Автор: Колемаев В.А. Калинина В.Н.
Теги: болезни животных (кроме болезней домашних животных) патология животных теория вероятностей математическая статистика комбинаторный анализ теория графов математика математическая экономика
ISBN: 978-5-390-00204-9
Год: 2009
В.А. КОЛЕМАЕВ, В.Н. КАЛИНИНА
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА
Рекомендовано Учебно-методическим объединением
по специальности «Менеджмент организации»
в качестве учебника для студентов
высших учебных заведений, обучающихся
по экономическим специальностям
Третье издание,
переработанное и дополненное
tfllOrfy
МОСКВА
2009
УДК 591.2(075.8)
ББК 22.17и73
К60
Рецензенты:
кафедра статистики и эконометрики РАЭ им. Г.В. Плеханова (заведующий
кафедрой д-р экон. наук, проф., акад. РАЕН А.Д. Коробкин),
Ю.П. Лукашин, заведующий кафедрой высших финансовых вычислений
Московского государственного университета экономики, статистики и
информатики, д-р экон. наук, проф.
Авторы:
В.А. Колемаев — введение, гл. 1-6, 9-12, приложения 1-5,
В.Н. Калинина — гл. 7, 8, приложение 6
Колемаев В.А.
К60 Теория вероятностей и математическая статистика : учебник / В.А.
Колемаев, В.Н. Калинина. — 3-е изд., перераб. и доп. — М. : КНОРУС, 2009. —
384 с.
ISBN 978-5-390-00204-9
Излагаются основы теории вероятностей, теории массового
обслуживания и математической статистики согласно
соответствующему разделу программы дисциплины «Математика» для
специальности «Менеджмент». Изложение сопровождается примерами
и задачами из экономической практики.
Для студентов и аспирантов вузов, а также слушателей
факультета магистерской подготовки, работающих в области
экономики и управления.
УДК 591.2(075.8)
ББК22.17я73
ISBN 978-5-390-00204-9
© Колемаев В.А., Калинина В.Н.,2009
© ЗАО «МЦФЭР», 2009
© ЗАО «КноРус», 2009
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ 6
ЧАСТЬ 1. ТЕОРИЯ ВЕРОЯТНОСТЕЙ
ГЛАВА 1. ВЕРОЯТНОСТНЫЕ ПРОСТРАНСТВА 10
1.1. Классическое определение вероятности 10
1.2. Конечная схема с неравновоэможными исходами 15
1.3. Исчисление событий 18
1.4. Аксиоматическое построение теории вероятностей 22
Вопросы и задачи 25
ГЛАВА 2. УСЛОВНЫЕ ВЕРОЯТНОСТИ.
ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ 27
2.1. Условные вероятности 27
2.2. Последовательности испытаний 30
2.3. Марковские цепи ....: 35
Вопросы и задачи 43
ГЛАВА 3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
И ИХ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ 45
3.1. Определение случайной величины
и ее функция распределения 45
3.2. Дискретные случайные величины
и их важнейшие числовые характеристики 50
3.3. Непрерывные случайные величины
и их важнейшие числовые характеристики 59
3.4. Нормальное распределение 66
3.5. Производящая функция и числовые характеристики
случайной величины 70
3.6. Многомерные случайные величины 78
3.7. Функции от случайных величин 89
Вопросы и задачи 95
ГЛАВА 4. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ .. 97
4.1. Законы больших чисел 97
4.2. Центральная предельная теорема 100
Вопросы и задачи 106
ГЛАВА 5. ВВЕДЕНИЕ В ТЕОРИЮ СЛУЧАЙНЫХ ПРОЦЕССОВ
И ТЕОРИЮ МАССОВОГО ОБСЛУЖИВАНИЯ 108
5.1. Случайные процессы и их виды 108
5.2. Марковские случайные процессы с непрерывным временем
и дискретным множеством состояний 111
3
5.3. Введение в теорию массового обслуживания 116
Вопросы и задач и 130
ЧАСТЬ 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
ГЛАВА 6. ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА 135
6.1. Оценка числовых характеристик случайных величин 135
6.2. Оценка функций распределения и плотности 147
Вопросы и задачи 149
ГЛАВА 7. ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 151
7.1. Метод моментов 151
7.2. Метод максимального правдоподобия 157
7.3. Понятие интервальной оценки. Интервальные оценки
параметров нормального распределения 161
7.4. Асимптотический подход к интервальному оцениванию 169
Вопросы и задачи 174
ГЛАВА 8. ПРОВЕРКА ГИПОТЕЗ 177
8.1. Основные понятия проверки гипотез.
Гипотезы о параметрах нормального распределения 177
8.2. Гипотезы о равенстве средних и дисперсий
двух нормальных распределений 187
8.3. Критерии согласия 190
8.4. Введение в дисперсионный анализ 195
Вопросы и задачи 201
ГЛАВА 9. КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ 207
9.1. Введение в корреляционный анализ 208
9.2. Парная линейная регрессия 218
9.3. Оценка параметров множественной регрессии
и дисперсии случайной составляющей 233
9.4. Проверка гипотез о параметрах множественной
регрессии и их интервальная оценка 242
9.5. Оценка качества уравнения множественной регрессии
и прогноз по уравнению регрессии 245
9.6. Критерий Дарбина—Уотсона и обобщенный метод
наименьших квадратов 248
9.7. Особенности практического применения
регрессионных моделей 256
Вопросы и задачи 261
ГЛАВА 10. СТАТИСТИЧЕСКИЙ АНАЛИЗ
ЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ 263
\0.\. Трепдовые модели 264
Ю.2. Выделение тренда в динамических рядах
экономических показателей 268
10.3. Нелинейные тренды 285
10.4. Экспоненциальное сглаживание 288
Вопросы и задачи 295
ГЛАВА 11. ОДНОВРЕМЕННЫЕ УРАВНЕНИЯ 297
11.1. Расширенная, структурная и приведенная
формы эконометрической модели 300
11.2. Условия идентифицируемости эконометрической модели 307
11.3. Методы идентификации эконометрической модели 315
11.4. Прогноз по эконометрической модели 331
Вопросы и задачи 335
ГЛАВА 12. ЭЛЕМЕНТЫ МНОГОМЕРНОГО
СТАТИСТИЧЕСКОГО АНАЛИЗА * 337
12.1. Модель факторного анализа
и метод главных компонент 338
12.2. Понятие о многомерной классификации 345
ПРИЛОЖЕНИЕ 1. Доказательство сходимости вероятностей
состояний СМО к стационарным значениям 350
ПРИЛОЖЕНИЕ 2. Распределение статистики —У\(Х/~Х)2 355
ПРИЛОЖЕНИЕ 3. Распределение статистики —'^(у,~^'/У 358
ПРИЛОЖЕНИЕМ Расчет сумм, содержащих
тригонометрические функции 362
ПРИЛОЖЕНИЕ 5. Обоснование сходимости метода Ньютона—Гаусса 365
ПРИЛОЖЕНИЕ6. Таблицы математической статистики 369
Библиографический список 375
ВВЕДЕНИЕ
По форме проявления причинных связей законы природы и
общества делятся на два класса: детерминированные и статистические.
Например, на основании законов небесной механики по
известному в настоящем положению планет Солнечной системы может быть
практически однозначно предсказано их положение в любой наперед
заданный момент времени, в том числе очень точно могут быть
предсказаны солнечные и лунные затмения. Это пример
детерминированных законов.
Вместе с тем не все явления макромира поддаются точному
предсказанию, несмотря на то что наши знания о нем непрерывно
углубляются и уточняются. Так, долговременные изменения климата,
кратковременные изменения погоды не являются объектами для успешного
прогнозирования. Еще менее детерминированы многие законы и
закономерности микромира. Например, с точки зрения теоретической
физики нельзя говорить о точном положении электрона в определенный
момент времени, но можно говорить о его распределенном положении
в пространстве («электронное облако»). Такого рода законы называются
статистическими. Согласно этим законам, будущее состояние системы
определяется не однозначно, а лишь с некоторой вероятностью,
являющейся объективной мерой возможности реализации заложенных
в прошлом тенденций изменения.
Теория вероятностей изучает свойства массовых случайных
событий, способных многократно повторяться при воспроизведении
определенного комплекса условий. Основное свойство любого
случайного события независимо от его природы — вероятность его
осуществления.
Теория вероятностей — математическая наука. Из
первоначально заданной системы аксиом вытекают другие ее положения и теоремы.
Впервые законченную систему аксиом сформулировал в 1936 г.
советский математик академик А.Н. Колмогоров в своей книге «Основные
понятия теории вероятностей».
Теория вероятностей вначале развивалась как прикладная
дисциплина. В связи с этим ее понятия и выводы имели окраску тех об-
6
ластей знаний, в которых они были получены. Лишь постепенно
выкристаллизовалось то общее, что присуще вероятностным схемам
независимо от области их приложения: массовые случайные события,
действия над ними и их вероятности, случайные величины и их
числовые характеристики. Большой вклад в развитие теории вероятностей
внесли русские ученые. Практические приложения способствовали
зарождению теории вероятностей, они же питают ее развитие как
науки, приводя к появлению все новых ее ветвей и разделов.
На теорию вероятностей опирается математическая
статистика, задача которой состоит в том, чтобы по ограниченным данным
(выборке) восстановить с определенной степенью достоверности
характеристики, присущие генеральной совокупности, т.е. всему
мыслимому набору данных, описывающему изучаемое явление. За
несколько последних десятилетий от теории вероятностей
«отпочковались» такие отрасли науки, как теория случайных процессов, теория
массового обслуживания, теория информации, эконометрическое
моделирование и др. Этот процесс продолжается и теперь.
Одной из важнейших сфер приложения теории вероятностей
является экономика. В настоящее время трудно себе представить
исследование и прогнозирование экономических явлений без использования
эконометрического моделирования, регрессионного анализа, трендо-
вых и сглаживающих моделей и других методов, опирающихся на
теорию вероятностей.
Статистические закономерности присущи и централизованно
управляемой, и тем более децентрализованной экономике. Наличие
таких твердо устоявшихся в экономике понятий, как страховой запас,
резервные мощности, государственные резервы, финансовые риски
и т.п., свидетельствует об этом.
Необходимо также заметить, что без элементов случайности
вообще невозможно развитие. Без случайности были бы невозможны
возникновение жизни и совершенствование биологических видов,
немыслимы история человечества, творческая деятельность людей,
развитие социально-экономических систем. Таким образом, проявление
случайности в экономике следует рассматривать как отклонение
от сложившегося русла событий либо в положительную сторону
(появление новых научных открытий, технологий, способов ведения и
организации производства и т.п.), либо в отрицательную (стихийные
бедствия, поломки оборудования, болезни работников, конфликты
7
людей и т.п.), что впоследствии приводит к существенному
изменению самого течения событий.
С развитием общества экономическая система все более
усложняется. Следовательно, по законам развития динамических систем
должен усиливаться статистический характер законов, описывающих
социально-экономические явления. Все это предопределяет
необходимость овладения методами теории вероятностей и математической
статистики как инструментом статистического анализа и
прогнозирования экономических явлений и процессов.
Часть 1
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
шяашяшшшшшшшшштштшашшяшшшт
ГЛАВА 1
ВЕРОЯТНОСТНЫЕ ПРОСТРАНСТВА
В настоящей главе в сжатом виде представлена эволюция
теории вероятностей от классической схемы с конечным числом равно-
возможных исходов до аксиоматического построения. Вводятся
важнейшие понятия теории вероятностей: пространство элементарных
событий, случайные события и действия над ними, поле событий,
вероятность, вероятностное пространство.
1.1. КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ
Достоверным называют событие, которое обязательно
произойдет при осуществлении определенного комплекса условий. Так,
например, вода при нормальных атмосферных условиях и 0° С
замерзает. Соответственно, петгшожпым является событие, которое при
заданном комплексе условий никогда не произойдет. Случайным
естественно назвать такое событие, которое при заданном комплексе
условий может как произойти, так и не произойти. Мера возможности
осуществления такого события и есть его вероятность. Достоверное
и невозможное события могут рассматриваться как крайние частные
случаи случайных событий.
Далее случайные события будем обозначать большими
латинскими буквами А, В, С, Достоверное событие обозначим
буквой О., невозможное — символом 0. Введем теперь некоторые
отношения между событиями.
Два события А и В несовместны, если наступление одного из них
исключает наступление другого. Сумма событий А, В — это такое
третье событие С = А + В, которое происходит тогда, когда наступает
либо событие А, либо событие В, либо они оба одновременно.
Произведение событий А, В — это такое событие С = АВ, которое наступает
тогда, когда происходят и событие А, и событие В. Событие А
противоположно событию А, если оно несовместно с событием А и вместе
с ним образует достоверное событие А + А =£1.
Пбкажем, как могут быть построены математические модели
явлений с конечным числом исходов. Одной из таких моделей является
10
модель, известная под названием «классическая вероятностная схема».
В этой схеме определение вероятности основывается на равновозмож-
ности любого из конечного числа исходов, что характерно для первых
попыток исчисления шансов в азартных играх.
Так, в случае с игральной костью при однократном бросании
равновозможно выпадение любой из шести граней, на которые
нанесены цифры 1, 2, 3, 4, 5, 6. Обозначим эти равновозможные исходы,
или элементарные события, через 0)l5 cpj, СО3, 0)4» <%> ®ь- Естественно,
что шанс осуществиться не одному исходу, а одному из двух,
например или о»!, или срз, в два раза больше. Рассуждая таким образом,
можно определить шансы осуществления любого составного события А,
состоящего из нескольких элементарных, так называемого составного
события.
В общем случае, когда имеется п равновозможных
элементарных событий С0[, ..., со,,, вероятность любого составного события А,
состоящего из т элементарных событий со(,...,со; определяется как
отношение числа элементарных событий, благоприятствующих
событию А, к общему числу элементарных событий, т.е.
Р(А) = т/п. (1.1.1)
Например, в случае с игральной костью вероятность события А,
состоящего в выпадении четного числа очков (т.е. А = {срг, 0)4> с^})>
равна Р(А) = 3/6 = 'Л, так как в событие А входят три элементарных
события, а общее число элементарных событий равно 6.
Из классического определения вероятности, в частности,
вытекает, что вероятность полного события Q, включающего все п
элементарных событий, равна единице:
Р(А) = п/п = \.
Но ведь тогда полное событие О., состоящее в появлении
любого из всего набора элементарных событий Q. = {со,, ..., coj, и является
достоверным событием, так как оно обязательно происходит. Поэтому
вероятность достоверного события равна единице.
Если события рассматривать как подмножества множества
элементарных событий, то отношения между событиями, введенными
выше, можно интерпретировать как соотношения между множествами.
Несовместные события — это такие события, которые не содержат
общих элементов. Сумма (А + В) и произведение событий А В — это
соответственно их объединение A U В и пересечение Af] В, противо-
11
положное событие А — дополнение А. Запись А с В означает, что в В
содержатся все элементарные события из А и могут содержаться
элементарные события, не входящие в А. Если A czBhBczA.toA = В.
В случае классического определения вероятности справедлива
следующая теорема сложения вероятностей:
Теорема 1.1. Если два составных события А = {со(• ,...,ш. }
и В = {(£>. ,...,0). } являются несовместными, то вероятность
объединенного события С = A U В равна сумме вероятностей этих двух событий.
Действительно, вероятности событий А и В равны
соответственно т/п и kin, а событие С = Л U# = {co,, ...,ц , со/5..., С0у } содержат
га + к элементарных событий, так как по условию теоремы среди
элементарных событий {соу,...,со- } нет ни одного, которое бы входило
в набор {со.,..., со- }, поэтому, согласно классическому определению,
его вероятность
Р(С)=^±А = « + * = /.(/4) + Р(В).
п п п
Из теоремы сложения вытекает, что
P(Q.) = P(A) + P(A) = \,
поэтому
Р(А)=\-Р(А). (1.1.2)
Отсюда, в частности, следует, что вероятность невозможного
события, являющегося противоположным по отношению к
достоверному событию, равна нулю:
Р(0)= 1-Р((Л) = 0.
Урновая схема
Классическая схема, несмотря на всю свою ограниченность,
пригодна для решения ряда сугубо практических задач.
Рассмотрим, например, некоторую совокупность элементов
объема N. Это могут быть изделия, каждое из которых является
годным или бракованным; или семена, каждое из которых может быть
12
всхожим или нет; или избиратели, которые могут проголосовать
за или против кандидата, и т.д. Подобного рода ситуации описываются
урновой схемой: в урне имеется N шаров, из них М белых и (7V - М)
черных.
Представим себе, что имеются только разрушающие средства
контроле каждого изделия на годность. Например, электролампа
считается годной, если до перегорания нити накаливания пройдет не
менее чем определенное число часов, а это можно определить только
непосредственным испытанием. В таком случае можно обследовать
только часть изделий, а не всю партию.
Итак, из урны, содержащей N шаров, в которой находится
неизвестное число М белых шаров, извлекается выборка объема п.
Требуется определить вероятность того, что в выборке будет
обнаружено т белых шаров. В частности, определить вероятность
того, что т'/п близко к M/N, т.е. достоверно ли представление о
генеральной совокупности, полученное по выборке. Последняя из этих двух
сформулированных задач, как будет показано далее, является задачей
математической статистики.
Первая же задача — на применение классического определения
вероятности. В самом деле, в описанной ситуации каждая выборка
не имеет предпочтения по отношению к любой другой, т.е. все они
равновозМожны. Подсчитаем число всех возможных выборок объема п
из N элементов. Как известно из комбинаторики, число способов,
с помощью которых можно выбрать п элементов из общего их числа
N, равно числу сочетаний из N по л, т.е. с" = '■ гДе М =
'v n\(N-n)\'
= 1 • 2---N. Таким образом, общее число равновозможных исходов
равно C"N. Выясним, сколько исходов из общего числа элементарных
исходов благоприятствуют событию А, т.е. наличию в выборке объема п
белых шаров в количестве т. Число способов, которыми можно из М
белых шаров извлечь т штук, равно С^, а число способов выбрать из
(N-M) черных шаров (/? - т) штук равно С","!"^- Поэтому число
исходов, благоприятных событию А, равно С'^С'^"^, следовательно,
вероятность события А, равная отношению числа благоприятных
исходов к их общему числу, такова:
Р(А) = ^-^ = Ри^,п). (1.1.3)
4<v
13
Пример 1.1. Пусть имеется партия, состоящая из 500 изделий,
среди которых два бракованных. Какова вероятность в выборке из 5
изделий не обнаружить ни одного бракованного?
Воспользуемся формулой (1.1.3):
Л«,(5,5) = %^ = 0,98.
Какой вывод можно сделать о генеральной совокупности, не
обнаружив в выборке ни одного бракованного изделия? Кажется
естественным перенести этот вывод на всю генеральную совокупность.
Таким образом, при выборке, составляющей 1% от генеральной
совокупности, мы получили с вероятностью 0,98 абсолютно неправильный
ответ: в генеральной совокупности нет бракованных изделий. Этот
вывод из очень простой задачи должен не обескуражить, а, напротив,
помочь правильно построить статистические выводы по выборочным
данным. В рассматриваемом случае, очевидно, не следует пытаться
оценивать долю бракованных изделий (N - M)IN по их доле в выборке
(п - т)1п, а, по-видимому, целесообразно указывать интервал, который
с определенной надежностью должен накрыть неизвестную долю
бракованных изделий (N - M)IN. Этот интервал естественно задать в виде
п — ТП
± б, где ширина интервала 5(я, q) является функцией от объема
п
выборки п и уровня надежности q.
Причем естественно ожидать (в чем мы и убедимся в
дальнейшем), что ширина интервала при прочих равных условиях
уменьшается с ростом объема выборки и увеличивается при возрастании уровня
надежности.
Как отмечалось выше, говорить о вероятности Р(А) как о мере
возможности осуществления случайного события А имеет смысл,
только если выполняется определенный комплекс условий. При
изменении условий изменится и вероятность. Так, если к комплексу
условий, при котором изучалась вероятность Р(А), добавить новое условие,
состоящее в появлении события В, то получим другое значение
вероятности Р(А/В) — условную вероятность события А при условии, что
произошло событие В. Вероятность Р(А) в отличие от условной будем
называть безусловной.
Выведем теперь формулу условной вероятности. Пусть
событиям А и В благоприятствуют тик элементарных исходов из п\ тогда,
14
согласно формуле (1.1.1), их безусловные вероятности равны т/п и к/п
соответственно. Пусть событию А при условии, что событие В
произошло, благоприятствуют г элементарных исходов, тогда, согласно
формуле (1.1.1), условная вероятность события А
Р(А/В) = г/к.
Разделив числитель и знаменатель на п, получим формулу
условной вероятности:
P{AIB)^JJL^A^B)
kin Р(В)
поскольку событию Af] В соответствует г исходов и, следовательно,
г/п — его безусловная вероятность. Событие А называется
независимым от В, если его условная вероятность равна безусловной, т.е.
Р(А/В) = Р(А), при этом из формулы (1.1.4) получаем
P(Af\B) = P(A)P(B), (1.1.5)
т.е. свойство независимости взаимно и для независимых событий,
вероятность их пересечения равна произведению их вероятностей.
Формула (1.1.4), шмисанная в виде
Р(АГ\В)=Р(А)Р{В/А),
называется формулой умножения для зависимых событий, а формула
(1.1.5) — теоремой умножения для нешшеимых событий.
Например, в опыте с игральной костью: пусть событие А состоит
в выпадении числа очков, делящегося на три, т.е. А = {со,, с^,}, а
событие В — в выпадении четного числа очков, т.е. В = {ерз, (з\, щ,}; тогда
А П В = со6 и по формуле условной вероятности (1.1.4) получаем:
Р(В) 3
но Р(А) = 2/6 = 73, поэтому Р(А/В) = Р(А), т.е. события А и В независимы.
1.2. КОНЕЧНАЯ СХЕМА
С НЕРАВНО-ВОЗМОЖНЫМИ ИСХОДАМИ
Ограниченность классического определения вероятности, в
частности, заложена в равновозможности исходов. Действительно, даже
небольшое усложнение практической ситуации немедленно войдет
15
в противоречие с равновозможностью, которая может рассматриваться
скорее как частный случай более общей ситуации.
Рассмотрим, например, стрельбу по круговой мишени.
Элементарными исходами здесь являются попадания в то или иное кольцо
круговой мишени. Попадание в малый внутренний круг оценивается
в 10 очков, в окружающее его кольцо — 9 очков, в следующее — 8
и т.д., во внешнее кольцо — одно очко, непопадание в круговую
мишень — нуль очков. Итак, имеется одиннадцать элементарных событий
сою, (Oj, ..., <% Для каждого стрелка определенного класса имеются свои
определенные устойчивые шансы (вероятности) выбить за один выстрел
то или иное число очков /J|(>, •..., р^ Эти события, вообще говоря, нерав-
новозможны. Например, для мастеров спорта, по-видимому, исключено
событие щм поэтому/^, = 0, т.е. сразу исключается равновозможность.
Конечная схема с неравновозможными исходами
определяется так. Имеется конечный набор элементарных событий Q. = {со(,..., щ,},
и для каждого элементарного события щ задана его вероятность ph
п
0£/?, £1, причем у» _j Вероятность любого составного события
А = {щ ,...,(0/ } определяется как сумма вероятностей входящих в
него элементарных событий:
/ = i
Эта схема является обобщением классической схемы. В самом
деле, если вернуться к случаю равновозможности и приписать
каждому элементарному событию вероятность '/„, то формула (1.2.1)
приводит к классическому определению вероятности.
В случае конечной схемы также верна теорема сложения.
Для двух несовместных событий А и В, являющихся
подмножествами Q,
P(A\jB) = P(A) + P(B).
В самом деле, пусть А ~ {со, ,..., (0( \, В = {ш/ ,..., со; }. Согласно
формуле (1.2.1),
ш к
/=1 ь=1
16
Поскольку события А, В несовместны, они не имеют общих
элементарных событий и, следовательно, С- А[)В={ол1,...,(а1 ,ш/,...,со/ }. На
основании формулы (1.2.1) имеем:
т к
/ = I к = 1
Точно так же, как конечная схема с неравновозможными
исходами является обобщением классической конечной схемы с равно-
возможными исходами, дискретная схема с бесконечным числом не-
равновозможных событий, в свою очередь, является обобщением
конечной схемы с неравновозможными исходами.
В дискретной схеме множество О. = {col5 ..., щ„ ...}, вообще
говоря, содержит счетное число элементарных событий. Для каждого
элементарного события задана его вероятность/?, = Р(щ), 0 <р± < 1, причем
У] Pi = 1. Вероятность любого конечного либо счетного подмножества
A <zCl множества элементарных событий ft равна сумме вероятностей
ее
составляющих его элементарных событий, т.е. если ,4 = ^0),, то
/ = i
рм= I а-Ё /v
0), б А I - I
В конечной схеме, как и в классической, можно вывести
формулу условной вероятности.
Рассмотрим события А={а1• ,...,со,. ,...,со, }, 5={ю/,...,(а/,...,а)у },
такие, что со, = со, ,...,со, = со,; / < w, к.
Иными словами, А П В - {со,•,..., со, }. Тогда
т к !
р(А)=S л,. ^=Ё ял > о? ям п д)=Ё а;, .
ц = 1 к= I fi = I
Пусть событие В произошло, поэтому имеет место новая
конечная схема с к исходами, к < п, следовательно, сумма вероятностей
полного набора этих новых исходов должна быть равна единице,
а она, согласно первоначальной схеме, равна
tzfiffiic^ 17
Чтобы обеспечить равенство суммы вероятностей элементарных
событий единице, введем новые вероятности исходов:
В рамках новой схемы (т.е. при условии, что произошло
событие В) определяем вероятность события А:
t, '• Р(В) Р(В)
Таким образом, мы снова пришли к той же формуле условной
вероятности, что и в классической схеме [(см. формулу (1.1.4)].
Независимость событий определяется аналогично классической схеме.
В качестве применения конечной схемы в следующей главе
будет исследована схема последовательных испытаний.
1.3. ИСЧИСЛЕНИЕ СОБЫТИЙ
Одним из основных понятий теории вероятностей являются
пространство элементарных событий ft и события как некоторые
подмножества этого пространства. В общем случае пространство ft может
быть любой природы, как конечным, так и бесконечным, как
дискретным, так и непрерывным.
Рассмотрим, например, стрельбу по мишени. Пели нас
интересует только сам факт попадания в мишень, то элементарными
исходами служат (0 = I (попадание в мишень) и О) =0 (непопадание в
мишень). Если важно попадание в отдельные области мишени (области
различаются с точки зрения уязвимости реальной цели), то
элементарными событиями могут быть со10 = 10, Cfl^ = 9, ..., С0[ = 1 (соответствуют
числу очков, приписанных попаданию в определенную область) и(^ =
= 0 (непопадание в мишень). Наконец, если существенно важно, в
какую именно точку щита, на котором изображена мишень, произошло
попадание, то произвольный элементарный, исход (0= {х, у}
представляют собой координаты точки попадания, а пространство
элементарных событий С1 — это множество точек щита.
Итак, пусть имеется пространство элементарных событий О.
любой природы. Будем рассматривать в качестве событий
подмножества Л, В, С,... этого пространства. В таком случае действия над
событиями становятся действиями над подмножествами.
18
Событие А происходит тогда и только тогда, когда происходит
одно из элементарных событий со, из которых состоит А. Напомним
некоторые отношения между событиями, введенные ранее. События А
и В несовместны, если наступление одного из них исключает
наступление другого. Но ведь это означает, что А и В не имеют ни одного
общего элементарного события, т.е. не пересекаются.
Аналогично, событие А + В эквивалентно объединению A U В,
т.е. множеству элементарных событий, которые входят или в А, или в В,
а событие АВ — пересечению А П В, т.е. множеству элементарных
событий, которые являются общими для А и В. Операции объединения
и пересечения множеств симметричны, т.е.
A{JB = B\JA, Af)B = Bf)A.
Событие, которое включает все элементарные события, т.е.
совпадает с пространством элементарных событий £1, называется
достоверным. Отсюда можно сделать вывод, что для любого события
А П ^ = А. Пустым (невозможным) называется событие 0, которое
не содержит ни одного элемента. Отсюда два события А и В
несовместны, если АГ\В = 0. Очевидно, A\J0 = A.
Напомним, что теоретико-множественной разностью двух
событий А и В называется такое событие А \В, которое содержит те
элементарные события, принадлежащие А, которые не входят в В. Отсюда
событие А, противоположное событию А, есть Q\A. В самом деле,
АГ\(&\А) = 0 и A\J'(Cl\A) = £l, т.е., действительно, A = Q.\A. В
частности, О, = 0, 0 = £1.
Иногда используется симметричная разность событий С -
= ААВ, представляющая собой такое событие, в которое входят те
элементарные события, которые входят в А или В, но не входят в их
пересечение А[\ В. Таким образом, эта операция может быть
представлена с помощью уже введенных операций следующим образом:
C = AAB = (A\B){J(B\A).
Для лучшего понимания операций над событиями —
подмножествами — обычно используют графические изображения, представляя
достоверное событие О. как прямоугольник, а другие события — как круги.
Тогда введенные выше операции над событиями могут быть
представлены в виде диаграмм Вьенна (рис. 1.1), где результаты операций
изображены в виде затемненных фигур. Операция объединения изображена
19
на рис. 1.1а, пересечения — на рис. 1.16, разности — на рис. l.le,
дополнения — на рис. 1 Лг, симметричной разности — на рис. 1. Id.
Действия над событиями, в частности операции объединения
(сложения) и пересечения (умножения), в определенном смысле
аналогичны сложению и умножению чисел. Так, выше отмечалось, что эти
операции симметричны; они также ассоциативны, т.е.
(A{JB){JC = A{J(B\JC), (АГ)В)Г\С = АГ\(ВГ\С).
Кроме того, эти операции, так же как и операции над числами,
обладают свойством дистрибутивности:
(А[]В)ПС = (АПВ)и(ВПСу- (1.3.1)
Рис. 1.1. Диаграммы Эйлера—Вьенна
Множество D ~(A\J B)f\C изображено в виде диаграммы Вьенна
на рис. l.le. Как видно из диаграммы, переселение множества С и
объединения A U В состоит, вообще говоря, из объединения трех
непересекающихся частей:
D^[(A\B)f]C][j[(B\A)f]C][j[(Af]B)f]Cl
Так как А-А[}А при любом/i, то
D = [(A\B)f]C]\J.[(B\A)f]C][j[{Af]B)f]C][j[(Af]B)f]C].
20
Используя теперь свойство симметричности операций
объединения, объединим первый и третий операнды, второй и четвертый:
[{A\B)f}C][J[(Af)B)f)C]=Af)Q
[(В\А)Г\С]и[(АГ\в)ПС] = вГ\с,
откуда окончательно получаем D = (Af]C){J Bf) С), т.е. свойство
дистрибутивности действительно выполняется.
Другое сходство с действиями над числами заключается в том,
что для операции пересечения роль, аналогичную роли единицы и
нуля при умножении чисел, выполняют соответственно множества Q.
и 0, так как Qf)A = A, AV\Cl= А и 0f]A = A[j0 = 0- Вместе с тем
теоретико-множес i венные равенства A{JA = AyAf]A = A и им
подобные показывают, что полной аналогии нет.
Действия над событиями важны не сами по себе, а как средство
определения вероятностей одних событий через вероятности других
событий. Так, например, если верна теорема сложения вероятностей,
то вероятность события С, являющегося объединением несовместных
событий А и В, равна сумме вероятностей последних событий Р{С) =
= Р{А) + Р(В), что Позволяет найти вероятность одного из трех
событий через известные вероятности двух других. Точно так же, если для
событий А, В и С = АГ\ В справедлива теорема умножения, можно
выразить вероятность одного события через вероятности двух других:
Р(С)=Р(А)Р(В).
В случае конечной или счетной теоретико-вероятностной
схемы, рассмотренной в предыдущем параграфе, в качестве события
рассматривалось любое подмножество конечного или счетного
пространства элементарных событий Q. и вероятность события определялась
как сумма вероятностей входящих в него элементарных событий. Если
же пространство О, непрерывно, то имеет место континуум
элементарных исходов. Попытка считать событием любое подмножество
непрерывного пространства О, сопряжена с большими трудностями.
Поэтому в общем случае приходится иметь дело не со всеми
подмножествами пространства О., а лишь с определенным классом,
замкнутым относительно операций объединения, пересечения,
дополнения.
21
Класс подмножеств пространства Q, замкнутый относительно
операций объединения, дополнения и пересечения, а также
содержащий множество Q., называется полем. Будем обозначать поле буквой S.
Минимальное поле S0 состоит из полного и пустого множеств S0 =
~ {0,ft}. В самом деле, 0 и £1 входят в этот класс, а результатами
операций объединения, дополнения и пересечения этими
множествами снова служат данные множества: 0\JQ. = £1,0 ГШ = 0,0 = Ф
Q = 0. Другим, более содержательным примером поля событий
служит класс из четырех событий S = {0, А, А,О.}. Действительно,
0UA = A,0UA = A,0\J£1 = £1,A\JA = £1,A\J£1 = £1,A\JCI = £K
0ПА = 0,0ПА = 0,0ПП = 0,АПА = 0,АПП = А,АПП = А,
0=П)А = А,И = 0.
1.4. АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ
ТЕОРИИ ВЕРОЯТНОСТЕЙ
При аксиоматическом построении теории вероятностей
исходным «материалом» служит пространство элементарных событий Q
и выделенный в нем класс подмножеств, образующий поле событий S.
Строение пространства £1 и класса S определяется конкретной
областью приложения.
Определение 1.1. Вероятностью называется числовая функция,
определенная на поле событий S и обладающая следующими
свойствами:
Аксиома 1. Вероятность любого события А е S.
0<Р(А)<\.
Аксиома 2. Вероятность достоверного события равна единице:
Р(£1) = 1.
Аксиома 3. Вероятность объединения двух несовместных
событий равна сумме вероятностей этих событий:
P(A\JB) = P(A) + P(B), Af]B = 0.
Проверим, например, что конечная схема удовлетворяет
условиям этих аксиом. Напомним, что конечная схема задается конечным
22
множеством элементарных событий ft = {(о:, ..., щ,} и вероятностями
п
каждого из них 0 <pf < 1, причем У] Я/ = 1- Вероятность любого собы-
/ = 1
тия А, являющегося подмножеством ft, т.е. А = {Щ ,..., Щ },
определяется по формуле:
ц е /4 / = I
Класс S всех подмножеств ft образует поле. В самом деле, 0
и ft являются подмножествами, поэтому принадлежат S, очевидно
также, что для любых событий А е S, В е S их объединение и
пересечение также являются подмножествами ft; А, В — также
подмножества.
Теперь проверим, что конечная схема удовлетворяет
требованию аксиомы 1. Для этого выберем произвольное событие А, которое
является подмножеством ft, так как А = {(0, ,...,щ }, то, согласно
конечной схеме,
т
/ = i
потому 0 йр{А) й 1, т.е. условие аксиомы 1 выполняется.
Условие аксиомы 2 выполняется, поскольку ft = {со,, ..., со,,}
и на основании формулы (1.4.1)
/>(ft) = 2> = l.
Условие аксиомы 3 также выполняется, так как оно
представляет собой содержание теоремы сложения для конечной схемы. Эта
теорема была доказана в § 1.2.
Итак, конечная схема является примером объекта, для которого
выполняется система аксиом теории вероятностей.
Простейшим частным случаем конечной схемы служит
вероятностное описание испытания, которое может закончиться успехом или
неудачей. В этом случае ft = {ось, с^} состоит из двух элементарных
событий: (О, = 0 — неуспех в испытании, со, = 1 — успех в испытании,
23
P(COi) = p, P((xh) = 1 - p = ц. Поле в данной ситуации состоит из
четырех событий: 0, А = {Ш[}, Л = |<Ц)}, Q=.{cflb, ш,}.
В качестве примера вероятностной схемы с непрерывным
пространством элементарных событий рассмотрим схему с
геометрическими вероятностями. Пусть пространством элементарных событий
служит множество точек некоторой области G, имеющей площадь
на плоскости. В качестве событий будем рассматривать имеющие
площадь подмножества А, В, С, ... этой области. Самостоятельно
докажите, что класс таких подмножеств образует поле. При этом
вероятность любого события А (подмножества, имеющего площадь mes (А)),
можно задать следующим образом:
р{А) = шЫА)
mcs(G)
Докажите (по аналогии с конечной схемой), что описанная
схема удовлетворяет аксиомам теории вероятностей. Аналогично можно
построить геометрические вероятности в любом конечномерном
пространстве.
Из аксиом теории вероятностей вытекает ряд следствий,
которые могут быть доказаны так же, как это было сделано для
классической схемы. Предлагаем самостоятельно доказать утверждения,
содержащиеся в шли чих к настоящей главе.
Во многих случаях требуется расширенный вариант аксиомы 3.
А именно аксиома 3 постулирует сложение вероятностей для
конечного числа несовместных событий, в то время как в расширенном
варианте речь идет о счетном числе несовместных событий.
Аксиома 3'. Если Л, € 5, / = 1,2,..., A-t П А- = 0, гФ у,
/со Л о.
Аксиомы теории вероятностей лишь постулируют
существование вероятностей для всех событий, образующих поле S, и задают
определенные правила действия с вероятностями.
Экспериментальное же определение вероятности любого
события A е S может быть осуществлено в результате испытаний,
выполняемых при определенном одном и том же комплексе условий. Как
будет показано ниже, выборочная частость |А/« появления события А
при большом числе испытаний п является достаточно хорошей оцен-
24
кой теоретической вероятности р = Р{А), что означает сходимость
Ц
в некотором смысле — =эр при /?—>«>.
п
Например, если событие А представляет собой выпадение
«герба» при однократном бросании симметричной монеты, то, согласно
классическому определению вероятности, Р(А) = У2, поэтому есть
основание считать, что при многих испытаниях частость выпадения
«герба» близка к Ч2. Действительно, в XVII в. Бюффон провел такие
эксперименты. В результате оказалось: при 4040 бросаниях монеты
частота выпадения «герба» составила 2048, что дает частость, равную
0,507. Английский статистик К. Пирсон провел 24 000 таких опытов,
частость оказалась равной 0,5005.
Итак, определенная теоретико-вероятностная схема задается
тремя компонентами {О., S, Р\, т.е. конкретным пространством
элементарных событий, конкретным набором подмножеств О.,
образующих поле S, а также конкретным заданием вероятностей Р на
множествах поля. Набор этих трех компонент далее везде будем называть
вероятностным пространством. Вероятность Р на (О., S) называется
распределением вероятностей на Q.
ВОПРОСЫ И ЗАДАЧИ
1. Опираясь на аксиомы теории вероятностей, докажите следующие
утверждения:
а) Р(А)= 1 -Р(А)\
б) Р(0) = О;
в) Р(А)>Р(В) при A d£;
г) Р(А)< 1.
2. Покажите, что из аксиомы 3 вытекает следующее следствие:
( ,, \ и
U4 = XPW ПРИ 4 П Aj = 0 для /*/.
V' — I ) '" = >
3. Докажите, что для любых событий А, В имеет место следующая
формула сложения:
Р(А U В) = Р(А) + Р(В) - Р(А П В).
4. Ау, А2,..., А„ — случайные события. Доказать для п = 3, 4 формулу:
25
(" "l "
+ X P(Aif]AJf]Ak)-...+(-\)"^p\(]Ai .
5. Партия изделий состоит из т изделий 1-го сорта и п изделий 2-го
сорта. Проверка первых к изделий, выбранных из партии наудачу,
показала, что все они 2-го сорта (к < п). Чему равна вероятность того, что
среди следующих двух наудачу выбранных из оставшихся изделий
по меньшей мере одно окажется 2-го сорта?
6. Двое договорились о встрече в течение определенного часа.
Пришедший первым ждет 20 мин и уходит. Какова вероятность встречи?
Указание. Рассмотреть вероятность как отношение площадей
множества точек (исходов), благоприятствующих встрече, и множества
возможных исходов.
7. Докажите, что из независимости А, В вытекает независимость А, В;
А, В; Я, А.
ГЛАВА 2
УСЛОВНЫЕ ВЕРОЯТНОСТИ.
ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ
Все теоремы и формулы теории вероятностей и математической
статистики выводятся из аксиом теории вероятностей. В этой главе
дается определение условной вероятности, доказываются наиболее часто
используемые теоремы и формулы, основанные на условных
вероятностях. Вводится понятие независимости событий, которое затем
используется в схеме последовательных независимых испытаний, а Также
дается описание марковской схемы с зависимыми испытаниями.
2.1. УСЛОВНЫЕ ВЕРОЯТНОСТИ
В § 1.1 формула условной вероятности была выведена для
классической схемы. В общем случае эта формула служит определением
условной вероятности события А при условии, что произошло
событие В, Р(В) > 0.
Определение 2.1. Условная вероятность события А при условии В
Р(В)
Определение 2.2. Событие А не зависит от события В, если
Р{А1В) = Р{А).
Независимость событий взаимна, т.е. если событие А не зависит
от В, то и событие В не зависит от А. В самом деле, используя
определения 2.1 и 2.2, при Р(А) > О имеем:
Р(В/А)=Р(А П В) = PWPW = P{B)PiAKp(B)
Р(А) Р(А) Р(А)
Из определения 2.1 вытекает следующая формула умножения
вероятностей:
P(Af]B) = P(A)P(B/A). (2.1.1)
Для независимых событий вероятность произведения событий
равна произведению их вероятностей:
P(Af]B)=P(A)P(B). (2.1.2)
27
Определение 2.3. События Аь А2, ..., А„ образуют полную группу
событий, если они попарно несовместны и вместе образуют
достоверное событие, т.е.
' = 1
Имеет место следующая теорема полной вероятности.
Теорема 2.1. Если события Аи ..., А,„ P(Aj) > О образуют полную
группу событий, то вероятность события В может быть представлена
как сумма произведений безусловных вероятностей событий полной
группы на условные вероятности события В:
P(B) = fjP(Al)P(B/Ai). (2.1.3)
События полной группы А{, ..., А„ попарно несовместны, поэтому
попарно несовместны и их произведения (пересечения) с событием 5,
т.е. события В П Л,-, В{~) А- при /' Ф j несовместны. Так как событие В
можно представить в виде
B = \J{BV\A.,l
то, применив к этому разложению события В аксиому сложения
вероятностей, имеем:
Р(В)=£р{ВГ)А<).
Используя формулу умножения вероятностей (2.1.1) для каждого
слагаемого, окончательно получаем:
P{B)=YjP{Ai)P{BIAi).
Требование, состоящее в том, что события А{ образуют полную
группу событий, может быть заменено более слабым: события попар-
п
но не пересекаются, В а \\АГ Кроме того, на основе аксиомы счет-
ной аддитивности теорему полной вероятности можно распространить
и на счетное множество попарно непересекающихся событий Ап
P(A)>0,Ba\jAi
28
P(B) = YiPWP(B/Ai). (2.1.4)
;' = l
Из формулы полной вероятности (2.1.3) легко получить
формулу Байеса: для события В с Р(В) > 0 и для системы попарно несовмест-
п
ных событий Ah Р{А) > О, B(z\\An
P(AJB)= WW . (2.,5)
£/>(Д)Р(В/Д.)
/ = l
В самом деле, применив формулы условной вероятности и
умножения вероятностей, имеем:
Р(А /в)^р(АкПВ)_Р(Ак)Р(В/Ак)
[ к1 ' Р(В) Р(В)
теперь, заменив вероятность события В по формуле полной
вероятности, получаем формулу (2.1.5).
Вероятности Р{А) событий А{ называют априорными
вероятностями, т.е. вероятностями событий до выполнения опыта, а условные
вероятности этих событий P(Aj/B) — апостериорными, т.е.
уточненными в результате опыта, исходом которого послужило появление
события В.
Пример 2.1. Расчет по формулам полной вероятности и Байеса
На предприятии изготовляются изделия определенного вида
на трех поточных линиях. На первой линии производится 20% изделий
от всего объема их производства, на второй — 30%, на третьей — 50%.
Каждая из линий характеризуется соответственно следующими
процентами годности изделий: 95, 98 и 97%. Требуется определить
вероятность того, что наугад взятое изделие, выпущенное предприятием,
окажется бракованным, а также вероятности того, что это бракованное
изделие сделано на первой, второй и третьей линиях.
Решение. Обозначим через At,A2, А^ события, состоящие в том, что
наугад взятое изделие произведено соответственно на первой, второй
и третьей линиях. Согласно условиям задачи Р{А^) = 0,2; Р(А2) - 0,3;
Р{АУ) - 0,5, и эти события образуют полную группу событий,
поскольку они попарно несовместны, т.е. Р(А{) + Р(А2) + Р(А^) = 1.
Обозначим через В событие, состоящее в том, что наугад взятое
изделие оказалось бракованным. Согласно условиям задачи Р(В/А^) =
= 0,05; Р(В/А2) = 0,02, Р(В/А,) = 0,03.
Используя формулу полной вероятности, получаем
Р(В) = ДШ,) Р[А{) + Р(В/А2)Р(А2) + Р(В/А})Р(А>) =
= 0,05 • 0,2 + 0,02 • 0,3 + 0,03 • 0,5 = 0,031,
т.е. вероятность того, что наугад взятое изделие окажется
бракованным, равна 3,1 %.
Априорные вероятности того, что наугад взятое изделие изготовлено
на первой, второй или третьей линии, равны соответственно 0,2; 0,3 и 0,5.
Допустим, что в результате опыта наугад взятое изделие оказалось
бракованным; определим теперь апостериорные вероятности того, что
это изделие изготовлено на первой, второй или третьей линиях.
По формуле Байеса имеем:
0,05 0,2 10
Р(А]/В) =
P{AJB) =
Р(А}/В) =
0,031 31
0,02 • 0,3 = 6
0,031 ~31
0,03 0,5 ^15
0,031 ~зГ
Таким образом, вероятности того, что наугад взятое и оказавшееся
бракованным изделие изготовлено на первой, второй или третьей
линии, равны соответственно 0,322; 0,194; 0,484.
Формула умножения вероятностей (2.1.1) может быть
распространена на случай произвольного конечного числа событий:
Р(А]ПА2П.МАп) = Р(А])Р(А1/А])...Р(Ап/А1Г\А2П.МЛп_{).(2Л.6)
Определение 2.4. События Аь Аъ ..., А„ независимы в
совокупности, если для любого их подмножества
Р(А. П \ П... П \ ) = Р(А. )Р(Л, )... P{Ah ), к<п.
Если это условие выполнено только для к = 2, то события
попарно независимы.
Из независимости событий в совокупности вытекает попарная
независимость, а из попарной независимости не следует
независимость в совокупности.
2.2. ПОСЛЕДОВАТЕЛЬНОСТИ ИСПЫТАНИЙ
Схема Бернулли
Пусть проводится конечное число п последовательных
независимых испытаний, в каждом из которых может произойти определенное
30
событие: либо успех, либо противоположное событие — неудача. Такая
последовательность испытаний называется схемой Бернулли, если
вероятности положительного исхода в каждом испытании одинаковы.
В качестве таких испытаний можно рассматривать, например,
производство изделий на определенном оборудовании при постоянстве
технологических и организационных условий, в этом случае изготовление
годного изделия — успех, бракованного — неудача. Эта ситуация
соответствует схеме Бернулли, если считать, что процесс изготовления одного
изделия не зависит от того, были годными или бракованными
предыдущие изделия. Другим примером является стрельба по мишени. Здесь
попадание — успех, промах — неудача. Если же речь идет о выборочном
контроле качества конечной партии изделий объема /Vno выборке объема
/?, то даже при независимости и случайности отбора единиц совокупности
отдельный акт отбора зависит от того, сколько на предшествующих
этапах было извлечено годных изделий и бракованных изделий. Ниже будет
показано, что при N —» °° эта гипергеометрическая (урновая) схема,
рассмотренная в § 1.1, переходит в схему Бернулли.
В схеме Бернулли одному испытанию соответствует множество
элементарных исходов, состоящее из двух элементарных событий:
{щ>, со,}, щ = 0 (неудача) и C0i = 1 (успех), при этом А = {со,}, А = {сс^}.
Множество элементарных исходов для п испытаний состоит уже из 2"
элементарных событий со = {/), /2,..,, /„}, каждое из которых соответствует
конкретному исходу испытаний, при этом набор /(, ..., /„, представляет
собой конкретную последовательность нулей и единиц,
соответствующую результатам испытаний на каждом шаге.
Если заданы вероятности успеха и неудачи в отдельном
испытании Дсо,) = р\ Р(Шо) = 1 - р = q, то можно определить вероятность
любого элементарного исхода в п испытаниях. Действительно,
рассмотрим любой элементарный исход (/h ..., /J, при этом (/,, /2,..., /„) —
конкретная последовательность нулей и единиц, соответствующая
последовательности неудач или успехов в каждом из п индивидуальных
испытаний, например со= (1, 0, ..., 1).
Тогда, поскольку результаты отдельных испытаний независимы
друг от друга, получаем:
/>(ш) = />(СО,)/>(Щ,) ... ДО),) = ... =pq - р.
Таким образом, если общий элементарный исход включает т
успехов и п - т неудач, то его вероятность
P((xj)=p'"q"'\ (2.2.1)
31
и, следовательно, по аксиоме сложения вероятностей может быть
определена вероятность любого события, состоящего из нескольких
элементарных событий.
В частности, если нас интересует вероятность Р„{т) того, что в п
испытаниях произошло т успехов, то ее определяем как сумму
вероятностей элементарных событий, характеризующихся т успехами.
Вероятность такого элементарного исхода, согласно формуле (2.2.1),
равнаpmq"~m. Следовательно, для нахождения вероятности Рп{т) надо
определить число элементарных событий, характеризующихся т
успехами, т.е. установить, сколькими способами могут быть на п мест
расставлены т единиц (остальные п - т мест занимаются нулями).
Но ведь это аналогично тому, что из п элементов надо выбрать
(пометить) т элементов. Число таких выборок, как известно, равно числу
срчетаний из п по т, т.е. С"'. Окончательно получаем
Р„(т) = СУ'"Ч" ■»'. (2.2.2)
Сумма получившихся биномиальных вероятностей равна единице:
£ р„(т)= £ с;уу • •» = (р + <?)" = 1" = 1.
т = 0 т = О
В ряде задач представляет интерес наивероятнейшее число
успехов, т.е. такое число т* успехов, вероятность которого самая
большая среди всех вероятностей (2.2.2). Чтобы определить это число,
рассмотрим отношение
Рп(т + \) _ {п-т)р
Рн(т) (т+\)д'
Если последующая биномиальная вероятность Р„{т + 1)
превышает предыдущую Р„(т), то это отношение больше единицы; если же
P„(ni + 1) < Р„(т), то меньше единицы.
Для нахождения т* надо уловить тот момент, когда отношение,
бывшее больше единицы, станет меньше единицы. Отношение
Рп(т* + \) _ (п- т*)р
Р„(т*) ~(m* + \)q~
имеет место при т* >пр- q,a отношение
Рщ{т*) =(n-m* + \)P:il
Рп(т*-\) (m*)q
32
при m* < пр + р; следовательно, окончательно получаем, что т* лежит
в интервале единичной длины:
np-q <т* <пр + р. (2.2.3)
Вернемся еще раз к урновой схеме, чтобы сравнить ее со схемой
Бернулли. В случае урновой схемы можно представить себе, что мы
осуществляем выборку объема п из урны не сразу, а последовательно
шар за шаром. В результате приходим к схеме последовательных
испытаний, однако в отличие от схемы Бернулли здесь результаты
последующих испытаний уже зависят от результатов предыдущих. Так,
если вероятность на первом шаге извлечь белый шар равна M/N,
то условная вероятность извлечь белый шар на втором шаге равна
(М- \)/(N- 1), если на первом шаге извлечен бедый шар, и MI{N- 1),
если на первом шаге извлечен черный шар.
Однако в том случае, когда генеральная совокупность велика
(т.е. N —> оо), урновую схему можно заменить схемой Бернулли. В са-
М
мом деле, пусть N, М —> °° таким образом, что > р- const. Тогда
формулу урновой схемы (1.1.3) можно преобразовать следующим
образом:
М\ (N-МУ-
ч CmC'n-m т\(М - т)\ (п - m)UN - М - п + т)\
РМ.ы(™,п)= = ■ ^ =
^М : '-
=с:
n\{N-n)\
М...(М - т + \){N -M)...(N -М -п + т + 1)
N...(N-n + \)
Используя то, что в получившейся дроби и в числителе и в
знаменателе по п сомножителей, разделим и числитель и знаменатель
на N' так, что каждый сомножитель при этом разделится на N:
М (М m-V\N - М ( М «-w-0
1...I1-
N
Переходя к пределу при N, М —> °о? получаем
lim Рмы(т,п) = СУ'"д"-'"=Р,1(т),
А/ М
,v-»<*>, —»«
N
33
т.е. при бесконечном объеме генеральной совокупности урновая схема
эквивалентна схеме Бернулли. На практике это означает, что при
объеме выборки, существенно меньшем объема генеральной
совокупности, можно вместо вероятностей урновой схемы приближенно
использовать соответствующие вероятности схемы Бернулли, т.е. при n«N
'-.*<*">-С7(£)"(^У"" (2-2-4)
Схема Пуассона (закон редких событий)
Рассмотрим, как ведут себя биномиальные вероятности при п —¥ «>,
р —> О, пр —» X. Умножим числитель и знаменатель на п"\ тогда
,К1-1/л)-((т-1)/Я) rd-^)-^re.t w)-
m! (1-р)'" w'
Предельные вероятности называются пуассоновскими:
P(w) = — е~\ т = О,1,... (2.2.5)
т!
Полиномиальная схема
От схемы независимых последовательных испытаний с двумя
исходами (схема Бернулли, или биномиальная схема) можно перейти
к полиномиальной схеме, т.е. к схеме последовательных независимых
испытаний, в каждом из которых возможны к исходов, к > 2, с вероят-
А
ностями р}, р2, ..., рь 0 < Pi■ < 1, ^р,; = 1. В этом случае пространство
/ = 1
элементарных событий содержит к' таких событий, а вероятность
того, что из п испытаний т.\ закончатся первым исходом, т2 -— вторым
исходом, ..., тк — &-м исходом, равна
Р,М,...,тк)= "' P';'...plh. (2.2.6)
w,!... тк!
Схема с зависимыми испытаниями
На практике, как было показано на примере урновой схемы,
далеко не всегда имеют место схемы с последовательными
независимыми испытаниями. Рассмотрим схему с зависимыми испытаниями,
34
в каждом из которых возможны к исходов. Элементарное событие,
как и в случае полиномиальной схемы с независимыми испытаниями,
тогда таково: (0 = {/[, i2i ..., /„}, где каждый индекс может принимать к
значений i{ = 1, 2, ..., к.
Вероятности элементарных событий такой схемы задаются
следующим образом:
р((й) =p{h)p{hli\) >»Р{Ш\,..., V i), (2-2.7)
p(ix //,,..., /v _,)£<), £ p{is //,,..., /r_,) = 1.
'» = i
Сумма определенных таким образом вероятностей элементарных
событий по всему их множеству должна быть равна единице. Докажем
это:
cue a i i„ = i
= Z ЯО'|)/70,2/'|)---Л//1.-"./«-2)^Л//1'-'-'/и-|)= '
I |„.,=| /„ = 1
= S Р('\)Р(*гп\)-Р(1„-1И\> ■••>*„-2)-
|'( |„ , ^1
В последнем равенстве было использовано условие (2.2.7) при s = п.
Еще и еще раз повторяя эту процедуру, мы наконец придем к
следующему равенству:
5>(o»=i>0'i) = l-
we Q I, = I
Последнее равенство также следует из выражения (2,2.7).
Последовательности испытаний, в которых условные вероятности
зависят только от исхода последнего из предшествующих испытаний
p(ijih ..., /,-i)=/#A-i),
называются цепями Маркова.
2.3. МАРКОВСКИЕ ЦЕПИ
Пусть некоторая экономическая, биологическая или техническая
система может находиться в одном из состояний Sb S2, ..., Sm и может
менять свое состояние в дискретные моменты времени / = 1, 2,... . Если
35
вероятности перехода р{] > 0, 2^/^=1 из некоторого состояния Sn
; = i
в другое состояние St не зависят от времени и задано начальное рас-
h
пределение вероятностей У*/?,0 = 1, то говорят, что задана однородная
марковская цепь.
В отличие от рассмотренных в предыдущем параграфе схем
последовательных испытаний (Бернулли и полиномиальной), в которых
испытания независимы, в марковской схеме, как видно из
вышесказанного, испытания зависимы, но таким образом, что при известном
настоящем состоянии будущие состояния не зависят от прошлых
состояний.
Матрицу переходных вероятностей
(тХга) Р = \\рЛ
называют стохастической, подразумевая под этим, что ее элементы
как вероятности неотрицательны и сумма элементов строки равна 1
т
При изучении марковских цепей наибольший интерес
представляют вероятности перехода за несколько шагов и асимптотическое
поведение вероятностей состояний, а также средние времена
пребывания в отдельных состояниях.
Обозначим вероятности перехода за / шагов через /?,, (7), тогда
из формулы полной вероятности вытекает следующее соотношение:
т
A,(> + *) = XAv(Op,/(.v). (2.3.1)
;- = l
Если обозначить через P(t) = /?,■/(О матрицу переходных
вероятностей за t шагов, то соотношение (2.3.1) запишется в следующей
матричной форме
P(t + s) = P(t)P(s), (2.3.2)
откуда Р(1)=р = |^.| (2.3.3)
P(t) = P(\)P(t-\) = F.
Если начальное распределение вероятностей сосредоточено
в одном состоянии /, то его можно задать единичным вектором
е, = (0,0,...0, 1.0....0), (2.3.4)
36
на г'-м месте которого находится единица, а на остальных местах нули.
Обозначим через p(t), {р(0) = р°) вектор-строку вероятностей нахождения
системы в своих состояниях, то согласно формуле полной вероятности
к
PjV) = 2,P?Ptj(t)> (2-3.5)
или в матричном виде
p(t) = p°P(t) = paP,1 (2.3.6)
в частности, при р° = е,,
pit) = e,P. (2.3.7)
Асимптотическое поведение переходных вероятностей р,у(?)
и вероятностей состояний р, (t) зависит от того, является ли
стохастическая матрица неразложимой либо разложимой.
Неотрицательная квадратная матрица А = на Л называется
разложимой, если ее путем перестановки строк и такими же
перестановками столбцов можно привести к виду (Л( Ф О, А2 Ф О, Ау Ф 0)
т. Шл
2
А, А
(тхт) А =
0 Аз
(2.3.8)
, т1+т2 = т.
Если же матрицу А нельзя путем перестановок строк и таких же
перестановок столбцов привести к виду (2.3.8), то такая матрица
называется неразложимой.
2.3.1. Стохастическая матрица неразложима
Докажем следующее утверждение': если стохастическая
матрица Р неразложима, то
limo (r) = p'\ y = l,2,...,m,
при этом предельное распределение вероятностей рЕ не зависит от
начального состояния и удовлетворяет уравнению
ph:=pEP.
Приведенное доказательство этого утверждения выполнил Колемаев В.А.
37
При доказательстве будем опираться на следующие два
утверждения1 относительно неотрицательных квадратных матриц (размера
т х т)\
1. Теорема Фрабениуса—Перрона. Неразложимая
неотрицательная матрица А имеет собственное число ХА> О, которое не меньше
модулей остальных собственных чисел, левосторонний собственный
вектор рА этого собственного числа имеет компоненты одного знака.
Асимптотическое поведение решения уравнения z{t) - z{t - \)А, z{t) =
= (zi(t), z2(t), ..., zk(t), определяется предельным соотношением
,. z(t) ' " u
lim = cpA, где с — скалярный множитель, зависящий от начально-
'— Х'А
го условия z(0) = Z.
2. Если матрица А неразложима, то А' > О, t > т.
Применим эти утверждения к стохастической неразложимой
матрице Р. Из второго утверждения вытекает, что вес переходные
вероятности pij(t) положительны при t > т.
Разберемся теперь с первым утверждением. Рассмотрим
равенство для определения собственных чисел X и левосторонних
собственных векторов р = (/?,, ...,/?„),
рР^Хр, (2.3.10)
для того, чтобы это однородное относительно р уравнение имело
решение отличное от нулевого, необходимо и достаточно, чтобы
определитель матрицы коэффициентов при неизвестных равнялся нулю
det(P-XEm) = 0, (2.3.11)
это характеристическое уравнение w-й степени для определения
собственных чисел имеет т корней А,,, Хъ ..., Х,„, т.е. столько, каков размер
матрицы Р.
Поскольку левая часть последнего равенства
(характеристический многочлен) может быть представлена в виде
т
(-\)mYl(X-Xi) = det(P-XE), (2.3.12)
то из этого, в частности, следует (trP — сумма диагональных
элементов матрицы Р)
т id
YX^trP, f[\.=detP. (2.3.13)
1=1 f = i
Доказательство этих утверждений приведено в книге Ашманова С.А.
«Введение в математическую экономику». М. : Наука, 1984.
38
Но для стохастической матрицы Р
trP<m,\detP\< 1,
поэтому из (2.3.12) следует, что модуль каждого из корней
характеристического уравнения (2.3.10) не превышает 1.
Вместе с тем X = 1 является корнем характеристического
уравнения (2.3.10), поскольку
det(/> - Е) = 0,
т.к. сумма столбцов матрицы (Р~Е) равна нулю:
( т \
£р,у-1 = 0, i' = l, 2,...,/я
ч./ = '
Таким образом, в соответствии с теоремой Фробениуса —
Перрона ХР = 1, поэтому этому корню отвечает левосторонний вектор
с компонентами одного знака. Поскольку собственные векторы,
отвечающие конкретному собственному числу, задают целое направление,
то выбираем из этого направления вектор с положительными
компонентами и такой, чтобы сумма всех его (положительных!)
компонентов равнялась единице.
Этот вектор обозначим рЕ, тогда согласно первому утверждению
т
рЕР = р\ //>0, Х>,£ = 1. (2.3.14)
Согласно (2.3.7)
p(t) = eiP'=p(t-\)P,umip(t) = p(t- \)р- (2.3.15)
Согласно первому утверждению теоремы
фробениуса—Перрона, асимптотическое поведение решения уравнения (2.3.15)
определяется предельным соотношением
но Хр = 1, поэтому предел вероятностей состояний существует и равен
к
lim p(t) = срр = р, £ р..- 1.
i= I
Поскольку предел существует, то он должен удовлетворять
соотношению, вытекающему из (2.3.15),
р = рР,
но такому же соотношению удовлетворяют установившиеся
вероятности рЕ, поэтому р — рЕ (из-за единственности установившегося
решения 2.3.14), так что
lim p(t) = pE,
где // удовлетворяет (2.3.14).
Смысл установившегося (предельного) распределения состоит
в следующем. При больших значениях промежутка времени Г среднее
время пребывания в состоянии 51, равно pfT.
Пример 2.2. Расчет предельного распределения вероятностей
Система обслуживания меняет свои состояния в дискретные
моменты времени / - 1,2,..., имеет два состояния: 0 (свободна), 1 (занята).
Матрица переходных вероятностей (за один таг) имеет вид:
1 — а а
Р =
b 1 - b,
где а - - вероятность поступления фсбоваиия, 0 < а < I;
b вероятность освобождения системы, 0 < b < I.
Найти установившееся распределение вероятностей.
Согласно только что доказанному утверждению, установившееся
распределение рЕ =(рЕ,рЕ) удовлетворяет уравнениям
(Р§,Р?)=(р!.Р?)[у-а а X *f + rf = i
I Ь \-Ь)
или в развернутой форме (первое уравнение является следствием
второго, поэтому первое уравнение отбрасываем)
U=ap!;+pE(\-b)
Получившаяся система уравнений имеет следующее решение
Е h /•' °
а + b а + b
следовательно, в установившемся режиме доля времени, когда система
свободна, равна , когда занята — .
а + b а + b
2.3.2 Стохастическая матрица разложима
Если стохастическая матрица Р имеет вид (2.3.8), то из
последних т2 состояний нельзя попасть в первые w, состояний, поэтому
первые состояния называются невозвратными.
40
Рассмотрим следующий пример.
Пример 2.3. Марковская цепь обучения в ВУЗе
Решением Госдумы РФ переход на двухступенчатую систему
высшего образования предусмотрен с 2009 г. Сейчас в ряде ВУЗов
действует смешанная система, в результате выпускниками становятся
бакалавры, специалисты и магистры.
Для упрощения модели примем, что на последнем курсе
бакалавриата отчислений нет, такие же предположения делаются относительно
последнего курса при подготовке специалистов, магистров.
Итак, пусть имеются следующие состояния обучающихся в ВУЗе
(на дневном отделении):
А — абитуриент,
5, — первокурсник,
S2 — второкурсник,
Sy — третьекурсник,
54 — четверокурсник,
55 — пятикурсник,
Sb — слушатель шестого года обучения,
Ot — отчисленный с первого курса,
02 — отчисленный со второго курса,
■Оу — отчисленныйстретьего курса,
Б — бакалавр,
С — специалист,
М — магистр.
Тогда граф переходов из состояния в состояние указанной цепи
Маркова выглядит так, как показано из рис. 2.1 (/?, — вероятность
перехода на следующий год обучения, q{ — вероятность отчисления, г, —
вероятность возвращения к обучению / = 2, 3, г6, гс— вероятность
продолжения обучения бакалавра, специалиста).
%
ША) РтДРгДРэ гбД_гсД_
q?_
1-rK
1-Гг
9б
1 - г.
а
1-г,
1 -гк
1-г„
га щ \в1 \м
Г Т Т Т 7
Рис. 2.1. Граф переходов из состояния в состояние
в процессе обучения в вузе по смешанной очной форме
41
Матрица переходных вероятностей в таком случае примет вид:
(13x13)/' =
<7,
0
0
0
0
0
0
1
0
0
0
0
кО
Ро
0
0
0
0
0
0
0
0
0
0
0
0
0
Р\
0
0
0
0
0
0
гг
0
0
0
0
0
0
Pi
0
0
0
0
0
0
h
0
0
0
0
0
0
Pi
0
0
0
0
0
0
0
0
0
0
0
0
0
гн
0
0
0
0
0
rH
0
0
0
0
0
0
0
rc
0
0
0
0
0
ry
0
0
4\
0
0
0
0
0
1-1
0
0
0
0
0
0
0
Чг
0
0
0
0
0
l-'2
0
0
0
0
0
0
0
03
0
0
0
0
0
l-'з
0
0
0
0
0
0
0
l-'*
0
0
0
0
0
l-'*-
0
0
0
0
0
0
0
\-rc
0
0
0
0
0
1-1-
0
0
0
0
0
0
0
I
0
0
0
0
0
1
Состояние M является поглощающим < поскольку, попав в это
состояние, уже нельзя пыйти из него (/;„ - I), Сумма переходных
вероятное гей в каждой строке равно единице, т.к. р, + ц, = I, / = О, 1 5,
состояния 5\, S„ 5*4, S^, $ь. £, С являются невозвратными, поскольку,
выйдя из них, уже нельзя в них вернуться.
Р-
Мцрковекие цепи, стохастическая матрица которых разложима,
и все состояния которых являются невозвратными либо
поглощающими, называются поглощающими.
Матрица их переходных вероятностей имеет вид
г \"
Q *
тг J
Такая система постепенно переходит из невозвратных
состояний в поглощающие, находясь в невозвратных состояниях некоторое
случайное время. Обозначим через т(/ случайное время пребывания
в состоянии Sj, если система в начальный момент времени находилась
в состоянии Sh и пусть Т= А/тг/ , i,j =1,2, ..., m. Имеем (5,у —
символ Кронекера)
Т.. = Mx&=bfJ +qij + Y,q,kqkJ + £ 2>А<?,/ + ■•■> (2-3.16)
k = \
fr = 1 /- = 1
42
при этом первое слагаемое равно 1, если / = у, т.е. один шаг проведен
в состоянии St второе слагаемое — вероятность того, что один шаг
проведен в состоянии S, после того, как система перешла из состояния
S/ в состояние 5), третье слагаемое — вероятность того, что еще один
шаг проведен в состоянии Sf после того, как система перешла из
состояния S, в состояние Sh провела в нем один шаг (если к =у, то этот
предыдущий шаг учтен уже в предыдущем слагаемом) и перешла
затем из Sk в £/, и т.д.
В матричном виде для всех i,j - 1, ..., тх соотношение (2.3.16)
записывается так:
T = Emi+Q + Q2+..^(Enh-Qy\ (2.3.17)
Обозначим теперь через т,
7-1
общее время пребывания системы в невозвратных состояниях,
начиная с первоначального состояния St (включая время пребывания в
начальном состояний), тогда вектор-столбец Ml = (Мхь Mz2, ..., Mzm )'
равен
Мх = Те,
где е = (1, 1,..., 1У — вектор-столбец из единиц.
Наконец, обозначим через 5(/ время попадания в поглощающее
состояние S/ при выходе из Sh тогда
MsfJ = Yj M'4ikPk/> * = 12> •••> m\. J = m\ + I m\ + 2> •••> m>
k = l
или в матричном виде
{m,Xm2)\MSiJ\ = TQ.
ВОПРОСЫ И ЗАДАЧИ
1. События At,A2, ..., Ак независимы, Р(А) = р„ i = 1, ..., к. Найти
вероятность:
а) появления хотя бы одного из этих событий;
б) непоявления всех этих событий;
в) появления только одного (безразлично какого) события.
43
2. В партии N изделий, занумерованных в порядке изготовления от 1
до -V, изделия извлекаются наудачу по одному (без возвращения). Чему
равна вероятность того, что хотя бы при одном извлечении номер
вынутого изделия совпадет с номером испытания?
3. Рабочий обслуживает 12 однотипных станков. Вероятность того, что
станок потребует к себе внимания рабочего в течение промежутка
времени Т, равна '/,. Чему равна вероятность того, что:
а) 4 станка за время Г потребуют к себе внимания рабочего;
б) число потребовавших внимания станков находится в интервале
между 3-м и 6-м (включая границы).
4. В семье 10 детей. Считая вероятности рождений мальчика и девочки
равными 'Л, найти вероятность того, что в семье:
а) 5 мальчиков и 5 девочек;
б) число мальчиков от 3 до 8.
5. В вузе обучаются 730 студентов. Вероятность того, что день рождения
наугад взятого студента приходится на определенный день года, равна
71б5 Для каждого из 365 дней. Найти:
а) наиболее вероятное число студентов, родившихся 1 января;
б) вероятность того, что найдутся три студента, имеющих один и тот
же день рождения.
ГЛАВА 3
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
И ИХ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
Наряду со случайным событием и вероятностью понятие
случайной величины является важнейшим в теории вероятностей. Случайная
величина — это числовая функция, определенная на пространстве
элементарных событий. В настоящей главе представлены случайные
величины, наиболее часто встречающиеся в сфере экономики и управления,
а также определены и изучены их важнейшие характеристики: функции
распределения вероятностей и плотности распределения вероятностей,
ряды распределения, показатели центра группирования их значений,
степени вариации значений вокруг центра и другие числовые
характеристики.
3.1. ОПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
И ЕЕ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
Случайные величины встречаются нам повсюду в окружающей
нас действительности: курс доллара или температура воздуха в наугад
взятый день, цены товаров, время ожидания транспорта при поездке
на работу, прибыль или убытки фирмы, предприятия, организации, в
которой работаем, и т.п. Даже число дней в наугад взятом году является
случайной величиной: с вероятностью 3/4 это число равно 365, а с
вероятностью 74 — 366.
Из последнего примера видно, что значение случайной
величины зависит от результата эксперимента: является ли наугад взятый год
високосным или обычным. Под результатом эксперимента здесь
понимается наступление конкретного элементарного события (исхода) со,
из всего множества (пространства) элементарных исходов £1. В нашем
примере это пространство может быть таким:
Q. = jet),, СО2, со,, со4},
где со,, аь, ш3 — первый, второй и третий обычные (невисокосные) годы;
(04 — високосный год.
Тем самым число дней в году (случайная величина X) является
функцией от элементарных исходов: Х(щ) = 365, ДсОг) = 365, Дсо,) =
= 365,Дсо,) = 366.
45
Иными словами, случайная величина как функция от со
осуществляет отображение пространства элементарных событий £2 в
некоторое подмножество на числовой прямой. При этом каждому со
отвечает одно и только одно число (в нашем случае Дсо() =365, Х(с^) =
= 365, Дсо,) = 365, Х(0Х\) = 366). Напротив, прообразов конкретного
значения случайной величины может быть много. Например,
множество тех элементарных событий, для которых Дсо) = 365, состоит
из трех элементарных событий:
{со: Дсо) = 365} = {со,,со2, соз).
Случайная величина, принимающая конечное или счетное число
значений на числовой прямой, называется дискретной. В нашем
случае мы имеем дело с дискретной случайной величиной, поскольку она
принимает два значения: 365, 366. Если же случайная величина
принимает непрерывное множество значений (например, значения на всей
прямой, на полупрямой, на отрезке), то такая величина называется
непрерывной.
Для того чтобы работать со случайными величинами, надо знать
в той или иной форме вероятности тех или иных значений случайной
величины. Так, для дискретной случайной величины надо знать
вероятности отдельных ее значений. В нашем примере надо знать
вероятности событий
Л, = {со: Дсо) = 365} = {со,, coj, со3},
Л2={со:Дсо) = 366} = {со,},
поскольку любой год из четырех равновозможен, то по классическому
определению вероятности
Р(А]) = У4,Р(А2) = Ч4.
Для непрерывных случайных величин надо уметь подсчитывать
вероятность попадания на полупрямую, на полуинтервал и т.п., т.е.
вероятности событий
{со: Дсо) <х}, (со: х < Дсо) < х2}.
Поскольку при X, < х2
{со:;с<Дсо)<;с2} = {со : Дсо) <х2}\{со: Дсо) <х{},
то на самом деле достаточно уметь подсчитывать вероятности
попадания на полупрямую. Следовательно, надо, чтобы для любого х
множество {со : Дсо) < х} имело вероятность, т.е. принадлежало полю
событий S:
{со: Дсо)<х} g S.
Эти наводящие соображения делают понятным следующее
строгое (формальное) определение случайной величины.
Случайной величиной называется числовая функция Х(со),
заданная на пространстве элементарных событий О, и измеримая
относительно поля событий S. Под измеримостью в данном случае
понимается следующее: для любого -» < х < <»
{со:Дсо)<х}€ S.
(Далее случайные величины будут обозначаться прописными
латинскими буквами (например, X, Y, Z) или строчными греческими
буквами.)
Таким образом, чтобы знать все о случайной величине, надо для
любого -<» < х < оо знать вероятность
Р{ы\Х(<1))<х},
т.е. совокупность всех таких вероятностей концентрирует все знания
о распределении вероятностей по значениям случайной величины.
Потому функция распределения вероятностей, значение
которой при конкретном ,v и есть одни из таких.вероятностей,
содержит в себе все сведения о случайной величине.
Если речь идет об одной случайной величине, кик в динном
контексте, то в обозначении функции распределения опускается индекс
случайной величины, т.е. употребляется просто И*) (без индекса).
Как числовая функция от числового аргумента дг, заданного
на всей прямой, функция распределения обладает следующими
свойствами:
1) 0<ВД<1;
2) является неубывающей функцией, т.е. для х2 >ЛГ|
F(x2)>F(X]);
3) непрерывна слева, т.е.
F(x) = F(x - 0) = lim F(xn);
V;j —».V
4) F(-oo) = 0, F(+oo) = 1.
Первое свойство очевидно, поскольку значение функции
распределения — это вероятность.
47
Для доказательства второго свойства введем следующие
обозначения:
Л, ={со: Х{ы)< хх), 1
Аг ={co:A-(co)<jc2}, I (3.1.1)
5 = {co:jt, < Х(<а)<х2},\
тогда
P{A) = F{x^P{A2) = F{x2).
Поскольку л, < л2, то Л, с Л2, кроме того, Л2 = А{ U 5, причем, как
видно из обозначений, события Ах и В несовместны, поэтому, согласно
аксиоме сложения,
Р(А2) = Р(А1) + Р(В). (3.1.2)
Следует заметить, что множества Аи А2 и В действительно
являются событиями, т.е. Л, е 5, А2 е 5, 5 е S. В самом деле, принадлежность
Л,, /I, полю событий 5 непосредственно вытекает из определения
случайной величины. Множество В является теоретико-множественной
разностью событий Л, и Аг, которую можно заменить операциями
пересечения и дополнения
В = А2\А1 =Л2ГЙ>
а поскольку поле замкнуто относительно операций пересечения
и дополнения, то В е S. Далее будем использовать полученный здесь
результат: поле замкнуто относительно операции
теоретико-множественной разности, а следовательно, и симметрической разности.
Используя формулу (3.1.2), последнее соотношение перепишем
в следующем виде:
F{xJ = F{xl) + P(B)t
ИЛИ
F(x2)-F(x,) = P(B). (3.1.3)
Поскольку вероятность любого события неотрицательна,
то Р(В) > 0 и, следовательно, F(x2) > /^л",). Таким образом, второе
свойство доказано.
Используя обозначения (3.1.1), запишем формулу (3.1.3) в
следующем виде:
P{xi<X<x2\=F(x2)-F(xl), (3.1.4)
иными словами, вероятность попадания на полуинтервал х, < X < х2
равна разности значений функции распределения на концах
полуинтервала.
48
При доказательстве третьего свойства будем пользоваться
расширенной аксиомой сложения, а также следующими обозначениями:
В,1={<м:.х„<х<х\
xl <х, <...<„Y)r <...<*, \imx/l=x, (3.1.5)
т.е. х„ — монотонная последовательность, сходящаяся к х.
Поскольку последовательность х„ монотонна, то В. :э В. для /</'.
Кроме того, так как Вп Г\ В11 + ] = Вп + Г то
= (Bllf]Bn + ])\J{Bll + ,[]Bn,1)\J(Bll + lf]Bll,2) =
= ...= \J(BkriBk + l)\jf\Bk:
к =и к = и
т.е. может быть представлено в виде бесконечного объединения
непересекающихся «колец» ВкГ\Вк + [ и несовместного с ними ядра Г\ д
к = п
поэтому на основании расширенной аксиомы сложения
( -
P{Bll)=^P(Bkf]Bk^) + P f]Bk
к = и \ к - и
Но из формулы (3.1.5) видно, что
f] Вк ={(й:х$Х <х} = 0,
(3.1.6)
т.е. ядро — невозможное событие, поэтому
( ~ ^
Р [)Вк = />(0) = О.
\k = ll J
Следовательно, формула (3.1.6) примет вид:
Р(В„)=^Р(ВкПВк + ^
но ряд
!>(** Г) *, + |) = />(*,)•
к = 1
как видим, сходится, поэтому его остаток сходится к нулю:
£р(вкпвк^) = р(вя)->о.
(3.1.7)
Используя обозначения (3.1.5), запишем формулу (3.1.7) в
следующем виде:
P(Bll) = P{m:x„SX(m)<x}=F(x)-F(x„)^0.
Отсюда
WmF(x„)=F(x-0) = F(x),
х„ -*х'
х„<х
что и требовалось доказать.
Четвертое свойство вытекает непосредственно из того, что
{со:ЛГ(со)<^°}=0,
{со : Х(са) < +«>} = Q.
поскольку Р(0) = 0, a P(Q) = 1.
3.2. ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
И ИХ ВАЖНЕЙШИЕ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
Кик было сказано выше, дискретная случайная неличина
принимает конечное или счетное число значений. Поскольку переход от
конечного числи значений к счетному не представляет больших
технических трудностей, то основные характеристики дискретной случайной
величины будем рассматривать при конечном числе значений.
Итак, пусть случайная величина принимает конечное число к
значений V, < х2< ... < хк. Тем самым все пространство элементарных
событий Q отобразится случайной величиной Х(ы) в к этих значений,
прообразами которых служат события
А,= {со :Дсо) = *,},/= 1,2, ...,А,
образующие полную группу, поскольку эти события несовместны
и вместе составляют £1.
Следует заметить, что множества А,- действительно являются
событиями (т.е. A, е S), поскольку в нашем случае для *; < jc < х,■ +,,
А,= {СО: Дсо) = xi} = {со: х, < Дto) <х) е S,
тем самым заданы их вероятности
л- = /Х4),о<л.<1, ,-=i,...,A,
причем ^ р. = 1, так как события А, образуют полную группу.
/ = i
50
Итак, каждому значению дискретной случайной величины
отвечает его вероятность. Последовательность таких пар и образует ряд
распределения дискретной случайной величины
, *i х-, *- ^
Х~
Я, Pi ... Рк)
х1<х2<...<хк,
0<Л<1, i = l,...,k, J>,=1.
1 = 1
Например, альтернативная случайная величина, описывающая
результат единичного испытания в схеме Бернулли, задается двумя
значениями — 0 (неудача) и 1 (успех) и отвечающими им
вероятностями отрицательного и положительного исходов q = 1 -pup,
поэтому ряд распределения примет форму:
X ~\ , или символическая запись^ ~ А(р)
\Ч PJ
0<р< \,р +q=\.
Ряд распределения биномиальной случайной величины (числа
положительных исходов в схеме Бернулли) имеет вид:
X
Л0 1 т пЛ
, ипиХ -В^п,р),
и- щиг1 с:;ря"~т р)
т = 0
Зная ряд распределения, можно найти функцию
распределения. В самом деле, имеем
-°°<х<х[, {ол:Х(ол)<х} =0,
х, <х<х2, {со: Дсо) <х} = {со:Дсо) <х,} = Аь
Xj<x<xi + ]> {(xnX((D)<x}=\J{(£>:X((u) = xi} = \JAi,
/=i /=i
к к
хк<х<™, {со: Х(ы)<х] = (J{со: Х(ы) = х,.} = (J А{ = П,
» = )
51
поэтому функция распределения примет вид:
О, - °о < х < х,,
р,, х, <х<х2,
F(x) =
£/;,., х,<х<х, + 1,
(3.2.4)
1,
X, < X < °°.
Таким образом, функция распределения F(x) является
ступенчатой (кусочно-постоянной) со скачками в точках, координаты которых
равны значениям случайной величины, а значение функции равно
сумме вероятностей значений, не превосходящих данное. Напротив,
зная ступенчатую функцию распределения дискретной случайной
величины, можно найти ее ряд распределения. В самом деле, пусть
F(x) = qhxl<x<xl, ,,/=0, ...Д(х0 = -о°,х*+| =+00),
тогда
Р{со: Дсо) = х,} =Р{со:х,<Дсо)<х,и} =
= F(xl,l)~F(xl) = ql¥l~ql.
Таким образом, и функция распределения, и ряд распределения
являются эквивалентными обобщающими характеристиками
дискретной случайной величины. При определении важнейших числовых
характеристик дискретной случайной величины (математического
ожидания и дисперсии) будем использовать ряд распределения.
Математическое ожидание
Математическое ожидание, или генеральное среднее, является
наиболее употребительной числовой характеристикой центра
группирования значений дискретной случайной величины. Обозначается
прописной латинской буквой Л/, поставленной перед обозначением
случайной величины: MX— математическое ожидание случайной
величины X. Математическое ожидание — средневзвешенное значение
случайной величины с весами-вероятностями
MX = Y,xiPr (3.2.5)
52
Например, если заработная плата (в некоторых денежных
единицах) имеет следующий ряд распределения:
80 100 120 ]
0,25 0,5 0,25/
то средняя заработная плата (математическое ожидание)
МХ = 80 • 0,25 + 100 • 0,5 + 120 • 0,25 - 100.
X -
СВОЙСТВА МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ
1. Математическое ожидание постоянной равно самой этой
постоянной:
МС=С Р{С=С} = С.
2. Константа выносится за знак математического ожидания:
к к
M(CX) = ^{Cxi)pi=C^xiPi=CMX.
i=i i=i
3. Математическое ожидание суммы случайных величин
равно сумме их математических ожиданий:
М(Х+ Y)=MX+ MY. (3.2.6)
Чтобы доказать это свойство, введем ряды распределений
участвующих в нем случайных величин
X + Y-
, X
xi + У j
P{X = xitY=y.}
/ - 1, ..., /с; /- 1, ..., т
Вначале докажем, что
, Y
т л
В самом деле, поскольку события
А,= {co:X(co) =*,},/= 1, ...,k,
образуют полную группу точно так же, как и события
Я,= {(о:П(о)=^},./= \,...,т,
то
т ш
%P{<o:X(<o) = xnY(<o)=yJ}='£tP(Air\BJ) =
./ = 1
= Р
7=1
7=1
= P{Ai) = P{a>:X(a» = xi}=pl,
53
аналогично
т
7 = 1
Используем теперь полученные выражения для сумм вероятностей
при доказательстве третьего свойства, имеем:
к /и
к т т к
= !LxiI,p{x = x<>Y=у,) + Ъу,Ър{х=xi>Y = у,) =
/=l j=\ у=1 7=1
к т
т.е. свойство доказано.
4. Математическое ожидание произведения независимых
случайных величин равно произведению их математических ожиданий:
MXY=MX-MY. (3.2.7)
Две дискретные случайные величины X и Y называются
независимыми, если события А{ = {ш : До) = х,}, Bj = {со : У(со) = у(}
независимы для любых / = 1,..., k\j = 1, ..., т. В § 3.6 будет дано более общее
определение независимости случайных величин, из которого как
частный случай будет вытекать данное определение.
Перейдем к доказательству, используя введенные обозначения
и независимость X, Y:
k т
1=1/=1
к т к in
= T,T,xiyjp(x=xi)p{Y = y;) = 2xiP>Tyj4i = MX-MY>
i = 1 j = 1 / = I y = l
что и требовалось доказать.
Найдем теперь математические ожидания дискретных
случайных величин, наиболее часто встречающихся в экономических
приложениях.
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ
АЛЬТЕРНАТИВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Используя ряд распределения альтернативной случайной
величины [см. формулу (3.2.2)], получаем:
MX=0 q+ \ р = р,
54
т.е. математическое ожидание альтернативной случайной величины
равно вероятности положительного исхода.
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ
БИНОМИАЛЬНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Биномиальную случайную величину X (число положительных
исходов в п испытаниях по схеме Бернулли) можно представить как
сумму альтернативных случайных величин, каждая из которых Xf
описывает результат /-го испытания в схеме Бернулли (число
положительных исходов в одном испытании):
* = 1Х 0-2.9)
Опираясь на формулу (3.2.9) и на свойство 3, получаем:
( " ) "
мх = м Y,xi =,£мх1=пр>
l'=l ) '-I
т.е. математическое ожидание биномиальной случайной величины
равно произведению числа испытаний на вероятность положительного
исхода.
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ
ПУАССОНОВСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Закон редких событий, вероятности которого были найдены
в § 2.2 как предельные значения биномиальных вероятностей при
я —► °°, р —» 0, пр —»X, задается следующим рядом распределения:
(О 1 ... т ..А
Х =
л т
е Ле ...—е
илиХ-П(^). (3.2.10)
т!
Поскольку пуассоновская случайная величина является в
указанном выше смысле предельной по отношению к биномиальной,
то математическое ожидание первой является пределом
математического ожидания последней, поэтому математическое ожидание пуас-
соновской случайной величины
МХ=\. (3.2.11)
Тот же результат получается прямым счетом:
», = о w! ,„ = )(m-l)!
55
МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ
ГЕОМЕТРИЧЕСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Геометрическая случайная величина — число испытаний по
схеме Бернулли до первого положительного исхода, ее ряд распределения
имеет вид:
'Л 2 ... т . ^\
р pq ... pq' ...,
Математическое ожидание находим прямым счетом:
MX =±трд>"-1 = pf^mq'"-1 = pf^(q'"l =
т = 1
( ~
(3.2.12)
= Р
= р
J
1
т = О
Р
О-я)'
(3.2.13)
т.е. математическое ожидание геометрической случайной величины
обратно пропорционально вероятности положительного исхода.
Дисперсия
Дисперсия случайной величины является наиболее
употребительной числовой характеристикой вариации значений случайной
величины вокруг центра группирования. Обозначается прописной
латинской буквой D, поставленной перед значком случайной величины:
DX— дисперсия случайной величины X.
Дисперсия — это математическое ожидание квадрата
отклонения случайной величины от своего математического ожидания:
DX=M(X-MX)2. (3.2.14)
Если раскрыть квадрат под знаком математического ожидания,
то получим вторую формулу дисперсии:
DX= М(Х- MX? = М(Х2 - 2Х ■ MX + (MX)2) =
- MX2 - 2(MX)2 + (MX)2 = MX2 - (MX)2,
т.е. DX=MX2-(MX)2. (3.2.15)
В формулах (3.2.14), (3.2.15) встретилась квадратичная функция
случайной величины. По определению, функцией от дискретной
случайной величины (р(Х) называется случайная величина, ряд
распределения которой имеет вид:
'(р(дг,) ф(х2) _ ($>(хкУ
, A Pi Pk
ф№ =
56
т.е. значения этой случайной величины — функции от значений
случайной величины (аргумента), а вероятности те же самые, что у
величины-аргумента.
Для конкретной случайной величины, использованной для
демонстрации расчета математического ожидания, МХ= 100 (см. с. 53):
f(80-100)2 (100-1 Об)2 (120-100)2)
0,25 0,5 0,25
(х- мху =
поэтому
DX= М(Х- MX)1 = 202 • 0,25 + 0 • 0,5 + 202 • 0,25 '= 200.
Свойства дисперсии
1. Дисперсия постоянной равна нулю:
DC= М(С - А/С)2 = М(С-С)2 = 0.
2. Постоянная выносится за знак дисперсии с возведением
в квадрат:
D(CXf = ЩСХ- М(СХ)]2 = М[С(Х- MX)]2 =
- М[С 2(Х- MX)1] = C2DX.
3. Дисперсия суммы независимых случайных величин равна
сумме дисперсий:
D{X + Y) = DX + DY.
В самом деле, используя четвертое свойство математического
ожидания, имеем:
D(X+ Y) = М(Х+ Y)2 - \М(Х+ Y)]2 = MX2 + 2MXY+MY2 -
- (MX2) - 2МХ ■ MY- (MY)2 = MX2 - (MX)2 + M.Y2 - (MY)2 +
+ 2(MXY-MX- MY) = DX+DY.
4. Дисперсия произведения независимых случайных величин X, Y
равна разности произведения математических ожиданий квадратов
случайных величин и произведения квадратов математических
ожиданий случайных величин:
D(XY) = MX2 ■ MY2 - (MX)2(MY)2.
Подсчитаем теперь дисперсии случайных величин,
математические ожидания которых были найдены выше.
ДИСПЕРСИЯ АЛЬТЕРНАТИВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Поскольку MX = р, то
\о-р? (\-р)2)
V Ч Р )
(х - мху =
57
поэтому
DX = М(Х- MX)2 = p2q + q2p = pq,
т.е. дисперсия альтернативной случайной величины равна
произведению вероятностей положительного и отрицательного исходов.
ДИСПЕРСИЯ БИНОМИАЛЬНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Поскольку биномиальная случайная величина может быть
представлена как сумма независимых альтернативных величин, то
Г" } "
DX = D £ДГ/ = £zXT,.=w (3.2.16)
,, = i J i = \
т.е. дисперсия биномиальной случайной величины равна
произведению числа испытаний на вероятности положительного и
отрицательного исходов.
ДИСПЕРСИЯ ПУАССОНОВСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
По тем же соображениям, что и при подсчете математического
ожидания,
DX=\\mnpq = \. (3.2.17)
/?->0
С другой стороны, прямым счетом приходим к тому же результату:
MX1 =Ym2 —е~* = е'х У т(т - 1 + 1)— =
», = о т[ т = \ т-
оо 1 1П оо У III
е > щт-\)— + > т — е =
<*> л т- 2
= е"-Ч2У>2— + Х = Х2+Х,
Л '(т-2)\
поэтому
DX = MX2 - (MX)2 = Х2 + Х-Х2 = Х.
Таким образом, дисперсия пуассоновской случайной величины
равна параметру Л,.
58
ДИСПЕРСИЯ ГЕОМЕТРИЧЕСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Используя ряд распределения (3.2.12) и расчеты (3.2.13), находим
Od 00
MX2 = £ m2pqm-{ = Y,Mm " l + 1)K""' =
m = I m = I
= |>(т-1)р<Г' +Е^т",=^1(^Г +i =
I V * I .l l И,1 2W 1 2q ^ 1
U = o J, Я УХ'Я) ч P (1-9) P P P
поэтому
OA' = MA'2-(MA')2=^- + ---L = 4-. (3.2.18)
ДИСПЕРСИЯ СУММЫ СЛУЧАЙНЫХ ВЕЛИЧИН
Если случайные величины X, У зависимы, то дисперсия их
суммы и разности записывается в следующем виде (см. доказательство
третьего свойства дисперсии):
D(X±Y) = DX+DY±2cov{X,Y), (3.2.19)
где cov(X, Г) = M(X-MX)(Y- MY) = MXY-MX-MY— коэффициент
ковариации (совместной вариации) случайных величин X, Y.
3.3. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
И ИХ ВАЖНЕЙШИЕ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ
Как было сказано выше, непрерывная случайная величина
принимает континуальное множество значений на прямой (на отрезке,
на полупрямой, на всей прямой и т.д.). Непрерывные случайные
величины делятся на два класса: абсолютно непрерывные (именно их далее
для краткости часто будем называть просто непрерывными) и
смешанные, обладающие свойствами как дискретных, так и непрерывных
случайных величин.
Случайная величина называется абсолютно непрерывной, если
ее функция распределения может быть представлена в виде:
.V
F(x)= \j\z)dz, (3.3.1)
59
такая функция распределения непрерывна, как функция от верхнего
предела интегрирования. Напомним, что функция распределения
дискретной случайной величины — ступенчатая функция. Смешанные
случайные величины имеют кусочно-непрерывную функцию
распределения с конечным или счетным множеством скачков.
Покажем теперь, что подынтегральная функция в формуле
(3.3.1) — это функция плотности вероятности, т.е. вероятность,
приходящаяся на единицу длины в данной точке.
В самом деле,
Р{х < Х< х + Л*} = f(x + Ах) - F(x) =
л- + Дх .v х + Дд-
= J f(z)dz-\f(z)dz = \ f(z)dz,
-со —оо v
поэтому вероятность, приходящаяся на единицу длины в данной точке,
1 1 v + Лх'
lim — Р{х<Х<х + Ах} = lim — f f(z)dz= f(x),
At->0Дг Лх-->1)Дг J
Л"
т.е. /(х) — действительно функция плотности вероятности. Если надо
отличать плотность одной случайной величины от другой, то
употребляют индекс случайной величины: fx(x). Поскольку по определению
F(+^)=] f(z)dz> аД+оо) = 1,
то
\f{z)dz = \, (3.3.2)
т.е. функция f(x) является функцией плотности только тогда, когда
интеграл от нее по всей числовой прямой равен единице.
Итак, зная функцию плотности/(х), получаем функцию
распределения:
х
♦ F(x) = \f{z)dz,
напротив, если известна функция распределения, то функция плотности
j\x) = F\x).
Таким образом, для абсолютно непрерывных случайных
величин функция плотности и функция распределения являются
эквивалентными обобщающими характеристиками случайной величины.
Ввиду удобства обычно используется функция плотности.
60
Пример 3.1. Функции плотности и распределения вероятностей
равномерной случайной величины
Рассмотрим равномерную случайную величину. Равномерное
распределение имеет время ожидания наугад взятым пассажиром
транспорта, курсирующего с фиксированным интервалом. Обозначим время
ожидания через т, а отдельные значения этой случайной величины
через t.
Плотность равномерной случайной величины задается следующим
образом:
fi/Л 'е[о,/],
Л( (о, Г« [0,/], илит~(/(о,/),
где / — длина интервала движения транспорта.
Поскольку Fx(i)= [ fx(s)d.s, то, выполнив интегрирование, находим
вдч
0, -~ < х < О,
х/1, 0<х</,
1, 1<Х<°°.
На рисунке 3.1 приведены графики функций плотности и
распределения равномерной случайной величины.
1
FM)
№
1
0
^
W) /
W)
'
!
t
Рис. 3.1. Графики функций плотности и распределения
вероятностей равномерной случайной величины
61
Иногда рассматривают равномерную случайную величину X,
заданную на отрезке [а, Ь]\
\1{Ь-а\ хе[а,Ь],
О, хе[а,Ь].
/,(*) =
Вероятность попадания на отрезок
Поскольку для абсолютно непрерывных случайных величин
х + Д.У
lim Р{х <, X <, х + Ах} = lim Г f(z)dz = О,
то вероятность попадания в любую точку х равна нулю. Поэтому
вероятность попадания на отрезок равна интегралу от функции плотности
по данному отрезку:
Р{Ь <Х< с) = P{b<X<c) = \f{z)dz.
(3.3.3)
Математическое ожидание
абсолютно непрерывной случайной величины
Пусть случайная величина имеет функцию плотности, заданную
на некотором отрезке [Ь, с] (рис. 3.2). Переход к случайным
величинам, для которых b = -°° и(или) с = +оо сопряжен с такими же
трудностями, как переход от собственного к несобственному интегралу.
,/(х) А
Рис. 3.2. График функции плотности распределения
вероятностей случайной величины со значениями на [Ь, с]
62
Разобьем отрезок [6, с] на к равных по длине полуинтервалов.
Вместо случайной величины Xрассмотрим допредельную дискретную
случайную величину Хь которая имеет следующий ряд распределения:
/ V V У \
*А =
Я, X
VI
Р\ Pi Рк)
г с — Ь
где pt= J f{z)dz= J{x,)A, Д = ——.
Последнее равенство получено с помощью теоремы о среднем.
Тогда 2_,р( = \f(z)dz = l, т.е. X— действительно дискретная
f = i h
случайная величина.
Ее математическое ожидание
1 = 1 /=|
т.е. представляет собой интегральную сумму, которая при к —» ©о
сходится к интегралу
Г xf(x)dx.
b
Последний естественно принять за математическое ожидание
случайной величины X:
Таким образом, в общем случае математическое ожидание
абсолютно непрерывной случайной величины X равно
MX = J xf\x)dx. (3.3.4)
По указанным выше наводящим соображениям сохраняются все
свойства математического ожидания, приведенные в § 3.2.
Далее всегда будем сокращенно обозначать математическое
ожидание буквой а, т.е. MX = а.
Используя это обозначение и определение математического
ожидания для абсолютно непрерывной случайной величины, получаем
следующую формулу для ее дисперсии:
-н*>
DX = М(Х - MX)2 = j(x- a)2 f(x)dx> (3.3.5)
63
или
DX = MX2 - (MX)2 = J x2f(x)dx - a:
Показательная случайная величина
как время обслуживания
В аналитической теории массового обслуживания (см. гл. 5)
время обслуживания требования каналом обслуживания принимается
распределенным по показательному закону. Плотность распределения
вероятностей показательного закона имеет вид:
_ Ue"M', f>0,
т ~|0, /<0, wm%~U(oJ)
1 v ' (3.3.6)
о о
На рисунке 3.3 приведен график показательной плотности.
Функция распределения показательного закона имеет вид:
' ц<
FT(0 = j\ie^ds = $e2dz = 1 - е-»1',
о о
В теории массового обслуживания часто надо знать вероятность
того, что обслуживание будет продолжаться более длительное время,
чем t.
Р{Х >t}=P{T>t} = \-P{x<t} = \- Fz(t) = е Л
Рис. 3.3. График функции плотности распределения
вероятностей показательной случайной величины
64
Найдем теперь математическое ожидание и выясним
содержательный смысл параметра [i.
Среднее время обслуживания одной заявки
Мх- \t\ie ^'dt^ — ize zdz- — -ze z + fe zdz
4 »l h lo j
о
V о J
(3.3.7)
Таким образом, среднее время обслуживания обратно
пропорционально (I. В свою очередь
ц = ~, (3.3.8)
л/т
т.е. [i — среднее число требований (заявок), обслуженных в единицу
времени, или интенсивность обслуживания.
Дисперсия показательной случайной величины имеет вид:
» 11" 1
Di - Л/т2 - (Л/т)2 = Гt2\ie^'dt - -L = -L f z2e'zdz - -у.
о V V- о И
Поскольку
оо ее
Г ? — - ? - 1°° Г —-
z е ~dz=-z е " +2 ze ~dz = 2,
J in J
о о
то получаем окончательно
£>т=1/ц2. (3.3.9)
Закон распределения Лапласа
Распределение Лапласа задается двусторонней показательной
плотностью (соответствующим образом нормированной):
f(x) = —e~^x, -оо<Х<°о.
• 2
Таким образом, плотность симметрична относительно нуля
и в этой точке достигает максимума.
График функции плотности распределения Лапласа приведен
на рис. 3.4.
Дисперсия в 2 раза больше дисперсии показательной случайной
величины
DX = МХ2=± 1 xV^W = JxV^x = 4-.
2 L l н2
65
./;<*) а
Рис. 3.4. График функции плотности
распределения вероятностей по за кону Лапласа
Среднее квадратическое отклонение
Поскольку дисперсия имеет квадратные единицы измерения,
то для перехода к линейным единицам извлекают из нее квадратный
корень:
a = y[DX, (3.3.10)
который и называют средним квадратическим или стандартным
отклонением,
Ниже часто будем использовать однобуквенное обозначение
дисперсии, как обычно опуская индекс случайной величины, если речь
идет об одной такой величине:
ol = DX.
(3.3.11)
3.4. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Нормальное распределение (распределение Гаусса) занимает
в теории вероятностей в определенном смысле центральное место,
поскольку, согласно центральной предельной теореме, которая будет
рассмотрена в главе 4, сумма достаточно большого числа
сравнительно малых независимых случайных величин имеет распределение,
близкое к нормальному.
Нормальное распределение имеет следующую плотность:
Ф(*) =
2nd
(3.4.1)
бб
То, что случайная величина X имеет нормальное распределение
с параметрами а, а, записывается так: Х~ N(a, а).
Прежде всего убедимся в том, что это действительно функция
плотности:
. 2 7ДЛ 2 Я.,.
V27tJ0 V27T V2
Здесь была применена замена переменной z - (х - а)/о и
использован интеграл Пуассона
о v ^
На рисунке 3.5 приведено семейство кривых нормальных
плотностей в зависимости от параметров а, а.
^
/Л
J ^>
а<0
<р(х)<
S
'г
^
0
\
-Х^4
«>о
^
X
Рис. З.б. Графики плотности распределения вероятностей
семейства нормвльных случвйных величин
Как видим, с геометрической точки зрения параметр а — точка
максимума плотности, а также центр симметрии. При увеличении а
график смещается вправо, при уменьшении а — влево, При
уменьшении а максимум плотности (р(;с) увеличивается, при этом значения
плотности в точках, достаточно удаленных от а, уменьшаются,
поскольку площадь под кривой плотности для любых значений
параметров равна единице.
Выясним теперь теоретико-вероятностный смысл параметров.
67
Снова делая замену переменной z = (х-a)/G, имеем:
МХ=-
оо if Х-(Л
-7=^- Г дге 2l ° } dx = -r=^ \(х-а + а)е^ ° > dx =
V271G _i V27ia L
x - a
2{~~CS
'2kg
о
х- a
■-\ — \
2l о J
dx+" fe"2l
V2rc i
о
t/л: =
= .— Г ze 2 dz + a = a,
V27i J„
поскольку Г ze 2 t/z =0 как интеграл по всей прямой от нечетной
функции.
Таким образом, параметр а — математическое ожидание.
Найдем теперь дисперсию нормальной случайной величины, снова
применяя замену z = (х - а)1а и интегрируя по частям:
JfT---T
DX = M(X-MX)2 = ]
2ла
l(x-af
dx =
a
V271
-ze
\
+ Г e 2dz
= G
Таким образом, о2 — это дисперсия, а a — среднее
квадратичное отклонение.
Случайная величина называется центрированной, если ее
математическое ожидание равно нулю. Для того чтобы центрировать
случайную величину, надо вычесть из нее математическое ожидание:
М(Х- МХ) = МХ-МХ= 0.
Случайная величина называется нормированной, если ее
дисперсия равна единице. Для того чтобы нормировать случайную
величину, надо ее поделить на среднее квадратичное отклонение:
У a J a о
Центрированная и нормированная случайная величина
называется стандартной. Для того чтобы стандартизировать случайную ве-
68
личину, надо вычесть из нее математическое ожидание и поделить
на среднее квадратичное отклонение. Стандартные случайные
величины обозначаются большой латинской буквой Z:
а
где а = MX, а2 = DX.
Поскольку только что мы доказали, что для нормального
распределения МХ = a, DX= а2, то
Z--— ~JV(0,1),
а
т.е. стандартная нормальная случайная величина имеет плотность
Фг(л-) = -7=е 2.
V2ti
Функция ф(х) — четная, ее значения для х > О приведены в табл.
П. 6.1.
Вероятность попадания на отрезок
Большинство задач с использованием нормального
распределения (как и других законов распределения абсолютно непрерывных
случайных величин) сводится к определению вероятности попадания
на отрезок.
Поскольку интеграл от нормальной плотности не табличный,
то приходится пользоваться таблицами для интегралов от стандартной
нормальной плотности в форме: функции Лапласа:
1 г -5''
ф(х) = -==\е 2dz, (3.4.3)
V27ii
считая эту функцию определенной для любых -оо < х < °°, при этом
Ф(-х) = -Ф(х),
т.е. функция Лапласа нечетна, ее значения длялс > 0 приведены в табл.
П. 6.1. Итак, пусть Х- N(a, а), найдем вероятность попадания на
отрезок [Ь, с]:
„,, т, 1 \b-a Х-а^с-а
Р{Ь<Х<с} = Р< < < —
69
a
При решении конкретных практических задач можно заново
проделывать все выкладки (3.4.4) либо пользоваться окончательным
результатом:
р{ЫХйс} = ф(^)-ф(^\. (3.4.5)
Правило «трех сигм»
Теоретически нормальная плотность вероятности отлична
от нуля в любой, даже очень отдаленной от а точке лг, однако
практически почти вся вероятность сосредоточена на отрезке а ± За (отсюда
и название). В самом деле,
/>{я-Зс<^<аОс}=р|-3<^^-£з| =
= Р{-3 £ Z £ 3} = 2Ф(3) = 0,9973.
Таким образом, вероятность попадания вне этого отрезка равна
всего 0,0027.
3.5. ПРОИЗВОДЯЩАЯ ФУНКЦИЯ И ЧИСЛОВЫЕ
ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
В § 3.2, 3,3 были рассмотрены важнейшие числовые
характеристики случайных величин: математическое ожидание как одна из
числовых характеристик центра группировании и дисперсия как одна
из характеристик вариации значений случайной величины. Однако эти
две характеристики хотя и являются самыми важными, но далеко не
исчерпывают всего набора употребляемых числовых характеристик
случайной величины. В этом параграфе будут последовательно
рассмотрены числовые характеристики случайной величины и
установлена связь некоторых из них с производящей функцией.
70
Начальные моменты
Начальным моментом к-го порядка, который обозначается как
vb называется математическое ожидание k-й степени случайной
величины:
vk = MX\k= 1,2,.... (3.5.1)
Например, первый начальный момент — это обычное
математическое ожидание:
v, = MX.
При небольших допущениях относительно случайной величины
можно доказать, что знание всех ее начальных моментов позволяет
восстановить ее функцию распределения как обобщающую
характеристику случайной величины.
Например, если известны математическое ожидание и
дисперсия нормальной случайной величины:
а = V,,
<32 = v2- v,2,
то известна и ее функция плотности (а следовательно, и функция
распределения), поэтому нормальная случайная величина полностью
определяется первыми двумя начальными моментами.
Центральные моменты
Центральным моментом к-го порядка, который обозначается как
ць называется математическое ожидание к-й степени отклонения
случайной величины от своего математического ожидания:
\ук = М{Х-МХ)к. (3.5.2)
Например, второй центральный момент — это дисперсия:
\12 = M{X-MX)2=DX.
Любой центральный момент можно выразить через начальные.
Например, третий центральный момент
U3 = М(Х- MX)" = М(Х- v,)3 =
= М{ХЪ - 3v,X2 + 3 v2 Х- 3 v3) = v3 - 3v,v2 + 2 v3.
Производящая функция
Производящая функция случайной величины X — это функция
от параметра t (вообще говоря, комплексного), которая равна:
mx(t)=Me,x. (3.5.3)
71
Если / = iu (i = v-1), то производящая функция переходит в
характеристическую, которая широко используется в фундаментальной
теории вероятностей и в теории меры.
Наиболее важным является то, что производящая функция mx{t)
содержит в себе сведения обо всех начальных моментах
(«производит» моменты), а это означает, что по ней можно определить, как
говорилось выше, функцию распределения, содержащую все сведения
о случайной величине. В этом смысле производящая функция и
функция распределения являются эквивалентными обобщающими
характеристиками.
В самом деле (индекс случайной величины опустим),
т'(0)=МХе,х\ = MX = v.
и = о
и вообще для любого к
т{к)(0) = МХке,х\ =МХк =v,,
т.е. к-я производная от производящей функции при / = О равна
начальному моменту к-го порядка.
В качестве примера найдем производящую функцию
нормальной случайной величины A'- N(a, а):
mx(t)=Mc,x =-r=- fe,ve 2[ а } dx =
i +°° Г 1
= .— f ехр -\х2 -2x(a+02t) + a2 + 2a<32t~
-2aa2i + aV - oV Y\dx = -=L- f e 2' a J e"'+~2 dx = e"'+ 2 ,
/J JzuoL
поскольку
, ■+« _J.f-v-«-av
2
л/2ТШ
e K ' dx = 1
как интеграл от плотности нормальной случайной величины
X ~ N(a + a2t, о).
72
Итак, производящая функция нормальной случайной величины
X ~ N(a, а) равна
тЛ0 = е
(3.5.4)
в частности, производящая функция стандартной нормальной
случайной величины Z~ /V(0, 1) равна
mz(t) = e
-„г
(3.5.5)
Найдем с помощью производящей функции отношение \ijcf для
нормальной случайной величины:
*,_М(Х-МХ?=и[Х^а] = ш,
rjieMZ4 — четвертый начальный момент стандартной нормальной
величины.
Для того чтобы найти четвертый начальный момент
стандартной нормальной случайной величины, надо найти четвертую произ-
1 ,
водную ее производящей функции е2 при t = 0:
1 ,
г
= te2
е2
V )
МЛ 1 >
г
v j
( 'Л"'
е2
V J
f i Л/к
- г
е2
V У
-pZ
= ez + ге
2в2
= 3/е2 + /Зе2
^Зе2 + 6/2с2 + /V
-3,
поэтому для любой нормальной случайной величины
Г-4 _ т
а4
(3.5.6)
73
Свойства производящей функции
1. Производящая функция случайной величины, умноженной
на константу, равна первоначальной производящей функции с
аргументом О
тМ = Ш'1'х=тАО). (3.5.7)
2. Производящая функция суммы независимых случайных
величин равна произведению производящих функций этих величин.
Пусть
*=2Х
/=|
тогда
т-(/)=Л/еЬч J = M
\1ш\ ) /=1
(3.5.8)
У = 1
Медиана
В качестве показателя центра группирования наряду с
математическим ожиданием используется медиана. Для абсолютно
непрерывных случайных величии медиана — >то граница, левее и правее
которой находятся значения случайной величины с вероятностями,
равными 0,5. Медиана случайной величины X обозначается МеЛ*. Для
нормального распределения МеХ = МХ = а.
Для дискретных случайных величин медиана находится на
отрезке [х,, *,+ ,], который определяется из условий:
п / + 1
5>,<0,5; 5>/>°Д
Точное положение медианы устанавливается следующим
образом:
где а, = —
МеХ-= а,х, + (1 - а,)*,,,,
S"'"2
или
ЫеХ = х,+
l/ + i Л1
(
Pi + \
74
Мода
Для абсолютно непрерывных распределений модой называется
точка локального максимума функции плотности. Мода случайной
величины X обозначается МоА^ Для нормального распределения
Ь/[оХ= MX = а. Распределения, имеющие одну моду, называются од-
номодальными Встречаются и многомодальные распределения (смеси
одномодальных распределений).
Квартили
Для абсолютно непрерывных случайных величин квартили —
это такие границы, которые делят всю вероятность на четыре равные
части. Квартилей три: Q\ — левая, Qi — центральная, равная медиане,
Qy — правая. На рисунке 3.6 показаны квартили равномерного
распределения.
Квартили могут быть определены и для дискретных случайных
величин подобно медиане.
/'(X) i
1//
\
0,25
0,25
0,25
0,25
-! ►
0 * О, Оа Оэ / х
Рио. 3.6. Квартили равномерной случайной величины
Разность правой и левой квартилей Q} - Q{ может быть
использована как показатель вариации.
Иногда используются децили, разделяющие всю вероятность
на десять равных частей.
Коэффициент асимметрии
Коэффициент асимметрии характеризует скошенность
распределения по отношению к математическому ожиданию:
а
(3.5.9)
75
Для симметричных распределений (13 - 0, поэтому коэффициент
асимметрии равен нулю. Для распределения скошенных влево [3 < О
(большие отрицательные отклонения определяют знак J3), для
скошенных вправо р > 0. Например, показательное распределение скошено
вправо.
Коэффициент эксцесса
Коэффициент эксцесса характеризует островершинность
распределения по отношению к нормальному:
у = Ь-3. ' (3.5.10)
а
Выше было показано, что для нормального распределения щ/о^
= 3. Для более островершинных распределений у> 0, для менее
островершинных у < 0. Например, для равномерного распределения у < 0,
в то время как для распределения Лапласа у > 0.
Критические границы
Понятие критических границ (процентных точек) для абсолютно
непрерывных случайных величин широко используется в
математической статистике при построении доверительных интервалов и
критериев проверки гипотез.
Различают левосторонние, правосторонние и двусторонние
критические границы.
Левосторонней критической границей, или квантилью,
отвечающей вероятности а, называется такая граница, левее которой
вероятность равна а (см. рис. 3.7). Квантиль обозначается Ка, по определению
a = P{X<Ka}=F(Ka), (3.5.11)
т.е. квантиль является решением уравнения
F{Ka) = a.
Правосторонней критической границей, отвечающей
вероятности а, называется такая граница, правее которой вероятность равна а.
Правосторонняя граница обозначается Ва, по определению
a = P{X>Ba} = \-F(Ba),
т.е. правосторонняя граница является решением уравнения
F(Ba)=\-a. (3.5.12)
76
Между левосторонней и правосторонней границами существует
следующее соотношение:
К« = Д,-«. (3.5.13)
На рисунке 3.7 показаны левосторонняя и правосторонняя
границы.
/(Х)т
Рис. 3.7. Критические границы случайной величины
Двусторонними критическими границами, отвечающими
вероятности а, называются такие границы Ва>Ва, внутрь которых
случайная величина попадает с вероятностью 1 - ос, а вне — с
вероятностью а, причем Р{Х <Ва} = Р{Х>Ва} = а/2.
Таким образом, двусторонние границы являются решением
уравнений (см. рис. 3.7):
F(Ba)=Z F(Ba) = \-^. (3.5.14)
Между односторонними и двусторонними границами
существуют следующие соотношения:
§-а ~Kall = 5]-а/2> Sa ~ К\ -а/2 = Ва12- (3.5.15)
Для стандартного нормального распределения двусторонние
границы симметричны и имеют специальные обозначения ±иа, т.е.
причем иа является решением уравнения
Ф(ма) = (1-сс)/2. (3.5.16)
77
3.6. МНОГОМЕРНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Многомерная случайная величина X= (Xh ..., Хп) — это
совокупность случайных величин Xh заданных на одном и том же
пространстве элементарных событий ft.
Закон распределения вероятностей многомерной случайной
величины X задается ее функцией распределения
Fx{x{,...,xn) = P{X><x ,Хп<х„), (3.6.1)
которая является числовой функцией многих переменных и как
вероятность принимает значения на отрезке [0,1].
Функция распределения многомерной случайной величины X
обладает следующими свойствами:
1) не убывает по каждому аргументу;
2) непрерывна слева по каждому аргументу;
3) Fx у (*,,...,.*„_„-«О = 0;
4) Fx *,(*».»., *„-„ + ") = /\* x,J*\* — x*-\)-
Следует заметить, что путем перенумерации любой аргумент
можно сделать последним, поэтому в третьем и четвертом свойствах
на самом деле речь идет о любом аргументе.
Доказательство первого и второго свойств аналогично
доказательству второго и третьего свойств соответственно для одномерной
случайной величины (см. с. 48—50).
Докажем третье свойство:
Fx х(Х\>-"<хп-\>-°*) = р{х\<х\*---*Хп-\<хп-\*хп<-~} =
Л>-| ^
= Р
Г|4П0 =я(0) = о,
где А,- {о: X,{ia) < х,), i = I и- 1,
/4„= {со:Л'„(а))<^»}=0.
Докажем четвертое свойство:
Fx Xn(xl,...,xn_i, + °°)=P{Xi<x{,...,Xn_]<xl,_l,X„ <+*>} =
<х
.-}-
ы\
/-I
~ МГ, А^С*!»—'*м-l)»
где Af= {ш: Xji(o)<x,)J= \ и-1,
78
А'),...,^) -
Распределение вероятностей многомерных дискретных
случайных величин удобнее задавать в форме рядов распределения
/[ = 1,...,«,; ...; jn = 1,...,кп,
к, — число значений i-й случайной величины,
к к
±...±Р{Х1=х].,....Х„=х1(11} = \.
(3.6.2)
где
А = 1 L = 1
Распределения вероятностей многомерных абсолютно
непрерывных случайных величин удобнее задавать в форме функций
плотности распределения вероятностей fxх (zit...,zn), которые
следующим образом связаны с функцией распределения;
Fx xSx\*"4xn)= } •'} fx{ ^(z,,...,^)^,,...,^,,,
для таких величин четвертое свойство принимает форму
jfx v.Ui 0< = /v, х„ ,Ui *i.-|)-
(3.6.3)
(3.6.4)
Для многомерной случайной величины подобно одномерной
могут быть определены начальные и центральные смешанные
моменты, поскольку в их образовании участвуют, вообще говоря, несколько
случайных величин из совокупности. Ниже будут рассмотрены только
смешанные центральные моменты второго порядка — коэффициенты
ковариации, которые в нормированном виде используются как меры
связи случайных величин.
Случайные величины Хи ..., Х„ называются независимыми в
совокупности, если
Fx, xSxv-*x„) = Fx^-FxS*,,)- (3-6-5)
В частности, две случайные величины независимы, если
FX^xSXrX2) = FxS^)FX2(X2y (3-6-6)
Для дискретных и абсолютно непрерывных случайных величин
это определение приобретает специфическую форму.
79
Независимость дискретных случайных величин
Пусть две дискретные случайные величины X, У заданы своими
рядами распределения
Х =
'*.
,Р\
хк
Рк;
, Y =
'Ух
<Ч\
у Л
Чт;
а двумерная величина (X, Y) — рядом
Pii
, p.. = p{x=xi,Y=yJ}, / = !,..., А, У = 1,-
т.
Используем обозначения, применявшиеся в § 3.2:
А, = {со: Дсо) = х,}, / = 1,..., к,
Bj= {со: К(со) =>>,-},./= 1,...,т.
Поскольку эти множества могут быть также представлены
в форме
Af= {со:х,<Дсо)<хт}, /=1,...Д, хЛ + |=со
Я,- {со:^<У(со)<^/ + 1}, у=1,...,т, #+1 = °°,
то
PiA^Fjcixnu-Fxix,),
P(Bj) = FY(yjn)-FY{yj).
Согласно рис. 3.8, имеем на плоскости значений случайной
величины (X, У):
{х,<Х<х1 + 1, yi<Y<yi + ]} = {X<xi^,Y<yJ + [}\
\{X<xi,Y<yj}\{xi<X<xi + lJ<yJ}\ (3.6.7)
\{X<xityj<Y<yj + l}t
т.е. множество точек незаштрихованного полузамкнутого
прямоугольника получается путем теоретико-множественного вычитания
из незамкнутого квадранта с вершиной в точке (хн.,,^ , ,) трех
непересекающихся заштрихованных фигур.
Поэтому по аксиоме сложения из формулы (3.6.7) вытекает:
Р{со: х, < Дсо) <х,^у, < Дсо) <yj +,} =
= Fx,y(xi + ],yJ+l)-Fx,y(xhyJ)-P{(0:xi<X((£>)<xi+bY((u)<yj}-
-Р{со:Дсо)<х/,^<Г(со)<уу+1}.
80
Рис. 3.8. Области значений дискретных случайных величин X, Y
Поскольку (см. рис. 3.8)
P{0):xl<X((i>)<xi + ],Y((£>)<yJ}=Fx,Y(xi,byj)-Fx<Y(xhyJ),
P{(x>:X((x))<xhyj< Y((D)<yJ,l) =FXtY(x„yJ+i)-FXiY(xhyj)t
то получаем окончательно :
/>{ш: х,£Х«о)<х, iuyj£ К(ш) <у,, i} =
■Fx,Y(xhyj.]) + Fx<Y(xhyj).
(3.6.8)
Используя формулу (3.6.8) и независимость случайных величин
(X, У), имеем:
P(AinBi) = P{(D:xi<Xm<xiU,yi<Y(bi)<y. + i} =
= FXtY(xl+],y, + l)- Fx у(х{ +,,yf) - Fx у(xn уИ]) + Fx, Y(x(,yt) =
= Fx(Xn ,) Fr(y,-,,) - F,(x,+,) Fy{y,) -F^xd FY(yl+,) + Fx(x,) FY(yj) =
= [Fx(Xi M) - Fx(Xi)][FY(yj и) - Fr(yJ)] = Р1А,)Щ),
т.е. события А/ и Bj независимы для любых / = 1, ..., k,j= 1, ..., т.
Таким образом, для дискретных случайных величин X, Y
независимость означает независимость событий, состоящих в том, что
каждая из двух случайных величин приняла одно из своих значений.
81
Независимость абсолютно непрерывных случайных величин
Пусть теперь X, Y — абсолютно непрерывные случайные
величины, поэтому
•v ,1'
Fx(x) = $ fx(z)dz, FY(y)= J fY(u)du,
x у
Fx. y (*• У) = j j fx. y (*. u)dzdu,
где fxix),/•№)■> fx. >(Х>У) ~~ функции плотности вероятности соответственно для
одномерных и двумерной случайных величин.
Для абсолютно непрерывных случайных величин тождество
(3.6.8) при X/ = х, у j =у,хГц =х + Ах, у,■ н = у + Ау примет вид:
дг+Дл: у+(ьу
j ) fx,y(z' u)dzdu = Fx>Y(x + Ах,у + Ау)-
х У
- Fx Y (x + Ax, у) - Fx Y (x, у + Ay) + Fx Y (x, y).
Используем теперь независимость и представление функций
распределения для одномерных случайных величин:
.г + Д-v ,г + Дг
j j fx,y(z' u)dzdu - Fx (дг + Ax) Fx (y + Ay) -
-Fx\x + Ax)Fy(y)-Fx(x)Fy(y + Ay)+Fx(x)FY(y) =
= [Fx(x + Ax)- Fx(x)][FY(y + Ay)- FY(y)] =
.v+Дл' )'+Д)'
= j fx(z)dz j fY(u)du.
таким образом,
x + Ax у + Дг а+Д-V .i'+Av
| | fx Y{z,u)dzdu = | fx{z)dz j fr(u)du.
x у x у
Разделив теперь левую и правую части последнего равенства
на АхАу и перейдя к пределу при Ах —> 0, Ау —> О, получаем
/\Ах>у)=Мх)/у(уУ
Таким образом, для абсолютно непрерывных случайных
величин независимость означает, что совместная двумерная плотность
вероятности равна произведению одномерных плотностей.
82
Коэффициент корреляции как мера связи случайных величин
Выше были рассмслрены различные формы независимости
величин. А как измерять меру зависимости случайных величин? В § 3.2 при
выводе формулы дисперсии суммы X + Y двух зависимых случайных
величин был введен коэффициент ковариации (совместной вариации):
covOT, Y) = М(Х- MX)(Y- MY) = MXY- MX • MY, (3.6.9)
причем
cov(JT, X) = M(X - MX)2 = DX.
Этот коэффициент в известной мере является измерителем связи
случайных величин, поскольку обладает следующими свойствами:
1) для независимых случайных величин равен нулю, поскольку
для таких величин М(Х-МХ)( К- MY) = М{Х-МХ) M(Y-MY) = 0\
2) для случайных величин X, Y, имеющих тенденцию
колебаться в одну сторону [т.е. с большей вероятностью sign (X - MX) =
=* sign (У- MY)], положителен;
3) для случайных величин X, Y, имеющих тенденцию
колебаться в разные стороны [т.е. с большей вероятностью sign (X - MX) «
» -sign (Y-MY)]S отрицателен.
Следует заметить, что по каждому аргументу коэффициент
ковариации удовлетворяет второму и третьему свойствам
математического ожидания (см. с. 52,53), т.е.
cov(Of, Y) = Ссо\(Х, У), cov(A', CY) = Ссо\{Х, У); (3.6.10)
( п \ м
COV
%ХпУ =2>v(A-„K),
/-I
COV
*'SK/ =Scov(A',K/).
Предлагаем доказать это читателю.
Однако этот коэффициент может принимать значения на всей
числовой прямой, поэтому не вполне пригоден для измерения степени
зависимости. В этом смысле более пригоден нормированный
коэффициент ковариации, или коэффициент корреляции,
'р(*,Г)=™<М>. C3I6.11>
схсу
Далее аргументы X, Y будем опускать, если речь идет об одних
и тех же случайных величинах.
63
Коэффициент корреляции меняется от -1 до +1. В самом деле,
рассмотрим случайную величину (Х + tY)1, где X, Y— уже центрированы,
т.е. МХ= О, MY = 0. Эта случайная величина неотрицательна, поэтому
и ее математическое ожидание неотрицательно:
М(Х+ tYf = MX2 + 2tMXY+ t2MY2 > 0.
Для неотрицательности получившегося трехчлена относительно /
необходимо, чтобы его дискриминант был неположителен:
4(MXY)2 - 4MX2MY2 < 0,
т.е.
\MXY\
\Imx4my2
но поскольку для центрированных случайных величин MXY =
= cov(X, У), MX1 = DX, MY2 = DY, то последнее неравенство принимает
вид:
|cov(X, Y)\
axaY
т.е. | p | < 1, или -1 < p < 1.
Для независимых случайных величин р = 0, поскольку для них
covpf, Y) = 0.
Для линейно связанных случайных величин | р | = 1. В самом деле,
пусть
Y=aX+$, а*0,
тогда
cov(^", У) = cov(X, аХ+ р) = acov(X, X) + pcov(X, 1) = aDX,
DY=a2DX,
поэтому
co\(X,Y) aDX a
yjDXy/DY \a\DX \a\
Таким образом,
fl, a>0,
H, a<0.
Итак, для независимых случайных величин р = 0, для линейно
связанных | р | = 1, а в остальных случаях -1 < р < 1, р Ф 0. Чем ближе
84
I р I к единице, тем с большим основанием можно считать, что X и Y
находятся в линейной зависимости.
Если р = 0, то это не всегда означает независимость случайных
величин. В этом случае говорят, что случайные величины
некоррелированны. Из независимости вытекает некоррелированность, но
наоборот — не всегда. Ниже будет показано, что для нормальных
случайных величин свойства независимости и некоррелированности
эквивалентны.
Двумерная нормальная случайная величина
Двумерная нормальная случайная величина задается следующей
функцией плотности:
J КХ] 5 Х7 ) ~
ехр-
1
\-р2а]а2 2(1 -р2)
х, -я,
У
'I J
-2р
х, -а, х, - а-,
х, — а-,
(3.6.12)
С геометрической точки зрения график функции плотности
представляет собой «гору» с достаточно крутыми склонами,
вершина которой находится в точке (а,, а2). Линиями уровня служат
эллипсы
х, -а,
V
-2р
х. — а, х, - а:
х-, - а-
12 ^1
а2 j
= С = const,
'I J wl "2
которые в случае р = 0 переходят в окружности.
Выясним теперь теоретико-вероятностный смысл параметров.
Прежде всего надо убедиться, что функция (3.6.12) —
действительно плотность, т.е. надо установить, что
J j f(xvx2)dxidx2 =1.
(3.6.13)
Вначале найдем внутренний интеграл, сделав замену z, = —
х. - а.
i = 1, 2, и выделив полный квадрат в показателе экспоненты:
1 7 I z, - 2pz,z2 + z
L 27rVl-p2a,a2i [ 2(1-P) J
kj,<fe, =
85
V2tco2 V2tco2
Это действительно так, поскольку
— f„pl-lfLl£bf.l*,-i
2«(1-р>)1 И 2(l-p=) J
как интеграл от одномерной нормальной плотности.
Поскольку, согласно формуле (3.6.4), интеграл по одной
переменной от двумерной плотности является одномерной плотностью
по другой переменной, то только что было доказано, что одномерная
случайная величина^ - N(a2, а2), т. е.
МХг = аь DX2=a2v
Ш>я„ DX, *о?,
поэтому и
т.е. а,, аг — математические ожидания случайных величин, a of, о\ —
дисперсии. Кроме того, интегрируя по второй переменной полученную
нормальную плотность, получаем единицу, т.е. равенство (3,6.13)
действительно верно.
Осталось только выяснить смысл параметра р. Центрируем
и нормируем случайные величины Х1чХ2\
7 =Х\~а\ 7 =Х2'а*
'с, а2
тогда функция плотности для этих величин примет вид:
г ( \ 1 А - 2Р2122 +;
2ttV1-P2 2(1_Р )
86
поэтому (снова выделяем полный квадрат в показателе экспоненты)
p(A'l,A'2) = p(Zl,Z2) = MZlZ2 =
_ 1 7 7,, pv„J z\ " 2pziz2 + 222
/ , J J г1г2еХР1
2nyj\-p2 LL
I 2('-p2) J
*dz]dz2 =
1
2tcV^"
j z2e 2 J(z, -pz2 + pz2)exp
z, - pz2
I 2('-p2)J
dz.
dz2 -
2л
z, e
2тсл/1-
-J
27Г
z, e
1
-/=7,f(*i-P*2)exP<
Vi-p2-
Jexp
(zi"P22)3
4гк^
2(l-pJ)
(Zi-Pz:)
•</(rt-pz2)
rfz2 +
I 2(1-P2) J
►d(z,-pz2)
<fe2 = p.
В последнем равенстве были использованы значения
следующих уже ранее вычислявшихся интегралов:
= f и с 2''"р ' du = О, и = z, - pz2 — математическое
2пу[\^р
ожидание центрированной нормальной случайной величины;
2л
7^7
J
^O-VL..-
Этт J
2тс
:,2 е" 2 dz, = 1
du = \, u = zi- pz2 —г интеграл от плотности;
дисперсия стандартной нормальной
величины.
Итак, параметр р — это коэффициент корреляции случайных
величин ХьХг.
Если две нормальные величины некоррелированны, т.е. р = О,
то, согласно формуле (3.6.12), их совместная плотность
.IX.,X, (•*■)> Х2/ ~
1 е 2[ °'
1
2яа(а2
1 [ х2 - аг
А о,
X: - а, \ .г, - д
\/2ла,
yflKO,
=/хМ\)/хЛхг)*
87
т.е. является произведением плотностей одномерных случайных
величин Х\,Х2, а это означает, по определению, что они независимы. Таким
образом, для нормальных случайных величин из некоррелированности
следует независимость.
Многомерное нормальное распределение
Многомерная нормальная случайная величина (Хь ..., Хт)
задается следующей функцией плотности:
1
/{Х ,Xj = (2*r/2J*
е 2
(3.6.14)
где
х — вектор-столбец переменных;
я — вектор-столбец математических ожиданий случайных величин;
В = cov(Хп Xt и — ковариационная матрица случайных величин Xt,..., Хт;
| В | —определитель матрицы В.
В частности, при т = 2
В =
( т2
а.
а,а2р
.2
^,02Р °2 J
|i?| = ofoi-o?^p2=ofo22(l-p2.),
/1 n "\
5"' =
a2(l-p2) a,a2(l-p2)
P 1
a,a2(l-p2) o2(l-p2)
(x-a)V'(x-a) =
4 ")
x, - a, I „ x, - a, x, - a,
~ 2p ' _ ' • 2 _ 2 +
X, — a0
'2 J
поэтому приходим к изученной выше плотности для двумерной
нормальной случайной величины [см. формулу (3.6.12)].
Как видно из формулы (3.6.14), математические ожидания и
ковариационная матрица случайных величин Хи ..., Хт полностью
определяют совместную функцию плотности.
88
3.7. ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН
Рассмотрим наиболее употребительные (в том числе в
математической статистике) функции от случайных величин.
Композиция распределений
Композицией распределений называется алгоритм (формула),
по которому можно получить закон распределения суммы случайных
величин на основе совместного закона распределения случайных
величин.
Следует заметить, что вид закона распределения суммы не
совпадает, вообще говоря, с законами распределения слагаемых (даже
если они одинаково распределены). Например, сумма двух одинаково
распределенных независимых альтернативных случайных величин
есть биномиальная случайная величина (но не альтернативная!).
Найдем закон распределения для суммы X = Х{ + Х2 двух
абсолютно непрерывных случайных величин с совместной функцией
плотности /(х,, х2).
Сделав замену z = х^ + х2, х2 = z -хи имеем:
Fx (х) = Р{Х{ + Х2 < х} = П / (х,, х2 )dxxdx2 =
Л, + V, <л
X ( ~ \
= J \ f{X^Z-X\)dx\ d2'
поэтому
fx(x) = Fi(x)= ] /{х^х-х^ (3.7.1)
и есть плотность композиции распределений.
КОМПОЗИЦИЯ РАВНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ
Пусть имеется две независимые равномерные случайные
величины Хь Х2 с параметрами /,, 12 (например, время ожидания двух видов
транспорта), требуется найти закон распределения общего времени
ожидания.
Совместная плотность распределения имеет вид:
,., v JtT'*'6!0'7']' ^,б[0,/,],х2е[0,/2],
О в противном случае.
89
Тогда, согласно формуле (3.7.1), плотность суммы равна (пусть
/,</2):
fx(x)= \ f(xl,x-xl)dxl =
, 0 < д: < /,,
//
-Ц l<x<L
И
'i + h ~ х ; ^ ^ / ;
V2
причем на каждом из трех участков область интегрирования по х}
константы 1/(/|/2) определяется из двух условий:
О < х] < /,,
О < х - л:, < /2,
или
0<х, </,,
л: - /2 < Xj < х.
На рисунке 3.9 изображен график получившейся
трапециевидной плотности (закон распределения Симпсона).
/, + /,
Рис. 3.9. График функции плотности распределения
вероятностей закона Симспона
При /, = /2 = /, получаем треугольную плотность (рис. 3.10).
90
/(х)А
yi
21
Рис. 3.10. График функции плотности распределения
вероятностей треугольной случайной величины
КОМПОЗИЦИЯ НОРМАЛЬНЫХ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ
Совместное распределение двух нормальных случайных
величин Х\% Х2 задается функцией плотности (3.6.12), Математическое
ожидание и дисперсию суммы X - Х\ + Х2 можно найти сразу, не
дожидаясь установления закона распределения:
а = МХ= MXS + МХ2 « а, + а2ч
о2 = DX= ZXY, + DX2 + 2cov(^, X2) = of + с] + 2ра,а2.
Применим формулу композиции (3.7.1), используя формулу
двумерной нормальной плотности (3.6.12):
fx{x)=[f(xltx-x})dx}= 7==
L 27CV1-P
хл -ал х-у-си
-2р
Сделаем теперь замену переменных
w = jc, -в|, v-х-a, v-u = x-x{ -аъ
тогда числитель показателя экспоненты (без знака «минус») запишется
в следующей форме (помним, что с2 -а2 + 2ра,а2 + о]):
и _ и v
— -2р
а: а а
-и (v-mV
]
«1
2 2
U О
-2wv(pc,o2+o2) + v2C2 ] =
91
<t°l
f
UG -
vc[(po1+o])\ v2a, (pa2+a,)^ 2
+ v a
a*
«?°S
UG~
val(pa2+a])
->2
Ы'-Р2)-
Подставляем полученное выражение в показатель степени
экспоненты:
-|2 "
/*(*) =
1
2la
27cyl - p2a,a.
Jexp
UG. , v
wa L(Pa2 + <Ji)
a
2(l-p2)afa2
>du.
Сделав новую замену переменной
1
t =
GlG1yj\-\
UG. / x
UG -{PG2 +0, )
a
, t/w =
O^/w
получаем окончательно
AW-
l
2Ы
л/2Ло л/2тг
где я = a, + я2, a2 = 07 + 2pa,a2 + о],
ji'2dt =
л/2тш
a,a2N/l
e 2l a
т.е. композиция нормальных законов распределения снова приводит
к нормальному закону распределения с математическим ожиданием,
равным сумме математических ожиданий, и дисперсией, найденной
по формуле дисперсии суммы.
Ниже приводятся используемые в математической статистике
распределения функций от нормальных случайных величин.
Распределение х*
Распределением х1 с п степенями свободы называется
распределение суммы квадратов п независимых стандартных нормальных
величин:
Х2(и) = 2Х, Z,~/V(0,1).
(3.7.21)
92
На рисунке 3.11 показано семейство функций плотностей
вероятности случайных величин £(п) при разных степенях свободы.
Рис. 3.11. Графики функций плотности распределений
вероятностей по закону х2
Плотности распределения х имеют вид:
1 ^-) '
f{x) = \T!2T{n
о,
х2 е 2, х>0,
х<0,
где Г(р)=\с "V'rfz.
При построении доверительных интервалов и проверке гипотез
используются двусторонние критические границы распределения у?.
Поскольку двусторонние границы можно определить по
односторонним (см. § 3.5), то в табл. П. 6.3 приводятся только
правосторонние критические границы (для каждого значения степеней
свободы).
Распределение Стьюдента
Закону распределения Стьюдента с п степенями свободы
удовлетворяет отношение
Z
<(«) =
>/х2(л)/я
где
стандартная нормальная величина, независимая от %■
93
Функция плотности распределения Стьюдента имеет вид:
я + П ,, + |
J XT
/(*) =
rf!№^
(3.7.4)
При n —» «J эта плотность, как видно из формулы (3.7.4),
сходится к плотности стандартной нормальной случайной величины.
Рис. 3.12. Графики функций плотности распределения вероятностей
по законам Стьюдента (1) и стандартному нормальному (2)
На рисунке 3.12 приведены кривые плотности распределения
Стьюдента (кривая 1) и стандартного нормального распределения
(кривая 2), а также показаны двусторонние критические границы этих
распределений.
Как видим, двусторонние критические границы распределения
Стьюдента ±/и шире соответствующих двусторонних критических
границ стандартного нормального распределения (ta > w«). В таблице
П. 6.2 приведены правые двусторонние границы (а(п) для разных
значений степеней свободы..
Распределение Фишера
Распределением Фишера с т, п степенями свободы называется
распределение F-отношения
^ ' Х2(п)/п
04
Как видим, F-отношение — неотрицательная случайная
величина. В таблице П. 6.4 приводятся правосторонние критические границы
Fa этого распределения для разных значений степеней свободы:
P(F > Fa) = a.
ВОПРОСЫ И ЗАДАЧИ
1. Магазин имеет два входа, потоки покупателей на этих входах
независимы и распределены по закону Пуассона. Через вход А проходит
в среднем 1,5 чел./мин, а через вход В — 0,5 чел./мин. Определить
вероятность того, что в наугад взятую минуту хотя бы один человек
посетит магазин.
2. Троллейбус имеет интервал движения 8 мин, поезд метро — 2 мин.
Определить закон распределения суммарного времени ожидания
транспорта наугад взятым пассажиром, пользующимся троллейбусом
и метро (без пересадок),
3. Время между прибытием двух машин к светофору распределено
экспоненциально со средним 0,25 мин. Определить вероятность того, что
время между прибытием двух машин составит от 0,2 до 0,3 мин.
4. Время изготовления детали — равномерно распределенная случайная
величина на отрезке [4, 8] мин. Изготовлено пять деталей. Какова
вероятность, что время изготовления четырех деталей отклоняется
от среднего не более чем на 0,5 мин.
5. Пусть число ошибок при вводе студентом в компьютер символьной
и цифровой информации имеет следующие ряды распределения:
0
0,1
Символьная
1 2
0,1 0,7
3
0,1
0
0,2
Цифровая
1 2
0,6 0,1
3
0,1
Известно, что студент допустил три ошибки. Какова вероятность того,
что цифровых ошибок больше, чем символьных?
6. Манометр показывает давление в колонне. Давление колеблется от
10,0 до 10,2 атм., и в этих пределах любое давление равновозможно.
Вследствие повреждения манометра его стрелка не отклоняется
больше чем на 10,16 атм. Какое давление в среднем показывает манометр?
7. Детали А{ и А2 можно изготовлять параллельно. Сборку узла Аг можно
начинать только при наличии деталей А,, А2. Пусть время (в минутах)
выполнения каждой операции задается следующими рядами
распределения:
2 3 41 т42 3 41 т~(2 3 41
0,1 0,8 0,1/ 2 10,4 0,4 0,2/ 3 10,2 0,3 0,5/
95
Какова вероятность того, что от начала обработки деталей А}А2
до завершения сборки узла Аъ пройдет более 6 мин?
8. Определить вероятность того, что средняя масса пяти наудачу взятых
пакетов с расфасованным товаром будет отклоняться от нормы не
более чем на 2 г, если средняя масса одного пакета — 1 кг, а стандартное
отклонение— 1,5 г (распределение массы пакетов нормально).
9. Автомат заполняет банки кофе. Масса кофе и масса банки имеют
нормальное распределение со средними соответственно 500 г, 50 г и
стандартными отклонениями 10 г, 2 г. Какова вероятность того, что вес
готовой к продаже банки будет менее 540 г?
10. Найти коэффициент асимметрии показательного распределения.
11. Найти коэффициент эксцесса равномерного распределения.
12. Найти квартили показательного распределения.
13. Независимые случайные величины X и К имеют ряды распределения
*-("' ° 'Ы~2 21-
1,0,1 0,1 0,8j 1,0,3 0,7j
Найти ряд распределения случайной величины Z - XY.
14. На железнодорожную станцию поступило 8 вагонов угля. Проверка
показала, что в трех вагонах зольность угля составляет 11 %, в
четырех— 13%, в одном — 15%. Два из прибывших вагонов поступило
на завод. Определить ряд распределения средней зольности угля,
поступившего на завод.
15. Инвестор может формировать портфель из различных видов ценных
бумаг, нормы прибыли по которым являются случайными величинами
Ху, ..., Х„, MX, = а„ DX, = а,2, cov(^0, Xt) = 0, / Ф). Определить доли вло-
жения капитала 0(, 0 < 0. < 1, 2^0.-1 в различные ценные бумаги,
(-1
обеспечивающие среднюю норму а - 10 и минимизирующие диспер-
п
сию нормы прибыли портфеля X - /^0,^, на основе следующих дан-
ных:
х 12 3 4 5 6
</,.(%) 11 10 9 8 7 6
(*,.(%) 4 3 1 0,8 0,7 0,7
1 " 2
16. Доказать, что случайная величина —уУ\(-^1 — ci) имеет распределение
%~{п), если Х„ ..., Хп — независимые случайные величины, Xt — N(a, с).
96
шшшшштяштятвшшяшяяяшяшааатяшшя^ш—аштшттщттштт
ГЛАВА4
ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
В этой главе представлены основные сведения о законах
больших чисел и центральной предельной теореме. Законы больших чисел
утверждают, что среднее арифметическое большого числа
независимых случайных величин ведет себя как среднее арифметическое их
математических ожиданий.
Согласно центральной предельной теореме сумма достаточно
большого числа сравнительно малых случайных величин ведет себя
приближенно как нормальная случайная величина.
Эти утверждения имеют большое практическое значение,
поскольку составляют теоретическую основу математической
статистики, широко применяющейся для анализа экономической информации
с целью выработки обоснованных управляющих решений.
4.1. ЗАКОНЫ БОЛЬШИХ ЧИСЕЛ
Теоретическую основу законов больших чисел составляют
понятие сходимости случайных величин по вероятности и неравенство
Чебышева.
Сходимость по вероятности
Последовательность случайных величин Х{, Хъ ..., Х„ сходится
по вероятности к случайной величине X, если для любого е > О
lim/J(|A'/j-Ar|<e}=l,
ИЛИ
limP{|Ar/r-Ar|>e} = 0. (4.1.1)
Сходимость по вероятности символически записывается так:
Хь => X. В законах больших чисел будет использоваться сходимость
последовательности по вероятности к константе.
Неравенство Чебышева
Если случайная величина X. имеет математическое ожидание
и дисперсию, то для любого £ > О
ПУ
Р{\Х-МХ\>г}<^-. (4.1.2)
97
Докажем это неравенство для абсолютно непрерывной
случайной величины. Для дискретных случайных величин доказательство
проводится аналогично, только интегралы заменяются
соответствующими суммами.
Обозначив MX = а, имеем:
Р{\Х-а\>г} = \f{x)dx. (4.1.3)
\.x-ci\>e
Область интегрирования |x-a|>e можно записать в
эквивалентной форме — > 1, поэтому в этой области
Е
J \f(x)dx < j (*Z°Lf(x)dx , (4.1.4)
|.\--я|>£. |.v-ri|>e
последний интеграл с неотрицательной подынтегральной функцией
может только возрасти, если расширить область интегрирования
до всей прямой:
\ J (x-a)2f(x)dx<\](x-a)2f(x)dx^^f. (4.1.5)
6 |.Y-,/|>E Е — Е
Собирая последовательно равенство (4.1.3) и неравенства
(4.1.4), (4.1.5), получаем неравенство Чебышева.
Неравенство Маркова
Для положительных случайных величин, имеющих
математическое ожидание, справедливо следующее неравенство Маркова (е > 0):
Р{Х>г}<—. (4.1.6)
Докажем его для абсолютно непрерывных случайных величин:
Е £
Р{Х >е} = \f{x)dx < j-f(x)dx < ~jxf(x)dx =
о
Это неравенство в первоначальной форме [см. формулу (4.1.6)]
или в форме
е
может быть применено для оценки снизу вероятностей попадания на
полупрямую положительных случайных величин с неизвестным законом
распределения.
98
Теорема Чебышева
Если независимые случайные величины Хь Х2, ..., Х„ имеют
математические ожидания МХГ — а; и ограниченные в совокупности
дисперсии DXj = а, < о , то разность средних арифметических
случайных величин и средних арифметических их математических
ожиданий сходится по вероятности к нулю:
Хп -ип ~->0.
В самом деле, применим неравенство Чебышева к случайной
величине Хп -а„. Поскольку
M{^n-~an) = M\-fjXi--fjal\ = -fj{MXi-ai)^
- - (\ " ^
D(x„-a„)=DX„ = D ~Y<Xi
1 " 1 " Г72
ТО
f/— - \ 1 DiXn-аЛ а2
Следовательно,
lim/>{(*„-я„)>е} = 0.
Таким образом, действительно X„ - ап => 0.
Следствие из теоремы Чебышева
Если все члены последовательности независимых случайных
величин Х\, ..., Х„, ... имеют одинаковые математические ожидания
MXj = а и одинаковые дисперсии DXj = о2 (например, одинаково
распределены), то среднее арифметическое случайных величин сходится
по вероятности к математическому ожиданию:
X п ~=> а.
Поскольку условия теоремы Чебышева выполнены, то, согласно
последнему положению ее доказательства (в условиях следствия),
lim/>{(*„-а„)>е} = 0.
а это и означает, что Хп => а.
99
Теорема Бернулли
Частость fjJn сходится по вероятности к вероятности:
п
Теорема Бернулли является частным случаем приведенного выше
следствия, поскольку биномиальная случайная величина может быть
представлена как сумма альтернативных случайных величин (см. § 3.2)
Ц = £*,-, MXt = Pl
/ = i
тем самым в этой теореме речь идет о сходимости среднего
арифметического к математическому ожиданию альтернативной случайной
величины, т.е. к вероятности положительного исхода.
Теорема Бернулли имеет исключительно важное теоретическое
и практическое значение. В первой аксиоме теории вероятностей
постулируется, что любое событие А имеет вероятность 0 < р = Р(Л) < 1,
но не говорится, как эту вероятность установить. Теорема Бернулли
дает простой рецепт для этого случая: надо провести эксперимент
из п испытаний, в котором с вероятностью р = Р(А) может появиться
данное событие (успех, положительный исход), потом подсчитать
частость (долю положительных исходов), вот эта частость и будет
«хорошим» приближением к вероятности при больших и, поскольку она
является реализацией случайной величины, которая сходится по
вероятности к Р{А).
Кроме обычных законов больших чисел доказаны также
усиленные законы больших чисел, в которых вместо сходимости по
вероятности используется сходимость с вероятностью 1:
Р{Х„^Х\ = \.
Из сходимости с вероятностью 1 вытекает сходимость по
вероятности, напротив, из сходимости по вероятности, вообще говоря,
не следует сходимость с вероятностью 1.
4.2. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
Во введении к данной главе приведена не совсем строгая, но
содержательная формулировка центральной предельной теоремы. Ниже
дана ее строгая формулировка, в которой ХХч ..., Х„, ... —
последовательность независимых случайных величин, МХ-{ = ah DX{ = <з], удов-
100
летворяющих при любом т > О условию Линдеберга (приведем это
условие для абсолютно непрерывных случайных величин, для
дискретных случайных величин интегралы заменяются на соответствующие
суммы):
' - 1 lv -а !>т/>
lim Ь " - „ = 0, (4.2.1)
с2
В знаменателе выражения (4.2.1) стоит сумма дисперсий
случайных величин X], ..., Х„, а в числителе — сумма «хвостов» этих
дисперсий. Когда это условие выполняется, говорят, что «хвосты»
дисперсий «легкие».
Теорема Ляпунова
Функция распределения центрированной и нормированной сум-
мы Zn =/\{Xj-aj) 12-j^i > независимых случайных величин Хи ...,
Х„, ..., удовлетворяющих условию Линдеберга, сходится к функции
распределения стандартной нормальной случайной величины:
Fn(x)=P(Zn<x)^-^\i2dz. (4.2.2)
На практике эта теорема наиболее часто используется в том
случае, когда члены суммы имеют одинаковое распределение.
Например, в математической статистике выборочные случайные величины
(см. гл. 6) имеют одинаковые распределения, поскольку получены
на основе одной и той же генеральной совокупности.
СЛЕДСТВИЕ ИЗ ТЕОРЕМЫ ЛЯПУНОВА
Если независимые случайные величины Х{ Х„, ... имеют
одинаковое распределение с MX,- = a, DX-, = а2, то функция распределения
их центрированной и нормированной суммы Zn~2_^ {^i~a) \^п)
101
сходится к функции распределения стандартной нормальной
случайной величины:
F„(x)=P{ZH<x)^>-IL] s^dz. (4.2.3)
V27C J„
Для того чтобы доказать это следствие, опираясь на теорему
Ляпунова, надо показать, что в данной ситуации выполнено условие
Линдсберга.
Доказательство проведем снова на примере абсолютно
непрерывных случайных величин. В условиях следствия суммы в числителе
и знаменателе формулы (4.2.1) будут состоять из одинаковых
слагаемых. Причем слагаемое знаменателя — о2, поэтому надо доказать,
что слагаемое числителя стремится к нулю при я—» <»:
$ (x-a)2f(x)dx -»0,
|.v-«|>TOV"
но это в самом деле так, поскольку интеграл в последнем выражении
представляет собой остаток
г
f (x-a)2f(x)dx + $ (x-a)2f(x)dx
-■» (l+TOsfn
сходящегося несобственного интеграла
j (х-a)1 f(x)dx=o2,
Рассмотренное следствие из теоремы Ляпунова имеет те же
условия (одинаковость распределения независимых случайных величин),
что и соответствующее следствие из теоремы Чебышева, поэтому
сравнение поведения соответствующих сумм имеет большое
содержательное значение. Как обычно, будем использовать следующее
обозначение для стандартизованных исходных случайных величин:
Z, = (X, - 0)1(5.
Следствие из теоремы Чебышева имеет вид — /^ А', => а, что эк-
\»Х,-а | »
вивалентно — > —! = —Z-. » =>®-
", = \ <* ", = )
102
В следствии из теоремы Ляпунова используется следующая
сумма:
№^=т-2х- («.4)
Таким образом, в первом случае сумма стандартизованных
слагаемых, деленная на я, сходится по вероятности к нулю (т.е. к
неслучайной величине), во втором случае та же самая сумма, деленная
на л/и , сходится (в смысле сходимости функций распределения!)
к стандартной нормальной величине Z~ /V(0, 1).
Сумма (4.2.4) в следствии из теоремы Ляпунова может быть
представлена в виде
/ = 1 Vw {yjnj п
Таким образом, сумма сравнительно большого числа (п велико)
достаточно малых случайных величин (дисперсии слагаемых
(zA 1
D —f= = — , т.е. малы) распределена приближенно как стандартная
Wiy п
нормальная случайная величина. Этим положением пользуются при
решении практических задач: при сравнительно большом п
распределение соответствующей суммы заменяют на распределение
стандартной нормальной случайной величины.
Пример 4.1. Определить вероятность того, что средняя
продолжительность 100 производственных операций окажется в пределах от 46
до 49 с, если математическое ожидание одной операции равно 47,4 с,
а среднее квадратическое отклонение — 4,9 с.
В этой задаче X — продолжительность наугад взятой проиэводст-
венной операции, а = MX = 47,4 с, a = >JDX = 4,9 с, X = - V X , п =
= 100, — средняя продолжительность 100 наугад взятых
производственных операций, причем MX = 47,4 с, DX = <т/п = (4,9)2/100 с2,
а-=0,49 с.
Находим вероятность
1,4 ^7-47,4 1,6
р{46<Х<49} = р\-^<Л-*^<
I i nia HiO
0,49 0,49 0,49
= Р{-2,857 < 2 < 3,265} = Ф(3,265) + Ф(2,857) = 0,9984.
103
При решении задачи на основании следствия из теоремы Ляпунова
распределение центрированного и нормированного среднего {X ~
- 47,4)/0,49 было приближенно заменено на распределение
стандартной нормальной случайной величины Z- jV(0, 1).
Интегральная теорема Муавра—Лапласа
Функция распределения центрированной и нормированной
биномиальной случайной величины при п —» °° стремится к функции
распределения стандартной нормальной случайной величины:
[ \Jnpq \ V27t i
Эта теорема является частным случаем следствия из теоремы
Ляпунова, поскольку биномиальная величина является суммой
альтернативных случайных величин:
и=5Х <4-2-5>
'=1
Доказательство следствия проводилось путем проверки
справедливости условия Линдеберга в непрерывной форме. Однако
альтернативные случайные величины — дискретные. Поэтому для
доказательства сформулированной теоремы надо установить выполнение
условия Линдеберга для альтернативных случайных величин.
Имеем для каждой альтернативной величины Xh входящей
в сумму (4.2.5),
\ч р) ■ \Ч Р)
поэтому
MX, = р, DX,=p2q + q2p = pq. (4.2.6)
Каждое из одинаковых слагаемых знаменателя условия
Линдеберга — pq, каждое из одинаковых слагаемых числителя
Y{x-pfpx> с4-2-7)
\x-p\>Xyjnpq
где х принимает значения 0 и 1, причем рх = q при х = 0, и рх = р при х = 1.
Полная дисперсия pq альтернативной случайной величины
(слагаемое знаменателя) состоит из двух слагаемых p2q и q2p, первое
104
из них отвечает х = 0 и войдет в сумму (4.2.7), если р > Zyjnpq, второе
отвечает* = 1 и войдет в сумму (4.2.7), если q > xJnpq. Поэтому при
л>-^— первое слагаемое не войдет в сумму (4.2.7), а при п>~- —
vq х р
второе слагаемое, т.е. при п > «(), я0 = max -%-,—j— , в сумме (4.2.7)
\.rq х Р)
не останется ни одного слагаемого. Таким образом, допредельная
величина в условии Линдеберга будет равна нулю, тем самым и предел
равен нулю, т.е. условие Линдеберга выполняется.
Приведенное доказательство основывалось на теореме Ляпунова,
которая была дана без доказательства ввиду сложности последнего.
Между тем учебный материал предыдущих глав вполне достаточен для
прямого доказательства интегральной теоремы Муавра — Лапласа.
ПРЯМОЕ ДОКАЗАТЕЛЬСТВО ИНТЕГРАЛЬНОЙ ТЕОРЕМЫ МУАВРА-ЛАПЛАСА
Доказательство будет проведено в терминах производящих
функций, т.е. будет доказано, что
г
ту {t)->my(t) = c2,
wz„=Hf^; (4.2.8)
yjnpq
е2 — производящая функция стандартной нормальной случайной величины
Z~/V(0, 1) (см. §3.5).
Стандартную биномиальную величину (4.2.8) представим в виде
суммы центрированных альтернативных величин:
Z.=*jJ2r = J-±X,-*p = -l-t(X,-p\ («.9)
s\npq sjnpq^\ \jnpq < = \
Поскольку
' -р Я
х,-р~
Я Р
то
тх _p(t) = Мёх ~р)' = Q~p'q + е*'р.
105
Используя представление производящей функции суммы
независимых случайных величин в виде произведения производящих
функций слагаемых, получаем
Применяя теперь выражение для производящей функции слу-
» \
чайной величины 2-i{Xj-p), умноженной на константу С =
( = 1
найдем
( '"
mz{t) =
qe
7w _|_ реФ'р<1
(4.2.10)
Разложим в ряд экспоненты, представленные в выражении
(4.2.10):
с
лл
yjnpq 2npq \ П
41
.1Л
^jnpq 2npq \ п
После сложения получаем
/>l ql
qe
^ + ne^ = l + — +о\-
2/2 \п
(4.2.11)
где о \ — \ — бесконечно малая, стремящая к нулю быстрее, чем — .
Подставив выражение (4.2.11) в равенство (4.2.10),
окончательно получаем:
л
т, (0 =
.1+ — +о\ -
2п \ п
-»е 2 =mz(t).
ВОПРОСЫ И ЗАДАЧИ
1. Закон распределения случайной величины, принимающей только
положительные значения, неизвестен. Оценить вероятность того, что
случайная величина примет значение, не превышающее 10, если ее
математическое ожидание равно 5.
106
2. Средний стаж работы ассистента до защиты кандидатской диссертации
равен 7,9 года. Оценить вероятность того, что стаж наугад взятого
ассистента не превышает 10 лет.
3. Оценить вероятность того, что средняя арифметическая 50 случайных
величин отклонится от средней арифметической их математических
ожиданий не более чем на 0,15, если дисперсия каждой случайной
величины не превышает 0,45.
4. Из большой партии деталей было отобрано 100 деталей. Определить
вероятность того, что отклонение средней прочности отобранных
деталей от средней прочности партии не превышает 0,3, если дисперсия
прочности наугад взятой детали равна 2,25.
5. Вероятность брака при изготовлении кинескопов равна 0,1.
Определить вероятность того, что при проверке 500 кинескопов будет
забраковано не более 54.
6. Вероятность выхода из строя конденсатора за время Г равна 0,2.
Определить вероятность того, что за время Г из 100 конденсаторов выйдет
из строя менее 25.
7. При штамповке изделий из пластмассы на каждые 6 изделий
приходится одно дефектное. Определить вероятность того, что из 80
изготовленных изделий число стандартных изделий будет находиться
в пределах от 60 до 75.
8. Инвестор покупает ценные бумаги за счет займа, взятого с процентной
ставкой г под залог недвижимости. Процентная ставка на ценные
бумаги X— случайная величина с MX - а, а > /-, DX= о2. Какова
вероятность того, что инвестор не сможет вернуть долг и лишится своей
недвижимости?
Указание. Оценить с помощью неравенства Чебышева вероятность
события (Х< г).
тттвшшшщтщттштштщтттщттщтшшщщтшшштятшшш
ГЛАВА 5
ВВЕДЕНИЕ В ТЕОРИЮ СЛУЧАЙНЫХ ПРОЦЕССОВ
И ТЕОРИЮ МАССОВОГО ОБСЛУЖИВАНИЯ
В данной главе приведены основные сведения о случайных
процессах. Дано определение случайного процесса, приведены основные
виды случайных процессов. Более подробно изучены марковские
процессы с непрерывным временем и дискретным множеством значений,
которые составляют основу аналитической теории массового
обслуживания.
Описаны состав и виды систем массового обслуживания,
выведены дифференциальные уравнения для вероятностей состояний
системы, найдены вероятности состояний в установившемся режиме
и по ним определены важнейшие операционные характеристики
систем массового обслуживания с ограниченной очередью.
Операционные характеристики систем с неограниченной
очередью и с отказами могут быть получены как частные случаи
соответствующих характеристик систем с ограниченной очередью.
5.1. СЛУЧАЙНЫЕ ПРОЦЕССЫ И ИХ ВИДЫ
Случайным процессом называется семейство случайных величин
X(t, со), заданных на одном и том же пространстве элементарных
событий Q и зависящих от параметра t е Т. В большинстве практических
приложений параметр / трактуется как время. Далее будем
придерживаться именно такой трактовки.
При фиксированном / = /0 X(tQ, со) представляет собой обычную
случайную величину (сечение процесса в момент /0), при
фиксированном со X(t, со) является траекторией случайного процесса.
Математическим ожиданием случайного процесса называется
траектория математических ожиданий составляющих этот процесс
случайных величин
а(1) = МХ(1,ю). (5.1.1)
Дисперсией случайного процесса называется траектория
дисперсий составляющих этот процесс случайных величин
а2 (0 = DX(t, со). (5.1.2)
108
Ковариационной (автоковариационной) функцией случайного
процесса называется функция двух переменных t, s е Т, значения
которой представляют собой коэффициенты ковариации сечений
процесса в соответствующие моменты времени:
B{t, s) = cov[X(t, со), X(s, со)]. (5.1.3)
Далее аргумент со опустим, но он будет подразумеваться
по умолчанию.
Конечномерным распределением случайного процесса в
моменты /,, ..., t„ называется распределение многомерной случайной
величины, составленной из сечений в моменты ?,,..., t„:
F, t{x„...,x„) = P{X{tx)<x^...,X{t„)<x„}. (5-1.4)
Процесс называется регулярный, если его поведение полностью
определяется конечномерными распределениями и они согласованы.
Под согласованностью понимается следующее: любые два
распределения в моменты (tv...,tk,tk + \,...,t„) и (/,,...,tk,tk-. +1,...,Ли) приводят
к одному и тому же распределению в моменты (/,, ..., /А). Здесь /,, ..., tk
для удобства записи выбраны следующими подряд, однако имеется
в виду, что они могут любым способом чередоваться с Л, tj.
Процесс называется процессом с непрерывным (дискретным)
временем, если множество Т непрерывно (дискретно). Как правило,
в первом случае рассматривают Т= [О, °о), во втором — Т = О, 1, 2, ... .
Далее будем считать, что имеет место один из этих случаев.
Процесс называется процессом с непрерывными (дискретными)
значениями, если составляющие его случайные величины принимают
непрерывные (дискретные) значения.
Процесс является процессом с независимыми значениями, если
X{i) не зависит от X{s) при / Ф s, t, s е Т.
Процесс называется стационарным в широком смысле, если его
математическое ожидание и дисперсия не зависят от времени, а
ковариационная функция зависит только от разности моментов времени:
B(t,t + s) = B(s). (5.1.5)
Процесс называется стационарным в узком смысле, если его
конечномерные распределения инвариантны относительно сдвига
по времени h > 0:
F,, + t, /„ + *(*!—> *J = F, ,„(*i.•■■>*„)■ (5л-6)
109
Из стационарности в узком смысле следует стационарность
в широком смысле, но не наоборот.
В самом деле, с одной стороны, из условия (5.1.6) вытекает
одинаковость одномерных распределений в разные моменты времени,
а из этого следует, что математические ожидания и дисперсии одни
и те же в разные моменты времени, с другой стороны, условие (5.1.6)
для двумерных распределений можно записать так:
что означает, что двумерные распределения одинаковы в моменты
времени, разность между которыми одинакова, а отсюда и следует, что
ковариационная функция зависит только от разности моментов времени.
Процесс называется гауссовским, если все его многомерные
распределения являются нормальными (см. § 3.6):
f, ,,(*)=, Jn jnaexp{4(x~fl)'*~l(*~g)}» (5Л<7)
(2л) -J\B\ I * J
/И (nit \\
где jc =
, " -
\Лп/
<*(М
И О.
, Я = Ш/,,/Х I, у = !,...,/?.
Для гауссовских процессов из стационарности в широком смысле
следует стационарность в узком смысле. Это в самом деле так,
поскольку плотность конечномерного распределения (5.1.7) целиком
определяется первыми двумя моментами: при a{t) - а0 - const вектор а
всегда будет постоянным, а ковариационная матрица инвариантна
относительно сдвига по времени, так как ее компоненты зависят только
от разности моментов времени:
Д(/, + Л,/, +А) = *(',-0 = *(*,-,(,),
тем самым
Л+А ,„+А (*)=/,, ,,W.
ii rro и есть стационарность в узком смысле.
В главе 10 будут изучаться экономические временные ряды.
В общем случае их случайная составляющая является стационарной
случайной последовательностью.
110
Среди случайных процессов особое место занимают марковские
случайные процессы. Марковские процессы обладают следующим
важным свойством: при известном настоящем их будущее не зависит
от прошлого (^ < t2 < ... <t„<s< t):
P{X(t)<x/X(tl) <дс„ ...Д(0 <x„X(s) <у} =
= P{X{t)<x/X{s)<y), (5.1.8)
т.е. будущее поведение системы, описываемой марковским процессом,
целиком определяется ее состоянием в последний из известных
моментов времени.
5.2. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ /
С НЕПРЕРЫВНЫМ ВРЕМЕНЕМ
И ДИСКРЕТНЫМ МНОЖЕСТВОМ СОСТОЯНИЙ
Марковский процесс с непрерывным временем и дискретным
множеством состояний составляет теоретическую основу для
исследования реальных систем массового обслуживания. Под состоянием
системы массового обслуживания понимается число требований (заявок)
на обслуживание, находящихся в системе. Поэтому далее изучается
марковский случайный процесс с непрерывным временем, который
принимает значения / - 0, 1,2,..., /V, где N— максимальное число
требований, которое может находиться в системе.
Для таких процессов марковское условие (5.1.8) запишется
в следующей форме:
P{X(t) =j/X(tt) = /„ .... ДО = /,„ X(s) = /} = (5.2.1)
= P{X(t)=j/X(s) = i}.
Вероятности в правой части (5.2.1) называются переходными
вероятностями и обозначаются следующим образом:
Р,р, t) = P{X{t) =jlX{s) = /}. (5.2.2)
Если переходные вероятности зависят только от разности
моментов времени (т.е. только от длины интервала)
p0(s, t)=p0(t-s),
то такой марковский процесс называется однородным по времени.
Ниже рассматриваются только однородные марковские процессы.
Кроме того, исходя из поведения реальной системы массового
обслуживания, будем считать, что на конечном интервале процесс
может менять свое состояние не более чем счетное число раз, такие про-
111
цессы называются сепарабельными. Таким образом, траектории
изучаемых процессов являются кусочно-постоянными (ступенчатыми).
По этим же соображениям будем рассматривать только
стохастически непрерывные марковские случайные процессы, для которых
при s —> О
X(t + s)=>X((), '(5.2.3)
т.е. для любого е
\\mP{\X(t + x)~X(t)\>e} = 0,
л-»0
откуда следует:
\imP{X(t + s)*X(t)} = 0. (5.2.4)
Из условия (5.2.4) и, следовательно, из условия стохастической
непрерывности вытекает, что при s —> 0 и i Ф}
p0(t + s) ->/>,/*), р^) -» 0. (5.2.5)
Переходные вероятности удовлетворяют следующим
уравнениям Колмогорова—Чепмена:
N
^/С + *)=Хл*(0^С«). (5.2.6)
которые выводятся аналогично теореме полной вероятности (см. §2.1).
Матрица, составленная из переходных вероятностей, называется
стохастической:
Я(0 = |^(0|, /,у = 0,1,..., yv.
В матричном виде уравнения (5.2.6) выглядят так:
P(t + s) = P{t)P{s).
Стохастически непрерывные сепарабельные марковские
процессы удовлетворяют следующим предельным соотношениям:
1-р,(А/)
lim ^ = \., \~ рАМ) = ХЛ{ + о{А0, (5.2.7)
л/-»<) Д/
р.ЛМ)
lim —'- = \h, p..(At) = \.At + o(At).
д,_>0 Д/ '■' r,/V ''
Постоянные X, называют плотностями вероятности выхода
из состояния, а X,,, — плотностями вероятности перехода из состояния
в состояние.
112
При доказательстве будем использовать следующее
обозначение:
лДО = Р{Х{и) = /, 0 < и < t/X(0) = /} —
вероятность того, что процесс на всем полуинтервале [0, t) будет
находиться в состоянии i, не выходя из него. Пользуясь свойствами
однородности и марковости, имеем:
тс,(/ + s) = P{X(u) = i,0<u<t + s/X(0) = /} =
= Р{Х{и) = /, 0 < « < t/X(0) = /} P{X(u) = ij<u<t + s/X(0) = /, X(t) = i }=
= n{t)P{X{u) ="/, 0 < м < s/X{0) = i\ = K(t)n{s). (5.2.8)
Поскольку 0 < тс,(1) < 1, то эту вероятность можно записать
в форме
M0 = *~\
где А., =-In 71,(1).
Из соотношения (5.2.8) вытекает: 7С,(1) =
П
, тс, - =е
^-\1п
точно так же тс, — =
«..I
= е '
Но поскольку любое / > 0 можно как угодно точно приблизить
рациональными дробями, то
Обозначив /,. = rt/n, имеем (выражение для вероятности справа
охватывает не все возможности перехода из состояния i в состояние у,
г = 0
Л,(0*5>,(О*4\L ",('-',„)й 1е-1'"'>„ ie
-1.1
n)]-Q
r = l
-Ki
t
-л,, f t ) L- е"Л'' ^ -V f / M " C_V "V ] " e"X'' P'j ^ n
/7 J —X:t I П
tin
поэтому
p..(r)>e ' hm — .
113
Поделив левую и правую части последнего неравенства на /
и переходя к пределу при t —> 0, получаем
hm——>hm^-—,
,_>о / б->о 5
т.е. существует плотность вероятности перехода
hm^— = Х 1Ф].
/-»о t J
Если 0 < /0 < /, < ... /„ < /, то вероятность/?^(/) можно представить
в виде
«-I
Pli(t) = ni(t)+Y,lLni(tr)Pij(tr+l-tr)P,j(t-tr + x)-
Пусть теперь t —> 0, тогда, согласно только что доказанному
утверждению,
лА'г+|-',)=У',+1-',-)+°(о,
поэтому ри (() = л,(/) + о(0, следовательно,
Уравнения Колмогорова
Пользуясь соотношениями (5.2.7) для плотностей вероятностей
выхода из состояния и перехода из одного состояния в другое
состояние, можно вывести дифференциальные уравнения для переходных
вероятностей и для вероятностей состояний.
ПРЯМАЯ СИСТЕМА УРАВНЕНИЙ КОЛМОГОРОВА
Пользуясь уравнениями Колмогорова—Чепмена [см. формулу
(5.2.6) и соотношениями (5.2.7), имеем:
N
*U (5-2-9)
= ([-\jAt)piJ(t)+ £ Pik(t)XkJAt + o(At),
кФ j
114
поэтому
P,j{t + А/) - pif(t) " 0(Дг)
/г * /
Переходя к пределу при At —> 0, окончательно получаем прямую
систему уравнений Колмогорова:
%=1>/А,> А,у/ =->-,,i,у = 0,1 //. (5.2.10)
ОБРАТНАЯ СИСТЕМА УРАВНЕНИЙ КОЛМОГОРОВА
Если уравнения Колмогорова—Чепмена для переходных
вероятностей записать в следующей форме [сравните с уравнением (5.2.9)]:
Л'
р)7(/ + дО=2>,,(Л/)а/(>),
it =0
то аналогичным образом может быть получена обратная система
уравнений Колмогорова
dp N
^f=IW (5.2.11)
"' it = о
УРАВНЕНИЯ КОЛМОГОРОВА ДЛЯ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ
Если задано начальное распределение вероятностей q = (q0, qu
., qN\ где q. = P{X{0) = /}, ]>>,. = 1,' то
/ = o
pl{t)^P{X(t) = j}^fjqlPii{t).
Умножая каждое из прямых уравнений Колмогорова (5.2.10)
на д, и складывая их, получим следующую систему уравнений для
вероятностей состояний:
"' к = 0
или в матричной форме:
^=М. р(0) = ?,
at
где р = (Pq,P\, .., Рх) — вектор-строка вероятностей состояний.
115
Система уравнений (5.2.12) имеет стационарную точку, в
которой — = 0; в стационарной точке дифференциальные уравнения пе-
dt
реходят в линейные алгебраические:
рЛ = 0. (5.2.13)
Определитель этой системы равен нулю, поскольку сумма его
столбцов равна нулю. В самом деле, для любого А/:
i>„(Ao=i,
,/ = о
или
$>*(A0 = 1-P,,(A0.
Поделив это выражение на At и перейдя к пределу, получим
J*i
или (напомним, \„ = -X,)
£>„.=0, / = 0,1,...,/V,
т.е. действительно сумма столбцов Л равна нулю. Поэтому одно
из уравнений системы (например, последнее) является следствием
N
других. Заменив это уравнение на естественное У] Рк = ^ получим
А- =0
следующую систему линейных алгебраических уравнений для
стационарных вероятностей:
2>аЧ = 0' ,/ = 0,1,...,ЛГ-1,
k=N° (5.2.14)
Sa = i.
а = о
5.3. ВВЕДЕНИЕ В ТЕОРИЮ МАССОВОГО ОБСЛУЖИВАНИЯ
Предмет теории массового обслуживания — вероятностные
модели реальных систем массового обслуживания (СМО). Состояние
СМО описывает марковский процесс с непрерывным временем и
дискретным множеством состояний.
116
Любая реально функционирующая СМО (автозаправочная
станция, парикмахерская, столовая и т.п.) соединяет в себе по крайней
мере три составляющие:
1) входящий поток требований (заявок) на обслуживание;
2) обслуживающую систему;
3) выходящий поток обслуженных заявок и поток заявок,
получивших отказ.
Любая реальная СМО может быть представлена как простая или
сложная система из многих таких составляющих.
Под входящим потоком понимается последовательность
случайных моментов времени fh t2, ... поступления заявок в систему.
Интенсивностью входящего потока называется среднее число
требований, поступающих в систему в единицу времени.
Если при занятой обслуживающей системе вновь пришедшая
заявка получает отказ, то такая СМО называется системой с
отказами, в противном случае — системой с очередью. Различают системы
с неограниченной очередью и ограниченной очередью, в последнем
случае заявка теряется, если очередь уже достигла предельной длины.
Под организацией очереди понимается порядок обслуживания
поступивших требований: если некоторые заявки имеют
преимущества в постановке на обслуживание, то такая СМО называется системой
с приоритетами.
Ниже будут рассматриваться системы без приоритетов и с
ограниченной очередью. Системы с отказами и с неограниченной
очередью являются особыми частными случаями систем с ограниченной
очередью. Максимальное число требований, которые могут
находиться в такой системе, будет обозначаться через N.
Обслуживающая система состоит из обслуживающих каналов.
Каждый канал может осуществлять лишь один вид обслуживания
и единовременно обслуживать лишь одно требование. Если система
включает в себя каналы, которые могут выполнять много видов
обслуживания, то такая система называется многофазной.
Наличие нескольких каналов (многоканальная СМО) позволяет
увеличить интенсивность обслуживания однофазной системы,
поскольку параллельно могут обслуживаться несколько требований.
Далее будут изучаться многоканальные однофазные СМО. Число
каналов в такой системе будет обозначаться буквой п.
Интенсивностью обслуживания (каналом или всей
обслуживающей системой) называется среднее число требований,
обслуженных в единицу времени.
117
Изучение выходящего потока особенно актуально тогда, когда
требования, прошедшие один вид обслуживания, поступают на
следующий вид обслуживания (на следующую фазу), т.е. выходящий
поток становится входящим потоком для другой фазы.
Простейший входящий поток
Входящий поток требований называется простейшим, если этот
поток обладает свойствами стационарности, отсутствия последействия
и ординарности.
Обозначим через X(t) число требований, поступивших во
входящем потоке к моменту времени /, полагая при этом, что Х(0) = 0.
Вероятность того, что за время / придет конкретное число
требований /с, зависит от того, где находится интервал длиною /:
P{X{t + s)-X{s) = k}=pk{s,t). (5.3.1)
Входящий поток требований называется стационарным, если
вероятности (5.3.1) не зависят от расположения интервала, но зависят
только от его длины:
P{X(t + s) -X(s) = к} = P{X{t)-X{0) = к} =pk(t). (5.3.2)
Таким образом, Pk(t) — вероятность того, что за время /
поступит к требований.
Входящий поток требований называется потоком с
отсутствием последействия, если будущее поступление заявок не зависит
оттого, как они поступали в прошлом, иными словами, если t: < t2 <
< ... < t„ < v < /, то
P{X{t) - X(s) = klX{tA) = i„ ..., X(Q = /„, X{s) = /} = (5.3.3)
= P{X(t)-X{s) = k}.
Из отсутствия последействия вытекает условие марковости [см.
формулу (5.2.1)] процесса Х(():
Р{Х(() -jlX{t,) = i„ ..., ДО = /„, X(s) = ,■} =
- Р\Х{() - X(s) =j - ,УВД = iu .... X{t.) = in, X{s) = /} =
= P{X{t)-X{s) =j- i/X(s) = i}= P{X(t) =jlX{s) = i}.
Условие стационарности означает однородность марковского
процесса X{i) -— числа заявок, поступивших за время /.
Входящий поток называется ординарным, если за малый
промежуток времени приход двух или более требований маловероятен
116
(вероятность такого события равна бесконечно малой величине более
высокого порядка по сравнению с At:
Pk(At)=o(At),k = 2,3,.... (5.3.4)
Докажем теперь, что простейший поток требований является
пуассоновским, т.е. все его конечномерные распределения — пуас-
соновские.
Начнем с вероятности p0(t), т. е. вероятности того, что за время t
в систему не поступит ни одного требования. Поскольку 0 < p0(t) < 1,
то эту вероятность можно записать в виде
Ро(1) = еЛ
гдеХ = -1п/?0(1) >0.
Пользуясь условиями стационарности и отсутствия
последействия, имеем:
Р\)\ ~
п
= />оО) = *-\
поэтому р()\ - \ = е~х/". Далее, поскольку р0 —1 =
п*
Ро\-
то
А U г
"ш", а отсюда уже с непреложностью вытекает [см.
аналогичное доказательство формулы (5.2.8)]
/>о(0 = е-А'.
Подключая теперь условие ординарности, получаем следующее
дифференциальное соотношение для любой вероятности состояния
при к > 1 [приход двух требований и более за время А/ имеет
вероятность o(At)\.
Pk{t + At) = pk(l)p0(At) + pk ,(/)p,(A0 + o{At).
Поскольку
pQ{At) = e XA' = 1 - XAt + o(At), (5.3.5)
p}(At) = 1 -p0(At) -p2(At) -... = XAt + o(At),
то
Pk{t + At) -Pk{t) = -Xpk(t)At + Xpk. t(t)At + o(At).
119
После деления на At и перехода к пределу при At —> 0
окончательно получаем
^ = -\рк+\рк_[> р,(0) = 0, £ = 1,2,..., (5.3.6)
dt
при этом для А; > 0рА.(0) = 0, поскольку Р{Х(0) = 0} = 1.
Для решения уравнений (5.3.6) сделаем замену:
Рк = e"XV w* - ех'р*. Л = I, 2, ....
(в частности, при к = 0 и0 = 1, поскольку /?0 (?) = е" '), тогда
^ = ЬА._,, м*(0) = 0, £ = 1,2,.... (5.3.7)
Решим сначала первое уравнение системы (5.3.7):
at
тогда щ =Xt,
затем второе уравнение
tin .
= ?i2r, и,(0) = 0,
тогда и, =
2 2!
с//
?Л2
Наконец, для любого /с > 0 получаем
и, =
А!
Возвращаясь к вероятностям, окончательно имеем:
Рк(() = Р{Х(0 = к} = ^-^, * = 0,1,..., (5.3.8)
Л!
т.е. одномерные распределения являются пуассоновскими.
Используя формулу (5.3.8), найдем среднее число требований,
поступающих в систему за время / (см. § 3.2):
MX{t)=Y;k^-s-h =\t. ' (5.3.9)
А- = 0
к\
120
Из уравнения (5.3.9) находим
\=мт. (5.3.10)
Таким образом, X — среднее число требований, поступающих
в систему в единицу времени, или интенсивность входящего потока
требований.
Система обслуживания с экспоненциальными каналами
В аналитической теории массового обслуживания
предполагается, что время обслуживания х одного требования каналом
распределено по показательному закону, функция плотности вероятности
которого имеет вид:
[це"ц' />0
Поскольку
0, /<0.
\1 Мх
поэтому ji — интенсивность обслуживания.
Поскольку
Fz(t) = P{x<t} = \-^\
то
P{x>t\=cm. (5.3.12)
В частности, при малом А/
Р{х > At) = е м' = 1 - цА/ + о(Д/),
Р{х < At) = 1 - е рД' = цД/ + o(At).
Показательное распределение как распределение времени
обслуживания обладает следующим свойством: длительность
предстоящего обслуживания не зависит от того, сколько обслуживание уже
продолжалось:
Р{х>s + t,x>t] _ Р{х>s + t) _
P{x>s + t/x>t} =
P{z>,} P{x>t)
=Q-^=P{X>S).
121
Если в обслуживающей системе в каждый момент / находится к
требований, к < п, то вероятность того, что за малое время Ы не
закончится обслуживание ни одного требования (т, — время обслуживания
требования i'-м каналом):
к
Р{хх > А/,..., хк > А/} = Y\ Р^! > А/} = е"*^' = 1 - k\lAt + o(At),
а вероятность того, что закончится обслуживание ровно одного
требования,
/>lU(xi > Л/> -'х' < Л/' — х» > А0 Г = k^At + °(д0. (5.3.14)
вероятность же того, что будет обслужено более одного
требования, — о(А/).
Уравнения для вероятностей состояний
многоканальной СМО с ограниченной очередью
Рассмотрим теперь, как функционирует однофазная «-канальная
СМО с ограниченной очередью длиною не более (N - п), на вход
которой поступает простейший поток требований с интенсивностью X,
а каждый канал обслуживающей системы является показательным
с интенсивностью обслуживания (J.. На рисунке 5.1 приведена схема
такой СМО.
X
Входящий
поток
Очередь
k<N - п
'
Поток
откаэо
в
'
W
J
м
1 .; \
\
ц
/
*.
Выходящий
поток
Рис. 5.1. Схема функционирования однофазной СМО
Обозначим через X{t) число требований в системе в момент /.
Поскольку входящий поток и обслуживающая система обладают мар-
122
ковским свойством, то X{i) как результат их взаимодействия является
марковским процессом с (N + 1) состоянием (к = О, I, ..., п, /7+1, ..., N).
В таком случае (см. § 5.2) вероятности состояний системы
pk(t) = P{X(t) = k}tk = 0, \,...,N,
удовлетворяют уравнениям (5.2.12). Чтобы найти конкретный вид этих
уравнений для рассматриваемого процесса X(t), надо найти плотности
вероятностей выхода из состояний и перехода из одного состояния
в другое.
Поскольку из-за ординарности входящего потока приход двух
требований и более за малое время At имеет вероятность о(А/), а
экспоненциальная обслуживающая система может за время At закончить
обслуживание двух требований и более также с вероятностью o(At),
то отличны от нуля только плотности вероятности перехода в
соседние состояния.
Используя уравнения (5.3.5) и (5.3.14), получаем: вероятность
того, что за время At пришло новое требование во входящем потоке,
рк к + ,(А/) - XAt + o(A/f), к = О, 1, ..., N - 1,
а вероятность того, что за время At обслуживающая система закончила
обслуживание одного требования,
k[iAt, к = \,...,п,
Л.*-|(д') =
n\lAt, k=n + h
N.
Поэтому
то
)СКОЛЬК
(Д/)=<
\ =
^А, *Н~^*
= 0,1,.
[п\1, к = /? -
:У
\-\At + o(At),
l-p*.*-i(^)-ft.* + i(AO
1 - n\xAt + o(At),
v 1-PuW)
hm — --<
Д/-»0 Д/
X
Х+ k\i,
X + /IJLI,
П[1,
.,N- 1,
f 1,...,/V.
А=0,
+ о(Л0, к = \,...
k = N,
к=0,
к = \ь...,п
к = п + 1,..., N -
k = N.
,N-\,
1,
123
\к - ~\ -
Соответственно
'-Х, к = 0,
-(Х + Лц), к = \,...-,п
-(k + n[i), k = n + [,...,N - 1,
-п\х, k = N.
Тем самым матрица Л в нашем случае примет вид:
Л =
таким образом, полностью заполнены диагональ, а также верхняя
и нижняя поддиагонали.
Расписывая матричную запись рК = 0 по уравнениям, получаем
следующую систему алгебраических уравнений для стационарных
вероятностей состояний:
^A._l-(A. + ^).pit + (/r + i)|ipitfl=o, л = 1,..м/1-1,
Хрк _, - (к + п\х)рк + n\ipk +, = 0, /г = и,..., N - 1,
(-Х
и
0
0
J
X
-(к +
2ц
0
0
Ю
0
А.
—(A, -h 2р.)
0
0
0
0
0
. иц
. 0
0
0
0
-(Я, + иц)
п\х
0 >
0
0
X
-лц,
(5.3.15)
Поскольку определитель системы (5.3.15) равен нулю, то одно из
ее уравнений является следствием других. Поэтому, заменив последнее
N
уравнение системы на естественное ^ рк =1, окончательно получаем
А- = 0
систему из (N + 1) уравнения для (N + 1)-й стационарной вероятности:
'-"кр0 + цр, = 0, к = 0,
\рк_х -(k + k\i)pk +(к + \)щ)к + { = 0, * = 1,...,л-1,
Арл _, - (А, + иц)рА. + Щ1рк +, = 0,
Р0 +р, + ... + /?д, =1.
к = п,..., /V-1,
(5.3.16)
Вначале выразим все вероятности через р{), а затем найдем р0
из последнего уравнения, в результате получим
124
Рк =
к\
pQ, k = l,...,n,
ln\n
— p0, к = n+ !,..., N,
Po =
p* p" l-(p/«)
,V - ;i + 1
4-„A!
A=0
1 -pin
Нетрудно проверить, что вероятность
(5.3.17)
Pn=-
п\п
-А).
найденная как решение уравнений (5.3.15) (без последнего уравнения),
удовлетворяет последнему из уравнений (5.3.15), т.е. это уравнение
действительно есть следствие остальных уравнений системы (5.3.15).
Далее через X будем обозначать случайную величину — число
требований в системе в установившемся режиме.
Функционирование СМО различно для трех стадий (режимов):
1. Заполнение системы после начала ее работы, вероятности
состояний зависят от времени и определяются как решение системы
дифференциальных уравнений.
2. Функционирование системы в установившемся режиме,
вероятности состояний не зависят от времени [см. выражение (5.3.17)].
3. Прекращение приема новых заявок на обслуживание и
освобождение системы от оставшихся заявок путем их обслуживания;
вероятности зависят от времени и являются решением
дифференциальных уравнений.
Переходный режим первоначального заполнения системы
описывается следующими линейные неоднородные дифференциальными урав-
неними {pN = \ - Pq - Р\ - ... - Pn i) с начальными условиями />0(0) = U
A(0) = (U=1,...,/V-1:
-^-=-Vo+wv
dt
dPk
dt
=\рк_х-{\ + к\1)рк+{к + \))1рШл
=Хрк_1-(Х + п\х)рк+пцрк+},
к=0,
к = 1,...,п-\,
k=n,...,N-2,
-t^=-n\ip0-...-n\ipN_y+(X-n\i)pN_2-('k + 2nii)pN_]+niL, k = N
dt
125
В Приложении 1 найдено решение этой системы при п -■ 1,
УУ= 2 и любом начальном условии р()(0) = q0, р\(0) = <?,. Это решение
имеет вид:
p,(t) = pl + Я„е~"'' + S2,.e~'y, v„ v2 >0,т.с.
iim/>,.(0=tf, / = 0,1.
поэтому при t —> оо решение стремится к стационарному. В общем
случае имеет место то же самое. Таким образом, после завершения
переходного процесса система переходит в установившийся режим,
описываемый стационарным распределением вероятностей. Хотя
чисто теоретически переходный процесс продолжается бесконечно долго,
практически он занимает относительно небольшую долю общего
времени функционирования системы, наибольшая доля приходится
на установившийся (стационарный) режим. Поэтому средние
характеристики, описывающие качество и экономичность обслуживания, надо
определять на базе стационарного распределения. Такие
характеристики называются операционными.
Операционные характеристики
многоканальной СМО с ограниченной очередью
Наиболее важными, с точки зрения клиентов, характеристиками
СМО являются средняя длина очереди, среднее время ожидания
в очереди, вероятность отказа и вероятность того, что придется
стоять в очереди.
Обозначим через Kf/ — текущее число требований в очереди,
Tf/ — время ожидания в очереди наугад взятой заявки. Имеем
(штрихом обозначена производная):
Мкч= X (*-")А= Z {к~п)
к = н + I
к^п + \
Р.РЦ Р
/7
к -и
Р<Р'
п\п
I*
,/--1
; = 1
_А£
и + 1 N -и
П\П
i = \
-РоР
11+ \
П\П
J pi п
N -и
i = \
О/и
_ Л,Р
1-(р/я)
N - и + I
п\п
1 - р / п
р/н
126
N-n
_Po?" + i l-(W-/i + l)(p//Q " +(N-n)(p/n)
, N - » + 1
n\n
(i-p/«r
Сравнивая с выкладками для к^, аналогично находим
Mt, = Xft«(t,'^ = *)=Z
* =11
ji N - I
*—„!»! и*""
п\\
к -и
=^1<*-» + ')(£) =^Z'f?"'
Л' - ;i
Л/К.
'</ _
X
N - и + 1
_Ц,р" + 1 1-(Л^-н + 1)(р//|),У "+(/У-„)(р//?)
п\пХ (1-р/»)2
Заявка получает отказ тогда, когда в системе уже находится
предельно допустимое число требований /V, поэтому вероятность отказа
п\п!
Р" ~ ^rN-n Р»'
Вероятность того, что заявка будет ждать, определяем
следующим образом:
. "-i ар ^YpY р" i-(p/«)
р{п<х<м-[\=УРк=-^- У \z-\=pv VK ;
1 J ^ к п\ ,4* \п) %! 1-р/я
к=п
1 = 0
С точки зрения управляющего или владельца СМО, важное
значение имеют «холостой ход» (доля времени простоя обслуживающей
системы) и среднее число занятых каналов.
Первая (из названный) характеристика — вероятность того, что
в системе нет требований
Ро =
W .р-Мр/чГ""
Ъ 77
*=0
к\ п\
1-p/w
Вторую характеристику — среднее число занятых каналов —
находим следующим образом (v — число занятых каналов):
w-I
Mv^Y,kPi<+nllPk=Po
и-1
р" 1-(р/я)
N - п + 1
L* = i(*-0! (""О' I-P/"
Соответствующие характеристики для СМО с неограниченной
очередью получаем из приведенных выше путем перехода к пределу
127
при TV —» «ж, при этом должно быть р/и < 1, или "К < п\у, а для СМО с
отказами — путем подстановки N = п. Все полученные результаты
сведены в табл. 5.1.
Понятие об имитации функционирования СМО
Как только не выполняется одно из предположений, сделанных
выше для обеспечения аналитического исследования системы вплоть
до получения формул для важнейших операционных характеристик,
так приведенные формулы становятся, вообще говоря,
неправильными. Повторим эти предположения:
1) входящий поток требований — простейший, при таком
потоке время между приходом двух требований имеет показательный
закон распределения с параметром X;
2) все каналы обслуживающей системы — показательные с
параметром |i;
3) система без приоритетов, т.е. все поступающие заявки
обслуживаются в порядке очереди;
4) система однофазная, т.е. производится один вид обслуживания;
5) система разомкнутая.
Имеющиеся имитационные пакеты прикладных программ
моделируют:
♦ длительность обслуживания с любым законом распределения;
♦ время между приходом заявок также с любым законом
распределения;
♦ процесс функционирования СМО при строго
формализованном алгоритме такого функционирования.
Для имитации на ПЭВМ функционирования изучаемой СМО
необходимо:.
1) составить блок-схему и алгоритм функционирования СМО;
2) установить законы (с точным указанием параметров
распределения) для промежутков времени между поступлением заявок во всех
входящих потоках и для времени обслуживания каждого канала;
3) подобрать пакет прикладных программ, пригодный для
имитации изучаемой системы;
4) описать на языке пользователя функционирование
изучаемой системы;
5) ввести указанные сведения в программную систему и
провести на ПЭВМ имитацию функционирования СМО, в результате чего
будут получены оценки операционных характеристик, тем более
точные, чем больше заявок во входящих потоках будет разыграно.
126
Операционные характеристики
Таблица 5.1
Наименование
характеристики
СМО с ограниченной очередью
СМО с неограниченной очередью
СМО с отказами
Вероятности
состояний
pt=P{X = k)
Ро
yEl + .P" i-(p/")v_n+1
A = i
%к\ я! 1-р/я
к = \,...,п,
Р4г7Л. k=n + l...tN
Ро =
Р п
1я!Я
z-
£"0к\ л! 1-р/я
— а,, £ = 1,...,я,
Аг!
А =
р*/А!
^
Р_
А: = 0,1,..., и
1я!я
ТТ7Ар * = « + !,■
Средняя длина
очереди Мк
р0р"^ \ - N(N -п + \)х'" +(N - п)(р/п)*
л!и (1-р/я)1
РоР
я!я(1-р/я)"
Среднее время
ожидания в опереди Мх
А/к /А.
А/к./А.
Среднее число
занятых каналов A/v
Ро
р" 1-(р/я)-"
fr(*-l)! (я-1)! 1-р/я
А>
у_Р__ + ^_Р
&(*-!)! (л-1)!(1-р/и)
aZ
ГП(Л:-1)!
Вероятность отказа
P.V
"^7 Л)
Р п
"ГА
я!
Вероятность того,
что заявка будет
ждать
P(n<X<N-l)
Ро
Р" 1-(р/»)Л
и! 1-р/я
Ро
Р" ^
я! 1-р/я
Ю
(О
В качестве примера на рис. 5.2 приведена блок-схема
функционирования трехфазной СМО, осуществляющей человеко-машинный
процесс доения коров:
фаза 1 — подготовка животного к машинному доению
(осуществляется оператором);
фаза 2 — доение (осуществляется доильной установкой);
фаза 3 — освобождение животного от доильного аппарата
(осуществляется оператором).
На этом рисунке: Г0 — время между поступлением животных;
Т/ — время 1-го вида обслуживания, i= 1, 2, 3.
Законы распределения в такой ситуации могут быть
нормальными с примерно следующими средними: МТ{) ~ МТХ = Л/Г3 = 1 мин,
МТ2 = 6 мин.
Первую и третью фазы может осуществлять один оператор либо
на каждую из них может быть выделен отдельный оператор.
Рис. 5.2. Схема трехфазной обслуживающей системы
2.
ВОПРОСЫ И ЗАДАЧИ
Автозаправочная станция имеет 4 бензоколонки. Среднее время
заправки — 2 мин. Входящий поток автомашин — простейший с
интенсивностью 1,5 авт./мин. При всех занятых колонках требование
теряется. Определить вероятность отказа и среднее число занятых колонок.
Покупатели магазина образуют простейший поток требований с
интенсивностью 150 чел./ч. Определить наименьшее число продавцов, при
котором среднее число покупателей, ожидающих обслуживания,
не превысит 3.
130
3. В нефтеналивном порту 4 причала для заправки танкеров, которые
приходят в среднем через 18 ч, а время загрузки составляет в среднем
двое суток. В очереди могут стоять не более 2 танкеров. Определить
пропускную способность и холостой ход порта.
4. Определить закон распределения промежутка времени между
приходом двух требований н простейшем потоке требований
интенсивностью А.
5. Поток желающих оформиib вьгзок врача на дом -— простейший.
В среднем абоненты звонят через каждые 10 с. Время приема вызова
распределено по показательному закону со средним значением 12 с.
Определить наименьшее число телефонов в регистратуре, при котором
вызов принимается не менее чем от 90% абонентов. Считается, что
в случае неудачи абонент не предпринимает больше попыток
дозвониться.
6. Доказать, что выходящий из показательного канала (на входе которого
всегда имеются заявки) поток является простейшим.
7. Автоматическая мойка может принять на обслуживание одновременно
4 автомашины. В среднем машины прибывают через 2 мин, а средняя
продолжительность мойки — 10 мин. В очереди могут находиться
не более 6 машин. Определить вероятность того, что в системе
находится хотя бы одна машина, и загруженность одной установки для
мойки машин.
8. В магазине имеется 3 справочных телефона. В среднем обращаются
за справками 40 чел./ч. Средняя продолжительность справочного
разговора 3 мин. Издержки, связанные с работой одного телефона, —
а руб./мин. Определить минимальную стоимость одной минуты
разговора по телефону, при которой система неубыточна.
9. Каким условиям должны отвечать случайные величины X, Y для того,
чтобы случайный процесс Z(/) = A'cos ОУ + Ksin Ш был стационарным
в широком смысле?
10. Платная стоянка для легковых автомашин имеет 7 мест. Найти
вероятность того, что прибывающая машина найдет свободное место, если
машины в среднем прибывают через 10 мин, а занимают место на
стоянке в среднем 1 ч.
П. Поток деталей, сходящих с конвейера, простейший с интенсивностью
2 дет./мин. Время проверки детали контролером имеет показательный
закон распределения со средним 2 мин/дет. Определить долю
непроверенных деталей.
12. Город обслуживают 4 машины скорой помощи. Вызовы поступают
в среднем через 4 ч. Вероятность того, что хотя бы одна машина
занята, равна 0,25. Определить среднее число занятых машин и среднюю
долю простоя машин.
131
13. В парикмахерской работают два мастера. Время обслуживания
распределено по показательному закону со средним 12 мин. Ожидать
обслуживание могут не более трех человек. Поток клиентов — простейший
с интенсивностью 10 клиентов/ч. Найти важнейшие операционные
характеристики этой системы.
14. Система автоматической посадки самолетов одновременно может
хранить данные только о шести самолетах, находящихся в воздухе.
Самолеты, подлетающие к аэродрому, образуют простейший поток с
интенсивностью 6 самолетов/ч. Если в момент запроса посадки система
заполнена, то самолет улетает к запасному аэродрому. Аэродром имеет
3 посадочные полосы, самолет занимает полосу в среднем 20 мин.
Найти пропускную способность СМО, загруженность одной полосы,
среднее число занятых полос, среднее время ожидания начала посадки
после запроса.
15. Система обслуживания изменяет свои состояния в дискретные
моменты времени / = 0, 1, ..., имеет два состояния: 0 (свободно), 1 (занято).
Матрица переходных вероятностей (за один шаг) имеет вид:
где а — вероятность поступления требования;
b — вероятность окончания обслуживания.
Найти стационарное распределение вероятностей.
Часть 2
МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА
Математическая статистика — раздел математики,
посвященный анализу данных. Основная задача математической статистики —
оценить характеристики генеральной совокупности по выборочным
данным.
Под генеральной совокупностью понимается весь мыслимый
набор данных, описывающих какое-либо явление. Более строго:
генеральная совокупность — это случайная величина Х(со), заданная
на пространстве элементарных событий Q с выделенным в нем полем
событий S, для которых указаны их вероятности Р. Или коротко:
генеральная совокупность — это генеральная случайная величина Х((д)
и связанное с ней вероятностное пространство (Q, S, Р).
Выборка объема п — это совокупный результат п независимых
наблюдений за генеральной случайной величиной. Конкретная
выборка л,, ..., х„ — это последовательность чисел — реализаций
случайной величины Х{(й). Случайная выборка — это весь мыслимый набор
конкретных выборок, или, более строго: случайная выборка — это
последовательность Хь ..., Х„ независимых одинаково распределенных
случайных величин, распределение каждой из которых совпадает с
распределением генеральной случайной величины. Случайная
выборка имеет следующее распределение:
?х Xi{xi,...>x,l)=P{Xl<x],...,Xll<xJ =
= f\P{Xi<xl} = flFx(xi).
В разделе.книги, посвященном математической статистике,
рассматриваются: методы получения и качество точечных и
интервальных оценок параметров и числовых характеристик случайных
величин; основные понятия проверки гипотез по выборочным данным
и наиболее употребительные в экономической практике виды гипотез;
регрессионный анализ как инструмент анализа и прогноза
экономических явлений; статистический анализ экономических временных
рядов; основные понятия и области применения в экономике
многомерного статистического анализа, эконометрики.
134
шшштщщщттштщтттщянттттшттшшщшшщ
ГЛАВА 6
ОСНОВЫ ВЫБОРОЧНОГО МЕТОДА
В настоящей главе разбираются вопросы построения оценок
параметров и числовых характеристик случайных величин по
выборочным данным и показатели качества этих оценок.
6.1. ОЦЕНКА ЧИСЛОВЫХ ХАРАКТЕРИСТИК
СЛУЧАЙНЫХ ВЕЛИЧИН
В результате осуществления п независимых наблюдений за
генеральной случайной величиной получена конкретная выборка xh ...,
х„, представляющая собой последовательность из п чисел.
Кроме этих результатов наблюдений за случайной величиной
ничего другого о ней не известно, за исключением, быть может, самых
общих представлений о форме закона распределения.
Каждое выборочное наблюдение х, в конкретной выборке
не имеет никаких преимуществ перед другими, т.е. они полностью
равноправны и равновозможны. Если выборочные наблюдения в
конкретной выборке переставить в порядке возрастания, то получим
вариационный ряд. Далее будем считать, что именно в таком порядке
уже расставлены выборочные наблюдения.
Все это дает нам основания для построения на базе конкретной
выборки ряда распределения обобщенной выборочной случайной
величины X :
(y Y \
X ~
l I
(6.1.1)
\п п )
Если все выборочные значения различны, то формула (6.1.1)
действительно задает ряд распределения: все значения случайной
величины различны и расставлены в порядке возрастания, сумма
вероятностей этих значений равна 1.
Если же некоторые значения совпадают (а это наверняка может
случиться для дискретных случайных величин, принимающих
меньшее число значений, чем п), то следует каждое такое значение
рассматривать один раз и с вероятностью, кратной числу значений.
135
Тогда получим настоящую выборочную случайную величину:
Х~
X]
т,
V п
Xl
т.
п
.. XI
т,
п )
^т; = п, 1 < п.
(6.1.2)
Если по рядам распределения X и I найти любой начальный
момент к-го порядка, то получатся одинаковые результаты
1 л , J^m
П—7 "Г П
MX'
=-У^=У-^хг=мхк.
Таким образом, с точки зрения расчета начальных моментов
(а следовательно, и центральных) обобщенный ряд распределения
(6.1.1) и обычный ряд распределения (6.1.2) полностью эквивалентны.
Поскольку все сведения о генеральной случайной величине X
сосредоточены в конкретной выборке (х,, ..., х„), а последняя
представлена в форме обобщенной выборочной случайной величины X ,
то естественно оценки числовых характеристик генеральной
случайной величины (далее все оценки будем помечать символом Л)
получать в форме соответствующих характеристик обобщенной
выборочной случайной величины. Приведем оценки наиболее
употребительных числовых характеристик — моментов:
vt=MA-=!£,«,
п гг
= 1
1
(6.1.3)
Например, оценки математического ожидания и дисперсии,
согласно формулам (6.1.3), примут вид:
1 " 1 " 2
a = v:=-Yx,=x, a2=-Y(x,-x) . (6.1.4)
",- = 1 л/ = 1
Оценкой числовой характеристики или параметра 6
случайной величины называется функция от выборочных значений
9(Х|,...,х(1), которая в определенном смысле «близка» к истинному
значению 6.
Например, в выражении (6.1.4) в качестве оценки
математического ожидания выступает линейная функция от выборочных значе-
136
ний с равными коэффициентами \1п, а в качестве оценки дисперсии —
квадратичная функция от выборочных значений и т.п.
Как измерить «близость» оценки 8 к истинному значению 0
или как определить качество оценки?
Качество оценки определяется не по одной конкретной выборке,
а по всему мыслимому набору конкретных выборок, т.е. по случайной
выборке. Поэтому для установления качества полученных нами
оценок моментов [см. формулы (6.1.3), (6.1.4)] следует в этих формулах
заменить конкретные выборочные значения xt на случайные
выборочные значения Xt.
Качество оценки устанавливают, проверяя, выполняются ли
следующие три свойства.
Состоятельность
Оценка 8 называется состоятельной, если она сходится по
вероятности к истинному значению (индекс п обычно опускается, но
подразумевается по умолчанию):
9=>е. (6.1.5)
Свойство состоятельности является обязательным для оценки:
несостоятельные оценки не используются.
Несмещенность
Оценка 0 называется несмещенной, если ее математическое
ожидание равно истинному значению:
М0 = 0. (6.1.6)
Это свойство желательно, но не обязательно. Часто полученная
оценка бывает смещенной, но ее можно поправить так, чтобы она
стала несмещенной. Иногда оценка бывает смещенной, но
асимптотически несмещенной, что означает стремление математического
ожидания оценки к истинному значению:
Л/ёи -> в. (6.1.7)
Эффективность
Оценка 9 называется эффективной в определенном классе
оценок 0, если она самая точная среди оценок этого класса, т.е. имеет
минимальную дисперсию:
£>0Л =minD0. (6.1.8)
ее©
137
Ниже рассмотрим, какими из этих свойств обладают
полученные выше оценки числовых характеристик.
Среднее арифметическое выборочных значений
как оценка математического ожидания
Для случайной выборки оценка математического ожидания [см.
формулу (6.1.4)] примет вид:
Согласно следствию из закона больших чисел (см. § 4.1) среднее
арифметическое независимых одинаково распределенных случайных
величин, имеющих дисперсию а2, сходится по вероятности к
математическому ожиданию
Х=>а,
а это и означает, что а = X состоятельна.
Несмещенность устанавливаем прямой проверкой:
(
^w / = 1 ) п i *= 1 п i = |
Теперь докажем, что а эффективна в классе линейных
несмещенных оценок.
В самом деле, линейная оценка имеет вид:
5 = 5>,*.,
линейная несмещенная оценка должна удовлетворять условию
Ма = а, поэтому
( п \
Ма=М
/ = i
т.е. для ее несмещенности необходимо ^с, = 1
( = 1
Найдем дисперсию
/
Da = D
\
) ы\
/ = ]
( = 1
(6.1.10)
138
Поэтому для определения наиболее эффективной оценки в клас-
нейнь
юрму.
константа):
се линейных несмещенных оценок надо минимизировать дисперсию
[см. формулу (6.1.10)] при выполнении условия несмещенности (а2 —
min J\f. (6.1.11)
Задача (6.1.11) — задача на условный экстремум, которая,
как любая такая задача, сводится к задаче на безусловный экстремум с
помощью функции Лагранжа:
» ( » \
/ = i
v<=i ;
Для определения точки экстремума находим производные
и приравниваем их к нулю:
— = 2с- -Х-0, i — 1,..., п.
Подставляя значения с, = ХУ2, полученные из первых уравнений,
в последнее уравнение, получаем
X \ X 1
— = —, или с, = — =—.
2 п 2 п
Итак, при с, = \ln, i= \, ..., п, оценка (6.1.9) имеет минимальную
дисперсию, т.е. а = X является эффективной в классе линейных
несмещенных оценок.
В частности, p-\i/ п (ji — биномиальная случайная величина)
является несмещенной, состоятельной и эффективной в классе
линейных несмещенных оценок оценкой вероятности.
Оценка математического ожидания
по неравноточным наблюдениям
Пусть имеются результаты п наблюдений за определенным
показателем а, выполненные с разной точностью:
Х\, ..., х„,
139
или в случайной форме:
Xi,...,X„,MXi = a, DX;=g*, /=l,...,/i. (6.1.12)
Требуется таким образом воспользоваться информацией,
содержащейся в конкретном ряде наблюдений хь ..., хп, чтобы
полученная по этому ряду оценка была самой точной с точки зрения всех
мыслимых значений такого ряда.
Описанная ситуация не укладывается в схему случайной
выборки, поскольку выборочные случайные величины имеют одинаковые
дисперсии, а здесь дисперсии разные. Вместе с тем такая задача имеет
большое практическое значение и обобщает решенную выше задачу
поиска наиболее эффективной оценки в классе линейных
несмещенных оценок.
В самом деле, в данной ситуации линейная оценка имеет
следующую дисперсию:
/
Da = D
\
£с,Л", =£с?о?
/=1
и задача поиска наиболее эффективной оценки в классе линейных
несмещенных оценок примет вид:
min У^с2о*
Снова строим функцию Лагранжа:
( п \
ЦС,,...,слА) = £с,2а?-А. £с,-1
(6.1.13)
и приравниваем ее производные к нулю:
= ZC/Oi — к = U, С/ =
2>, -
2а;
, / = !,..., я,
= 0,
откуда находим
с, =■
" 1
-и
(6.1.14)
140
Таким образом, в этом случае наблюдения входят в самую
точную оценку обратно пропорционально своей дисперсии: более точные
наблюдения входят с большим весом, более грубые наблюдения —
с меньшим весом.
Свойства оценок начальных моментов
Выше было показано, что оценка а = X первого начального
момента является состоятельной, несмещенной и эффективной
(в классе линейных несмещенных оценок) оценкой момента vb если
генеральная случайная величина имеет дисперсию с2.
Начальный момент и его оценка как функция от случайной
выборки имеют вид (к > 1):
vk = МХк, vA. = МХк = -УУ =хк . (6.1.15)
Если ввести случайную величину U = Л*, то для нее
рассматриваемый момент будет моментом первого порядка:
vk = МХк = MU,
поэтому оценка vk как оценка математического ожидания U обладает
следующими свойствами: состоятельна, не смещена и эффективна
в классе линейных относительно и, (или к-х степеней jc; ) оценок, если
существует дисперсия
DU = MU2 -(MU)2 =v2k -v2,
т.е. если существует у генеральной случайной величины X наряду
с моментом vh который оценивается, и момент v2b
Наличие этих свойств у оценок начальных моментов служит
теоретическим основанием метода моментов (см. гл. 7).
Свойства оценки дисперсии ч
Для случайной выборки оценка дисперсии [см. формулу (6.1.4)]
примет вид:
а2=11(*,-*)2- (6-1.16)
141
Изучение свойств этой оценки начнем с проверки на
несмещенность. Раскрыв квадрат под знаком суммы в уравнении (6.1.16), имеем:
Мд2 =~Y,(MX? -2М(Х.Х) + Х2). (6.1.17)
Найдем теперь каждое из слагаемых в скобках под знаком суммы:
MXf=DXi+(MXif =а2 + а2,
( , „ ^\
M(XtX) = M Х.-^Х,
MX? + £ MXiMXj
1 = 1
а 2
= — + а ,
п
МХ2 = М
л п л п
Y,MX?+ £ MXiMXj
<* 2
— + а .
Подставив найденные выражения в (6.1.17), имеем:
Мд2=а2-^ = ^а2,
п п
откуда видно, что оценка а2 имеет систематическое смещение (-о2/л),
т.е. эта оценка занижает в среднем истинное значение дисперсии
на а2/и. Правда, это смещение сходит на нет при п —» «©, т.е. оценка
асимптотически не смещена.
С целью устранения смещения скорректируем оценку
следующим образом:
п-\ «-l^f1 '
(6.1.18)
В самом деле,
Ms2= — M.g2=g2,
п-\
т.е. скорректированная оценка действительно не смещена.
Теперь перейдем к доказательству состоятельности s2. Для этого
понадобится утверждение: для состоятельности несмещенной оценки 8
142
достаточно, чтобы DQ —► 0. В самом деле, применим неравенство Че-
бышева к этой оценке, тогда для любого е > 0
я{|ё-е|Ц^.
Поскольку большая правая величина стремится к нулю, то левая
(меньшая) вероятность также стремится к нулю, а это и означает, что
0 =э 6, т.е. оценка 6 состоятельна.
Таким образом, для доказательства состоятельности достаточно
показать, что Ds2 —► 0.
Имеем:
Ds2 = Ms4 - (Ms2)2 = Ms4 - G4,
(6.1.19)
Ms4 = M.
r-.\2
— \1
{n-\)t~i
I(*/-Wy*)
1
£ [MXfx] - 2MX2XfX + MX2X2 - 2MX,X2X +
(и-1)\~'
+ 4MXtX,X2 - 2MX,X* + MX)X2 - 2MXfXl + MX4).
Найдем теперь каждое из девяти математических ожиданий
в скобках под знаком суммы (считая, что все X, уже центрированы, т.е.
MXj = 0. Это всегда можно сделать, поскольку в выражении (6.1.19)
используются разности X. - X , которые преобразуются в разности
центрированных величин Xi -X = Xi - X + a~a = (Xt-a)-(X -а).
Итак,
, , \MX4=[i4, i = j,
мх2х2=\ ' ^4 л
' ' [МХ2Х2=с\ i*j,
MX,
МХ2ХХ =-У МХ2Х,Х =
lx2=\ У ш2хх=\Уш2х2=^+(п~\)а\
1 = ./.
п
a4 . .
—, l*J,
I n
r.p~\
143
МХ(Х]Х = 1
n
l = J>
n
МХ,Х,Х2=^% MXiXiXrX„ =
" .-,,! = I
H4 , 3(*-l)a4
"•" 7 •> l J->
n n
~2
o\
i*j.
1
lw
м (и—4)a
n L J
,wr4 = -i- £ Л/Л;л>ГД,Ц[^ + 3(/1-1)а4].
W С /Л (f, I ~ I Я
Подставив полученные выражения в правую часть (6.1.19),
получаем (отдельно выписаны результаты суммирования по каждому
из девяти математических ожиданий):
Ms4 = 2"[«|a4 + «(«-l)a4-2|a4-2(«-l)a4+|n4 + («-l)a4-
(п-\)
л л/ i\ 4 4Ц4 12(/1-1) 4 2 6(«-1) 4 / ,ч 4
-2ц4-2(л-1)сг+-^4-+—^ ^-а —ц4—ь ;-<у+д4+(и-1)а -
п п п п
2 6(я-1) 4 Ц4 3(я-1) 4
п п п п
^ + —^ (я2-2я + 3).
и и(и-1)
Теперь окончательно получаем выражение для дисперсии:
п п[п~\)у ' п\ п~\ )
которая действительно стремится к нулю при п —» <*>, если существует ц.4.
Итак, оценка а2 состоятельна, если существует четвертый
центральный момент.
144
Соотношение между предельной ошибкой выборки,
риском и объемом выборки
Предельной ошибкой выборки А называется максимально
допустимое по модулю отклонение эмпирической характеристики
от теоретической.
Риском а называется вероятность того, что модуль отклонения
эмпирической характеристики от теоретической превысит предельную
ошибку
/,{|ё-е|>д} = а, (6.1.20)
тем самым вероятность противоположного события
р{|ё-е|<д} = 1-а.
(6.1.21)
Ниже под теоретической характеристикой будет
подразумеваться математическое ожидание а или вероятность р, а под эмпирической
характеристикой — оценка математического ожидания или
вероятности.
В первом случае
Р{\Х-а\$А} = \-а, (6.1.22)
поскольку MX -а , то под знаком модуля стоит уже центрированная
случайная величина, но поскольку дисперсия среднего
арифметического п независимых одинаково распределенных случайных величин
в п раз меньше дисперсии одного слагаемого:
f \^ „) |^„„ а2
DX = D
для нормирования делим обе части неравенства на a/ vw
Х-а
O/yfn
Дл/я
■ = 1-а.
Согласно следствию из центральной предельной теоремы
распределение центрированной и нормированной суммы независимых
одинаково распределенных случайных величин при п -^ оо стремится
к распределению стандартной нормальной величины, следовательно,
при достаточно больших п стандартную случайную величину под зна-
145
ком модуля можно приближенно заменить стандартной нормальной
величиной
Сравнив последнее выражение с определением двусторонних
критических границ стандартного нормального распределения
P{\z\<ua} = \-a, или Ф(иа) = (1-а)/2, (6.1.23)
Д^ (С 1 ПАЛ
иа = , (6.1.24)
G
это и есть искомое выражение.
Во втором случае оценкой вероятности является частость ц/л,
или среднее арифметическое альтернативных случайных величин, по-
/I
скольку биномиальная величина Д^У^Л^ (число положительных ис-
/ = i
ходов в п испытаниях) разлагается на сумму альтернативных, каждая
из которых представляет число положительных исходов в одном
испытании (т.е. О или 1). Поэтому при оценке вероятности формула
(6.1.22) принимает вид:
$Д =1-а, (6.1.25)
а вытекающее из этой формулы соотношение получается из формулы
(6.1.24) путем замены а на ^jp{\-p), поскольку последнее и есть
стандартное отклонение альтернативной случайной величины:
Д^ 1С. 1 ОЛЛ
"а= , (6.1.26)
JpV-p)
При использовании формул (6.1.24) и (6.1.26) необходимо
принимать во внимание следующие два обстоятельства:
1) объем выборки п должен быть достаточно большим,
по крайней мере несколько десятков, но лучше п > 100;
2) стандартное отклонение а (или yjр{\ - р)) должно быть
хотя бы приближенно известно.
146
Пример 6.1. Определить объем выборки для установления с
точностью ±0,03 доли стандартных изделий в большой партии при
допустимом риске 5%. Предполагаемая доля стандартных изделий — 0,9.
При а = 0,05 находим по табл. П. 4.1 критическую границу
стандартного нормального распределения ип = 1,96. Теперь
непосредственно по формуле (6.1.26) находим
;г_^/;(1-^)^(1,96)20,9.0,1=3^
А2 (0,03)2
6.2. ОЦЕНКА ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ И ПЛОТНОСТИ
Оценка функции распределения
Оценку функции распределения вероятностей получаем по тому
же принципу, который был применен при оценивании числовых
характеристик: оценкой функции распределения генеральной случайной
величины X служит функция распределения выборочной случайной
величины^ [см. формулу (6.1.2)]:
Fx(x) = Fx(x) =
0, -оо<х<Х|,
т
1, X, < X < с*>
£-*-, хк<х<хк+[,к = \,...,1-\, (6.2.1)
Эмпирическую выборочную функцию распределения можно
представить также в следующей форме:
Fx(x) = m(x)/n, (6.2.2)
где т(х) — число значений конкретной выборки jc,, ..., х„, меньших х.
На рисунке 6.1 приведен пример эмпирической функции
распределения.
При больших п выборочная функция распределения Fx(x)
близка к теоретической. Более точно это можно сформулировать так:
выборочная функция распределения Fx (х) в каждой точке х, -<» < х < «>,
рассматриваемая как функция случайной выборки, сходится по
вероятности к теоретической функции распределения в этой точке:
Fx(x)=>Fx(x). (6.2.3)
147
т
п
т,
п
чь.
п
т2
п
I I
I I
I I
I 1
Рис. 6.1. График эмпирической функции распределения вероятностей
В самом деле, обозначим
p = F,(x) = P{X<x},
тогда случайная выборка xt, ..., х„ порождает схему Бернулли, на
каждом шаге которой может произойти событие \Х, < х), i - I, ..., п,
или может случиться противоположное {X,> х\, причем прямое
событие на каждом шаге происходит с одинаковыми вероятностями
р = Р{Х,<х},
поскольку выборочные случайные величины Х„ распределены как
генеральная случайная величина.
Тогда значение эмпирической функции распределения в любой
точке х для конкретной выборки дг,, ..., х„ является отношением числа
положительных исходов (т.е. исходов, для которых X, < х) к общему
числу исходов п, а при переходе к случайной выборке Х]л ..., Х„
становится случайной величиной \1{х)/п, где \i(x) — биномиальная случайная
величина.
Согласно теореме Бернулли (см. гл. 4), частость \xJn сходится по
вероятности к вероятности, поэтому
FK(x) = ^-^p = P{X<x}=Fx(x),
п
т.е. Fx(х) => Fx (х), что и требовалось доказать.
Оценка функции плотности
Функция плотности оценивается с помощью гистограммы. Под
гистограммой понимается столбчатая фигура, построенная
следующим образом. Вся числовая прямая разбивается на /
непересекающихся полуинтервалов А, = [b,-b b), i = 1, ..., /, bQ = -°°, b, - «>,
по конкретной выборке хь ..., х„ подсчитывается число наблюдений тп
/ = 1,..., /, попавших в каждый полуинтервал. Затем над каждым полу-
148
интервалом строится прямоугольник, площадь которого
пропорциональна Ш/.
Точно так же, как и выше, можно доказать, что частости
попадания на полуинтервалы сходятся по вероятности к соответствующим
вероятностям
Л,
^-=э I fx(x)dx = P{bi_<<X<bi}.
При подходящем подборе полуинтервалов гистограмма будет
напоминать график функции плотности /a<jc).
Если известно, что плотность отлична от нуля только на
некотором отрезке, то полуинтервалы можно и желательно выбирать
одинаковой длины Д, а площади прямоугольников — равными часто-
стям mln, поэтому вся площадь под гистограммой будет равна
единице. На рисунке 6.2 показан пример именно такой гистограммы.
Ь2 Ьэ £>4
Рис. 6.2. Гистограмма
ВОПРОСЫ И ЗАДАЧИ
Для установления срока службы испытано на продолжительность
непрерывной работы 125 изделий. При этом средний срок службы
оказался равным 19,5 месяца, а дисперсия равна 2,25;
а) с вероятностью 0,683 определить, в каких пределах находится
теоретический средний срок службы изделий;
б) с какой вероятностью можно утверждать, что модуль отклонения
эмпирического среднего не превысит 0,3 месяца?
в) сколько нужно провести испытаний, чтобы модуль отклонения
не превысил 0,5 месяца с вероятностью 0,9973?
149
2. Сколько нужно провести испытаний, чтобы частость отличалась
от вероятности, равной 0,7, не более чем на 0,05 при риске 0,008?
3. При измерении диаметра детали одним прибором установлен средний
диаметр Зсt = 10 мк, и, = 8, при измерении другим прибором — х2 -
= 12 мк, п2= 16. Определить наиболее точную оценку диаметра по
измерениям двух приборов, если а, = 0,5 мк, о: = 1 мк.
4. Рост десяти наугад отобранных студентов-юношей оказался
следующим (в см): 156, 162, 170, 177, 180, 181, 183, 196, 199, 201. Найти
несмещенные оценки математического ожидания и дисперсии.
5. Как оценить по выборке медиану?
6. Сколько нужно опросить респондентов, чтобы средняя доля тех, кто
положительно ответил на поставленный вопрос, отличалась по модулю
от соответствующей доли не более чем на 0,03 при риске 0,05, если
экспертная оценка указанной доли равна 0,7?
7. Для определения средней заработной платы работников определенной
отрасли было обследовано 100 чел. Результаты представлены в
следующей таблице (данные условные):
Зарплата
в долларах
190-192
192-194
194-196
196-198
198—200
Число
человек
1
5
9
22
28
Зарплата
в долларах
200-202
202-204
204-206
206-208
Число
человек
19
11
4
1
Построить гистограмму и график эмпирической функции
распределения, найти оценки математического ожидания и дисперсии зарплаты
наугад взятого работника.
8. Докажите, что в случае нормального распределения случайной
величины А'дисперсии оценок DXтаковы: Da2 = = , a Ds2 = .
п п-1
ГЛАВА7
ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ
Имеется два подхода к оцениванию неизвестных параметров
распределений по наблюдениям: точечный и интервальный. Точечный
указывает лишь отдельное значение, приближенно равное истинному
значению параметра; при интервальном находят случайный интервал,
который с некоторой, как правило, большой, вероятностью, задаваемой
исследователем, накроет неизвестное числовое значение параметра.
В главе рассматриваются методы точечного оценивания параметров;
строятся интервальные оценки параметров нормального
распределения, обсуждается общий подход к интервальному оцениванию
параметров распределений, отличных от нормального.
7.1. МЕТОД МОМЕНТОВ
Метод моментов является одним из методов точечного
оценивания параметров распределений.
Пусть чакон распределения случайной величины X известен с
точностью до числовых значений его параметров 6h 62 6*. Это означает,
что известен вид функции плотности f^x, 0), где 0 = (6|, 62,..., 6;), если X
непрерывна (известен вид функции вероятности Р(Х = х, 0), если
А'дискретна), но числовые значения к параметров неизвестны. Найдем оценку
А /А А А \
0 = 16р62,...,6^ I параметра0,располагая выборкойхьх2, ...,хп.
Допустим, что существует к начальных моментов, каждый
из которых можно выразить через 0 (без ограничения общности
можно рассматривать только начальные моменты, так как центральные
моменты являются функциями начальных). Пусть такими моментами
будут первый, второй, ..., к-й: v,, v2, ..., vk (что вовсе не обязательно).
Выразим каждый из них через 0:
v =g (е)~
т от \ t
m = l,2,...,&.
^х'"Р(X = х,0), если X дискретна,
X
(7.1.1)
j хт fx (х, ®)dx, если X непрерывна,
151
Заметим, что в системе
vH1 = gw(e,,e2>...,0t),m= 1,2, ...Д, (7.1.2)
число уравнений должно быть равным числу к оцениваемых
параметров. Найдем решение системы (7.1.2). Выразив каждый параметр 6„,
через V], v2,..., vk, получим:
9»« = AOT(v„ v2,..., vk), /и = 1, 2, ...Д. (7.1.3)
Свойство состоятельности выборочных начальных моментов
(см. § 6.1) является основанием для замены в уравнениях (7.1.3)
теоретических моментов v,, v2, ..., vA на вычисленные при большом п
выборочные моменты 0(, v2,..., vA. .
Оценками метода моментов параметров 0,, 62,..., 0А. называются
оценки
■e(Bf)=*w(01,v2,...,0A),m = l,2,...,A:, (7.1.4)
где
*>=5>/Л», ./=1.2, ...,*.
Вопрос о том, какие начальные моменты включать в систему (7.1.2),
следует решать, руководствуясь конкретными целями исследования
и сравнительной простотой форм зависимостей моментов от
параметров. В статистической практике дело редко доходит даже до
четвертых моментов.
Пример 7.1. Нахождение оценок параметров нормального
распределения методом моментов. Случайная величина Х~ N{a, о), при этом
числовые значения параметров а и а2 неизвестны. Найдем оценки
метода моментов для этих параметров.
Используя формулу (7.1.1), выразим моменты v, и v2 через о и а2:
v = f х™ . е 2^ ° J dx, т = 1,2;
I Vw
(v, = а) П (v2 — а2 + о2) — таков вид системы (7.1.2) в данном примере.
Решив ее относительно аио2, получим: а - Vj, с2 = v2 - Vj . Отсюда
оценки метода моментов:
1 "
а(М) = у, = — У\х, =х — это оценка математического ожидания я;
i/i i/i -
а ' = v2-v, =->■*,•-(*) = — УЛ-*/"*) = (У~ — это °Ценка
дисперсии <Т.
152
Отмеченная ранее некоторая неопределенность выбора
начальных моментов может привести к получению различных оценок одного
и того же параметра.
Пример 7.2. Нахождение оценки параметра распределения
Пуассона методом моментов. Случайная величина X имеет распределение
Пуассона:
Xх
Р(Х=х) = -—-е~ , х = 0, 1, 2, ...; X > 0. Найдем оценку параметра
х\
X для двух вариантов:
а) в качестве начального момента возьмем v,; получим:
; = I
х\ п:
б) в качестве начального момента возьмем v2; получим:
„ х' 2
. MjX-i г—
i(M).V1+4°2-' V "^ Jl + 4;r2-l _
Л — — — Фх.
2 2 2
Оценки — разные. Конечно, предпочтительнее первая; Х = х как
более простая и соответствующая смыслу параметра пуассоновского
распределения: X = MX, поэтому за А. естественно принять х —
хорошую точечную оценку математического ожидания (см. § 6.1).
Однако не все получаемые методом моментов оценки обладают
свойствами «хорошей оценки». Так, полученная в примере 7.1 оценка
1 " — 2
а2 = — чУ.(Х1. - Х) дисперсии а2 не обладает свойством несмещенно-
сти (см. § 6.1); а2 является асимптотически несмещенной оценкой:
ИтЛ/62 =Нт а2 =а2, т.е. при больших п можно считать, что а2
не смещена относительно а2.
Приведем без доказательства теорему о функциях от моментов,
из которой вытекают некоторые свойства оценок метода моментов.
153
Предположим, что 0,t (индекс означает зависимость 0 от
объема выборки п) — функция двух выборочных моментов vk и
vm : 0,t = h(vk, vm ), не содержащая явно п. Пусть 9 = h(vk, v,„), где vk =
= Mvk, a v,„ = Mvm (последние два равенства верны в силу свойства
несмещенности выборочных начальных моментов),
dh
dh
Теорема утверждает: если в некоторой окрестности точки (vh v,„)
функция h непрерывна со своими первыми и вторыми производными, то
при больших п распределение случайной величины 0;/ =h{vk, vw) близко
к нормальному (0;; имеет асимптотически нормальное распределение)
с математическим ожиданием, равным 0, и дисперсией, равной
D(vk)h2k+2cov(vk,vm)hkhnl + D(vJh2ni=c2(Q)/ п, (7.1.5)
где с2(0) — некоторая постоянная, зависящая от 0. (Теорему можно
распространить на любое количество моментов — аргументов функции п.)
Из теоремы вытекает, что при выполнений достаточно общих
условий оценка метода моментов 0^} при больших п удовлетворяет
следующим соотношениям:
М)(„М)=0, (7.1.6)
т.е. оценка метода моментов является асимптотически несмещенной,
Ш!,М)=с2(0)/«. (7.1.7)
Убедимся в том, что 0„ ' обладает свойством состоятельности.
Действительно, неравенство Чебышева для величины ¥пм) при
больших п, с учетом формул (7.1.6) и (7.1.7), примет вид:
Vl ' ' £ п£
отсюда получим, что при п —>°° Р\№„М) -9 <е) —» 1.
154
Введем понятие эффективности и асимптотической
эффективности несмещенной оценки скалярного параметра 8.
Эффективностью е(дп) несмещенной оценки 6„ параметра 0
называют отношение minD0„ — минимально возможного значения
Й„ е S
дисперсии оценки в классе S всех несмещенных оценок параметра 0
к дисперсии Ddn рассматриваемой оценки. Если функция плотности
fx (х, 0) [функция вероятности Р(Х = х, 0)] удовлетворяет достаточно
общим условиям регулярности: дифференцируемое™ по 0,
независимости области определения от 0 и т.д., то имеет место неравенство
Рао—Крамера— Фреше:
DQ >—— = ттЯё„, (7.1.8)
" /7/(0) M.v "
где /(8) — количество информации о параметре 8, содержащееся в
единичном наблюдении, определяется соотношением
/(9)=Aff<//w^e(jr'9)Y (7.1.9)
(/(8) — некоторая постоянная, зависящая от 8). Поэтому
e(Q„) = -^minDQ= ^^<1; (7.1.10)
v ; D9„ е. е.? »/(8)D8„
если <?(в,() = 1, то 8„ — эффективная оценка параметра 8 в классе 5 всех
его несмещенных оценок.
Асимптотической эффективностью оценки 0Л называют
величину
eQ(Q,,)=bme(Q„)<\; (7.1.11)
если е()(8(1] = 1, то 8(/ —асимптотически эффективная оценка
(очевидно, что эффективная оценка будет и асимптотически
эффективной). Найдем выражение для асимптотической эффективности оценки
д[м). Так как при больших п оценку д[М) можно считать
несмещенной, то с учетом формул (7.1.11), (7.1.10) и (7.1.7) получим
еЛё^») = lim *(§<">) = lim Ц- = L—.
Ч ) „^ V ) »^nl{^)D^n /(0)с2(0)
155
распределения, 1(a) - М\ ' ) '— | -— , получим, что е(Х) = 1
Пример 1.3. Доказательство эффективности оценки параметра а
нормального распределения. Убедимся в том, что найденная методом
моментов по случайной выборке из генеральной совокупности Х~
~ N(a, с) оценка X параметра а является эффективной в классе
несмещенных оценок, а оценка &~ параметра сг является, после
исключения смещения, асимптотически эффективной.
Оценка X — несмещенная, и DX = а2 /п. Предположив, что о2
известна, и используя формулу (7.1.10), в которой, с учетом нормальности
J\nj\,(x,arf _ 1
da ) а2
Следовательно, X — эффективная оценка.
Оценка а2 — смещенная; исключив смещение, получим оценку
2 Ь2п tC ] „ ,_ 2 2а4 .
s = - = ■- -- , дисперсия которой us = (см. задачу 8
/1 — 1 п -\ п — 1
гл. 6).
Предположив, что а известно, и используя выражение (7.1.10),
в котором, с учетом нормальности распределения, /(а2) =
dln/,(jC,CT2)Y 1 ,, , 2л
, получим, что эффективность e(s ) =
= М
do' J 2а
= <!, а асимптотическая эффективность e()(.v )=lime(s )=1.
Слсдоватсльно, s2 — асимптотически эффективная оценка.
Замечание. Несмещенной и эффективной оценкой дисперсии
является используемая при известном значении параметра а оценка s0 =
=Х(** ~ а)2 г'так как Mv°2 = °2' Ds* = 2су4 /п и е^)= ] '
При выполнении достаточно общих условий все три оценки: а , s2
и s,. состоятельны.
В приведенном примере оценка метода моментов X является
эффективной, a s2 — асимптотически эффективной. Однако подобные
примеры скорее исключение: гораздо чаще оценки метода моментов
с точки зрения эффективности не являются наилучшими из
возможных даже при больших п. Р. Фишер показал, что асимптотическая
эффективность этих оценок часто значительно меньше единицы. Асимп-
156
тотически эффективные оценки могут быть получены методом
максимального правдоподобия.
7.2. МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
В основе метода максимального правдоподобия лежит понятие
функции правдоподобия. Пусть X = (Хь Х2, ..., А',,) — случайная, а х =
- (jq, х2, ..., jc„) — конкретная выборка из генеральной совокупности X.
Напомним, случайной называют выборку, удовлетворяющую
следующим условиям:
♦ случайные величины ХЬХ2,..., Х„ независимы, т.е.
( п
Р| (X,.= х,-) = YIР (xi= xi)' если Х Дискретна; (7.2.1)
/ = i ) i■ = i
/^ х л (*,, jc2,..., *„) = П fx (а:,),, если Xнепрерывна. (7.2.2)
( = 1
♦ распределение каждой из величин Xt совпадает с
распределением величины X, т.е. при i~ 1,2,..., п
P(Xj = х) = Р(Х = х), если Xдискретна;
/v (x)~f\(x) > если Xнепрерывна.
(7.2.3)
(7.2.4)
Функция правдоподобия — это функция L(x, 0), значение
которой в точке х определяется соотношением:
если X дискретна;
Цл:,0) =
QcnnX непрерывна.
( = i
( = i
Из определения следует: чем вероятнее (чем правдоподобнее)
при фиксированном 0 набор х, тем больше значение функции
правдоподобия L(x, 0), отсюда и ее название.
157
Итак,
Y\ Р (X = Xj, 0), если X дискретна;
Цл:,0) = ^ ' (7.2.5)
ГТ/л-(*,ч®)> если А' непрерывна.
j = \
Согласно методу максимального правдоподобия, оценка
максимального правдоподобия 0(Г1> = (ejri>,e^11*,...,9^Г1>,] параметра 0 =
= (9,, 92,..., 6Д при заданном наборе х определяется из условия:
Цлг, 0(П)) = max 1{х, 0), (7.2.6)
ве{Э\
где {©[ — область допустимых значений для 0.
Естественность такого подхода к определению оценки 0(11)
вытекает из смысла функции L: при фиксированном 0 функция L(x, 0) —
мера правдоподобия набора дг; поэтому, изменяя 0, можно проследить,
при каких его значениях набор дг является более правдоподобным,
а при каких — менее, и выбрать такое значение 0<П), при котором
имеющийся набор л: будет наиболее правдоподобным.
В ряде случаев 0(П) удобнее определять из условия:
InЦлг, 0([|)) = max In Цх,0), (7.2.7)
0е {0}
идентичного условию (7.2.6): если вместо функции L взять In L, точка
максимума не изменится. Функцию In L (лс, 0) называют
логарифмической функцией правдоподобия.
Согласно формуле (7.2.7), для нахождения 0(,1) следует:
♦ найти решения системы уравнений максимального
правдоподобия
Э1пЦдг,в) 2
эе,.
при этом решением считается лишь такой набор 0* =
= (б), 82,..., 6^ J, удовлетворяющий (7.2.8), в котором каждое
* „
8; действительно зависит отдг;
♦ среди решений, лежащих внутри области {0}, выделить
точки максимума;
158
♦ если система (7.2.8) не определена, не разрешима или если
среди ее решений нет точки максимума внутри {0}, то точку
максимума следует искать на границе области {0}.
Пример 7.4. Нахождение оценок параметров нормального
распределения методом максимального правдоподобия. Найдем методом
максимального правдоподобия оценки параметров а и b = о2 нормального
распределения. Согласно формуле (7.2.5), функция правдоподобия
(*/-а)2
2Ь
yj2Kb
ехр
L(x, а, Ь) =ГГ . ехр
логарифмическая функция правдоподобия
_у _(*-«О2
1Ъ
2Ъ
Частные производные:
~da~~h b ' db ~~2b + £i 2b2
Система (7.2.8) примет вид:
или <
П - /
Х(х,-а) Ь = п
Li'=i
па
i(x,-af/b=n.
Ее решение:
U=!
-\2
а =х, b =2^(х/-х) /n=G
Проверим достаточные условия максимума функции In L в точке
(а*, Ь*). Найдем:
Э21п1
j2
*\2
Э21п!
Л=-
да2
-_А o_^2lnZ-
"а2' ~ ЭаЭб
= 0,
С =
db2
(« .л )
2(* )2 ЙГ ((,')' 2о4 2S6
так как Д > 0, а А < 0, то точка (а* = х , Ь* - с2) является точкой
максимума функции In L. Поэтому оценки максимального правдоподобия
а(П> = х , 62(П> = О2. Оценки совпали с оценками метода моментов.
159
Пример 7.5. Нахождение методом максимального правдоподобия
оценок параметров а и Ъ равномерного на отрезке [а, Ь]
распределения. Согласно формуле (7.2.5), функция правдоподобия
Цх, а, Ь) = 1/(6 -а)", если xte[a,b], i = 1, 2, ...,п.
Система (7.2.8) не имеет решения относительно а и Ь. Оценки а(П) и
/гП) следует искать на границе области допустимых значений для а и 6:
№ = (а<х(п)П(Ь>х[п)),
где*,,) = min(X|, х2,.... -v„), а х{11) = max(.vh х2, ...,.*,,).
Тогда условие (7.2.6) примет вид:
1 1
= max- — .
(#П) _-(!.>)" «^...(б-«)"
Так как функция L(a, b) — \l{b - а)" возрастает при возрастании а
и убывании 6, то ее максимум на области {0} достигается в точке
(а(,,) = х(1),6(,,) = х^ I. Это и будут оценки максимального
правдоподобия параметров а и 6 равномерного на отрезке [а, Ь] распределения
(эти оценки отличаются от оценок а = х - av3 , b = х + GV3 , которые
можно получить методом моментов при использовании первого и
второго начальных моментов).
Пример 7.6. Нахождение методом максимального правдоподобия
оценки вероятности р успеха в единичном испытании. Случайная
величина X — число успехов в единичном испытании: Р(Х = х) = р"(\ -
-р)1 \ х - О,1; р — вероятность успеха в единичном испытании.
Найдем оценку максимального правдоподобия р^' , располагая выборкой
х = (л,, х2, ..., л*„), где х,— число успехов в с'-м испытании.
Согласно формуле (7.2.5), L(x,p)=Y\P{X=Xj,p) = P*' О-/?)" f?*'\
i=i
п f п \ d In L
lnZ,(*,p)=Vjc.lnp+ и-Vjc. ln(l-p). Решив уравнение - = 0,
. 1 ^ d2 In L
найдем p =-2_,xi , а так как
"м ' ФР
< О, то оценка
160
p(ll) =—y\xi =— , где m — число успехов в п испытаниях Бернулли (та-
кую же оценку можно получить и методом моментов). Эта оценка
состоятельная, несмещенная и, в чем нетрудно убедиться, эффективная.
Отмеченная выше естественность определения оценок
максимального правдоподобия из условия (7.2.6) подкрепляется их
хорошими свойствами. Если функция плотности fx (х, 9) (функция
вероятности Р (X = л\ 9), если X дискретна) удовлетворяет достаточно общим
условиям регулярности, оценка максимального правдоподобия 9(П)
имеет при больших п распределение, близкое к нормальному с
математическим ожиданием, равным 9, и дисперсией, равной 1/[л/(9)], где
/(9) определяется соотношением (7.1.9), является состоятельной,
асимптотически несмещенной и асимптотически эффективной; более
того, если существует эффективная оценка параметра, она будет
единственным решением уравнения максимального правдоподобия.
Кроме описанных методов оценивания параметров существует
ряд других, например метод наименьших квадратов, согласно
которому оценка 9 параметра 9 находится из условия:
Z(*,-9)2=min£(*,.-9)2. (7.2.9)
;=1 (=]
Обратим внимание на то, что при оценивании математического
ожидания нормального распределения с известным значением
дисперсии условие (7.2.9) идентично условию метода максимального
правдоподобия (7.2.6).
В последние годы развиваются так называемые робастные, или
устойчивые, методы оценивания, позволяющие находить оценки, хотя
и не являющиеся наилучшими в рамках предполагаемого закона
распределения, но обладающие достаточно устойчивыми свойствами при
отклонении реального закона от предполагаемого.
7.3. ПОНЯТИЕ ИНТЕРВАЛЬНОЙ ОЦЕНКИ.
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Вычисленная на основе выборки оценка 9 является лишь
приближением к неизвестному значению параметра 9 даже в том случае,
когда эта оценка состоятельная, несмещенная и эффективная. Возни-
161
кает вопрос: нельзя ли указать такой случайный интервал (0,, 02),
который с заранее заданной близкой к единице вероятностью 1 - а
накроет неизвестное значение параметра 0. Интервал (0,, 02) называют
интервальной оценкой параметра 0, или доверительным интервалом; 0(,
02 — нижней и верхней доверительными границами; 1 - а —
надежностью интервальной оценки, или доверительной вероятностью. Выбор
доверительной вероятности определяется конкретными -условиями;
обычно используются значения 1 - ос, равные 0,90; 0,95; 0,99.
Если интервальная оценка имеет вид:
(§ + Д,ё-А) (7.3.1)
где 0 — точечтная оценка параметра 0 (т.е. с вероятностью 1 - а
выполняется неравенство 0 - 0 < А), то Д называют ошибкой оценки 0 .
В формуле (7.3.1) границы доверительного интервала
симметричны относительно точечной оценки. Однако не всегда удается
построить интервал, обладающий таким свойством. Для получения
доверительного интервала наименьшей длины при заданном объеме
выборки п и заданной доверительной вероятности 1 - а в качестве
оценки 0 параметра 0 следует брать эффективную или асимптотически
эффективную оценку.
Существует два подхода к построению доверительных интервалов.
Первый подход, если его удается реализовать, позволяет строить
доверительные интервалы при каждом конечном объеме выборки п. Он
основан на подборе такой функции \|/(0,0), называемой в дальнейшем
статистикой, чтобы:
ее закон распределения был известен и не зависел от 0;
функция \j/(0,0) была непрерывной и строго монотонной по 0.
Задавшись доверительной вероятностью 1 - а, находят
двусторонние критические границы \|/а и \j/a, отвечающие вероятности а.
Тогда с вероятностью 1 - а выполняется неравенство
\j/a<\|/(0,0)<ij/a. (7.3.2)
Решив это неравенство относительно 0, находят границы
доверительного интервала для 0. Если плотность распределения статисти-
162
ки \j/(6,6) симметрична относительно оси Оу, то доверительный
интервал обычно симметричен относительно 9.
Второй подход, получивший название асимптотического
подхода, более универсален; однако он использует асимптотические
свойства точечных оценок и поэтому пригоден лишь при достаточно
больших объемах выборки.
Рассмотрим первый подход на примерах доверительного
оценивания параметров нормального распределения.
Интервальная оценка математического ожидания при
известной дисперсии. Итак, X ~ N(a, а), причем значение параметра а не
известно, а значение дисперсии а2 известно.
При X ~ N{a, а) эффективной оценкой параметра а является X,
при этом X - N{a, с/л/п). Статистика Z = т=- имеет распределе-
CF/Vw
ние N(0, 1), не зависящее от параметра а, и как функция параметра а.
непрерывна и строго монотонна. Следовательно, с учетом неравенства
(7.3.2) и симметричности двусторонних критических границ
распределения /V(0; 1) будем иметь:
P{-ua<Z< иа)= 1 -сс.
Х-а
Решая неравенство -иа < j= < ип относительно а, получим,
а/л/и
что с вероятностью 1 - а выполняется неравенство
X — uaG /yjn < а < X + uaG /y[7i. (7.3.3)
при этом
Д = м„ст/>/й, (7.3.4)
что соответствует результату (6.1.24); число иа находят по табл. П. 6.1
из условия Ф(иа) = (1 - сс)/2.
Замечание. Если п велико, оценку (7.3.3) можно использовать
и при отсутствии нормального распределения величины X, так как
в силу следствия из центральной предельной теЬремы при случайной
выборке большого объема п
^=^«Z~tf(0;l).
a/Vfl
163
В частности, если X = )1, где )1 — случайное число успехов
в большом числе п испытаний Бернулли, то
\ifn-p
yjpq/n
-Z
и с вероятностью = 1 - а для вероятности р успеха в единичном
испытании выполняется неравенство
\l/п-иа^pq/п < р<\i/п + иа^pq/п . (7.3.5)
Заменяя значения р и q = 1-рв левой и правой частях
неравенства (7.3.5) их оценками p = [i/n и q = ]-p, что допустимо при
большом п, получим приближенный доверительный интервал для
вероятности/?:
p-uaylP4/n<p<p + ua^pq/n . (7.3.6)
Задача 7.1. Фирма коммунального хозяйства желает на основе
выборки оценить среднюю квартплату за квартиры определенного типа
с надежностью не менее 99% и ошибкой, меньшей 10 д.е. Предполагая,
что квартплата имеет нормальное распределение со средним
квадратичным отклонением, равным 35 д.е., найдите минимальный объем
выборки.
Решение. По условию требуется найти такое и, при котором
/>(|Лг-я|< 101>0,99 , где а и X — генеральное и выборочное
средние.
Приравняв 1 - а = 0,99, по табл. П. 6.1 найдем число н(Л при
котором: Ф(и„) = (1 - ос)/2 = 0,495; ц|(Н = 2,6. При А = 10 и О" = 35 из форму-
лы (7.3.4) получим п-——-— = 82,81. Но так как с ростом 1 - ос
А"
и уменьшением А растет п, то п > 82,81 и птт = 83.
Интервальная оценка математического ожидания при
неизвестной дисперсии. Итак, Х~ N(a, а), причем числовые значения ни а,
ни а2 не известны. По случайной выборке найдем эффективную оцен-
_ 1 " — 2
ку параметра а: X и оценку л = 2-Х^>~^) паРаметРа (^-
л-1 ,=|
164
Построение интервальной оценки для а основано на статистике
, ,ч Х-а „
t[n—\) — т=, которая при случайной выборке из генеральной сово-
s/y/n
купности X ~ N{a, о) имеет распределение Стьюдента с (п - 1)
степенью свободы [22], не зависящее от а, и как функция параметра а
непрерывна и строго монотонна.
С учетом неравенства (7.3.2) и симметричности двусторонних
критических границ распределения Стьюдента будем иметь:
P{-ta < t{n - 1) < ta) = 1 - а.
Х-а
Решая неравенство -/а < /=<'« относительно а, получим,
что с вероятностью 1 - а выполняется неравенство
X-tas/yfn<a<X + tas/yfn (7.3.7)
и ошибка оценки X при неизвестном значении параметра о2
A = tas/^, (7.3.8)
где число ta находят по табл. П. 6.2 при к = п-\ ир = а.
Замечание. При к = п - 1 > 30 случайная величина t (к) имеет
распределение, близкое к /V(0; 1), поэтому с вероятностью = 1 - а
X-uas/y[n<a<X + uas/Jn, (7.3.9)
гдеФ(ма) = (1 -а)/2.
Задача 7.2. Для отрасли, включающей 1200 фирм, составлена
случайная выборка из 19 фирм. По выборке оказалось, что в фирме
в среднем работают 77,5 человек при среднем квадратичном
отклонении s - 25 человек. Пользуясь 95%-ным доверительным интервалом,
оцените среднее число работающих в фирме по всей отрасли и общее
число работающих в отрасли. Предполагается, что количество
работников фирмы имеет нормальное распределение.
Решение. При к = п - \ = 18ир = а= 1 - 0,95 = 0,05 найдем
в табл. П. 6.2 t(m = 2,10. Доверительный интервал (7.3.7) примет вид:
(65,5; 89,5); с вероятностью 95% можно ожидать, что этот интервал
накроет среднее число работающих в фирме по всей отрасли. Тогда
доверительный интервал для числа работающих в отрасли в целом таков:
(1200-65,5; 1200-89,5).
165
Интервальная оценка дисперсии (среднего квадратичного
отклонения) при известном математическом ожидании. Эффективной
1 "
оценкой дисперсии в этом случае является Sq = — ^(Л"; -а) .
п i=i
Используются два варианта интервальной оценки для а2(а).
1. Основу первого варианта составляет статистика
X2(n) = ns20/c2, (7.3.10)
которая имеет распределение %2 с п степенями свободы, не зависящее
от параметра о2, и как функция параметра G2 > 0 непрерывна и строго
монотонна.
Следовательно, с учетом неравенства (7.3.2) будем иметь:
^(Й<)С2И<ХаН-а>
где х« и х« — двусторонние критические границы ^-распределения с
п степенями свободы.
-о2
2 nSn 2 ">
Решая неравенство ха <—j-<Xa относительно <т, получим,
что с вероятностью 1 - а выполняется неравенство
2
^ <az<^f (7.3.11)
—-< а ^
^2 „.2
и с такой же вероятностью выполняется неравенство
yl"4/xl<G<\l"4/xL • (7.3.12)
Числа Ха и Ха находят по табл. П. 6.3 при А: = п и
соответственно при р = а/2 и р = 1 - а/2. Интервальная оценка (7.3.12) не
симметрична относительно s0.
2. Второй вариант предполагает нахождение интервальной
оценки для а при заданной надежности 1 - ос в виде
*0 max(0; 1 - 6а) < а < s0 (1 + 8а). (7.3.13)
При 0 < 5а < 1 границы этой оценки симметричны
относительно s0 и ошибка оценки s0, гарантируемая с вероятностью 1 - а,
А = Л- (7.3.14)
166
Как найти 5а? Решая неравенство (7.3.13) относительно /w2/a2,
получим, что с вероятностью 1 - а выполняется неравенство
" <4< ^-^т, (7.3.15)
(1+8J2 о2 max2(0;l-SJ
или, учитывая формулу (7.3.10) и заменив п на к, а а нар,
( \
—^-Г<Х2(*)< 2,* g v =1-р. (7-3.16)
v(1 + 5p)2 max2(0;l-8p)J
Значения 6^, удовлетворяющие равенству (7.3.16), при
различных р и к приведены в табл. П. 6.6. Итак,
Fornax2 (0;1-8а)< а2 <*02 (1 + 5а)2) = 1-сс, (7.3.17)
где 8а — число, найденное в табл. П. 6.6 при к = ппр- а.
Интервальная оценка дисперсии (среднего квадратичного
отклонения) при неизвестном математическом ожидании. Наилучшей
точечной оценкой дисперсии в этом случае является л2 =
1 " — 2
= Х(^/~^) ' и построение интервальной оценки для а2 осно-
п " 1 /=!
вано на статистике х2(« - 1) = (п - 1)А,2/а:, которая при случайной
выборке из генеральной совокупности X ~ N(a, а) имеет распределение
X2 с {п - 1) степенью свободы [22J.
Проделав выкладки для величины х2(п ~ 0> подобные
выкладкам при известном математическом ожидании, получим два варианта
интервальной оценки для а2 (а):
(n-\)s2 2 (и-1)
2\
<а <
ла ла
= 1-а, (7.3.18)
^(V(«-1)^73Ca<^<V("-l)^/Xa) = 1-«J С7'3'19)
где числа х« и Ха находят по табл. П. 6.3 при к ~ п - \ и
соответственно при р = а/2 и р = 1 - а/2.
2. />(.s2max2(0;l-8a)<a2<.s2(l + 6a)2) = l-a, (7.3.20)
/>(.smax(0;l-8a)<a<.s(l + 8a)) = l-a, (7.3.21)
167
при этом ошибка оценки s, гарантируемая с вероятностью 1 - а,
Д = я5а; (7.3.22)
число 8а находят по табл. П. 6.6 при к ~ п- 1 и /? = ос.
Замечание. При к = п - 1 > 30 случайная величина у?{к) имеет
распределение, близкое к N поэтому с
вероятностью = 1 - ос
2(,/-1).у2 2 2(/7-1)52
<а < —~~7' (7.3.23)
(>/2л-3+и(Х) (^2я-3-иа)
гдеФ(ы„) = (1 -а)/2.
Задача 7.3. Вариация ежесуточного дохода случайно выбранных
10 киосков некоторой фирмы, измеренная величиной
s— \ У_.{х ~х) » где х, — доход /-го киоска, оказалась равной
100 д.е. Найдите такое А, при котором с надежностью 90% можно
гарантировать, что вариация дохода по всем киоскам фирмы, измеренная
средним квадратичным отклонением а, не выйдет за пределы 100 + А.
Предполагается, что доход — нормально распределенная величина.
Решение. Так как средний доход киоска по всей фирме не известен
и интервал для <т должен быть симметричным относительно .у, для
расчета ошибки оценки s при 1 — а = 0,9 воспользуемся формулой (7.3.22).
При к = 9 и р = а = 0,1 по табл. П. 6.6 найдем 801 - 0,476; тогда
А = 47,6, С надежностью 90% можно ожидать, что интервал 100 + 47,6
накроет а.
Задача 7.4. Пользуясь 90%-ным доверительным интервалом,
оцените в условиях задачи 7.2 среднее квадратическое отклонение
работающих в фирме по всей отрасли.
Решение. По условию п = \9, s = 25, \ - а = 0,9. Найдем два
варианта доверительного интервала:
1. Согласно формуле (7.3.19),
7l8-257xoj <CT<7l8-252/xo,i ,
а так как при к = п - 1 = 18 %1,\ = 28,87, а %1,\ = 9»39 (см. табл. П. 6.3),
то 90%-ный доверительный интервал такой (19,740; 34,613); интервал не
симметричен относительно s.
168
2. Согласно формуле (7.3.21),
25 max(0; 1 - 5,,,) < а < 25(1 + 5(U),
а так как при к = п - \— 18, б(,, = 0,297 (см. табл. П. 6.6), то с
вероятностью 0,9 17,575 < а< 32,425 — эта оценка симметрична
относительно 5. Она, как и следовало ожидать, отличается от предыдущей
интервальной оценки.
7.4. АСИМПТОТИЧЕСКИЙ ПОДХОД
К ИНТЕРВАЛЬНОМУ ОЦЕНИВАНИЮ
С примерами интервальных оценок, имеющих место только при
больших объемах выборок, мы уже сталкивались. Так, если
распределение случайной величины X отлично от нормального, но п велико,
то с вероятностью ~ 1 - а интервальная оценка для математического
ожидания имеет вид неравенства (7.3.3); с вероятностью = 1 - ос
интервальная оценка вероятности р при больших п имеет вид
неравенства (7.3.6) и т.д. [см. неравенства (7.3.9), (7.3.23)].
Рассмотрим асимптотический подход в общем случае.
В § 7.1 и § 7.2 было установлено, что при выполнении
достаточно общих условий оценка 0И параметра Э, полученная или методом
моментов или методом максимального правдоподобия, имеет
асимптотически нормальное распределение и является асимптотически
несмещенной, т.е. при больших п оценка Э„ - N (6, у £>§„ I. Однако
в отличие от ситуации, когда дисперсия DX оценки
X~N\a,ylDX =a/Vfl) предполагалась известной, в общем случае
дисперсия £>9„ оценки 0^ зависит от оцениваемого неизвестного
параметра Э:
яё;|=с2(е)/«. (7.4.1)
Поэтому напрямую первый подход к доверительному
оцениванию неприемлем.
Поставим вопрос так: нельзя ли преобразовать оценку 0 в g =
неизвестный параметр 9в^ = g(9) так, чтобы дисперсия Dg
= g(Q) и
не зависела от Э. Изложим схему подбора такого преобразования,
а затем объясним, как, используя его, найти интервальную оценку для Э.
169
А. А
Пусть 0 — оценки метода моментов: Э, а следовательно, и g =
= g(8) являются функциями выборочных моментов. Тогда, согласно
теореме о свойствах функций выборочных моментов (см. § 7.1),
распределение оценки g = g[Q) при больших п близко к нормальному,
Mg = М#(б) = g(9) = g и, с учетом выражений (7.1.5) и (7.4.1),
Dg = Dg(9) = [D§][g'(9)]2 = [сг (9)/«][g'(9)]2 = [c(9)g'(9)] 2/и
(аналогичные выражения получаются и для оценок максимального
правдоподобия в регулярном случае). Но так как дисперсия Dg
не должна зависеть от 0, то выражение c(0)g'(0) должно быть
постоянным, например c(0)g'(0) = 1. Тогда g'(0) = 1/с(0) и
при этом произвольная постоянная при интегрировании выбирается из
соображений простоты окончательных выражений,
Итак, при больших п распределение оценки # = #(6) близко
к нормальному, при этом Mg = g(&) и, следовательно,
K-Jg£s -^-V-y—«Z~/V 0;l).
Поэтому при больших п для g(0) с вероятностью «1-а имеет
место неравенство, подобное неравенству (7.3.3):
g(ty-uj^<g{b)<g(l>) + ujjit (7.4.3)
гдеФ(и„) = (1-а)/2.
Применив ко всем частям неравенства (7.4.3) преобразование g~\
которое является обратной функцией к функции g, получим
интервальную оценку для 0.
Пример 7.7. Построим доверительный интервал для параметра
Xх
распределения Пуассона: Р{Х = х) ~ —е~х,х- 0,1,...; Х> 0.
х\
В примере 7.2 была найдена оценка метода моментов X = X
параметра X ~ MX; X , будучи оценкой метода моментов, имеет асимптоти-
170
чески нормальное распределение, при этом X, — несмещенная оценка,
так как МК = MX = MX = Л. , а дисперсия оценки А, зависит от
параметра X:
D\ = DX = DX/n = \/п .
Сопоставив выражение для Dh с выражением (7.4.1), получим
с(к) = лД и, согласно равенству (7.4.2),
С учетом вида функции g(K) неравенство (7.4.3) примет вид:
2-Ji-uJJn<2>l\<2yli+uJyfn . (7.4.4)
Для функции у = g(x) = 2у[х при д: > 0 и у > 0 обратная функция д: =
= S '(у) = (у/2)2. Поэтому, если в неравенстве (7.4.4)
2VX-«a/V^>0,
то, применив ко всем его частям преобразование g ', получим
неравенство
{fi-u'ihx{fUu-^l' (7А5)
которое выполняется при больших п с вероятностью ~ 1 - ос.
Пример 7.8. Построение доверительного интервала для р —
вероятности успеха в единичном испытании
В примере 7.6 методом максимального правдоподобия для р была
найдена оценка р = \l/n , где Ц — случайное число успехов в п
испытаниях Бернулли; р имеет асимптотически нормальное
распределение, при этом Мр = р , а Dp = р(\ - р)/п — дисперсия зависит от
параметра р,
Сопоставив выражение для Dp с выражением (7.4.1), получим
с(р) =\]р(1~ Р) и» согласно формуле (7.4.2),
&W = \ I S ч = 2 flrcainV^ '
Чр^-р)
С учетом вида функции g{p) неравенство (7.4.3) примет вид:
2arcsin,/p < 2arcsin Jp +ua/\fn . (7.4.6)
Для функции у =g(x) = 2arcsinV^ при 0<V*^1 обратная
функция х = g'{(y) = sin2(y/2), где 0 < у < к. Поэтому, если в неравенстве
171
(7.4.6) (2 arcsin yfp-ua/yfn)> О и (2arcsinyjj) + ua/4n] <n, то,
применив ко всем его частям преобразование g \ получим неравенство
sin2 arcsinyjp - иа —j= < р < sin2 arcsin ^fp + ua —j= , (7.4.7)
которое выполняется при больших п с вероятностью = 1 - а.
Задача 7.5. В случайной выборке из 30 аспирантов,
специализирующихся по управлению предприятиями, составленной по
нескольким основным университетам, 18 человек оказались сыновьями
специалистов с высшим образованием. Оцените долю аспирантов
в обследованных университетах, отцы которых являются
специалистами с высшим образованием, и число таких аспирантов среди 2000
аспирантов при 90%-ных доверительных границах.
Решение. По таблице П. 6.1 найдем число и^ при котором Ф(иа) -
= (1 - ос)/2 = 0,45; м0, = 1,65. Для генеральной доли р интересующих
нас аспирантов получим, согласно неравенству (7.4.7),
sin2 arcsin Jo, 6 -1,65—у= < p<sin2 arcsin л/0,6 + 1,65 ,— ,
I 2V30J I 2V30j
или неравенство 0,451 < p < 0,741, и тогда 90%-ный доверительный
интервал для числа таких аспирантов среди 2000 человек — (902;
1482).
Если воспользоваться неравенством (7.3.6), 90%-ный интервал для
р будет таким: (0,452; 0,748).
Точный же 90%-ный доверительный интервал для /?, который
можно построить, используя биномиальное распределение случайной
величины (I (а не аппроксимацию этого распределения нормальным,
имеющую место только при достаточно больших п) такой: (0,434;
0,750) (см. [7, с. 107]).
В условиях задачи нижние границы первых двух интервальных
оценок для р практически одинаковы, но далеки от точной нижней
границы (в задаче п - 30, а это не так много), верхняя же граница
второй оценки ближе к точной, чем верхняя граница первой оценки.
Пример 7.9. Построение доверительного интервала для
коэффициента корреляции
Построим доверительный интервал для коэффициента
корреляции р — одного из параметров двумерного нормального
распределения, располагая результатами независимых, проведенных в
одинаковых с вероятностной точки зрения условиях наблюдений (Хь У,),
{Хъ Y2),..., (Хп, Y„).
172
Оценкой метода моментов для р является выборочный
коэффициент корреляции
cov(X,Y)
Р =
ТЕШЙО7)'
где cov(X ,Y) = — J\(Xj — Х)(У;—У) — выборочный второй смешанный централь-
ный момен! величин X и Y;
Д2(А')--^(А', - ^)'=d2v , |12(К) = -^(К;-У7)'=а^ — выборочные вторые
центральные моменты соответственно величины Хи величины У.
Распределение оценки р при больших п близко к нормальному,
при этом Мр = р и Dp = ( 1-р2) п. Сопоставив выражение для
дисперсии Dp с выражением (7.4.1), заключаем, что с(р) - 1 - р2 и,
согласно формуле (7.4.2), g(p)- Г—^-г- =—In—- .
М-р 2 1-р
Преобразование z(p) = — In — носит название z-преобразования
2 1-р
Фишера. Функция z(p) — нечетная; ее значения при 0 < р < 0,99
приведены в табл. П. 6.5.
Исследования точности приближения распределения случайной
величины z(p) к нормальному показали, что
^•'Н
z(p)~N\z(p) +
У 2(я-
даже для сравнительно малых п, а потому, пренебрегая величиной
, получим, что для z(p) с вероятностью ~ 1 - ос имеет место не-
2("-1)
равенство, аналогичное неравенству (7.4.3):
z(p)-w(l/V^r3<z(p)<z(p) + wa/V^r3 .
Поскольку функция z(p) возрастающая, то после применения ко всем
частям этого неравенства преобразованияz ' получим:
*"' (*(р)" ИаД/^з) < р < z"1 (z(p) + uJJ^b), (7.4.8)
-I/ ч е2"-1 л. С л. / ч !т 1 + Р
где z (z) = — функция, обратная функции z(p) = — In—-,
е"г + 1 2 1-р
173
При достаточно больших п (оставляем только линейную часть разло^
жения в ряд Тейлора)
z-'(z(p)±«u/V^3) = z-'(z(p))±^
m„/Vai-3 =
dz
=p±d-p2K/V^3,
поэтому доверительный интервал примет вид, приводимый в
большинстве книг по математической статистике (поскольку п большое,
то (л - 3) заменено на п):
p-(l-p2)wa/V^<p<p + (l-p2)"a/V^.
Задача 7.6. Коэффициент корреляции между производительностью
труда и себестоимостью продукции, вычисленный по 100 отделениям
фирмы, оказался равным -0,35. Постройте 95%-ный доверительный
интервал для генерального коэффициента корреляции.
Решение. Согласно неравенству (7.4.8):
по табл. П. 6.1 найдем число иа, при котором Ф(иа) = (1 - (Х)/2 = 0,475,
ит - 1,95; по табл. П. 6.5 при р = -0,35 найдем z(-0,35) = -0,3654,
вычислим 2, = z(p) -1,95 /VlOO =-0,3654 -0,195 = -0,5604,
z2 = z(p) +1,95/VI00 =-0,1704 ;
по табл. П. 6.5 при z =z,, hz = z2 найдем р, ~ -0,51, р2 ~ -0,17.
Таким образом, 95%-ный доверительный интервал для
генерального коэффициента корреляции — (-0,51; -0,17).
ВОПРОСЫ И ЗАДАЧИ
Что означает словосочетание «хорошая оценка»? Какому из методов
оценивания параметров вы отдаете предпочтение и почему?
Найдите методами моментов и максимального правдоподобия оценки
параметров известных вам распределений. Является ли выборочное
среднее (выборочная доля) хорошей оценкой математического
ожидания (вероятности)? Какие точечные оценки дисперсии вам известны
и какой из них вы отдадите предпочтение?
Вам нужно найти пять человек, пользующихся услугами некоторой
фирмы. При опросе на улице случайных прохожих оказалось, что 11,
14, 20, 22 и 30-й прохожие пользуются услугами фирмы. Методами
моментов и максимального правдоподобия оцените вероятность того,
что случайный прохожий пользуется услугами фирмы; найдите для
этой вероятности 90%-ные доверительные границы.
По выборке объемом п — 42 из нормальной генеральной совокупности
найдена средняя х = 608. Предположив, что 0=15, определите:
а) среднее квадратичное отклонение средней; каков содержательный
смысл этого отклонения?
б) 95%-ный доверительный интервал для математического ожидания а\
в) вероятность того, что интервал (0,992 х ; 1,008 х ) накроет а;
г) вероятность того, что ошибка средней не превзойдет 4,5;
д) объем выборки, при котором с надежностью 95% ошибка средней
не превзойдет 4,5.
Для отрасли, включающей 1200 фирм, была составлена случайная
выборка из 45 фирм. По выборочным данным оказалось, что в фирме
работают в среднем 77,5 человек при среднем квадратичном отклонении
20 человек;
а) пользуясь 95%-ным доверительным интервалом, оцените среднее
число работающих в фирме по всей отрасли и общее число
работающих в отрасли;
б) пользуясь 90%-пым доверительным интервалом, оцените среднее
квадратическос отклонение работающих в фирме по всей отрасли,
Результаты сравните с результатами решении задач 7.2 и 7,4.
Фирма с целью установления известности се продукции опросила
на каждой из пяти улиц но 40 человек, Количество знакомых
с продукцией фирмы оказалось таким: 20, 10, 30, 10, 15, Задания:
й) методами моментов и максимального правдоподобия оцените
степень известности продукции фирмы;
б) постройте 90%-иый и 95%-ный доверительные интервалы для
степени известности продукции. Какой из интервалов шире и почему?
в) пользуясь 95%-ным доверительным интервалом, оцените число
жителей среди 2000, знакомых с продукцией фирмы.
Распределение 200 погибших в результате ДТП по возрасту таково:
Возраст
Число погибших
16—21
133
21—26
25
26—31
15
31-36
4
36-41
2
41—46
1
Предположив, что имеет место показательный закон распределения,
найдите точечную и 90%-ную интервальную оценки для среднего
числа погибших за год.
Из 200 работников банка случайным образом отобрано 20 человек,
средняя зарплата которых составила 600 у.е., а среднее квадратичное
отклонение I00 у.е. Предположив, что зарплата распределена по
нормальному закону, определите с 95%-ной надежностью среднюю
зарплату в банке и суммарные затраты банка на зарплату в месяц.
175
•9. При проверке двух предприятий розничной торговли ревизор
установил, что в одном магазине для случайной выборки п = 10 счетов
среднее сальдо счета равно 54 дол., а в другом, при таком же объеме
выборки, 45 дол. Используя 95%-ные доверительные границы, оцените
разность средних сальдо счетов для двух магазинов, если среднее
квадратичное отклонение сальдо для первого магазина а( - 3 дол.,
а для второго а2 ~ 2 дол. Предполагается нормальное распределение
сальдо счета.
10. С какой вероятностью можно ожидать, что:
а) ошибка от замены среднего квадратического отклонения а
ежесуточного дохода киосков некоторой фирмы оценкой ,v, вычисленной
для 13 киосков этой фирмы, не превзойдет 0,388 s;
б) отношение где s2 также вычислена по результатам
обследования 13 киосков, будет заключено в интервале (0,297; 0,436).
11. Из двух генеральных совокупностей X — N(ax, о)иГ~ N(Qy, о*)
извлечены случайные независимые выборки соответственно объемом л, и п2
и найдены оценки л( и s2 дисперсии <т\ Каков закон распределения
отношения s} /s; ? Пусть и, = 13, а п2 = 7. Какова верхняя граница
отношения ж, /s2 , которую можно гарантировать с вероятностью 0,95?
Какова при той же вероятности нижняя граница?
12. Для того чтобы определить отношение избирателей к предложению
администрации области относительно выпуска облигаций, проводится
опрос 100 человек в каждом из двух районов. В одном районе это
предложение поддержали 60 человек, а в другом — 50. Пользуясь
95%-ными доверительными границами, оцените разность процентных
долей лиц, поддерживающих предложение администрации области
в обследованных районах.
13. Постройте 95%-ную интервальную оценку генерального коэффициента
корреляции:
а) если « ^ 52, а р = 0,36;
б) если /7 = 52, а р = -0,36.
ГЛАВА8
ПРОВЕРКА ГИПОТЕЗ
На практике часто приходится на основе выборочных
наблюдений проверять различные предположения относительно генеральной
совокупности. Процедура сопоставления выдвинутых гипотез с
выборкой и вынесения решения относительно приемлемости этих
гипотез получила название проверки гипотез.
8.1. ОСНОВНЫЕ ПОНЯТИЯ ПРОВЕРКИ ГИПОТЕЗ.
ГИПОТЕЗЫ О ПАРАМЕТРАХ
НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Статистическая гипотеза — это некоторое предположение
относительно генеральной совокупности, проверяемое по выборочным
данным. Примеры статистических гипотез:
а) нормально распределенная случайная величина X имеет
генеральное среднее а, равное щ;
б) нормально распределенная случайная величина X имеет
дисперсию, равную /»,>;
в) выборка х = (xi, лг2, ...', х„) взята из нормально распределенной
генеральной совокупности.
Гипотеза называется параметрической, если в ней содержится
некоторое утверждение о значении параметра распределения
известного вида. Параметрическая гипотеза называется простой, если ней
речь идет ровно об одном значении параметра (одномерного или
многомерного); в противном случае имеют дело со сложной гипотезой.
Проверяемую гипотезу называют основной, или нулевой, и
обозначают //0. Например, простая гипотеза «а» запишется гак: Н{): а = а0.
Наряду с //0 рассматривают конкурирующую, альтернативную
гипотезу, являющуюся логическим отрицанием И0. Альтернативной к
гипотезе «а» может, например, быть простая гипотеза //, : а = я, (at —
число, не равное а0) или сложные гипотезы Их:аФ а(), или //, : а < а() и т.д.
Гипотеза b относится к непараметрическим.
Правило, по которому решают: принять или отклонить //0
(соответственно отклонить или принять Я,), — называют критерием.
В общем, схема построения критерия такова: все выборочное про-
177
странство делится на две взаимодополняющие области —• область S
отклонения основной гипотезы И{) и область S принятия этой
гипотезы (область отклонения основной гипотезы называется критической);
если выборочная точка д: попала в S, то основная гипотеза #„
отклоняется и принимается альтернативная гипотеза #,; если же точка х
попала в S , то принимается //,,,'а //, отклоняется.
При этом может иметь место ошибка двух родов:
♦ будет принята гипотеза Нь тогда как на самом деле верной
является #0 —> это ошибка первого рода, ее вероятность
обозначают а:
a = P(xeS\H,) = P(H,\H,),
где Р{Н{\Н0) — вероятность того, что будет принята гипотеза Н}
если на самом деле в генеральной совокупности верна
гипотеза /■/„;
а — уровень значимости и обычно для а используют
некоторые стйндвртные значения: 0,05; 0,01; 0,005;
0,001:
♦ будет принята гипотеза //„, тогда как на симом деле верной
является //, — это ошибка второго р<н)а, ее вероятность
обозначают р:
Правильное решение также может быть двух родов:
♦ будет принята гипотеза #,„ тогда как и на самом деле в
генеральной совокупности верна //ц; вероятность такого решении
\-а = Р(хе S \Н0) = Р(ЩНа);
♦ будет принята гипотеза #,, тогда как и на самом деле в
генеральной совокупности верна //,; вероятность такого решения
1 - Р = Р(х е 5|Я|) = P(H]\Hi) называют мощностью
критерия (табл. 8.1).
Критерий называется наиболее мощным, если из всех
Возможных критериев с заданным уровнем значимости а он обладает
наибольшей мощностью, т.е. если его критическая область S* является
такой, что
Р(хе S* \Hl)^m&xP(xe S\H]), (8.1.1)
где максимум берется по тем S, для которых
Р(хе S\H0) = a. (8.1.2)
178
Так как мощность критерия, равна 1 - (3, то использование
наиболее мощного критерия гарантирует при заданной вероятности а
ошибки первого рода наименьшую, по сравнению с другими
критериями, вероятность (3 ошибки второго рода.
Таблица 8.1
Гипотеза
"о
Верна
Неверна
(верна Н,)
Условные вероятности того, что гипотеза На будет
отклонена
(будет принята Н,)
а = Я(х€5|//0)-Д//,|//())
(ошибка первого рода)
(правильное решение)
принята
\-a = f\xe S \Н0) = Р(ЩН0)
(правильное решение)
Р=Ддге S\HX)^P{HQ\H,)
(ошибка второго рода)
Задача построения наиболее мощного критерия (критической
области S*) решается для простых гипотез с помощью леммы Неймана—
Пирсона. Поясним ее смысл, предположив, что случайная величина X
непрерывна с одним параметром, а гипотезы Н0иН[ — простые.
При выполнении простой гипотезы Я0 плотность f0(x)
величины X определяется однозначно, а потому и функция правдоподобия
[см. формулу (7.2.5)] также определяется однозначно, т.е. в точке х
Аналогично при выполнении простой гипотезы Я, однозначно
определяются плотность/i (х) и функция правдоподобия в точке х
Li(x)=fl(x]yl(x2)...f](x„).
О правдоподобии выборки х в отношении гипотез Я| и Я0 будем
судить по отношению правдоподобия L{ILQ (конечно, при L0 Ф 0): чем
правдоподобнее выборка в условиях гипотезы Я,, тем больше L,
(по сравнению с L0), тем больше отношение L^Lq.
Согласно лемме Неймана—Пирсона, существует такая
константа, зависящая только от а, что критическая область S* наиболее
мощного критерия
S = \x:L0(x) = 0{J
L0(x)
Спри10(лг)*0
при этом константа С является решением уравнения
Им*)
Ял
= а
(8.1.3)
(8.1.4)
179
Метод построения критической области, использующий
отношение правдоподобия, называют методом отношения правдоподобия.
Пример 8.1. Построение критерия проверки гипотезы Н{) : а - а{)
при альтернативе //, : а = а} > а{).
Случайная величина Х~ N (а, а), причем числовое значение
математического ожидания а неизвестно, а числовое значение дисперсии о2
известно. Пусть основная гипотеза Я0 : а = а„, а альтернативная
гипотеза Я, : a- at> а„ (а, — число, большее а{)).
Если верна гипотеза Я,„ т.е. Х~ N(a(), а), то функция правдоподобия
в точке х = (Зс|, х2,..., х„)
м*)=
У
ехр
1 "
2а ,-=|
если же верна гипотеза Ни т.е. X ~ N(au а), то
(8.1.5)
АМ =
1
ехр
2а ,-=,
.о>/2я
Тогда отношение правдоподобия таково:
Z1/L0=exp|-^i5-j;[(Jci-fll)2-(Jf/.-fll))2]U
:exPJ-rr(ai-ao)(2jc-tf|-an)/,[-
Так как при а, > а() это отношение является монотонно
возрастающей функцией от х и так как в примере L{)(x) *■ О, то неравенство
Lt/Lu > С равносильно неравенству х>С, где Си С - некоторые
константы. Поэтому соотношения (8.1.3) и (8.1.4) примут вид:
S*= {х: х>С}\ (8.1.6)
р((х>С)\Н0) = а. (8.1.7)
Известно, если X ~ N(a, а), то А' ~ Лм a, a/yjn I, а потому при
выполнении гипотезы Н():а = аь получаем X - ЛЧ а0, о/л/и ]; тогда
а = />((ЛГ>с)|//0) = ^Ф
с/л/й
180
Отсюда Ф'^^ I-i^a С^
af-Jn ) 2 о/л/л
C = aQ+u2aa/yfn. (8.1.8)
Итак, наиболее мощный критерий проверки гипотезы Н0 : а - а0
при альтернативной гипотезе //, : = а, > а0 такой:
если J < an + i/2a о/V« , то И0 принимают (Я, отклоняют);
если х>а0 + и2и o/yw, то Н0 отклоняют (//, принимают).]
При использовании этого критерия вероятность ошибки первого
рода равна числу а, а вероятность ошибки второго рода, с учетом
соотношений (8.1.6) и (8.1.8):
(3=Р(«„ |//,)= Р(ХеГ\Н,)=р((Х <С)\(х ~м(а„о/Щ) =
=!+ф
2
(г п > 1 (
С ~а.
а0+и2аа/4п-а1 )_
1\ = ± + ф
= ^-ф((а,-в0)Л/ст-и2в). (8.1.10)
Из выражения (8.1.10) видно, что:
♦ с ростом вероятности а ошибки первого рода вероятность (3
ошибки второго рода уменьшается, если п константа;
♦ с ростом объема п выборки вероятность (3 ошибки второго рода
уменьшается, если а константа.
Заметим, справедливость этих выводов не ограничивается рамками
рассмотренного примера.
Из выражения (8.1.10) нетрудно получить, что при заданном а
вероятность ошибки второго рода, не превосходящая (3, обеспечивается
объемом выборки
(и,и + и20) а2
п>^ -ZJ-—. (8.1.11)
(a,-fl0)
Итак, для X ~ N(a, а), где а неизвестно, а а известно, наиболее
мощный критерий проверки гипотезы И0 : а = а() при альтернативной
гипотезе Я, : а- а, >ап имеет вид (8.1.9).
Нетрудно убедиться в том, что наиболее мощный критерий
проверки гипотезы Н0: а = а0:
при Я, : а = а, < а0 будет таким:
если х > а0 ~ и2а o/vrt, то Я0 принимают;
если х < а0 - и2а G/Jn, то Н0 отклоняют. J
181
при Я, : а = я, Ф ап будет таким:
если л„ - ип G/*Jn <х <а{) + иа o/<Jn, то Я„ принимают;
если (х < а0 -иа о/>/й)\J[x>a()+uac/\fn), то Я0 отклоняют.
Проведем параллель между критерием (8.1.13) и интервальной
оценкой (7.3.3) параметра а при известной дисперсии о2. Решив первое
неравенство в (8.1.13) относительно я(), получим такую формулировку
критерия проверки гипотезы Я() : а = д() при альтернативной гипотезе
Н\\а~а^Ф ап: если для предполагаемого в основной гипотезе Я0
значения а() параметра а выполняется неравенство
х - иа ст/л/я <aQ<x+ ии а/4п , (8.1.14)
то Яп принимают, в противном случае гипотезу Яп отклоняют. Сравнив
неравенства (7.3.3) и (8,1.14), заключаем: если предполагаемое в
основной гипотезе числовое значение неизвестного параметра попадает
в интервальную оценку этого параметра, отвечающую надежности 1 -
а, где а — заданный уровень значимости, то гипотезу Я0: а = ай
принимают; в противном случае ее отклоняют в пользу Я, : а = а, * а0.
Такая формулировка наиболее мощного критерия имеет место не только
в данном случае, но и при проверке гипотезы Я0 : 6 = 90 о числовом
значении любого параметра нормального или асимптотически
нормального распределения, если альтернативная гипотеза Я, : в = 91 ^= 90.
Приведем еще одну формулировку критерия (8.1.13) проверки
гипотезы Я0: а = а„ при Я, : а — а,\ Ф а0. Введем статистику критерия
Z =
a/yfn
В терминах этой статистики область принятия гипотезы Я0 : а = д0
задается неравенством -иа < z < иа или неравенством
И<ив1 (8.1.15)
а область отклонения будет такой:
ze(-oo,-Me)U(Ma, + °o).
х~ — (X
Если значение z = —j—Л статистики Z удовлетворяет неравенству
а/у/п
(8.1.15), гипотезу Я() ; а - а0 принимают; в противном случае
отклоняют в пользу гипотезы Нх : а- а{Ф а0. Область отклонения гипотезы Я0
(-«*>, - иа) U (иа, + «>) называют двусторонней критической областью
значений статистики Z.
При использовании статистики Лдля проверки гипотезы /Ум : а - щ
при альтернативной гипотезе //, : а = я, > ап область принятия Нп
задается неравенством
2 <И2а
и критическая область значений статистики Z будет правосторонней:
(м«м +ос).
При использовании статистики Z для проверки гипотезы Н0 : а = а0
при альтернативной гипотезе Нх : а = а, < а0 область принятия Я0
задается неравенством
z > -и2а
и критическая область значений статистики Z будет левосторонней:
Критерии проверки гипотез о числовых значениях параметров
нормального распределения, коэффициента корреляции и вероятности
успеха в единичном испытании приведены в табл. 8.2.
В заключение отметим: принятие основной гипотезы Я0 вовсе
не означает, что Я() является единственно подходящей, просто
предположение Я() не противоречит выборочным данным, однако таким же
свойствам могут наряду с И„ обладать и другие гипотезы,
Задача 8.1, Крупная торговая фирма желает открыть в новом
районе города филиал. Известно, что фирма будет работать прибыльно,
если еженедельный средний доход жителей района превышает 400 у,е.
Предположив, что дисперсия дохода жителя района о2 = 400,
а) определите правило принятия решения, с помощью которого,
основываясь пи выборке п - 100 и уровне значимости ot - 0,05, можно
установить, что филиал будет работать прибыльно.
б) рассчитайте вероятность того, что при применении правила
принятия решения, полученного при ответе на вопрос пункта «а», будет
совершена ошибка второго рода, если средний доход за неделю
достигнет 406 у.е.
в) считая альтернативное значение генерального среднего дохода
равным 430 у.е., рассчитайте объем выборки, при котором
вероятность ошибки первого рода равна 0,025, а вероятность ошибки
второго рода не превысит 0,05.
Решение, а) Фирма не откроет филиал, если средний доход
жителей не превысит 400. Будем считать, что Нп : а = 400, a Я, : а > 400.
Значение дисперсии а2 дохода известно: в этом случае Я, принимают,
если —гт=">1/2а - По условию а0 = 400, ы0) = 1,65. Поэтому Я, прини-
a/yjn
мают и, следовательно, филиал открывают, если недельный
среднедушевой доход 100 жителей х > 400 + 2 • 1,65 = 403,3.
183
Таблица 8.2
Проверка гипотез о значениях параметров нормального распределения и вероятности успеха
н0
1
а = а0
(Ь0>0)
Предположение
2
О2
известно
О2
не известно
а
не известно
Статистика критерия
при выполнении
гипотезы Н„
3
z-*~a°
а/у/п
S/y/n
х (л 1)= ,
",
4
а = а, > а0
а = а, < а0
а = а1>а0
а = ах <а0
а = а1*щ
<f = b{>b0
а2 = *>, < *>0
о2 = J>,*60
Область
отклонения
Н0
5
z>u2a
2 < -U7a
t(n-l)>t2a
t(n-l)<-t2a
x2(«-0>xL
x2(«-0<xL
Й<х2("-0
Xa>X2("-0
Мощность критерия
1-Р
6
0,5 + Ф((а)-а0)^/а-М2а)
0,5 + ф((я0-а,)^я'/а-м2о)
/3(/(«-1)>(а0-а,)^А + /2а)
\-P(t{n-\)>{a0-ai)^/s-t2Q)
l + p(t(n-l)>(a0-al)yfc/s + ta)-
-P(t(n~l)>(a0-4)yfc/s-ta)
P{r(n-l)>f2abjbl)
\-P{rin-\)>^labJb[)
\+P(x2(n-l)>x2ab0/bl)-
-P(x2(n-l)>xlbjb])
Окончание табл. 8.2
Р=Ро
п порядка нескольких
десятков.
npQ>5
п(\-р0)>5
Z =
Р-Ро
yfp^J"
Р=Р\>Ро
P=Pi<Po
Р=Р)*Ро
z>u7
Z <-Uj
z >м„
0,5+ Ф
0,5+ Ф
(
Pi-Po _„ \РоЯо
IPrfi/n V Р\Ч\ ,
Ръ~Р\ „ \РоЯо
М2г
JprtJ" 2a V Ptii ,
1 + Ф
(
Pi~Po.-u lp°g°
+ф
<Jprf\/n \P\Q\j
Л
Pq-Pi u jPo4o_
у1р\Я\1" \ Р\й
P = Po
n> 10
z =
r(p)-z(p0)
l/Vw-3
Замечание:
при p0 = 0
Z = z(p)Vn-3 *
P>Po
P<Po
P*Po
z>w2a
z < -w,a
|z|>m„
p = 0
t2(n-2) =
p*0
|f(ii-2)|>/e
(l-p2)/<«-2)
2(p)--ln[(l + p)/(l-p)] — преобразование Фишера
б) Альтернативное значение среднего дохода равно: а] - 406 и
гипотеза Я, : а = 406 > д0, В этом случае вероятность ошибки второго рода
Р = 0,5 -ф{(д,-а0)>/й/а-и2и} = 0,5 -ф{(б-10/20) -1,65} =0,09.
в) При гипотезах Я() : а - а0 (аУ) = 400), и Я, : а = а, > а„ (а, = 430),
объем выборки рассчитаем по формуле (8.1.11), в которой а = 0,025,
a Р = 0,05. Получим:
J"o,q5 + "o,i)2 -400 _ (1,95 + 1,65)' 400 _g ^
Задача 8.2. Торговец утверждает, что он получает заказы в среднем
по крайней мере от 30% предполагаемых клиентов. Можно ли при
5%-ном уровне значимости считать это утверждение неверным, если
торговец получил заказы от 20 из 100 случайно отобранных
потенциальных клиентов.
Решение. Будем считать, что гипотеза Я(> : р = 0,3 (т. е. число
/>0 = 0,3), Я, : р < 0,3; п= 100, лр() > 5, п(\ -/?„) > 5, поэтому для
проверки гипотезы Я0 используем статистику Z- ,—- . >...- , числовое
значение которой при р = 20/100 = 0,2 равно -2,18. Так как при
а = 0,05 верно неравенство -2,18 < ~ига - -1,65, то гипотезу Ям
отклоняем: с утверждением торговца не согласимся.
Задачи 8.3. По данным обследования 20 однотипных фермерских
хозяйств вычислен коэффициент корреляции р = -0,47 между средней
урожайностью и средней себестоимостью моркови, Постройте
95%-ный доверительный интервал для генерального коэффициента
корреляции. Можно ли при 5%-ном уровне значимости считать
выборочный коэффициент статистически значимым?
Решение. В таблице П. 6.1 найдем и(т = 1,95, а в табл. П. 6.5
z(-0,47)= -0,5101 и тогда, согласно (7.4.8), получим z '(-0,9830) < р <
< z■■'(-0,0372), или -0,76 < р < -0,04.
Коэффициент р называют статистически значимым при
заданном уровне значимости а, если при этом а гипотезу Я„ : р = 0
отклоняют в пользу гипотезы Я, : р ^ 0. Используя соответствующий этой
ситуации критерий (см. табл. 8.2), найдем z (-0,47) • Vn = -2,103, и
так как |-2,103|>и005 = 1,95 , то гипотезу Я„ : р = 0 отклоняем, т.е.
считаем 6 =-0,47 статистически значимым.
Замечание. Приведенный в табл. 8.2 критерий проверки гипотезы
Я0 : р - р0 при Я, : р Ф р0 идентичен выяснению, накроет ли
построенный с надежностью 1 - а доверительный интервал для р число р(). Если
это произойдет, гипотезу Н0 принимают, в противном случае ее
отклоняют. В задаче 1 - ос = 0,95, а = 0,05 и рп = 0 g (-0,76; -0,04) —
гипотезу Н0 : р = 0 отклоняем.
8.2. ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ И ДИСПЕРСИЙ
ДВУХ НОРМАЛЬНЫХ РАСПРЕДЕЛЕНИЙ
Гипотеза о равенства средних при известных дисперсиях. Итак,
случайные величины Х[[) ~ N(a\, ох), а Х[2) - N(a2, С2) при этом я, и а2
не известны, а о] и о2 известны. Построим критерий проверки гипотезы
Н0: а\ = а2, если Я, : а{> а2, предварительно заметив, что для случайной
величины X = Х0)-Х{2) математическое ожидание МХ= а]-а2 = а.
Пусть Х\[),Х^\...,Х^ и Х\2\Х™,...,Х™ — независимые
случайные выборки из соответствующих нормальных генеральных
совокупностей. Напомним: вычисленные по этим выборкам средние
имеют нормальные распределения, а именно А'(1) Лчяр ^\1^Щ),
a J(2) TV f а2, ст2/vл2) • Тогда, с учетом независимости случайных
величин A^(l) и Х(2), вытекающей из независимости случайных
выборок, получим:
( г^—п
JP=(X(l)-^(2)) /V fl =„-в2=а,0;р= Р- + ^ _ (821)
Далее, гипотеза Н{)\ а{= а2 при Н\ : а\ > а2 равносильна гипотезе
Н'0:а = а0 при Н[\а>ай , при этом я0 = 0, критерий проверки которой
приведен в табл. 8.2. С учетом выражения (8.2.1) он формулируется
так:
х-а х(|)-х(2)
если = - , —=г < и , принимают Н'а : а = 0 (или //0: я, = я2),
ст* fe+£2.
в противном случае принимают #( : я > 0 (или //,:#,> а2).
Этот критерий, а также критерии проверки гипотезы Н0 : а, = а2
для случаев, когда //| : я, < я2 и Я, : а^ Ф а2 приведены в табл. 8.3.
Замечание. Если гипотезу Я0 : я, = я2 принимают, то говорят,
что различие выборочных средних х{[) и х{2) статистически не
значимо и оценка общего математического ожидания такова:
187
Сравнение соответствующих параметров нормальных распределений
Таблица 8.3
Но
а\ = а1
°f=°i
= ... = <*
Р: = Рг
ft=Pi
Предположение
известны
ст?»°2
не известны,
но равны
не известны
л,- > 3
/=1,2, ...,v
fli И П2
порядка
нескольких
десятков
/?i > 10
л2>10
Статистика критерия
при выполнениии гипотезы Н„
Z -
V "l л2
0, ^(,>-Х(2)
t(n. + iu—7) — —■
V") "г ) /i
1\Л1 Л2,
гдс „2 .("l"1)^ + {П2~1)4
;>1 +Лт -2
F(nt-l,n, -l)=sl/s22, (s*>s2)
1 4
3(v-l)
Y
1
) 1
[Г»,-' 2>,--i)j
z-^-^/i^?ii+~
2 = (^(P,)-^P2))/
гдег(р) — преобразоЕ
1'+'
Л, — 3 «0-3
ание Фишер
, где р
. В»,-1)
/
W, + /И-,
Л, +И-1
а
н,
а, > а2
а, < а2
а1 ^^2
а, > а2
а, <а2
а, *аг
Pi>Pi
Pi <Pi
P\*P2
Pl>p2
P1<P2
Pl*p2
Область
отклонения Ha
z>u2a
2<~U2a
«(лj + «2 - 2) > f2„
r(«!+«2-2)<-/2„
]/(л,+л2-2)|>/а
F(nl-l,n2-l)>F2a
F(nl-\,n2-l)>Fa
x2(v-i)>xL
(критерий
Бартлетта)
г> м2а
^ < -W2«
\Z\>U*
z>u2a
z<~u2a
Гипотеза о равенстве средних при неизвестных дисперсиях.
Критерий проверки такой гипотезы довольно прост, если известно, что
неизвестные дисперсии ъ\ и а; равны, —- он использует
распределение Стьюдента (см. табл. 8.3 и П. 6.2). Если же заранее не известно,
что а2 = а2, то, прежде чем проверять гипотезу Н0: а{ = а2, проверяют
гипотезу Н'0 : а2 = al. И в случае приемлемости Н'0 приступают,
с некоторой осторожностью (ведь принятие И'() вовсе не означает, что
и на самом деле а, = а;), к проверке гипотезы //„: ах = а2.
Гипотеза о равенстве дисперсий при неизвестных средних.
Схема проверки гипотезы А/(] : G, = а; приведена в табл. 8.3. При
проверке //0 используется табл. П. 6.4 — таблица критических точек
распределения Фишера.
Замечание. Если гипотезу Н() : о^ =о2 принимают, то говорят,
что различие выборочных дисперсий .vj" и л; статистически не
значимо, и оценка общей дисперсии такова:
[.vf(Wl-l) + .v22(/i2-l)]/ (/i,+/i2-2).
В таблице 8.3 приведен критерий Бартлетта проверки гипотезы
о равенстве дисперсий более чем двух нормальных распределений; он
основан на ^-распределении (см. табл. П. 6.3) и будет использован в § 8.4.
Критерий проверки гипотезы о равенстве средних более чем двух
нормальных распределений с одинаковыми дисперсиями расмотрен в § 8.4.
В таблице 8.3 также даны критерий проверки гипотезы о равенстве
двух вероятностей /?, и /;2 [для случая больших чисел п, и«2 испытаний
Бернулли, когда можно считать, что Д ~ ЛМ/>(,-^/7,(1-/?,)/я, I и
р2 -Nip.,, yjp-,0 - р2)/ >h ) ]-. и критерий проверки гипотезы о равенстве
двух коэффициентов корреляции. Критерий проверки гипотезы о равенстве
более двух вероятностей (критерий однородности) рассмотрен в § 8.3.
Задача 8.4. Расход сырья на одно изделие случаен. Результаты
наблюдений таковы:
Расход сырья
Число изделий
Старая технология
304
1
307
4
308
4
Новая технология
303
2
304
6
306
4
308
1
Предположив, что расход сырья как при старой, так и при новой
технологии имеет нормальное распределение, выясните, влияет ли
технология на средний расход сырья на одно изделие. Примите ос - 0,05.
189
Решение. Найдем выборочные средние: х(П = (304 + 307 х 4 +
+ 308 х 4)/9 = 307,1 1 и х(2> = (303 х 2 + 304 х 6 + 306 х 4 + 308)/13 =
= 304,77 и выборочные дисперсии л,2 = 2,378 и sj = 1,685. По условию
генеральные дисперсии неизвестны и неизвестно, равны ли они.
Поэтому, прежде чем сравнивать генеральные средние, проверим
гипотезу Н'п : а2 =а\, приняв в качестве альтернативной Н[: с\>а\.
Согласно F-критерию (см. табл. 8.3), вычислим F = 2,378/1,685 = 1,41,
а затем по табл. П. 6.4 при к{ = п} ~ 1 = 8 и к2 = п2 - 1 = 12 найдем
F2x005 = F„i05 = 2,85. Так как 1,41 < 2,85, гипотезу о равенстве
генеральных дисперсий принимаем.
Теперь проверим гипотезу Я„ : а, = а„, приняв в качестве
альтернативной Н]: а] > а2. Согласно /-критерию (см. табл. 8.3), вычислим
сначала s2 = (8 х 2,378 + 12 х 1,685)/20 = 1,9622, потом t = 3,852. Далее
по табл. П. 6.2 при к = я, + п2 - 2 = 20 найдем t2a = tlu = 1,72. Так как
3,852 > 1,72, принимаем гипотезу Я, :а1 > а2, т.е. считаем, что
применение новой технологии снижает средние затраты сырья на одно изделие.
8.3. КРИТЕРИИ СОГЛАСИЯ
Не всегда есть основания высказать альтернативную гипотезу
в явном виде. Часто в качестве такой гипотезы имеется в виду просто
невыполнение основной, и в этом случае проверка основной гипотезы
состоит в выяснении, согласуется ли высказанное в ней
предположение с выборочными наблюдениями ж,, х2, ..., х„ — соответствующие
критерии получили название критериев согласия.
Критерий согласия у? относительно закона распределения
1. HQ: выборка извлечена из совокупности, имеющей
распределение F0(x, 0), значения параметров (0Ь Э2, ..., ЭА) = 0 которого известны.
Процедура проверки этой гипотезы состоит из следующих этапов:
а) предположив справедливость гипотезы И0, весь диапазон
значений случайной величины X разбивают на группы (интервалы)
А,, Д2, ..., А, без общих точек и подсчитывают число т, наблюдений, по-
v
павших в каждый из интервалов; ^ш, = п ;
б) подсчитывают вероятности р, = Р (X е А,), / = 1,2, ..., v,
190
в) подсчитывают ожидаемые частоты nph при этом если для
некоторых групп npi < 5, то их объединяют с соседними так, чтобы в
итоге для каждой группы ожидаемая частота была больше 5; новое
число групп обозначим v *;
г) за меру расхождения выборки с гипотетическим
распределением F()(jc, 0) принимают
x2=fK-^)2,f^.n, (8.3.!)
/=i "Pi i=i nPi
При выполнении гипотезы Н0 и достаточно большом п
распределение величины *£ близко к х2-распреде-лению с (v* - 1) степенями
свободы, и если %2 < xla - Ха' где Ха — число, найденное при к = v* - 1
ир = а по табл. П. 6.3, гипотезу И0 принимают, конечно, не считая ее
при этом абсолютно истиной; в противном случае Я0 забраковывают,
по крайней мере до получения дополнительных данных.
2. //0: выборка извлечена из совокупности, имеющей распределение
F()(x, 0) с некоторыми заранее не известными значениями 1(1<>к)
параметров 8i, 62, ..., 6/. Так как значения / параметров неизвестны, то
и вероятности />,, = Р(Хе А,), / = 1, 2, ..., v, и \j/0 = V_i__M будут
не числами, а некоторыми функциями неизвестных параметров.
Естественно за оценки этих параметров принять такие числа (6,, Э2,...»9/ J = 0 ,
при которых расхождение \|/„ = \j/() (0) между выборкой и F{(x, 0) будет
минимальным (заметим, что эти оценки не всегда совпадают с оценками,
приведенными в § 7.1 и § 7.2). Найденными оценками 0 заменяют
неизвестные параметры в функции FQ(x, 0) , а затем выполняют этапы «б» —
«г» процедуры пункта 1 с той лишь разницей, что в данной ситуации
распределение величины (8.3.1) близко к ^-распределению с (v* - /- 1)
степенями свободы, и если %2 < Ха' где Ха — число, найденное по табл. П. 6.3
при к =v*-l-\np = OL, гипотезу Я0 принимают.
Рассмотрим некоторые этапы использования критерия согласия
X2 на примерах пуассоновского и нормального распределений.
Пример 8.2. Проверка гипотезы о распределении Пуассона
Гипотетическим является распределение Пуассона:
Xх
Р(Х = х) =— е~ , х = 0, 1,...; значение параметра X неизвестно.
х\
191
Предположим, что по выборке л:,, х2,..., х„ получили:
т(1 наблюдений с х < q\
ntjнаблюдений сх = i, где i = q + 1, q + 2,..., q + v-2;
тч +, , наблюдений с х > q + v - 1.
Тогда соответствующие вероятности будут такими:
рч = Р(Х= 0) + Р(Х=1) + ... + Р(Х= q)-
р, = Р(Х = 0, где / = q + 1, ц + 2,..., <? + v - 2;
Л = ц + г - I
оценка параметра А. будет такой: А.* = — Vjt;. , а число степеней свобо-
ды распределения величины (8.3.1 ) будет равно (v* - 2).
Пример 8.3. Проверка гипотезы о нормальном распределении
Гипотетическим является нормальное распределение N(a, а)
с плотностью ф(х) с неизвестными а и о.
Выборку X,, х2, ...,хп разбивают на v интервалов длиной А: А, = (аг , =
= £,■ - 0,5Л; at = £,• + 0,5А), / = 1, 2, ..., v; ^, — центр интервала. Поскольку
гипотетическим распределением является нормальное, примем а0 = -оо,
V
aov- +оо. Пусть интервал А, содержит w, наблюдений, ^/и, = л. Соот-
ветствующие вероятности будут такими:
pi = J ф(*) <^;
р. = [ <р(х) <Лг, / = 2,3 v-1;
"; 1
Р„ - | ф(х) Л,
"v - I
1 v
а оценки параметров а и а2 будут такими: а* =— Z^iw/ — среднее вы-
борки, сруппированной по v интервалам, (а2) = — Z(^i: - аj w/
и)=| 12
дисперсия сгруппированной выборки, скорректированная на поправку
Шеппарда. Число степеней свободы распределения величины (8.3.1) равно
(v* - 3).
192
Задача 8.5. По данным задачи 7 гл. 6 выяснить, можно ли на уровне
значимости сх= 0,05 считать нормальным распределение средней
заработной платы.
Решение. Найдем оценки неизвестных параметров нормального
распределения:
1 9 1
а =—УЬ.= (191-1 + 193-5 + ... + 207-1) = 198,96,
100
100
1 ' 100 tT ' ; 12 100 ГГ ' ' * '
4__
.„ - «™,=, 12"
=39 594,44 - 39 585,081 - 0,3(3) = 9,0257, а* - 3,00.
Результаты расчетов величины (8.3.1) приведены в табл. 8.4; в этой
таблице FN (а,-) = — + Ф
а,~а
, / = 1,2, ..., 8, и так как в соответствии
с алгоритмом а{{ - -°о, а{> = +■», то F\(a,t) = 0 , a F^a^) = 1.
Таблица 8.4
/
1
1
2
3
4
5
6
7
8
9
Всего
о, | ~ а,
2
190-192
192—194
194—196
196—198
198—200
200—202
202-204
204-206
206-208
—
nh
3
1
5
9
15
22
28
19
11
4
1
16
100
/Ч<«; |)
4
0,0000
0,0107
0,0495
0,1587
0,3821
0,6368
0,8413
0,9554
0,9906
—
Fs{at)
5
0,0107
0,0495
0,1587
0,3821
0,6368
0,8413
0,9554
0,9906
1,0000
—
P^FfAa)-
6
0,0107
0,0388
0,1092
0.2234
0,2547
0,2045
/0,1141
0,0352
0,0094
1,0000
пр,
7
1,07
3,88
10,92
15,87
22,34
25,47
20,45
11,41
3,52
0,94
15,87
—
nPi
8
0,048
0,005
0,251
0,103
0,001
0,408
Итак, х ~ 0,408. По таблице П. 6.3 при £=v*-3 = 5-3 = 2h/? =
= а = 0,05 найдем xl о< = 5,99. Так как у; = 0,408 < 5,99, гипотезу
о нормальном распределении зарплаты принимаем.
Критерий однородности
Пусть имеются / независимых выборок, объемом л, каждая, i =
i
= 1, 2, ..., /; Vw(. = п. Проверяется гипотеза И0: выборки извлечены
из одной и той же совокупности, или иначе, выборки однородны.
193
Процедура проверки гипотезы Н0 состоит из следующих этапов:
а) Данные каждой выборки группируют в v одинаковых групп
(интервалов) и подсчитывают число /и,у наблюдений из /-й выборки,
попавших в/-ю группу:
/ V V I
б) Предположив справедливость гипотезы Н0, оценивают
вероятности pi принадлежности отдельного результата к каждой из групп:
р ■ = л* • / п , а затем ожидаемые частоты т- =п^р- =njitn.*- / п .
в) Вычисляют величину
2 +"b[mij-ml)
= 11
(8.3.2)
т.
распределением которой, при справедливости предположения Н0,
достаточно большом п и trijj > 5, близко к ^-распределению с (/ - l)(v - 1)
степенями свободы. И если %2 <%1а =Ха» гипотезу Н0 принимают.
Задача 8.6. Предполагается, что применение новой технологии
приведет к увеличению выхода годной продукции. Результаты
контроля двух партий продукции, изготовленных по старой и новой
технологии, таковы:
Технология
Новая
Старая
Всего
Изделия
годные
ти - 140
Юл = 185
т., =325
негодные
W|2 = 10
w,t - 15
т., = 25
Всего
я, = «,, =150
п2 = п2* = 200
л = 350
Подтверждают ли эти результаты предположение об увеличении
выхода годной продукции? Примите а = 0,01.
Решение. В задаче требуется проверить гипотезу об однородности
двух выборок (/ = 2), извлеченных из продукции, изготовленной
по старой и по новой технологии, причем каждая из этих выборок
разбита на v = 2 группы. Иначе, требуется проверить гипотезу Я0: /?,, =
= р2\ и/7|2 — /?22» гДе Ри(Р2\)— вероятность изготовления годного
изделия при новой (старой) технологии, а рп(р17) — вероятность
изготовления брака при новой (старой) технологии. Так как рп = 1 - р1Ь то
сформулированная гипотеза равносильна гипотезе Н0: ри -р2].
Проверим ее двумя способами:
194
1. С помощью критерия tf. Если гипотеза Я„ : ри = p2i верна,
то ожидаемые частоты будут такими:
т' =/i,./i.,/;i= 150-325/350= 139,3,
т\ =«|.rt.2//i= 150-25/350= 10,7,
т' =/i3./i.,/« = 200 -325/350- 185,7,
/и*, = ":-"-'" - 200 25/350-14,3.
Все ожидаемые частоты т* >5 - Вычислим
, (140-139,3)2 (Ю-10,7)2
у~ = -^— — + -—— — +
139,3 10,7
(185-185.7)2 (15-14.3)2 ЛЛ
+ ^— —!- + ± -!- = 0,086.
185,7 14,3
По таблице П. 6.3 при к = (/ - 1 )(v - 1) = (2 - 1 )(2 - 1) = 1 и р = а =
0,01 найдем %~М)] - 6,64; так как у/ = 0,086 < 6,64, то гипотезу //()
принимаем: считаем, что приведенные данные не подтверждают
предположение об изменении выхода годной продукции при применении
новой технологии.
2. С помощью Z-критерия (см. табл. 8.3). Итак, //„ : ри = р,,.
Примем за альтернативную гипотезу Я, : рп > рг[. Если гипотеза //„ верна,
оценка вероятности изготовления годного изделия будет такой:
р =(/я,,+Я12,)/(/1,+я2)=(140+ 185)/(150 +200) = 0,929,
Оценки вероятностей/?,, и/?2, таковы:
Ри =/и, ,//?,= 140/150 =0,933, a p2i = mv/n2 = 185/200- 0,925.
Тогда значение статистики
z = (Ai-/>2i)/ JHx-p)\ ~ + l
равно 0,288.
Далее, при ос = 0,01 по табл. П. 6.1 найдем число ц1а, при котором
Ф("2|х) = (1 - 2а)/2 - 0,49; и2в - 2,35. Так как 0,288 < 2,35, гипотезу //„
принимаем.
8.4. ВВЕДЕНИЕ В ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ используется для выявления влияния
на изучаемый показатель некоторых факторов, обычно не
поддающихся количественному измерению. Суть метода состоит в
разложении общей вариации изучаемого показателя на части, соответству-
195
ющие раздельному и совместному влиянию факторов, и
статистическом изучении этих частей с целью выяснения приемлемости гипотез
об отсутствии этих влияний. Модели дисперсионного анализа
в зависимости от числа факторов классифицируются на однофактор-
ные, двухфакторные и т.д. По цели исследования выделяют
следующие модели: детерминированная (Ml) — здесь уровни всех факторов
заранее фиксированы, и проверяют именно их илияние, случайная
(М2) — здесь уровни каждого фактора получены как случайная
выборка из генеральной совокупности уровней фактора, и смешанная
(МЗ) — здесь уровни одних факторов заранее фиксированы, а уровни
других — случайная выборка.
Однофакторный дисперсионный анализ
В основе однофакторного дисперсионного анализа лежит
следующая вероятностная модель:
Yk('] = MY + Q(i) + E({\ (8.4.1)
где У/° — значение случайной величины У, принимаемое при уровне Л*'\ i —
= 1,2,..., v, фактора А в k-м наблюдении, к = 1, 2, ..., /?,;
9(,) — эффект влияния на Y^ уровня А(,)\
е^ — независимые случайные величины, отражающие влияние на УЛ(,)
неконтролируемых остаточных факторов, причем все е^'> ~ N(0, аЛ).
При этом в модели Ml все 0(,) — детерминированные величины
и £б('Ч -0 ; а в модели М2 6(,) — случайные величины (значения слу-
; = 1
чайного эффекта Э), 8(,) = 8 где 8 ~ N(0, а^), и все 8(,> и е^ — независимы.
Найдем общую вариацию 5й результативного признака Y и две
ее составляющие — SA и SK, отражающие соответственно влияние
фактора А и влияние остаточных факторов:
v "< _ _ v _2ц /
52=Z Z (Yk(i) - Y)'где Y=Z Z Yk] h —общая срадняя;
i = 1 к = I i: = U = 1 /
S] = Y,(YV) -?f и,-, где F(0 = £ Yk(i) n.t — групповая средняя;
1=1 к=1 /
si=£l:(»r-i™),=i«.-a?. w ?=£(уу-7«)2 L -
/=] А- = l /=l A = l
групповая дисперсия.
196
Нетрудно убедиться в том, что S2 =S2A + S2R . Разделив все части
этого равенства на п, получим:
^_ = £l+5l, „ли д2у=д2 + д2 (8.4.2)
п п п
— это правило читается так: «Общая дисперсия наблюдений равна
сумме межгрупповой дисперсии (это дисперсия а^,, групповых
средних) и внутригрупповой дисперсии (это средняя о2 из групповых
дисперсий)».
Для выяснения того, влияет ли фактор А на результативный
признак:
♦ в модели Ml проверяют гипотезу Я0 : 0(1> = 6(2> = ... = 9(v> =0
(если она будет принята, то для всех ink математическое
ожидание Л/У/° = MY [см. формулу (8.4.1)], а это означает,
что при изменении уровня фактора групповая генеральная
средняя не изменяется, т.е. рассматриваемые уровни
фактора А не влияют на У;
♦ в модели М2 проверяют гипотезу Я0: а\ = 0 (ее принятие
означает что эффект 9 — постоянная величина, а с учетом
условия Л/0 = 0 получим, что 0 = 0, т.е. фактор А не влияет на Y).
Критерии проверки этих и других гипотез, а также оценки
параметров модели (8.4.1) приведены в табл. 8.5.
Задача 8.7. Исследователь хочет выяснить, отличаются ли четыре
способа рекламирования товара по влиянию на объем его продажи.
Для этого в каждом из четырех однотипных городов (в них
использовались различные способы рекламы) были собраны сведения об
объемах продажи товара (в денежных единицах) в четырех случайно
отобранных магазинах и вычислены соответствующие выборочные
характеристики:
Способ рекламы
Объем продаж
",
v('>
t
1
140
144
142
145
4
142,75
4,92
2
150
149
152
150
4
150,25
1,58
3
148
149
146
147
4
147,5
1,67
4=v
150
155
154
152
4
152,75
4,92
197
Можно ли на 5%-ном уровне значимости считать влияние
доказанным?
Решение. Здесь фактором А является способ рекламы;
зафиксированы четыре его уровня, и выясняется, различаются ли по своему влиянию
именно зти уровни, — это модель Ml однофакторного анализа.
Обсудим, можно ли считать выполненными допущения модели
(8.4.1), а именно:
Y™ = MY + е(0 + Е{р , /, * = I,..., 4, (8.4.3)
где е[() независимы и е^' N(0,0^).
Так как MY и все 6(,) — постоянные величины, то при выполнении
(8.4.3) наблюдения КЛ(,) независимы и все
Г/° /V(Я/ = MY + QV), <r = а\). (8.4.4)
Допустим, что независимость наблюдений гарантируется ор1Яниза-
цией эксперимента; условие же (8.4.4) означает, что объем продаж при /-м
способе рекламы имеет нормальный закон распределения с.
математическим ожиданием я, = MY + 9(,) и с дисперсией, одинаковой для всех
способов. Допустим, что нормальное распределение имеет место. Используя
критерий Бартлетта (см. табл. 8.3), убедимся, что результаты испытаний
позволяют принять гипотезу //,' : а2 =... = а24 . Вычислим
±3s2 3£ln(3,27/.v,2)
;- I
= 3,27, х = ,л ,=1,538;
12 . _L 4__1_
3-3^3 3-4
по табл. П. 6.3 при /с = у-1=3и/7=а = 0,05 найдем yj2xi ~х\~ ^,82 ;
так как 1,538 < 7,82, гипотезу /-/„ принимаем.
Теперь проверим ключевую гипотезу дисперсионного анализа
//„ : е(" =... = е,4) = 0. Вычислим 5; - 220,19, Sj -39,27, S2 = 259,46;
убедившись в справедливости равенства (8.4.2), найдем оценку (8.4.5)
(см. табл. 8.5) si - 39,27/12 = 3,27 дисперсии a2R ; проверим,
выполняется ли неравенство (8.4.6) (см. табл. 8.5):
S2J\2
по табл. П. 6.4 при kt = 3, к2 = 12 и р = а = 0,05 найдем F2u - Fa - 3,49 .
Так как 22,43 > 3,49, неравенство (8.4.6) выполняется. Поэтому гипотезу
198
Таблица 8.5
Условия и критерии проверки гипотез
однофакторного дисперсионного анализа
М1
М2
6 , / = 1 + v, —детерминированные
величины,
>(<>
при этом £б(,)н, =0
91'' /V(0,08),/ = l + v , — случайные
величины, независимые между собой
и с г^.к - 1 + я,
MY = Y
s2R ~S2R/(n- v) —несмещенная оценка дисперсии o2R (8.4.5)
eM = Yv)~Y,i = l + v
v -
ii(v-l)
* _2
«2-z«;
несмещенная оценка дисперсии ae
^0:9<,)=e(2,=...=e<v>=o,
//0:o5 = 0,
область отклонения H„
5Л/(л-у)
(8.4.6)
При отклонении гипотез Н0 вычисляют коэффициент детерминации
f\2y/A=S2A/S2 (8.4.7)
— долю вариации наблюдаемых «игреков», объясняемую влиянием фактора А.
H0:Bll)=&k\ ^:6('Ve(/),
область отклонения Нп
Ш) у О)
W»-v)=-7= -^^>'« (8-4'8)
//п: MY - а0, //, : А/У * ап, область отклонения Н0
\y(i)-yU)\
|/(я - v)| = , * -L >/„
ylsl/(n-v)/j;
|f(/)_f(/)|
/(л-у) = , ' -,__>/„
Ш^)14~п "
199
Ht): 6(1> = ... = в(4> = 0 отклоняем: считаем, что зафиксированные
способы рекламирования продукции влияют на объем продаж; при этом вли-
S2
янием способа рекламирования объясняется т^^,^ • 100% =—~• 100% =
= 84,9% вариации объема продаж.
Далее, используя условие (8.4.8) (см. табл. 8.5), можно выяснить,
сравнимы ли по влиянию любые два из предложенных четырех
способов рекламы.
Изменим условие задачи. Предположим, что способы
рекламирования товара заранее не фиксированы, а выбраны случайным образом из
всего набора способов. Тогда выяснение вопроса о том, влияет или нет
способ рекламирования, сводится к проверке гипотезы //„: а~ = 0
модели М2. Критерий ее проверки такой же, как и в модели Ml. Так как
условие (8.4.6) отклонения гипотезы Н„ : ajy - 0 выполняется, гипотезу
забраковываем, по крайней мере до получения дополнительных
данных: считаем, что способ рекламирования товаров (во всем наборе
•утих способов) влияет на объем продаж.
Двухфакторный дисперсионный анализ
(с одинаковым числом т > 1 наблюдений
при различных сочетаниях уровней факторов)
В основе двухфакторного дисперсионного анализа лежит
следующая вероятностная модель:
y^J) = my + q('] + е(дУ) + e^j/* + e(A'v/>, (8.4.9)
где YJ:1'п значение случайной величины К, принимаемое при уровне А{1),
i = 1, 2, ..., v.„ фактора А и уровне Ви\ j = 1,2,..., vB, фактора В в к-м.на-
п
соответственно уровней А{'\ В^} и взаимодействия А[,) и Ви); ек''7> —
независимые случайные величины, отражающие влияние на Yk"j)
неконтролируемых остаточных факторов, причем Ek'J) ~ N(0, GR).
Найдем общую вариацию S2 признака К и ее четыре
составляющие — S2A , S2B, S2AB , Sf,, отражающие влияние соответственно
факторов А, В, их взаимодействия и остаточных факторов:
блюдении, к = 1, 2,..., т; в^, Э^, Q('('J} —эффекты влияния на Yk"j)
200
s^ttiirr-rf.
/ ^ I у = U- = 1
_ v. V„ ,„ I
где Y =XZZy*"'7 /л' " = ^/'"/;
./ = U = 1 /
./ = '
где Г«» =££n"'7(v-'w);
^=£±1(^/,-^/')2.
/ = 1 ./• * 1A = 1
Нетрудно убедится в том, что S2 = S2A + S23 + S2AB + S2R.
Оценки параметров всех трех типов модели (8.4.9): Ml, М2
и МЗ, проверяемые гипотезы и критерии их проверки приведены
в табл. 8.6. В моделях М2 и МЗ предполагается, что все случайные
эффекты независимы как между собой, так и с Е^.'"').
ВОПРОСЫ И ЗАДАЧИ
1. Приведите примеры статистических гипотез (основной и
альтернативной) из области коммерческой или биржевой деятельности.
2. Основную гипотезу отклоняют, если значение статистики критерия
попадает в критическую область. Почему?
3. Прогноз задолженности квартплаты по РЭУ таков: средняя
задолженность равна 120 у.е. Среднее квадратичное отклонение задолженности
а = 20 у.е. Выборочные подсчеты по девяти РЭУ дали среднюю задол-
201
Условия и критерии проверки гипотез
М1
/= 1 + v/,,y = 1 +V„—
детерминированные величины
£>•'> = о, £е</>=о,
;=] ./-1
§(/) = рчо_Р1 ,= |+v,,
вуиг^-г,у=|+Уя,
*AJ)«^-rf-4'> + r
^:eS»=...-^>«0.
область отклонения W„
52 -
F(vA-\,n-vAvB) = ^->F2a;
яв:е*!) = ...=е<;',=о1
область отклонения Нв
2
SR
И .a(l,l)_ _q(v.„v,)_q
При отклонении какой-либо из гип
показывающий долю вариации наб
М2
eS>-tf(o,oeJ, вУ>-^(0,ав,),
'=1 -«-v^y-l+v.
92
wy _ у. г2 _ °Л
*e,s(*J--4)/(«vfl).
^^(•'в-.^я)/^).
<.4u-*i)/w
^:<=0,
область отклонения НЛ
5ЛЯ
"*:<=(),
область отклонения Нв
^:<=0.
область отклонения Н„а такова:
отеэ Нд, Нв, НАд вычисляют соответствующий
людаемых «игреков», объясняемую влиянием
Примечание. Используются такие обозначения: sA = SA/(v А - 1),
202
Таблица 8.6
двухфакторного дисперсионного анализа
мз
е;\|=1 + ^,
— детерминированные величины,
( = 1 ; = 1
e(ey>-^(0,oeJ,y=:l + ve;
#iaJ)-N(0,a9M)
ei/\y=i+vfl,
— детерминированные величины,
У=1 7=1
У = 1
ey-^fO.OeJ./^l+v,;
^-"(O.aJ
— несмещенная оценка дисперсии 0R
бу = г^-г, i-i+v,.
^ft=(4-4)/(wvJ.
^=(^fl-4)/w
я,:е^=... = е^=о,
область отклонения Н„
Я,:а^«0.
область отклонения Нв
F(ve-1, «-v/)vfl) = ^f>F:a;
5Л
^:<й-0.
ei'W^-y, /=i+v,.
\ =(^-4)/(^VB),
^=(^fl~4)/w
ЯЛ:в(/|,=... = в(;')=0,
область отклонения Hg
^K-b(v,-i)(ve-i))=4^>^
5ЛЯ
/V<=o,
область отклонения НЛ
F(v4-1, «-v.,vfl) = ^->F2a;
",»:<.=<>•
^(K-0(^-i),"-v^vfl)=4A*>^«.
коэффициент детерминации: fjj.^ =S2A/S2 гЦг/в — S2B/S2 ,T\Yiab ~Sab/S ,
соответственно фактора А, фактора В и их взаимодействия.
Й = *2/(ve - О. -4 = ^fl/[(v, - l)(ve - 1)].
203
женность 135 у.е. Принимается ли прогноз или отвергается при а -
= 0,05? Какова вероятность того, что вывод будет ошибочным?
4. Что такое мощность критерия? Какой критерий называется наиболее
мощным? Докажите справедливость выражений для мощности
критериев, приведенных в табл. 8.2.
5. Партия изделий принимается, если дисперсия контролируемого
размера не превышает 0,2. По выборке и - 40 изделий вычислена s2 = 0,25.
Можно ли принять партию при а - 0,05?
6. Статистика по страховому обществу утверждает, что только 3 из
каждых 10 визитов страхового агента заканчиваются заключением
договора о страховании. Однако агент Иванов в результате 100 визитов за
месяц заключил 40 договоров. Если Вы — начальник Иванова, что Вы
решите: случайны его результаты или они свидетельствуют о его
высокой квалификации?
7. Поставщик ламп накаливания утверждает, что средний срок службы
лампы равен 2500 ч. Для выборки из 37 ламп средний срок службы
равен 2325 ч при среднем квадратичном отклонении 600 ч. Проверьте
справедливость утверждения поставщика при а = 0,05. Вычислите
мощность критерия, если Н{.а- 2390.
8. Средненедельный объем продаж для 15 торговцев района А составил
3000 дол. при среднем квадратичном отклонении 500 дол., а для
10 торговцев района В — 2600 дол. при среднем квадратичном
отклонении 600 дол. Значимо ли различие средненедельных объемов продаж
в районах А и В при 5%-ном уровне значимости? Значимо ли
превышение средненедельного объема продаж в районе А по сравнению
с районом В при 5%-ном уровне значимости? Предполагается
нормальное распределение объема продаж для торговца.
9. Сторонники строительства крупной ГЭС утверждают, что по крайней
мере 50% населения поддерживают данное строительство. Из 200
опрошенных 40% высказались за данный проект, а 30% — за
строительство малых ГЭС. При 5%-ном уровне значимости проверьте
справедливость утверждения сторонников крупной ГЭС; сравните количество
сторонников крупной и малых ГЭС.
10. На протяжении месяца в произвольно отобранных районах А и В
фирма проводила новые мероприятия по расширению торговли, а в двух
других произвольно отобранных районах С и D торговля велась
традиционными методами. Число покупателей за текущий и за предыдущий
месяцы по четырем районам таковы:
Район
Число покупателей за предыдущий месяц
Число покупателей за текущий месяц
А
75
115
В
45
75
С
30
40
D
150
170
По-видимому, в районах, где фирма проводила специальные
мероприятия, она добилась больших успехов, чем в остальных районах.
а) Определите ожидаемое число покупателей по каждому району
за текущий месяц при условии неэффективности новых
мероприятий (для вычисления доли суммарного числа покупателей,
ожидаемого для каждого района в текущем месяце, используйте данные
о числе покупателей в предыдущем месяце).
б) Существенно ли при 5%-ном уровне значимости различие между
распределениями наблюдаемых и ожидаемых частот для текущего
месяца?
11. Проверьте гипотезу о законе распределения, который определяется
двумя параметрами, причем значение одного из них известно, а
значение другого оценивалось по выборке, по следующим данным:
т,
nPi
2
1
5
3
15
11
14
15
15
18
21
24
12. Сравните при 1%-ном уровне значимости четыре фирмы по
качественному составу годной продукции, классифицированной по трем сортам,
по следующим выборочным данным:
Сорт
1
2
3
Фирма
1
147
109
39
2
184
113
57
3
120
129
33
4
282
139
49
13. Фирма с целью установления известности ее продукции опросила
в каждом из 100 населенных пунктов по 20 человек. Распределение
числах,, не знакомых с продукцией фирмы, таково:
X,
Число
пунктов
0
65
1
20
2
10
3
3
4
1
5
1
Можно ли при 5%-ном уровне значимости считать, что число
незнакомых с продукцией фирмы подчиняется закону Пуассона?
14. По данным задачи 7 гл. 7 выясните, можно ли считать, что
продолжительность жизни имеет показательный закон распределения? Примите
а = 0,01; 0,05.
15. Приведите примеры экономических задач, требующих использования
дисперсионного анализа (моделей Ml, М2, МЗ).
205
16. В трех магазинах, продающих товары одного вида, данные
товарооборота (в д.е.) за 8 месяцев работы таковы:
Магазин
1
2
3
Месяц
1
19
20
16
2
23
20
15
3
26
32
18
4
18
27
26
5
20
40
19
6
20
24
17
7
18
22
19
8
35
18
18
Допустив, что условия дисперсионного анализа выполняются,
проверьте гипотезу о равенстве средних товарооборотов магазинов.
Оцените параметры соответствующей модели дисперсионного анализа.
Если гипотеза отклоняется, оцените долю вариации товарооборота,
объясняемую влиянием «магазина», проведите попарное сравнение
средних. Примите а = 0,01.
Измените условие задачи: предположите, что три магазина случайно
отобраны из всей совокупности магазинов, продающих товары одного
вида. Влияет ли «магазин» на средний товарооборот? Оцените
параметры соответствующей модели дисперсионного анализа,
17. Из совокупности экспертов извлечена случайная выборка в 10 человек.
Каждый эксперт оценивал случайно выбранные 20 студенческих работ
по пятибалльной шкале. Общая вариация оценок S2 - 1831,6, вариация
оценок, обусловленная различиями экспертов, S^ = 94,32. Кто в
среднем отличается больше: эксперты или студенческие работы, которые
оценивает один и тот же эксперт?
18. Считая уровни факторов А и В фиксированными величинами,
проведите двухфакторный дисперсионный анализ по следующим данным:
д..(
д13,
В"1
6,3
6,5
7,9
6,3
6,8
7,9
6,4
6,9
8,0
В121
7,2
7,9
9,0
7,3
7,9
8,9
7,5
8,0
8,9
19. Проведите полное исследование различных моделей двухфакторного
дисперсионного анализа по следующим данным: vA — 3, vB~ 5, т — 2,
S] =31,55=17, S*B=3,S2 = 53.
ГЛАВА9
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
Корреляционный анализ и регрессионный анализ являются
смежными разделами математической статистики и предназначены
для изучения по выборочным данным статистической зависимости
ряда величин, некоторые из которых являются случайными. При
статистической зависимости величины не связаны функционально, но как
случайные величины заданы совместным распределением вероятностей.
Исследование взаимозависимости случайных величин приводит
к теории корреляции как разделу теории вероятностей и
корреляционному анализу как разделу математической статистики. Исследование
зависимости случайной величины от ряда неслучайных и случайных
величин приводит к моделям регрессии и регрессионному анализу на
базе выборочных данных. Теория вероятностей и математическая
статистика предоставляют лишь инструмент для изучения статистической
зависимости, но не ставят своей целью установление причинной связи.
Представление и гипотезы о причинной связи должны быть привнесены
из некоторой другой теории, которая позволяет содержательно
объяснить изучаемое явление.
Формально корреляционная модель взаимосвязи системы
случайных величин X = (Хь Х2, ..., Хк)' может быть представлена в
следующем виде:
X=f{X,Z),
где Z — набор внешних случайных величин, оказывающих влияние на
изучаемые случайные величины.
Примером корреляционной связи является статистическая
взаимозависимость между отдельными частями человеческого тела. В
случае же парной и множественной регрессии одна случайная величина
(зависимая переменная Y) зависит от ряда неслучайных факторов,
которые представлены независимыми переменными х' = (л^, х2, ..., хк),
и от набора случайных величин Z:
Примером регрессионной зависимости служит зависимость
между урожайностью определенной сельскохозяйственной культуры и
влияющими на нее природными и экономическими факторами.
207
Первый параграф настоящей главы посвящен корреляционному
анализу как инструменту исследования статистической
взаимозависимости на основе выборочных данных. В остальных параграфах
приводятся сведения по исследованию зависимости результирующих
экономических показателей от детерминированных
природно-экономических факторов с помощью регрессионного анализа.
9.1. ВВЕДЕНИЕ В КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
9.1.1. Паркая корреляция
Корреляционная зависимость двух случайных величин задается
моделью
X = X(Y,.Z),Y=Y(X4Z),
где Z — набор внешних случайных факторов.
Парная корреляция занимается изучением характеристик
взаимосвязи двух случайных величин. Основой получения этих
характеристик служит совместное распределение случайных величин
F(x,y) = P\X<x,Y<y}.
Коэффициент корреляции уже был рассмотрен в § 3.6:
M(X-MX)(Y-MY) i ,
p = _J 11 L% aY=y[DXtaY=yfDY. (9.1.1)
oxgy
Линиями регрессии у по х и х по у называются линии условных
математических ожиданий:
y(x) = M(Y/X=x), x(y)=M{X/Y = y). (9.1.2)
Линии условных дисперсий характеризуют, насколько точно
линии регрессии передают изменение одной случайной величины при
изменении другой:
a2Y,x = D(Y/X=x) = M\[Y-y(x)]2/x = x}t
(9.1.3)
a2x/y=D(X/Y = y) = M{[X-x(y)]2/Y=y}.
Средние из условных дисперсий характеризуют точность
прогноза одной случайной величины с помощью другой на всем
диапазоне изменения последней:
208
a2Y!,=M[Y-y(X)]\
(9.1.4)
o2x/Y=M[X-x{Y)] .
Точные (или приближенные) прямолинейные рефессии
у(х) = а, + Р,л\ х(у) = а2+ (52у
задаются следующими коэффициентами:
<5Х <5Х Су GY
' а,=МК-Р,Ш\ a2 = MX-$2MY.
Если случайные величины X и Y независимы, то р = 0, все
условные математические ожидания и дисперсии не зависят от
фиксированного значения другой случайной величины и совпадают с
безусловными:
y{x) = MY, х(у) = МХ, <52у/х=<52у, а2х/у=<52х.
В случае нелинейных регрессий степень концентрации
распределения вблизи линии регрессии показывает корреляционное
отношение
цу/х =J-M[y{X)- MY]' = \-2jUJL, (9.1.5)
Как видно, корреляционное отношение меняется в пределах от О
до 1, оно равно единице тогда и только тогда, когда GYIX =0> т-е- все
распределение сосредоточено на кривой регрессии (имеет место
функциональная зависимость). Это отношение равно нулю тогда и только
тогда, когда линия регрессии у по х представляет собой
горизонтальную прямую линию, проходящую через центр распределения, т.е. если
Y и X некоррелируемы. Можно доказать, что во всех случаях
р2<г\х/у, р2<Цу/х.
9.1.2. Множественная корреляция
При изучении корреляционной зависимости между более чем
двумя случайными величинами Л",, Х2, ..., Хк с заданным совместным
распределением используют множественные и частные коэффициенты
корреляции и корреляционные отношения.
209
Применение обычных коэффициентов парной корреляции
при множественной корреляции для изучения связи двух случайных
величин может привести к неправильными выводам. Если коэффициент
парной корреляции между двумя случайными величинами уменьшается
или становится близким к нулю при других фиксированных случайных
величинах, то можно сказать, что взаимозависимость этих случайных
величин в значительной мере (или определяющим образом) имеет место
благодаря третьим факторам. Если же при фиксации третьих факторов
степень взаимозависимости двух случайных величин возрастает, то это
означает, что эти факторы «маскировали» истинную взаимозависимость
двух случайных величин.
Частный коэффициент корреляции — это мера линейной
зависимости между двумя случайными величинами из некоторой
совокупности случайных величин ХЛ, Хъ ..., Хь когда исключено влияние
остальных случайных величин:
п -о _M(Y]-MY])(Y2-MY2)
Pi,2. -Pi,2«3 k) — » С9-1-6)
где К, =*,-*;.
a Jf|= X*t[ik), Х2 = Х2,(Л k) — наилучшие линейные приближения
величин Хъ Х2 случайными величинами Х3 Xh коэффициенты
которых определяются из следующих соотношений:
Г к \ ( .к
^ ) а { /=з
Частный коэффициент выражается через элементы
корреляционной матрицы R= р J , составленной из коэффициентов парной
корреляции:
А
4^К
п\'тМ
а
Р,.2.(3 *,=" -7=%=- (9Л-7>
Здесь R0 — алгебраическое дополнение элемента р,у- в
корреляционной матрице.
Выше было показано, как по различию между обычным и
частным коэффициентами корреляции можно судить о зависимости Хь Х2,
между собой и от других случайных величин. Если случайные вели-
210
чины Х\, Х2, ..., Хк попарно не коррелируемы, т.е. рг/ = 0 при / Ф j, то
и все частные коэффициенты корреляции равны нулю.
Множественный коэффициент корреляции служит мерой
линейной зависимости между случайной величиной Л", и некоторым
другим набором случайных величин Хъ ..., Хк. Множественный
коэффициент корреляции р,.(2 к) определяется как обычный коэффициент
парной корреляции между Хх и Х} , где Х} — наилучшее линейное
приближение Хь случайными величинами Х2, ..., Хк, коэффициенты
которого определяются из соотношения
( к
minM
^i-ao-Za^
При к - 2 множественный коэффициент корреляции совпадает
с обычным коэффициентом корреляции.
Множественный коэффициент корреляции выражается через
элементы корреляционной матрицы следующим образом:
2 det /? ,„ , пч
Р?.=РЦ2 *) = 1-^~' (9Л<8)
К\1
где det R — определитель матрицы R\
Rn — алгебраическое дополнение элемента pj,.
Если р]# = 1, то величина^ с вероятностью, равной единице,
равна линейной комбинации случайных величин Хъ ..., Хк. С другой
стороны, р,, = 0 тогда и только тогда, когда Хх не коррелирована ни
с одной из случайных величин Х2,..., Хк, т.е. р12 = ... = р]к = 0.
Для вычисления множественного коэффициента корреляции
можно также использовать следующую формулу, которую легче
интерпретировать, чем формулу (9.1.8):
_ 2 -)_a'-(2 *»=1_.g^L (919)
Kl. -Pl.(2 к)~1 2 nv ' \УЛУ)
а, ш.
Именно это выражение оправдывает назначение коэффициента
множественной корреляции как показателя тесноты линейной связи.
В самом деле, чем лучше приближается случайная величина Хх
линейной комбинацией случайных величин Х2, ..., Хк, тем ближе значение
этого коэффициента к единице; чем хуже линейное приближение, тем
этот коэффициент ближе к нулю.
211
Совокупность методов оценки корреляционных характеристик
и проверка статистических гипотез о них по выборочным данным
называется корреляционным анализом. В корреляционном анализе
используются следующие основные приемы:
1) построение корреляционного поля (двумерных и
трехмерных сечений пространства, если речь идет о многомерном
пространстве значений случайных величин Хл, Х2, ..., Хк), и составление
корреляционной таблицы;
2) построение выборочных коэффициентов корреляции и
корреляционных отношений;
3) проверка статистических гипотез о значимости связи.
Некоторые их этих приемов уже были рассмотрены в гл. 8,
поэтому приведем лишь основные результаты, касающиеся методов
и приемов корреляционного анализа.
9.1.3- Анализ парной корреляции
При изучении по выборке (х(, _>>,), (х2, у2), •., (х„, у,)
корреляционной зависимости двух случайных величин общую картину их
взаимной изменчивости можно получить, изобразив на координатной
плоскости все выборочные точки. Это изображение называется
корреляционным полем. На рис. 9.1 приведено корреляционное поле,
отражающее зависимость между ростом и весом человека.
У ,
70
60
50
i
-
-
-
У =
-а
l 1
150
•
i
•
•
#^
•
•
1
160
. 1у*
Si #
7 •
/ •
1 1 1
170 180
X
Рис. 9.1. Корреляционное поле зависимости
между ростом и весом наугад взятого человека
212
Если выборка небольшая, как это имеет место в примере 9.1 (см.
рис. 9.1), то оценки корреляционных характеристик вычисляют
непосредственно по выборочным данным с помощью следующих формул:
оценки первых моментов
оценки вторых моментов
A2.o=eJ=-Z(*/-*)2. (9ЛЛ1>
п j=]
nj=l
По этим оценкам в свою очередь определяются оценки
коэффициентов парной корреляции и приближенных линейных регрессий:
Y,{xj-*){yj-y)
, = *^£) = _^_ , (9.U2)
V/ = l 7 = 1
a,=y-^x, ft=p-?4 (9.1.13)
В качестве примера рассмотрим расчет корреляционных
характеристик парной зависимости между ростом и весом наугад взятого
студента-первокурсника.
Пример 9.1. Расчет корреляционных характеристик
Исходные данные приведены в табл. 9.1. Для расчета
корреляционных характеристик воспользуемся формулами (9.1.10)—(9.1.12).
213
Номер
наблюдения
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Е
Рост,
х;
165
171
182
165
183
180
183
166
173
184
168
164
170
174
172
2 620
см
х. -х
-9,7
-3,7
7,3
-9,7
8,3
5,3
8,3
-8,7
-1.7
9,3
-6,7
9,3
-4,7
-0,7
-2,7
-
Вес, кг
У/
72,9
48,4
66,3
64,1
62,7
, 76,0
72,8
50,6
52,3
68,6
52,6
72,8
61,6
66,8-
56,5
945
УГУ
9,9
-14,6
3,6
1,1
-0,3
13
9,6
-12,4
-10,7
5,6
-10,4
9,8
-1,4
3,8
-6,5
-
Используя табл. 9.1, прежде всего находим средние
арифметические выборочных значений:
1 Д 2620 ,„, „
х= У>,= = 174,7;
IS f^ ' 15
1 V 945 (л п
У = > У,= = 63,0.
15 f^ ' 15
Вычислив отклонения от средних, одноименные отклонения
возведем в квадрат, разноименные — перемножим. Суммируя, имеем:
Х(.^.-х)2 =747,35; £(^-?)'=»П53;
> = i у = i
£(*,-*)(v,-7) = 482.
Используя приведенные выше суммы, получаем:
^^51(х.г4 =^ = 49,82; 6, =7,06;
15 ~
15
»и=-%(х>-х)(У;~у)=-[Г = 32>12-
Теперь можно определить эмпирический коэффициент корреляции
и оценки коэффициентов приближенной прямолинейной регрессии:
32,12
p = J^-
дхду 7,06-8,77
= 0,519;
.6
Р,=М- = 0,645; а, =:?-&* = 49,7;
р2=р-^ = 0,418; а2 = *-р2у = 148,4.
о*
Соответствующие прямолинейные линии регрессии изображены
на рис 9.1.
Если выборочных данных много, то их объединяют в
корреляционную таблицу, в каждой клетке которой указывают число
попавших в нее выборочных данных пкт. Клетке таблицы соответствует
на корреляционном поле прямоугольник с координатами центра:
хк =xQ + (к- \)Ах, к = 1,..., пх,
Ут = Уо + (т-\ )Ду, т = 1, ..., Пу,
при этом
«к = Z Пкт • Пт = Z Ппк' Z Z "*»' = П.
т - ) Л = I иг ™ I А с I
где «г,«,, — число равных интервалов длины Дг, Ду, ни которые разбиты
области выборочных шйчеиий случайных величин X, Y.
При использовании данных корреляционной таблицы формулы
(9.1.10) и (9.1.11) принимают следующий вид (они отличаются от
предыдущих на погрешность округления, возникшую в результате замены
координат каждой выборочной точки координатами центра
прямоугольника, в которой эта точка попала):
х- / ,Пкхк'
к = \
'=-Т,"Л>
Л1 = 1
1 "л 1 "у
*=i
п „"Г,
^U=-2l2l(xk-x){ym~y).
п к = 1 m = I
(9.1.14)
215
По данным корреляционной таблицы можно построить
эмпирические регрессии:
У(х*)=—Т,Уи,пы> к = 1...,пх,
Ч «1=1
х (У,„) =— £****„,, « = !,..., пу
А=1
(9.1.15)
Если линии эмпирической регрессии заметно отклоняются от
нелинейной формы, то в качестве меры связи необходимо использовать
выборочные корреляционные отношения:
Л
г/х
\X/Y
Д2
zl[y(xk)-y]2nk Ак>
*=1 /
Z[*U,)-*]\, fix
т = \ /
(9.1.16)
Величину г\х/у -р2 используют в качестве индикатора
отклонения регрессии от линейной.
Проверка гипотезы о значимости связи основывается на
распределениях выборочных корреляционных характеристик. В том случае,
если совместное распределение случайных величин X, Y нормальное,
выборочный коэффициент корреляции значимо отличается от нуля,
если
л2 1
р >1+(«-2)АГ
(9.1.17)
где ta= ta(n -2) — критическое значение распределения Стьюдента с п - 2
степенями свободы, соответствующее уровню значимости а.
Если связь значима, то для истинного коэффициента
корреляции имеет место следующий приближенный доверительный интервал
(при больших выборках, см. также гл. 8):
1-р' ^ 1-Р2
л/я л/я
(9.1.18)
где иа — критическая граница нормального распределения,
соответствующая уровню значимости ос.
216
9.1.4. Анализ множественной корреляции
В случае множественной корреляции основой статистического
анализа служит матрица выборочных значений Х~ |^/;||;у = 1, ..., л, i -
~ 1, ..., к, п — объем выборки, к — число рассматриваемых случайных
величин. Для анализа парной зависимости могут быть использованы
формулы, приведенные выше для анализа парных корреляций. Однако
парная зависимость осложнена влиянием других случайных величин.
Поэтому наряду с корреляционной матрицей, состоящей из
коэффициентов парных корреляций, и с другими характеристиками парной
корреляции необходимо использовать и выборочные характеристики
множественной корреляции — частные и множественные
коэффициенты корреляции.
Выборочную оценку коэффициента частной корреляции
случайных величин Хь Х2, если исключено влияние остальных случайных
величин Л'з, .., Xh можно получить с помощью следующего выражения
(аналога выражения (9.1.7.)):
РГ.2. =РГ.2.(3 к) =—Г==* (9119>
\IR] 1^22
где /?(. — алгебраическое дополнение элемента р. выборочной
корреляционной матрицы R .
Сравнивая выборочные обычный и частный коэффициенты
парной корреляции р,у и р--,, можно делать выводы о том, насколько
взаимозависимость между величинами Х„ X; вызвана их зависимостью
от других случайных величин (различные варианты таких выводов
были даны, в начале настоящего параграфа).
В качестве выборочной оценки коэффициента множественной
корреляции используют выражение
Р,.=РИ2 W1-^ <9Л-20>
где Ь] — — ^Jх., - х [ 1 — полная выборочная дисперсия случайной величины Xt;
/2y=i
217
где xfi — наилучшие линейные приближения выборочных значений Хц
выборочными значениями xj7,..., xJh т.е.
к
Здесь а0,а2 ак определены методом наименьших квадратов:
Z xji-ao~1LaixJi
7=1
—»min.
Подробнее определение оценок коэффициентов линейной
регрессии и их свойства рассмотрены в последующих параграфах
настоящей главы.
Чем ближе значение выборочного коэффициента
множественной корреляции к единице, тем лучше приближение случайной
величины линейными комбинациями случайных величин Х2,..., Хк.
9.2. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Модель парной линейной регрессии имеет вид
у = а*) + щх + е,
где у — зависимая переменная (предиктор);
х — независимая переменная (регрессор);
у(х) = а,, + а,* — детерминированная составляющая;
£ — случайная составляющая (случайный остаток);
М-=0,
De = oz,
а,,, а, — параметры регрессии, которые должны быть определены
по выборочным данным.
Параметр а, показывает, на сколько единиц в среднем
изменится зависимая переменная (например, выпуск продукции в
стоимостном выражении), если независимая переменная (например, число
занятых) увеличится на единицу.
Независимая переменная х — неслучайная величина, напротив,
зависимая переменная у — случайная величина, поскольку в нее
входит случайная составляющая е.
Поскольку изменение только одной независимой переменной х,
вообще говоря, не может вобрать в себя все источники вариации
зависимой переменной, то случайная составляющая и отражает
совокупное влияние на зависимую переменную всех других (кроме х)
факторов.
218
9.2.1. Идентификация модели
Оценка параметров регрессии (идентификация) проводится
либо по пространственной (у/( хД / = I, ..., п, либо по временной выборке
(у„ х,), t = I, ..., л. В первом случае носителями информации выступают
разные (но в определенном смысле однотипные) экономические
объекты, рассматриваемые в один и тот же момент времени. Во втором
случае носителем информации служит один и гот же объект в разные
моменты времени. Реже используется пространственно-временная
выборка.
Итак, пусть для определенности имеется конкретная
пространственная выборка (объема п): (у,-, xf),j = I, ..., п, тогда в случае
справедливости модели парной регрессии имеют место следующие п
соотношений (выборочных уравнений)
у, = а,, !- а,А- + е,, _/ = I,..., п. (9.2.1)
Эти соотношения трактуются по-разному для конкретной и
случайной выборок. В первом случае каждое выборочное наблюдение
{урх) — это просто пара чисел или точка в двумерном пространстве,
поэтому в соотношениях (9.2.1) е; = у-, - (ос<, + ос^) — конкретные числа,
являющиеся реализациями случайных величин £;. Во втором случае £,• —
настоящие случайные величины, поэтому и у7 также являются
случайными величинами. Необходимость в этой второй трактовке возникает
тогда, когда надо проверить качество полученных оценок параметров
регрессии, а это можно сделать лишь путем перебора всех возможных
ситуаций, т.е. по случайной выборке.
В последнем случае обычно делается предположение о
некоррелированности разных значений е; и ег, т.е.
cov(e/, £Л) = 0 при / Ф г.
Для получения оценок ос^а, применяется метод наименьших
квадратов (МНК): подбираются такие значения параметров, при
которых сумма квадратов отклонений фактических значений от
выравненных была бы минимальной
£(сс0, а,) = Y, (У/ ~ ао - а1Л'/ У -» min- (9-2-2)
/ -1
Под выравненным значением зависимой переменной для /-го
наблюдения понимается значение
yJ=ciL0 + alxi, (9.2.3)
лежащее на прямой у = clq + а,л\
219
С геометрической точки зрения минимизация суммы квадратов
отклонений (9.2.2) означает выбор прямой (из всех прямых с параметрами Oq,
а,), которая ближе всего «прилегает» по ординатам к системе выборочных
точек (yj,Xj)J =1,2,..., п, что показано на рис. 9.2.
У i
У,
У/
X
*
• 1
Х1
•
•
МНК-прямая
X
Рис. 9.2. Геометрическая интерпретация метода наименьших квадратов
Минимум квадратичной функции двух переменных Q(o^, а,)
находим, приравнивая к нулю производные
|£ = 2£(,;-а0-а,*,)(-1) = 0, (9.2.4)
ох\ ./ = 1
Приведем теперь эти уравнения к стандартному виду
(слева — неизвестные, справа — известные величины)
( п Л ( п \
W = > J
V/ = i J
CLn +
an +
( n V
(9.2.5)
Получившаяся система из двух линейных уравнений с двумя
неизвестными ссо, а( называется системой нормальных уравнений.
220
Она легко решается методом последовательного исключения
неизвестных
а0=у-ха,, (9.2.6)
_> = >
I
а, =
/ = i
где z, — х,- х (поэтому У^ z i = X (х; - X ) = пх - пх = 0 ).
/ = 1 / I
СВОЙСТВА МНК-ОЦЕНОК
Прежде всего докажем, что МНК-оценки не смещены. В са-
( » Л
мом деле
Ma, =^ = ^ = a„
5>? 2>2
/=i /=i
Ma0 =—VMv. -x/V/a, = a0 +a,jc-xa, = oc0,
и
таким образом, оценки действительно не смещены.
Теперь докажем, что МНК-оценки — состоятельны, т.е. сходятся
по вероятности к истинным значениям параметров. Для несмещенных
оценок достаточным условием состоятельности является сходимость их
дисперсий к нулю при неограниченном возрастании объема выборки.
Это следует из неравенства Чебышева:
Е
поэтому при Z)a, —>• 0
lim /*{!«, - а, | > ej = 0 , т.е. оценка состоятельна.
221
Осталось только показать, что Da, —» 0. Имеем
ах = Da, =
/ = |
поэтому Da, —» 0, если ^zj —> °° при и —> °°, а это будет иметь ме-
/ = i
сто тогда, когда zt =Xj -х ^0 (кроме конечного числа значений), т.е.
х/ не совпадают со своим средним значением.
Точно так же
a2x =Da()-JDv + x2Dal-2cov(y,xd])- —+ ^- (9.2.8)
2 —2 2
(Г дга
£>а„ = — +
-» 0 при тех же условиях, что и выше.
При этом было использовано равенство cov(y, a,) - 0 (которое
вытекает из условия 2_.z,■ = 0 ):
cov(_y,6c, ) = cov
Ev./
1 V1 / = '
5>?
1 " a "
=——ZzjcovU->>,/)=——Zz/=°-
Итак, МНК-оценки параметров регрессии a0,a, состоятельны.
НОРМАЛЬНЫЕ УРАВНЕНИЯ В МАТРИЧНОЙ ФОРМЕ
Запись нормальных уравнений в матричной форме позволяет
продемонстрировать их единообразное строение как в случае парной,
так и множественной регрессии.
222
Введем следующие обозначения
Y =
00
Уг
У}
(\
, Х =
О Хп J
(9.2.9)
Y — вектор-столбец выборочных значений зависимой переменной;
X — матрица выборочных значений независимых переменных х/0 з 1,
хп =X/J= 1 //.
Нетрудно прямым счетом убедиться, что матрица нормальных
уравнений равна
п Hxj
л =
7=1
I*; 1*5
= ХХ
(9.2.10)
и вектор правых частей нормальных уравнении
Ь =
T,yj
Hx:,yj
=xv,
(9.2.11)
поэтому нормальные уравнения в матричной форме имеют вид
хх
Vai7
= ху.
(9.2.12)
ОЦЕНКАДИСПЕРСИИ СЛУЧАЙНОЙ СОСТАВЛЯЮЩЕЙ
Поскольку речь идет о дисперсии случайной составляющей,
то ее оценку надо строить по сумме квадратов оценок е. =[У/ ~Уп
случайной составляющей
2
(9.2.13)
7 = 1
константу h подберем так, чтобы оценка была несмещенной.
223
Имеем
Ma2=hfdM(yJ-yj)2=hfjD(yJ-yi), (9.2.14)
последнее верно, поскольку М (>> - у ■\ = 0 .
Представим j)/. в следующем виде уt =y + aizj и найдем
(пользуемся соотношениями cov^, у) = О при / * /, соу(у;, yj) = а2):
D(^7 -^) = ^- + ^-2соу(^,^) =
а2 *2а2
= а'+ —+ ^ 2
и "
; = 1
2^2
а2 ^;а
= G
" 2>2
'" = ' У
Подставив последнее выражение в (9.2.14), получаем
Мд2 = ho2 (п-2), откуда h = ,
п-2
поэтому оценка дисперсии
А 2
О =■
п-2
2
T,(yj-yj)
./=i
(9.2.15)
является несмещенной.
1 2
РАСПРЕДЕЛЕНИЕ СТАТИСТИКИ — ^(у; ~ У/)
Эта статистика, т.е. функция от выборочных значений,
использовалась при построении несмещенной оценки дисперсии случайной
составляющей.
Докажем, что эта статистика имеет распределение X* с(п ~ 2)
степенями свободы, если значения случайной составляющей имеют
нормальное распределение, т.е. е,- - N(0, а).
В Приложении 2 доказано, что при а, - 0 статистика
-JrZOv-jO'-x'f-O
224
имеет распределение %2 с (и - 1) степенью свободы,
Разложим теперь полную сумму квадратов отклонений
S2 ~ ^{у; -у) на остаточную S2. = Х(^/ ~У/) и объясненную
7=1 7 = 1
В самом деле, имеем
S2 = l(yj -У? = !(■", *г, -?)2 = t[(yj -hlh -r)T
./=' ./' = ' 7 = 1
•±{yrh)1 + ±{>ry)1+->t[(yrh){h-y)\
, = l / = l / = l
поскольку последнее слагаемое равно нулю
"г "1 "
7 = ' 7 = 1
V7 = l ./ = 1 )
= а,
то
или
S^Sj+S2
л-2 л-2 Л2
а а а
Z»2 2
Но Vx2(""0. ^т-^Ц- =
/- - Л'
Л,
(9.2.16)
(9.2.17)
Х2(0 имеет при а, = 0
распределение %2 с одной степенью свободы, поэтому из (9.2.16)
следует, что
1
-ЬЦугЬ) -Х2(п-2)
имеет распределение % с (и - 2) степенями свободы.
ПРОВЕРКА ГИПОТЕЗЫ О НАЛИЧИИ РЕГРЕССИОННОЙ ЗАВИСИМОСТИ
Найденная оценка а, Ф 0 может быть реализацией случайной
величины, математическое ожидание которой равно нулю
/Wa, = aj = 0,
225
т.е. может оказаться, что никакой регрессионной зависимости на
самом деле нет. Для того чтобы разобраться с этой ситуацией, проверим
следующие две конкурирующие гипотезы:
Я0: а, = 0 (нет регрессионной зависимости),
Я[: ос, Ф 0 (есть регрессионная зависимость).
Будем считать, что случайная составляющая имеет нормальное
распределение, т.е. е, ~ N(0, а), поэтому оценка а, как линейная
комбинация значений зависимой переменной также нормальная случайная
величина
2
J = l
При нулевой гипотезе
-^ = Z~N(0,1). (9.2.16)
Поскольку дисперсия случайной составляющей неизвестна,
то в (9.2.16) ее приходится заменять оценкой
? = |L *|_. (9.2.17)
ля
Последняя величина называется расчетной t-значимостью
оценки и при нулевой гипотезе имеет распределение Стьюдента
с (п - 2) степенями свободы (Z~ N(0, 1))
бс, a* z
"\ _ «I _
"а,
1 _я
^H(yj-yj)'
■ = f(w-2),
«-2 -
поскольку статистика (как было доказано выше)
распределена по закону %2 с {п - 2) степенями свободы.
226
Для принятия решения применим следующий критерий
И*л,
Ht
I)
|f| >/„-»//,.
т.е. если расчетная / значимость по модулю не превосходит табличное
значение ta (/,»-— двусторонняя критическая граница распределения
Стшдента, отвечающая вероятности а), то принимается гипотеза //()1
в противном случае — гипотеза //,, Для такого критерия ошибка
первого рода равна а. В самом деле,
Р{н,/на)-рЩ>1а/на}-рЩ>1а}-л
0.2.2. Прогно! по урмн1НИюр1грюоии
ТОЧЕЧНЫЙ ПРОГНОЗ
Если известно значение независимой переменной дс, то прогноз
зависимой переменной ос у то стилисте и подстановкой лого значения
в оценку детерминированной составляющей
Я*)-А0+А,*-У + А,(дг-*). (9,2,18)
Вследствие несмещенности оценок параметров регрессии этот
прогноз также не смещен
Мр(х)шМй0 +.*■ Л/&, -а„ +<v-iP(.y). (9.2,19)
Показателем точности прогноза служит его дисперсия; чем она
меньше, тем точнее прогноз
с}ы - Dp{x) - Op + (.г - Т) /)А, - а:
/*|
(9.2.20)
Из формулы (9,2.20) ни дно, что прогноз тем точнее, чем больше
объем выборки, а при фиксированном объеме - точнее при большем
«разнесении» выборочных данных, и чем ближе значение независимой
переменной к среднему выборочному значению.
ИНТЕРВАЛЬНЫЙ ПРОГНОЗ
Поскольку согласно (9.2.19), (9.2.20) <P(a-)~/v(,P(a'),o(^)),
а дисперсия а3 в (9.2.20) заменяется се несмещенной оценкой по
формуле (9,2.15), то за середину доверительного интервала принимается
227
точечный прогноз зависимой переменной, а ширина доверительного
интервала выбирается пропорциональной стандартному отклонению
точечного прогноза
Р{а0 + &,х- taaHx) <а0 + а,* <а0 + а,* + /аа-(г)} =
= 1-а, (9.2.21)
г
°*)=°
1 (х-х)
- + - —
И 5>;
2
Z
г = 1
/а — двусторонняя критическая граница распределения Стьюдента
с (и - 2) степенями свободы.
Замечание. Интервальный прогноз зависимой переменной (т.е.
детерминированной и случайной составляющих вместе: у(х) = о^ +
+ а,х + е имеет вид
Р{а0+а1х-ггаако<у(х)<а0 + а,х<а0+а|х + /ааф^1-а,
где a;(v) = сг + — +
а' crix-jc)
Л-2
; = 1
Пример 9.1. Зависимость розничного товарооборота от числа
занятых
Исследуем зависимость розничного товарооборота (млн руб.)
магазинов от среднесписочного числа работников. Товарооборот как
результирующий признак обозначим через у, а среднесписочное число
работников (чел.) как независимую переменную (фактор) — через х.
На объем товарооборота влияют такие факторы, как объем основных
фондов, их структура, площади торговых залов и подсобных
помещений, расположение магазинов по отношению к потокам покупателей
и др. Предположим, что в исследуемой группе магазинов значения этих
последних факторов примерно одинаковы, поэтому влияние различия их
значений на изменение объема товарооборота сказывается
незначительно. В табл. 9.1 во втором и третьем столбцах приведены значения
соответственно объемов розничного товарооборота и среднесписочного
числа работников, а в следующих столбцах — значения расчетных
величин, необходимых для определения оценок коэффициентов регрессии
и дисперсии случайной составляющей
(z;. = *,. -х, Ду; ^у.~у,е^уГу.).
228
Таблица 9.1
Фактические и выравненные значения товарооборота в зависимости от числа занятых
Порядковый
номер
магазина
1
2
3
4
"5
6
7
в
Итого
Число занятых
х(чел.)
73
85
102
115
122
126
134
147
904
Товарооборот
У
(млн руб.)
0,5
0,7
0,9
1,1
1,4
1,4
1,7
1,9
9,6
7
-40
-28
-11
2
9
13
21
34
0
4у
-0,7
-0,5
-0,3
-0,1
0,2
0,2
0,5
0,7
0
■
1 600
784
121
4
81
169
441
1 156
4 356
Ayz
28
14
3,3
-0,2
1,8
2,6
10,5
23,8
83,8
(*у)2
0,49
0,25
0,09
0,01
0,04
0,04
0,25
0,49
1,66
У
0,43
0,661
0,998
1,239
1,373
1,45
1,604
1,854
1,199
е
0,07
0,039
-0,088
-0,139
0,027
-0,05
0,096
0,046
0,001
1
е~
0,0049
0,015
0,0077
0,0193
0,0007
0,0025
0,0092
0,0021
0,0479
На Иди ми итоги м иго рой и трем.с И колонок средние !F - 904/8 •
■113, у ■ 9,6/8 т 1,2, последовательно шнолняем 4-8-И столбцы
и мод под им итоги но Чтим столбцам. Теперь можно определят!,
эмпирические коэффициенты регрессии. По формулам (9.2,6) исходим
следующие точечные оценки коэффициентом регрессии:
Л"-У-1,2; ft,-^^*,/£ij-83.3/4336'"0,OI924;
&„ ■ у - ft,* ■ 1,2 - 0,01924 ■ 113 = -0,974,
У к
2,0 -
1,8 -
1,0 -
0,6 -
„ _ , J I J_ i ' »
SO 100 160 *
Рио. 9.Э. Фактические (ооединены пунктирной линией)
и выравненные (ооединены прямой) значении товарооборота
'Винчение хуленого коэффициенты (V представляет собой ординату
эмпирической линии регрессии it точке д' ~ ,? - ИЗ, и коэффициент
регрессии ft, * 0,019 угловой коэффициент по И прямо И линии,
Ни рисунке 9.3 изображены систем» соединенных штриховой линией
точек наблюдений и прямая эмпирической регрессии. Вели не
учитывать, что мы имеем не теоретическую, а эмпирическую линию
регрессии (которая действительно янляотоя приближением теоретической
линии регрессии), то коэффициент ft, - 0,01924 показывает, что
увеличение среднесписочной численности ни одного челояеки приводит к
увеличению объема тояарооборота в среднем mi 19,24 тыс, руб. Это
с нос го ром эмпирический норматив приростной эффективности
использования работников данной группы магазинов. Иели увеличение
численности ни одного работника приводит к меньшему росту объема
товарооборота, то прием его mi роботу необоснован,
Теперь можно вычислить выравненные значения (значения ординат
эмпирической линии регрессии)
^•JJ + ft,^-1,2 + 0,01924*,
и использовать 9, 10 и 11-й столбцы табл. 9.1. Итог 11-го столбца в свою
очередь позволяет получить оценку дисперсии случайной составляющей:
2 1 ^ 2 0,047
а ~
Ye) -^-* 0,008.
Знание дисперсии случайной составляющей позволяет проверить
статистические гипотезы о параметрах регрессии и уравнении в целом,
а также строить интервальные оценки параметров регрессии и
прогнозного значения детерминированной составляющей.
Для проверки гипотезы о том, значимо ли отличается от нуля
выборочный коэффициент &,, находим, согласно равенству (9.2.17),
эмпирическую значимость коэффициента
которую теперь надо сравнить с теоретическим значением t (п - 2),
найденным из таблицы распределения Стьюдента (см. табл. П. 6.2).
Выбираем уровень значимости равным 5% (т.е. с вероятностью 0,05 мы
допускаем отклонение гипотезы а, = 0, когда она на самом деле верна),
тогда по табл. П. 6.2 находим ?005 (6) = 2,447. Эмпирическая значимость
(14,198) существенно больше теоретической (2,447), поэтому а,
значимо отличается от нуля, т.е. принимаем гипотезу СС( * 0.
Этот же вывод подтверждается и высоким значением
коэффициента детерминации:
/I
, = 1_4 = 1-^1-^ = 0,971,
S2 А. 2 1,66
./ = 1
который показывает, что в исследуемой ситуации 97,1% общей
вариабельности розничного товарооборота объясняется изменениями числа
работников, в то время как на все остальные факторы приходится лишь
2,9% вариабельности.
Этот статистический вывод не абсолютен. Допустим, что в магазинах
исследуемого типа стало больше работников, при этом предельная
эффективность работника упадет, а на первый план выйдет влияние других
факторов. По-видимому, это прежде всего доля дефицитных товаров
в ассортименте и комплекс всех факторов, который характеризует
культуру обслуживания, а так же расположение магазина относительно
потоков покупателей.
Построим интервальные оценки параметров регрессии а0, а,, в
форме а°±гай„, &|±/6&. Здесь середины интервалов являются точеч-
231
ными оценками коэффициентов регрессии, которые уже рассчитаны:
а0 =~у -1,2; а, =0,01924 . При выборке уровня значимости 5%
получаем ?1)05(6) = 2,447. Остается только найти стандартные ошибки
коэффициентов регрессии. Согласно формулам (9.2.7), (9.2.8),
заменяя а на ст, получаем:
а&п = a/Vn = 70,008/^8 = 0,032,
о&| =а/ KV -^0,008/74356 =0,0014.
Отсюда окончательно получаем, что с вероятностью 0,95 истинные
значения параметров лежат в пределах:
1,122 < а" < 1,278,
0,01581 < а, < 0,02267.
Найденные отклонения фактических значений от выравненных
(столбец 10) позволяют провести сравнительный анализ работы
различных магазинов рассматриваемой группы. Прежде всего необходимо
обратить внимание на магазины с отрицательным отклонением (3, 4, 6-й).
Особенно велико отклонение у 4-го магазина. В реальной ситуации
необходимо внимательно обследовать эти магазины и установить причины
отклонения фактического значения товарооборота от выравненного
(«нормативного» значения). В данной ситуации это может быть
расположение магазина в стороне от основных потоков покупателей, плохое
снабжение товарами повышенного спроса, устаревшее оборудование,
неудовлетворительный кадровый состав и т.п. При чисто статистическом
анализе при сделанных выше предположениях и на основе имеющихся
данных приходим к выводу, что в этих магазинах, по-видимому,
имеются резервы в организации труда работников. Напротив, в магазинах 1, 2,
5, 7 и 8 работники используются эффективнее статистического
норматива, по может оказаться, что эти магазины объективно находятся в
лучших условиях.
Полученное уравнение регрессии может быть использовано для
прогноза, В частности, пусть намечается открытие магазина такого же
типа с численностью работников х = 140 чел., тогда достаточно
обоснованный объем товарооборота следует установить по уравнению
регрессии
у(х) = у + а^х-х)= 1,2 + 0,01924(140- 113)= 1,72 млн руб.
С точки зрения принятой теоретической схемы полученный
прогноз у(х) является лишь точечной оценкой истинной детерминиро-
ванной составляющей у(х), а сама эта составляющая лежит внутри
доверительного интервала у{х) ±//ла..г), в котором, согласно формуле
(9.2.21),
5»
или
fl U-xf , — [\ (140-113)2
а =а - + А i-=Vo,008-*- + ^ ^-=0,039,
() Ап у72 V8 4356
поэтому получаем следующий доверительный интервал для
теоретического значения прогноза.
1,72 - 2,447 • 0,039 < у(х) < 1,72 + 2,447 - 0,039,
1,625 < у(х) < 1,815.
9.3. ОЦЕНКА ПАРАМЕТРОВ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
И ДИСПЕРСИИ СЛУЧАЙНОЙ СОСТАВЛЯЮЩЕЙ
Модель линейной множественной регрессии имеет вид
где у — зависимая переменная (предиктор),
л*„ i-\,...,k — независимые переменные (регрессоры),
у(х) = а() + ^ОС;*, — детерминированная составляющая — линейная функция
независимых переменных,
а(„ ос,,..., а* — параметры регрессии — предельные эффективности
независимых переменных,
£ — случайная составляющая (случайный остаток). Me = 0,
De = <r.
Параметр ос, (/ = 1, ..., к) показывает, на сколько единиц в
среднем возрастет зависимая переменная, если i-я независимая переменная
возрастет на единицу.
233
Независимые переменные — неслучайные величины,
зависимая переменная — случайная величина, поскольку в ее состав наряду
с детерминированной составляющей входит и случайная
составляющая. Случайная составляющая отражает влияние на зависимую
переменную большого числа факторов, которые не вошли в
детерминированную составляющую, поскольку влияние каждого из них
незначительно.
9.3.1. Оценка параметров регрессии
по методу наименьших квадратов
Исходными данными для оценки служат пространственная
(V/,jf/i, ...,*/*), ./'= I,.... и,
либо временная выборка
(y„xth ...,xtk)j = 1,..., п.
Выборочные данные представим в виде вектора-столбца
значений зависимой переменной (слева от матриц — их размеры)
(лх!) У =
Уг
(9.3.1)
Уп)
и матрицы значений независимых переменных
(пх(к + \)) Х =
122
72
кя2
х А
Чк
'»к )
один столбец матрицы X — это вектор значений одной из
независимых переменных, в частности, начальный столбец из единиц — это
вектор значений фиктивной независимой переменной xjo = 1,
коэффициентом при которой является свободный член.
234
Предполагается, что модель выполнена для каждого
выборочного наблюдения
(9,3.2)
y = i
поэтому «уравнений (9,3,2) целесообразно назвать выборочными
уравнениями.
Если речь идет о всех мыслимых исходах выборки, т.е. о
случайной выборке, то е; — некоррелированные случайные величины
(и yt также)
COvfl,, !,<) = (), J + f\ COvfi^E^sDE^O2,
в противном случае (т,с, для конкретной выборки) — реализации тгих
случайных величин, потому yf — числа.
Выборочные уравнения (9.3.2) можно записать в виде единого
матричного соотношения
К^ЛГа + е, (9.3.3)
а =
«и
а,
вектор-столбец коэффициентов регрессии,
^2
е =
\gn/
- вектор-столбец случайных остатков.
Для получения оценок &(). &, бсА коэффициентов регрессии
так же, как и в случае мирной регрессии, применяется метод
наименьших квадратов (МНК): подбираются такие значения параметров, при
которых сумма квадратов отклонений фактических значений
зависимой переменной от выравненных была бы минимальной
236
£(а0,ар.,.,а,) = £
7 = 1
y.i
f к л
-\2
—> mm.
(9.3.4)
Под выравненным значением зависимой переменной для у'-го
наблюдения понимается значение
У
у=Оо+ЁаЛ'
/ = |
лежащее на гиперплоскости в (к + 1 )-мерном пространстве,
определяемой параметрами (oto, а,,..., а*)
к
r = i
Для нахождения минимума квадратичной формы (9.3.4)
приравниваем нулю производные по параметрам
Г к Y
У)-
Oo+ZV
H) = o,
■Уу-
«o^Za,-*/
r'=l
(9.3.5)
(-*,,) = 0, / = 1,..Д.
Приведем теперь эти уравнения к стандартному виду
(неизвестные — слева, известные —справа)
' и Л к ( п ~\ п
Z1 &о+Е Ъхи &.- = z^
\/ = \ ) 1 = 1 W = i У ./='
Z** do+Z Z-V./Y «.^Zvy/. /=1,-д
(9.3.6)
Получившаяся система из (£ + 1) линейного алгебраического
уравнения с (к + 1) неизвестными а<), ос1з ..., а* называется системой
нормальных уравнений, ее решение отмечено значком «крышка».
Нулевое уравнение этой системы имеет специальный вид
к
па,
+ п£х,-а1- = пу,
/=1
236
откуда
/ = i
С другой стороны, при введении искусственной нулевой
переменной х ,0 =1, нормальные уравнения приобретают следующую
единообразную форму
Е1хЛа.- = Х^м / = 0,1,...,*, (9.3.8)
или в матричном виде
(Х^)6с = ЛГУ. (9.3.9)
Если матрица нормальных уравнений А = Х'Х невырождена, т.е.
det XX Ф О, то система нормальных уравнений (9.3.9) имеет следующее
решение
а = (ХХ)~1 ХУ = а + (ХХ)~] Х'е. (9.3.10)
СВОЙСТВА МНК-ОЦЕНОК
Прежде всего МНК-оценки, задаваемые формулой (9.3.10),
не смещены
Ма = (XX)'1 ХШ =(XX)'1 ХХа = ос.
Ковариационная матрица оценок равна
^&=|cov(a,-, d, )| = Af (&-«)(&-«)' =
= {ХХ)~[ X%1vl'X{XX)~' = (9.3.11)
= (Х*Х)~У Х'^Х(Х*ХУХ = а2(Х*Х)'\
поскольку ^ =а2Еп.
Матрицу, обратную к матрице нормальных уравнений, обычно
обозначают буквой С
с = (хху].
Из (9.3.11), в частности, следует
Da. = о2си, или а& = о^с~-. (9.3.12)
Докажем теперь, что МНК-оценки состоятельны.
237
Для пою воспользуемся записью нормальных уравнений в форме
(9.16). Разрешив нулевое уравнение относительно &„ (ем. 9.3.7)
и подставив это выражение в остальные уравнения, получим
нормальные уравнения для оценок & , &к
(9.3.13)
или н матричной форме
С АЛ
(9,3.14)
где
а1.
Л у
вектор-столбец опенок периметров регреииии fle ■ &ц,
(их*) Й1
•II -12
:JI г32
■/I ШП
\т1)\ -/)2
(ах*) **■£->-,
'пк /
М
iv
s|cov(5,„rj)||*2^ (:, Ы\ столбец Z),
Следует заметить, что ковариационная матрица £, в нашей
ситуации лишь характеризует расположение выборочных значений
независимых переменных, по вовсе ме свидетельствует об их случайном
характере,
Найдем собственные числа и нормированные собственные векторы
71'оИ матрицы
S/-V/. /и| *■
Из собственных векторов построим ортогональную матрицу I ■
-(/ /*)•
С помощью тгого ортогонального преобразования перейдем от
набора г
(- \
\*и
центрированных и коррелированных показателей к па-
бору центрированных и некоррелированных показателей /' =
главных компонент (см, гл. 12)
z = L/;/=L'z
|cov(./:, fr )|| = Mff" = ML'zz'L = L'Mzz'L =
(9.3.15)
a,
-^LM^LA'
X2 0
= A, K^Df^-tfi-
■y = i
ч/
Выразим ковариационную матрицу первоначальных показателей z,
т.е. центрированных коррелированных переменных, через
ковариационную матрицу главных компонент
£ = Mzz = MLff'L' = LMff'L' - LAL'.
Поскольку
( tt
./■)
Z2 = k]T. =L
I/S
7-1
0
//.
1/Л
поэтому по правилу обращения произведения матриц ((АВ)* - В~ХАА)
I i
IK,|| = (^r'=(iT'
./ = '
о
о
о
14
/=1
о о
14
-I _
239
~L
V = i J
0
0
r» V1
z/ =
I
/• = 1
II
14
./' = '
r» V
V/ = l J
при этом мы воспользовались правилом, согласно которому операция
обращения ортогональной матрицы эквивалентна ее
транспонированию.
Из последнего выражения следует, что
"Т/2
./ = 1
в свою очередь из (9.3.16) видно, что с,. —» 0, если для любого г при
it
п —> оо ^//г-*00' ио ^/ ~а2ст поэтому для того, чтобы МНК-
оценки были состоятельны, достаточно, чтобы выборочные 'значения
независимых переменных были рачными, кроме, быть может,
конечного числа значений, тогда и значения компонент будут разными.
9.3.2. Оценка дисперсии случайной составляющей
Поскольку речь идет о дисперсии случайной составляющей,
то оценивать ее надо по оценкам случайных остатков (как и в случае
парной регрессии)
•]=У]~У}> >>./ = &о+ХаЛ7» J = 1 ■■■>"■
(9.3.17)
i' = i
Подберем константу h таким образом, чтобы оценка дисперсии
была не смещена
^ = "Пу.гЬГ
(9.3.18)
Имеем
M^yj-yjf^M^e'^Me'e, е = (*„*2,...,*„)'. (9.3.19)
; = i
7 = 1
240
Поскольку
e=Y-Y=Xa+e-Xa=
= Ха + е-Х(ХХ)~{ Х'(Ха + г) =
(е-Х(ХХ)'1 Х'У = Нг,
где Н = Е-Х(ХХ)~1 Х\
то е'е = е'Н'НЕ, но матрице Я симметрична
Н' = Е-Х(ХХ)~*Х'=Н,
поэтому
е'е = Е'Н2£,
кроме того, матрица И идемпотентна, т.е.
н2 = (е-х{хх)~*х')(е-х(хх)-1х') =
= Е-2Х(ХХ)~] Х' + Х(ХХ)~[ Х'Х(Х'ху] Х' =
= Ell-X(XX)~i Х' = Н,
так что ( M£]Zr = 0 при / * /•)
(9.3.20)
Поскольку след матрицы Н равен (след квадратной матрицы —
сумма ее диагональных элементов, след произведения не меняется при
перестановке сомножителей, если при этом произведение имеет смысл)
trH = trE.. - tr
Х(ХХ)'1 X'
-п- lr
(ХХУ\ХХ)~
= п — к - 1,
то
М^{уГУ$=<52{п-к-\у
7 = 1
поэтому несмещенная оценка дисперсии случайной составляющей
имеет вид
д2 =
1
w-Jfc-lfr
Пуг'у,)'
= 1
241
9.4. ПРОВЕРКА ГИПОТЕЗ
О ПАРАМЕТРАХ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
И ИХ ИНТЕРВАЛЬНАЯ ОЦЕНКА
Относительно каждого из параметров регрессии проверяются
следующие гипотезы
Я0: а, =0 (/-я независимая переменная не влияет на результат),
Н\: а. Ф 0 (/-я независимая переменная влияет на результат).
При построении критерия для проверки сформулированных
гипотез будем опираться на классическое предположение о нормальном
распределении случайной составляющей ey. - N(0, а).
Критериальная статистика — ^-значимость оценки, т.е.
Г, = ^. (9А1)
Ниже будет показано, что при гипотезе //<, эта статистика имеет
распределение Стьюдента с (п -к - 1) степенями свободы.
Для доказательства понадобится два важных вспомогательных
утверждения: первое из них докажем здесь, а второе — о распределе-
1 " 2
нии статистики —f^f^y ~ У/) —будет доказано в Приложении 3.
® ,/ = 1
Полная вариация разделяется па объясненную и остаточную
вариацию
S2=S2+S2R, (9.4.2)
где
S2 = £ (_v/ - J>) — полная вариация,
52 = V (у - у) — объясненная вариация,
/ = i
5д = ^ ( у - у Л — остаточная вариация.
Это утверждение было доказано в главе 9.2 для случая парной
регрессии, докажем его здесь для общего случая множественной
регрессии.
Имеем
s2 = t(yj±yj-y) = t(yj-yj)1 + t{yj-y)2 +
./ = 1 7 = 1 7 = 1
/=i 7=1
242
поэтому для доказательства достаточно показать, что последняя сумма
равна нулю,
Поскольку
У э &о + £&1*ц ■ У * 2А*/» • '/' " *// " *• то
/=1 /И
(=1
поэтому (напомним, £ г >,■(), так что и ?^г^"0)
2>/ tyi*n-tt(sii*it)bi
i=] j=\
/=)/=)
последнее выражение равно нулю, вследствие равенства нулю каждого
выражения в квадратной скобке как /-го нормального уравнения, все
члены которого перенесены в правую часть.
Вернемся к статистике tr При нулевой гипотезе й, -#(о,с4 ),
|'де ол. ■ o^i поэтому
-^—^(0.1).
но о неизвестно, поэтому заменяем это стандартное отклонение его
оценкой, и при нулевой гипотезе видим, что статистика F, имеет
распределение Стьюдента с (п - к - I) степенью свободы
А,
[^V
~n-~k~"-\ ^
-/(я-*-1).
243
Оценка незначима, если ее расчетная ^-значимость по модулю
не превышает табличной значимости, т.е. двусторонней критической
границы распределения Стьюдента
оценка значима в противном случае
Указанный критерий имеет ошибку первого рода ос. В самом
деле, ошибка первого рода равна
р(//,///0)=,р{|/~|>/а///0}=/э{И>^}=«-
9.4.1. Последовательная процедура
исключения переменных с незначимыми оценками
коэффициентов регрессии
Найдем оценку с минимальной значимостью
Л = min If. ,
\ '»] i < ,• < к i i
если
\к\<1*'
то исключаем переменную xf из уравнения, после чего снова
применяем МНК к новому уравнению и так до тех пор, пока в уравнении
не останутся переменные со значимыми оценками коэффициентов
регрессии.
9.4.2. Интервальная оценка коэффициентов регрессии
Если а, ^0, то статистика ' ,—' имеет распределение Стью-
gJc,,
дента с (п - к - 1) степенью свободы, поэтому доверительный интервал
легко построить, используя определение двусторонних критических
границ этого распределения
P{\t\<ta} = \~a,
ОС: - ОС:
подставив в это соотношение вместо /статистику ■ ~=-, получаем
О J С:
244
OJC
<tA = \-a,
откуда и следует доверительный интервал
9.5. ОЦЕНКА КАЧЕСТВА
УРАВНЕНИЯ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
И ПРОГНОЗ ПО УРАВНЕНИЮ РЕГРЕССИИ
9.5.1. Оценка качества уравнения множественной регрессии
Наиболее часто в практических расчетах для оценки качества
всего уравнения в целом применяется коэффициент детерминации
d = —,
S2
т.е. доля объясненной вариации во всей вариации. Считается, чем
больше эта доля, тем лучше уравнение регрессии описывает изучаемое
явление. Однако если коэффициент детерминации очень близок
к единице, то это должно настроить исследователя на критическое
отношение к независимым переменным модели: среди них может
оказаться переменная, которая является линейной функцией зависимой
переменной.
Для проверки качества всего уравнения в целом также
используется /^-отношение, которое функционально связано с
коэффициентом детерминации (см. 9.5.1).
В качестве нулевой гипотезы выдвигается предположение,
что линейной регрессии нет
И0: а, = сс2 = ... = ос* = О,
при конкурирующей гипотезе
Нх: хотя бы одно а, *■ 0.
Как было показано выше, при нулевой гипотезе
l S2 ..г,,л 1
и а
поэтому при выполнении этой гипотезы /^отношение
245
0
*T= mF{kt*-k-\)
(9.5.1)
я-А-1
r0
//и
имеет распределение Фишера с (к, п - к - I) степенями свободы.
Для проверки сформулированных нышс основной и
конкурирующей гипотез применяется следующий критерий
F<Flt~> И,
где t'\, правосторонняя критическая граница распределения Фишера.
Этот критерий имеет ошибку первого ряда а
P{H,/H9)-P{F>FjHa)-P{F.>Fa}~a.
Чем выше расчетное ^-отношение, тем лучше модель отражает
изучаемое явление,
9.6.2. Прогноз поурмнвниюр§гр§ооии
' ТОЧЕЧНЫЙ ПРОГНОЗ ПО УРАВНЕНИЮ РЕГРЕССИИ
Точечный прогноз по уравнению регрессии осуществляется
путем подстановки значений независимых переменных в оценку
детерминированной составляющей*■ (*„ ,..,**)
Я*) = &()+£&^ =? + £&,(*,-*,). (9.5.2)
м
/=i
Этот прогноз не смещен, поскольку опенки параметров
регрессии не смещены
Му(х) = М&{) + £м ft,*, = а() + £а,дг, = р(х). (9.5.3)
/■1
t*\
Точность прогноза определяется его дисперсией: чем меньше
дисперсия, тем выше точность прогноза
Dy(x) = Dy+D
К
5>,(*-у)
/*]
/
+ 2cov
246
Поскольку для / = 1 к
( | и к и
cov(7,&.) = cov -Z^'ZZ^W,/
уП,- = \ 1=1.) = '
г2 к
(последнее верно вследствие У^7 =0), то
./ = 1
o24x) = Dy(x) = Dy + D £&,(*,-х;)
V-'
а2 "
= — + Е(*,-*,)сИ«/Л)(*/-*/) =
" ,,i = \
(9.5.4)
= а
1 *
i.i=\
ИНТЕРВАЛЬНЫЙ ПРОГНОЗ ПО УРАВНЕНИЮ РЕГРЕССИИ
Такой прогноз строим так же, как интервальную оценку для
параметров регрессии: за середину доверительного интервала выбираем
точечную оценку детерминированной составляющей у(х), а затем
отступаем от середины на величину, пропорциональную стандартному
отклонению оценки д^», с коэффициентом пропорциональности,
равным двусторонней критической границе распределения Стьюдента
ta, отвечающей вероятности а.
Итак, доверительный интервал для детерминированной
составляющей у(х) = а0 + Уа.х. имеет вид
/ = I
где d.(v) = ст - + £ (*/ "х,)с„(х, -х,),
».' = i
*—±-±(у,-*,)'
n-k-l
У = |
247
Замечание. Интервальный прогноз всей зависимой переменной
(а не только ее детерминированной части) имеет следующий вид:
где а
1 *
1+-+ И(х> -*<)сЛ*/-*/)
9.6. КРИТЕРИЙ ДАРБИНА-УОТСОНА
И ОБОБЩЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ
Все выводы, полученные выше, основывались на
предположении, что случайные остатки для разных наблюдений
некоррелирован ы. Однако это предположение далеко не всегда выполняется.
Отсюда два вопроса:
1. Как проверить: коррелированны или некоррелированны
случайные остатки?
2. Что делать в том случае, когда остатки коррелированны?
Ответ на первый вопрос дает критерий Дарбина—Уотсона,
который рассматривается в этом параграфе. Ответ на второй вопрос дает
применение обобщенного метода наименьших квадратов (ОМНК).
9.6.1. Критерий Дарбина—Уотсона
Для определенности будем рассматривать этот критерий для
временной выборки
(ynxn,xl2t...,xfk), / = l,...,/l.
В качестве критериальной величины выступает отношение
суммы квадратов первых разностей оценок случайных остатков к сумме
квадратов остатков
v2
d = — , (9.6.1)
где е, = у, - у,,
У, = «о+ £"/*/"
а(., / = 0,..., к — МНК-оценки параметров регрессии.
248
Авторы критерия исследовали распределение статистики d
в предположении верности гипотезы Н{): р = 0 об отсутствии
корреляции между соседними значениями.
Оказалось, что существуют такие критические границы
критерия Дарбина—Уотсона d,,{ct) < d„(a) (они приводятся в
Приложении 6), что решающее критериальное правило выглядит следующим
образом:
1-й случай: d < 2 (альтернатива: существование положительной
автокорреляции остатков первого порядка)
при d < d/,(a) гипотеза Н{) отвергается,
при d > d„(a) гипотеза //„ не отвергается,
при d,,{c£) < d < dlt(a) никакой определенный вывод по
имеющимся данным сделать нельзя;
2-й случай: d>2 (альтернатива: существование отрицательной
автокорреляции остатков первого порядка)
при 4-d< dfXo) гипотеза Н{)отвергается,
при 4 -d> d„{a) гипотеза Н{) не отвергается,
при dh(o) < 4 - d < dH(a) никакой определенный вывод по
имеющимся данным сделать нельзя.
Итак, если автокорреляция в случайных остатках отсутствует,
то критериальная статистика d должна не слишком отклоняться
от значения d- 2.
9.6.2. Обобщенный метод наименьших квадратов
Пусть с помощью критерия Дарбина—Уотсона было
установлено, что гипотезу о некоррелированности случайных остатков принять
нельзя, и пусть каким-то образом определена ковариационная матрица
случайных остатков
|cov(ErE,)| = XP=A/ee'. (9.6.2)
Как тогда находить оценки параметров регрессии? Напрямую
пользоваться обычным методом наименьших квадратов нельзя,
поскольку его применение основано на некоррелированности случайных
остатков. Основная идея состоит в том, чтобы сделать такое
преобразование над первоначальными выборочными уравнениями
к
1 = 1
249
или в матричном виде
где (напоминаем обозначения 9.3.1)
(9.6.4)
г =
(V
Уг
У,
<У»,
г
, * =
V
1 Л<11 «т"^
1 xM xi:
(с \
I
1иА/
а =
о
к
» е =
, Me = 0, |cov(e„ef)|| = Y .
Vе")
чтобы новая модель превратилась в модель с некоррелированными
случайными остатками.
С этой целью умножим матричное равенство (9.6.4) на £
(квадратная матрица В = \[А существует, если А — симметрична, не
вырождена и положительно определена)
или в новых обозначениях
? = Ха + г, (9.6.5)
где ? = Z;l/2Y, Х^Х, ё = Х:'/2е.
Новая модель характеризуется некоррелированностью
случайных остатков
V = мы'= мУч/2ЕеТ-|/2=у-|/2Ма'Уч/2=
Z_je i—iz t—tz .£—<е i—ьг
1/2
= y-VZy у-Чг =E
Luz Lai Lai "'
поэтому для оценки ее параметров (наших первоначальных
параметров регрессии а) можно применить обычный метод наименьших
квадратов
а = (Щ~*Х*У
250
или, переходя к первоначальным обозначениям, получим оценки
обобщенного МНК
Только что нами были определены ОМНК — оценки
параметров регрессии, но не было установлено, н чем состоит ОМНК,
Напомним, что обычный МНК состоит в минимизации квадратичной формы
О(о)ш^(угр^т(у-Ха)\у-Ха)^т\п.
3 нашем случае мы также применяем обычный МНК, но только
к преобразованным переменным
й{а)ш{?-Ха)'(?-Яа),
заменив в последнем выражении преобразованные переменные
не первоначальные, получаем обобщенный метод наименьших
квадратов
ow-iiyr-zrrfW1'-!?*')- („7)
т(у-Ха)'^{У-Ха)-*т\г\.
Эти оценки тик же, как и МНК-оценки, не смещены
мй,,ш,к-(*Т;14'*Т>Ч*Х'*Г*Х|*а"0'
они имеют следующую ковариационную матрицу
£<U» * м&»мик^1М11К -
- М (*'£' xj' x"£t tr£' х{х%' Х)' -
201
если обозначить последнюю матрицу через С, то
£>&,. = £,.,.
(9.6.9)
Точечный прогноз по уравнению регрессии в этом случае
выглядит точно таким же образом, как при использовании МНК-оценок,
но только в формуле фигурируют ОМНК-оценки
к
y(x) = aQ + Yj&ixi=x&> x = (\txlt...,xk). (9.6.10)
; = l
Этот прогноз не смещен
к к
Му(х) = Мбс0 +^М&;Х; = ос0 + £а,х,. =у(х),
и имеет следующую дисперсию:
(к к \
Dy(x) = cov(xoc, ха) = cov ^х;а., ^ */&,
\< = i) / = о
* * / -i \-1
= X xi cov(a.,a,)jc, = £ xAixi = * И'Её x) *'•
;,/ = l /./=0
Рассмотрим две наиболее интересные с практической точки
зрения ситуации:
1) случайные остатки по-прежнему не коррелированы, но их
дисперсии в каждый момент времени разные (гетероскедастичность),
2) случайные составляющие связаны автокорреляционной
зависимостью первого порядка.
9.6.3. Гетероскедастичность случайных остатков
В этом случае ковариационная матрица случайных остатков
имеет вид
f -г
1Г =
0
0 al
0 0
\
(9.6.11)
W
т.е.
De, =сг;, t = \,...,и,
cov(e,,e,') = 0, t*t'.
252
Поэтому
sr =
Ч »
о 4,
CF-,
V
0 ° 7?,
V2 -
f± о
а.
о -1
О,
О О
а
«У
и оценки ОМНК определяют путем минимизации следующей
квадратичной формы
QM^Y-Xa)'^ (У-*<*) =
А1, м2 . (9-6-12)
т.е. квадраты отклонений фактических значений зависимой
переменной от ее выравненных значений входят обратно пропорционально
дисперсиям случайных остатков: для больших дисперсий «вес»
меньше!
9.6.4. Автокоррелированность случайных остатков
Вернемся теперь к первоначальному допущению о гомоскеда-
стичности случайных остатков, т.е.
De = g2, t = 1, ..., я,
но будем считать, что коэффициенты корреляции случайных остатков
связаны соотношением /-(£,,£v) = p'f \ |р|<1, т.е. связь затухает при
росте \t — s\, тогда
253
•■ р
и -1 Л
j\- 2
«а2£„. (9.6.13)
/l-l A»f=2 л»-.»
.Р""' Р
Р'
несмещенная оценка дисперсии гомоскедастичной слученной
составляющей для рассматриваемой модели равна
9.6.В. npooTpiHOTiiHHO-ipiMiHHin сборка
В случае пространственно-временной выборки случайную
составляющую естественно представить как сумму двух компонент:
*//■$/ + */,.
№„-0.
04,» a2,, Яв^-с2.
,/■1 л; /-1 7',
первая из которых характеризует случайные отличия единиц
статистической совокупности, а вторая является остаточным членом. Даже
в случае предположения о независимости обеих компонент друг от
друга и независимости их отдельных значений приходим к следующей
форме ковариационной матрицы размера (пТх пТ):
О
О L
О л
О
. i,
'e' + oj
о +о„
«г
of,
о2 +a2
о/
Обратная матрица также имеет блочно-диагональную структуру:
',/.'. /V г
2в4
К;.л/У=<
^#. >/. <=<;
о' + Tai
а2 + Та]
О,
J = J, t = t,
J = J ■
Метод максимального правдоподобия (ММП) приводит к
следующим оценкам:
к ( \
S Е*7.мк./.'.уЛ»'.< ^= X ^.<кл<,./ухуУ./' ' = 0,1,...,Л,
tf=-L
пТ
А2 _
Ye2 —Ye. е. .
J.I l .hi,I'
nT{T-\)fx,
!Lehiej,t*
r^e e./.»=>'./.»-LV/.f./
1-0
Если выборочные значения факторов приближенно
ортогональны, то можно вывести следующие формулы для дисперсии оценок
метода наименьших квадратов и ММП:
£>&,■ = ^ , [o2+TPiol),
2>.L.<
1,1
Da,=-
2 /_2
' 5Х-.Л 1 + 7-?,^/а
где Д=-у^ т-. 0<ft<l, ?,=1-р„
откуда видно, что оценка ММП, учитывающая структуру
ковариационной матрицы, более эффективна, чем оценка метода наименьших
255
квадратов. В целом обе оценки асимптотически эффективны. Можно
также показать, что оценки, полученные по пространственной выборке
осреднением данных по времени, менее точны, чем приведенные
выше, поэтому использование пространственно-временных выборок
расширяет возможности пространственных выборок.
9.7. ОСОБЕННОСТИ ПРАКТИЧЕСКОГО ПРИМЕНЕНИЯ
РЕГРЕССИОННЫХ МОДЕЛЕЙ
Регрессионная модель, как и всякая другая математическая модель,
отражая основные свойства изучаемого экономического явления или
объекта, не в состоянии полностью воспроизвести его поведение. Но даже то,
что исследователь наметил отразить, трудно сделать в условиях реальной
экономической ситуации. Все дело в том, что в распоряжении
исследователя имеются данные о фактической траектории экономического объекта
либо совокупности участков траекторий ряда сходных объектов.
При этом значения факторов не расположены так, чтобы оценки
параметров регрессии оказались самыми точными и чтобы исследователь
получил ответ на вопросы о влиянии на результирующий признак всех
интересующих его факторов отдельно и во взаимодействии. Последнего
можно добиться только в условиях контролируемого (планируемого)
эксперимента, когда значения факторов можно выбирать по усмотрению
исследователя, но при этом, разумеется, нельзя полностью воспроизвести
условия реальной экономической ситуации.
Например, при изучении влияния минеральных удобрений на
урожайность по фактическим значениям урожайности конкретной
сельскохозяйственной культуры и фактическим дозам внесения минеральных
удобрений под эту культуру на единицу площади в рамках
определенной совокупности сходных хозяйств может оказаться, что коэффициент
регрессии по этому фактору незначим, а это при прямолинейной
трактовке служит основанием для вывода: минеральные удобрения не
влияют не урожайность. На самом деле это, конечно, совсем не так. Более
тщательное изучение всех условий, формирующих результирующий
показатель и значения факторов, поможет выяснить обстоятельства
неправильного вывода. Так, может оказаться, что во всех этих хозяйствах
внесение минеральных удобрений находится примерно на одинаковом
уровне и практически не сказывается на вариабельности
результирующего признака. Могут быть и другие особенности, например, с увели-
256
чением внесения удобрений на единицу площади в меньшей степени
соблюдаются агротехнические условия внесения и т.п.
Итак, необходимо, чтобы в условиях конкретной выборки
каждый из введенных в модель факторов обладал достаточной
вариабельностью (в смысле влияния на результат). Это можно выяснить,
исключая данный фактор из модели и сравнивая полученные до и после
исключения коэффициенты детерминации и /^отношения (не забывая
при этом о возможном взаимодействии исключенного фактора с
другими). Существенность влияния фактора в конкретных условиях
определяется также его значимостью.
Следующим осложняющим обстоятельством является мулыпи-
коллинеарпость факторов, т.е. такое расположение их выборочных
значений, при котором последние близко прилегают к некоторой
гиперплоскости в пространстве факторов. Применительно к нормальным
уравнениям это означает, что их определитель близок к нулю, и поэтому
уравнения практически нельзя решить. Наиболее распространены в
таких случаях следующие приемы: исключение одного из двух сильно
связанных факторов, переход от первоначальных факторов к их
главным компонентам, число которых может быть меньше, затем
возвращение к первоначальным факторам. Другим приемом является так
называемая гребневая регрессия с получением ридж-оценок. Суть приема
состоит в усилении обусловленности матрицы нормальных уравнений
добавлением неотрицательных чисел к ее диагональном элементам:
a(e) = (X'X + QEll)~] ХУ, (9.7.1)
при этом, естественно, оценки получают смещение, однако появляется
возможность более устойчивого их определения.
Особым случаем мультиколлинеарности при использовании
временных выборок является наличие в составе переменных линейных или
нелинейных трендов. В этом случае теория рекомендует сначала
выделить и исключить тренды, а затем определить параметры регрессии
по остаткам, при этом используется следующая
теоретико-вероятностная схема:
х„ =*,(*)+5„-. * = !,..-,*, (9-7-2)
Т1,=/(^,...,^) + Е„ Л/е,=0, Z)E,=cr.
В этой схеме y(t), *,•(/) — регулярные функции времени, т.е.
тренды зависимой и независимых переменных, а Т)„ ^, — отклонения
257
от трендов. В условиях прогноза по тренду приходится считать эти
отклонения выборочными значениями случайных величин, однако
при рассмотрении регрессии в остатках отклонения от трендов
независимых переменных определяются как детерминированные, а
отклонения от тренда зависимой переменной расчленяются на
детерминированную (регрессию по остаткам независимых переменных) и
случайную составляющие.
Игнорируя наличие трендов в зависимой и независимой
переменных, мы завышаем степень влияния независимых переменных
на результирующий признак, что получило название ложной
корреляции. В качестве примера выделим явно ложную корреляцию в
случае парной регрессии по динамическим рядам зависимой и
независимой переменных, содержащих тренды:
<•,,..„ =</,л,, + ^л^А- (9Л-3)
где г,, ,,1'^ г — эмпирические коэффициенты корреляции первоначальных
переменных и их отклонений от трендов;
'V rrv./ — эмпирические коэффициенты корреляции переменных по
времени;
9 , 9р —■ доли вариации остатков в общей вариации зависимой и
независимых переменных.
Как видно из формулы (9.6.4), эмпирический коэффициент
корреляции переменных распадается на произведение эмпирических
коэффициентов корреляции переменных по времени (ложная корреляция)
и на часть, обусловленную истинной корреляцией в форме
эмпирического коэффициента корреляции остатков.
Наиболее часто в практических исследованиях возникает
вопрос: сколько надо наблюдений для надежного определения параметров
регрессии? Однозначного ответа на этот вопрос нет. Выше было
показано, что очень многое зависит от расположения выборочных
значений факторов. Далее в этом параграфе подробнее будут рассмотрены
осложняющие обстоятельства, связанные со случайной составляющей.
Будем предполагать, что случайная составляющая удовлетворяет
стандартным условиям, сформулированным в начале гл. 9.3, а матрица
нормальных уравнений достаточно обусловлена. Последнее означает,
что можно перейти от первоначальных к ортогональным факторам,
например к главным компонентам в том же количестве. Далее будем
считать, что это уже сделано.
258
Выбор числа наблюдений зависит от требований к точности
и надежности оценок параметров, что определяется в конечном счете
размером доверительного интервала прогноза. Таким образом, из
требований к точности прогноза и вытекает требование определенного
числа наблюдений. Обозначим требуемый размер половины
доверительного интервала через Ид, где а2 — оценка дисперсии случайной
составляющей. Достижение этой желаемой точности определяется как
объемом выборки, так и расположением прогностических значений
факторов. Чем более разнесены последние от средних выборочных
значений, тем меньше точность прогноза. Найдем уровни отклонений,
пропорциональные отклонениям от выборочных значений:
е2 =
(*,-*,)2
' ^/7 — Xji •*■;> I — \-> ..., К■
При указанных условиях необходимый объем выборки,
согласно формуле (9.5.3), при ортогональности выборочных значений
факторов определяется из следующего соотношения:
или
откуда
е?5>}
-Ид
«14
р
п
i = i )
= h\
П -
_'/
2 (
к \
Из формулы (9.6.5), в частности, вытекает, что при h = 1,6; = 1,
/=- 1, ..., к и /;, - 2 на каждый фактор должно приходиться по четыре
наблюдения, а при сохранении тех же требований к точности
прогноза, но при увеличении в 2 раза отклонений прогностических значений
от среднего арифметического фактических значений факторов т.е.
при б, -2,i- 1,..., к — по 16 наблюдений.
259
Самым большим препятствием к применению регрессии является
ограниченность исходной информации, при этом наряду с указанными
выше затрудняющими обстоятельствами (мультиколлинеарность,
зависимость остатков, небольшой объем выборки и т.п.) ценность
информации может снижаться за счет ее «засоренности», т.е. проявления новых
обстоятельств, которые ранее не были учтены.
Резко отклоняющиеся наблюдения могут быть результатом
действия большого числа сравнительно малых случайных факторов,
которые в достаточно редких случаях приводят к большим отклонениям,
либо это действительно случайные один или несколько выбросов,
которые можно исключить как аномальные. Однако при наличии не
менее трех аномальных отклонений на несколько десятков наблюдений
мы склонны приписать это влиянию одного или нескольких
неучтенных факторов, которые проявляются только для аномальных
наблюдений.
В таком случае приходим к следующей
теоретико-вероятностной схеме:
где 4/ — случайная составляющая, отражающая влияние неучтенных
факторов, которые проявляются только для аномальных отклонений,
Л^,=0, D^.=oi
Е. — обычная случайная составляющая, Me.=0, De = о~ .
Согласно такой схеме имеет место система неравноточных
наблюдений, при использовании которой каждое наблюдение должно
входить в расчет обратно пропорционально своей дисперсии, т.е.
аномальные отклонения войдут с меньшим весом, обычные — с
существенно большим.
Перенумеруем наблюдения таким образом, чтобы первые и,
из них были обычными: у- = у., j = 1,..., л,, а последние пг = п - щ —
аномальными: у". = yit н у; j'■ = 1, ...,л2; и, ^> п2 и обозначим
я, сг + ас.
Тогда «взвешенные» средние выражаются через средние
обычных и аномальных наблюдений так:
260
Yy> 1" ^ >± l V •
y = J=l ' = / = l +CTQ7=I
jj" a2 a2" "-fa?
x,- -(l-S^ + Sx".
Коэффициенты нормальных уравнений и их правые части
имеют вид:
ап =(1-8)4,+ ьа;,ь{=(1-&)ь; + щ.
Следовательно, средние и коэффициенты регрессии таким
образом выражаются через соответствующие величины, рассчитанные
по обычным наблюдениям, при этом учитываются поправки,
отвечающие аномальным наблюдениям:
у = У + Ь(у"-у), a = a'+&A-l(b'-A2A^b').
Например, согласно этому правилу, два сильно отклоняющихся
аномальных наблюдения с приблизительно равными значениями
независимых переменных следует заменить одним наблюдением с теми же
значениями независимых переменных и значением зависимой
переменной, равным полусумме соответствующих значений объединяемых
наблюдений.
Подобную же процедуру реализует робастное оценивание при
котором наблюдения с меньшими отклонениями берутся с большим весом,
с большими отклонениями — с меньшим.
ВОПРОСЫ И ЗАДАЧИ
1. Предскажите время реакции полуторамесячного ребенка по
следующим данным
Возраст (мес.)
1
2
3
4
Время реакции (с)
1.5
0,8
0,5
0,4
2. Каков содержательный смысл параметра парной регрессии а/?
1-6 у+бу,
I
261
3. Определить функцию спроса (зависимость сбыта Q от цены товара р)
по следующим данным
Цена{в евро)
Объем сбыта (шт.)
54
570
50 1 55
600 | 580
59
510
60
480
58
500
64
450
4. Какой содержательный смысл имеют параметры линейной
множественной регрессии а,, о^,..., а*?
5. В макроэкономических исследованиях широко используется
мультипликативная производственная функция, согласно которой выпуск
(например, валовой внутренний продукт) следующим образом зависит
от капитала К и числа занятых L:
X = AKa'La>.
Можно ли с помощью обычного метода наименьших квадратов оценить
по выборочным данным [Xl,Kt,Ll), l = 1, 2,..., п, параметры
производственной функции А, ак, aLl
6. На основе данных о курсе доллара xt, фондовом индексе х2 и котировке
акций у за 10 дней спрогнозировать котировку акций, если курс
доллара составит 30,0 руб., а значение фондового индекса будет равно 5,0.
X.
х?
У
28,75
4,0
100
28,7
4,2
112
28,54
4,7
108
28,90
5,1
106
28,88
4,9
103
28,35
4,6
101
27,98
4,8
100
28,10
4,3
103
28,05
4,4
102
27,90
4,5
100
ГЛАВА 10
СТАТИСТИЧЕСКИЙ АНАЛИЗ
ЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ
В общем случае временной ряд содержит как
детерминированную, так и случайную составляющие; для простоты далее будем
считать их аддитивными:
У} = /(**х}) + £п ' = !>•••,«1
где у, — значения временного ряда;
f(t, *,) — детерминированная составляющая;
х, — значения детерминированных переменных, влияющих на
детерминированную составляющую в момент t;
е, — случайная составляющая, Me, = 0;
п — длина ряда.
Математическая статистика занимается анализом и прогнозом
временных рядов, содержащих случайную составляющую.
В экономике роль детерминированной составляющей играет,
например, объем производства, обусловленный общей тенденцией
экономического роста, научно-техническим прогрессом и затратами
экономических ресурсов. На результат кроме экономических факторов могут
оказывать долговременное влияние, поддающееся предсказанию, и
некоторые природные факторы. Например, солнечная активность
оказывает влияние на урожайность сельскохозяйственных культур с
периодичностью 11,2 года. Случайная же составляющая аккумулирует
влияние множества не включенных в детерминированную составляющую
факторов, каждый из которых отдельно оказывает незначительное
воздействие на результат.
Основная задача анализа временных рядов состоит в выделении
на основе знания отрезка временного ряда {yt, t = 1, ..., п}
детерминированной и случайной составляющих, а также в оценке их
характеристик. Получив оценки детерминированной и случайной
составляющих, можно решать задачи прогноза будущих значений как самого
временного ряда, так и его составляющих.
При анализе временных рядов в основном применяются те же
методы, что и при работе с моделью множественной регрессии. Глав-
263
ный из них — метод наименьших квадратов (МНК), кроме того, в этой
главе рассматриваются один из нелинейных МНК и
дисконтированный МНК.
Для лучшего понимания методики расчетов в главе разбираются
примеры работы с моделями временных рядов, идентификация
которых (моделей) сводится к идентификации модели парной регрессии,
и поэтому может быть выполнена на калькуляторе. В более сложных
случаях надо применять научные ППП, содержащие программы
множественной регрессии и экспоненциального сглаживания. К таким
ППП относятся SAS, Статистика, Excel, STATGRAF и др.
10.1. ТРЕНДОВЫЕ МОДЕЛИ
Под трендом (в узком смысле) понимается детерминированная
составляющая, зависящая только от времени. Тогда временной ряд
представляется следующей теоретико-вероятностной схемой:
jW(0 + e„ (lO.l.l)
где /(0 -- тренд;
г, — случайная составляющая, Л/е = 0.
Если тренд линеен относительно своих параметров, а случайная
составляющая имеет известную матрицу ковариаций, то задача
сводится к задаче множественной регрессии, описанной в гл. 9. В самом
деле, в таком случае соотношение (10.1.1) принимает следующую
форму:
к
У, = ао + Z(VP.-(0 + E»' t = \,...,n, (Ю.1.2)
/ = i
где ф, (/) -- полностью известные функции времени.
Например, в случае полиномиального тренда соотношение
(Ю.1.2) имеет вид:
Л=?ао + £а/+Ег t = \,...,n.
(• = ]
Обозначив (р, (t) через х„, придем к обычной модели
множественной регрессии, линейной относительно параметров, тогда
выборочные уравнения запишутся следующим образом:
^=ao+Za/xrf + E" (10.1.3)
264
или в матричной форме
где Y -
У2
(\
, х =
у J
(1 ^
KxiU
J Х-у^ -*22
1 х.„ ж..-,
(10.1.4)
Si* J
а =
fa ^
а,
\^u
Е =
ГеА
ч%/
Приведем общее решение, исходя из теории регрессионного
анализа, содержащейся в § 9.3. Форма решения зависит от
статистических характеристик случайной составляющей.
10.1.1. Значения случайной составляющей некоррелированы
Ковариационная матрица гомоскедастичной случайной
составляющей с независимыми значениями имеет вид:
наилучшие оценки коэффициентов тренда получаются по методу
наименьших квадратов и имеют следующий вид:
1) оценка коэффициентов тренда
(X'X)a = XV, (10.1.5)
а = {Х'Х)~] XV, Ма-а,
Bb^covia^a^cs^X'xy* =а2С;
2) оценка дисперсии случайной составляющей
о2 =
п-к~\
!(*-*).
(Ю.1.6)
где v, = х,а = щ + £&,.*„. = а,, + £а,-ф,- (/).
; = I i = I
Точечный прогноз детерминированной составляющей на
глубину X выполняется по формуле:
f(n + t) = y(n + t) = x'T + la = ad + 2laiq>i(n + 'c). (Ю.1.7)
265
Отметим, что
к
М/(л + т) = /(л + т) = а0 + £а,(р,.(л + т),
Df(n + z) = v2x:,TCxn+v
где х^ + т=[1,ф,(и + т),...1ф4(и + т)].
Интервальный прогноз детерминированной составляющей
на глубину т задается следующей формулой (в предположении, что
случайная составляющая имеет нормальное распределение либо
рассматривается достаточно длинный отрезок ряда):
/(« + T)-/„d.(,r+t)s/(« + T)s/(«+t) + r„d;.(^T),
где (/> = (/1(п- к -)) — критическая граница распределения Стьюдентв
с (п - к - I) степенями свободы, соответствующая
уровню чнач и мости/>;
Рассмотрим более подробно случай линейного тренда:
/(/) * Oi, + а,/, Л - К Ф,(/) -/.
Формулы (10.1.5) — (10.1.8) принимают следующий вид:
1) оценка коэффициентов линейного тренда
2>(<-7) .,
a0=y-aj, а,=^ , / =—^; (10.1.9)
2) оценка дисперсии случайной составляющей
a2 = -L-£( Л)2. (юл.10)
где .р, =а0 + а,/ = 7 + а,(г-7);
3) точечный прогноз детерминированной составляющей
/(п + х) = у + а>(п + т-Т)>
Mf(n + t) = a0 + a](n + x), (10.1.11)
266
Df(n + l) = G2
1 (п + т-t)1
—+ - i_
П ^, -42
(10.1.12)
4) интервальный прогноз детерминированной составляющей
^Оо+а^я + ^ + г^^,,
(10.1.13)
—\2
1 (п + 1-t)
а;.. = а I- + -
" ze-n'
Априорные предположения о форме тренда могут быть
сформулированы в виде рабочей гипотезы. Например, в случае рабочей
гипотезы о постоянстве годовых абсолютных приростов/(/ + 1) -f{t) = ах =
■= const приходим к линейному тренду. Если же имеет место гипотеза
постоянства темпов роста/(? + \)lf{t) = а, = const, то получаем
экспонентный тренд/(г) = Ооос'., который в логарифмах сводится к
линейному. Так как не всегда удается иметь дело с трендом, линейным
относительно параметров, то приходится использовать нелинейные
методы оценивания, понятие о которых дано ниже в § 10.3.
10.1.2. Значения случайной составляющей зависимы,
ковариационная матрица известна
В случае, если значения случайной составляющей зависимы
и задана известная ковариационная матрица случайной составляющей
^ = Мее'= cov(ef,£s)L t, s = 1, ..., п, наилучшие несмещенные
точечные оценки коэффициентов тренда определяются методом
максимального правдоподобия. В матричной форме эти оценки
определяются следующими выражениями:
Ма = а, Z,4lcHu,A)H*T~'*f • (Ю.1.14)
267
Точечный прогноз детерминированной составляющей на
глубину т осуществляется по следующей формуле:
*
/(л + т) = а0 + 2,а,(Р((" + т)> (10.1.15)
<■ = ]
при этом
М/(п + т) = а0 + 2>,.ср, (я + т),
/ = i
D/>+T) = *;+t(x'X;,*)~1 x<I+t,
где .< + х=[],ф,(л + х),...,ф4(н + х)].
Проверка гипотезы о значимости оценок коэффициентов тренда
и всего уравнения тренда в целом может быть выполнена по
формулам, приведенным в § 9.3.
10.1.3. Значения случайной составляющей зависимы,
ковариационная матрица неизвестна
Если ковариационная матрица неизвестна, но имеет
специальную структуру, определяемую некоторым числом параметров, то для
оценки конечного числа параметров (коэффициенты тренда и
параметры ковариационной матрицы) можно применять метод
максимального правдоподобия.
В общем случае, когда о структуре ковариационной матрицы
ничего не известно, теория рекомендует применять итерационную,
по крайней мере двухшаговую, процедуру: на первом шаге с помощью
метода наименьших квадратов определяют оценки коэффициентов
тренда а и ковариационной матрицы 2е по отклонениям, на втором
шаге находят уточненные оценки коэффициентов тренда по формулам
(ЮЛ. 14), в которые вместо матрицы £Е, подставлена ее оценка 2Е,
что позволяет получить прогноз детерминированной составляющей
на глубину т по формуле (10.1.15).
10.2. ВЫДЕЛЕНИЕ ТРЕНДА В ДИНАМИЧЕСКИХ РЯДАХ
ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ
При исследовании динамических рядов экономических
показателей обычно выделяют следующие четыре основные составляющие:
долговременную эволюторно изменяющуюся составляющую; долговре-
268
менные циклические колебания; кратковременные циклические
колебания (сезонная составляющая); случайную составляющую. В нашем
понимании первые три составляющие представляют собой тренд, т.е.
детерминированную составляющую.
Случайная составляющая образована в результате
суперпозиции большого числа внешних факторов, не участвующих в
формировании детерминированной составляющей и оказывающих каждый
отдельно незначительное влияние на изменение значений показателя.
В целом влияние этих факторов на изучаемый экономический
показатель проявляется в изменении во времени его значений.
Долговременная эволюторно изменяющаяся составляющая
является результатом действия факторов, которые приводят к
постепенному изменению данного экономического показателя. Так, в
результате научно-технического прогресса, совершенствования организации
и управления производством относительные показатели
результативности и эффективности производства растут, а удельные расходы
ресурсов на единицу полезного эффекта снижаются.
Долговременная циклическая составляющая проявляется на
протяжении длительного времени в результате действия факторов,
обладающих большим последействием, либо циклически изменяющихся во
времени. Примером такого рода явлений служат кризисы перепроизводства
и структурные кризисы. Другой пример связан с природным фактором —
солнечной активностью. Так, с большой степенью достоверности
доказано, что изменение солнечной активности с периодичностью 11,2 года
оказывает существенное влияние на развитие биологических объектов.
Исследование длинных рядов урожайности сельскохозяйственных
культур в районах устойчивого земледелия позволяет выявить
долговременную циклическую составляющую с II-летним периодом и амплитудой
5—7% от среднегодовой урожайности.
Сезонная циклическая составляющая легко просматривается
в колебаниях продуктивности сельскохозяйственных животных в
зависимости от времени года, а также в колебаниях розничного
товарооборота по временам года.
Эволюторно изменяющуюся долговременную составляющую
можно достаточно хорошо представить отрезком ряда Тейлора;
следовательно, эта составляющая во многих практических случаях может
рассматриваться как полиномиальный тренд.
Что касается долговременной и сезонной циклических
составляющих, то обе они являются периодическими функциями, которые
269
достаточно хорошо могут быть представлены отрезками ряда Фурье;
следовательно, эти составляющие могут рассматриваться как
тригонометрический тренд.
Ниже на простых примерах демонстрируется техника расчета
оценок коэффициентов полиномиального и тригонометрического
трендов и их использования для прогнозирования будущих значений
детерминированной составляющей. Оценка коэффициентов
одновременно присутствующих эволюторной и циклической составляющих —
несколько более сложная задача, но она полностью укладывается
в схему расчетов, приведенную в § 10.1. Если амплитуда циклической
составляющей эволюторно изменяется, т.е. имеет место
мультипликативное представление детерминированной составляющей в форме
произведения эволюторной функции на периодическую, то для
анализа и прогнозирования можно воспользоваться методом сезонного
экспоненциального сглаживания, который рассмотрен в § 10.4.
10.2.1. Полиномиальный тренд
Схема расчетов, приведенных в § \0Л для тренда,
представляющего собой линейную комбинацию некоторого набора функций
Фо(0» 9i(0> —■> Ф*(0 в случае полиномиального тренда выглядит
следующим образом. Роль функций <р,(0 играют степени времени, т.е.
ф,(0 = Л фо(0 = 1, поэтому
к
/(/,а) = а0+£а/, t = \,...,n.
Исходную модель временного ряда [сравните с обозначениями
формул (10.1.3), (10.1.4)]
к
можно записать в матричной форме:
Y = Xa + z,
где в качестве X используется матрица, столбцами которой служат
значения времени в различной степени:
Г1 1 1 п
х =
1 2 V
1 п п1
270
Остальные обозначения совпадают с обозначениями формулы
(10.1.4).,
Матрица коэффициентов нормальных уравнений имеет вид:
А = Х'Х =
ъ<+>
/ = 1
, /,/ = 0,1,...,*,
т.е. ее элементы являются суммами натуральных чисел в целой
степени, которые могут быть заранее рассчитаны, протабулированы и
использованы для любого исходного ряда. Правые части нормальных
уравнений необходимо подсчитывать для каждого конкретного ряда
ХУ =
5>/
/=)
, / = 0,1 к,
причем для оценки свободного члена используется формула
к _
с\=у-£бу\
/-1
в которой коэффициенты при оценках й,
также могут быть чаранес протабулированы.
Прогноз па глубину т осуществляется по формуле
к /
л,+т=&о+Е&/(я+х)-
Доверительный интервал для детерминированной
составляющей записывается в следующей форме:
к к k
5>,(л+т)' -*д(и+т) * 2>,>+тУ* Е&/(я+т)' + /А(«+т).
;=0
;=0
™е дг(я + т)=6л £с,Ля + т)' + '> С = (Х'ХУ1,
, / = (I
п-к-\
2>.-*)2-
Пример 10.1. Анализ временных рядов удойности и урожайности
зерновых
В качестве примера исследуем динамический ряд среднегодовых
удоев молока (кг) от одной коровы на сельскохозяйственных предпри-
271
ятиях за 1961 —1985 гг. (длина ряда — 25 лет). Для расчетов
используем формулы полиномиального тренда при к ~ 1, т.е. примем гипотезу
линейного тренда, состоящую в примерном постоянстве по годам
среднегодовых приростов удоев молока от одной коровы [см. формулы
для линейного тренда (10.1.9) — (10.1.13)]. Пример расчетов по
аналогичным формулам парной регрессии был рассмотрен в § 9.2, поэтому
результаты расчетов приведены менее подробно. Исходные и
расчетные данные представлены в табл. 10.1.
Прежде всего по формуле (10.1.9) находим оценки коэффициентов
линейного тренда, используя исходные данные табл. 10.1:
_ 1^ 80 753 ,„,„ - 1^ 1 + « ,,
.>' = -2>=—— = 3230, ,=-£,=—-=13;
п" 25 п" 2
" /7(/г-П)(2к + 1)_2526-51_5525.
к 6 6
иУ,-у)* У'~,у 1121733-323025 13 ....
а, = = = ; = 55,37
1(<-')2 Ъ'-"(т)2 5525"25132
а||=у-&|Г = 3230-720 = 2510.
Найденный коэффициент &[ = 55,4 показывает, что в среднем
за год удой возрастает на 55,4 кг.
Теперь рассчитаем выравненные значения yt = а0 + а^ (с
точностью до 1 кг) и заполним столбцы yt> у,-уг (у, ~ у,) табл. 10.1.
По найденной сумме квадратов отклонений S2R ~2^(у, ~ У,) =
= 643 792 теперь можно получить оценку дисперсии случайной
составляющей с2 =- 2-Ау< ~У() = 27 991, откуда а2 = 167,3.
Найдем расчетную значимость коэффициента линейного тренда:
сй 6 \f?\ 167,3
которая существенно превышает табличную значимость /005(23) - 2,069
при 5%-ном уровне значимости (5%-ном риске), т.е. коэффициент
линейного тренда существенно отличается от нуля, и следовательно,
тренд действительно имеет место.
Таблица 10.1
Фактические и выравненные удои молока
от одной коровы (кг) по хозяйствам Эстонии
в 1961-1985 гг.
Год
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
Итого
Фактический удой,
У,
2 542
2317
2 341
2513
2 968
2 956
3 041
3 182
3 177
3 181
3 201
3 192
3 156
3 364
3489
3 587
3 648
3 475
3475
3 579
3 473
3 385
3 701
3 854
3 966
80 753
ty,
2 532
4 634
7 023
10 052
14 840
17 736
21 287
25 456
28 593
31810
35 211
38 304
41028
47 096
52 335
57 392
62016
62 550
66 025
71 580
72 993
74 470
81 523
92 496
99 150
1 121 731
Выравненный
удой.
У,
2 565
2 621
2 676
2 731
2 787
2 842
2 898
2 953
3 006
3 064
3119
3 174
3 230
3 285
3 341
3 396
3 451
3 507
3 562
3617
3 673
3 728
3 784
3 839
3 894
Отклонения
У< - У,
-33
-304
335
-218
181
114
143
229
169
117
2
18
-74
79
148
191
197
-32
-87
-38
-200
-343
-83
15
72
Квадрат
отклонений
{у,-у,)г
1 089
92416
112 225
47 524
32 761
12 996
20 449
52 441
28 561
13 689
4
324
5476
6 241
21 904
36 481
38 809
1024
7 569
1444
40000
117 649
6 889
225
5 184
643 793
Теперь можно найти прогностические значения тренда
среднегодовых удоев молока от одной коровы на 1986—1990 гг.:
Л-ы =6tD+a,(/i + l) = 3949
Л + 2-й0+&,(я + 2)=:3995
Л, + э=&о.+ М" + 3) = 4050
Л, + 4=&0+&|("+4) = 4105
Я, + 5=!&0+«|(" + 5)=!41б1
(1986 г.);
(1987 г.);
(1988 г.);
(1989 г.);
(1990 г.).
273
Построим доверительный интервал для теоретического тренда
удойности за 1987 г., т.е. при прогнозе на два года вперед:
Л+2 -'о.о5(23)дс,( + 2 £а0 +а,(/? + 2)< j>„ + 2 + /0,05(23)дг„,+2.
Так как ^.ost23) = 2,069,
'"' J" p-Tf hs ,30°
то окончательно получаем доверительный интервал
3844 Sot0+а, (л+ 2)^4146,
размах которого равен 302, т.е. достаточно велик и составляет 7,5%
по отношению к значению середины интервала. Вместе с тем размах
вполне приемлем для практических прогнозов значений
долговременной тенденции удойности на несколько лет вперед.
Более углубленный анализ динамического ряда удойности совместно
с динамическими рядами экономических факторов, оказывающих
на удойность решающее влияние, показывает, что колеблемость
удойности вокруг тренда главным образом обусловлена колеблемостью
урожайности зерновых культур. И это полностью соответствует
действительности, поскольку именно обеспеченность кормами (главный из
которых комбикорм, основу которою составляет зерно) оказывает решающее
воздействие на продуктивность животных, Практически синхронная
колеблемость вокруг своих трендов рядов динамики удойности и
урожайности зерновых хорошо видна на рис. 10.1, на котором точки отсчета
и масштаб выбраны таким образом, чтобы тренды исходили из одной
точки, а размахи рядов были примерно одинаковы, Фактические и вы-
равненнные значения ряда урожайности зерновых показаны штриховой
линией, а ряда удойности коров — сплошными линиями.
i i i i i ) i i i i i i i i 1 1 ^
1962 1966 1970 1974 1978 1982 1986 199СИ
Рис. 10.1. Фактические и выравненные значения
удойности коров (кг) и урожайности зерновых (ц/га)
Синхронное изменение значений двух рядов, обусловленное
решающей зависимостью продуктивности коров от обеспеченности кормами,
приводит к мысли о возможности прогнозирования отклонений
удойности от тренда по отклонениям урожайности от своего тренда. Это имело
бы большое практическое значение для более достоверного предвидения
производства животноводческой продукции, если бы существовали
надежные методы прогнозирования отклонений значений урожайности
от тренда в зависимости от вариации погодных условий. Однако к
настоящему времени надежных методов прогноза урожайности
сельскохозяйственных культур в зависимости от метеорологических условий и их
прогноза на длительный срок пока нет. Существующие методы дают
недостаточно достоверные прогнозы урожайности. Поэтому для прогноза
удойности пока наиболее практически доступным является метод
выделения тренда, прогноз остатков станет осуществим в будущем.
Что касается выявления тренда урожайности зерновых (ц/га), то
результаты соответствующих расчетов приводятся ниже и представлены
в табл. 10.2 и 10.3:
бс0=14,6; бс, =0,56; S2R-393\ а2 =17,1; 6 = 4,13.
Итак, стандартные ошибки достаточно высоки, поэтому размахи
доверительного прогноза по тренду составляют ±3,4; ... ± 4,3, что весьма
значительно. Тем не менее эти прогнозы можно было бы использовать
на практике, если предположить, что сохранится сложившаяся
долговременная тенденция изменения значений данного показателя. Если
тенденция изменится под влиянием определенного фактора, то отклонение
от прогноза по тенденции можно будет рассматривать как суперпозицию
результата влияния нового фактора и случайной составляющей.
Таблица 10.2
Фактические и выравненные значения
урожайности зерновых (ц/га) в Эстонии в 1960—1985 гг.
Год
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
Значение
урожайности
фактическое
13,3
12,2
12,4
12,4
16,4
22,0
17,2
21,8
22,4
24,8
21,3
26,7
17,9
выравненное
11,67
13,36
14,6
15,62
16,53
17,34
18,1
18,81
19,49
20,13
20,76
21,36
21,95
Отклонение
1,63
-1,16
-2,2
-3,22
-0,13
4,66
-0,9
2,99
2,91
4,67
0,54
5.34
-5,05
Год
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
Значение
урожайности
фактическое
19,5
30,1
26,7
31,0
28,4
20,0
24,7
26,9
21,3
28,6
27,7
30,0
22,9
выравненное
22,52
23,08
23,63
24,17
24,71
25,24
25,76
26,27
26,79
27,3
27,8
28,3
28,8
Отклонение
-3,02
7,2
3,07
6,83
3,69
-5,24
1,06
0,63
-5,49
1.3
-0,1
0,7
-5.9
275
Таблица 10.3
Прогноз урожайности (ц/га) по тренду
Год
1986
1987
1988
1989
1990
Прогноз
29,8
30.4
31,0
31,5
32,1
Стандартная ошибка прогноза
1,69
1,32
1.9
2,02
2,11
Таблица 10.4
Сравнение результатов применения
различных видов тренда
для прогноза урожайности зерновых (ц/га)
Формула тренда
А + Вс
Ае1"
A+B/t
\/(A + Bt)
A+B\nt
е{'"'
Экспоненциальное
сглаживание
ут + х =29,68 +0,6427 т
Значение
коэффициента
А
14,6
14,5
24,9
0,069
9,27
3,2
29,68
В
0,56
0,029
-18,3
-0,0015
5,5
-0,97
0,6427
Остаточная сумма
квадратов
отклонений
392
448
512
581
328
463
439
В таблице 10.4 приведены результаты расчетов по различным
трендам, линейным относительно двух параметров. Как видим, наименьшая
из рассмотренных сумм квадратов отклонений у логарифмического
тренда, который характеризуется постепенным падением абсолютных
приростов, что отвечает сформулированной выше гипотезе:
f(t + l)-f(t) = A + B\n(t + \)-A-B\nt = B\n( 1 + -).
Этот тренд дает более осторожный прогноз по сравнению с
прогнозом по линейному тренду, что видно из табл. 10.5.
В таблицах. 10.4, 10.5 приводятся коэффициенты прогнозирующего
полинома и прогноза тенденции этого же ряда на те же годы,
полученные методом экспоненциального сглаживания (см. § 10.4).
Таблица 10.5
Прогноз урожайности (ц/га) по линейному
и логарифмическому трендам и с помощью
экспоненциального сглаживания
Год
1986
1987
1988
1989
1990
Прогноз по тренду
линейному
29,8
30,4
31,0
31,5
32,1
логарифмическому
27,4
27,6
27,8
28,0
28,1
Экспоненциальное
сглаживание
30,3
31,0
31,6
32,3
32,9
10.2.2. Тригонометрический тренд
Снова рассмотрим модель, содержащую детерминированную
и случайную составляющие:
yi - /(/, <х) + Е, 1 = ],...,П,
где Мв, = 0, Dz, = a2, cov(e„ еЛ) = 0 при t * s, f(t, а) — периодическая
функция с известным периодом т, нацело делящим п, т.е. п = hm,
h=— . Далее m, а следовательно и п, будем считать четными.
т
При рассмотрении тренда только в наблюдаемые моменты
времени его можно точно выразить через п линейно независимых
тригонометрических функций. Если же период тренда равен т < п, то все
его первые т значений затем повторяются еще (я - I) раз, т.е. всего h
раз, поэтому в точное разложение функции в точках / = I, ..., л,
достаточно включить т членов, которые дают точное представление
функции в точках t= 1,..., т, а все остальные значения повторяют первые т
значений.
. (2nj \ . (2nj
Функции cos —-/ Lsin ——/
\ т ) \ т
имеют период
т
поскольку
cos
sin
2ту
т
2ту_
m
m
t + —
J J
m
t + —
J
= cos —-t + 2n =cos —-t
\ m
= sm —:L
\ m
\ m
t + 2n | = sin —/
V m
причем этот период укладывается в общей длине ряда nj/m - hj раз,
т.е. целое число раз, если у — целое. Теперь подберем m таких
функций с наименьшими периодами. Прежде всего в разложение необхо-
277
димо включить константу, т.е. в число функций времени войдет
ф0 (t) = 1. Затем последовательно будем включать пары
тригонометрией - 2ту . 2kj л _
ческих функции cos—-/, sin——t при j = 1, 2, ..., причем каждому j
т т
соответствует пара функций с периодом ml}. Следовательно,
остановившись на j = 1, мы включим т - 1 функцию. Таким образом,
осталось включить еще одну функцию с j = т/2, имеющую период
т
mil
- 2. В качестве такой функции выберем (р„,_ ((7) = (-1)'.
Окончательно получаем следующее представление
периодического тренда:
(м!/2)-1 -
f(t,а) = а0+ £
7 = 1
ос2._tcos —-t 1 +
\ т
■ (2ту
+ а2 sin —-t
J \ т
(10.2.1)
+ a«-i(-1)'-.
Например, при рассмотрении ежемесячных данных, имеющих
сезонный характер (т.е. период т = 12), достаточно включить в
разложение 12 членов, т.е.
ф0(г) = 1,
(p2/._,(f) = cos(^fj, cp2y(f) = sin\^-t., y = l,2,3,4,5,
Фи(') = И)'.
и разложение принимает вид:
5
/(/,Ос) = ОС0 + £
У = 1
ai;_,cos —-f 1 +
^ т
ij-\
2nj
+ aT,sin| —-t
m
(10.2.2)
+ an(-l)'
Теперь воспользуемся методом наименьших квадратов для
оценки параметров ос, получившейся теоретико-вероятностной схемы:
{т/2)-]
Л =ао+ £
а2/ _, cos|-
/ I + а2/sin
+ am_,(-l)' + е,, / = !,...,и
271/
/и
(10.2.3)
278
Нормальные уравнения в терминах функций времени (р(/)
согласно (10.12—10.15) запишутся следующим образом:
I
/=0
2>,(»Ф,(0
1 = \
«■•=!>& (0. / = 0 т~\, (10.2.4)
/ = ]
— в данном случае распадутся на т отдельных уравнений,
содержащих только одно неизвестное, что вытекает из ортогональности
тригонометрических функций, как это видно из Приложения 3.
Рассмотрим оценку для свободного члена
И1-1
fto^-EfyfcW
/ = |
Согласно Приложению 3,
i"\
\ м
/я)
V и
щм-лыщлыт.и
i^\
у т
t = \
\ п
поэтому
Ф,„-,(')=-1Н)'=о.
«о=Г-
Рассмотрим внедиагональные члены матрицы нормальных
уравнений (10.2.4). Только что было показано, что
II п
Еф/(')фо(0=2Х<)=0-
При условии, что 0 < i < I < т - 1, внедиагональные
коэффициенты обращаются в нуль; действительно, согласно Приложению 3,
Хф/(Оф/(о=Ес°4—* Us — л=
,Tf ,Т! V т J у т )
= pJ^XoJ^ty0, / = 2y-U l = 2k-\,
279
Z9((09/(/)=Ecos[^^sin[^/ | =
/ = i
^^cos ^-/ sin f| = 0, i = 2y — 1, / = 2Jt,
1 = 1
ЁфДОф,-.(0=1^^)(-1)^о, /=27.
Коэффициенты при единственном неизвестном в каждом из
нормальных уравнений также определяются по формулам, найденным
в Приложении 3:
2>?(0=ZCOS[ — 4 = Zcos2f~4 = T» ' = 2y-l<m-l,
,«i v т J , = \ V т J 2
/ = i
±^(1)=Щ^ура^,у^ i-v<m,
i = \
( = i
M-,(0=IH)2' = «-
( = ]
/ = l
Окончательно получаем:
2 Л (2ту ^ . , m .
V w
m
(10.2.5)
njT\ \ m J 2
&*-i=-ZH)'jv
Таким образом, точечные оценки тренда определяются
выражением
(»</2)-1
У, = <*0 +
./ = ' L
6ц,._ ,cos —~t +a,,sin —f
J у m J J { m
(10.2.6)
+ а»-|(-1)Г.
280
а оценка дисперсии случайной составляющей равна
*2=Г-Ч2>'-Й)2- (Ю.2.7)
(л-»0г = 1
Построение доверительных интервалов для параметров не
вызывает затруднений, поскольку легко находятся дисперсии их
точечных оценок:
DaQ = Dy=G2/n,
Da2J_]=Da2j=2<52/nt у = 1,...,у-1,
Dam_,=(52ln.
Вследствие некоррелируемости оценок параметров легко
определяется дисперсия точечной оценки тренда:
(Ш/2)"1Г 2(2л/ >п. . ,Г2я/ . л
52 —f Z)a,; , + sm~ ——t\Da,
Dy,=Da{)+ X
cos
m ) \ m
n n \2 n n n
Пример 10.2. Выделение тригонометрического тренда
Используем формульг тригонометрического тренда для выделения
тренда в динамическом ряде помесячных удоев от одной коровы. Для
примера выбраны данные только за тс годы, которые характеризуются
практически одинаковым среднегодовым удоем; это означает, что
отсутствует смещение, отличающее один год от другого, и имеют место
только сезонные циклические колебания. В таблице 10.6 (и далее)
применяется обозначение:
а> =тХ>^12/' * = 1,...,12.
Используя данные табл. 10.6, получаем
d0=y = 192,2.
Легко также найти
1 •"' 47
" зб,4г 36
281
Таблица 10.6
Помесячная удойность коров (кг) в Новосибирской обл.
Месяц
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Декабрь
Итого
Среднее
Помесячные удои по годам
1975
140
147
196
210
259
288
271
244
190
136
104
116
2 301
191,8
1978
143
148
196
208
240
290
278
245
195
136
110
120
2 309
192,4
1983
133
135
183
203
254
294
276
264
196
144
115
124
2311
192,6
Всего
416
430
575
624
753
872
825
743
681
416
329
360
6 921
576,8
Среднее
138,7
143,3
191,7
208
251
290,7
275
247,7
193,7
138,7
109,7
120
2 307
192,2
Остальные коэффициенты найдем следующим образом:
u»4f>Kf 'ИЩИ j-h2-3A'5-
Исходные данные для расчета приведены по последним формулам
в табл. 10,7, на основе этих данных получаем оценки коэффициентов,
которые приведены в табл. 10.8.
Как видно из табл. 10.8, наибольшее значение амплитуды у первой
гармоники с периодом т = 12, причем это значение на порядок выше
амплитуд остальных гармоник, поэтому в практических случаях можно
ограничиться одной гармоникой:
;; = 192,2-82,8cos[— r]-5,0sin(— Л
или двумя гармониками;
y = l92,2-82,8cos(— r]-5,0sin[— r]-2,9cos[— r] + 13,7sin[— Л
Более точные результаты получаются при включении всех шести
гармоник:
у, =192,2 -82,8cos[—H-5,0sin(—H-2,9cos[—/] +
Таблица 10.7
Непосредственные исходные данные* для расчета коэффициентов тригонометрического тренда
t
1
2
3
4
5
6
7
8
9
10
11
12
а,
138,7
143,3
191,7
208
251
290,7
275
247,7
193,7
138,7
109,7
120
12
; = 1
(к )
cos —t
U J
0,866
0,5
0
-0,5
-0,866
-1
-0,866
-0,5
0
0,5
0,866
1
-496,95
•КЙ
0,5
0,866
1
0,866
0,5
0
-0,5
-0,866
-1
-0,866
-0,5
0
-30,15
cos —t
Ь )
0,5
-0,5
-1
-0,5
0,5
1
0,5
-0,5
-1
-0,5
0,5
1
-17,35
sin — t
Ь )
0,866
0,866
0
-0,866
-0,866
0
0,866
0,866
0
-0,866
-0,866
0
-84,26
cos —/
Ь )
0
-1
0
1
0
-1
0
1
0
-1
0
1
3
s,nfr)
1
0
-1
0
1
0
-1
0
1
0
-1
0
7
cos(f')
-0,5
-0,5
1
-0,5
-0,5
1
-0,5
-0,5
1
-0,5
-0,5
1
40,05
sin(f')
0,866
-0,866
0
0,866
-0,866
0^
0,866
-0,866
0
0,866
-0,866
0
-43,21
(5n Л
cos —t
U )
-0,866
0,5
0
-0,5
0,866
-1
0,866
-0,5
0
0,5
-0,866
1
-17,3
sHt')
0.5
-0,866
1
-0,866
0,5
0
-0,5
0,866
-1
0,866
-0,5
0
30,9
* В последней строчке таблицы приведены суммы поэлементных произведений первой колонки (at) на текущую
тригонометрическую колонку.
Таблица 10.8
Расчетные оценки
коэффициентов тригонометрического тренда
Параметр
<Vi
«2/
Амплитуда
P^yj&li-y+ali
Период т: = 12/j
Оценка коэффициентов
7=1
-82,8
-5,0
83
12
у = 2
-2,9
13,7
14
6
/ = з
0,5
1.2
1,3
4
7 = 4
6,7
-7,2
9,8
3
7 = 5
-2,9
5,2
5,9
2,5
/' = 6
-1,6
1-6
2
Таблица 10.9
Фактические и расчетные помесячные удои (кг)
Месяц
Январь
Февраль
Март
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь
Ноябрь
Декабрь
Сумма
модулей отклонений
фактических
от расчетных
значений
Фактические удои,
138,7
143,3
191,7
208
251
290,7
275
247,7
193,7
138,7
109,7
120
Расчетные удои
по первой гармонике
У,
118
146,5
187,2
229,3
261,4
275
266,4
238,2
197,2
155,1
123
109,4
а, - у,
20,7
-3,2
4,5
-21,3
-10,4
15,7
8,6
9,5
-3,5
-16,4
-13,3
10,6
137,7
Расчетные удои
по первой и второй
гармоникам
У,
128,5
159,9
190,1
218,8
248
272,1
276,9
246,9
200,1
144,6
109,6
106,5
а, -у,
10,2
-16,6
1,6
-10,8
3
18,6
-1,9
0,8
-6,4
-5,9
0,1
13,5
89,4
,-, ^ ■ (4п ) пс [бп \ , „ . (6л: ^ z „ (8л }
+ 13,7sin —t +0,5cos —t +l,2sin —/ + 6,7cos —/ -
U2 J W2 J ll2 ) [\2 J
-7,2sin —/ -2,9cos / +5,2sin —f -l,6(-l) .
В таблице 10.9 приведены фактические значения ряда и их оценка
по первой гармонике, а также по первой и второй гармоникам.
Добавление всех остальных гармоник весьма незначительно улучшает
результат.
10.3. НЕЛИНЕЙНЫЕ ТРЕНДЫ
При наличии во временном ряде нелинейного (относительно
параметров) тренда возможны два варианта действий:
1) линеаризовать тренд (если это возможно) с помощью
некоторого преобразования,
2) применить нелинейный метод наименьших квадратов.
Кратко рассмотрим оба эти варианта.
10.3.1. Линеаризация тренда
В макроэкономических исследованиях широко используется
мультикативная производственная функция (ПФ)
X = AKa*La'-ev,
которая связывает результат производства — выпуск, например, ВВП
с затратами прошлого труда А' (капитал) и живого труда L (число
занятых), а также учитывает научно-технический прогресс (множитель
еу'). Иногда в эту производственную функцию включают и освоенные
природные ресурсы.
Эта функция линейна относительно параметра А, но не линейна
относительно параметров 0^,0^,у. Эти четыре параметра оценивают
по временной выборке (Х„ К„ L„ t)tt= 1,2, ..., п.
Допустим, что параметры известны, тогда при наложении
модели на реальные выборочные данные возникнут рассогласования между
реальным и модельным выпусками, которые можно «устранить»
введением корректировочного коэффициента 5, (в каждый момент
времени свое значение)
ЛГ,=6,Л/Га* £"'■<?*, t = \ л(5,«1).
Прологарифмируем эти выборочные уравнения
In Х( = In А + ак In Kf + a, In L, + у/ + In 8, (In 5, = 0)
в результате в логарифмах получим линейную смешанную регрес-
сионно-трендовую модель, которую можно идентифицировать с
помощью программы множественной регрессии. В результате найдем
оценки ее параметров \пА, aK,aL, у, а следовательно и оценки
параметров ПФ (<?,n'\aK,aL,y).
285
10.3.2. Итерационные методы оценки
коэффициентов нелинейного тренда
В том случае, когда тренд не линеен относительно
коэффициентов и его невозможно линеаризовать, применяют нелинейные методы
оценки коэффициентов, основанные на итерационных процедурах,
на каждом шаге которых используются алгоритмы получения
линейных оценок. Ниже дадим общее представление о нелинейном
оценивании на примере метода Ньютона—Гаусса.
В случае тренда, нелинейного относительно параметров, имеет
место следующая теоретико-вероятностная схема:
Я =/(/,а) + е„ f = l и, (10.3.1)
где/(/, ос) — тренд, нелинейный относительно вектора параметров а, а' =
= (а, а,);
£, — случайная составляющая с Ме, - О, Dz, = (Г, причем для простоты
будем предполагать, что ее значения не коррелированы.
Рассмотрим сумму квадратов отклонений известного отрезка
ряда у„ t - 1,..., п, от тренда:
е(«)=Zb,-/(«.»)]'
/ = i
Для минимизации суммы квадратов отклонений необходимо
приравнять к нулю производные по параметрам:
1^- = -2Дз'/-/('.а)]^г- = 0. i' = l,..,*. (Ю3.2)
Если —— линейно независимы как функции времени, то матри-
ца X имеет ранг к:
df(t4a)
Х =
Эос.
, t = ],...,п, i= 1,...,к.
Для исследования движения к точке экстремума необходимо
рассмотреть и вторые производные:
" Эа,-Эау £Эа,Эа. ,4f' ' { '-'Эа.-Эа,. " и
286
Исследование проведем при следующих предположениях,
которые сознательно сформулированы не очень строго (чтобы можно было
только изложить суть метода):
1) нелинейный тренд имеет относительно невысокий порядок
нелинейности, иными словами, вторые производные имеют не очень
большие по модулю значения;
2) точка ос(0), с которой начато исследование, находится вблизи
точки минимума а* = arginf Q(a), т.е. разность (сс(0> - а*) мала.
Исходя из этих предложений, рассмотрим разложение тренда
в окрестности некоторой точки а(/):
. ,„ к Э/-(/,а(,)).
/(/,a) = /^al')) + £_L__/(a/_a(')) + o(A)f (10.з.з)
; = 1
А = max
а, -а
С)
причем вследствие сделанных нами предположении вторые
производные в разложении отсутствуют.
Последовательность точек сс(/), / = 0, 1,2, ..., будем строить
таким бразом, чтобы она сходилась к а*. Введем следующие
обозначения:
ГУ[Л
Y =
УУп
. /(«)=
ГрЛ
е =
Х =
Э/(г,ос(|))
Эсс,
f{n*a)j ^nj
Тогда
Y = /(а) + е = /(а(/)) + *, (а - а(/)) + е, (10.3.4)
где величина £ вобрала в себя и остаточные члены разложения
каждой временной компоненты / (а), при этом по-прежнему считаем,
что Mt = 0.
Если предыдущая точка а(/> уже каким-то образом определена,
то будем искать последующую точку ос(М ° с помощью метода
наименьших квадратов, рассматривая в качестве исходной модели (в
матричном виде) преобразованное в следующий вид выражение (10.3.4):
K-/(a(/)) = ^(a-a(,)) + E, М1 = 0. (10.3.5)
287
Выражение (3.3.5) представляет собой модель тренда,
линейного относительно коэффициентов ос. - ос: , причем наблюдаемыми
значениями ряда являются у{ -fit, ее '), а значениями функций вре-
Э/-(',а">)
мени при параметрах регрессии — ф; (/) = -. Применяя метод
Эос,
наименьших квадратов к оценке параметров линейной модели (10.3.5),
получаем
а-а{,) =(х;х,у* X'Jy-f[a{,))~
обозначив полученную оценку d через а ', имеем:
а{, + 1) =а^ +(х;х,)-* x;[y -f(ai'^
В результате, начиная с некоторой точки or'', получаем
рекуррентную последовательность точе?к ос \ос , ос ,... таким образом,
что каждая последующая точка получается из предыдущей с помощью
метода наименьших квадратов для линейного относительно
коэффициентов тренда. В Приложении 4 доказано, что данная
последовательность при ранее указанных предположениях сходится к точке
минимума
сс1^ —> ос* = arg inf Q (а).
10.4. ЭКСПОНЕНЦИАЛЬНОЕ СГЛАЖИВАНИЕ
В случае линейных и нелинейных временных трендов,
рассмотренных в § 10.1, 10.3, необходимо было постулировать форму тренда
с точностью до параметров перед началом экспериментального
исследования на основе известного отрезка у„ t = 1, ..., и, временного ряда.
Метод экспоненциального сглаживания позволяет анализировать
временной ряд и получать прогноз без предварительного задания формы
тренда. Требуется лишь, чтобы в области исследования тренд
изменялся достаточно постепенно, эволюторно.
В основе экспоненциального сглаживания лежит следующая
теоретико-вероятностная схема:
„v, =/(*) +е, Me, =0, De, =а2, / = !,...,«. (10.4.1)
288
Для простоты далее будем предполагать, что значения
случайной составляющей в разные моменты времени некоррелированны, т.е.
cov(e,,ej = 0, t*s.
Из первоначального временного ряда у, сглаженный ряд S, (у)
можно получить с помощью следующего линейного оператора
сглаживания:
St{y) = ay,+{\-a)S,_{(y), (10.4.2)
где а — константа сглаживания, 0 < а < 1.
Если применить оператор сглаживания последовательно ко всем
значениям отрезка ряда, то получим
•5«М = аЛ+0-а)^-,Ы =
= ay„+(\-a)[ay„_l+(\-a)S„_2(y)] =
(10.4.3)
= ... = ayll+a(\-a)yn_l+a(\-ayy„_2+...+
+ ос(1-ос)"" >ч+(1-а)"~ v|t
при этом в последнем равенстве сглаженное значение S}{y) заменили
на первое известное значение ряда. Таким образом, в случае
экспоненциального сглаживания наблюдения входят в обработку не с
одинаковыми, а с экспоненциально убывающими весами, т.е. настоящие
наблюдения как бы воспринимаются с большим доверием, чем
прошлые. Напомним, что и в методе скользящих средних имеет место
неравенство весов: наблюдения, попавшие в отрезок осреднения, входят
с равными весами, а остальные наблюдения — с нулевыми весами.
Так как веса экспоненциально убывают, то при достаточно
большой длине ряда его прошлые значения входят с быстро
стремящимися к нулю (по мере удаления) весами, поэтому условно ряд
можно считать бесконечным, расширив его за пределы самых удаленных
значений. В этом случае оператор сглаживания запишется в
следующем (унифицированном) виде:
S,b) = a£0-°0V.v- (Ю.4.4)
л = 0
Оператор сглаживания как в первоначальной, так и в
унифицированной форме линеен, поэтому, применяя его к отдельным
составным частям теоретико-вероятностой схемы, можно после сложения
получить результат сглаживания всего исходного ряда.
289
Применим оператор к случайной составляющей, тогда
Ме) = а£(1-а)Ч_,.
л = 0
Найдем теперь дисперсию сглаженных значений случайной
составляющей, воспользовавшись независимостью ее значений в
различные моменты времени:
-|2
DS,{e) = M
a£(l-cc)V.v
v=0
= а2 £ (1-a)v+'Me,_ve,_,.=
.V, Г = I
2 2 VV, \2л а a tt 2
= ат^(1-а) = - = а
л-О
1-{1-а) 2-а
Отсюда следует, что в результате сглаживания дисперсии
случайной составляющей, вообще говоря, уменьшаются, поскольку
< 1, так как a < 2 - a, т.е. действительно имеет место сглажива-
2-ос
ние. «Выступающие» значения детерминированной составляющей
также сглаживаются, т.е. сглаживанию действительно подвергается
временной ряд в целом.
Оператор сглаживания можно вновь применить к уже
сглаженным значениям; в результате получим оператор сглаживания второго
порядка, последующее сглаживание дает оператор третьего порядка
и т.д.:
sl]]=ay, + (\-a)S^(y),
(10.4.5)
Применяя несколько раз оператор сглаживания, а также
подбирая соответствующим образом константу сглаживания, можно
практически полностью исключить случайную составляющую. В результате
останется только преобразованная детерминированная составляющая.
Возникает вопрос: как же все-таки построить прогноз? Из
изложенного выше следует, что пока имеет место такая же ситуация, как
и в случае метода скользящих средних: можно расчетным образом вы-
290
делить детерминированную составляющую, однако нет аналитической
формулы для получения ее прогностических значений.
В случае экспоненциального сглаживания (в отличие от метода
скользящих средних) имеются аналитические выражения для
прогноза. Теорема Брауна, являющаяся фундаментальной в методе
экспоненциального сглаживания, утверждает, что коэффициенты полиномов,
по которым производится прогнозирование, определяются с помощью
дисконтированного метода наименьших квадратов и аналитически
выражаются через сглаживаемые значения ряда.
Введем следующие обозначения для прогнозирующего
полинома степени N, построенного в предположении, что значение ряда
в момент t является последним:
Таким образом, по этому полиному можно получать прогноз
в точках (/ + т). Коэффициенты полинома должны быть определены
так, чтобы прогноз был наиболее точным.
Теорема Брауна. Коэффициенты прогнозирующих полиномов,
определенные по дисконтированному методу наименьших квадратов
aJT(l-cx)A\y,-<-Y,\{-s)'\ ^min, (10.4.7)
линейно выражаются черсч сглаженные значения ряда
Доказательство теоремы сопряжено с громоздкими выкладками,
поэтому приведем его только для случая /V - 1:
Найдем оценки двух параметров прогнозирующего полинома с
помощью дисконтированного метода наименьших квадратов (верхний
индекс / опущен, введено обозначение р — I — ос). Получаем
Q{a^ai) = a^[yl_,-{al)-a]s)]2. (10.4.8)
.v = U
Точку минимума, как обычно, находим из условия равенства нулю
производных:
^ = -2aJ>(>>,_,-«„+«,*) = <),
291
да
= 2«Z 5РЛ (>'<- v - ао + ai5) = 0.
| л = 0
откуда получаем следующие уравнения:
У - \ ( - Л
^.v = 0 ) \х = 1> ) v = (l
I*1
1Л* = ° )
\s=0 J ,v=0
Так как
tp-.i. i>-=^, fye-J1-^-)
а
а
а
то
I - а Л (1) / ч
(1-а)а0-(1-а)<2-а)а,=^>(.у)-ауР(Д
потому окончательно имеем:
5!;»=2s;'>(/)-if'(.v).
aj')=^L[5:"(.v)-S,l2»(.v)].
1 -aL J
(10.4.9)
В случае наиболее часто используемого квадратичного
прогнозирующего полинома
можно аналогично получить следующие выражения для оценок его
коэффициентов:
W=lS^(y)-lsl2)(y) + slV(y), (10.4.10)
а) ' =
а
2(l-a)L
(2)
:(з)
(6-5a)S^{y)-2(5-4a)S^(y) + (4-la)S)i}{y)
(l-a)L
292
Для расчетов на ЭВМ применяют следующие рекуррентные
формулы, эквивалентные формулам (10.4.10):
Й|'> =«!'""+^-"-|а1(2-о)(А-Л),
а|"=«<-'>-о5 (й-л).
Из этих формул видно, что при появлении нового наблюдения
не обязательно хранить весь предыдущий отрезок временного ряда,
надо лишь знать коэффициенты прогнозирующего полинома,
найденные по этому отрезку.
Для прогнозирования на глубину X за пределы известного
отрезка ряда используют прогнозирующий полином, найденный на основе
всего ряда:
iV Л(")
XVе'- (Ю.4.11)
i=0 1-
В том случае, когда в окрестности точки п детерминированная
составляющая близка к постоянной, применяют аппарат однократного
экспоненциального сглаживания и прогноз определяется по формуле
Так как
<>(,) = DS</>(E) = ^L
2 - а
то получаем следующий доверительный интервал прогноза:
S{,!](y)±t/,6yla/(2-a), tr = tp(n-\).
Если в окрестности точки п детерминированная составляющая
линейная, то применяют двойное экспоненциальное сглаживание
и точечный прогноз осуществляют по формуле:
>',,♦! =4) '+«! *•
293
В результате подсчетов можем получить
ОД, + т =
оссг
(2-а)'
1JI
1 + 4(1-а) + 5(1-а) + 2а(4-3а)т + 2а2т
поэтому имеем следующий доверительный интервал для прогноза:
а\ > +<7 Ч±
±tpa]la 1 + 4(1-а) + 5(1-а)2 + 2сс(4-За)т + 2а2т2 }/(2-сс)3.
Если детерминированная составляющая не линейна в
окрестности и, то применяют тройное экспоненциальное сглаживание и
точечный прогноз определяется формулой:
В том случае, если детерминированная составляющая кроме
роста испытывает еще и периодические колебания, т.е. в окрестности
t может быть описана формулой:
/(/ + т) = (4+Ягт)/Ч/ + т),
где F{t) — периодическая функция с известным периодом М, может
быть применено сезонное экспоненциальное сглаживание, которое
реализовано в ряде пакетов прикладных программ. Программная
система по заданному периоду инициализации М производит
первоначальную оценку периодической функции (кМ— число наблюдений):
*•(')=*
Уш
Л/ + 1
-j\B
-1-1
t = (i-\)M+j, t<kM, 7 = 1,..., М, / = 1,...,Аг;
кМ | М
*.=
(£-1)Л/
Т7 L Л-Т72.Л
м
л =(А - 1J.-V/ + |
Л/
1 м
А-1
м
/ = l
294
В дальнейшем производится взаимосвязанное сглаживание
периодической функции и коэффициентов тренда по формулам:
Я=а-^- + (1-а)(Я_1 + Й,_1), при/<М, F,_M=Fr
/г=р4+.(1-р)/;_д,, t>M,
Д=у(Я-1-Д) + (1-у)Д-1.
Прогноз временного ряда на т шагов вперед осуществляется
по формуле
Уп + т=(4,+Впт)Р{» + 1-М), п = кМ.
Оптимальные значения констант сглаживания а, (3, у выбирают
по минимуму суммы квадратов отклонений прогнозов (на один шаг)
от действительных значений ряда.
ВОПРОСЫ И ЗАДАЧИ
1. Определите вид и параметры тренда в динамическом ряде
государственных расходов Швеции (млрд. долл. в ценах 2000 г.)
Год
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
Государственные
расходы
37,4
37,7
37,9
37,7
38,0
38,4
38,8
39.0
39.1
40,4
Год
1990
1991
1992
1993
1994
• 1995
1996
1997
1998
1999
Государственные
расходы
42,7
42,1
42,6
44,8
45,1
45,0
46,6
46,7
48,8
51,0
2. Пусть у, = ос0 + ос,/ + е„ Me, = 0, De, - 0, cov(e„ еЛ) =* 0, s *t, t ~ 1,..., n.
При каком h оценка а, = A^()\ + i ~y,) является несмещенной? Найти
дисперсию этой оценки.
295
3. Имеются следующие данные о числе ошибок лиц, обучающихся
машинописи:
Число месяцев работы
на пишущей машинке
1
2
3
4
Среднее число ошибок
на страницу
25
10
5
2
Найти прогноз среднего числа ошибок для лиц с полуторамесячным
стажем.
ГЛАВА 11
ОДНОВРЕМЕННЫЕ УРАВНЕНИЯ
Эконометрические модели отражают статистические
закономерности, установленные экономической наукой. Эконометрическая
модель — это система одновременных линейных алгебраических
уравнений, некоторые из которых содержат случайные составляющие.
Последние можно трактовать как результат совокупного влияния факторов,
воздействие каждого из которых незначительно и поэтому не может
быть учтено напрямую в модели.
Эконометрические модели могут применяться как на макро, так
и на микроуровне. Цель их применения — количественный анализ
взаимного влияния показателей, описывающих данный
экономический объект (или явление) и прогнозирование будущих значений
одних переменных (показателей) по известным значениям других
переменных.
Различают эндогенные, в том числе лаговые эндогенные,
экзогенные и предопределенные переменные.
Эндогенными (выходными) называются переменные, которые
в каждый текущий момент времени / могут быть определены с
помощью модели.
Эндогенные лаговые — это такие эндогенные переменные,
некоторые прошлые значения которых влияют на их текущие значения.
Экзогенные — это переменные, которые задаются извне модели.
Предопределенными (входными) называются переменные,
по значениям которых определяются значения эндогенных в каждый
момент времени t.
Все уравнения, не содержащие случайную составляющую,
называются балансовыми.
Наиболее широко в экономических исследованиях применяется
конъюнктурная модель Клейна, разработанная этим автором в начале
50-х годов прошлого века для США. Проиллюстрируем все
вышесказанное именно на этой модели.
297
Конъюнктурная модель Клейна
Cl=c[,+c)Pl+c2Pl_l+c2(wtp +W?) + e], Me)=0, DeJ=af,
/, = /„+/,/', +i2Pt_b+i)Kt_]+e.n Me?=0, De? =о22,
/>, = г,-т;-<,
a:, = a:,_, + /,,
где С, — потребление,
/, — чистые инвестиции,
ff/J — заработная плата в частном секторе,
W{{' — заработная плата в государственном секторе,
К, — валовой внутренний продукт (без чистого экспорта и прироста
запасов),
Р, — общая прибыль,
К, — капитал,
С, — госудпра венные расходы,
7] общий сбор налогов.
Как видим, в модели 9 переменных и 6 уравнений. В число
эндогенных переменных входят С„ /„ W'\ Y„ Р„ К„ всего шесть, т.е. ровно
столько, сколько уравнений! Из этих шести три переменные Уп Р„ К,
являются лагоаыми эндогенными* поскольку в текущий момент /
в уравнениях принимают участие также прошлые значения этих
переменных У, |, Р,.), К,..\.
Экзогенными переменными являются Wf, G„ Т„ t; эти переменные
вместе с прошлыми значениями лаговых эндогенных переменных У,_,,
Р, ,, К, , образуют набор t, G„ Ж,с, Y,_b Р,_,, ЛГ,._, предопределенных
переменных.
Первые три уравнения содержат случайные составляющие,
последние три таких составляющих не содержат, поэтому являются
балансовыми.
Модель Клейна, идентифицированная* по данным Канады
за 1955—1975 гг., имеет следующий вид (все стоимостные показатели
в млрд. долл. в ценах 1975 г.):
Расчеты по модели выполнила в 2002 г. студентка Оттавского
университета и заочной формы обучения (экстернат ГУУ по специальности «Финан-
298
С, = 1,407 + 0,694Р, + 0,1РГ_!+ 0,855 (\V,P + W,G) + ell1 а, =1,7,
/, = -2,215 + 0,433/^ + 0,947^_, -0,34К,_, + е,2, а2 =3,85,
^ = 11,624 + 0,779У, + 0,159T,_, + 0,698; + е,3, а3 = 1,87,
к,=с, + /,+с„
Р/ = К/-т;-<,
а:, =аг,_1 + /,.
Из модели, в частности, видно, что увеличение текущей
прибыли на 1 млн долл. приводит к среднему увеличению потребления
на 0,694 млн долл., а такое же увеличение фонда заработной платы
в частном и государственном секторах — к среднему росту
потребления на 0,855 млн долларов. На рост инвестиций наибольшее влияние
оказывает прибыль прошлого года, а на рост фонда заработной платы
в частном секторе ВВП текущего года, кроме того, имеется тенденция
среднегодового роста этого фонда на 698 млн долл.
Таким образом, характерной чертой эконометрической модели
является наличие в системе ее уравнений хотя бы одного уравнения
со случайной составляющей. В частности, вся система может состоять
только из одного уравнения со случайной составляющей, тогда имеем
дело с множественной линейной регрессией.
Другой особенностью эконометрической модели является то,
что она идентифицируется по временной выборке, при этом в
некоторых из переменных может присутствовать временной тренд. Поэтому
другим частным случаем эконометрической модели служит модель
временного ряда с трендом.
И модель линейной множественной регрессии, и модель
временного ряда с трендом — это хорошо изученные объекты, и это
изучение проводилось в рамках математической статистики с
использованием простого и обобщенного методов наименьших квадратов.
Существенно новые проблемы возникли, когда появилась
необходимость работать с моделями, в которых содержится более одного
уравнения со случайными составляющими. По мере преодоления этих
проблем выяснилось, что после определенных преобразований задача
идентификации такой модели сводится к решению нескольких задач
множественной регрессии.
соный менеджмент») А.Н. Князева. Данные предоставлены статистическим
институтом Канады STATS CANADA (Federal Government).
299
Итак, с одной стороны модель множественной регрессии — это
частный случай эконометрической модели, а с другой стороны —
фундамент для изучения обшей эконометрической модели.
11.1. РАСШИРЕННАЯ, СТРУКТУРНАЯ И ПРИВЕДЕННАЯ
ФОРМЫ ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
Введем следующие обозначения (слева от каждой матрицы
в скобках указывается ее размер):
т -^- общее число одновременных уравнений
эконометрической модели,
т — число уравнений, содержащих случайную
составляющую, т < т,
п — число наблюдений за переменными модели,
р — число предопределенных переменных, включая
фиктивную переменную (тождественно равную
единице), коэффициенты при которой являются
свободными членами уравнений,
Уг =
и, =
>'х^
■ V
\л1 )
( и^
\и>)
(тхт)В = Ши
— вектор-столбец значений эндогенных
переменных в момент времени /,
— вектор-столбец значений предопределенных
переменных в момент времени t,
— вектор-столбец (ненаблюдаемых) случайных
составляющих в момент времени t,
— матрица коэффициентов при эндогенных
переменных, причем в каждой строчке один из
коэффициентов равен 1,
300
(/?ixp)/, = ||YM.|| — матрица коэффициентов при предопределенных
переменных.
Замечание. В приведенных обозначениях используется верхний
индекс, это возможно, поскольку рассматриваемые эконометрические
модели — линейные, поэтому этот индекс никак нельзя принять
за показатель степени. Введение значка «тильда» над некоторыми
векторами и матрицами обусловлено тем, что в дальнейшем будут
использоваться уже без значка «тильда» только части этих векторов
и матриц.
В этих обозначениях развернутая запись эконометрической
модели в расширенной структурной форме выглядит следующим
образом:
,/ = i
A = l
k = \
(11.1.1)
EM*/+ £?**'=<>, i = « + 1,...,
7=1
m.
или в матричной форме
By, + Лс, =V„
(11.1.2)
где v, =(w),»/2,...,»;",0...o)
Заметим, что число уравнений т равно числу эндогенных
переменных.
Разделим вектор эндогенных переменных у, на два подвектора
г!" =
'vV
-(2)
гу'Гл
у, J
в подвектор первого типа войдут переменные, коэффициенты при
которых равны 1 в первых т уравнениях, а в подвектор второю типа —
переменные, коэффициенты при которых равны 1 в последних
(т — т) уравнениях. Тогда модель (11.1.2) примет вид
я,й(,) + ад(2)+/>,=!,,,
я3й(,) + я4й(2)+г2*,=о,
(11.1.3)
301
(тхт)В] — матрица коэффициентов в первых т уравнениях
при первой группе эндогенных переменных,
(mx(in- т))В2 ~~ матрица коэффициентов в первых т
уравнениях при второй группе эндогенных переменных,
(m-ffi)xm р3 — матрица коэффициентов в последних
(т - т) уравнениях при первой группе эндогенных переменных,
((т -т)х(т-гп))Вл — матрица коэффициентов в последних
(in-m) уравнениях при второй группе эндогенных переменных,
(тхр)Г1 — матрица коэффициентов при предопределенных
переменных в первых т уравнениях,
((w- т)хр)Г2 — матрица коэффициентов при
предопределенных переменных в последних (т-т) уравнениях,
(т.х 1) и( =
^
\ut )
— вектор-столбец случайных остатков в первых т уравнениях.
Если матрица В4 невырождена, то последнюю группу уравнений
можно разрешить относительно второй группы эндогенных
переменных:
подставив это выражение в первую группу уравнений, получим
(в,-в1в;%)у11)+(г]-в2в;1г1)х, = иг о и.4)
Именно эта система уравнений со случайными остатками,
получившаяся в результате исключения балансовых равенств, и называется
обычно эконометрической моделью в структурной форме.
С этого момента будем пользоваться следующими
обозначениями:
302
»=*'"=
ГУ)Л
у1,
т
\.У> J
— вектор-столбец эндогенных переменных, число компонент которого
равно числу уравнений со случайными остатками,
(тхт) В = В\-В2В^В), (тх р) Г = Г{ - В2В;]Г2.
В этих обозначениях структурная форма эконометрической
модели приобретет следующий законченный вид:
Ву, + Гх,-ип / = 1,...,л. (11.1.5)
Идентификации модели состоит в оценке ее коэффициентов
по выборочным данным.
Диагональные элементы матрицы В равны 1, поэтому подлежат
оценке по выборочным данным только т1 - т элементов матрицы В.
В матрице Г тр переменных, поэтому для идентификации модели
в структурной форме надо оценить т{т - 1 + р) коэффициентов
матриц В и Г.
Относительно случайных остатков и, обычно делаю гея
следующие предположения:
Л/и/ = 0, Г = 1 я, 7 = 1,..., т. (11.1.6)
Duj=a),
cov(w/,u/) = 0, /*/',
cov(u/,w/) = 0, /*/,
т.е. случайные остатки одного уравнения некоррелированы для разных
наблюдений, случайные остатки разных уравнений некоррелированы
между собой, для каждого из уравнений случайные остатки
центрированы и гомоскедастичны.
Трудность идентификации структурной формы (11.1.5)
заключается в том, что прямое применение к каждому уравнению структурной
формы МНК неприемлемо, поскольку приводит к смещенным (иногда
и несостоятельным) оценкам коэффициентов. Это обусловлено тем, что
в каждом уравнении наряду с предопределенными переменными при-
303
сутствуют, вообще говоря, все эндогенные (объясняемые) переменные.
Для того чтобы стало возможным напрямую применять МНК, надо
добиться того, чтобы в каждом уравнении имелась бы ровно одна
эндогенная переменная (с единичным коэффициентом), тогда это уравнение
становится обычным уравнением множественной регрессии и МНК
эффективно работает, как это было описано в главах 9—10.
Итак, для преодоления указанной трудности разрешим систему
уравнений структурной формы (11.1.5) относительно эндогенных
переменных. Это возможно только в том случае, когда матрица В
невырождена, т.е. det В Ф 0. Пусть это имеет место, тогда, умножив левую
и правую часть (11.1.5) на В ', получим
у, + B~lrxt =B~]ut, / = 1,...,Л,
или
yt = flxt +£,, / = 1,...,я, (11.1.7)
где (тхр) П=-В~*Г,
(/7X1) £, = Д~'м,, t = \,...tn.
Система уравнений (11.1.7) называется эконометрической
моделью в приведенной форме, Каждое уравнение приведенной формы
имеет вид обычного уравнения множественной регрессии (если одна
из предопределенных переменных равна 1, то коэффициент при ней —
свободный член)
>>/=£*//*,'+е/, (П.1.8)
где л(. = (л;л,..., я.,.,..., я) —у'-я строка матрицы коэффициентов В при
предопределенных переменных,
е/ = (В"] j и,, (# '). ■—./-я строка матрицы В~\
Поскольку £, = В~]иг, то при выполнении (11.1.6)
Me, =B~'Mu, = 0,
(д-,).и„(в-,).И/)= £(5-,)>cov(w;,w;)(5-l) =
1 J г. л = 1 Jt
т
= Е(Д',)-Г°'(Д",)-Г = &?' ^ = 1---..-,я;У = 1 «,
304
cov(E/,e^) = cov((5-1) ^.(Д-1) и^) =
г, л = 1 '
при / Ф t' ((В {\. — элемент матрицы В'л).
Иными словами, если случайные остатки структурной формы
центрированы, некоррелированы и гомоскедастичны, то такими же
свойствами обладают и случайные остатки приведенной формы.
Сквозной пример 11.1. Упрощенная модель Клейна.
Рассмотрим следующую эконометрическую модель, состоящую
из трех одновременных уравнений
с, = cQ + t\Y,+rfn
/^io+i^+fi,2, (11.1.9)
Y^C^I^G,, f = l,...,w,
где С, — потребление за год /,
/, — чистые инвестиции за год t,
Y, — валовой внутренний продукт (ВВП) за год / без чистого экспорта
и прирост шпасов,
С, — государственные расходы за год /,
й],й? — центрированные, некоррелированные и гомоскедастичные
случайные остатки уривпений,
t'i — склонность к потреблению,
/, — склонность к инвестированию,
с<>» 'о — свободные члены первого и второго уравнений.
В этой модели три уравнения, первые два — это уравнения
со случайными остатками, последнее уравнение — это балансовое
равенство.
С„ /„ Y, —эндогенные (выходные) переменные модели, хю = 1,(7,—
экзогенные (входные) переменные модели.
В модели нет лаговых эндогенных переменных, поэтому
предопределенные (объясняющие) переменные — это только экзогенные
переменные.
В модели четыре параметра с(), си «'„, /',, которые надлежит оценить
по выборочным данным.
Как видим, первоначальная форма модели (11.1.9) не является ни
структурной формой, ни приведенной формой.
Для исключения балансового равенства (т.е. третьего уравнения)
подставим его в первые два уравнения со случайными остатками
305
Раскрыв скобки и приведя подобные члены, а также поделив первое
уравнение на коэффициент при С„ второе — на коэффициент при /„
получаем следующую структурную форму модели (все переменные
находятся в левой части каждого уравнения, случайные остатки —
в правой части)
где pi2=--S-, 7|0 = --ii!_, y,^--^-,
I - С] I - C, I - f'|
R _ f'| _ /() /']
Р21"" . . ' Y2II ~ . . ♦ Y2I = , . '
В матричной записи структурная форма модели приобретает такой
же вид, как структурная форма (11,1.5) любой жономстрической модели
Ву, + Гх,~ м„
в нашем случае (т = 2, р = 2)
<2х2> 4!, >')•(2х2» -и: ?,:
(2X1) Л-^']. (2x1) „,.Щ
Следует обратить внимание, что в структурной форме (11.1.10)
чисто формально шесть коэффициентов, подлежащих оцениванию
по выборочным данным, однако на самом деле, исходя из
первоначальной модели, надо найти только четыре коэффициента, поскольку
из этой модели следует, что [312 = у],, р\, = у,,.
Разрешим уравнения структурной формы (11.1.10) относительно
эндогенных переменных С„ /„ тогда получим приведенную форму
С, =7cl0 + 7cMG, + e„
/, =rc20 + 7c2lG, + е,,
(11.1.11)
= П-ч)со + с1'о П1 _/|С(|+(1-С|);п (Ц.1.12)
1-е,-*, i-q-'i
1 - с. - /, 1 - с, - Л
306
I — г, — /, I — с, - /,
Рассматриваемая модель названа упрощенной моделью Клейна
по следующим двум соображениям:
первое упрощение состоит в том, что три уравнения модели Клейна
(капитала, заработной платы частного сектора, дохода частного
сектора) исключаются;
второе упрощение состоит в том, что потребление и чистые
инвестиции зависят только от ВВП в год / и не зависят от значений ВВП
в предыдущие моменты времени и от переменных, которые выведены
из модели в связи с исключением трех уравнений.
11.2. УСЛОВИЯ ИДЕНТИФИЦИРУЕМОСТИ
ЭКОНОМЕТРИЧЕСКОИ МОДЕЛИ
Отдельное уравнение эконометрической модели в структурной
форме называется идентифицируемым, если по выборочным данным
могут быть оценены его коэффициенты.
Эконометрическая модель идентифицируема, если
идентифицируемы все уравнения структурной формы этой модели.
Таким образом, идентифицируемость — это возможность
оценки (быть может, неоднозначной) всех коэффициентов структурной
формы по выборочным данным. Если в результате проверки условий
идентифицируемости оказалось, что модель неидентифицируема,
и потому работать с ней нельзя, то ее надо так скорректировать, чтобы
она стала идентифицируемой.
Условия идентифицируемости устанавливаются как условия
осуществимости следующей процедуры: переход от структурной
формы к приведенной, оценка коэффициентов приведенной формы,
определение коэффициентов структурной формы по коэффициентам
приведенной формы. Если первоначальная модель не представлена
в структурной форме, то возникнут также условия возможности
определения коэффициентов первоначальной формы по коэффициентам
структурной формы. Эта заключительная часть процедуры показана
для упрощенной модели Клейна в сквозном примере.
В процессе осуществления указанной процедуры станет ясно,
что некоторые условия относятся к эконометрической модели в целом,
в то время как другие - к отдельным уравнениям. Условия первого
типа появляются на прямом пути от структурной формы к приведен-
307
ной, а условия второго типа — на обратном пути получения оценок
коэффициентов структурной формы по коэффициентам приведенной
формы.
11.2.1. Условия идентифицируемости
эконометрической модели в целом
Прежде всего рассмотрим расширенную структурную форму
модели (П.).2). Число уравнений и число эндогенных переменных
в ней одинаковы и равны т. Если бы число эндогенных переменных
было больше числа уравнений, то первые невозможно бы было
определить. Напротив, если переменных меньше, чем уравнений, то
эндогенные переменные определяются неоднозначно.
Итак, первое необходимое условие идентифицируемости: число
эндогенных переменных и число уравнений расширенной структурной
формы должны быть одинаковыми.
Следующий шаг: исключение балансовых равенств. Этот шаг
осуществим, если матрица Z?4 коэффициентов при подвекторе второго
типа в балансовых равенствах не вырождена, т.е. det ВА * 0. Это
второе необходимое условие идентифицируемости.
В результате исключения балансовых равенств получается эко-
нометрическая модель в стандартной структурной форме. В ней число
эндогенных переменных (первого типа) равно числу уравнений
со случайными остатками. Если бы уравнений было меньше, то их
нельзя бы было разрешить относительно эндогенных переменных,
если больше, то решение получилось бы неоднозначным Поэтому
третье необходимое условие идентифицируемости состоит в том, что
число эндогенных переменных стандартной структурной формы равно
числу уравнений.
Следующий шаг: разрешение уравнений структурной формы
относительно эндогенных переменных. Это возможно, если матрица В
коэффициентов при эндогенных переменных не вырождена, т.е.
det В^О. Это четвертое необходимое условие идентифицируемости.
Поскольку набор независимых (предопределенных) переменных
в каждом уравнении (множественной регрессии) приведенной формы
один и тот же, то и коэффициенты (при оценках параметров
регрессии) нормальных уравнений одни и те же. Матрица А коэффициентов
нормальных уравнений равна А = Х'Х, напомним
308
(пхр) Х =
Л] т
-v,->
Х-, „
У^н!
St2
"/> У
— матрица выборочных значений предопределенных переменных.
Поэтому для того, чтобы можно было найти оценки П всех
коэффициентов приведенной формы, необходимо, чтобы матрица
нормальных уравнений (Х'Х) была не вырождена, т.е. det (Х'Х) Ф О, а это
имеет место лишь тогда, когда ранг матрицы Л'равен р. Это пятое
необходимое условие идентифицируемости.
Сквозной пример 11.2. Условия идентифицируемости упрощенной
модели Клейна
Проверим, как выполняются найденные выше условия
идентифицируемости для рассматриваемой нами модели.
Первое условие выполнено, поскольку в расширенной структурной
форме число уравнений т = 3 и столько же эндогенных переменных:
С, /, Y.
Второе условие также выполнено, т.к. матрица В4 при
исключаемой переменной У (коэффициент при ней в балансовом уравнении
равен 1) имеет размеры (1 х 1) и равна 1 (т.е. det В4 - 1).
В стандартной структурной форме два уравнения со случайными
остатками, т.е. т - 2, и столько же эндогенных переменных: С, /,
поэтому третье условие выполнено.
Рассмотрим матрицу коэффициентов при эндогенных переменных
в стандартной структурной форме
1 1 Р,2Л
1
в =
VH2I
ГДС Э|2=-
|-(
l-'i
поэтому
det 5 = 1-р|2(3Э| =
(1-е, )(1-/,)-с,/1 1-е,-/,
(i-c,)(i-«,) (i-q)O-O'
следовательно, четвертое необходимое условие (det 5/0)
выполнено в том случае, если с\ + /', Ф 1, т.е. сумма склонностей к
потреблению и к инвестированию не равна 1.
309
Матрица X в нашем случае (т.е. в случае парной регрессии) имеет
вид
Х =
г\
1
1
ч1
°л
G
Gr
GN;
поэтому
Х'Х =
1} II
Ее, 5Х
\i=\ i=i
п nG
nG nG2
где G' = —VG, g':=—Vg'/,
откуда
det(*#) = w2]T(G,-(7)\
" — 2
Итак, пятое необходимое условие выполнено, если ^((7, -С?) /О ,
а это будет иметь место в том случае, если государственные расходы не
являются постоянными, т.е. изменяются во времени.
11.2.2. Условия идентифицируемости
отдельного уравнения эконометрической модели
Если пятое условие идентифицируемости выполнено, то могут
быть получены оценки коэффициентов каждого уравнения
приведенной формы kj = (kn,...,kj \, i = \,...,m.
Вопрос теперь стоит так: можно ли по оценкам коэффициентов
приведенной формы /7 найти оценки коэффициентов структурной
формы, т.е. выразить коэффициенты матриц В, Г через коэффициенты
матрицы оценок П ? Матрицы В, Г связывает с матрицей П
соотношение (см. 11.1.7)
В]Г = -П, (11.2.1)
310
которое можно представить в виде
ВП = -Г. (11.2.2)
Если матрица оценок П известна, то, согласно (11.2.1), для
нахождения полного набора т2 - т коэффициентов В и полного набора
тр коэффициентов Г имеется тр уравнений (в матрице П тр коэффи-
циентов), т.е. для определения коэффициентов В, Г по оценкам П не
хватает (т2 - т) уравнений. Для того чтобы преодолеть эту проблему,
«обнуляют» некоторые коэффициенты матриц В, Г, что с
экономической точки зрения означает пренебрежение некоторыми наименее
важными связями между переменными модели. В результате число
ненулевых коэффициентов матриц В, Г становится не больше тр, т.е.
числа коэффициентов матрицы П (лучше точное равенство).
Шестое необходимое условие состоит в том, что среди
уравнений структурной формы не должно быть двух (или более) уравнений
с одинаковыми номерами «обнуленных» коэффициентов.
Рассмотрим произвольное /-е уравнение структурной формы.
Перенумеруем эндогенные переменные так, чтобы первые mh т, й т,
из них были тс, коэффициенты при которых в структурной форме
отличны от нуля. Аналогичным образом перенумеруем
предопределенные переменные.
Тогда /-с уравнение структурной формы примет следующий
вид:
ix.y/+£>,**,*=4, t=\,...,n, (п.2.3)
j=\ *=i
в этом уравнении (m, - 1) неизвестных коэффициентов Р,у и р,
неизвестных коэффициентов yik.
Для определения этих (ю, - 1 + /?,) неизвестных коэффициентов
имеется р уравнений, которые получаются, если взять г-ю строку
матричного соотношения (11.2.2)
(Р(/)'°)[Гп Л*(Д1—(^)-О). (П.2.4)
{"у(ч ПЛ1))
где (1 х т) Р(/) = (рл, р,2> •••■> Р/,п.) строка ненулевых коэффициентов
при эндогенных переменных,
{mt х р^ fj(i) — матрица оценок коэффициентов приведенной
формы в первых т{ уравнениях при первых р, предопределенных
переменных,
311
((w - т{)х рЛПv(i) — матрица оценок коэффициентов
приведенной формы в последних (/и —/и.) уравнениях при первых р(
предопределенных переменных,
(ml х(/>- pj))nv(/) — матрица оценок коэффициентов
приведенной формы в первых т, уравнениях и при последних (р - р,)
предопределенных переменных,
((ш - mt) х (/? - р,))Пху (/) — матрица оценок коэффициентов
приведенной формы в последних (w-mj уравнениях при последних
(р ~~ Р,-) предопределенных переменных,
У{') ~ (Ун' Y/2' ••-' 7//>.) — строка ненулевых коэффициентов при
предопределенных переменных.
Для оценок неизвестных коэффициентов (3(/), y(f) /'-го уравнения
структурной формы получаем следующие уравнения:
(\х(р-р,)) Р(/)Я,(/) = 0 (11.2.5)
• (lxft) y(i) = 4(i)n(i).
В строке р(/) один коэффициент равен 1, так что в первых (p-pi)
линейных неоднородных уравнениях (т, - 1) неизвестное, поэтому для
возможности их разрешения относительно этих т, - 1 неизвестных
должно быть r(n(i)j = m, - 1, кроме того,р-pt >mt-\. Итак, седьмое
условие состоит в том, что матрица /7(/) оценок коэффициентов
приведенной формы в первых nij уравнениях при последних (р-р,)
предопределенных переменных должна иметь ранг т, - 1, а восьмое
условие— в том, что число p~Pi нулевых коэффициентов структурной
формы при предопределенных переменных (т.е. число уравнений
первой группы (11.2.5)), должно быть не меньше числа т, - 1 неизвестных
коэффициентов при эндогенных переменных структурной формы.
Рели первая группа уравнений (11.2.5) имеет одно или
несколько решении Р(/), то с помощью второй группы уравнений (11.2.5)
определяются оценки у(/) ненулевых коэффициентов структурной
формы при предопределенных переменных.
Если окажется, что общее число (т, - 1 + р) неизвестных
(ненулевых) коэффициентов /-го уравнения структурной формы меньше
312
числа р уравнений (11.2.5), то говорят, что г'-е уравнение сверх-
идентифщируемо, при этом сами коэффициенты оцениваются
неоднозначно.
Сквозной пример 11.3. Условия идентифицируемости каждого из
уравнений структурной формы упрощенной модели Клейна
Приведенная форма упрошенной модели Клейна задана днумя
уравнениями (11.1.11). Если выполнено условие 5 (неодинаковость
объема государственных расходов за рассматриваемые годы), то
коэффициенты двух уравнений приведенной формы можно оценить с
помощью применения метода наименьших квадратов к каждому
уравнению по отдельности. Поскольку каждое уравнение — это уравнение
парной регрессии, то оценки имеют вид
t.C,(G,-C) £/,(«,-с)
Z(G,-G)' £(G,-G)-
/=1 Г-!
Кю =С — KUG, 7С20 = / — 7С21С
Теперь для определения коэффициентов структурной формы по
коэффициентам приведенной формы воспользуемся соотношением
(11.2.2), которое в нашем случае имеет вид
1 Pi2Yftm *nl _|Чо Yll
(11.2.6)
или в развернутом виде
*I0 + Pi 2*20 = YlO'
Л) +Pl2*2l = — "У| I -
Р2|ям+7с21=-у2|.
Система из первых двух уравнений предназначена для определения
параметров P|2>Yio'Yn пеРвого уравнения структурной формы, а
система из последних двух уравнений — параметров p\i'Y2o>Y2i второго
уравнения структурной формы. Таким образом, всего в структурной
форме шесть неизвестных параметров.
Как видим, в каждом случае для определения трех параметров
имеется два уравнения, т.е. и первое и второе уравнение структурной
формы неидентифицируемы, поэтому, согласно теории, в каждом из двух
уравнений структурной формы надо обнулить один параметр, т.е.
пренебречь какой-то связью.
313
Однако в нашем примере этого делать не придется, т.к. нас
интересует первоначальная модель (11.1.9), в которой только четыре
неизвестных параметра: сп, с,, /0, /,. Из этого обстоятельства следует, что
между параметрами структурной формы действуют следующие два
соотношения: 312 = Y[|,P2| = у2)- Если воспользоваться этими
соотношениями, то системы (11.2.6) приобретают вид
Л10 + Р|2Л21) = ~Ун)>
яи+|312л:21 =-р,2.
р2|7С|0 + ТС20 =—yi0,
$2\K\\+it2\=-$2\-
Первая и вторая системы имеют следующие решения:
(11.2.8)
(11.2.7)
У и
Y2I
* тс
-R - "
Pl2 . , - •>
1 + л21
-в - *21
Р21 , , - '
1 + ТС,,
К\\К20
1 + л2|
1 + тсп
-л,
-тс.
Разрешим теперь соотношения (11.1.10) между параметрами
первоначальной и структурной форм относительно параметров
первоначальной формы
q=__bi_ с Tjo_> (lh2,8)
' 1-Р.2 ° 1-Р.2
i Р21 у _ ?20
Подставим теперь в последние выражения значения оценок
структурной формы по формулам (11.2.8), тогда получим зависимость
оценок коэффициентов первоначальной формы от оценок коэффициентов
приведенной формы
*- (U^K-tc,,^,^ (и29)
1+ТСи+ТС2| 1 + ТСп+7С21
*2I ; _(1 + "ll)ft20-ft21ftIO
1 + ТС||+ТС2| l + TC^+TCj,
Таким образом, первоначальная модель идентифицируема, т.к.
четыре ее коэффициента с0, с,, i0, /', могут быть найдены по оценкам
коэффициентов приведенной формы по формулам (11.2.9).
11.3. МЕТОДЫ ИДЕНТИФИКАЦИИ
ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
Исходными данными для идентификации служат выборочные
значения эндогенных и предопределенных переменных
Y =
Л,' 2
У] Ух
] 7
Уг Уг
у\ У]
\у\ у1
л
V")
У,
У„ )
( 1
Х =
2
*7
-/Л
\лн
<J
(11.3.1)
Строки с номером / в матрицах К, X— это выборочные значения
эндогенных и предопределенных переменных для наблюдения /
(например, за год /), / = 1,..., п.
Отдельные столбцы выборочных матриц Y, X, а также U
(ненаблюдаемых случайных остатков) далее будем обозначать большими
буквами с нижними индексами
rJ=
у;
X)
вектор-столбец выборочных значений/-й эндогенной переменной,
*ь =
\лп J
— вектор-столбец выборочных значений /г-й предопределенной
переменной,
315
i
l(2
— вектор-столбец значений случайной составляющей i-ro уравнения.
Ниже рассматриваются наиболее употребительные методы
идентификации эконометрической модели.
11.3.1. Косвенный метод наименьших квадратов
Этот метод фактически уже был описан в предыдущей главе
при выводе условий идентифицируемости. Суть его состоит в том, что
напрямую оцениваются не коэффициенты структурной формы, а
коэффициенты приведенной формы (поэтому метод и называется
косвенным), после чего по оценкам коэффициентов приведенной формы
определяются оценки коэффициентов структурной (или
первоначальной) формы.
Итак, вначале по обычному МНК определяем оценки
коэффициентов каждого уравнения приведенной формы по отдельности
(я, = (я/р^2,...,1С/и))
к]=(Х'Х)"1 Л% / = 1,...,го. (11.3.2)
Все равенства для оценок (11.3.2) можно свернуть в одно
матричное равенство
П'=(ХХ)~^ ХУ. (11.3.3)
Затем по оценкам параметров приведенной формы находим
оценки коэффициентов структурной формы, используя соотношение
(11.2.2)
ВП = -Г. (11.3.4)
Последнее матричное уравнение имеет размер (mx/з), т.е.
в нем содержится тр отдельных линейных алгебраических уравнений.
Поскольку перед проведением идентификации была установлена
идентифицируемость модели, то подлежащих определению с
помощью уравнений (11.3.4) элементов матриц В и Г должно быть
316
не больше тр (некоторые элементы этих матриц могут быть равны
нулю, другие равны между собой и т.п.).
Полученные оценки коэффициентов приведенной формы
позволяют получить выравненные значения эндогенных переменных
yj=x,n)% у = 1,...,/и,
где xt = (a,1, jr,2,..., а/') — • /-я строка матрицы Л'или значения
предопределенных переменных для наблюдения /,
я . = Г я -(, ft -2,..., тс. ) — вектор-строка оценок коэффициентов при
предопределенных переменных в j-м уравнении
приведенной формы.
Зная фактические и выравненные значения эндогенных
переменных, можно определить несмещенные оценки дисперсий
случайных остатков уравнений приведенной формы (а^ = Dyj = Dej)
1
п-Р, = \
Поскольку случайные остатки приведенной и структурной форм
связаны соотношением (11.! .7)
е,=дЛ/„
откуда получаем зависимость случайных остатков структурной формы
от остатков приведенной формы
U, = Be„ (11.3.6)
где U, =
гиу\
и:
\Ч j
fe*\
, е,=
Vc( J
Найдем зависимость дисперсий случайных остатков
структурной формы от соответствующих дисперсий приведенной формы
DU; = cov(*.е„ В,г,) = cov XР,/Е/' ZM)'
\j = \ г=\
т и
= xp„p„covK-cov<)=Zp^.
./,/ = 1 " ./ = !
317
0£/;=$>Jo*, | = j ,„. (Ц.3.7)
./ = 1
Сквозной пример И.4. Применение косвенного метода
наименьших квадратов для идентификации упрощенной модели Клейна.
Приведем результаты применения косвенного МНК для
идентификации упрощенной модели Клейна по исходным данным Швеции*
за 1980—2001 гг. Исходные данные приведены в табл. 11.1, в связи
с чем читатель сам может выполнить расчеты, результаты которых
приведены ниже.
Таблица 11.1
Важнейшие макроэкономические показатели Швеции
за 1980—2001 гг. в млрд дол. (в ценах 1995 г.)
( С), /, — расчетные (выравненные) значения)
№
п/п
1
2
3
4
5
6
7
6
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Годы
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
Y
125,0
124,8
126,3
128,6
134,2
137,1
140,8
145,6 -
149,3
153,3
155,0
153,3
150,6
152,3
158.7
165,1
167,2
171,3
177,5
185,7
193,8
210,6
Потребление
С
61,9
63,0
64,8
64.0
65.1
67,4
69,7
73,6
75,2
75,3
75,6
78,7
78,5
78,4
80,2
80,6
82,0
84,4
87,0
90,7
95,1
102.7
С
70,1
70,5
70,9
70,5
70.9
71,4
71,9
72,1
72,2
73,9
76,8
76,0
76,7
79,4
79,8
79,7
81,7
81,8
84,5
87,2
88,5
95,4
Чистые
инвестиции
/
25,8
24,1
23,6
26,9
31,0
31,2
32,3
32,9
35,0
37,6
36,7
32,5
29,5
29,0
33,4
39,5
38,7
40,1
41,7
43,9
46,7
50,3
7
31,9
32,1
32,2
32,1
32.2
32.5
32,7
32,8
32,8
33,5
[ 34,7
34,4
34,6
35,8
35,9
35,9
36,7
36,8
37,9
39,0
39,5
42,4
Государственные
расходы
37,4
37,7
38,0
37,7
38,0
38,4
38,8
39,0
39,1
40,4
42,7
42,1
42,6
44,8
45,1
45,0
46,6
46,7
48,8
51,0
52,0
57,5
Сбор данных за I960—2001 гг. и расчеты по ним выполнили в 2002 г.
студенты ГУУ (III курс, специальность «Мировая экономика») Качанов В.М.,
Соколов М.А., Евтихеева М.Г., Коновалов Н.В.
318
Расчет коэффициентов парной регрессии потребления по
государственным расходам дал следующие результаты:
7С10 =22,98; ft,, =1,26;
поэтому выравненные значения коэффициентов потребления равны
С, =22,98 + l,26G,.
Оценки коэффициентов парной регрессии чистых инвестиций
по государственным расходам таковы;
jc2l) = 12,49; 7С2|=0,52,
поэтому выравненные значения чистых инвестиций равны
I, = 12,49 + 0,52G,.
Подставим теперь оценки коэффициентов 7С)0,7СП,7С20,7С2|
приведенной формы в формулы для коэффициентов первоначальной эконо-
метрической модели, получим
с0=6,7; с, =0,45;
/0=5,86; Г, =0,19.
Таким образом, конкретная эконометрическая модель Швеции,
полученная с помощью косвенного МНК (по данным 1960— 2001 гг.),
имеет вид
С, = 6,7 + 0,45У, +»;,
/, = 5,86 + 0,19К,+й,2,
y,=C, + l, + Gr
Коэффициент 0,45 при Y, в первом уравнении (склонность к
потреблению) означает, что при увеличении ВВП на 1 млрд дол.
потребление возрастет в среднем на 450 млн дол. Точно так же коэффициент
0,19 при Y, во втором уравнении (склонность к инвестированию)
означает, что такое же увеличение ВВП приведет к среднему росту чистых
инвестиций на 190 млн дол.
11.3.2. Двухшаговый метод наименьших квадратов
Применим двухшаговый МНК к /-му уравнению эконометриче-
ской модели (11.1.5).
Введем следующие обозначения
Jj — множество номеров эндогенных переменных (кроме
номера /'), коэффициенты при которых отличны от нуля, всего таких
номеров — (ntj - 1) (вместе с /-м номером число отличных от нуля
коэффициентов равно w,),
319
Kt — множество номеров предопределенных переменных,
коэффициенты при которых в /-м уравнении отличны от нуля, число
Таких коэффициентов —рг
(п х (т< - 1)) Y(i) — матрица, составленная из векторов-столбцов
У, выборочных значений эндогенных переменных^ е Jh
(п х р/) X(i) — матрица, составленная из векторов-столбцов
выборочных значений предопределенных переменных Хк, к е К„
((ш, - 1) х 1)(3(/) — вектор-столбец, составленный из ненулевых
коэффициентов f3,y,y е J, при эндогенных переменных в i-м уравнении
(исключая коэффициент 1 при эндогенной переменой У),
(р,• х 1) т(0 — вектор-столбец, составленный из ненулевых
коэффициентов;^, k е Kj при предопределенных переменных в i-м
уравнении.
В этих обозначениях п уравнений (11.3.8) в матричной форме
запишутся следующим образом:
к/+П0Р(0 + Д/Ж0 = ^. (П.3.8)
Перенесем теперь все члены этого матричного равенства, кроме
Yh в правую часть
Г--К(/)(3(0-Д/)7(0 + ^. (П3.9)
По форме это матричная запись п выборочных уравнений
модели множественной регрессии, однако наличие в правой части
некоторых других эндогенных переменных исключает прямое применение
МНК, поэтому и необходима двухшаговая процедура.
На первом шаге с помощью МНК строятся регрессии
эндогенных переменных с номерами / е J, по всем предопределенным
переменным, иными словами производится оценка параметров регрессии
следующих моделей:
или в матричном виде
Yf = XaJ+\J, jeJ„ (11.3.10)
где а' =
а"
вектор-столбец параметрову-й модели,
320
%■' =
(%j\
$»'
Ui.
вектор-столбец случайных остаткову-й модели.
Применив к каждой модели МНК, получим
а1 =(Х'Х)~] X'Yj, jej;. (11.3.11).
Свернем (т,- 1) соотношение (11.3.11)в одно выражение
а = (Х'Х)~] X*Y(i), (11.3.12)
в котором
(р*(т,-\)) &=(&■''), ./еУ,
С помощью полученных оценок ос найдем набор значений
переменных с номерами^ е J,
Y(i) = Xa. (11.3.13)
Подставим в (11.3.9) вместо набора Y(i) выборочных значений
объясняющих эндогенных переменных набор их выравненных
значений, тогда получим следующее матричное равенство:
Y,. = -Y(i)^(i)-X(i)y(i) + Uit (11.3.14)
в этом равенстве справа присутствуют наряду со случайными
остатками только выравненные значения У(/) и значения X(i)
предопределенных переменных. Вторым шагом является оценка по МНК
параметров (3 (/), с (0 множественной регрессии (11.3.14).
Нормальные уравнения для этих параметров множественной
регрессии в этом случае будут иметь вид
rY'(i) Y(i)
X\i) f(i]
Если матрица
?'{i) 1(0
V
*'(/) Х(ф(1))
*('■)
(' V'
\
(11.3.15)
((mi-\ + pi)x(m,~\ + pi)) А =
■\'\
y'{i)¥(i) Y'(i)X(i)
X'(i)Y'(l) X'(i)X(i)
321
оказалась невырожденной, то могут быть найдены оценки параметров
структурной формы, рассматриваемых как параметры множественной
регрессии
Если ввести обозначения
то в этих обозначениях
9
, z(/) = (y(/),^(0), -(п.3.16)
2МНК
(')='
Г(/)уЛ
df =
х'(1)у,.
Га,.-, =«?""'• ^-°^.
——!——rn-zfoe^^otk-zto&^HKWi
Сквозной пример 11.5. Применение двухшагового метода
наименьших квадратов для идентификации упрощенной модели Клейна
В качестве исходных данных снова используем значения
важнейших макроэкономических показателей Швеции за 1980-2000 гг.,
представленные в табл. 11.1.
Первый шаг двухшаговой процедуры уже выполнен в процессе
применения косвенного МНК: установлена регрессионная зависимость
эндогенных переменных (С, I) от предопределенных переменных (см.
сквозной пример 11.4.)
С, =22,98 + l,26G,,
/, = 12,49 + 0,52G,.
Рассмотрим теперь второй шаг применительно к первому
уравнению, для этого в него вместо /, подставим I,, тогда получим
С,+IV,+Yio+YnG, =",'>
или
с,=-у10-М,-У|,с,+м,''
322
но поскольку согласно первоначальной модели Р,2 = уп, то в этом
случае последнее уравнение запишется как модель парной регрессии
С,=-у,о-Ун(',+<?,) + «,',
в которой зависимой переменной служит С„ а независимой (l, + G,),
поэтому МНК-оценки параметров этой модели имеют вид
±c\ii+g^(J7g)
i -1 L
~Yi i ~ „ г -а '
f\l,+G,-ll + G,)
-T,o=C+Y„(/+g).
Подставив в последние формулы значения временных рядов С„ /,,
G, из табл. 11.1, получим
1064,6
-Ум = = 0,863,
'" 1233,4
-У]0 =77,0-0,683-78,1-9,6.
Теперь в свою очередь подставляем эти значения в формулы
(11.2.9), в результате получаем
0,863
1+0,863
9,6
-0,463,
= 5,153.
1 + 0,863
Таким образом, применение двухшагового МНК к первому
уравнению структурной формы позволило идентифицировать первое
уравнение первоначальной формы
С, =5,15+ 0,46 Г, + Й,1,
как видим, получилось уравнение, весьма близкое к тому, которое
было найдено с помощью косвенного МНК.
11.3.3. Трехшаговый метод наименьших квадратов
Этот метод применяется тогда, когда нарушается условие гомо-
скедастичности или когда случайные составляющие коррелированы.
Для оценки коэффициентов каждого уравнения структурной формы
по-прежнему применяется двухшаговый МНК. Тогда третий шаг
состоит в следующем.
323
По 2МНК-оценкам коэффициентов структурной формы
определяются оценки значений эндогенных переменных (выравненные
значения), после чего находятся разности фактических и выравненных
значений, а уже по этим разностям устанавливается оценка
ковариационной матрицы случайных составляющих и, наконец, с помощью
этой матрицы определяются ЗМНК-оценки параметров структурной
формы.
В обозначениях (11.3.16) каждое уравнение структурной формы
для выборочных данных записывается в следующем матричном виде
y,=z(/)e(0 + (/,;
умножив обе части этого векторного равенства размера п на X'',
получим векторное равенство размера р
Х% = X'Z(i)b(i) + X'Ui
или
y) = z(/)e(/) + tf,., (п.3.16)
где Yi = X'Y,, Z(i) = X'Z(i), 0, = XV,,
при этом Z(i) не коррелируете Ur
Ковариационная матрица случайных составляющих имеет вид
(I, =<»?*.)
£\ =Mlulu;) = M(x'uiu'ix) = x'Muiu'ix = x'YJU Х = а*Х'Х,
поэтому £~ =(5]2(Х'Х)~ .
Применим ОМНК для определения оценок параметров 0(/)
(напомним, 0(/) = -(р(г), у(/)) ) соотношений (11.3.16)
eOMHK(0 = r?'(0Z^(0>(0S,.>?/ =
', ' (11.3.17)
Z'(i)X(X'xy]XZ(i) Z'(i)X(X'X)~lX'Yr
Можно показать, что оценки (11.3.17) совпадают с оценками,
полученными по двухшаговому МНК, т.е.
"ОМИК \Ч -®2МПК\1)-
324
Запись (11.3.16), примененную для /-го уравнения структурной
формы, можно распространить на все уравнения структурной формы
(ХУЛ (x'z(\) о о V в(1)1 (х'их\
ХУ* О X'Z(2) 0 9(2) XV,
\XYmJ \
О
о
X'Z(m)
9(2)
+
XV
. (11.3.18)
mj
Модель (11.3.18) можно записать в более сжатой форме
Y = ZQ + U, (11.3.19)
где (трх\) Y. = {X'Yl,X%t...,X'Ylll)s
' X'Z{\) О
тРх\ lZ(mi + Pi)-"1
Z =
zZ(m> + P')-
XI
0 X'Z(2)
О О
в = (в(1),в(2) 9(«))'
X'Z{m))
(трх\) U = {X'U],X'U1,...,X'Um) .
Ковариационная матрица случайных составляющих уравнений
(11.3.19) имеет следующий вид
(тхт) J\ =А/ТО'= А/(Л"^;.^)! = 10^^11, (11.3.20)
где а^ =cov(m,', и/), t = l,...,n.
Оценки ковариаций случайных составляющих структурной
формы получаем по разностям фактических и расчетных (на втором
шаге) значений эндогенных переменных
^=^-Z(062M,.K(0]'[>'/-^(7)e2MllK(y)]. (Н.3.21)
Подставив оценки (5.1.21) в (5.1.20), можем воспользоваться
ОМНК для получения оценок третьего шага
Ъшк=[г'±ог)~*г±оУ- (и.з.22)
325
11.3.4. Метод максимума правдоподобия
Напомним суть метода, который применяется для оценки
вероятностных параметров. Составляется функция правдоподобия, которая
является произведением плотностей (вероятностей) в выборочных
точках. В качестве оценок вероятностных параметров выбираются
такие их значения, которые максимизируют функцию правдоподобия.
Оценки максимума правдоподобия при определенных (весьма слабых)
условиях обладают следующими свойствами: они единственны,
состоятельны, асимптотически несмещены, эффективны и нормальны.
Применим этот метод к оценке параметров структурной формы.
Выборочные уравнения этой формы в матричном виде записываются
так:
ВУ' + ГХ' = и
или для отдельных моментов времени
By, + Гх, -и,, t = ],...,п.
Далее примем, что центрированные случайные остатки
и, =
Vй, )
являются нормальными гомоскедастичными случайным величинами,
ковариационная матрица которых могла бы быть оценена по выборке
(в предположении, что коэффициенты В, Г заданы) следующим образом:
1 = -(ЯУ"+ГЛ") (BY'+ГХ').
(11.3.23)
Тогда плотность распределения m-мерной нормальной
случайной величины и, будет иметь вид
Л =
1
"' "I / ~
(2тф yjdetX
поэтому логарифмическая функция правдоподобия (логарифм
произведения нормальных плотностей в выборочных точках) запишется так:
1п(Я,Г) = 1п/,(Я,Г) =
r = \L
(11.3.24)
где и, - By. + Гх..
326
Задача на максимум сложной нелинейной функции (11.3.24)
реализована в программной системе S-PLUS, Microsoft Professional
Edition (программа «Generalized Nonlinear Least Squares»). Вводя
уравнения структурной формы и исходные данные X, Y в эту программную
систему, получаем на выходе точечные оценки параметров
структурной формы В, /\ их стандартные ошибки, t-значения, а также
ковариационные матрицы оценок коэффициентов каждого уравнения
со случайными остатками.
Следует заметить, что программная система воспринимает и
балансовые равенства, просто в этом случае правая (случайная) часть
равна нулю, а все коэффициенты уравнения известны. В приводимом
ниже примере показаны результаты работы этой программы с целью
оценки коэффициентов расширенной структурной формы.
Сквозной пример 11.6. Применение метода максимального
правдоподобия для оценки коэффициентов модели Клейна
Модель Клейна была рассмотрена во введении к главе. Чтобы
работать с ней, запишем ее здесь еще раз (содержательный смысл
переменных раскрыт во введении)
С, =с0 +c]Pl+c2Pl_l+c,(wir+Wl°) + u]>
И/'' = Wq + w, Y( + w2 Y: _, + и',Л, + и*,
*,=*,-,+А-
Для этой модели вектор-столбец из шести эндогенных переменных
в момент времени / имеет вид
А
- w,p
р,
соответственно столбец из семи предопределенных переменных равен
327
fwo\
A.
K,-
Матрицы В, Г коэффициентов при эндогенных и
предопределенных переменных согласно модели, в которой все переменные
перенесены в левую часть, чтобы в результате получилась расширенная
структурная форма, таковы (номер строки — номер уравнения):
О -<
г6х6) В =
( \
О
О
-I
о
о
о
о
— W.
(-<
(6x7) Г =
О о
о о
О 0 -w3
-1 о
О 1
о о
о
о
о
о
о
-'|
о
о
]
о
о
о
о
о
о ^
о
о
о
Всего коэффициентов эконометрической модели, подлежащих
оценке, — 12, остальные возможные коэффициенты «обнулены», т.е.
соответствующие связи между переменными признаны автором
модели несущественными.
Ковариационная матрица случайных остатков равна
(3x3) t =
Vu3i
"и
&23
or
А
зз;
где оценки ст.. , /, / =1,2, 3, определяются по формулам (самой
программной системой)
328
ш n A V (at j>
>>
причем коэффициенты P,,.,P/V и Y,;, Уд берутся из первых т строк
матриц В и Г, поскольку эти строки относятся к уравнениям со
случайными остатками.
Например, в обозначениях нашей конкретной модели
п i = i
Таким образом, в максимизируемой логарифмической функции
правдоподобия (11.3.24) неизвестные входят в det£, в S"1 и в
hi _ р
"^ZM' + ZYft**. '" = 1'2'3-
г=| к=\
Замечание. Поскольку в различных руководствах по эконометрике
не сложилось единого толкования структурной формы и единых
обозначений, то различные программные продукты, приспособленные для
идентификации эконометрических моделей используют разные виды
записи структурной формы. В частности, чтобы пользоваться
упомянутой программой, надо иметь в виду, что матрица коэффициентов при
эндогенных переменных обозначается Г и равна в наших обозначениях
В\ а матрица коэффициентов при предопределенных переменных
обозначается В и равна в наших обозначениях {-Г%
В заключение приводим листинги с результатами расчетов по
модели, которые выполнила в 2002 г. студентка Оттавского университета
А. Князева (см. Введение): Сама численная модель приведена во
введении.
*** Generalized Nonlinear Least Squares **'*
Generalized nonlinear least squares fit
Model: С ~ cO + d * P1 + c2 * P2 + c3 * W
Data: StatsCAN3
AIC BIC logLik
85.54173 89.71982 -38.77087
Coefficients:
Value
cO 1.406948
d 0.693815
c2 0.100057
c3 0.854805
Std. Error
0.7960066
0.1548662
0.1254383
0.0599314
t-value
1.76751
4.48009
0.79766
14.26306
p-value
0.0951
0.0003
0.4361
<0001
329
Correlation:
cO
d -0.264
c2 -0.109
c3 0.204
c1
-0.512
-0.702
c2
-0.223
Standardized residuals:
Min Q1 Med
-2.069735 -0.7559147 0.1474549
Residual standard error: 1.703948
Degrees of freedom: 21 total; 17 residual
*** Generalized Nonlinear Least Squares
Generalized nonlinear least squares fit
Model: I ~ iO + И * P1 + i2 * P2 + i3 * K2
Data: StatsCANS
AIC BIC logLik
119.7979 123.9759 -55.89893
Q3
0.6335608
Max
2.017052
Coefficients:
Value
iO -2.215234
11 0.432931
i2 0.946911
13 -0.339519
Correlation:
10 И
11 -0.316
c2 -0.290 -
c3 0,321 -
Std. Error
1.859684
0.302817
0.444332
0.133151
12
■0.049
t-value
-1.191188
1.429677
2.13Ю90
-2.549889
■0.568 -0,783
Standardized residuals:
Mln
-1.602949 -
Q1
0.6997122
Med
-0.002022127
p-value
0.2499
0.1709
0.0480
0.0207
Q3
0.5518358
Max
1.829676
Residual standard error: 3.851912
Degrees of freedom: 21 total; 17 residual
*** Generalized Nonlinear Least Squares **"
Generalized nonlinear least squares fit
Model: W ~ wO + w1 * X1 + w2 * X2 + w3 * A
Data: STAT.CAN.TOTAL
AIC BIC logLik
89.44518 93.62327 -40.72259
Coefficients:
Value
wO 11.62381
w1 0.77934
w2 -0.15899
w3 0.69752
Std. Error
4.125882
0.059707
0.075880
0.201700
t-value
2.81729
13.05287
-2.09525
3.45820
p-value
0.0119
<,0001
0.0514
0.0030
Correlation:
wO w1 w2
w1 0.020
w2 -0.476 -0.884
w3 0.979 0.051 -0.485
Standardized residuals:
Min Q1 Med Q3 Max
-1.197279 -0.7731836 -0.1131369 0.5101537 1.8444
Residual standard error: 1.869904
Degrees of freedom: 21 total; 17 residual
11.4. ПРОГНОЗ ПО ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ
Система в приведенной форме (для выборочных данных) имеет
вид
у,=Пх,+Е„ Г = 1,2,..., и, (11.4.1)
или в виде одного матричного равенства
У = ХП' + е, (11.4.2)
где (напоминаем применявшиеся ранее обозначения)
(«х1) у, = (у},у?,...,у7)';
(nxm) Y = пу]\, / = 1,2,..., я; / = 1,2,...,яг;
(рх\) х,=(дг,',х,2,...,*,") ;
(пхр) * = |*,*|, / = 1,2,..„я; к = \,2,...,р\
(mxl) е, = (eJ,e?,...,e;m) ;
(nxm) е= ej , / = 1,2,...,я; / = 1,2,..., яг.
МНК-оценки параметров приведенной формы, как параметров
множественной регрессии (применительно к каждому уравнению
приведенной формы), имеют вид
П'ШК=(Х'ХУ1ХУ, (11.4.3)
или после транспонирования
Пшк = ¥'Х(Х'Х)-\ (11.4.4)
331
причем эти оценки, как МНК-оценки параметров множественной
регрессии, не смещены
МПМНК = П
и состоятельны
^мнк => п-
Точечный прогноз
Зная значения предопределенных переменных х„ hT на т тактов
вперед, можно по оценкам коэффициентов приведенной формы найти
точечные оценки эндогенных переменных в этот момент времени
U + i(*»-t) = /7mhk*,, + i (П.4.5)
или по отдельным эндогенным переменным
У'„ + Х(х„ + Х) = щх„ + Х, « = 1,...,/я.
Этот точечный прогноз несмещен
Точность этого прогноза по каждой переменной определяется ее
дисперсией (меньше дисперсия — точнее прогноз и наоборот). Чтобы
определить дисперсию каждой компоненты, найдем ковариационную
матрицу точечного прогноза
5\ =М(П-П)хн + Х + .(П-П)'. (П.4.6)
Поскольку
П-П = Y'X(Х'Х)~* -П = (ХП' + г) Х(Х'Х)~У -П = г'Х(Х'ху1,
то
£. =Ме'Х(Х'хУ Х„„Х'„>ЛХ'ХУ' *'£ =
где e'(i) = (e|,ei t'„...,e!„), e(7) = (fl/,e^,...,e/,...,e,;).
332
Имеем
(г'г'
pipj
t2t,
е'' г'
е'е*
&i
<*i
е' р./
е' е'
= °,Л
A/e(i)e'(y") = A/
Введем обозначение G = х'п + х(Х'Х) Х\ тогда
Me'(i)X(X'X)-\ll + X + AX'xy] *4j) = ME'(i)G'GE(j) =
= M[tr(E\i)Ge(j))] = M^r(Ge(j)e.'(i)G')] = tr[_GME(j)e(i)G'] =
= oijtr(GG') = o,[X;i + x{X'xy] Х'Х(Х'Х)-' *„ + т] =
В последних преобразованиях использовалось следующее
соображение: число, полученное в результате перемножения нескольких
матриц, является матрицей размера (1 х 1), поэтому к нему можно
применять матричную операцию tr (след). Напомним, что эта
операция применяется только для квадратных матриц и ее результатом
является сумма диагональных элементов матрицы
"(я)=2Х
В матричном исчислении доказывается (при условии, что АВ,
В А существуют).
tr{AB) = tr(BA).
Итак.
где ££ = |а/у|, /.у" = 1,2,...,/я,
в частности,
(11.4.7)
333
Сквозной пример 11.7; Прогноз по упрощенной модели Клейна
Для прогноза эндогенных переменных на т шагов вперед необходимо
задать значения предопределенных переменных хп + х. В нашем примере
одна предопределенная переменная (экзогенная) — G„ + x
(государственные расходы в год п + т). Поскольку в нашем распоряжении не было
данных о будущих государственных расходах, то получим их путем
прогноза по линейному тренду, т.е. на основе следующей модели
G,=g0+g]t + ^, Л/^=0, * = 1,...,и.
Оценки параметров линейного тренда получаем как МНК-оценки
параметров парной регрессии
io,{t-T)
< = \
Подставив в последние формулы значения государственных
расходов из табл. 5.1. (или введя эти данные в статистический ППП),
получим
£,=1,01; g0 =31,56;
откуда
G, =31,56 + 1,01*.
Теперь можно найти прогноз будущих значений государственных
расходов на 2002 г. и 2003 г. (л + X = 23 и п +Т = 24).
G21 = 31,56 + 1,101 • 23 = 54,79 млрд дол.
G24= 31,56+1,101-24 = 55,8 млрд дол.
Подставим эти значения в формулы для выравненных значений
эндогенных переменных
Прогноз на 2002 г.
С21 = 22,98 + 1,26 • G23 = 92,02 млрд дол.,
/23 = 12,49 + 0,52 • G23 = 40,98 млрд дол.,
^23 = С23 + ^23 + ^23 = 1 87,79 млрд дол.
Прогноз на 2003 г.
С24 = 22,98 + 1,26 • G24 = 93,29 млрд дол.,
/24 = I2,49 + 0,52G24 =41,51 млрд дол.,
^24 = С24 + ^24 + ^24 = ] 90>59 МЛРД Д°Л-
Интервальный прогноз
Для простоты рассмотрим только случай, когда остатки
приведенной формы некоррелированы, тогда
( ~2
£ =
О
О О
о
о
"I, =<«(^Л"''.„!..
т.е. ковариационная матрица прогнозируемых значений эндогенных
переменных диагональна (или приближенно диагональна), поэтому
можно строить интервальный прогноз по каждой эндогенной
переменной в отдельности.
Если случайные остатки нормальны, а их дисперсии оценены
по выборке по формулам (9.3.21), то точечная оценка y'll + z
распределено по закону Стьюденти с (п - р) степенями свободы, поэтому по
правилу интервального прогноза по уравнению множественной регрессии
(9.5.4) получаем следующий доверительный интервал для неслучайной
составляющей /-й эндогенной переменной у'н.т = 2]nrtJtJ + T:
ф:,+т-<А< £# + 1£# + т + габП = 1-а, (11.4.8)
где o\u =-y/z)yi+T,
п-Р77\
а.., = а, <\х'п„{Х'Х)~Хх„„.
ВОПРОСЫ И ЗАДАЧИ
1. Каковы виды уравнений и переменных эконометрической модели?
2. В чем отличие расширенной формы эконометрической модели
от стандартной структурной формы модели?
335
3. Почему надо переходить от структурной формы к приведенной?
4. В чем отличие идентифицируемости от идентификации модели?
5. Каковы условия идентифицируемости эконометрической модели
в целом?
6. Каковы условия идентифицируемости отдельного уравнения?
7. Задана следующая эконометрическая модель:
у\ = P.2.V/2 + (W? + Ун, + Yi !*,' + Y12*; + ej,
-V,2=P2i.yJ+Y2o+Y2i*;+e,2.
у] = Ку1 + М? + Ум + Уз!^ + Упх? + «V
Являются ли уравнения этой сис!'смы идентифицируемыми?
8. Идентифицировать по двухшаговому МНК второе уравнение
упрощенной модели Клейна (сквозной пример).
9. В каком случае применяется трехшаговый МНК?
10. Каким образом осуществляется точечный прогноз эндогенных
переменных по эконометрической модели?
ГЛАВА 12
ЭЛЕМЕНТЫ МНОГОМЕРНОГО
СТАТИСТИЧЕСКОГО АНАЛИЗА
Многомерный статистический анализ в экономике занимается
выявлением «скрытых» факторов, определяющих изменение системы
экономических показателей, а также классификацией совокупности
экономических объектов — носителей системы показателей.
В первом случае система показателей трактуется как
многомерная случайная величина, между компонентами которой существует
стохастическая связь, а «скрытые» факторы как система
центрированных некоррелированных случайных величин. Выявлением этюс
«скрытых» факторов занимается факторный анализ, в том числе метод
главных компонент.
Во втором случае совокупность экономических объектов
трактуется как совокупность носителей многомерных выборочных значений,
образующих выборку наблюдений за многомерной случайной
величиной. Каждое многомерное наблюдение — реализация многомерной
случайной величины — описывает конкретный объект изучаемой
совокупности и может быть отнесено (наблюдение и, следовательно, объект)
к одному из классов. Такая классификация осуществляется с помощью
методов дискриминантного анализа и распознавания образов. При этом
необходимо иметь априорную информацию о типе распределения
многомерной случайной величины. Если же такой априорной информации
нет, то классы выделяются по степени «близости» объектов: объекты
внутри класса «близки» между собой, но,далеки от объектов других
классов. Расстояние между объектами определяется, например, как
обычное евклидово расстояние в /7-мерном пространстве.
В главе рассматривается сквозной пример, связанный с
определением и эффективностью использования природно-жономического
потенциала. Рассмотренные в предыдущих главах методы
математической статистики могут быть, по крайней мере в простейших случаях,
реализованы вручную. Так, для того чтобы лучше разобраться с
алгоритмом регрессионного анализа, следует решить вручную
простейшую задачу парной регрессии, после чего переходить к
компьютерному решению сложных задач множественной регрессии.
337
Реализация же процедур многомерного статистического анализа
немыслима без применения ЭВМ. Многомерный статистический
анализ представлен во многих лицензионных программных системах. Как
одну из лучших можно рекомендовать программную статистическую
систему Statistical Analysis System (SAS). В системе SAS широко
представлены методы теории вероятностей, математической статистики
и математического программирования. Имеются программные
средства ведения баз данных, графического и табличного отображения
данных.
12.1. МОДЕЛЬ ФАКТОРНОГО АНАЛИЗА
И МЕТОД ГЛАВНЫХ КОМПОНЕНТ
При индивидуальном пошиве одежды измеряют несколько
десятков параметров, характеризующих фигуру данного человека, в то время
как при промышленном изготовлении одежды во внимание
принимаются только три: размер, рост, полнота.
Эта ситуация наглядно демонстрирует основную задачу
факторного анализа: перейти от первоначальной системы большого числа
взаимосвязанных показателей /V,, ..., Хт к относительно небольшому
числу «скрытых» факторов Fh ..., Fh k < /и, изменение которых и зни-
чительиой мерс предопределяет изменение первоначальных
покишгелей.
В экономике возникает множество как частых, тик и общих
задач такого рода, например, задача поиска одного или нескольких
обобщающих показателей эффективности использования ресурсов
по многим частным показателям эффективности (производительность
труда, фондоотдача, материалоотдача). Казалось бы, в скобках
перечислено всего три частных показателя эффективности. Но если
вспомнить о разных видах труда, фондов и расходуемых материалов, то
станет ясно, что таких показателей достаточно много.
12.1.1. Модель факторного анализа
Модель факторного анализа записывается в следующей форме:
к
Х-, =(*-, + ^aijFj + v/ey i = U-,m, k<m, (12.1.1)
где MXt = a;,
FjJ = I к — общие («скрытые») факторы;
338
С1ц — нагрузки первоначальных показателей на общие факторы;
£/,/= 1,..., т — характерные факторы;
V, — нагрузки показателей на характерные факторы.
Общие и характерные факторы центрированы {MF, =0, _/ = 1,
..., к, Me, = 0, / = 1, ..., т), нормированы (MFJ - 1 J = 1, ..., к, Mej =1,
i = 1,..., т) и некоррелированы
{MFjFj. = 0, 7' * /, Ш& = 0, i Ф I, MFfr = 0,
y',/ = l,...,*,/,/' = l,...,m).
В матричной форме модель факторного анализа (12.1.1) примет
вид:
где
X = а + AF + Уг,
(12.1.2)
Х =
(х,\
\ Х>1>J
(„х\
\аш)
— векторы-столбцы первоначальных показателей и их математических
ожиданий;
W
F =
<Л/
/С)Л
£ =
К^т/
векторы-столбцы общих и характерных факторов;
А =
V"»ii
V =
о
о о
о
VmJ
— матрицы нагрузок на общие и характерные факторы.
Согласно модели (12.1.2), многомерный показатель
^разлагается на три некоррелируемые составляющие:
1) неслучайную составляющую а (математическое ожидание);
2) случайную составляющую AF, определяемую общими
факторами;
3) случайную составляющую Уг, определяемую характерными
факторами.
Для того чтобы реализовать модель факторного анализа, по
крайней мере надо найти по выборочным данным оценки математических
339
ожиданий а (это несложно и изложено в гл. 6), оценки факторных
нагрузок и сами общие факторы F, тогда последняя составляющая
определяется как остаток.
Имеются методы (центроидный и др.), которые позволяют это
делать, однако эти методы определяют факторы неоднозначно,
поэтому в большинстве случаев анализа используется метод главных
компонент.
12.1.2. Метод главных компонент
В отличие от общих факторов, которые исчерпывали большую
часть вариации (но не всю!) первоначальных факторов, главные
компоненты объясняют всю вариацию и определяются однозначно.
Модель главных компонент имеет вид:
т
Xi=a + Y,aijFi> <' = U.,™, (12.1.3)
или в матричной форме:
X = a + AF.
Как видим, в этой модели отсутствуют характерные факторы,
поскольку главные компоненты F полностью исчерпывают всю
вариацию первоначальных показателей. Главные компоненты, как и
факторы, центрированы, нормированы и некоррелированы. Иногда
рассматриваются и ненормированные главные компоненты.
Обозначим центрированные первоначальные показатели через
Yj = Xj- ah i ~ 1, ..., т, тогда модель (12.1.3) запишется в форме
Y = AF. (12.1.4)
С целью определения матрицы нагрузок А найдем собственные
числа А, и собственные векторы / ковариационной матрицы
первоначальных показателей
(тхт) 5 = |cov(^i.,jr/)|| = |cov(y;.,K/.)|=A/yy/.
Напомним: собственные числа и собственные векторы матрицы
определяются из уравнения
В1 = Д или (В -ЛЕ„,)1 = 0, (12.1.5)
т.е. для таких векторов умножение на матрицу эквивалентно
умножению на собственное число. В уравнении (12.1.5) Еш — единичная
матрица.
340
Однородная система уравнений (12.1.5) имеет ненулевое
решение, если ее определитель равен нулю:
\В = Щ = 0. (12.1.6)
Характеристическое уравнение (12.1.6) является уравнением
т~н степени относительно А., поэтому имеет т решений Х1,...,Хт —
собственных чисел матрицы В.
Каждому собственному числу отвечает целое направление
собственных векторов, так как уравнение (12.1.5) остается справедливым
и для любого С/, если оно верно для /. Поэтому из всех собственных
векторов, отвечающих собственному числу А,, выберем
нормированный, т.е. такой, длина которого равна единице:
т
£'} = '•
Собственные векторы, отвечающие разным собственным
числам, ортогональны, поэтому матрица
составленная из нормированных собственных векторов, ортогональна.
Ортогональные матрицы задают поворот осей координат. Обратная
к ортогональной матрица также ортогональна, поскольку она задает
поворот с возвратом в первоначальное состояние. Для ортогональных
матриц обратная матрица равна транспонированной.
Поэтому линейное преобразование центрированных
первоначальных показателей с помощью ортогональных матрицы V означает
поворот осей:
f=L% Y=Lf. (12.1.7)
Покажем, что получившиеся новые показатели
некоррелированны. В самом деле, эти показатели согласно формуле (12.1.7)
центрированы, поэтому
Icov (/.,/,. )|| - Л///" = ML'YY'L = L'MYY'L = L'BL = кв^\\ =
— \\r"\ i \\ —
-\\liKJlj\\-
(X, о о ^
о х2 о
1° о ... К)
таким образом, co\{f'hfj) = 0, i *у, и Dj] = cov {fh JJ) = X:.
341
Поскольку ортогональное преобразование сохраняет
расстояние, то
Itf-I/,?
Поэтому вся вариация первоначальных показателей равна
вариации ненормированных главных компонент:
( « \ ( « Л
= м
I/;2 =Z^//=lv (12.1.8)
а последняя равна сумме собственных значений, тем самым полная
вариация равна сумме собственных значений. Главные компоненты
перенумеровываются в порядке убывания собственных значений
А., >А.2 >...>*.,.
На практике из всех ненормированных главных компонент
оставляют несколько первых, которые аккумулируют существенно
большую часть полной вариации, остальные отбрасывают.
Нормированные компоненты получаем делением компонент
на свои стандартные отклонения:
*;■=,,
*,.
или в матричном виде:
( 1
где
-1/2 _
О
О
JK
Л V
откуда f = Al/2F, поэтому
Y = Lf = LAy2F=AF,
т.е. матрица нагрузок на стандартизованные компоненты имеет
следующий вид:
A = LA
1/2
(12.1.9)
342
где Л1'2 =
ryjXl О О
о фГ2 о
О О ... V^v
На самом деле все эти расчеты выполняются не по
теоретическим математическим ожиданиям а и ковариационной матрице В,
а по их оценкам а, В, найденным по выборке.
Пример 12.1. Определение агроресурсного потенциала субъектов РФ
На объем выпуска сельскохозяйственной продукции при прочих
равных условиях долговременное решающее воздействие оказывают
следующие факторы (показатели): площадь и качество сельхозугодий,
среднегодовая температура, осадки за год, число занятых, основные
производственные фонды, дороги, минеральные удобрения, покупные
концентрированные корма. Как видим, первые три показателя
относятся к природно-климатическим, а последние — к экономическим.
Если все -экономические показатели перевести в рисчете на гектар
сельхозугодий некоторою стиндиртного, битового качества
(приведенный гсктир сельхозугодий), то получим окончательно следующий
перечень показателей;
Л", — среднегодовая температура (С0),
Х2 — осидки (мм),
Ху — число занятых (чел./га),
X) — основные производственные фонды (тыс, руб./га),
Xi — дороги с твердым покрытием (км/га),
Хв — внесение минеральных удобрений (т/га),
Х-) — покупные концентрированные корма (т/га),
т.е. т — 1.
Носителями указанных показателей служат субъекты РФ —
республики, области и края. Всего 77 субъектов, т.е. объем выборки равен
п = 77. Расчеты выполнялись с помощью программной системы SAS.
В результате были оценены математические ожидания первоначальных
показателей а , их ковариационная матрица В и найдены ее
собственные числа:
А., =4,22; А, = 1,30; А,, = 0,77; А4 = 0,36;
А5 = 0,22; А6=0,12; А^=0,05.
Таким образом, сумма первых двух собственных значений
составляет 78,5% общей суммы, т.е. вариация двух компонент объясняет
(определяет) 78,5% общей вариации.
343
Центрированные первоначальные показатели оказались
следующими линейными комбинациями ненормированных главных
компонент:
у, = о •./; + 0,69./;, ys = о,89/:; - 0,04/;,
Y2 = -0,09/; + 0,5 \f2, Yh = 0,76/i + 0,25/2,
y, = 0,94/; + 0,03/j, y7 = 0,95/; + 0,02/;.
У4 = 0,97/; + 0-./21
Как видим, экономические показатели (3—7) имеют достаточно
высокие нагрузки на первую компоненту, а климатические (1—2) —
на вторую. Таким образом, первую компоненту можно
интерпретировать как «скрытый» обобщенный экономический фактор, а вторую —
как «скрытый» обобщенный климатический фактор.
РЕГРЕССИЯ НА ГЛАВНЫХ КОМПОНЕНТАХ
Модель множественной регрессии на главных компонентах
имеет вид:
к
1 = 1
где Fj — нормированные главные компоненты.
Будем считать, что модель регрессии и компоненты
определяются по одной и той же совокупности из п экономических объектов.
Так как главные компоненты, найденные по выборке, центриро-
- 1 4-
ваны, то — V Fu = 0, следовательно, бс0 = у = — V у, поэтому модель
можно представить в следующей измененной форме:
Тогда теория множественной регрессии дает следующие оценки
коэффициентов регрессии:
где
F =
'Flt F{
I ' 2
1 ' 12
Ft F„
a = (F'F) FAY,
F Л
F»
V Ml Гп2 Fnk )
a F/i — значение i-тл компоненты для /'-го наблюдения;
344
/а^
а =
vaki
, AY =
fy{-y\
К.Уп-У)
— вектор-столбец отклонений значений результирующего показателя
от своего среднего. \
То, что главные компоненты нормированы и центрированы для
выборочных значений, записывается в следующей форме:
п ~~, [0, г * s
поэтому в нашем случае матрица нормальных уравнений примет вид:
(п 0 0^
0/7 0
F'F =
ZW
7 = 1
о о
тем самым каждое нормальное уравнение будет содержать только
одну переменную
™-,=llFj,{y.i-y\
./ = >
т.е. решение записывается в явном виде:
&, = "Z ^ U/ " У)= "X ^Л' так как X F/v = °-
Я ;-
/ = 1
./ = >
./ = !
12.2. ПОНЯТИЕ О МНОГОМЕРНОЙ КЛАССИФИКАЦИИ
Анализируемые экономические объекты (предприятия,
организации, регионы и т.п.) описываются системой из т показателей, тем
самым каждый такой объект задается как точка в m-мерном
пространстве
:J=[x),x2j,...,x"') , j = 1,2,..., п,
(12.2.1)
где x'j — значение /-го показателя yj-ro объекта,
п — число изучаемых объектов.
345
Совокупность всех рассматриваемых объектов (наблюдений)
(12.2.1) можно трактовать как выборку объема п из многомерной
генеральной совокупности Xi, Хъ .... Хт.
Классификация объектов может рассматриваться двояким
образом: как их разбиение на некоторое число (вообще говоря, заранее
неизвестное) классов, либо как отнесение каждого из объектов к одному
из заранее известных (хотя бы приближенно) классов к = 1,2, ..., К.
В первом случае речь идет о классификации без обучения, поскольку
нет никакой априорной информации о классах (кластер-анализ),
во втором случае -— о классификации с обучением, поскольку имеется
априорная информация о классах в форме обучающей выборки (дис-
криминантный анализ).
12.2.1. Кластер-анализ
Методы кластер-анализа основаны на «близости» наблюдений
(объектов) внутри класса и на их «удаленности» от наблюдений
других классов. «Близость», «удаленность» понимаются в смысле
расстояния между точками, координатами которых служат значения
показателей (П.2.1) соответствующего объекта. Под расстоянием между
точками х-,х./ подразумевается обычное евклидово расстояние
I т j
pM/)=JS(4-4) • о2-")
либо любое его обобщение.
Для того, чтобы можно было пользоваться формулой
расстояния (12.2.2), необходимо добиться, чтобы показатели были измерены
в одинаковых единицах (иначе под корнем выражения (12.2.2) будут
складываться, скажем млн чел.2 и млн долл.2). С этой целью каждый
показатель центрируют и нормируют (тем самым новый показатель
становится безразмерным и отсчитывается от нуля)
х) -х1 _. \ " .
х'; =—=, i., - ==-, х'=~у jc'v, i = 1, 2,..., п.
Далее будем считать, что эти операции уже выполнены, т.е.
первоначальные значения показателей (11.2.1) уже центрированы
и нормированы, поэтому значок «тильда» над ними ставить нет
надобности.
346
Имеется много разновидностей процедуры классификации,
кратко опишем одну из них, реализованную в ППП SAS. Число
классов К считается заданным, просто процедуру можно повторить при
любом другом числе классов, указанным пользователем, и за
пользователем же остается выбор окончательного варианта из нескольких
выполненных.
На начальном этапе выбирают К наблюдений, наиболее
разнесенных друг от друга, эти наблюдения берутся за центры классов, им
присваиваются первые К номеров, число наблюдений в каждом классе
принимается за единицу, т.е. п} = п2 = ... = щ= 1, после чего остальные
п - К наблюдений (/ = К + 1, ..., п) последовательно относят к одному
из классов по следующему алгоритму:
наблюдение с номером/ относят к классу с номером к, если
р(х-,хЛ= min р(а:,х. ), (12.2.3)
_ 1 "*
где хк=— £>,.,
>Ч, = \
i — порядковый номер наблюдения в классе к, при этом число
наблюдений в классе к увеличивается на единицу.
Пример 12.2. Классификация регионов РФ по уровню агроре-
сурсного потенциала
Вернемся к примеру 12.1. Напомним, что из семи главных
компонент были отобраны две: первая получила интерпретацию как
обобщенный экономический показатель, а вторая — как обобщенный
климатический. На плоскости первых двух компонент было выполнено
разбиение 77 субъектов РФ на 5 классов (разумеется, были варианты
с разбиением на другое число классов).
Полученные классы были расположены в порядке уменьшения
оснащения приведенного гектара экономическими ресурсами: первый
класс — самый высокооснащенный, последний класс — самый низко-
оснащенный. Когда на карте РФ республики, области и края были
размечены по принадлежности к классам, то выяснилось, что на самом
деле классы выстроены в порядке улучшения природно-климатических
условий: первый класс — с самыми худшими
природно-климатическими условиями (в основном, самые северные области), последней —
с наилучшими природно-климатическими условиями (в основном,
самые южные области). Тем самым многие десятилетия худшие
природно-климатические условия компенсировались большей ресурсоосна-
щенностыо.
347
12.2.2. Дискриминантный анализ
Каждый из данных К классов интерпретируется как одномо-
дальная генеральная совокупность, закон распределения которой
fk (х) (плотность или вероятность) оценен по специальной обучающей
выборке (для каждого класса своей)
Байесовское оптимальное правило дискриминантного анализа
(распознавание образов) состоит в отнесении у-го (объекта) к такому
классу к, для которого
где (к{, к2,..., кк) априорное распределение вероятностей на классах.
Если априори все классы равновозможны, то правило (12.2.4)
заменяется на более простое
U*j)= ™?JA*,)- <12-2-5>
Правило (12.2.4) характеризуется минимальной долей ошибочно
классифицированных объектов,, если потери от неправильной
классификации С(1с/к) при кФ к не зависят от к, к.
12.2.3. Модель смеси распределений
Закон распределения вероятностей смеси из К одномодальных
генеральных совокупностей, заданных плотностями (или
вероятностями)/^*, 9Д определяется следующим образом:
/(x/Jf,nl,...,icA,9l,...,eft) = XicA/4(x,e,), (12.2.6)
А =)
7С| — априорная вероятность к-го класса,
9; — набор парамс!ров, задающий закон распределения к-го класса.
На первом этапе производится оценка параметров
К, тс,, ..., тс*, 8„ ..., 6*
смеси распределений с помощью метода максимума правдоподобия
(ММП), согласно которому оценки параметров определяются как их
348
значения, доставляющие максимум функции правдоподобия в
выборочных точках
П £**■/;(*;. О,)"* max. <12-2-7)
Получив ММП-оценки К,кп...,кк,д1,...,д^, можно на втором
этапе осуществить оптимальное правило дискриминантного анализа
(12.2.4)
где .Д(*.) = ./,(х,Д).
Поскольку нет обучающей выборки, то модель смеси
распределений следует отнести к кластер-анализу, однако на втором этапе
применяется процедура дискриминантного анализа, поэтому эта
модель занимает промежуточное положение между кластер-анализом
и дискриминантным анализом.
ПРИЛОЖЕНИЕ 1
ДОКАЗАТЕЛЬСТВО СХОДИМОСТИ ВЕРОЯТНОСТЕЙ
СОСТОЯНИЙ СМО К СТАЦИОНАРНЫМ ЗНАЧЕНИЯМ
В § 5.3 использовалось утверждение, что СМО с ограниченной
очередью после завершения переходного процесса входит в
стационарный режим, в котором вероятности состояний системы задаются
стационарным решением системы дифференциальных уравнений для
вероятностей состояний в переходном режиме. Эти стационарные
вероятности состояний не зависят от начального состояния СМО.
Докажем это утверждение для одноканальной СМО (п = I)
с ограниченной очередью при ,V = 2, т.е. в очереди не может быть
более одного требования.
Дифференциальные уравнения для вероятностей состояний
системы в переходном режиме имеют следующий вид (см. формулу
(5.2.12) с матрицей Л, определяемой из формулы (5.3.15) при п = I,
N = 2):
at
<^--A,Al-(A, + u)/?1-f(i/?2, (П.1.1)
at
dp-, »
—Г = Щ
-^Plat
Эта система уравнений имеет стационарное решение,
определяемое системой линейных однородных алгебраических уравнений:
-Vo + MA = °»
<Xpo-(X + \i)pi + \xp2=0, (П. 1.2)
Vi -№2 = о*
которая имеет ненулевое решение, поскольку ее определитель равен
нулю (последнее уравнение является суммой первых двух).
Заменяя последнее уравнение на естественное соотношение р() +
+ Р\ + Р2 ~ К получаем невырожденную систему линейных
неоднородных уравнений:
350
'- Хрй + р/7, = О,
которая имеет решение, совпадающее с (5.3.17) при п = 1,7V= 2,
1
Pi =
1+р+р-
Р
1 + р + р2
(П.1.3)
1+р+р ц
В свою очередь, из естественного соотношения pQ + р, + р2 = 1,
t/pn б/р, Jp9
вытекает —- н L + —— = 0, поэтому последнее уравнение (П. 1.1.)
dt dt dt
является суммой первых двух. Отбрасывая его и заменяя p2(t) = 1 -
tPqU) ~ P\U)-> получаем следующую систему дифференциальных
уравнений для /?,>(/), />,(/):
at
at
Система (П. 1.4) имеет стационарное решение:
(П.1.4.)
rf =
1+Р+Р 1 + р + р"
которое, конечно, совпадает с (П.1.3).
Эта система неоднородна, поэтому сначала найдем решение для
однородной системы, которое, как предписывает теория, будем искать
в виде:
p0 = AQe\ Р\=Л/.
Подставляя эти выражения для р0 и р^ в (П. 1.4), получаем:
\lA0e"={X-[i)A0e"-(X + 2[i)A]e">
351
или
(П. 1.5)
= 0,
(П. 1.6)
тем самым константа / должна удовлетворять следующему
характеристическому уравнению (чтобы получить нетривиальное решение
относительно А(),А1):
(X-\i) -(\ + 2\i)-l
или /2+ 2(A. + u.)/ + A.2+иЛ + ц2 = 0, откуда
ll2=-Ck + \L)±yl\iX.
Кроме того, из первого уравнения (П. 1.5) (второе при / = /,, /2
является следствием первого) получаем
Ц
поэтому общее решение однородной системы примет вид
(С, = 4°, '' = 1.2):
'p0(0=c/,+c2^'=c1pJ,)(/) + c2pJ2)(0,
Pi(0-C,(-1 + Vp)^+C2(-1-Vp)^ (П. 1.7)
где (Х+/,)/ц = (-ц±ч^)//ц = -|±л/р-
Решение первоначальной системы (П. 1.4) найдем методом
вариации постоянных С, = Cj(t), г = 1, 2. Подставляем выражение (П. 1.7)
в систему (П. 1.4):
(2)
</С2 (2)
—-Ро ~
cW+dQ (1)+ с*^т_
1 Л Л ° 2 Л Л
Ф±_ , ^Ci „О .г *1
(2)
+ ^-Л(2) =
Л dt dt dt
= (?1-ц)(с1^1) + С2^))-(?1 + 2ц)(с1р1(1)+С2А(2)) + ц.
352
Поскольку \P(l\p\ I, i ~ 1, 2, являются решениями
однородных уравнений, то для С|(/), С2(0 получаем систему:
dt dt
dC
dd
Приводим ее к стандартному виду (путем решения как обычной
„ dC, dC2
алгебраической системы относительно —-, —-):
dt . dt
dC. ц .,
dt 2yjp
dC2 (I e_h,
dt 2^p
При этом, как видим, получилось два отдельных уравнения
с разделяющими переменными, которые имеют следующие решения:
C2(t) = Le-':'+£
Итак, общее решение системы (П. 1.4) примет вид:
*(0 = 4
+ Я/' + В2е'*',
2у[р
1-л/р 1+Ур
V '.
12 У
+ Л, (-1 + Vp)^'' + ^ (1 + Vp)^/3',
где 5|, В2 — постоянные, определяемые из начальных условий.
Поскольку /, =-(ц + А,) + 7JjX<0, /2 =-(ц + А,)->/цЗС<0, то
при / —» °° члены, содержащие 5,, 52, стремятся к нулю, поэтому
r у ц 2yta 1
lim/>0(/)-
27р(ц + ^)2-цХ 1 + Р-Р3
= />о
353
lim/7i(0 = TT
-i + Vp l i+Vp
2д/р ^Ц + ^-л/JjX [i + X + ^l^k
_ц[2^"2\/р(М- + Ч]_ p
27р(ц2+ц^+^2) i + p + p:
= Pi
Таким образом, действительно, по завершении переходного
процесса система входит в стационарный режим, вероятности
которого являются стационарным решением системы (П. 1.4):
\\mpi(t) = pf, / = 0,1,2,
при этом
Pi (*) = 1~ А) (0 " Р\ (О' Pi =1~Ро~ рЧ
ПРИЛОЖЕНИЕ 2
РАСПРЕДЕЛЕНИЕ СТАТИСТИКИ \£(Х. - xf
Пусть имеется последовательность независимых одинаково
распределенных нормальных случайных величин -Xit Х2, ..., Х„, т.е.
Х( ~ N(a, а).
Докажем, что статистика
^S('/-')l=xJ(»-0 <п-2-»
° 7 = 1
имеет распределение %2 с (п - 1)-й степенью свободы.
Прежде всего внутри каждого слагаемого вычтем и добавим а,
тогда М(Х, ~ а) = 0 и М( X - а) ~ О, т.е. при выполнении этой операции
статистика остается прежней, но в ней представлены уже
центрированные случайные величины X.t = X. - а
Будем считать, что эта операция уже выполнена, поэтому
в (П.2.1) участвуют уже центрированные нормальные величины
х, ~ /v(0, а).
Рассмотрим ортогональное преобразование системы величин
Х= (Х}, ..., Х„У в систему величин Y=(Yb ..., Y„)\ Y= АХ, где
О о
о о
о о
1 /7-1
V(»-1)" >-!)»
_L _L
4п >fn J
г i
у/12 Vb2
1 1
>/2~3
1
2-3
I
/2-3
A =
Л~4
/3-4
3-4
1
Vl*-1)" Vl"-1)" Vl"-1)* >-0»
_L _L _L _L
Vw \fn \fn 4n
355
Матрица А действительно ортогональна, поскольку сумма
квадратов элементов любой ее строки равна 1, а скалярное произведение
разных строк равно нулю.
Поскольку ортогональные преобразование (поворот
координатных осей) сохраняет расстояние, то
и it
./ = 1
/ = i
Раскроем квадраты в каждом слагаемом суммы в (П.2Л)
— ч2
izoo-*) =1*?-»*2=
У = 1
./=1
1 и - 1 и -1 ( у у и-)
(П.2.2)
Поскольку MY = М(АХ) = АМХ = О, то случайные величины Y
центрированы, а из линейности преобразования следует, что эти
величины нормальны.
Найдем теперь коэффициенты ковариации этих случайных
величин (/ </, cov (Хг, Хх) = с?25,„.)
"(^,+„. + LYt.-LYt. + 1)(>y1+.;.+ >y/-,/^. + ,)'
= А/
Ji(i + \)j{j + \)
т.е. случайные величины YhYj (при / <j,j < п - 1) некоррелированы
между собой и DK, = а2.
Точно так же
соу(К„Уи) =
>/'(/ + ,)я
■(/ -/) = 0 при /< л,
Z>r„ =-]>>*,. = а2.
Для нормальных величин из некоррелированности вытекает
независимость, поэтому У,, У?, ..., Y„ попарно независимы, нормальны
( уЛ
и DY, = <5\ следовательно, случайные величины Z,, Z2, ..., 2Л 2- =—-
356
являются независимыми стандартными нормальными величинами
(Z,~iV(0, I)), так что согласно определению случайной величины %2>
из соотношения (П.2.2) вытекает, что наша статистика
^1(*,-*)2 = 1>;=х>-1)
имеет распределение %2 с (п - 1)-й степенью свободы.
ПРИЛОЖЕНИЕ 3
РАСПРЕДЕЛЕНИЕ СТАТИСТИКИ -L £(^. - j>J2
° 7 = l'
Ниже будет доказано (доказательство автора), что эта
статистика имеет распределение у?{п-к-\), если случайные составляющие
некоррелированы и нормально распределены, т.е. e;-iV(0,а). При
выводе несмещенной оценки дисперсии (§ 9.3) уже изучалась
статистика
1>,-;,)Ч^)>-П
./ = 1
Согласно результатам этого исследования
У - У = Яе,
где Н = Е„- X(Х'Х)~1 X',
и матрица Н симметрична (#' = //) и идемпотентна (Z/2
Вследствие указанных результатов
£(у, - уj f = e'tf'tfе = e'tf2e = е'Яе,
поэтому
гдаГ*№,^2 U, $,~*(о,1), i = i,2 и.
Дальнейшее исследование будет опираться на следующие
фундаментальные результаты теории матриц*:
1) собственные числа идемпотентной матрицы равны либо
единице, либо нулю;
2) если ранг неотрицательно определенной квадратной
матрицы равен г, то эта матрица имеет г положительных собственных чисел
и (п - г) собственных чисел, равных нулю;
* Эти результаты и их выводы содержатся в цитируемой монографии
П. Ланкастер. Теория матриц. М. : Наука, Физматгиз, 1978.
(П.3.1)
=//).
(П.3.2)
358
3) r(A + В) < r{A) + r(B), r(A) — ранг матрицы A\
4) г(А,В)<т\п[г(А\г(В)1
Рассмотрим с этих позиций матрицу Ни ее составляющие
И = Еп- X(Х'Х)~* X' = Е„ - ХСХ\ С = (Х'Х)~^.
Имеем, согласно утверждению 3
r(En)<r(H) + r(B), где В= Х(Х'Х)~* Х' = ХСХ',
откуда
г(Н)>п-г(В).
Согласно утверждению 4, получаем
r(B)<mir\[r(X),r(C),r(X')] = k + \,
поэтому г{Н) = п~к~ 1. (П.3.3)
Поскольку матрица // идемпотентна, неотрицательно
определена и г(Н) = п - к - 1, то согласно утверждениям 1, 2 эта матрица имеет
(и - к - 1) собственных чисел, равных единице, а остальные ее (к + 1)
собственных чисел равны нулю.
Собственные числа и собственные векторы матрицы И (как
и любой другой квадратной матрицы) определяются из уравнений
(I Л
Я/,=У,., 1 = 1,2,...,/! /,.=
(П.3.4)
при этом X; (/= 1, 2, ..., я) — корни характеристического уравнения п-й
степени
det(#-k£„) = 0. (П.3.5)
Для каждого собственного числа Х: существует целое
направление собственных векторов, поэтому выберем /, нормированным (т.е.
с длиной, равной единице).
Поскольку собственные векторы, соответствующие разным
собственным числам, ортогональны, то матрица L, составленная из
нормированных собственных векторов
^ = ('Ь *2» •••» '«)>
ортогональна.
359
Применим эту матрицу для приведения матрицы Н к главным
осям, т.е. совершим над матрицей Я следующее преобразование:
VHL. . (П.3.6)
Поскольку система соотношений (П.3.4) для всех / = 1,2, ..., п
записывается в виде единого матричного равенства
Я1 = (^|/|Д2/2) ...Д„/м),
то преобразованная матрица L'HL действительно будет диагональной
(пхп) L'HL = \\/flr
О \,
О О
= Л,
(П.3.7)
nj
т.е. матрица Н в результате ортогонального преобразования L
действительно приведена к главным осям.
Поскольку Н неотрицательно определена, идемпотентна и имеет
ранг(п- к- 1), то матрица Л имеет вид
п-к~\ к+\
(\ о .., о о 0\
0 1 0 0 0
Л =
о о
о о
о о
(П.3.8)
Применим теперь ортогональное преобразование V к вектору
случайных остатков \
6 = LTV r\=L%
тогда выражение (П.3.2) для нашей статистики приобретет следующий
вид (используем (П.3.7), (П.3.8)):
in , п-к -1
Х(^-Л) =ВД = П^7Д.Т1 = Л'ЛТ1= Z Л?- (П.3.9)
7 = 1
360
Новые случайные остатки Т| = (т],,Г|2,...,Т|;() центрированы
нормированы (пользуемся некоррелируемостью случайных остатков
^•, а также нормированностью собственных векторов)
( » V " V
Dx\t = Мг|- = М
некоррелированы между собой
cov(tl;,Tl.v) = w
М" = 1 ./=1
у, г = I
./=1
при /' Ф s, и нормальны, поскольку являются линейной комбинацией
первоначальных нормаль'ных случайных остатков
Ч = 1'Д. S,-w(o,i).
7 = 1
Поэтому, согласно (П.3.9),
1 ^
/»- к - I
iK^-Л) = I л?=х2(«-*-1),
./»!
i^l
поскольку Я, ~ N(0,1) и независимы друг от друга.
ПРИЛОЖЕНИЕ 4
имеющие период
\_ т J \ т
РАСЧЕТ СУММ, СОДЕРЖАЩИХ
ТРИГОНОМЕТРИЧЕСКИЕ ФУНКЦИИ
В § 10.2 при расчете коэффициентов тригонометрической
регрессии были использованы выражения сумм, содержащих
тригонометрические функции cosf—— J, sin f—-t\,
mm
-г,У = 1,..., —-1,/и = 2/.
J 2
Ниже определяются эти выражения. Прежде всего найдем суммы
Усоз(фГ), Ysin((pf), ф = -^, / = 1,...Д-1.
;-| /-1 т 2
Используя формулу Эйлера
coscp+ /sinф = с/ч>, / = v-li
и формулу суммы геометрической профессии, имеем:
Есов(фг) + /5>(<р|)-5>* {г^ =
(С08ф-С08Гф(л + 1)1 + /|8тф-8тГф(/1+1)1|\Г(1-С08ф) + /8тф1
[(1 - cos ф) - i sin ф][(1 - cos ф) + / sin ф!
= - ~2 — Г{с08ф-С08[ф(л + 1)]}(1-С08ф)-
(1-созф) н-sin ф1-
— 81Пф|81пф — 81пГф(/7 + 1)1} + /(51пф|с08ф— С08Гф(гс + !)]} +
+ (1--С08ф){81пф-8тГф(/1 + 1)1|\ =
4sinf IJsinf^Jcosf ^ф1 + /-48т^|8т[^^ф|8т^^ф|
л • 2 Гф
4 sin ' ■
362
ф
sin | —n
2
sin I —
2
, /7 + 1 ^ . . (/7 + 1
cos| ф +/sin ф
отсюда
Ёсо8(ф0=
sin l — я cos
(/7 + 1)*
/ = i
ZsinM =
sin
sin I —/7 ism
Ф
(-of
/ = i
• Ф
sin —
Поскольку ф = 2jc/7w, « = и/m — целое, то
поэтому
sini w— =sin л— J = sin(7С/Л) = 0,
M?'h 1>&и-
Далее
, v 1 + COS —-/ , , ч
,4l l« J £ 2 2 2Й U J 2
l-cosf4-7^)
,4f \m ) & 2 2 2ftx \m ) 2
Поскольку при j * к (используем формулу косинуса суммы и
разности)
t = \
^cosl —-/ |cos
2кк
т
=1
cos
т
+
Л . (2nj ) . (2кк ~] Л . (2к/ ) . (2кк ,
w ^ v w
363
t cos
Ink
m
it
=1
cos
/ = l
2n{j-k)t
m
r = 1 V ™
/ sin
Ink
m
'--£
sin
/ = i
2ti/ V (27bfc
w
/sin — t ,
w
поэтому
Icosf^4cos(^'l=±Isin(v'Jsin(^'}
V w
/ = i V m
следовательно,
^ f27C/'^ (2я* ^ n yh . (2л;/ ^ . (2nk Л n
> cos -^-t cos 1 = 0, > sm —-? sin 1 =0.
Точно так же, используя формулу синуса суммы и разности,
устанавливаем:
л (гщ \ (ink . Л
> cos —^-t cos 1 1 = 0.
ПРИЛОЖЕНИЕ 5
ОБОСНОВАНИЕ СХОДИМОСТИ
МЕТОДА НЬЮТОНА-ГАУССА
В § 10.3 в общих чертах был описан итерационный метод
Ньютона—Гаусса нахождения точки минимума функции
е(«)=Е[>-/(<.«)]2. <*
Гп л
ос,
\aU
где/(/, а) — тренд, нелинейный относительно своих параметров.
Необходимым условием локального экстремума функции
многих переменных является равенство нулю ее первых производных:
|^ = 0, / = !,...,*,
da.
однако при этом неясно, является ли точка ос , в которой все
производные обращаются в нуль, точкой максимума или минимума либо
вовсе не является точкой экстремума. Для выяснения того, какой же
случай действительно имеет место, следует рассмотреть вторые
производные функции Q(a).
Согласно предположениям, сделанным в § 10.3 при изложении
метода Ньютона—Гаусса, начальная точка а(0) находится в достаточно
близкой окрестности точки локального минимума (условие 2), а
функция/(Г, а) не слишком «нелинейна» относительно параметров а
(условие 1), точнее это выражается в том, что поведение матрицы Гессе,
т.е. матрицы вторых производных функции Q
# =
э2е
Эа.Эа.
df_ty_
da,, да.
-2l[>■-/('■«)]
э2/
< = \
*1
э/ а/
,^Эа,.Эа.
-2Е|>,-/(',«)]
э2/
/=)
Эа,Эа,
Эада (
= Н] + Н2
365
определяется первым слагаемым Я, = Х'Х, где
'Э/(1,а) Э/(1,а)
Х = Х(а) =
Эа,
Эа.,
Э/(1,а)
Эа.
Э/(/,а) Э/(*,а) Э/(*,а)
Эа,
Эа,
Эа.
Э/*(/7,а) Э/(и,а) Э/(я,а)
Эа,
Эа.
Эа,,
Для доказательства сходимости метода Ньютона—Гаусса
понадобятся следующие две теоремы.
Теорема 1. Если столбцы матрицы X линейно независимы, то
матрица А = XX положительно определена.
Доказательство. Линейная независимость столбцов матрицы X
означает, что ни один из них не может быть представлен в виде линейной
комбинации других хотя бы с одним ненулевым коэффициентом, т.е.
det Л Ф 0. Матрица А, как и всякая другая, некоторым ортогональным
преобразованием U приводится к главным осям, т.е.
U'AU = A =
X, 0
0 X,
(О
о
О О ... кк
Из невырожденности А вытекает, что все Х; * 0, поскольку
det Л - А.,Х:... Хк = (det iff det А.
Теперь осталось только показать, что все X, > 0. Действительно,
A=U'AU = и'ХХи = {XU) XU = В'В =
Ё*А
, в = хи,
и, следовательно, X, = ^6,, > 0, но X, Ф 0, поэтому Х; > 0, что и требо-
/ = i
валось доказать.
Теорема 2. Если матрица А положительно определена, то и
матрица А'1 положительно определена.
366
Доказательство. Поскольку А положительно определена, то
найдется такое ортогональное преобразование U, что
а о^
U'AU-A-
0 Хг ... 0
^0 0 ... к
где все 'К, > 0. Тогда
V ...
0 К?
Л"' =
о о
о
о
\
к J
-1 л-\ ti г>\~* — г r's-U
= {U'AU) =U-lA-](U'Y=U'A-]U,
поскольку для ортогональных матриц (£У = U'. Так как Xt' > 0 для
всех /, то из последнего равенства следует положительная
определенность А ', что и требовалось доказать.
Итак, условие 1 и доказанная теорема 1 обеспечивают
положительную определенность матрицы Гессе функции Q{a) в окрестности
точки а*.
Теперь докажем, что последовательность точек а(/),
определенная в § 10.3, сходится к точке локального минимума а* функции
Ж = 1[л-/('.а)]2
Прежде всего покажем, что на последовательности сс(/) функция
Q{o.) строго монотонно убывает, т.е.
f,(t)=f(t,aW). х, = х[ам). у; =(/,(1),..../,(/.))'
^K))=Lb,-./;(0]2=(>'-./;)>--//)>
= \-fi-xl(x;xyix;(Y-f!)\[Y-fl-xl(x'lxlyix'l(Y-f,)
367
= (Г -f,)'{Y -f,)-2(Y ^fSx^Xj'X^Y-j,)*
+(Y-fl)'xl(x'lxl)-lx'ixl(x;xlylx'1(Y-fl) =
= Q(a{l])-(Y-fl)'x,(X;Xiy,X'l(Y-fl)=Q(a")-z'Ai>z,
где z = X',[Y — /J) — вектор-столбец размером к x 1, поэтому z'Af*z —
квадратичная форма с матрицей Л;~' размера (А: х Л).
Выше было доказано, что матрица At = Х\Х, положительно
определена, поэтому и матрица Л;_| также положительно определена (см.
теорему 2), так что квадратичная форма z'A^z > 0 для любых
значений z. Поэтому действительно Q\cl + '\<Qloc ')", т.е.
последовательность значений Q(cl0)) строго монотонно убывает. Вместе с тем она
ограничена снизу Q(o!n) > 0, поэтому существует предел £?(а(/)) —> Q*.
Из непрерывности Q(ol) следует а"' —> а*, Q{a*) = Q, что и
требовалось доказать.
ПРИЛОЖЕНИЕ 6
ТАБЛИЦЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Таблица П.6.1
Значение функции ф(х) =
и функции Лапласа
ф{']-ж{
--2/2
dz
у[2к
v:/2
X
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
1,05
1,10
1,15
1,20
ФМ
0,3989
0,3984
0,3970
0,3945
0,3910
0,3867
0,3814
0,3752
0,3683
0,3605
0,3521
0,3429
0,3332
0,3230
0,3123
0,3011
0,2897
0,2780
0,2661
0,2541
0,2420
0,2299
0,2179
0,2059
0,1942
Ф{х)
0,0000
0,0199
0,0398
0,0596
0,0793
0,0987
0,1179
0,1368
0,1554
0,1736
0,1915
0,2088
0,2257
0,2422
0,2580
0,2734
0,2881
0,3023
0,3159
0,3289
0,3413
0,3531
0,3643
0,3749
0,3849
X
1,25
1,30
1,35
1,40
1,45
1,50
1,55
1,60
1,65
1,70
1,75
1,80
1,85
1,90
1,95
2,00
2,05
2,10
2,15
2,20
2,25
2,30
2,35
2,40
2,45
ФМ
0,1826
0,1714
0,1604
0,1497
0,1394
0,1295
0,1200
0,1109
0,1023
0,0940
0,0863
0,0790
0,0721
0,0656
0,0596
0,0540
0,0488
0,0440
0,0396
0,0355
0,0317
0,0283
0,0252
0,0224
0,0198
ФМ
0,3944
0,4032
0,4115
0,4192
0,4265
0,4332
0,4394
0,4452
0,4505
0,4554
0,4599
0,4641
0,4678
0,4713
0,4744
0,4773
0,4798
0,4821
0,4842
0,4861
0,4878
0,4893
0,4906
0,4918
0,4929
X
2,50
2,55
2,60
2,65
2,70
2,75
2,80
2,85
2,90
2,95
3,00
3,05
3,10
3,15
3,20
3,25
3,30
3,35
3,40
3,45
3,50
3,55
3,60
3,70
3,80
ф(л-)
0,0175
0,0154
0,0136
0,0119
0,0104
0,0091
0,0079
0,0069
0,0060
0,0051
0,0041
0,0038
0,0033
0,0028
0,0024
0,0020
0,0017
0,0015
0,0012
0,0010.
0,0009
0,0007
0,0006
0,0004
Q.0003
Ф{х)
0,4938
0,4946
0,4953
0,4960
0,4965
0,4970
0,4974
0,4978
0,4981
0,4984
0,4986
0,4989
0,4990
0,4992
0,4993
0,4994
0,4995
0,4996
0,4997
0,4997
0,4998
0,4998
0,4998
0,4999
0,4999
369
Таблица П.6.2
Значения t.
соответствующие вероятности
~""^^. р
к ^^-^^
1
2
3
4
5
6
7
6
9
10
11
12
13
14
15
16
17
18
19
20
25
30
40
60
120
оо
0,1
6,31
2,92
2,35
2,13
2,01
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1.73
1,72
1,71
1,70
1,68
1,67
1,66
1,64
0,05
12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,06
2,04
2,02
2,00
1,98
1,96
0,01
63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,79
2,75
2,70
2,66
2,62
2,58
0,005
127,32
14,09
7,45
5,60
4,77
4,32
4,03
3,83
3,69
3,58
3,50
3,43
3,37
3,33
3,29
3,25
3,22
3,20
3,17
3,15
3,08
3,03
2,97
2,91
2,86
2,81
Таблица П.6.3
Значения х),*
соответствующие вероятности
Р = Р{г(к)>х\)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
100
0,99
0,0002
0,02
0,12
0,30
0,55
0,87
1,24
1,65
2,09
2,56
3,05
3,57
4,11
4,66
5,23
5,81
6,41
7,02
7,63
8,26
8,90
9,54 .
10,20
10,86
11,52
12,20
12,88
13,56
14,26
14,95
22,16
29,71
70,07
0,95
0,004
0,10
0,35
0,71
1,15
1,64
2,17
2,73
3,33
3,94
4,58
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,12
10,85
11,59
12,34
13,09
[3,85
14,61
15,37
16,15
16,93
17,71
18,49
26,51
34,76
77,93
0,90
0,02
0,2.1
0,58
1,06
1,61
2,20
2,83
3,49
4,17
4,87
5,58
6,30
7,04
7,79
8,55
9.31
10,09
10,86
11,65
12,44
13,24
14,04
14,85
15,66
16,47
17,29
18,11
18,94
19,77
20,60
29,05
37,69
82,36
0,10
2,71
4,61
6,25
7,78
9,24
10,65
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30,81
32,01
33,19
34,38
35,56
36,74
37,92
39,09
40,26
51,81
63,17
118,50
0,05
3,84
5,99
7,82
9,49
11,07
12,59
14,06
15,51
16,92
18,31
19,68
21,03
22,36
23,69
25,00
26,30
27,59
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
55,76
67,51
124,34
0,01
6,64
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,72
26,22
27,68
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
43,98
44,31
45,64
46,96
48,28
49,59
50,89
63,69
76,15
135,81
371
Таблица П.6.4
Значения F..
соответствующие вероятности
p = P(F{kl,k2)>Fp) прир = 0,05
ч
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
40
60
120
оо
1
161,45
18,51
10,13
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,24
4,17
4,08
4,00
3,92
3,84
2
199,50
19,00
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,88
3,80
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,38
3,32
3,23
3,15
3,07
2,99
3
215,71
19,16
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
2,99
2,92
2,84
2,76
2,68
2,60
4
224,58
19,25
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,76
2,69
2,61
2,52
2,45
2,37
5
230,16
19,30
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,02
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,60
2,53
2,45
2,37
2,29
2,21
6
233,99
19,33
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,49
2,42
2,34
2,25
2,17
2,09
8
238,88
19,37
8,84
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,34
2,27
2,18
2,10
2,02
1,94
12
243,91
19,41
8,74
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,16
2,09
2,00
1,92
1,83
1,75
24
249,05
19,45
8,64
5,77
4,53
3,84
3,41
3,12
2,90
2,74
2,61
2,50
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
1,96
1,89
1,79
1,70
1,61
1,52
ОО
254,32
19,50
8,53
5,63
4,36
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,71
1,62
1,51
1,39
1,25
1,00
372
Таблица П.6.5
z -преобразование Фишера z = 0,5 In—-
р
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0.8
0.9
0
0,0000
0,1003
0,2027
0,3095
0,4236
0,5493
0,6931
0,8673
1,0986
1,4722
1
0,0100
0,1105
0,2132
0,3206
0,4356
0,5627
0,7089
0,8872
1,1270
1,5275
2
0,0200
0,1206
0,2237
0,3317
0,4477
0,5763
0,7250
0,9076
1,1568
1,5890
3
0,0300
0,1308
0,2342
0,3428
0,4599
0,5901
0,7414
0,9287
1,1881
1,6584
4
0,0400
0.1409
0,2448
0,3541
0,4722
0,6042
0,7582
0,9505
1,2212
1,7380
5
0,0501
0,1511
0,2554
0,3654
0,4847
0,6184
0,7753
0,9730
1,2562
1,8318
6
0,0601
0,1614
0,2661
0,3769
0,4973
0,6328
0,7928
0,9962
1,2933
1,9459
7
0,0701
0,1717
0,2769
0,3884
0,5101
0,6475
0,8107
1,0203
1,3331
2,0923
8
0,0802
0,1820
0,2877
0,4001
0,5230
0,6625
0,8291
1,0454
1,3758
2,2976
9
0,0902
0,1923
0,2986
0,4118
0,5361
0,6777
0,8480
1,0714
1,4219
2,6467
373
Таблица П.6.6
Значения 5,,, определяемые уравнением
( \
= 1~р
к ^\
1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
25
30
35
40 -
45
50
60
100
1000
0,1
6,923
2,086
1,270
0,941
0,738
0,623
0,576
0.516
0,476
0,442
0,388
0.357
0,325
0,297
0,282
0,247
0,226
0.207
0,193
0,184
0,174
0,155
0,125
0,044
*/ИЛ
0,05
3,400
1,932
1,382
1,104
0,918
0,800
0,713
0,650
0,596
0,527
0,468
0,422
0,390
0,370
0,317
0,281
0,261
0,242
0,228
0,212
0,193
0,146
0,047
к/max2 П
0,02
5,857
3,000
2,056
^,594
1,306
1,143
0,986
0,889
0,814
0,700
0,620
0,564
0,500
0,480
0,408
0,369
0,347
0,312
0,288
0,270
0,242 -
0,184
0,056
-6,:°)
0,01
8,500
4,200
2,700
2,000
1,650
1,393
1,225
1,094
0,980
0,840
0,740
0,671
0,600
0,567
0,485
0,425
0,400
0,375
0,350
0,311
0,2783
0,200
0,059
0,001 •
9,00
5,00
3,80
3,00
2,50
2,05
1,75
1,50
1,30
1,14
1,02
0,92
0,85
0,70
0,60
0,56
0,52
0,48
0,45
0,40
0,30
0,08
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Айвазян С.А., Енюков И.С, Мешалкин Л.Д. Прикладная статистика.
Основы моделирования и первичная обработка данных. М. : Финансы
и статистика, 1983.
2. Айвазян С.А., Енюков И.С, Мешалкин Л.Д. Исследование
зависимостей. М. : Финансы и статистика, 1985.
3. Айвазян С.А., Мхитарян B.C. Прикладная статистика. Основы
эконометрики: в 2-х т. Т. 1. Теория вероятностей и прикладная статистика.
М. : ЮНИТИ-ДАНА, 2001.
4. Айвазян С.А., Мхитарян B.C. Прикладная статистика в задачах и
упражнениях. М. : ЮНИТИ-ДАНА, 2001.
5. Андерсен Т. Статистический анализ временных рядов. М. : Мир, 1976.
6. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и
управление. Вып. 1, 2. М. : Мир, 1974.
7. Большее Л. Н., Смирнов И.В. Таблицы математической статистики. М. :
Наука, 1983.
8. Боровков А.А. Математическая статистика. Новосибирск : Наука, 1997.
9. Боровков А.А. Теория вероятностей. М. : Эдиториал УРСС, 1999.
10. Вин <)ср Вар<к'п ИЛ Математическая статистика. М, ; ИЛ, 1960.
11. Встель В,В. Интегральная регрессия и корреляция, Статистическое
моделирование рядом динамики, М,: Финансы и статистика, 1983.
12. Вентцель Е.С. Теория вероятностей. М.: Высшая школа, 1998.
13. ГнеОепко Б.В. Курс теории вероятностей. М.: Эдиториал УРСС, 2001.
14. Демиденко ЕЛ. Линейная и нелинейная регрессия. М. : Финансы и
статистика, 1982
15. Дрейпер И., Смит Г. Прикладной регрессионный анализ. М. : Финансы
и статистика, 1986, 1987. Кн. 1,2,
16. Закс Л. Статистическое оценивание. М. : Статистика, 1976.
17. Кепдалл М.Дж. Временные ряды. М. : Финансы и статистика, 1981.
18. Кепдалл М.Дж., Стьюарт А. Статистические выводы и связи. М.:
Наука, 1973.
19. Колемаев В.А. О математическом обеспечении
экономико-статистических исследований и разработок: Ученые записки по статистике. М. :
Статистика, 1980. Т. 36.
20. Колемаев В.А., Калинина В.И. и др. Теория вероятностей в
экономике. М. : МИУ, 1989.
21. Колемаев В.А., Калинина В.Н. и др. Математическая статистика в
экономике, М. :МИУ, 1990.
22. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория
вероятностей и математическая статистика. М. : Высшая школа, 1991.
375
23. Колемаев В.А.. Калинина В.Н. Теория вероятностей и математическая
статистика. М.: ИНФРА-М, 2000; ЮНИТИ, 2003.
24. Колемаев В. А., Калинина В.Н., Соловьев В.И. и др. Теория вероятностей
в примерах и задачах. М.: ГУУ, 2001.
25. Колемаев В.А., Калинина В.Н., Соловьев В.И. Математическая
статистика в примерах и задачах. М. : ГУУ, 2001.
26. Колмогоров АН. Основные понятия теории вероятностей. М. :
Фазис, 1998.
27. Крешер Г. Математические методы статистики. Ижевск: Регулярная
и хаотическая динамика, 2003.
28. Кремер Н.Ш Теория вероятностей и математическая статистика. М. :
ЮНИТИ, 1999.
29. Ланкастер П. Теория матриц. М.: Наука, 1982.
30. Леман Э. Проверка статистических гипотез. М. : Наука, 1979.
31. Лоули Д., Максвелл А. Факторный анализ как статистический метод.
М.':Мир, 1967.
32. Лукашин Ю.П. Адаптивные методы краткосрочного
прогнозирования. М. : Статистика, 1979.
33. Льюис К.Д. Методы прогнозирования экономических показателей. М.:
Финансы и статистика, 1986.
34. Мешалкин Л.Д. Сборник задач по теории вероятностей. М. ; Изд-во
Моск. ун-та, 1963.
35. Прохоров Ю.В., Розанов Ю.А. Теория вероятностей. М.: Наука, 1987.
36. Пугачев B.C. Теория вероятностей и математическая статистика. М. :
Физматгиз, 2002.
37. Рао СР. Линейные статистические методы и их применения. М. :
Наука, 1968.
38. Розанов Ю.А. Случайные процессы. М.: Наука, 1979.
39. СеберДЖ. Линейный регрессионный анализ. М. : Мир, 1980.
40. Смирнов Н.В., Дунин-Борковский И.В. Курс теории вероятностей и
математической статистики для технических приложений. М. : Наука,
1969.
41. Тутубалин В.И. Теория вероятностей. М. : МГУ, 1972.
42. Тюрин ЮН., Макаров А.А. Статистический анализ данных на
компьютере. М.: ИНФРА-М, 1998.
43. Харман Г. Современный факторный анализ. М. : Мир, 1983.
44. Химмельблау Д. Анализ процессов статистическими методами. М. :
Мир, 1973.
45. Четыркин ЕМ. Статистические методы прогнозирования. М. :
Статистика, 1977.
46. Четыркин ЕМ., Калихман И.Л. Вероятность и статистика. М. :
Финансы и статистика, 1982.
47. Чистяков В.П. Курс теории вероятностей. СПб. : Лань, 2003.
48. ШеффеГ. Дисперсионный анализ. М. : Физматгиз, 1963.
ЭЛЕКТРОННЫЙ
УЧЕБНИК
БАКАЛАВР:
МАКРОЭКОНОМИКА
Думная Н.Н., ред.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-85971-866-5
Код 193633.
Цена 250,00
Предназначен для
подготовки
экономистов-бакалавров. Отличительной
особенностью данного учебника
по сравнению с другими
курсами макроэкономики является ориентация изложения материала
на экономику России.
Форма электронного учебника особенно удобна при подготовке
бакалавров.
АНАЛИЗ
НАНСОВОИ
1ТЧЕТНОСТИ
АНАЛИЗ
ФИНАНСОВОЙ
ОТЧЕТНОСТИ
Жарылгасова Б.Т.,
Суглобов А.Е.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-85971-754-5
Код 197749.
Цена 250,00
Раскрыты сущность
финансовой отчетности,
ее состав и содержание. Показано, как влияет на
информативность отчетности ориентация на международные стандарты
бухгалтерского учета. Рассмотрены направления анализа
отчетности, способы использования результатов анализа в обосновании
стратегии развития организации.
Для студентов вузов, аспирантов, преподавателей, слушателей
системы послевузовского образования и обучающихся в системе
дистанционного образования.
БАКАЛАВР:
МИКРОЭКОНОМИКА
Юданов А.Ю., ред.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-85971-867-2
КОД 193634.
Цена 250,00
Предназначен для
подготовки
экономистов-бакалавров. Отличительной
особенностью данного учебника
по сравнению с другими кур-
сами микроэкономики является ориентация изложения материала
на экономику России.
Электронный учебник дает преподавателям и студентам
реальный инструмент организации эффективной самостоятельной,
внеаудиторной работы будущих бакалавров.
ЖИЛИЩНО-
КОММУНАЛЬНОЕ
ХОЗЯЙСТВО:
упмалше, этнлиим
ЖИЛИЩНО-
КОММУНАЛЬНОЕ
ХОЗЯЙСТВО
Черняк В.З.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-390-00052-6
КОД 19564В.
Цена 250,00
Жилищно-коммунальное хозяйство —
важнейшая система
жизнеобеспечения и безопасности населения. Степень развития и объем
деятельности коммунального хозяйства непосрвдстввнно
влияют на уровень благосостояния населения, бытовые условия его
жизни, санитарно-гигивничвские условия и чистоту водного
и воздушного бассейна, а также на уровень
производительности труда.
Учебник предназначен для студентов и аспирантов строитвль-
ных вузов.
КОМПЛЕКСЫ
ЭКОНОМИЧЕСКИЙ
АНАЛИЗ
ХОЗЯЙСТВЕННОЙ
ДЕЯТЕЛЬНОСТИ
КОМПЛЕКСНЫЙ
ЭКОНОМИЧЕСКИЙ
АНАЛИЗ
ХОЗЯЙСТВЕННОЙ
ДЕЯТЕЛЬНОСТИ
Алексеева А.И. [и др.]
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-85971-745-3
КОД 199672.
Цена 250,00
В электронном учебнике изложены теоретические аспекты
средств и методов экономического и финансового анализа
хозяйственной деятельности, применение которых на практике
позволит повысить эффективность и результативность
экономической и финансовой деятельности организаций.
Форма электронного учебника особенно удобна.для
подготовки студентов дистанционной формы обучения.
КУРОРТНОЕ
ДЕЛО
КУРОРТНОЕ
ДЕЛО
Ветитнев A.M.,
Журавлёва Л.Б.
Электронный учебник,
КНОРУС. 2008.
ISBN 978-5-390-00О16-6
Код 195650.
Цена 250,00
В электронном
учебнике в соответствии с
Государственным стандартом и
программой подготовки
специалистов по специальности «Социально-культурный
сервис и туризм» впервые представлены основные материалы по
курсу «Курортное дело».
Для студентов, аспирантов и преподавателей вузов,
слушателей системы послевузовского образования, а также для
руководителей санаторно-курортного комплекса, специалистов в
области курортного дела.
МЕЖДУНАРОДНЫЕ
ВАЛЮТН0-ФИНАНС0ВЫЕ
ОТНОШЕНИЯ
МЕЖДУНАРОДНЫЕ
ВАЛЮТНО-
ФИНАНСОВЫЕ
ОТНОШЕНИЯ
Суэтин АА
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-390-00017-5
Код 195066.
Цена 250,00
Рассматривается
история становления и развития
мировой валютной системы, а также балансы международных
расчетов, в.частности платежный баланс, и методы их анализа.
Освещаются вопросы валютного регулирования, валютные
риски и их страхование. Изучаются валютные операции,
международные расчеты, финансовые и коммерческие документы.
Для студентов, аспирантов и преподавателей экономических
факультетов и вузов, слушателей системы послевузовского
образования.
МАРКЕТИНГ:
Основы теории
и практики
Беляев В.И.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-85971-793-4
Код 199673.
Цена 250,00
Отражаются
теоретические и практические
аспекты деятельности
производственных и
коммерческих организаций, направленных на создание востребованных
рынком товаров и услуг, которые удовлетворят потребности-
людей и обеспечат приемлемую прибыль предприятиям.
Электронный учебник построен так, что его можно
использовать как в традиционной (на дневном, вечернем и заочном
отделениях вузов), так и в дистанционной системе обучения.
МЕНЕДЖМЕНТ
ОРГАНИЗАЦИИ
МЕНЕДЖМЕНТ
ОРГАНИЗАЦИИ
Тебекин А.В., Касаев Б.С.
Электронный учебник,
КНОРУС, 2008.
ISBN 978-5-390-00053-3
Код 195522.
Цена 250,00
Электронный учебник
полностью отвечает
требованиям Государственного
образовательного стандарта
высшего
профессионального образования. В нем сформулированы основные принципы,
функции, методы, организационные структуры менеджмента как
системы управления.
Для студентов и преподавателей экономических факультетов
и вузов, а также специалистов всех уровней управления.
т\#У(
ИЗДАТЕЛЬСКИЙ ТОРГОВЫЙ ДОМ
• ЛИДЕР В ИЗДАНИИ И РАСП РОС РАНЕНИИ
ДЕЛОВОЙ И УЧЕБНОЙ ЛИТЕРАТУРЫ
• АССОРТИМЕНТ - 30000 НАИМЕНОВАНИЙ
КНИГ 2000 РОССИЙСКИХ ИЗДАТЕЛЬСТВ
• БОЛЕЕ «00 НАИМЕНОВАНИЙ
СОБСТВЕННЫХ ИЗДАНИЙ
• ГИБКАЯ ЦЕНОВАЯ ПОЛИТИКА
• ДОСТАВКА ВО ВСЕ РЕГИОНЫ РОССИИ
И СТРАНЫ СНГ
• ИНФОРМАЦИОННАЯ И ТЕХНИЧЕСКАЯ
ПОДДЕРЖКА ПАРТНЕРОВ
• ИНТЕРНЕТ-МАГАЗИН -WWW.BOOK.RU
Адрес 129110, г. Москва
ул. Большая Параяславская, д. 46
Тол./факс (495) 680-7254, 680-9106
680-9213, 680-1278, 680-0671, 775-8387
E-mail: offkaQknorus.ru
УЧЕВНАЯ ЛИТЕРАТУРА ПО ПРАВУ
КОДЕКСЫ
СБ0ВИ8Р
СБОРНИКИ
КОММ
философия пс
ФИНАНСЫ
ОТЧЕТНОСТЬ
УЧЕБНАЯ ЛИТЕРАТУРА ПО ПРАВУ
КОММЕНТАРИИ
з;
АРИИ
ность
т
СБ
ФИЛОСОФИЯр
ПСИХОЛОГИ^
КОДЕКСЫ ЗАКбМ
.nroClMFAJ1TEPCyK4HE?
ИСТОРИ5РОДЕКСЫ
ЭКОНОМИКА ФИНАНСЫ 'ПРОСПЕКТ-
И УЧЕТ
КОММЕНТАРИИ
Г1ТГЗАКОНЫ
УЧЕБНАЯ ЛИТЕРАТУРА ПО ПРАВУ
УЧЕБНАЯ ЛИТЕРАТУРА ПО ПРАВУ
КОММЕНТАРИИ
ФИЛОСОФИЯ
психология
ИЗДАТЕЛЬСТВО «ПРОСПЕКТ»
111020, Москве, ул. Боровая, д.7, стр.4
(495)967-1572
e-mail: malKiiprospekt.org
• проспект» www.prospekt.orfl
Учебное издание
Колемаев Владимир Алексеевич
Калинина Вера Николаевна
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Учебник
В авторской редакции
Корректор Л. А. Ссмосина
Компьютерная верстка: Е.П. Довголенская
Санитарно-эпидемиологическое -заключение
№ 77.99.60.953.Д.ОО0035.01.08 от 09.01.2008 г.
Изд. № 893. Подписано в печать 29.08.08
Формат 60x90/16. Гарнитура «Times New Roman PS».
Печать офсетная. Бумага газетная.
Усл. печ. л. 24,0. Уч.-изд. л.-19,2. Тираж 3000 экз. Заказ № 3780
ЗАО «КноРус». 129110, Москва, ул. Большая Переяславская, 46.
Тел.: (495) 680-7254, 680-0671, 680-1278.
E-mail: office@knorus.ru http://www.knorus.ru
Отпечатано в полном соответствии с качеством
предоставленного издательством электронного оригинал-макета
в ОАО «Московская типография № 2».
129085, Москва, пр. Мира, 105.