Текст
                    MODERN APPLIED
MATHEMATICS
PROBABILITY—STATISTICS—OPERATIONAL-
RESEARCH
J. C. TURNER, M. Sc., F. S.FS.
Principal Lecturer in Mathematics
Leeds Polytechnic
The English Universities Press Ltd
1970

Д. ТЁРНЕР ВЕРОЯТНОСТЬ, СТАТИСТИКА И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Перевод с английского Е. 3. Демиденко, В. С. Занадворова ПОД РЕДАКЦИЕЙ А. А. РЫВКИНА Москва «Статистика» 1976
Г. 17.8 135 БИБЛИОТЕЧКА ИНОСТРАННЫХ КНИГ ДЛЯ ЭКОНОМИСТОВ И СТАТИСТИКОВ Издательство «Статистика» выпускает на русском языке серию книг иностранных авторов по статистике, рассчитанных на круг читателей, нуждающихся в пополнении своих мате- матических и статистических знаний. Задача книг — озна- комить статистиков и экономистов не на очень сложном ма- териале с современными методами, которые за рубежом при- меняются в экономическом анализе и в различных хозяйст- венных расчетах. В серию включаются как книги по общим вопросам ста- тистики, так и книги, посвященные статистическому анализу в отдельных областях экономики. Издательство старается подбирать работы, не перегруженные сложными теоретиче- скими изысканиями, но такие, которые подводят к примене- нию теоретических достижений на практике. Уже вышли из печати книги: 1. М. Б р о у д и. О статистическом рассуждении. 2. А. Б е р н с т е й н. Справочник статистических ре- шений. 3. У. Дж. Р е~й х м а н. Применение статистики. 4. X. Крыньский. Математика для экономистов. 5. С. Д а й м е н д. Мир вероятностей. 6. А. X ь ю т с о н. Дисперсионный анализ. 7. С. Л и з е р. Эконометрические методы и задачи. 8. Эм. Борел ь, Р. Дельтейль, Р. Юрон. Вероятности, ошибки. 9. Статистические методы исследования корреляций в экономике. 10. Л. С т о л е р ю. Равновесие и экономический рост. 11. Я. О к у н ь. Факторный анализ. 12. С. С и р л, У. Г о с м а и. Матричная алгебра в экономике. 13. Е. Г р е н ь. Статистические игры и их применение Подготавливается к изданию: Э. К е й н. Экономическая статистика и эконометрия. Редколлеги я Л. С. Кучаев, П. П. Маслов, Л. Е. Минц, И. С. Пасхавер, Г. Г. Пирогов, 3. А. Сумник, Е. М. Четыркин, Р. М. Энтов т 10805<-155 117 76 008(01)-76 ’ Второй индекс 10803. © перевод на русский язык, «Статистика», 1976 4 АлквЯеОД { аамиввх’’ че^®а и.ч, . ,а зутц ПР ВШ> ..,1
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Книга Д. Тёрнера задумана как руководство практически по все- му курсу математики. Первая часть книги посвящена изложению ряда понятий классической математики, она позволяет читателю овладеть навыками работы с аппаратом, развитым в теории множеств и матрич- ной алгебре. Исключительно важны для высококвалифицированного практика методы статистического анализа, базирующиеся на совре- менных достижениях теории вероятностей и математической статисти- ки. Эти методы содержатся в наиболее объемной второй части книги. И только последняя, третья ее часть относится непосредственно к за- дачам, имеющим сугубо прикладную направленность. Изложение материала иллюстрируется в книге большим числом удачно подобранных примеров, благодаря чему читатель постоянно ощущает стремление автора помочь ему в активном усвоении получен- ных знаний. Вместе с тем, познакомившись с первыми двумя частями книги, читатель вряд ли составит себе правильное представление о том классе задач, ради решения которых собран весь этот, по сути дела, подготовительный материал. Поскольку автор не снабдил свою книгу достаточно подробным вве- дением, объясняющим конечную цель всего курса, мы несколько опередим события и постараемся заглянуть вперед, чтобы выяснить на конкретных примерах содержание прикладного математического исследования. Мы увидим, как в реальной ситуации возникает целый комплекс математических задач. С многими из них читатель встретится при работе с книгой Д. Тёрнера, с некоторыми познакомится при чте- нии других книг или на практике. Объединяет эти задачи общность их возникновения — все они появились как задачи, в которых требует- ся принять наилучшее решение в той или иной реальной ситуации. Представьте себе производство листового проката. Нагретый в пе- чах металл поступает вначале на слябинг, где производятся прямо- угольные бруски—слябы. Эти бруски снова нагреваются в печах и про- катываются на листопрокатном стане до нужных размеров. Завод имеет определенный портфель заказов — месячную программу. Прокат различных марок требует разного времени обработки на слябинге и на листопрокатном стане. В одних случаях быстрее справляется со своей работой слябинг, в других—прокатный стан. Когда слябинг работает с опережением, то готовые слябы либо ожидают своей оче- 5
реди в печах, либо, если в печах уже нет свободного места, остывают и требуют впоследствии больших затрат времени на разогрев. Инженер, составляющим программу работы всей линии, стремится установить такую очередность, чтобы иа выполнение всего задания цепочкой агрегатов было затрачено минимальное время. Он учитывает и такое обстоятельство, как необходимость определенного расхода времени на переналадку при переключении линии с изготовления од- ного сорта проката иа другой. Для некоторых размеров листа время работы слябинга и прокат- ного стана либо сбалансировано, либо почти сбалансировано, т. е. разность производительностей агрегатов незначительна. Инженер бу- дет стремиться к производству такой продукции максимально больши- ми партиями без переналадок. Если же расхождения во времени за- грузки основных агрегатов становятся достаточно большими, то осу- ществление маневра, связанного с переналадкой, оказывается оправ- данным. В этом случае инженер попытается расставить заказы в оче- реди таким образом, чтобы чередовать продукцию, требующую боль- шей загрузки первого агрегата, с продукцией, более трудоемкой для второго. Нагревательные печи — промежуточный агрегат — должны выполнять в этом случае роль «склада» и иметь некоторый запас мощ- ностей. При более интенсивной работе слябинга запас полуфабрикатов будет накапливаться в печах. Этот запас должен обеспечить равно- мерную загрузку прокатного стана при переключении слябинга на производство следующей партии, более для него трудоемкой. Распределяя месячную программу по дням, инженер может обна- ружить, что загрузка прокатного стана оказывается более интенсив- ной, чем загрузка слябинга. Тогда он постарается включить в програм- му выполнение заказов на прокатку слябов для другого прокатного стана или же для создания страхового запаса на случай выхода сля- бинга из строя. При обратной ситуации страховой запас слябов будет постепенно расходоваться. Так возникает одна из типичных производ- ственных задач — задача составления расписания. Однако, работая в течение длительного времени, инженер, состав- ляющий расписание, может заметить, что слябинг систематически имеет запас производственных мощностей по сравнению с прокатным станом, а использовать этот ресурс полностью не удается. Тогда он может поставить вопрос о реконструкции производственной линии. Напри- мер, слябинг может быть модернизирован с тем, чтобы у него появилась возможность в случае необходимости брать на себя часть работы про- катного стана, уменьшая толщину выпускаемых слябов. Инженер может обратить внимание и на ограниченную мощность печей, которая не позволяет осуществить достаточный маневр при чередовании в рас- писании продукции различных размеров. С его стороны поступит пред- ложение о расширении этого узкого места за счет постройки дополни- тельной печи. Все эти предложения должны подвергнуться экономическому ана- лизу со стороны администрации завода. Во-первых, нужно выяснить, окупятся ли затраты, связанные с реконструкцией (в том числе нужно учесть и возможную остановку производства), эффектом, полученным 6
в результате ее осуществления. Во-вторых, сопоставить этот эффект с эффектом от других мероприятий в рамках завода, также требующих финансирования. В-третьпх, выяснить возможности финансирования извне, и если такие возможности имеются, то обратиться с соответ- ствующими предложениями. Так появляются задача «расшивки» узких мест и более общая задача составления плана развития всего предприятия. Вышестоящая организация, получив от предприятия соответствую- щую заявку, также постарается сопоставить возможный экономический эффект на этом предприятии с другими вариантами расходования имеющихся у нее ограниченных средств. Возможно, просьба предприя- тия о дополнительном финансировании не будет удовлетворена, од- нако проведенные предприятием расчеты позволят улучшить проекты вновь строящихся заводов по производству проката. Принимая свое решение, вышестоящая организация решает задачу размещения име- ющихся у нее ресурсов. Приняв решение о строительстве нового объекта или о реконструк- ции действующего, вышестоящая организация поставит тем самым се- рию задач перед исполнителями. Нужен будет четкий план последо- вательного проведения необходимых для этого работ. Все работы долж- ны быть обеспечены рабочей силой, механизмами, материалами. Для проведения последующих работ должны быть выполнены все подгото- вительные операции, закончены все связанные с ними предшествующие работы и т. д. Составление проекта, предусматривающего все взаимо- связи между отдельными работами, распределение имеющихся мате- риальных ресурсов, а также ресурса времени, и есть задача сетевого планирования. В гл. 3.4 книги Д Тёрнера изложены основные понятия теории решения таких задач. Усвоив их, читатель сможет уверенно работать с более подробными книгами. Вернемся к нашему предприятию. Оно имеет отдел, занимающий- ся реализацией готовой продукции. В распоряжении этого отдела на- ходится склад. Хранение продукции на складе также требует расходов, и поэтому отдел реализации будет побуждать производственников изготавливать продукцию как можно ближе к сроку, установленному заказчиком. Но мы уже видели, что для производственников могут оказаться выгодными более крупные партии. Между двумя отделами возникает противоречие, и каждый старается разрешить его в свою пользу. Именно такого рода противоречия и- ведут к появлению мате- матических задач. Администрация должна выступить здесь в роли ком- петентного арбитра и разрешить это противоречие с максимальной выгодой для всего предприятия в целом. Так возникают задача опре- деления оптимального размера партии и задача управления запасами. Конечно, гл. 3.5 книги охватывает лишь несколько простейших ва- риантов постановки подобных задач. Однако все существенные эле- менты такой постановки проиллюстрированы, и читатель, вероятно, легко сможет сам сформулировать аналогичную задачу управления запасами полуфабрикатов, сырья и т. п. Можно говорить также о запасе производственной мощности того или иного агрегата. В цепочке сля- бинг — печи — прокатный стан нагревательные печи являются наибо- 7
лее дешевым агрегатом. Поэтому их пропускная способность должна быть несколько выше пропускной способности прокатного стана. Но возникает вопрос—насколько выше? Чтобы ответить на него, при- дется сопоставить расходы, связанные с дополнительными капитало- вложениями и дополнительными издержками топлива, с возможно- стями, открывающимися как при маневрировании находящимся в пе- чах запасом горячих полуфабрикатов, так и при использовании холод- ного запаса, имеющегося на складе. В первом случае запас обеспечивает выигрыш во времени в результате выбора разумного расписания, ко- гда партии, требующие большей загрузки слябинга, чередуются с пар- тиями, для которых необходима более интенсивная работа прокатного стана. Во втором случае запас холодных полуфабрикатов на складе позволяет компенсировать сбои в работе слябинга, который время от времени может выходить из строя. Если есть возможность реализо- вать избыток полуфабрикатов, то возникает вопрос, какой их запас имеет смысл хранить. Вероятно, предполагается, что при выходе из строя прокатного стана избыток продукции со слябинга поступает на склад. Если же простаивает слябинг, то холодные слябы со склада (они требуют большего времени на их нагревание) загружаются в печи. Чтобы определить оправданную величину страхового запаса на складе, нужно измерить частоту и продолжительность простоев сля- бинга. С этой целью в течение достаточно длительного промежутка времени придется наблюдать за его работой. Допустим, собранные измерения позволяют сказать, что в среднем остановка слябинга на 10— 20 мин происходит 2 — 3 раза в сутки, остановка на 20 — 40 мин — 1 раз в двое суток, а более чем на 40 мин — 1 раз в неделю. Если ре- жим работы слябинга останется таким же и впередь, то собранные дан- ные дадут возможность рассчитать уровень запаса на складе холодных полуфабр и катов. Но какова степень нашей уверенности в том, что в будущем не произойдет что-либо непредвиденное, совсем не похожее на то, что мы наблюдали при регистрации работы слябинга? Здесь на помощь приходит теория вероятностей. Применить ее мы сможем лишь в том случае, если наблюдавшийся отрезок работы принципиально не отли- чался от последующих—расположен достаточно близко по времени, агрегат после наблюдений не подвергался реконструкции и не имел серьезных повреждений, загрузка его была примерно равномерной и т. п. Приняв такого рода гипотезы, мы можем оценить степень уве- ренности в наступлении того или иного события в будущем, основы- ваясь на сделанных наблюдениях. Например, можно указать такое число, что продолжительность наибольшего ожидаемого простоя сля- бинга в течение недели имеет 95 шансов из 100 не превысить этого чис- ла, но имеет 5 шансов оказаться большей. Ясно, что такое число — хороший ориентир именно в силу разбиения всех шансов на две группы, это не верхняя оценка, а наиболее удачная из возможных точных оце- нок. Конечно, можно задать вопрос о степени нашей уверенности и в этой оценке. Математическая статистика, основанная на понятиях те- ории вероятностей, позволяет ответить и на этот вопрос.. 8
Чтобы овладеть, пусть даже в самом небольшом объеме, аппаратом теории вероятностей, чтобы научиться формулировать на математиче- ском языке практические задачи, нужны навыки и в некоторых областях математики, не являющихся прикладными. Чтобы перевести задачу с обычного языка на математический, нужно этот математический язык знать. Автор предлагаемой книги не ставил перед собой цели научить своего читателя многому и дать ему глубокую систему знаний по всем затронутым в книге вопросам. Цель была иной —* ввести чита- теля в круг идей и понятий современной прикладной математики, помочь ему приобрести необходимые навыки в использовании мате- матического аппарата, дать тот минимум сведений, который позволяет продолжать самостоятельное изучение тех теорий, начала которых содержатся в книге. Автор акцентирует внимание на тех моментах, которые очень полезны на практике. Сложные теоремы формулируются в несколько упрощенном виде с тем, чтобы подчеркнуть главные со- держательные моменты и опустить дополнительные предположения, важные для доказательства, но мешающие создать интуитивную кар- тину того факта, о котором идет речь. Трудные доказательства либо не приводятся, либо намечены в самых общих фразах. Все это делает книгу полезной и доступной не только для студен- тов экономических вузов, но и для тех, кто получил образование в прошлом, долгие годы был далек от применения в своей работе ма- тематических методов и теперь ощутил потребность в овладении фор- мальными и численными приемами решения практических задач. Книга печатается с незначительными сокращениями. А. А. РЫВКИН
ПРЕДИСЛОВИЕ В последние десятилетия появилось много новых методов, приме- няемых в научных и прикладных исследованиях, ври разработке про- ектов в промышленности, для изучения деятельности коммерческих систем и управления ими. Базируясь на математических идеях, эти методы в большинстве своем предусматривают использование вычис- лительных машин. Их развитие привело к значительному росту ак- тивности в некоторых областях прикладной математики, в первую оче- редь это относится к статистике, и даже к появлению нескольких со- вершенно новых разделов, например, теории очередей, теории восста- новления, теории надежности и математического программирования. Каждое из направлений стало объектом серьезного математического изучения, выявило свою специфику и оказалось достаточно плодот- ворным. Эти новые и энергично растущие области удачно объединяет термин «современная прикладная математика». Развитие и усложнение промышленных, экономических и социаль- ных организаций приводит к необходимости знать и использовать воз- можности новых методов при управлении деятельностью этих орга- низаций. Сегодня начинающий менеджер не может считаться образо- ванным до тех пор, пока он не имеет достаточного представления о при- менении этих методов. Признавая это, колледжи.и университеты из- меняют учебные программы и все чаще предлагают темы дипломов и специальных курсов по новым разделам. Эта книга представляет собой введение в курс современной при- кладной математики, содержащее необходимые сведения о множествах, матрицах, сведения из теории вероятностей и математической стати- стики и начала нескольких разделов исследования операций. Уровень математической подготовки, требуемый от читателя этой книги, не высок, и можно утверждать, что ее содержание в основном будет доступно выпускникам средней школы. Каждая тема излагается с азов и подкрепляется многими несложными упражнениями с тем, чтобы помочь студенту быстро усвоить новые идеи и терминологию. Автор считает, что большинство книг, адресованных первокурсникам университетов и колледжей, не включает достаточного числа легких вопросов, непосредственно связанных с содержанием; они не предусмат- ривают элементарных упражнений, так необходимых каждому начи- нающему изучать новый предмет. Простые вопросы, собранные в книге', помогут студенту приобрести необходимую уверенность и побудят его при чтении постоянно обращаться к карандашу и бумаге. 10
В конце второй части приведено много вопросов, предлагавшихся первокурсникам на экзаменах по теории вероятностей и статистике. Студенты (а возможно, и лекторы) смогут успешно пользоваться ими на завершающей стадии курса. Эти вопросы использовались в экза- менационной практике университетов Шеффилда, Бирмингема, Лан- кастера, Лидса и Лондона, и автор благодарен советам этих универси- тетов за разрешение их воспроизвести. Книга разделена на три части. В первой из них приводятся сведения общего характера, необхо- димые для изложения последующего материала. Подробнее об этом сказано во вводных замечаниях к первой части. Вторая часть содержит основы курса теории вероятностей и мате- матической статистики. Идеи теории вероятностей развиты на базе по- нятия случайного эксперимента с использованием при этом теоретике множественного подхода. По мнению автора, это лучший способ ввести читателя в сущность предмета. Понятия и законы теории вероятностей служат основой математической статистики и широко применяются в исследовании операций. Они слишком важны, чтобы можно было ограничиться лишь поверхностным изложением,, как это принято в большинстве книг по элементарной статистике. В третьей части анализируются важные приложения теории ве- роятностей и рассматриваются модели очередей, основывающиеся на матричной трактовке конечных цепей Маркова. Дано также введение в разделы линейного программирования, сетевого планирования и уп- равления запасами. В конце многих глав приведены рекомендации по дальнейшему чтению, а общая библиография дана в конце книги. Д ТЁРНЕР
ЧАСТЬ НЕКОТОРЫЕ ПОНЯТИЯ ПЕРВАЯ СОВРЕМЕННОЙ МАТЕМАТИКИ ВВОДНЫЕ ЗАМЕЧАНИЯ Когда студенты начинают знакомиться с современной прикладной математикой, они сразу же сталкиваются с многими новыми понятиями, необходимыми для описания изучаемых ими ситуаций. Эти понятия, а также термины и величины, используемые при их определении, должны быть усвоены прежде, чем станет доступен для понимания весь процесс логического построения новой области исследований. К своему огорчению, студенты постоянно сталкиваются с тем, что используемые при таком построении математические идеи и опе- рации оказываются для них совершенно непривычными. В результа- те начальный период изучения становится трудным вдвойне. Средние школы мало-помалу изменяют математические программы, включая в них начала современной математики, и в дальнейшем это принесет известное облегчение, однако сейчас большинство студентов встреча- ются с ними впервые в университете или политехническом институте, поэтому все лекторы должны хорошо помнить, что теория множеств, к примеру, не может быть изучена за день. Пять глав первой части задуманы как введение (или же уточнение и закрепление того, что изучалось по новым программам в средней школе) к тем областям современной математики, которые особенно важ- ны при последующем изложении прикладной математики. В гл. 1.1 объяснены основные идеи и законы теории множеств, а предлагаемые упражнения помогут студенту овладеть символикой и правилами действий над множествами. В гл. 1.2 кратко рассказывается о свойствах оператора суммиро- вания. Этот математический символ используется при суммировании чисел, соответствующих элементам заданного множества. Он часто встречается в математической статистике, и по этой единственной причине следует внимательно изучить главу, проработав все примеры и упражнения. Едва ли лектор, читающий курс, найдет время для подробного обсуждения смысла и свойств этого оператора. К сожале- нию, он не имеет такой возможности, и это вполне оправданно — сту- дент должен самостоятельно овладеть необходимыми навыками. За те небольшие усилия, которые при этом потребуется приложить, он будет вознагражден с лихвой. В гл. 1.3 рассматриваются разделы теории матриц, связанны^ с их обращением и решением систем линейных уравнений. Матрицы используются затем в третьей части книги при изложении основ теории марковских цепей. 12
Гл. 1.4 посвящена неравенствам. Системы линейных неравенств, которым посвящен параграф 1.4.8, предназначены как введение к главе о линейном программировании, помещенной в третьей части. В гл. 1.5 дано введение к весьма привлекательному предмету, известному как теория графов. Большинство понятий этой теории лег- ки для усвоения, имеют многочисленные обобщения и приложения. Многие сложные системы, изучаемые специалистами по исследованию операций, описываются в виде сетей некоторого типа, и теория графов обеспечивает естественную топологию при изучении их основных структур. Автору кажется, что курс теории графов должен предшест- вовать (или даваться параллельно) всем курсам исследования опера- ций. Его важность в операционных исследованиях все возрастает.
1.1 ГЛАВА ТЕОРИЯ МНОЖЕСТВ А. ОСНОВНЫЕ ИДЕИ И ОПРЕДЕЛЕНИЯ 1.1.1. ОПИСАНИЕ МНОЖЕСТВА В математике понятие множества фундаментально, и элементар- ное знание теории множеств необходимо для понимания многих областей современной математики. Обычное употребление слова «множество» в словосочетаниях типа «множество стрелок» или «множество книг» слишком узко по срав- нению с математическим понятием множества. Множество есть простая совокупность различных объектов любого типа. Чтобы задать множе- ство, достаточно каким-либо образом описать или определить его эле- менты. Отдельный элемент часто называют членом или точкой мно- жества. Приведем несколько примеров множеств. Примеры (1) Буквы алфавита: а, Ь, с, г. (2) Первые пять нечетных чисел: 1, 3, 5, 7, 9. * (3) Люди, чей рост выше двух метров. Множество можно описать одним из следующих двух способов: 1) В виде списка или таблицы, все элементы множества непосред- . ственно перечисляются (см. примеры (1), (2)). 2) Указанием способа конструирования множества', задается опре- деленное правило, обычно выражаемое словами, математическими уравнениями, неравенствами, в соответствии с которым осуществляет- ся выбор элементов, образующих множество. Элементом множества из примера (3) будет любой человек, чей рост выше двух метров. Ясно, что рассмотрение такого множества небессмысленно, хотя практически невозможно одновременно измерить всех людей на земле и зарегистрировать каждого столь высокого человека. 1.1.2. ОБОЗНАЧЕНИЯ МНОЖЕСТВА Для обозначения множеств обычно используют прописные буквы А, В, X, Y и т. д., а элементы соответствующего множества заключают ., в фигурные скобки. 14
Примеры* (1) Запись А = {1, 2, 7, 8} означает, что множество А состоит из четырех элементов 1, 2, 7, 8. (2) Запись X = {х : х является человеком выше двух метров} означает, что множество X состоит из элементов х, таких, что х обо- значает человека, чей рост больше двух метров. Символ «:», исполь- зующийся в этом примере, заменяет слова «таких, что». (3) Запись Y = {у ' у означает, что Y — множество всех чисел, больших чем три. а) Принадлежность элемента множеству. Символ £ используется для обозначения принадлежности элемента множеству. Например, в множестве Y из примера (3) число 8 является элементом этого мно- жества, что кратко записывают 8 f У и читают: «число 8 принадлежит множеству У». Аналогично: 19 6 У, ЮЗ Е У ит. д. Отрицание принад- лежности к множеству обозначается символом (£. Так, выражение 2 (£ Y означает, что 2 не является элементом множества Y, и читается: «число 2 не принадлежит множеству У». Замечание. Важно четко различать элемент и содержащее его множество. В частности, ошибка может произойти, когда множество состоит лишь из одного элемента. Например, если множество А содержит только один элемент, А — {а}, нужно уяснить, что а£А, но {о} А. 1.1.3. КОНЕЧНЫЕ И БЕСКОНЕЧНЫЕ МНОЖЕСТВА Говорят, что множество конечно (имеет конечное число элементов), если его элементы могут быть пересчитаны (по крайней мере теорети- чески) и пересчитывание оканчивается определенным целым п. В противном случае множество имеет бесконечное число элементов и говорят, что оно бесконечно (см. примечание к слову «счетность» на с. 87). Примеры (1) F = {а, Ь, с, d}, F — конечное множество, имеющее четыре эле- мента. (2) Р = {х : х является книгой в Британском музее}. Хотя в Бри- танском музее много книг, без сомнения, Р является конечным мно- жеством. (3) R = {х : х есть натуральное число } = {1, 2, 3, ...}; R—бес- конечное множество. Упражнение 1.1.1 1. Укажите способ конструирования множества {а, е, i, о, и}. 2. Запишите в табличной форме множества (х : х является множителем числа 6}. 3. Если А = {3, 5, 8, 9}, то выразите символами: * Множество А из примера (1) записано в табличной форме; для множеств X и У из следующих двух примеров указан способ их конструирования. — Примеч. ред. 15
(a) 8 принадлежит множеству А; (б) 4 не принадлежит множеству А. 4. Установите, какие из следующих множеств конечны, а какие бесконечны: (а) А = {х, у, р, q, 5, 7}; (б) {х : х является песчинкой в Европе}; (в) С = {х : х кратно 3}; (г) D = {х : х является числом между 0 и 1}. 1.1.4. ПОДМНОЖЕСТВА: ОТНОШЕНИЕ ВКЛЮЧЕНИЯ Подмножество множества А есть множество, содержащее некото- рые (а возможно, и все) элементы множества А. Само множество А будет своим подмножеством. Чтобы выразить тот факт, что В — под- множество А, пользуются обозначением В сг А, которое называют отношением включения1. Его следует читать: «В содержится в А». Заметим, что если х — элемент множества В, а множество В со- держится в множестве А, то, очевидно, что х будет элементом множест- ва Л. В сокращенной записи это утверждение записывается так: «если В сА и х Е В, то х Е А». Примеры (1) Множество В = {а, е, i, о, и} есть подмножество множества букв латинского алфавита А ~ {а, Ь, с, d, .... г}. (2) Множество планет {Земля, Марс} представляет собой подмно- жество множества всех планет Солнечной системы. (3) Множество чисел {4 , 8, 26, 102} является подмножеством мно- жества всех четных чисел. Бесконечное множество непременно содержит бесконечное под- множество. Например, множество всех четных чисел бесконечно; оно содержит в качестве подмножества множество всех чисел, кратных 4, которое также бесконечно. Отрицание включения обозначают символом ф. Сравните его с сим- волом (£, предназначенным для отрицания принадлежности элемента множеству (см. 1.2.2). Таким образом, ВфА означает, что В не яв- ляется подмножеством множества А. Вполне возможно, что несколько точек множества В, но не все, принадлежат одновременно и множест- ву Л. В этом случае множество В не будет подмножеством множе- ства Л. Чтобы оно стало подмножеством, Л должно содержать все точки множества В. По определению, включение Л с А справедливо для всех множеств Л. Если В cz Л и множество Л содержит точки, не принадлежащие В, то говорят, что множество В есть собственное подмножество мно- жества Л. 1.1.5. НЕПЕРЕСЕКАЮЩИЕСЯ МНОЖЕСТВА Два множества называются непересекающимися, если они не имеют общих элементов. , 1 Некоторые авторы это отношение обозначают символом G. Они сохраняют символ с для указания «строгого включения»; множество В строго включено в А, если оно состоит из некоторых (но не всех) элементов множества Л. I 16
Примеры (1) Множества {1, 3, 5, 7, 9} и {2, 4, 6, 8} непересекающиеся. (2) Множество гласных и множество согласных букв не пересе- каются . 1.1.6. ПУСТОЕ МНОЖЕСТВО Удобно ввести специальный символ для множества, не имеющего элементов. Такое множество называется пустым множеством и будет обозначаться символом 0. Иногда его называют нулевым множеством. Примеры (1) {х : х является женатым холостяком). (2) {х : х есть действительное число, квадрат которого равен —1}. (3) {х : х — ящерица, живущая на Луне). Сразу видно, что в каждом из этих множеств нет ни одного элемен- та и к каждому применимы термин «пустое множество» и обозна- чение 0. Важно различать множества 0, {0}, {0}. Второе и третье мно- жества не пустые, каждое из них содержит по одному элементу. Второе служит примером множества, элементы которого представляют собой также множества (см. 1.1.8). Замечание. Пустое множество будет подмножеством всякого множества, т. е. 0 с X для любого множества X. Эта мысль, воз- можно, несколько трудна для усвоения, однако ясно, что все элементы пустого множества будут также и элементами множества X, поскольку множество 0 вообще не имеет элементов. 1.1.7. РАВЕНСТВО МНОЖЕСТВ Если два множества имеют в точности одни и те же элементы (т. е. если каждый элемент одного множества есть также элемент другого множества и обратно), то говорят, что эти два множества равны между собой. Замечание. Если множества А и В равны, пишут А = В. Если же множества А и В не равны друг другу, то пишут А В. а) Условия равенства множеств. Ясно, что если оба утверждения Лс~В и В<^А справедливы, то А — В. Это следует из определений отношений равенства и включения. Примеры (1) {1, 2, 3, 4} = {4, 3, 2, 1). Следует обратить внимание, что мно- жество не изменится при изменении порядка его элементов. (2) {1, 2, 3, 4} = {1, 1, 2, 2, 4, 4, 4, 3). Оба множества содержат лишь четыре различных элемента, а именно 1, 2, 3, 4. На практике никогда не следует записывать это множество так, как записано справа. Повторяющиеся элементы, если они даже беспрестанно встречаются, не играют роли в операциях над множествами, и потому нет необходи- мости их записывать. (3) {д, а, с) = {х : х — буква в слове «сад»}. 17
Упражнение 1.1.2 1. Даны множества: А — {1, 3, 5, 7}; В = {3, 5}; Е = {2}; Е) — {5, 7, 9}. Укажите среди следующих утверждений истинные и ложные: (а) В С А; (б) Е CZ В; (в) В с= D; (г) D с= А; (д) В £ А; (е) 0 £ В\ (ж) 0CB; (з) 0 £ £>; (и) Е (Д В; (к) множество А конечно; (л) D не является подмножеством множества А. 2. Среди следующих множеств укажите пары непересекающихся множеств: А = {х, у, г}; В = {1, 2, 4, t/}; С — {а, Ь, с, 2); D = {1, х, а}; Е = 0; F = {2, 3, Ь, с}. 3. Выбрать пустые множества: X = {х : х есть решение уравнения х2 — 0}; У = {у : у является замужней старой девой); Z = {0}; 1У = {х : х является человеком, чей возраст превосходит 200 лет). 4. Среди следующих множеств укажите равные: А = {1, 2, а, 6}; В = {1, 0, 2, а, &}; С = {Ь, Ь, 2, 1, a, a); D — {1, 2, 3, а, 6). 1.1.8. КЛАССЫ МНОЖЕСТВ Нам уже встречались множества, элементами которых были также множества (см. пример (3) в 1.1.6). Примером может служить и мно- жество всех возможных подмножеств данного множества. В таких слу- чаях, чтобы избежать неуклюжих выражений типа «множество мно- жеств», обычно говорят класс множеств или иногда семейство множеств. Слова «класс» и «семейство» следует воспринимать как синонимы сло- ва «множество». Все определения, относящиеся к множествам, точно так же применяются к классам1 и семействам. Пример. Множество .А = {{1, 2, 3), {9, 10}, {3, 4}} представ- ляет собой класс множеств. Каждый из его элементов есть множество. Будет ли множество 0 элементом этого класса? Ответ. Нет* *. 1.1.9. ДИАГРАММА ВЕННА Простой и очень полезный способ изображения множеств — это рисунки, известные как диаграммы Венна (по имени английского фи- лософа Джона Венна, 1834 — 1883). Конечное множество может быть представлено как совокупность точек, отмеченных на бумаге и окруженных подходящей фигурой типа круга, квадрата или треугольника. Расположение точек внутри фи- гуры несущественно. Обычно не указывают все точки внутри фигур, так как наибольшую информацию о соотношениях между множествами дает расположение границ. В случае бесконечного множества может быть нарисована только граница фигуры; часть плоскости внутри нее будет изображением множества. 1 Для описания кл ассов множеств общепринято пользоваться рукописными . прописными буквами, такими, как Ji, Si, SB и т. д. * Полезно обратить внимание, что хотя 0 с Ji, тем не менее 06 Ji (см. замечание в 1.1.6). — Примеч. ред. 18
Примеры (1) Включение. Рассмотрим множества Р = {a, b, с, d, е, /} и Q = {с, f}. Множество Р изобразим шестью точками внутри треуголь- ника, a Q — двумя точками внутри круга. Тот факт, что множества Q и Р связаны соотношением QczP, будем иллюстрировать следующим образом: точки с и f используются только один раз, круг содержит только эти две точки и лежит внутри треугольника (рис. 1). Рис. 2. Диаграмма Венна: непересе- кающиеся множества Рис. 1. Диаграмма Венна: вклю- чение QczP (2) Непересекаемость. Напомним, что два множества не пересека- ются, если они не имеют общих элементов. Это наглядно изображается диаграммой, на которой соответствующие множествам фигуры не пе- рекрываются. Например, если S = {х, 1, 2} и Т — {3, у, 4, 5}, то с по- мощью круга для S и квадрата для Т получаем диаграмму, изображен- ную на рис. 2. Рис 3. Диаграмма Венна: пе- ресекающиеся множества (3) Пересекающиеся множества. Рассмотрим множества А = = {1, 2, 3, 4}, В — {3, 4, 5, 6}. Изображая А квадратом, а В — кру- гом, получим две частично перекрывающиеся фигуры. Общая часть этих фигур будет содержать точки 3, 4, принадлежащие множествам А и В одновременно (рис. 3). (4) Соотношения между тремя множествами. Рассмотрим множе- ства А — {1, 2, 3, 4, 5}, В = {1, 2} и С = {2, х, у}. Изобразив А квад- ратом, В — треугольником, С — кругом, с помощью диаграммы Вен- на (рис. 4) можно отразить различные соотношения между ними. а) Соотношения между несколькими множествами. Ясно, как можно распространить применение диаграмм для иллюстрации соотношений между несколькими (более чем тремя) множествами. Часто границы фигур обозначают разными цветами или затеняют различные части диаграммы штриховкой в разных направлениях. 19
б) Число элементов множества. Элементы конечного множества можно сосчитать. Число N элементов множества X будет обозначаться N (X). Так, в примере (4) из 1.1.9 получаем JV (Л) = 5, N (В) = 2 и N (С) = 3. Иногда, когда это не приводит к двусмысленности, этими числами помечаются фигуры (круг, квадрат, треугольник и т. д.) на диаграмме. Упражнение 1.1.3 (смешанные задачи) 1. Дано множество А = {1, {2, 3}, 4}. Можно ли описать множество А как класс? Справедливы или ложны следующие утверждения: (1) {2, 3} Q А; (2) {{2, 3}} <= А; (3) {2, 3} <= А; (4) 3 $ А; (5) 0 С А; (6) 0 Ф А; (7) 4 £ А? 2. Запишите множества в табличной форме: (1) (х : х2 — 4 = 0, х — 2 = 0}; (2) {х : х является буквой слова «отсутствующий»); (3) (х : х является одной из цифр семизначного числа 3064505); (4) {х : х есть нечетное число, меньшее 7). 3. Запишите множества, указывая способ их конструирования: (1) {2, 4, 6, 8, 10}, (2) {м, и, с, п}; (3) {1, 3, 5, 7,...}; (4) {красный, оранжевый, желтый, зеленый, синий, индиго, фиолетовый}. 4. Установите, конечны или бесконечны следующие множества: (1) множество слов в английском языке; (2) множество слов во всех живых языках; (3) множество всех комбинаций букв алфавита; (4) множество точек на отрезке; (5) множество прямых, проходящих через точку (1,1); (6) множество всех атомов во Вселенной; (7) множество решений уравнения sin х = 0; (8) множество всех прямоугольных треугольников; (9) множество травинок на крикетном поле. 5. Постройте диаграммы Венна для изображения следующих множеств: (1) А = {5, 6, 8, 2, 4}; В = {1, 2, 3, 4, 5}; (2) Р = {х, у, 5, 6}; Q = {у, 5, 6}; R = {5, 6, 7}; (3) X = {х : х есть гласная буква}; Y = {у ". у является буквой слова «голос»}; Z = {г : г является буквой алфавита}. (4) Из 12 студентов 8 носят очки, 5 студентов курят, а 3 студента курят и носят очки. 6. В каждой из следующих задач укажите равные между собой множества: (1) {а, Ь, с}, {а, а, Ь, с, с, с}, {с, Ь, а, 6}, {Ь, а}; (2) совокупность букв п, s, i, {х : х является буквой слова «sin»}; {у : у является буквой слова «innings», кроме буквы g}, буквы, составляющие слово «inns»; (3) 0, {0}, {0}. 7. Какие из множеств 0, {0}, {0} могут быть описаны как класс множеств? 8. Выпишите все подмножества каждого из следующих множеств: (1) {х : х является гласной буквой}; (2) {у : у есть четное число между 1 и 7}; (3) {г : г2 = 9}. 9. Перепишите следующие утверждения, используя операции над мно- жествами: 20
(1) S есть подмножество S; (2) х принадлежит множеству Р; (3) множество Y не является подмножеством множества X; (4) множество S — подмножество множества Т; (5) z не принадлежит множеству Z; (6) X является подмножеством множества St). 10. Нарисуйте диаграмму Венна для иллюстрации отношений между сле- дующими множествами: А = {0, 1, 2, 3, 4, 5}; В = {2, 3, 4, 5, 6, 7, 8}; С = {2, 3, 4, 5, 6}; D — {3, 4}. Завершите формулировку следующих утверждений, вставляя вместо точек правильные символы (<z, £ и т. д.): (1) 3 ...А; (2) 2 ... £>; (3) С ... D; (4) С ... В; 0 ... D. Какие из множеств А, В, С, D могут равняться множеству X, если известно, что: (1) X и D не пересекаются; (2) X с С и X =£ С; (3) X С {у : у > 1). Выпишите класс всех подмножеств множества точек, принадлежащих В, но не принадлежащих ни А, ни С, ни D. Б. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ: ОСНОВНЫЕ ЗАКОНЫ 1.1.10. УНИВЕРСАЛЬНОЕ МНОЖЕСТВО Обычно в приложениях теории множеств ограничиваются рассмот- рением элементов одного типа. Например, в геометрии интересуются множествами точек, но не занимаются множествами бананов или людей. Множество всех объектов, относящихся к отдельной прикладной зада- че, называется универсальным множеством, или областью исследова- ния. (В теории вероятностей и статистике оно называется множеством исходов, или выборочным пространством.) Универсальное множество мы будем обозначать символом S. Примеры (1) В эксперименте с бросанием кости областью исследования будет множество S = {1, 2, 3, 4, 5, 6}. Оно представляет собой совокуп- ность возможных исходов и универсально для этого эксперимента. (2) Рассматривая всевозможные футбольные команды, мы в качестве универсального множества должны принять множество всех футбо- листов; из этого множества мы можем как угодно выбирать подмно- жества. (3) В геометрии на плоскости (планиметрии) универсальное множе- ство представляет собой множество всех точек плоскости. 1.1.11. ДОПОЛНЕНИЕ МНОЖЕСТВА Рассматривая универсальное множество S и его подмножество А, мы, вообще говоря, можем найти элементы из S, которые не принадле- жат множеству А. Определение. Совокупность элементов, принадлежащих универсальному множеству S, но не принадлежащих подмножеству А, 21
называется дополнением множества А. Мы обозначим его через А' («Л штрих»). Таким образом, Л' = {х :х f S, х (£ Л }. Заметим, что Л и Л' — непересекающиеся множества и оба пред- ставляют собой подмножества множества S. Примеры Пусть S — множество, составленное из первых семи букв англий- ского алфавита, т. е. S = {a, b, с, d, е, f, g}. Тогда, если Л = {а, Ь, с, d}, то дополнением Л будет множество А’ = {е, f, g}. С помощью диаграммы Венна мы можем представить область иссле- дования рассмотренного примера прямоугольником, включающим в себя все элементы и подмножества (рис. 5). Рис. 5. Дополнение множества А Замечание. Из определения дополнения множества следует что дополнение дополнения множества Л есть множество Л, т. е. (ЛТ = Л. Упражнение 1.1.4 1. Пусть S = {1, 2, 3, 4, 5, 6}, А = {1, 3, 5}, В = {2, 4, 6}, С = {1}, D = {4, 5). Покажите, что: (1 ) А' = {2, 4, 6} = В; (2) В' = А; (3) С = {2, 3, 4, 5, 6}; (4) D' = {1, 2, 3, 6}; (5) (£>')' = {4, 5} = £>; (6) (С')' = {1} = С; (7) £' = {—} = 0. Нарисуйте диаграммы Венна, чтобы проиллюстрировать каждую из этих операции дополнения. 2. Если S есть множество всех целых положительных чисел, то каково до- полнение множества О = (1, 3, 5..)? 3. Покажите, что для любого универсального множества S S'= 0 и 0'=S. 1.1.12. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ Давайте остановимся ненадолго на понятиях суммы, разности-и про- изведения, столь фундаментальных в обычной алгебре. Мы можем взять любые два числа а и b и образовать из них новые числа посредством операций суммирования, вычитания и умножения. Так: «£+ Ь,‘ а — Ь, а b 22
есть три числа, которые, вообще говоря, отличны от а и Ь. Знаки «Ц-», «—» и «-» символизируют три бинарные операции для комбинирования чисел и алгебраических выражений. (Замечание. Слово «бинарный» относится к комбинации двух чисел при выполнении некоторой операции.) Множества также могут быть скомбинированы различными спосо- бами. Имеются три основные бинарные операции над множествами, а именно операции объединения, разности и пересечения-, их мы и опре- делим. К сожалению, символы для этих операций полностью не стандар- тизованы. Операции над множествами мы будем обозначать следую- щим образом: (J (объединение), — (разность) и f) (пересечение). Таким образом, если А и В есть два множества из одной и той же об- ласти исследования, то A (J В, А — В, A (~| В обозначают резуль- таты операций объединения, разности и пересечения над множествами А и В соответственно. Сейчас эти три операции будут точно определены. а) Объединение (Л IJ В). Объединением двух множеств А и В на- зывается множество всех элементов, принадлежащих или множест- ву А, или множеству В (или обоим сразу). Таким образом, Л U В — {х : х £ А или х С В}. Примеры (1) А = {барабан, кукла, солдат}; В = {яхта, барабан, книга, пугало}. Объединением множеств А и В будет множество A U В = {ба- рабан, кукла, солдат, яхта, книга, пугало}. (Заметьте, что «барабан» записывается только однажды, хотя он встречается как в А, так и в В.) (2) А = {1, 2, 3, 4,}; В = {3, 4, 5, 6}; A U В = {1, 2, 3, 4, 5, 6} (3, 4 записываются только один раз). Диаграмма Венна, иллюстрирующая пример (2), изображена на рис. 6. Замечание. Перечислим следствия из определения объеди- нения множеств: 1) А 2) А А = Л; S = S; U и 3) A U 0 = Л; 4) Л U А' = S; 5) A U В = В U А. Упражнение 1.1.5 1. Найдите объединение множеств А и В в следующих случаях (рекомен- дуем нарисовать диаграмму): (1) А = {собака, кошка}, (2) А = {1, 2}, (3) А = {5, 10, 15}, (4) А = {х : 0 < х < 1}, (5) А ~ {х : 0 < х t 1}, В = {корова, собака, коза}; В = {6, 7, 8}; В = {10, 11, 12, 13, 14, 15}; В = {х : 1/2 < х < 3/2}; В = {х : 1/2 < х < 1}; 23
(6) рассмотрим группу студентов: А — множество студентов, умеющих пла- вать, В — множество студентов, не умеющих плавать. 2. Пусть S = {1, 2, 3, 4, 5, 6} и А ~ {1, 2}. Найдите А'. Покажите, что A U А' = S. 3. Пусть А = {1, 2, 3, 4} и В = {1, 3}. Найдите A (J В. 4. Пусть S = {х : — 1 х 1}, Т = {х : 0 < х < 1}. Найдите S U Т. 5. Рассмотрите результаты задач 3 и 4. Чему будет равно A (J S, если Рис. 6. Объединение множеств А и В Рис. 7. Разность множеств А и В б) Разность (4 — В)1. Разностью двух множеств А и В будет множество всех таких элементов множества А, каждый из которых не принадлежит множеству В. Таким образом: А — В = {х : х £А , X В}. Читать лгу запись будем так: «Л минус В». Примеры (1) Пусть А = {а, Ь, с, d}, В = {с, d, е, f}. Тогда А — В = {а, Ь} (рис. 7). (2) Пусть А = {х : 3 С х 6}, В = {х : О С х -С 4}. Тогда А — В = {х : 4 < х С 6} (рис. 8). С в □ С я □ ------------------------ ------------tfHtfHtfHHHfHiimmtHHf -7 О 7 2 3 4 5 6 7 ( я-в □ Рис. 8 Замечание. Из определения разности следует: (1) А - А = 0; (2) S - А = А'. 1 Некоторые авторы обозначают разность множеств А и В через А \ В (иногда А / В или А ~ В). 24
Упражнение 1.1.6 1. Для каждого из примеров (1) — (6) задачи 1 из упражнения 1.1.5 найдите разности Л — В. 2. Пусть А = {1, 2, 3} и В = {4, 5, 6}. Найдите А — В. В общем случае если А и В не имеют общих элементов, то каково будет мно- жество А — В? 3. Верно ли, что А — В = В — А? Если вы считаете, что в общем случае это неверно, то можете ли вы указать частный пример, когда это утверждение все-таки верно? Или же это утверждение всегда ложно? 4. Для любого множества А что представляет собой А -— А'? 5. Если А С В, то каково А — В? (Нарисуйте диаграмму.) и) Пересечение (4 Я В). Пересечением двух множеств А и В бу- дет множество всех элементов, принадлежащих и множеству А и мно- жеству В. Таким образом: А (] В = {х : х Е А и х Е В}. Примеры (1) Если А — {а, е, I, о, и}, В = {е, t, о}, то A f] В — {<?, о} рис. 9). Рис. 9. Пересечение множеств А н В (2) Пусть А = {х : 0 < х С 5}; В = {х : — 1 < х < 2}. Тогда A f| В — {х : 0 < х < 2} (рис. 10). С в ) ( л 3 ---------HHIHHHHIIHHMHHH------------------------— -7 0 7 23 45 Ь ( АП В ') Рис. 10 (3) На плоскости заданы два множества: А — единичный квадрат с центром в точке (0,0), В—единичный квадрат с центром в точке (1у/2> ^г)- Тогда множество А f) В есть квадрат со стороной 1/2, как показано на диаграмме Венна, изображенной на рис. 11. 25
Рис. 11. Пересечение множеств А и В Замечание. Из определения пересечения следует: 1) А П А ---- А; 3) A f] S -= А; 2) А П 0 = 0; 4) А П А' = 0; 5) А П В = В П А. Упражнение 1.1.7 I- 1. Для каждого из примеров (1) — (6) задачи 1 из упражнения 1.1.5 найдите пересечение множеств Лий. i 2. Заштрихуйте площади, изображающие множество Л р В на каждой из диаграмм Венна, изображенных на рис. 12, а, б, в, г, д. Рис. 12 3. С помощью диаграммы Венна на рис. 12, в покажите, что если Л ZD В, то Л П В = В. 4. Если Л сг В, то каково Л Р й? 5. Пусть Л = {0, 2, 3, 4,5}; В = {1, 3, 5, 7}; С = {0, 2, 4, G}. Выпишите множества: (1) Л П й; (2) В П С; (3) С Р А; (4) С р й; (5) Л П (В П С); (6) (Л П В) р С (сравните с (5)). Упражнение 1.1.8 1. Дано универсальное множество S = {а, b, с, d, е, f, /} и его подмноже- ства Р = {а, Ъ, с, d}, Q = {а, е}, R = {6, d, е, /}. Выпишите элементы, образу- . ющие следующие множества. В тех случаях, когда результат будет одинаковым,'; 26
посмотрите, нельзя ли вывести общий закон, обеспечивающий соответствующее равенство: (1) Р Г) (Q и R)> (3) р U (Q А R); (2) (p П Q) U (P П R); (4) (P U Q) П (p U R); (5) (Р A Q) U R- (7) (р и Q) П R; (6) (P U R) П (Q U R); (3) (P A R) U (Q A R); (9) SDP- (io) sn(PUR); (П) sn(PUQ); (13) з и (Q A R); (15) (Q U R) U 8; (17) (QUR)U0; (19) QU (PAR); (21) р n (Р U 0); (23) R и (Р Л R); (25) R и (R А 0); (27) (0UR) Л [(SUP)O(QUR)1; (29)(rnQ)'; (31) R'UQ'; (33)P'f]Q'; (35) (P U Q)-(PUR); (12) (8 n P) U (s A Q); (14) (8 и Q) A (S U R); (16) (P U S) и R; (18) Q U (R U 0); (20) (Q U P) A (Q U R); (22) p и (P A Q); (24) 8 П (R U 8); (26) Q A (P U 0); (28) p' и Q'; (30) (RnQ)'; (32) (PUQ)'; (34) p и (Q-R); (36)[(PUQ) UR]'; (37) (P—Q)—R; (39) (P—Q) U (Q-P); (38) (P-R)-(Q_R); (40) (PUQ)-(PAQ)- 2. Выполните задание 1 для 8 = {1,2, 3, 4, 5, 6), Р = {1,2, 3}, Q= {1,3,5}, R = {2, 4, 6}. 3. Выполните задание 1 для 8 = {х : 0 х ; 10}, Р = {х : I < х < 6}, Q = {х : 4 < х J 10}, R = {х : 0 х < 1}. 1.1.13. КЛАССЫ ПОДМНОЖЕСТВ (МОЩНОСТЬ МНОЖЕСТВА; РАЗБИЕНИЕ) В 1.1.8 введено понятие класса, или семейства, множеств. Определим два типа классов, которые играют важную роль в тео- рии множеств, а именно множество подмножеств и разбиение. (а) Множеством подмножеств называется класс всех подмножеств множества 8. Его часто обозначают З5 (8): (8) = {X : X cz 8}, Примеры (1) 8 = {0, 1, 2}. SP (3) = {0, {0}, {1}, {2}, {0, 1}, {0,2}, {1, 2}, {0, 1, 2}}. (2) 8 = {Ь, а, /}. & (3} = {0, {&}, {а}, {/}, {Ь, а}, {Ь, /}, {а, /}, {Ь, а, /}}. 27
(б). Разбиения. Рассмотрим Множество S и = {С\, С2, .... С\} — класс непустых подмножеств 5, обладающих следующими свойст- вами: 1. Для любых двух подмножеств Ct, Cj из класса 4S либо С, = Q, либо Ci П Cj = 0. (Это означает, что <ё — класс непсресекающихся множеств.) 2. Объединение всех подмножеств равно S, т. е. G и С2 U - U Ck = S. Тогда называется разбиением множества S. Примеры (1) S = {0, 1, 2, 3}. Подмножества: Сг = {0}, С2 = {1}, С3 — {2, 3}. Класс = = {Ci, С2, С3} есть разбиение S, так как каждое Сг непусто, каждые два множества С,-, Cj не пересекаются и Ci и С2 и С3 — S. (2) S = {а, Ь, с, d, е, f}. Подмножества: Сг = {а, е}, С2 = {b, с, d, /}. Класс ’ё = {G, С2} есть разбиение множества S, так как каждое Ct непусто, 1 Ci П С2 = 0 и С^ U С2 = S. Упражнение 1.1.9 1. Найдите (S) множества S={a} (вспомните, что 0 представляет собой подмножество каждого множества). 2. Найдите (S) множества S = {а, b}. 3. Найдите SB (S) множества S — {а, Ь, с}. 4. Сколько подмножеств имеет множество S = {а, b, с, <:/}? 5. Покажите, что конечное множество, состоящее из п элементов, имеет мно- жество подмножеств, состоящее из 2П элементов. 6. Покажите, что = {Сь С2, С3}, где Cj = {1, 3}, С2 = {4, 6}, С3 = {2,5}, есть разбиение множества S = {1, 2, 3, 4, 5, 6}. 7. Пусть S = (р, q, г, s, t, и). Укажите среди следующих классов подмно- жества такие, которые составляют разбиение: (1) Pi = {р, s, /}, = {<7. г}, Д3 = {б «}}: (2) {Si = {р}, В2 = {?}. В3 = {г, и}, В, = {s, /}}; (3) {Cj = {р, q, /}, с2 = с;}; (4) { {г, S, /}, {р, q}, {«}, 0}; (5) {{р, q, г, s, t, и}}. 8. Покажите, что если А есть любое непустое собственное подмножество множества S, то класс '2? = {Л, А'} составляет разбиение множества S. . 9. Пусть S — множество натуральных чисел {1, 2, 3, ...}. Покажите, что класс {CJt С2, С3}, где Сх = {х : х = Зп, п = 1, 2, 3, ...}, С2 — {х х = 3 п — 1, п = 1, 2, 3, ...} и С3 ~ {х : х= 3 п — 2, п=1, 2, 3, ...}, составляет разбиение множества S. 10. Найдите все возможные разбиения множества S = {0, 1,2, 3} (их всего пятнадцать). 28
1.1.14. ОСНОВНЫЕ ЗАКОНЫ АЛГЕБРЫ МНОЖЕСТВ Приведем сводку основных свойств операций над множествами (законы алгебры множеств); S обозначает универсальное множество; А, В, С — любые подмножества множества S. Основные законы алгебры множеств 1. Идемпотентные законы A (J А = А ЛрЛ = Л 2. Законы тождества ли0=л 71l)S = S Лр8 = Л Лр0=0 3. Законы дополнения ЛиЛ' = 5 (А')' = А ЛПЛ' = 0 8' = 0 и 0' = S 4. Законы коммутативности лив=В1М лрв=врл 5. Законы ассоциативности (Zue)UC=^U(BUC) (ЛрВ)р С = Лр (ВрС) 6. Законы дистрибутивности _ ЛЦ (ВрС) = (Лрй)Р (ЛИС) Лр (В11С) = (ЛрВ) и (ЛрС) 7. Законы де Моргана (ЛиВ)' = Л'Пв' (ЛрВ)' = Л'иЯ' Если читатель полностью выполнил упражнение 1.1.8, то он сам мог убедиться в верности этих свойств. Очень важно понять их и уметь свободно пользоваться. Успех в этом достигается долгой прак- тикой. Упражнения, помещенные в конце главы (см. упражнение 1.1.13 на с. 33), дадут читателю возможность приобрести необходимый опыт. Прежде чем перейти к доказательству законов алгебры мно- жеств, проиллюстрируем последние два из них на отдельном примере. Пример Универсальное множество: <S = {a, b, с, d, е, f, g}. Его подмножества: А = {a, b, с, d}, В = {с, d, е, f}, Cj= {b, с, f, g}. (1) Законы дистрибутивности для операций объединения и пере- сечения. (a) A U (В Г) С) = (Л U В) П И U С). Это равенство непосредственно проверяется в результате последо- вательного формирования множеств, стоящих в левой и правой части. Л. Ч. (левая часть равенства) П. Ч. (правая часть равенства) Л врс ли (В.РС) лр£ лис (AUC) {а, Ь, с, d) {с. 0 {а, Ь, с, d, f} {а,6,с, d.e.f} {a,b,c,d,f,g} {a, b, c, d, f} А 1 t л. ч.=п. ч. 29
Рис. 13. Иллюстрация с помощью диа- граммы Венна Соответствующая диаграмма Венна изображена на рис. 13. (б) А П (В и С) = (А р В) и И A Q. Равенство иллюстрируют таблицы: Л. Ч. А вис ЛП (BUC) {а, Ь, с, d) {b,c,d,e,f,g} {Ь, с, d} П. Ч. лрв ЛПС (ЛПВ)и(ЛПС) {c,d} {ь, с} {b, с, d) Л. ч.=п. ч. Соответствующая диаграмма Венна изображена на рис. 14. Рис. 14. Иллюстрация с помощью диаграм- мы Венна (2) Законы де Моргана. (а) (Л U В)' = А' Л В'. 30
Равенство правой и левой частей иллюстрируют таблицы: Л. ч. п. ч. 71UB (ЛОВ)' [а, Ь, с, d, е, Д (4 А' В' Л'ЛВ' {«, f, g} {a, b, g} U} л. ч. = п. ч. (б) (Л п ву = Л' U в'. Равенство правой и левой частей иллюстрируют таблицы: Л. Ч. П. Ч. лрв (ЛИВ)' {a, b, е, f, g) А' В' A'UB' {е, f, g} {о. b, g} {“> b, е, f, g} л. ч. = п. ч. Упражнение 1.1.10 Продемонстрируйте справедливость всех основных законов алгебры мно- жеств на примере S = {1, 2, 3, 4, 5, 6, 7}, А = {1, 2, 3, 4}, В = {3, 4, 5, 6}, С — {2, 3, 6, 7}, действуя указанным способом. Чтобы проиллюстрировать каж- дый закон, нарисуйте диаграммы Венна. 1.1.15. ДОКАЗАТЕЛЬСТВО МЕТОДОМ СРАВНЕНИЯ ЭЛЕМЕНТОВ Приведенные иллюстративные примеры не доказывают законов алгебры множеств. Они только показывают их справедливость в каж- дом отдельном случае. Эти законы могут быть доказаны в общем слу- чае с помощью метода сравнения элементов. Проиллюстрируем применение этого метода на втором законе де Моргана. Закон: (Л Л В)’ = Л' (J В'. Доказательство. Равенство любых двух множеств Р и Q следует из одновременного выполнения соотношений Р с. Q и Q с Р (см. 1.1.7). Поэтому закон де Моргана будет установлен, если доказать, что (л п ву <= Л' U В'-, Л' U В' <= (Л л ву. (1) (2) 31
Для доказательства соотношения (1) рассмотрим произвольный элемент х, принадлежащий множеству (Л f| В)', расположенному слева, и покажем, что в этом случае он должен принадлежать и мно- жеству A' U В'. Итак, предположим, что х Е (А f| В)’. Тогда х $ (А П В). Это значит, что либо х & А, либо х £ В, т. е. либо х Е А', либо х Е В'. Следовательно, х Е A' J В'. Это справедливо для всех элементов из (A Q В)', а потому (А П В)’ с A' U В', и тем самым установлено соотношение (1). Рассмотрим теперь произвольный элемент х из множества A' J В'. Тогда либо х Е А', либо х Е В'. Это означает, что либо х А, либо х В, т. е. х не принадлежит как множеству А, так и множеству В, поэтому х (£ (А П В). Следовательно, х Е (А f) В)'. Это справедливо для всех элементов из множества A' J В', а потому A' U В' с (А П В)', и тем самым установлено соотношение (2). Доказательство второго закона де Моргана полностью завершено. Упражнение 1.1.11 Примените рассмотренный метод для доказательства следующих теорем: 1. (А')' = А. (Если х£(А')’, то х Е А', поэтому х Е А. Следовательно, (А')' с А. Если х А, то х Е А', поэтому х Е (А')'. Следовательно, А с: (А')'.) 2. А (1 S = А. (Если х Е АП5, то х Е А (и х Е S). Следовательно, A f)ScA. Если х Е А, то х Е А П S (х Е S, так как S — универсальное множество). Следо- вательно, А с А П S.) 3. А П 0 = 0. 4. (А — В) П А = (А — В). 5. А — В = А П В'. 6. В — А = А' () В. 7. (А — В) П В= 0. 8. A U (А П В) = А. 9. Приведите доказательства всех теорем из таблицы основных законов. 1.1.16. ПРИНЦИП ДВОЙСТВЕННОСТИ Символы U и f| и символы S и 0 называются двойственными друг другу. Если в некоторое выражение (или равенство), записанное для множеств, входят только операции объединения, пересечения и допол- нения, то, заменив каждый из символов (J , f|, S и 0 на двойственный ему, получим выражение (или равенство),1двойственное первоначаль- ному. Предлагаем читателю обратиться к таблице основных законов, в которой двойственный каждому из них появляется как другой основ- ной закон (он приводится на той же строке). 32
Примеры (1) Законы тождества: A U 0 = А; А П 5 = Л, (2) Законы коммутативности: A U В = В (J А; А Г) В = В П А. (3) Законыде Моргана: (Л J В)' = A' f] В'; (Л П В)' =А' U В'. (4) Закон дополнительности: (Л')' = Л; (Л')' = Л — равенства, по изменяющиеся при подобной замене, называются двойственными С( бе. Мы можем теперь установить очень важный принцип. Принцип двойственности. Если Т — какая-либо теорема о мно- жествах, выраженная в терминах (J , ,' и выведенная из указанных основных законов, то утверждение, двойственное Т, также будет тео- ремой, выводимой из этих законов. В самом деле, если Т доказывается определенной последова- тельностью шагов, то доказательство утверждения, двойственного Т, состоит из последовательности двойственных шагов. Пример Теорема (Л Г) В')'U В=Л'U-6- Доказательство (Л ПВ')Ч)В =(Л'ив)ив = л'и (в и в) = л'ив Двойственная теорема (лив')'пв = л'пв. Доказательство (двойственные шаги) (Л U В')' Г) В = (Л' f) В) П В (закон де Моргана) = Л' П (В Г) В) (закон ас- социатив- ности) = Л'[~|В (закон идемпо- тентности) Когда принцип двойственности применяется к математическим структурам, то он приводит к плодотворному обмену идеями между двойственными системами. Любая теорема, доказанная в одной системе, немедленно вызывает другую теорему (с полным доказательством) в двойственной. Если математическая структура представляет собой модель некоторой реальной (т. е. физической) системы, то двойствен- ные теоремы, полученные таким образом, могут привести к весьма не- ожиданным дополнительным соотношениям между физическими пере- менными. Упражнение 1.1.12 1. Для каждого из следующих выражений выпишите двойственное ему: (1) (Л П В)' П S; (2) (A’ U0)lWUS); (3) (Sn PY U (Q П В); (4) (ЛПВ) и(СП0)и(5ПЛГ)В); (5) S и [(Д л В') Л 012 (6) (Д Л С) и В и S- 2 Зак. 973 33
2. Докажите приведенные тождества, затем выпишите двойственные тож- дества и докажите их: (1) PU(P'nQ)=PUQ; (2) (Р U S) Л (Р Л 0)=0; (3) РЛ(Р UQ)=P; (4) (Р П Q) U (Q П Р)=(Р'ПР')'ПС- Упражнение 1.1.13 (смешанные задачи) 1. Установите, какие из следующих множеств всегда пусты: (I) (Л и В) Г) (Л' и В'У, (2) (Л п В) П (С П Л'); (3)(ЛПВ)-В; (4)B-(W); (5) (ли В) П (Л'UP'). 2. Определите, какие из следующих пяти множеств равны: (1) А Л (В U С); (2) (B-C)U(C-B); (3) (С U В) (С Л В)'-, (4) (Л n С) U (Л л Р); (5) (Л Л Р Л С') U (Л П Р' П С) и (л' Л л Р Л С') U (Л' Л в' Л С). 3. Для каждой из следующих пар множеств определите, является ли одно подмножеством другого: (1) В, (В Л Л); (2) (Л Л В'). (В Л Л'); (З)Л-Р, В—Л; (4) Л'ЛР', (ЛОР)'. 4. Покажите, что (1) (Л Л Р) U (В' Л Л) = Л; (2) л и р=(Л л Р) U (л Л р') и1(Л'Л Р); (3) л л (л и Р)=л л (Л'Л р')'=Л; (4) л и (л'Л в) = л и (л U р')'=л и В- 5. Выпишите двойственные тождества для каждого из соотношений (1) — (4) задачи 4. 6. Какие из следующих уравнений справедливы для всех множеств Л, В, С (S — универсальное множество): (1) л л (в UО = (л Л в) U(л ПО; (2) (лпв) U (Л' Л в) U (л л в')=5; (3) л л (л ив) = л; (4)л'ив'=(л и в)'; (5) Л U (Л'ЛВ) = Л U В; (6)лил'=5; (7) Л и (Л Л В) = Л; (8) (Л U В) Л (Л' U С) = (Л Л С) U (Л' Л В); (9) (Л'Л В') U (Л'Л В) и (Л Л В') =5; (10) (Л Л В)'= Л'Л В'. 7. Упростите следующие выражения: (1) [Л'л (В и С)]'; (2) [(Л Л В) и (Л' л В) и (Л л В')]'; (3) (Л и В') л (Л' и С) л (В и с'); (4) (Л Л В) и (Л' ЛС)и(ВЛС). 8. Покажите, что Л П (Л' U В) (J В (1 (В U С) (J В = В. 9. Покажите, что Л U (Л' 0 В) = Л (J В. 10. Покажите, что (Л (J В (J С)' = Л' П В' П С'. 11. Покажите, что [(Л Л В) U (Л Л С) и (Л' Л х' л У)] П [(Л Л В' Л С) U (Л' Л X' л У') U (Л' Л в Л У)Г = (Л л В) U М' Л в' Л X' Л У). 12. Покажите, что (л U В) Л (С и о)=(С Л Л) и (С Л В) и (В Л Л) и (В Л В). 34
(Замечание. Эта формула называется «разложением на множители».) 13. Разложите (Л Г) В) U (С П D) на линейные множители. (Решение: (С (J A) f) (С U В) f| (D (J Д) f) (D (J В).) 14. Разложите на линейные множители (как в задаче 13); (1) A U (В' П С); (2) (X П Y) U (С n D); (3) А и в n (С и £>); (4) (Д DB')U А' п (В и Q. 15. Сведите каждое из следующих выражений к одному множеству (т. е. к одному символу): (1) Д Г1 В' П Д' Г) В'; (2) (Д П В) и (Д п В’) и (А' п В) и (А' П В')-, (3) (Д П С')ЩД П В П С) и (А Л С); (4) Д'иВ'иС' и(ЛГ)ВПС); (5)(д'ив)П(ли5); (6) [Д U М П В) U И Г) в П С)1 П [И и в и Q1; (7) [(ДГ)В')и(Д'ЛВ)]' П(ИПВ)иИ' Г)в')]'. 16. Для каждого из тождеств в задачах 8, 9, 10 и11 выпишите двойственные. Замечание. Мы специально не оговариваем, что упражнения размещены в разных частях главы. Цель этих упражнений—совершен- ное овладение читателем символами, операциями и законами алгебры множеств; повторение должно помочь ему ускорить этот процесс. 1.1.17. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА Мы уже отмечали, что без знания теории множеств невозможно обойтись при изучении современной математики. Это не только инте- реснейший предмет сам по себе, он дает мощные средства и методы во многих областях исследования. В этой книге теория множеств наиболее широко применяется при изложении теории вероятностей (во второй и третьей частях). Она также необходима при изучении теории графов и линейного программирования. Для дальнейшего чтения читателю рекомендуется работа [11 (ее уровень примерно такой же, как и у этой книги).
к2 ОПЕРАТОР ГЛАВА СУММИРОВАНИЯ 1.2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Во многих приложениях современной математики переменные, определенные на дискретных множествах, таких, как {х1г х2, ..., хп} или {лу, х2, ...}, употребляются чаще, чем переменные, определенные на непрерывных множествах, таких, как {/ : 0 / < оо}_ Например, описйвая эксперимент с бросанием кости, мы находим, что возможные исходы эксперимента образуют дискретное множество {1, 2, 3, 4, 5, 6}. Изучая же схему поступления требований на обслу- НепрерыВная функция (опреде- ленная на множест- ве [х: тжхрб}) Рис. 15 х2 х3 Х Дискретная функция ( опреде- лённая на множест- ве {х,,х?,х3}) Рис. 16 живающий прибор (ситуация очереди), в качестве множества возмож- ных интервалов времени между последовательными поступлениями требований мы должны взять множество {t:O^t<_T}, где Т — некоторый реальный верхний предел, например 60 мин. (В большинстве случаев, рассматриваемых в теории очередей, принимают Т неогра- ниченным сверху.) При решении задач, связанных с функциями, определенными на непрерывных множествах, часто приходится выполнять операцию ин- тегрирования (j dx). В аналогичных же задачах, связанных с функция- ми, определенными на дискретных множествах, выполняется операция суммирования (S). Чтобы получить «сумму» значений функции на ее области опре- деления, мы берем (1) J у dx в непрерывном случае (рис. 15) и (2) у у + t/2 + у3 в дискретном случае (рис. 16). Суммы дискретных величин очень часто встречаются в этой книге. В данной главе мы хотим показать читателю, как можно оперировать 36
такими суммами с помощью оператора суммирования, обозначаемого греческой буквой 2. Свободное владение этим оператором требуется, например, для понимания теории математической статистики. 1.2.2. ИНДЕКСНЫЕ ОБОЗНАЧЕНИЯ Элементы множества, состоящего из трех различных объектов, могут быть обозначены некоторыми символами, например хъ х2, х3; числа 1, 2, 3 называются в этом случае индексами. Мы можем представить п различных объектов символами хг, х2, ..., xn_lf хп, а произвольный объект из этого набора обозна- чить символом хт, где индекс г «пробегает» множество целых чисел 1, 2, ..., п — 1, и. Например, мы можем для обозначения пяти масс, размещенных на плоскости, воспользоваться символами mlt m2, m3, mit m5 и, рассмат- ривая любую из них, писать mr, где г = 1,2, 3, 4 или 5. Мы можем, далее, ввести координаты (xlt t/j массы тъ а в общем случае говорить о массе тг с координатами (хг, уг), где г = 1, 2, 3, 4, 5. 1.2.3. ОПЕРАТОР СУММИРОВАНИЯ Заглавная греческая буква 2 (сигма) служит символом операции суммирования. Рассмотрим, например, сумму хг + х2 + хз- Ее можно записать з как ]рхг; знак перед хг указывает, что все значения хТ должны быть Г=1 просуммированы. Числа, стоящие под знаком 2 и над ним, называются пределами суммирования и указывают наименьшее и наибольшее зна- чения индекса суммирования, между которыми расположены его про- межуточные значения. Примеры 7 7 (1) «Раскрывая» V.xr, получаем ^Хг = х4 + хй4 х6 + х7. г = 4 г=4 п п (2) «Раскрывая»2-4, получаем Vxr = х0 -I- Xj-)-... -|- хп_г + хп. г=0 г=0 (3) «Раскрывая» ^х,., получаем V xr=-xm 4-xnl+j 4- ... 4-x„_14-xn. r=m r~m Замечания а) Переменный индекс г может принимать только целые числовые значения. б) Значение У. хг не изменится, если использовать не г, а другой Г индекс (поэтому индекс суммирования г часто называют немым индек- сом). Наряду с г в качестве индексов суммирования наиболее часто употребляются бувы i, j, k. в) Выражение, стоящее после знака суммы, называется элементом суммирования, пли слагаемым-, например, в^хг слагаемым будет хТ. 37
г) Очень часто, если пределы суммирования не вызывают сомнений, индекс при слагаемом опускается и пределы суммирования не указы- п ваются. Например, Vx часто пишут как сокращение для Использование знака S можно продемонстрировать на следующих примерах. Примеры 1. Раскройте следующие выражения: 3 7 8 4 (1) Vxr+Vxfc; (2) £/; (3) r=l k=4 г—4 г=2 3 1 2 4 (4) 2 —; (5) 2 (6) £ а г=1 Хг г = 0 г 2 Решения (1) хх + х2 + х3 +ух4 - Ь х5 + хв + х7; (2) 4 + 5 + 6 + 7 + 8; (3) 3 + 4 4- 5; (4) 1/хг + 1/х2 + 1/х3: (5) хг + х2 -I- х3; (6) 22 + З2 + 42 = 4 + 9 + 16 = 29. 2. Перепишите следующие выражения с помощью оператора сум- мирования: (1) хг + х2 + х3 + х4; (2) 22 + 23 + 24; (3) х2 + -^з х4 — Xq х? х3, (4) Vз 1/0 + /27 /gi* Решения (i) 2^; (2) 2^ <3) 2*~2^ (4) £(-1)г+ 3~г. r=l r = 2 i = 2 ft=6 г = 1 Упражнение 1.2.1 1. Выпишите следующие суммы в развернутом виде 6 5 6 9 (1) У, хг; (2) У, xft; (3) V, хг+ 2 r = 3 k-‘2 r=3 k=7 3 4 3 6 3 (4) У, *ь + У, xf, (5) У xk — У xf, (6) 2 (хг+лун); k.— \ j=2 k=\ z = 4 r=l 4 3 1 1 (7) 2 r’ (8) 2 — •> (9) 2 (f2+2r); r=l r=l xr r=l 4 4 2 (10) V (-l)'x-'; (11) V (-iyyi- (12) 2 (-l)fe2fc/xfe. r= 2 Z.= 0 k = 0 2. Перепишите следующие выражения с помощью оператора суммирования: (1) хх + х2 4- х3 + ... 4“ Xn-i 4“ хп\ (2) 1 4 2 4- 3 — (4 + 5 4- 6); (3) х3 4- х4 + хъ + х6 + х7; (4) х2 + х3 + х4 + xu + Xj2 + х13 + х14; 38
(5) х1 + хз + х1 + хь> (6) “+ —1-+ ~+ ~~ ’> х6 Л7 Лд (7) 1 4 9 16 —+ —+ —+ —; х2 хз 1 х4 х6 1 1 1 (8) 1+т+т+т= 2 3 4 5 (9) 33+43 + 5^ + 6®; (10) —+ —+ — + — • 3 4 5 6 1.2.4. НЕКОТОРЫЕ ВАЖНЫЕ ТОЖДЕСТВА Следующие тождества легко проверить, раскрывая операторы сум- мирования в обеих частях каждого равенства (предполагается, что индекс суммирования «пробегает» произвольное множество последо- вательных целых чисел): О V(xr + i/r)=yxr + 2(//. 2) V ^хг == С V xr, С—константа; п 3) У^а = па\ Г=1 п п — k 4) У Хт = 2 xr+h > r = fe г = 0 2 %г= 2 г» г=0 г=0 6) ^Хг = Хп + 2 хг= V хг+х0. г=0 г=0 г = 1 п Тожество 3 следует из того, что 2й = й й + ••• + а, где г=1 п п в правой части а берется /г раз. В частности, V 1 = пи 2 1 = п m+ 1. Г=1 г—ш Тождество 4 легко понять, если положить п и k равными некоторым числам; разложения (3) и (4) из приводимого далее примера 1 подтверж- дают это тождество. Примеры 1. Следующие разложения иллюстрируют приведенные тождества: 5 5 5 (1) V (4хг + 7уг) = 4 2 *г + 7 2 Уг = 4(х2 + ^з + ^Тл:б) + г = 2 г—2 г=2 + 7(У2+Уз+у4 + у^, 4 4 4 (2) 2 (З-'-г + 2) — 3 2 хг Н- 2 2 — 3 (хх + х2 + х3 + х4) + 8; Г=1 Г=1 Г = 1 6 (3) У^Хг^Х;^ Х4+ Х-0 + Хб-, г=3 3 (4) 2 Хг+з = Л:о+з + х1+3 + х2+з + хз+з = х3 + х4 + х5 + хе( (3)). г=0 39
4 (5) у, хт = х„ + Aj + х2 + х3 + х4; г = 0 4 (6) У, Х4-г = А4 О + А'4—1 + Х4—2 + А4-3 + Х4-4 ~ Х4 + Х3 ' i Х2 + г = 0 + х1 + -^о( —(5)). п 2. (а) Покажите, что V (xr~xr-i) = хп~хо- г—1 (б) Получите выражение для суммы первых п целых чисел. Решения п п п (а) 2 ^xr xr—i) 2 — 2 xr—i г=1 Г=1 Г=1 (по тождеству 1)= п— 1 п ==л'п_1_ 2 Хг —2 хт—1 Г=1 Г=1 (по тождеству 6)= п — 1 п — 1 =хи+ 2 Хг~ 2 хт (по тождеству 4) = г=1 г=0 n—1 п—I = *п + 2 Хг—2 хг—хо (по тождеству 6) = Г=1 Г=1 — хп Х0- (б) Имеем: л л п 2 г~ 2 r = 2 (п—г< (по тождеству 5) = г=1 г=0 г=0 1 п п = 2 г + 2 («~г) = z Lr = O r=0 1 п = —- 2 п (по тождеству 1) = 2 г=0 (по тождеству 2) = =т('г+1) Упражнение 1.2.2 Выпишите в развернутом виде следующие суммы: 1. 2 ''('•-!)• 2. 2 (/'+1 2)аг. 3. 2 (-1)гт2. г=1 г—1 Г=1 2п 4. 2 (1+(-1)Э- г = 0 40
Выразите следующие суммы с помощью знака S: 5. 1-4 + 2- 5+ 3- 6+ ...,п членов. 6. 1 — 2 + 3 — 4 -| .... 20 членов. 7. 1/л3 + 1/(п + IIs + 1(«+ 2)3 + ... + 1/(2п)3. 8. 1 + 3 + 5 + 7 +-.., 10 членов. 9. 1-2 + 3- 4+ 5-6 + 7- 8+ ..., п членов. 48 48 ______ 10. (1) Упростите у [/ (г + 1) — / (г)]. (2) Вычислите у [ J г + 1 — [+]. г=1 г=1 1.2.5. ПРИМЕНЕНИЕ ОПЕРАТОРА СУММИРОВАНИЯ Рассмотрим несколько примеров с оператором а) Математические ряды. Читатель, возможно, знаком с разло- жением в ряд некоторых элементарных функций. В примерах (1) — (3) верхним пределом для г будет оо (бесконечность). Это означает, что процесс суммирования ведется неограниченно долго, причем г «про- бегает» все натуральные значения. (Для бесконечных рядов возникает важный вопрос о их сходимости, который здесь не затрагивается.) Примеры разложения в ряд некоторых элементарных функций: (1) у—- = ! + %+— + ... (экспонента ех). 00 х2г +1 X3 X5 (2) у ==х + 'зГ+'5|”,_’” (гипеРболический СИНУС> shx). 00 х2г х2 х4 (3) 2 1 + — + — + ... (гиперболический косинус, ch х). И / Н \ / ft \ (4) У g"-rpr=gn+ 1?n-lpl + ... + pfl г =0 \ Г ) \ 1 ! (биномиальный ряд; разложение (д + р)п, когда п — целое число). п \ nl г / (п—г)!г! Замечание. , эти выражения обычно обозна- чаются как Сгп и называются биномиальными коэффициентами. б) Умножение векторов. Вектор-строка есть строка элементов /Уг\ (хх, х2, л'з), вектор-столбец есть столбец элементов lya I. +з/ В векторной алгебре скалярное произведение вектора-строки на вектор-столбец определяется следующим образом (на примере трех- мерных векторов): (1Л\ 3 (х1; х2, х3) у2 = Xi yr + х2 у2 + х3 у3 = у Xi yt. \Уз/ i==1 41
Числовой пример /2х (3, 1, 2)1 4 1 = 3-2+ 1.4 + 2-6 = 22. \6/ Читатель встретит умножение такого типа в гл. 1.3, посвященной теории матриц. Скалярное произведение также рассматривается при изучении конечных цепей Маркова (см. гл. 3.1). в) Выбор рчные характеристики. Здесь мы немного забежим вперед и изложим некоторые статистические понятия из материала второй части книги. Допустим, что эксперимент осуществляется п раз и каждый раз результат фиксируется в виде некоторого числа; в итоге возникает множество, состоящее из п чисел. Это множество называется выборкой объема п, и его элементы обозначаются символически хг, х9, хп. Арифметическое среднее выборки определяется как п У хг -=Х1+х2+хз+...+хга или - = п п Это число служит мерой «центрального» значения всех результатов, которые можно было бы получить, если бы число экспериментов было неограниченно. Среднее значение случайной величины называют мате- матическим ожиданием. Чтобы измерить рассеяние (разброс) значений случайной величины около математического ожидания, пользуются выборочной диспер- сией п 2 (хг—х)2 Г=1 п Пример Кость бросают пять раз, и результаты образуют выборку {6, 1, 1, 4, 3}. Найдите арифметическое среднее и дисперсию выборки. Арифметическое среднее равно Б “ r?iXr 6+1+ 1 + 4+3 „ л —• -' ' —----------— о. 5 5 Выборочная дисперсия равна 5 2 (*г-Э2 г=1 3* + (—2)2+(—2)2+12 + 02 42
Упражнение 1.2.3 1. Покажите, что sbx + ch х = ех, пользуясь разложениями этих функций в ряд, указанными в 1.2.5, (а). 2. Раскройте следующие суммы: 3 / О \ 4 (О 2 (2) 2 r = 0\r 1 /=0 (3) qe~kpk. ( 6 k k Вычислите каждую сумму при р = 1/2, р = 1/4, р = 3/4; q = 1 — р. 3. Вычислите следующие скалярные произведения: (1 2 3 / 0 \ / 1 ; (2) (-1, -1,0) ( 3 ]; (3) (2, -1, 0, 4) ® \ 4 J \ о 4. Представьте следующие скалярные произведения векторов в виде сумм как с помощью знака 2, так и подробно выписывая их: (1) (s0, si, s2, s3) 5. Найдите среднее арифметическое и дисперсию для каждой из следующих выборок: (1) {3, 5, 1, 2, 4, 3}; (2) {1, 2, 3, 4, 5}; (2) {—1, 0, —1, 4, 3}; (4) {8, 7, 6, 3}. 6. Покажите, что для любой выборки объема п выполняются соотношения: (1) 2(х—х) = 0; (2) 2 (х—х)2=2х2— пх2, где х=---- • 7. Рассмотрим множество значений х : {х1( х2, х3, х4}. Предположим, что каждому хг соответствует некоторое число (мы будем называть его частотой). " "г Выпишите в развернутом виде ^rXr> ^PfrXr. г=1 г=1 Вычислите эти суммы в каждом из следующих случаев: Значения х 5 10 15 20 Частоты 3 5 10 2 А + dr, где А — постоянная Значения х 3 5 7 9 Частоты 14 8 7 8. Покажите, что если 2/r = N и хг = величина, то 2fr xr = 2frdr + N • А. 43
1.2.6. ДВОЙНОЕ СУММИРОВАНИЕ Часто для указания двойной классификации удобны два индекса при дискретной переменной. Например, возьмем выборку объемом в тридцать школьников (школьники отбираются случайным образом) и будем группировать школьников по двум признакам: полу (мальчик, девочка) и цвету волос (темный, каштановый, белокурый, рыжий). Результаты группировки приводятся в следующей таблице с двумя входами: 1 Цвет волос Т К Б Р Итого М Пол Д 5 8 12 3 7 3 1 16 14 Итого 8 15 4 3 30 Числа в клетках таблицы соответствуют численности школьников в различных группах. Так, величина, стоящая в первой клетке (в ле- вом верхнем углу), равная пяти, означает, что в выборке есть пять мальчиков с темными волосами; из содержимого следующей клетки известно, что есть восемь мальчиков с каштановыми волосами, и т. д. Мы обозначим частоты в клетках таблицы символами Хц\ индексы i, j указывают, что клетка находится на пересечении i-й строки и /-го столбца. В нашем примере i равняется! ,2 (соответствует М и Д); / равняется 1, 2, 3, 4 (соответствует четырем цветам волос: Т, К, Б, Р). Элементы верхней строки: — 5, х12 = 8, х13 = 1, х14 = 2; элементы ниж- ней строки: ха1 = 3, х22 = 7, х23 = 3, х24 == 1. Сумма элементов первой строки равна 4 У xi} = + х12 + х13 + х14 = 5 -р 8 + 1 + 2 = 16; /=1 сумма элементов второй строки равна 4 У1 , x2j = х21 + х22 + х28 + х24 = 3 + 7 + 3 + 1 = 14. i=i Чтобы получить общий итог, мы воспользуемся оператором S дважды. 4 2 Общий итог = 2 2^ = (-41 + -41) + (-4.2 + Х22) + (Л'13 + Л'23) + / = И=1 + (Х14 + %24)- Это означает, что сначала х1} суммируется по i (т. е. получены сум- мы по столбцам), а затем суммы по столбцам суммируются по /. Таким - 44
образом: 4 2 4 2 2 X‘i= 2 /=1/=1 /=1 = У (сумма по /-му столбцу) = / = общий итог. Очевидно, что порядок, в котором выполняется двойное суммиро- вание, не влияет на результат. Мы установим это как общую теорему. Теорема. Пусть на пересечении i-й строки и j-го столбца таблицы размером т X п стоит значение xiS. Тогда пт т п У 2 Хц= 2 2 хч- 7=1 z = l z=i/=i п т п Доказательство, у у xi} = у (х1}- + ... + хт]) = /=! /=1 /=1 = J -4j4~--- + У Мш = (^114_Л'124_"-4_Л:1п)4_"-4_(Л'т14_Л:?п24‘'...4-Л:тп)- Г=1 /=1 Убрав скобки, перегруппируем слагаемые и расставим скобки по- новому; получим: С^’11 4~ ••• 4~ ^ml) 4 (-^12 4" ••• 4~ ^ms) 4~ ••• 4~ (М.п 4- 4" т т т = 2 Л'14- У xi2 4-... 4- У xin — i=i z=i »=i = Z Uii4-xi24-...4-xin)= V | У хгд i==l i=l \/=l / Отсюда вытекает: п m m n 1 V хи= 2 2 x‘i- /=i/=i z=i/=i Примеры Следующие примеры показывают, как выполняются операции над переменными с двойными индексами. 1. Образуйте общую таблицу с двумя входами для х^ при t = 1,2 и / = 1, 2, 3. Решение J = 1 / = 2 /=3 S xij J —1 04 II II Xll X21 X12 X22 X'13 Хцз Ri R2 Sx0 Ci C2 c3 i i 45
3 Через Rt обозначена сумма по f-й строке: Rt = Яхц. i=x 2 Через Cj обозначена сумма по /-му столбцу: С} = у х;;. «=1 3 2. Напишите в развернутом виде суммы (1) 2xi} и «=1 (2) /=2 Л Решения (1) Хц + х2} + х3}. (2) xi2 4- xl3 + xit. 2 3 3. Напишите в развернутом виде у xt (xt + #/)- /=1 1X1 Решение 2 2 [*1 (Х1 + У]) + Х2 (,Х2 4“ У)} + х3 (х3 + у})] ~ /=1 2 = 2 + Х* + + <Х1 + *2 + *з) У}] = 7=1 2 = 2 (х* + х2 + х2) + (%1 + х2 4- х3) 2 tjj = /=i = 2 (х2 4- %2 + Х2) + (Х1 + х2 4- Х3) (уг 4- у2). С другой стороны, 2 2 Х‘ (Xi + У?> =22 (Xi + Xi У}) = i=4=i z=iz=i 9 4 9 4 = 2 2** + 2 2ЗД= /=i(=i f=i i=i 2 3 = 2(x|4-x2 4- x2)4- 2 У] 2 х^ = i = l Z = 1 = 2 (x? 4- x2 4- x2) + 4- y2) (Xj 4- x2 4- XJ). При известной практике двойные суммы такого типа могут быть выписаны очень быстро. Упражнение 1.2.4 1. Напишите таблицу с двумя входами (см. пример 1), обозначая через yTS содержимое rs-й клетки таблицы, где г == 1, 2, 3 и s = 1, 2, 3, 4. Выпишите суммы по строкам, суммы по столбцам, а также полную сумму с помощью знака S. 2. При Rr = 8, Хц = 1, х12 = 4 и j = 1, 2, 3 найдите х13. 3. При Сг = 12, х12 = 4, х32 = 8 и i = 1, 2, 3 найдите х22. 4. Напишите в развернутом виде следующие суммы: 5 4 3 2 (1) (2) 2 Уг^, (3) 2 xip i—1 s = 0 , 46
2 4 2 3 4 2 (4) У У yrs', (5) У У, х1}\ (6) у У Уг&, Г=\а=Ъ i=\ j=\ S = Qr=\ 2 2 4 (7) У У (2xi;-+3)x0; (8) У aij.bjh- 7=17=1 /=1 5 2 3 i (9) У Prs'4st> (Ю) у у 2 • s=l 7=17=1 ХЦ 5. С помощью результатов, полученных в предыдущем задании, покажите, что (3) = (5) и (4) = (6). 6. Покажите, что х?/—т-п-х2, где mt 1 I i i j = 1,..., n. Следующее задание познакомит читателя с употреблением многоиндексных величин. 7. Раскройте следующие суммы: 2 3 2 4 (1) У У (Ч?+М); (2) У У /=17=1 7=17=1 2 2 12 (3) У У al}-b}h-, (4) У У 2(777^+1); 7=17=1 / = 0 7=1 1 4 2 7 а (5) У У xt (2хг-5х;); (6) у У -----; 7=0 7 = 2 7=17 = 6 1—07/ 2 2 2 3 2 1 (7) У 2 У хиь; (8) у У У №-1).
1.3 ГЛАВА МАТРИЦЫ В этой главе мы кратко изложим алгебру матриц. Она оперирует математическими объектами, представляющими собой блоки чисел, или элементов. Алгебра матриц и матричное исчисление применяются во многих практических задачах; некоторые из них упомянуты в 1.3.2; в большей мере мы будем пользоваться матрицами во второй и третьей частях книги. 1.3.1. ОПРЕДЕЛЕНИЕ Определение 1. Матрицей называется прямоугольная таб- лица чисел. Отдельные числа (или символы, заменяющие их) называют- ся элементами матрицы. Таблица обычно заключается в квадратные (или круглые) скобки. Примеры 4. D = [3 5 1/2 1]. Замечания (1) Обычно для обозначения матриц пользуются заглавными бук- вами, а соответствующими малыми буквами обозначают их элементы. (2) Общий элемент матрицы А записывается в виде а:р, он распо- лагается на пересечении i-й строки и /-го столбца матрицы. Благо- даря этому матрицу можно записать так: А = 1аг>], i = 1, ..., т, j = 1, ..., п, где т—число строк и п—число столбцов в матрице (см. пример 3). Определение 2. Говорят, что матрица имеет порядок т X п (читается «т на п»), если она содержит т строк (горизонталей) и п столбцов (вертикалей). 48
Если т = п, то матрица называется квадратной. Матрица порядка 1 X п называется вектором-строкой, а матрица порядка тX 1 — вектором-столбцом. Примеры 1. Матрица 3 6 5 2 3 0 Л = имеет две строки и три столбца. Это — матрица порядка 2x3. 2. Матрица В = 5ц ^21 512 ^22 _ квадратная матрица порядка 2 X 2, или просто матрица второго по- рядка. 3. С = [2 3 4 5 6] — вектор-строка порядка 1 X 5. Г 0=3 — вектор-столбец1 порядка 3x1. 5 Матрица R = Г1 — 2 41 имеет порядок 2x3; О 3 6 4. 5. гп — 1 (пересечение 1-й строки и 1-го столбца); г-12 = — 2 (пересечение 1-й строки и 2-го столбца); г13 = 4 (пересечение 1-й строки и 3-го столбца); r2i = 0 (пересечение 2-й строки и 1 -го столбца) и т. д. Определение 3. Матрица, все элементы которой равны нулю, называется нулевой матрицей и обозначается 0. Квадратная матрица порядка п, у которой все элементы главной диагонали1 2 равны 1, а все остальные элементы равны 0, называется единичной матрицей. Например, единичная матрица четвертого поряд- ка есть 10 0 0 0 10 0 0 0 10 0 0 0 1 Единичная матрица обозначается буквой I. 1 Иногда удобнее записывать вектор-столбец горизонтально, при этом он заключается в фигурные скобки. Например, ' 1 ' {13 5}= 3 . 5_ 2 Главная диагональ идет из верхнего левого угла матрицы в ее правый нижний угол. 49
Мы увидим, что нулевая и единичная матрицы1 играют такую же роль в алгебре матриц, как 0 и I в обыкновенной алгебре. Упражнение 1.3.1 1. Дана матрица 3 —5 2 6 4 5 — 1 0‘ [3 1 —6 11 Установите ее порядок, выпишите элементы /и, /2з. ^зг» Йза> бз- 2. Выпишите отдельно три вектора-строки и четыре вектора-столбца мат- рицы Т из предыдущего примера. Определите порядок каждого вектора. 3. Установите порядок каждой из матриц, приведенных в примерах после определения 1. 4. Выпишите полностью квадратную матрицу S = [s,j] третьего порядка, считая, что = 2j при i = 1, j = 1, 2, 3; Sjj = 3 j при i = 2, j = 1, 2, 3; все остальные s;y равны нулю. 5. Выпишите квадратную матрицу Р = четвертого порядка, полагая, что ptj = 1 при i = /, ptj = (i + /) при i < j и ptj = — (i + j) при i > j. 6. Выпишите нулевые матрицы, имеющие порядок 2 X 2 и 3 X 4, а также нулевые векторы, порядок которых 1 X 3 и 5 X 1. 7. Выпишите единичные матрицы, имеющие порядок 3 X 3 и 5 X 5. 8. Какое существует соотношение между индексами I и / у элементов, стоя- щих на главной диагонали матрицы [ayl? 1.3.2. ПРИЛОЖЕНИЯ АЛГЕБРЫ МАТРИЦ Прямоугольные таблицы чисел встречаются в разнообразных математических ситуациях. Ими можно оперировать как самостоятель- ными математическими объектами. Формализация операций над мат- рицами привела к созданию алгебры матриц. В этой главе мы дадим элементарное введение в алгебру матриц, определим основные действия с матрицами и рассмотрим некоторые их следствия. Вначале мы коротко остановимся на нескольких прикладных за- дачах, чтобы дать читателю минимальное представление об исполь- зовании этих алгебраических понятий. а) Системы линейных уравнений. Рассмотрим следующую систему < линейных уравнений: 3x + 2// + 4z= 1; —х +у + 2z = —5; (1) х —2/y + 3z = 2. Мы можем составитьпрямоугольную таблицу чисел из коэффициен- тов при переменных х, у, г: 2 1 4 2 3 1 1 Матрицы будут обозначаться заглавными буквами латинского алфавита, векторы-столбцы или векторы-строки — малыми, полужирным шрифтом. Для нулевой и единичной (тождественной) матриц будут использоваться специальные символы О и I. 50
Такая таблица называется матрицей коэффициентов системы. Далее мы представим переменные х, у, г и свободные члены уравнений сис- темы в виде двух векторов-столбцов: Теперь систему уравнений можно записать таким образом: или короче: 3 2 4 — 1 1 2 1 —2 3 Ах = п. (2) (3) Мы покажем позже, что умножение и равенство матриц определены таким образом, что системы (1), (2), (3) эквивалентны. Кроме того, может быть найдена матрица Л-1 (называемая обратной1 к Л и та- кая, что А-1 Л = Г), позволяющая решить матричное уравнение (3): Ах = п умножением обеих его частей на Л-1: Л-1 Ах = Л-1 и. Умножение вектора х на Л-1 Л оставляет его неизменным (сравните с умножением на 1 в обычной алгебре). Поэтому х = Л-1 п. Итак, мы видим, что с помощью матриц можно решить систему линейных уравнений так же, как решается одно уравнение типа ах = b в обычной алгебре. Преимущества такого метода очевидны. Конечно, для получения численного решения системы выражение Л-1« должно быть некоторым образом вычислено; иногда это довольно трудоемкий процесс. Однако в теоретических работах не приходится выходить на численный уровень; в них оперируют матричными урав- нениями и получают решения в общей матричной форме. Такие решения исследуют качественными методами, не обращаясь при этом к конк- ретным числовым значениям. б) Транспортные издержки. Предположим, что компания имеет два завода (Л и В) и три склада (7?, S, Т). Продукция заводов должна ежедневно перевозиться на склады. Необходимо так выбрать маршруты перевозок продукции заводов на склады, чтобы общие затраты на пере- возки были как можно меньше. Задачи такого типа называются транс- портными, они представляют собой объект изучения теории исследо- вания операций (см. гл. 3.3). 1 Не всякая матрица имеет обратную. Вопрос обращения матриц рассмат- ривается в 1.3.10. 51
Для решения этой задачи необходимо как можно точнее определить затраты на перевозки грузов по шести различным маршрутам. Эти величины удобно расположить в виде матрицы: Склады к S Т 3 а в А Си с12 с13 о Д ы В С21 С22 с23 Матрица затрат Элемент сг1 равен затратам на перевозку единицы продукции с завода Л на склад /?; элемент с12 равен затратам на перевозку единицы продук- ции с завода А на склад S и т. д. в) Матрицы перехода. В гл. 3.1 излагается теория конечных цепей Маркова, в которой стохастические матрицы играют основную роль. (Матрицы, элементы которых являются вероятностями, называются стохастическими.) Этот тип матриц мы рассмотрим на очень простом примере. Предположим, что погода на некотором острове в Море Математики может ежедневно меняться. Она будет либо дождливой (Д), либо сол- нечной (С). Результаты ежедневных наблюдений за погодой в течение длительного периода времени записаны в виде последовательности С, С, Д, Д,Д, С, Д, С, ... При анализе этой последовательности в изменени- ях погоды была обнаружена следующая статистическая регуляр- ность: (1) за дождливым днем следует дождливый день в три раза чаще, нежели солнечный; (2) за солнечным днем следует солнечный день в два раза чаще, нежели дождливый. Замеченные закономерности могут быть выражены в терминах вероятностей перехода1, образующих следующую матрицу: Погода на второй день Д С Погода в первый день Д С 3/4 1/4 1/3 2/3 Первая строка матрицы указывает, что дождливый день следует за дождливым с вероятностью 3/4, а солнечный день следует за дожд- ливым с вероятностью х/4. Эти вероятности находятся в отношении 3 : 1 (в соответствии с замеченной закономерностью (1)), и их сумма 1 Мы полагаемся на интуитивное представление читателя о вероятности. Ма: тематическая теория вероятностей излагается в гл. 2.1. 52
равна 1 (как и должно быть, так как заранее известно, что погода на второй день будет либо солнечная, либо дождливая). Они стоят в клетках таблицы (Д, Д) и (Д, С) соответственно. Во второй строке стоят вероятности того, что за солнечным днем следует дождливый, и того, что за солнечным днем следует солнеч- ный день. С помощью этой матрицы переходов мы можем ответить на неко- торые вопросы, имеющие вероятностный характер и касающиеся по- ведения погоды на острове. Теперь мы вернемся к описанию основных правил матричной ал- гебры. 1.3.3. РАВЕНСТВО МАТРИЦ Определение. Две матрицы равны между собой, если (1) они имеют одинаковый порядок и (2) их соответствующие элементы равны. В принятых обозначениях это определение выглядит так: матрица А = равна матрице В = если: (1) матрицы А и В имеют одинаковый порядок; (2) Ojj = btj для каждой пары i, j. Примеры 3 4 5 6 (1) 3 4 . /g) 1 л: 14 5 6J’ V 0J ” .8 О Из равенства матриц (2) следует, что х = 4 и у = 8. 1.3.4. СЛОЖЕНИЕ МАТРИЦ Определение. Пусть матрицы А = [с,;] и В = [6 гу] имеют одинаковый порядок. Тогда суммой матриц А и В будет матрица А + В = [ т. е. суммой матриц А и В является матрица, каждый элемент которой равен сумме соответствующих элементов матриц А и В. Сложение матриц разных порядков не определено. Примеры ! [2 31 , 1 4 ' [1 2J 12 2. 1 2 3, 2 0—14 —2 2+1 3 + 4 = 3 7 1+1 2+2 2 4 1 61 = Г 3 3 9 0 —1 —2 —1 3 3. Если С и D — матрицы порядка 2 X 2, то lcij] + Mij] — Сц + (11г С21 + С12 4" ^12 ^22 + ^22 53
4. 3 4 —2 3 4 —2 3 4 —2 О О О О о о + 1 5 2 1 5 2 1 5 2 О О О О О О 5. Рассмотрим дгу? матрицы: 1 2 3 4 3 2 1 1 — 1 2 Сумма их не определена, так как матрицы имеют разный порядок. Упражнение 1.3.2 Найдите (когда это возможно) матрицы Л + В, В + >4, В г С, С + В, С А, А + С, С + D, D + С, D + Е', Е + D, А + О, В + О, С+ О, О + + В, О + Е. Г х 2х 3x1 Г 2х у О 2. Сложите матрицы и L у — х 4yJ L 2У х Зу 3. Определите значения х, у и г, если X 1 2 ' 2—х 1 2 5 У 0 = 5 2у-1 0 4 3 Z 4 3 l+4z Законы сложения. Пользуясь определениями равенства и сло- жения матриц, легко показать, что если А, В, С и О:— матрицы одного порядка, то (1) А + (В + С) = (Л + В) + С, и, следовательно, мы можем написать в обеих частях просто А + В + С. (2) А + В = В + А. (3) А + О = О + А = А. Из (1) и (2) видно, что сложение матриц подчиняется законам ас- социативности и коммутативности. Закон (3) является законом тож- дества, роль нейтрального элемента (нуля) играет нулевая матрица. 54
1.3.5. УМНОЖЕНИЕ НА СКАЛЯР Когда мы говорим об умножении матрицы на скаляр, мы подразу- меваем умножение на действительное число (или на символ, его пред- ставляющий). Определения (1) Если т — некоторый скаляр и А = [аг;] — матрица, то т • А = [mai}], т. е. чтобы умножить матрицу на скаляр, надо каждый элемент мат- рицы умножить на этот скаляр. (2) mA = Ат. Примеры а) Вычитание матриц Определения (1)-Л =(-1)Л; (2) А — В = А + (—1) В (Л и В имеют одинаковый порядок). б) Теоремы об умножении на скаляр. Рассмотрим какие-либо две матрицы А и В, имеющие одинаковый порядок, т, п — скаляры. Тогда: (1) (тп) А = т (пА~)-, (4) 1А = А, ОД — О; (2) т (Л + В) —,тА + тВ\ (5) А + (--Д) = (—Д) 4- А = О; (3) (т + ri) А = mA 4- nA-, (6) 2Д = А 4- А, ЗА = А 4- А 4- А и т.д. Эти теоремы следуют из определений, приведенных в 1.3.3— 1.3.5. Упражнение 1.3.4 Г1 — П г0,3 0,6] 1. Вычислите: (1) 6 ; (2) — 10 0 —1 L2 10,2 0,5) 1 (5) 100 8 0 10 0 0 1 —6 4-2 о 1 0 0 0 1 0 0 0 1 о о 1 о о о 1 55
2. Докажите теоремы (1) — (6) об умножении на скаляр. 3. Найдите значения v, w, х, у из матричного уравнения 1x21 Г 1 У 1 Г 0 0 1 3 _2 J = I I 1 v j l 2 J j 0 0 J 4. Вынесите скалярный множитель из матриц: 1 (1) 40 4 0 16 12 0 8 1.3.6. УМНОЖЕНИЕ МАТРИЦ Мощность матричных методов и широта их применения основы ваются на операции умножения матриц. Без сомнения, это замеча- ние покажется читателю очень странным, однако при небольшом прак- тическом знакомстве, а затем и более глубоком изучении приложений его недоумение вскоре рассеется. Мы начнем с определения произведения двух векторов (т. е. двух однолинейных матриц). а) Произведение вектора-строки на вектор-столбец. Пусть даны вектор-строка а = [бд а2 ... ап] и вектор-столбец Определение. Произведением векторов а и b называется п = 4д£д + а2/)2-'г ... + anbn = i=i Замечания (1) произведение векторов есть скаляр; (2) обычно оно называется скалярным произведением-, (3) векторы а и b должны иметь одинаковое число элементов; для векторов с различным числом элементов скалярное произведение не определено Примеры 1. Если а = [3 4 5] и Ь = 1 то а-Ь = [3 4 5] = 3-1 + 3 + 4-2+ 5-3 = 26. 2. с = [2 6], d = cd = 2(—-1) + 6-4 = 22. 56
Упражнение 1.3.5 1. Пусть даны векторы: а=[3 4 5], b=[—1 0 —8], с = — 1 2 —2 Найти: (1) а - с; (2) а - Ь; (3) b e; (4) b - d; (5) а . (с + d); (6) b - (с + d); (7) (а + Ь) • с; (8) (а + Ь) • d. Показать, что а • (с + d) = а с + а • d; b - (с + d) = b • с + b • d; (а + b) • с = а • с + b • с; (а + Ь) • d = а • d + + b • d. 2. Пусть а — вектор-строка и Ь — вектор-столбец, имеющие одинаковое число элементов, а т, п — скаляры. Покажите, что выполняются следующие равенства: (1) (ma) - b = т (а Ь); (2) (та) (nb) = (т/г) (а • Ь) = та (пЪ) = = a (mnb). б) Произведение двух матриц. (1) Матрицы порядка 2x2. Сна- чала мы рассмотрим умножение квадратных матриц второго порядка, затем мы определим умножение матриц в общем виде. Пусть 'А В ' С D а b с d Определение. Произведением матриц S и Т (обозначим его через ST) является ’ А В a b~ ~Аа-\-Вс AbJ-Bdl CD cd Са-\-De Cb + Ddj Покажем, как образуется это произведение. Представим себе, что мат- рица S (левый множитель) состоит из двух векторов-строк, т. е. И BJ1 ги/ [С £)]] [R2_ а матрица Т (правый множитель) состоит из двух векторов-столбцов °1 Р с d — [Ci С2]. Тогда каждый элемент матрицы ST есть скалярное произведение век- торов R; • Су, т. е. R.-Q Ra‘ Ci Ri-C2 r2c2 Например, элемент, стоящий на пересечении 1-го столбца и 1-й строки, равен RrC1 = [/4 В] = Аа -| - Вс. 57
Обратив внимание на индексы у элементов матрицы ST, можно вы- вести следующее правило. Правило умножения матриц. Элемент, стоящий на пересечении t-й строки и j-ro столбца матрицы ST, будет скалярным произведением i-й вектора-строки матрицы S и j-ro вектора-столбца матрицы Т. Пример Я S [2 3 4 5 1 3 2 4 Т = ST = '2 3 4 5 1 2’ 3 4 12 3]’ .14 5]. [2 3] [4 5] [2 3] [4 5] '2-1+3-3 2-2 + 3-4 4-1+5-3 4-2 + 5-4 Г11 161 19 28 Упражнение 1.3.6 1. Вычислите следующие матричные произведения, выписывая подробно каждый шаг: О 1 ° 1 1 ] ’ скалярные произве- 3. Попытайтесь вычислить произведение матриц 2 3 1 1 1 J 4 5 О 1 6 3 с помощью скалярного произведения левых векторов-строк па правые векторы- столбцы. Почему нельзя найти это произведение? (2) Общее правило умножения матриц. Сформулируем условия существования произведения матриц и правило его вычисления. Пусть Л — матрица порядка г X s, а В — матрица порядка т х п. Тогда: (а) Произведение матриц А и В определено, если s = т, т. е. если • число столбцов матрицы А равно числу строк матрицы В. Если s #= т, то матрицы будут несогласованными и их произведение не определено. 58
(б) Если s = т, то матрица-произведение АВ имеет порядок г X В. (в) Если произведение матриц определено, то элемент, стоящий на пересечении i-ii строки и j-ro столбца матрицы АВ, равен скаляр- ному произведению i-й вектор-строки матрицы А на j-й вектор-стол- бец матрицы В (это правило уже было сформулировано раньше). Таким образом, если А и В — матрицы порядка г X s и т X п соответственно и s = т, то их произведение может быть записано в виде п. Пример (1) А и В — матрицы порядка 2 X 3 и 3 X 3 соответственно, ус- ловие s = т (3 = 3) выполняется, следовательно, их можно умно- жать. (2) Матрица АВ имеет порядок 2x3. Следующая схема указывает, как можно определить порядок матрицы-произведения: (rXs) • (sx п) -> (г X п). I 1 (3) АВ = '2 3 4' 1 2 3 1 2" 1 2 2 1 2-1 + 3-2+4-2 2-1 + 3-I+4-2 2-2 + 3-2-1-4-1 1-1 + 2-2 + 3-2 1-1 + 2-1 + 3-2 1-2 + 2-2 + 3-1 16 13 14 11 9 9 Упражнение 1.3.7 (1) Установите, для каких пар матриц определено их произведение (пары рассматривать в данном порядке): А, В; В, А; А, С; С, A; A, D; D, А; А, Е; Е, A, A, F; F, А; С, D; D, С; С, Е; Е, С; С, F; F, С; D, Е; Е, D\ D, F; F, D. (2) Для каждой из согласованных пар определите порядок матрицы-произ- ведения. (3) Вычислите произведение матриц для каждой из согласованных пар. 59
2. Вычислите произведение матриц: j (дистрибутивные законы); Найдите произведения: Al, 1А, AJ, J А, АК, КА, AL, LA. Внимательно следите за результатами этих операций. в) Теоремы об умножении матриц. Для различных комбинаций сумм и произведений матриц можно доказать справедливость следующих теорем: (1) (ЛВ) С — А (ВС) (ассоциативный закон); (2) А (В + С) = АВ + АС (3) (В + С) А = В А + СА (4) т (АВ) = (mA) В = А (тВ)„ где т — скаляр. Читатель должен был заметить, что умножение матриц не комму- тативно, т. е., вообще говоря, АВ В А. Действительно, часто одно произведение (скажем, АВ) существует, а другое (ВЛ) не определено. Примеры ЛВ=Н=ВЛ. О 1 2 [Г* 7 Q -1 „ ' ° , а В А не определено. 2 и т I Упражнение 1.3.8 Проверьте справедливость теорем об умножении на примере этих матриц и ска- ляра т. Покажите также, что АВ =А В А, ВС СВ, С А АС. 1.3.7. ТРАНСПОНИРОВАННАЯ МАТРИЦА Определения (1) Матрицей, транспонированной к матрице 60
^12 ••• ^ln A = &21 ^22 ••• ^2П _^тп1Кт2 — ^mn— называется матрица ^11 ^21 • %*. A a12 a22 • am2 _ й1п ^2?» • • • ^mn — Таким образом, чтобы получить транспонированную матрицу, надо строки и столбцы исходной матрицы поменять местами. (2) Если А = А', то матрица А называется симметрической,. (3) Если А = — А', то матрица А называется кососимметрической. Примеры 1. 2. ГЗ 41 А "2 А = 3 4 41 следовательно, — симметрическая матрица. 3. А ’ 0 2 3' — 2 0 4 — 3 —4 О — З- — 4 О следовательно, матрица А — кососимметрическая. Л = 1 О 2 1 3 О 5 А 5 1 А 3 1 4 2 2 3 4 О 1 3 О 5 4 5 1 Упражнение 1.3.9 Г1 0 8—1“] 1. Транспонируйте матрицу 2 3 1 6—1 О 4 2 2. Покажите, что (Л'}' = A; mA’ = (т А)'; (Л + В)' = Л' + В’. 3. Покажите, что симметрическая матрица должна быть квадратной. 4. Покажите, что если Л — симметрическая матрица, то ац — ац для всех I, j. 5. Покажите, что если Л — кососимметрическая матрица, то (1)а,у = = — ац для всех i, j и (2) все элементы ац главной диагонали должны быть рав- ны нулю. 1.3.8. ОПРЕДЕЛИТЕЛЬ МАТРИЦЫ Каждой квадратной матрице А можно поставить в соответствие некоторое число, называемое определителем матрицы А; обозначим его | А |. Определитель матрицы вычисляется по ее элементам. 61
а) Определитель матрицы второго порядка. Определение. Пусть дана квадратная матрица второго по- рядка А — й11 °12 _#21 #22. Ее определителем называется число И1 = #11 #12 #21 ®22 — йц • #22 #21' ^12- 3. Процесс получения значения определителя можно изобразить в виде диаграммы: I a b I ,т2> , , I# d I c'-'-~d~ + a ' d ~ c ‘ b. Упражнение 1.3.10 Вычислите определители следующих матриц: ГЗ 21 Г—1 21 Г1 01 ГО 11 1. . 2. -3. .4. [2 1] [ -3 2j |0 1J [1 О] Га dl Г1 *1 Га-|-Ь а—Ь] Г Ю 111 5. . 6. .7. . 8. - [с b j 1.x 1J \а— Ь a+Z>J [ 12 13J б) Определитель квадратной матрицы третьего порядка. Каждому элементу квадратной матрицы (порядок которой больше или равен 3) можно поставить в соответствие два числа, называемые минором и алгебраическим дополнением. Мы покажем, как они вычисляются, а затем дадим формулу для вычисления определителя матрицы. Начнем с примера. Рассмотрим квадратную матрицу а b с 2 1 0 3 2 4 С каждым элементом верхней строки мы сопоставим определенную матрицу, получаемую из матрицы А мысленным вычеркиванием стро- ки и столбца, на пересечении которых стоит рассматриваемый элемент. Определитель полученной матрицы называется минором соответству- ющего элемента. 62
Минор элемента а равен минор элемента b равен минор элемента с равен = 4; = 8; = 1. 2 О 3 4 2 1 3 2 Каждый элемент квадратной матрицы имеет минор. Определим общую процедуру нахождения миноров. Определение. Минором элемента ац квадратной матрицы А = [а,;] (любого порядка) называется определитель матрицы, получаемой из матрицы А вычеркиванием строки и столбца, на пере- сечении которых стоит элемент Пример. В матрице а I) с 2 1 О 3 2 4 элемент а22 = I; он стоит на пересечении второй строки и второго столб- ца. При вычеркивании этих строки и столбца остается матрица а с 3 4 а с 3 4 3 : 4 следовательно, минор элемента п22 равен а с 3 4 = 4а — Зс. Определение. Алгебраическим дополнением элемента ац на- зывается минор элемента а^, умноженный на (—1)‘+Л Обозначив минор и алгебраическое дополнение через Мц и соответственно, мы можем написать = (—1)‘+7 • Мц. Примеры Рассмотрим матрицу 1 2 3 2 1 О 3 2 4 63
Выпишем несколько элементов и вычислим их миноры и алгебраические дополнения. Элемент >+/ Минор Алгебраическое дополнение #11 ~ 1 4+1=2 1 ° =4 2 4 (—I)2.4 = 4 #23 “ Ч 2 + 3 = 5 1 2=-4 3 2 ( —1)5-( —4) = 4 #31 = 3 3 + 1=4 23=-з 1 0 (-1)4.(-3) = -3 #32 = 2 3 + 2 = 5 1 з = —о 2 0 (-!)«.(-6) 6. Очевидно, что алгебраическое только знаком от соответствующего минора. Знаки алгебраических дополнений элементов лицы (на пересечении элемента ац): дополнение элемента отличается матрицы А i-й строки = leZjj] расположены в виде таб- и /'-го столбца стоит знак Atj для Упражнение 1.3.11 1. Вычислите миноры для всех элементов матриц: (1) ’ 2 1 О 3 1 4 —12 5 О Г 3 —1 2 4 2 Г 5 6 1 2 2. Вычислите алгебраические дополнения для всех элементов матриц из предыдущей задачи. Теперь мы в состоянии вычислить значение определителя третьего порядка. Определение. Пусть А — некоторая матрица третьего порядка °11 й12 °13 #21 #22 #23 ’ #31 G32 #33 а Ди, Д12, Д13 — алгебраические дополнения элементов аи, й12, а13 соответственно. Тогда определитель матрицы А равен з I | = С1ц Дц -|~ С12 ^12 + #13 -^13 = —J <hj ^lj‘ i=i 64
Замечание. В этом определении определитель вычисляется по элементам первой строки и их алгебраическим дополнениям. Можно показать, что если вычислить определитель по элементам и алгебраи- ческим дополнениям любой строки или столбца, то мы получим тот же результат. Например, если мы решим вычислять определитель по эле- ментам третьего столбца, то значение определителя получается сле- дующим образом: з | А | = О13 Л13 -|- 4723 ^23 @3'3 = — fli3^i3- I = i (Читатель должен проверить этот факт, раскрыв полностью оба выражения для определителя, — подставить вместо алгебраических до- полнений их выражения через элементы матрицы и показать равен- ство полученных таким образом сумм.) Примеры Найдем определитель матрицы 1 А= 2 2 3 1 О 2 4 3 тремя различными способами: (1) с помощью разложения по первой строке: (2) разложением по второй строке: 2 3 2 4 2 2 М| = -2 = __4—5 —0= —9; (3) разложением по второму столбцу: 1 3 2 0 |Л|=-2 3 4 4 = —16—5+ 12 = —9. Упражнение 1.3.12 1. Вычислите определитель матрицы из предыдущего примера по элементам и алгебраическим дополнениям (1) третьей строки, (2) первого столбца, (3) тре- тьего столбца. 2. Вычислите всеми возможными способами определители матриц: (1) 3 2 Г — 12 0 0 1 3 (2) —1 0 3' 1 0 4 0 1 2 (3) 0 —1 3 2 0 1 0 —2 I 3. Установите справедливость следующих теорем, пользуясь указаниями: (1) Если заменить строки матрицы столбцами с соответствующими номерами или же ее столбцы строками, то значение определителя не изменится. ia b I I а с и с dl \b d 3 Зак. 973 65
(2) Если в матрице поменять местами любые две строки или два столбца, то определитель новой матрицы будет равен определителю исходной матрицы с противоположным знаком. I a b I I с d I Сравните: С нс I с dl |а Ь | b а d с (3) Если в матрице какие-либо два столбца собой, то ее определитель равен 0. или две строки равны между a b I I а а Вычислите: , I a b I I с с 3 3 3 1 2 3 3 3 3 3 4 5 \ 3 4 5. 1—11 / (4) Если каждый элемент какой-либо строки или столбца матрицы умножить на скаляр, то определитель новой матрицы будет равен определителю исходной матрицы, умноженной на этот скаляр. (Чем это отличается от умножения мат- рицы на скаляр?) а b с d авните значения определителей: т та mb с d a mb I а /Л с md me md\ (5) Если каждый элемент какой-либо строки или столбца матрицы умножить на скаляр и сложить с соответствующими элементами любой другой строки или столбца, то определитель новой матрицы равен определителю исходной матрицы. авните значения определителей: a-j-mc b j-md| c d | ’ a fe-|-3a c d-\-3c а b с d Замечания. Эти теоремы справедливы для определителей любого по- рядка. Их применение может сильно упростить процесс вычисления определителя. 4. Вычислите определитель 1 2 3 2 4 7 3 5 2 руководствуясь следующими указаниями: (1) Умножим элементы первого столбца на —2 и прибавим их к соответствую- щим элементам второго столбца. Определитель преобразуется в такой: 1 0 3 2 0 7 3 —1 2 По теореме (5) из задачи 3 значение определителя не изменится. (2) В новом определителе умножим элементы первого столбца па —3 и сло- жим их с соответствующими элементами третьего столбца. (3) Вычислите полученный определитель разложением по первой строке. (Проверьте результат, вычислив определитель исходной матрицы в соответствии с определением.) а b с 5. Рассмотрим матрицу def g h i Пусть алгебраические дополнения элементов первой строки равны соответствен-- но А, В, С; для элементов второй строки—D, Е, F и т. д. Покажите, что aD + ЬЕ + cF = 0 и аВ + dE + gH = 0. Найдите еще де- сять аналогичных выражений, равных нулю. Для этого рассмотрите матрицы, - 66
состоящие из элементов а, b, с, d, е, f, g, h, i и имеющие две одинаковые строки или два одинаковых столбца. Определитель каждой из этих матриц есть выра- жение указанного вида. 6. Вычислите следующие определители, пользуясь методом задачи 4: (1) 2 1 4 3 5 1 1 3 4 1 3 2 2 4 6 1 5 2 (2) (в примере (2) для второй матрицы сначала поменяйте первый и второй столбцы местами); (3) 2 3 5 2 1 4 1 0 4 (поменяйте местами первую и третью строки). в) Общий случай: определитель матрицы «-го порядка. Определение, данное для определителей третьего порядка, можно очевидным обра- зом обобщить. Определение. Пусть А — квадратная матрица «-го порядка; А = [«/;]; Au — алгебраическое дополнение элемента ац. Тогда определитель матрицы А равен п | | = «11 Лц + «12 Л12 + -Ь«1п'^1П== «11-^11- /=1 Результат не изменится, если при вычислении определителя взять произвольную строку или столбец и их алгебраические дополнения. Пример Пусть А = "1 2 1 0 0 0 2 1 2 1 0 о г о 2 1 По первой строке элементов получим их алгебраическим дополнениям и 2 0 1 2 0 0 1 о о 2 |Л|= + 1 2 0 2 —0 1 0 о 2+2 122—1 120 1 0 1 0 1 0 1 0 1 1 0 1 0 Вычислив четыре определителя третьего порядка, получим значение определителя | А |. Упражнение 1.3.13 1. Вычислите до конца определитель матрицы А в предыдущем примере. 2. Вычислите | А | в предыдущем примере по элементам и алгебраическим дополнениям элементов (1) второй строки, (2) третьей строки, (3) четвертой строки, (4) второго столбца, (5) четвертого столбца. 3* 67
1.3.9. ПРИСОЕДИНЕННАЯ МАТРИЦА Из любой квадратной матрицы можно получить некоторую другую матрицу, называемую присоединенной к матрице А. Мы опишем процедуру нахождения присоединенной матрицы третьего порядка; обобщение на матрицы п то порядка очевидно. Пусть 4ZU й12 О13 Л = О21 ^23 _с:зп а32 a3S _ Тогда (1) заменим каждый элемент ац матрицы А его алгебраическим дополнением АТаким образом мы получим матрицу алгебраических дополнений С = Лц А12 Л13 Л21 Л22 Л23 Л31 Л32 Л33_ (2) Транспонируем матрицу С; результат транспонирования на- зывается матрицей, присоединенной к А'. Мы будем обозначать ее через Лц -^21 Л31 Adj (Л) = С = Л12 Л22 Л32 Л13 Л23 Л33_ (Ясно, что на практике шаги (1) и (2) могут быть сделаны одновременно.) Пример '3 1 О' л = 0 2 2 1 3 0 -- 2 2 0 2 0 2 (1) Аг = + 3 0 — -—6; Л12 = 1 0 = 2; Л13= + 1 3 = —2; 1 0 3 0 3 1 /121 ~~~ = 0; Л22 = + = 0; Л23 = — = —8; 3 0 1 0 1 3 Л31 == -j- 1 0 -= 2; Л32 = . 3 0 ——6; Л33 = 4- 3 1 = 6. 2 2 0 2 0 2 Матрица алгебраических дополнений — 6 2 — 2 О 0—8 2—6 6 68
(2) Транспонируем матрицу С. Получаем Adj^A) = С' = —6 0 2 2 0—6 -2 —8 6 Общее определение присоединенной матрицы. Описанная про- цедура мо?кет быть обобщена на матрицы п-го порядка. Определение. Пусть А — матрица п-го порядка, А — latjl. Тогда матрицей алгебраических дополнений С = [AfJ называется матрица, элементами которой являются алгебраические дополнения соответствующих элементов матрицы А. Матрица, при- соединенная к А, равна матрице, транспонированной к С: Adj (А) = с = ад. Упражнение 1.3.14 1. Составьте матрицы алгебраических дополнений к матрицам (!) , [3 2 1 (2) [-141 (3) Г1 01 /1=1 ; о = ; 7 = I I: L1 4 J [о 2J [о 1] (4) 2 1 5' р= —320 2 0 1 (5) [—2 4 1 F = 0 3 2 0 1 0 (6) G = “1 0 1 О' 0 10 1 1 1 0 1 -1 0 1 0. 2. Выпишите матрицы, присоединенные к А, В, I, Е, F, G. 1.3.10. ОБРАЩЕНИЕ МАТРИЦЫ В поле действительных чисел для каждого ненулевого числа а мы можем найти число Ь, такое, что а • b = 1. Например, если а ~ 3, то b = Vg; если а = л, то b = 1/л и т. д. Число b называется обратным к а, и часто пишут b = а~г. Естественно выяснить, какая матрица А может иметь обратную матрицу А-1, такую, что А • А^ = I (единичная матрица). В этом параграфе мы установим, при каких условиях матрица имеет обрат- ную, и покажем, как вычисляется обратная матрица (при выполнении этих условий). Сначала рассмотрим числовой пример. Возьмем матрицу второго порядка Требуется найти матрицу В = а b с d такую, что АВ = I (т. е. В = А-1). 69
Другими словами, мы ищем значения a, b, с, d, при которых 2 Г 'а 3 4] [с dj 1 О О I Перемножим матрицы, стоящие в левой части этого матричного урав- нения. В результате получаем матрицу 2а + с 2b + d За + 4с 3b + Ad а уравнение преобразуется в следующее: 2а + с 2b + d 10 За + 4с 3b + 4d 0 1 В соответствии с определением равенства матриц получаем четыре уравнения: 2а + с = 1; (1) За + 4с = 0; (2) 2b + d = 0; (3) ЗЬ + 4d = 1. (4) Решая совместно уравнения (1) и (2), находим а = 4/5, с = —3Л>> а решая совместно уравнения (3) и (4), получаем Ъ = —d = f/5. Следовательно, А~1 = В = 4 5 2 5 Проверка-. '2 Г 3 4 5 2 5 2Д 5 2 5 АА-1^ Упражнение 1.3.15 1. Покажите, что в предыдущем примере произведение АА~г равно I. 2. Найдите обратную к каждой из матриц: (1) 13 21 (2) Г4 11 (3) Г—1 31 (4) Г4 61 [г г]’ [з г]’ [—2 г]’ [б з] 3. Покажите, что для каждой из матриц задачи 2 выполняется А~1А = = I = АА-1. 4. Для каждой из матриц задачи 2 определите: (1) | А |; (2) Adj ( А ); (3) (1/ | А |) Adj (Л), сравните результаты с обратными матрицами, найденными в задаче 2. 70
Условия существования обратной матрицы. Формулы для вычис- ления обратной матрицы. Сформулируем без доказательства условия, при которых можно обратить матрицу (т. е. найти ей обратную). За- тем мы дадим формулу для ее вычисления. (1) Условия: матрица имеет обратную тогда и только тогда, когда: (а) она квадратная; (б) ее определитель не равен нулю. (Замечание. Квадратная матрица называется вырожденной, если ее определитель равен нулю; таким образом, только квадратные невырожденные матрицы имеют обратные.) (2) Формула для вычисления обратной матрицы. Чтобы обратить квадратную невырожденную матрицу, надо присоединенную к ней матрицу умножить на 1/|А|, т. е. А~г — (1/|А|) Adj (А). Примеры 1. Рассмотрим числовой пример из 1.3.10 и найдем обратную к А матрицу по указанной выше формуле: А = 2 Г 3 4 А-1=-А-Аб//(А) = = 1/5 2 3 — 11 2 4 —Г — 3 2 4 —3 1 1 4 2. Найти обратную к матрице 1 о 2 4 3 0 0 1 1 А = Решение 4 3 0 0 1 1 1 |А|= 0 2 Следовательно, А-1 = 11; Adj{A) = Adj(A) = -4- —4 1 8 3 —4 2 — 6 3 2 — 6 4 — 1 3 1 1 8 4 — 1 3 1 4 0 Проверка: АА-1 = 0 3 1 -1/11 —4 1 8 2 0 1 3 2 — 6 4 — 1 3 = 1/11. 11 о о 0 11 0 0 0 11 = 7. 71
Заметьте также, что 1/11 Вообще говоря, можно показать, что если АВ = /, то и BA = /. Следовательно, если матрица В — обратная к матрице А, то и мат- рица А — обратная к матрице В. (Это совсем не очевидно: вспомните, что умножение матриц некоммутативно.) Упражнение 1.3.16 1. Найдите матрицы, обратные к матрицам задачи 1 из упражнения 1.3.14. В каждом из случаев, покажите, что АЛ-1 — I = Л-1Л. 2. Дана матрица Ь е М = а d .g h с f i Найдите произведение М Adj (Л4). Каждый элемент этого произведения есть выражение типа аА + ЬВ + сС; воспользуйтесь результатами задачи 5 из уп- ражнения 1.3.12 и покажите, что матрица М • Adj (М) равна ~|/И| 0 0 ' О \М | О О 0 | М| Покажите, что М М-1 = I. 3. Найдите обратные матрицы: 1 0 2 2 3 0 1 0 1 (1) Г1 °] | 2 з] 1 02 Г 2 3 0 0 10 10 0 2 2 1. 4. Матрица называется треугольной, если все элементы над главной диаго- налью (или под главной диагональю) равны нулю. Найдите обратные для сле- дующих матриц: 1 0 0 (1) а 0'1 с dj (2) Га Ь] [О d]’ (3) Г1 2 Г (4) (5) 12 3 4 0 10 2 0 0 2 1 .0 0 0 1. 0 1 2 0 0 1 2 2 0 4 1 3 1.3.11. РЕШЕНИЕ СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ В заключение этой главы покажем, как алгебра матриц приме- няется при решении системы п линейных уравнений с п неизвестными. Рассмотрим систему уравнений: 72
a х2+ ... +aln хп = Ьр, х2 + ... + а2л хп = Ь2; (1) "4~ апп хп — ^п- Коэффициенты ац и свободные члены—известные числа, xlt хг, ..., хп — неизвестные. Коэффициенты системы могут быть записаны в виде матрицы Д = [а,;], неизвестные образуют вектор-столбец х, а свободные члены образуют вектор-столбец Ь. Тогда систему уравнений можно очень просто записать в матричной форме: Дх = Ь, (2) где Д — квадратная матрица n-го порядка. Мы знаем, что она имеет обратную тогда и только тогда, когда | Д | 0. Можно показать, что это условие в точности совпадает с условием существования един- ственного решения системы линейных уравнений с п неизвестными. После всего изложенного это не слишком удивит читателя. Итак, если у системы существует единственное решение, то мы мо- жем найти обратную матрицу для Д. Умножив обе части уравнения (2) на А~\ получаем (Д-М)х = Д-1Ь, что приводит к решению х = Д-1Ь (так как А"1 Ах = 1х = х). Примеры 1. Решить систему уравнений с помощью матричного метода: (Зх + у = 7; (2х—«/ = 3. Решение. Запишем систему в матричной форме: ’ 7 ' 3 ’ '3 Г 2 —1 x \_У J т. е . Дх = Ь. (Читатель должен проверить, что матричное уравнение эквивалентно исходной системе двух уравнений.) Тогда Д"1 = Adj (Д) = — I Г — 1 —1 — 2 3 LU Следовательно, х = 2 и 1 Г-1 5 —2 5 — 1 Г7 3 3 и х = Д-1 b, 2 1 2. Решить систему: у = 1. (Проверка: Зх + у = 6 + 1 = 7.) х + у — z = 1; у + г = 2; х — у = О матричным методом. 73
Решение 1 О 1 А = 1 1 — 1 Следовательно, х — 1, у = 1, г = 1 + 1 - 1 = 1) = 1. (Проверка: х + у — г = Упражнение 1.3.17 Решить системы линейных уравнений с помощью матричного метода: 1. 4. Зх—у= 1; *4-2у=5; 2х—p+z = 3; 2y-z=l; 2. Is— 2/= — 3; (3s+/=—2; 5. (х+у+г=3; j у—2z«f — 1; I х—у—z=* —1; 3. I 2%+3w—6=0; t x—4a<+8 = 0; 6. [3p |-4?+5r=ll; < p+<7—r = 3; l29+r = 4.
1.4 ГЛАВА НЕРАВЕНСТВА 1.4.1. ВВОДНЫЕ ЗАМЕЧАНИЯ В повседневной жизни нам приходится постоянно что-либо срав- нивать — людей или некоторые объекты. Мы мысленно их упорядо- чиваем в соответствии с такими характеристиками, как сообразитель- ность, ловкость, красота, значимость и т. д. Сравнение двух объектов по каким-либо параметрам — одна из основных математических опе- раций. Существенной частью научной деятельности является сопостав- ление либо чисел, либо математических выражений, которые могут принимать числовые значения. Операциями над математическими вы- ражениями, содержащими неравные величины, занимается теория не- равенств. В этой главе мы рассмотрим отношения порядка между действи- тельными числами, докажем теоремы о неравенствах. Мы покажем, что неравенства с одним или большим числом неизвестных определяют множества чисел или точек. 1.4.2. УПОРЯДОЧЕНИЕ ДЕЙСТВИТЕЛЬНЫХ ЧИСЕЛ Известно, что действительные числа можно упорядочить: если даны два числа а и Ь, то имеет место одно из трех: либо а равно числу Ь, либо оно больше числа Ь, либо меньше его. Мы определим понятие упо- рядочения чисел, опираясь на более простое понятие положитель- ности числа. а) Понятие положительности числа. Множество действительных чисел может быть разбито на три множества, а именно множество поло- жительных чисел, множество {0} и множество отрицательных чисел. Множество положительных чисел полностью описывается следующими аксиомами. 1. Если а — действительное число, то верно только одно из ут- верждений: а — положительное число; а равно 0; (—с) — положительное число. 2. Если а и b — два произвольных положительных действительных числа, то их сумма и произведение будут также положительными дей- ствительными числами. б) Отношение порядка. Пользуясь понятием положительного чис- ла, мы можем ввести отношение «больше» на множестве действитель- ных чисел. 75
Определение. Если разность {а — Ь) есть положительное число, то а больше, чем Ь. Если разность (а — Ь) есть положительное число или нуль, то либо а больше, чем Ь, либо а равно Ъ. Замечание. Символ > означает «больше», символ означает «больше или равно». Таким образом, выражение а> b читается: «а больше Ь», выражение а~^Ь читается: «о больше или равно Ь». Кроме того, существуют символы <; и а < Ъ («а меньше Ь»), т. е. Ь> а\ а Ъ («а меньше или равно &»), т. е. Ъ а. Отношения порядка обозначаются знаками неравенств: <Z, sC, > и ^г. (Отношения порядка > и < называются строгими неравен- ствами.) Примеры 1. Так как (3 — 2) — положительное число, то мы можем напи- сать 3 > 2 или 2 <Z 3. 2. Если х — произвольное действительное число, то (х — 2)2 — либо положительное число, либо нуль. Поэтому мы можем написать (х — 2)2 > 0 или 0 < (х — 2)2. 3. Так как разность (—2) — (—5) есть положительное число, то можем написать — 2 > — 5 или —5 < — 2. 4. Поскольку разность между нулем и отрицательным числом есть число положительное, то можно написать 0 > (отрицательное число), например 0 > — 4. 5. Выражение х 4 означает, что х — действительное число, которое больше или равно 4. 1.4.3. ПРОСТЫЕ ДЕЙСТВИЯ НАД НЕРАВЕНСТВАМИ Действия над неравенствами основаны на следующих теоремах. Теоремы. Пусть a, b, с, d — действительные числа. (1) Если а> b nb>c, то а > с. (Отношение «больше» транзи- тивно.) (2) Если а >6, то а-]-с>Ь-\-с. (Прибавление действительного числа к обеим частям неравенства не изменяет его смысла.) (3) Если а > b и с > 0, то ас > Ьс. (Умножение обеих частей не- равенства на одно и то же положительное действительное число не изменяет смысла неравенства.) (4) Если а > b и с<0, то ас < Ьс. (Умножение обеих частей не- равенства на одно и то же отрицательное действительное число изме- няет знак неравенства на противоположный.) (5) Если a>bnc>d,ma + c>b + d. (Это справедливо и при с d.) Если в теоремах (1) — (5) отношения > и < всюду заменить на и соответственно, то получим пять новых теорем. Доказательства. Укажем основные моменты доказатель- ства теорем (1) — (5). 76
(1) Разность а — с = (а — Ь) + (Ь — с). Она является положи- тельным числом, так как оба выражения, заключенные в скобки, положительны. Следовательно, а > с. (2) Так как (а + с) — (Ь + с) = а — Ь > 0, то а + с > Ь + с. (3) ас — Ьс = (а — Ь) с\ произведение, стоящее в правой части, имеет знак множителя с, поскольку а —Ь положительно. Следова- тельно, при О 0 ас > Ьс. (4) Выражение ас — Ьс отрицательно при с < 0 в силу соображе- ний, приведенных при доказательстве предыдущей теоремы. Следо- вательно, — (ас — Ьс) — Ьс — ас > 0, так что Ьс > ас. (5) (а — Ь) + (с — d) > 0, так как оба выражения в скобках по- ложительны. Перегруппировав члены, получим (а + с) — (b + d) > > 0. Следовательно, а 4- с > b + d. Читатель должен обратить особое внимание на теорему (4), в ко- торой говорится, что при умножении или делении неравенства на от- рицательное число смысл неравенства меняется на противоположный. Примеры 1. (1) Неравенство 5>3 перейдет в неравенство 9 > 7, если к обеим его частям прибавить 4; оно перейдет в неравенство —2 > —4, если из обеих частей вычесть 7. (2) Неравенство 6 > 3 перейдет в неравенство 18 > 9, если обе его части умножить на 3; оно перейдет в неравенство —12 < —6, если обе части его умножить на —2. (3) Неравенство 4^1 перейдет в неравенство — 4/3 4/ — 1/3, если обе его части разделить на —3. 2. Если х > 2 и у > 3, то, рассматривая всевозможные пары (х, у), определите наибольшее число, меньшее чем 2х + 3 у. Решение. По теореме (3) мы имеем 2х>4пЗу>-9. Тогда по тео- реме (5) 2 х + 3 у > 4 + 9 — 13. Это значит, что наибольшее число, меньшее чем 2 х + 3 у, равно 13. 3. Если х < 4 и у 4/ 5, то каково наименьшее число, большее чем 3 х + 4у? Решение. По теореме (3) 3 х < 12 и 4у 4/ 20; тогда по теореме (5) 3 х + 4 у < 32. Следовательно, 32 есть наименьшее число, большее чем 3 х + 4 у. 4. Если х 2 и у 4, то каково минимальное значение выра- жения 5 х + 2 у? Решение. По теореме (3) мы имеем 5 х 10, 2 у 8; тогда по тео- реме (5) 5 х + 2 у 18. Следовательно, минимальное значение выра- жения 5 х + 2 у равно 18. 5. Если х > 2 и у < 4, то каково наибольшее число, меньшее чем Зх — 7у? Решение. Мы имеем 3 х > 6 и —7у > — 28. Складывая эти два не- равенства, получаем 3 х — 7 у > —22. Следовательно, наибольшее число, меньшее чем 3 х — 7 у, равно — 22. 77
Упражнение 1.4.1 1. Выпишите неравенства, получающиеся из неравенства х > 5, если его (1) умножить на 4, (2) разделить на 6,(3) умножить на—3, (4) разделить на—5 и (5) разделить на —3/4. 2. Если х > 4 и у > 5, найдите наибольшее число, меньшее чем 5 х т 6 у. 3. Если х < 2 и у < 9, найдите наименьшее число, большее чем 4 х + 2 у. 4. Если х > 1 и у 4, найдите наибольшее число, меньшее чем 7 х + 8 у. 5. Если х х 3 и у < 8, найдите максимальное значение выражения 2 х+ 10 у. 6. Если х <Z 4 и у > — 2, найдите наименьшее число, большее чем 3 х — бу. 7. Если x^3hj ’С 7, найдите минимальное значение выражения Зх-—8 у. 8. Покажите, что если 0 < а <С Ь, то 1'а 1/Ь. (При обращении обеих ча- стей неравенства, связывающего положительные величины, знак неравенства меняется на противоположный.) 1.4.4. ДВОЙНЫЕ НЕРАВЕНСТВА Определение. Выражение а С Ъ < с означает, что как а < Ь, так и b < с. Аналогично а sC b с означает, что одновременно a b и b с; выражение а < b с означает, что а < b и b с. 1.4.5. интервалы Определения. Пусть а и b — действительные числа, при- чем а < Ь. Тогда множество всех действительных чисел х, удовлет- воряющих неравенству a<Zx<Zb, называется интервалом от а до Ь; множество всех действительных чисел х, удовлетворяющих неравен- ству а х Ь, называется отрезком от а до Ь; множества всех дей- ствительных чисел х, таких, что а < х b или а х < Ь, называются полуинтервалами (или полуотрезками). Точки а и b называются концами интервала или отрезка. Заметим, что концы интервала не принадлежат множеству точек интервала; концы отрезка принадлежат множеству точек отрезка; в полуинтервал входит один из его концов и не входит другой. Множество действитель- ных чисел х, удовлетворяющих неравенству х < а (или х > а), назы- вается открытой полупрямой, а множество чисел, удовлетворяющих неравенству х а (или х а), называется замкнутой полупрямой (иногда эти множества называют бесконечными интервалами}. Обозначения. Интервал {х:а<_х<.Ь} можно коротко обозначить через или просто (а, Ь). Множество точек отрезка {х : а х sgC b } можно обозначать через а х Ь, или [а, Ь]. Полуинтервалы можно записать в виде неравенств а < х Ь, а^ х < b (или (а, &], [о, Ь) соответственно). Иногда пользуются другими обозначениями, а именно:. 1а, &[, 1а, &], [а, Ь{ — для интервала, отрезка и полуинтервала соответственно. Примеры На рис. 17 изображены рассмотренные выше типы множеств на прямой. 78
2(х<5 (интервал) ---------— 2(.х<5 (отрезок) ----•---j--- 2<х£.5 (полуинтервал)----•--- 2^х<5 (полуинтервал)--*------ Полупрямые -е—~—£— ——» s х<2 Х(.2 х>2 XJ.2 Рис. 17 Упражнение 1.4.2 Изобразите следующие множества на действительной прямой: 1. 3<х < 8; 2. 4 < х < 9; 3. — 5 < х < 0; 4. — 1 < х < 2; 5. х > 6; 6. х > — 6; 7. х < — 1; 8. х «С 3; 9. —4 < х; 10. —3 < х < 4. 1.4.6. НЕРАВЕНСТВА СО ЗНАКОМ МОДУЛЯ Определения. Символ | х| читается как модуль х и опреде- ляется следующим образом: х, если х 2>0; —х, если х<0. |х | также называется абсолютной величиной х. Примеры 1. 13| = 3; 2. 2 | = 2; 3. |—0,13 | = 0,13. Запись |х| < k, где k > 0, равносильна двойному неравенству— —k<ix<Zk. Аналогично формула |х] k, kZ^O, равносильна двой- ному неравенству — k <1 х si k. Примеры 1. Запись |х| < 4 равносильна неравенству — 4 < х < 4. 2. Запись |х| 3 равносильна неравенству — 3 =С х 3. 3. | х21 = х2, если х — действительное число (так как х2— всегда неотрицательное число). 4. Неравенство — 4 <х ф 2< 4 может быть записано как |х + 21 <4. 5. Запишите неравенство —4 < х < 6, пользуясь знаком модуля. Решение. Так как —4 < х, то —5 <; х — 1, а так так х < 6, то х — 1 < 5. Поэтому —5 < х — 1 < 5, а это неравенство может быть записано в виде |х — 1 | < 5. 1.4.7. ОДИН ИЗ СПОСОБОВ ДОКАЗАТЕЛЬСТВА НЕРАВЕНСТВ Известно, что квадрат любого действительного числа всегда неот- рицателен. Это свойство лежит в основе доказательства многих нера- венств. Покажем это на примерах. 79
Примеры 1. Докажите справедливость неравенства (х2 4- 2х + 4) 3 для всех действительных значений х. Решение, х2 + 2х + 4 = (х + I)2 + 3, а так'как (х + I)2 О для всех действительных значений х, то (х2 4~ 2 х 4- 4) 3. 2. Показать, что для всех действительных значений х и г/х2 + г/2 > 2 ху. Решение, (х — у)2 0 для всех действительных значений хну. Поэтому х2 — 2 ху + у2 0 и, следовательно, х2 + У2 2 ху. 3. Для каких значений х справедливо неравенство х2 + 6х—16<0? Решение. Выделив в левой части неравенства полный квадрат, получим (х + 3)2—25 < 0, т. е. (х + З)2 < 52. Из этого следует, что | х-[-31 < 5, т. е. —5 < х 4- 3 < 5, или —8 < х < 2. Следова- тельно, неравенство х2 + 6х — 16 < 0 справедливо для значений х, удовлетворяющих неравенству — 8 < х < 2. Упражнение 1.4.3 1. Запишите следующие неравенства с помощью знака абсолютной величины: (1) — 1 < х + 1 < 1; (2) — 5 < х + sin х < 5; (3) 1 < х < 4; (4) — 3 < х < 6; (5) — 2 < х + 1 < 5; (6) а < х < Ь. 2. Покажите, что для произвольных действительных чисел а и Ь верны сле- дующие утверждения: (1) I а | 0, причем Ы = 0 тогда и только тогда, когда а = 0; (2) — |а| < а с|а|; (3) | ab | = | а |-| b |; (4) | a-\-b | < | а Ц-1 b |; (5) |а+б | >|а|—|Ь|; (6) |а+Ы > ||а|-|6||. 3. Запишите следующие неравенства в виде двойных неравенств: (1) |х|<5; (2)———<3; (3) | х | > 3 (используйте (2)); (4) |х—1|<^; | х | 2 I 1 I 1 I 1 I 1 (5Т+т|<т: (6)Нт|>т- 4. Докажите неравенства: (1) а + b 2 ~\/ab (рассмотрите выражение (~|/а — V*)2). (2) а2 + 62 + с2 ab + be 4" са. 5. Для каких значений х справедливо неравенство | 3 х — 1 | > 4? 6. Для каких значений х справедливо неравенство х2 + 4х + 1 >0? 1.4.8. ЛИНЕЙНЫЕ НЕРАВЕНСТВА Неравенства вида ах + b > 0, а Ф 0 (а также ах 4- b < 0, ах + b 0, ах + b 0) называются линейными неравенствами, или неравенствами первой степени. Линейные неравенства могут вклю- чать более чем одно неизвестное, например Зх 4- 4 у 2. Такие неравенства играют важную роль в теории линейного про- граммирования (см. третью часть книги). Мы введем основные понятия, необходимые для изложения этой теории. ео
а) Неравенства с одним неизвестным, (1) Одно неравенство. Рассмотрим неравенство Зх + 6 > 0; это линейное неравенство с одним неизвестным х. Множество значений х, для которых неравенство справедливо, называется множеством ре- шений неравенства. Легко видеть, что множеством решений неравен- ства Зх + 6 > 0 будет множество {х : х > — 2}; это открытая полу- прямая (см. 1.4. 5), изображенная на рис. 18. t Множество решений неравенства __1___ЕГ-2 21 / 2 Z / z1 И 2 2 I/ 2 21 2 2 я 2 -3-2-7 О 1 г з 4 Действительная ось Рис. 18 В общем случае неравенство ах + b > 0 определяет открытую полупрямую —Ыа, если <х>0, и открытую полупрямую x<Z—Ыа, если а < 0. Нестрогое неравенство ах + b 0 определяет замкнутую полу- прямую хДь—b/а, если а>0, и замкнутую полупрямую —Ыа, если а < 0. (2) Два или более неравенств. Два неравенства вида: ( Зх + 6>0; ( х— 1 < 0, (1) (2) относительно которых ставится вопрос об отыскании их общих ре- шений, образуют систему неравенств первой степени с одним неизве- стным. Множество решений первого неравенства есть {х : х > — 2}, в то время как множество решений второго неравенства — {х : х< 1}. Эти множества могут быть изображены на числовой прямой, как по- казано на рис. 19. Все точки, принадлежащие их пересечению, удов- летворяют обоим неравенствам. Таким образом, множеством решений системы неравенств (1) и (2) будет интервал (—2<х < 1). /Множестворешений неравенства Vе зх+е>о ' -34 -2 ~7 О у 2 3 4 Действительная ось Множество решений неравенства х-7 < О Рис. 19 Аналогично решением системы, состоящей из трех неравенств: Зх + 6>0; х— 1 < 0; 2х+1>0, (1) (2) (3) 81
будет интервал (—V2 < х < 1), который получается пересечением трех полупрямых: х > —2, х < 1 и х > —г/2. Каждая из полупрямых изображает множество решений первого, второго и третье! о неравенств соответственно. В общем случае решение системы п линейных неравенств с одним неизвестным есть интервал, представляющий собой пересечение п множеств решений отдельных неравенств. (Заметим, что пересечение может оказаться пустым множеством, например нет таких значений х, которые бы удовлетворяли как неравенству х — 2 > О, так и неравен- ству х — 2 < 0.) Упражнение 1.4.4 1. Изобразите интервалы, определяемые следующими неравенствами: (1) —х+2>0; (2) —х + 2>0; (3) ~х—3<0; (4)—-^-х—3<0; (5) —8x4-11 >0. 2. Найдите решения следующих систем неравенств: (1) (х>0; |х—3 < 0; (3) [х>0; <х—3 < 0; (х —1 > 0. (5) /х—1>0; (х— 1 <0; (7) !-2х+4<0; (2х —10 ' 0; (2) (х>0; |х — 3 < 0; (4) /х —1 >0, ]х—1 <0; (6) /х —1 > 0; 1х—1 0; 1 — *4~4<°; — х-|-3>0; х+1 > 0. б) Неравенства с двумя неизвестными. (1) Одно неравенство. Рассмотрим линейное неравенство х+у> 1. Множеством решений этого неравенства будет множество всех упо- рядоченных пар (х, у), таких, что х + у > 1. Геометрически оно может быть изображено как множество точек на декартовой плоскости, ле- жащих выше прямой, задаваемой уравнением х 4* 1/ = 1 (рис. 20). Покажем, что все точки, лежащие выше прямой, принадлежат множеству решений и никакая точка, лежащая ниже, не принадлежит ему. Рассмотрим вначале произвольную точку Р (х, у), расположенную над прямой (как показано на рис. 20). Ее ордината пересечет прямую х + у = 1 в некоторой точке Q (х, у'), причем у' < у (по определению точки Р). Тогда ху > х-'гу' =1, и, следовательно, точка Р принад- лежит множеству решений неравенства. Рассмотрим теперь произвольную точку Р (х, у"), лежащую ниже прямой. Мы имеем у" < у', и, следовательно, х 4- у" < х у' = 1. Таким образом, точка Р не принадлежит множеству решений нера- венства X 4- у > 1. Вообще прямая ах by = с определяет три множества точек на декартовой плоскости, а именно: 82
(1) полуплоскость, точки которой лежат под прямой; (2) множество точек прямой; (3) полуплоскость, все точки которой лежат над прямой. Следовательно, линейное неравенство с двумя неизвестными опре- деляет какую-либо полуплоскость (если неравенство строгое). Если не- равенство нестрогое ( либо либо s^), то оно определяет полупло- скость, объединенную с множеством точек прямой. (Уравнение прямой задается соответствующим равенст- вом.) От коэффициентов а, Ь, с зависит, какую полуплоскость определяет не- равенство. В отдельных случаях по- луплоскость легко определить, про- верив, удовлетворяется ли неравен- ство в начале координат (т. е. в точ- ке с координатами (0,0)). Если нача- ло координат удовлетворяет нера- венству, то содержащая его полупло- скость будет искомым множеством рис 2о решений. Если неравенство не удов- летворяется в начале координат, то искомой будет полуплоскость, не содержащая его в качестве одной из своих точек. Когда прямая проходит через начало координат, то можно проверить другие удоб- ные точки, например точку (0, 1). II римеры 1. Изобразите множество решений неравенства 2 х + у < 1. Решение показано на рис. 21. Замечания (1) Начало координат (0,0) удовлетворяет неравенству (так как 2 • 0 + 0 *< 1), следовательно, искомым множеством будет полупло- скость, содержащая точку О. (2) Неравенство строгое, поэтому точки прямой 2х + у — 1 не включаются в множество решений. 2. Изобразите множество решений неравенства —Зх 2у 6. Решение показано на рис. 22. Рис. 21 Множество реше ний неравенства -Зх + 2уь6 \- Множество реше-/ ний неравенства Прямая -Зх*2у=6 (точки Включены в множество ре- шений) Рис. 22 83
Замечание. Начало координат не удовлетворяет неравенству, поэтому множеством решений неравенства будет полуплоскость, не содержащая точку О. Упражнение 1.4.5 Изобразите множество решений каждого из следующих неравенств: (1) — х + у > 1; (2) — х + у < 1; (3) 2х — 3 у < 6; (4) х — 5у > 10; (5) — х — Чу < 6 (2) Система двух или более неравенств. Рассмотрим систему двух линейных неравенств с двумя неизвестными: I х —z/>0. (1) (2) Это система неравенств первой степени с двумя неизвестными. На рис. 23 показаны полуплоскости, определяемые каждым из неравенств. Двойной штриховкой изображено пересечение этих полуплоскостей. Точки плоскости, принадлежащие пересечению, удовлетворяют как первому, так и втором;? неравенству (т. е. это пересечение изобра- жает множество решений нашей системы неравенств). В общем случае система п линейных неравенств типа aiX-^biy^Ci, i = 1, 2, ...., п определяет некоторую область на плоскости ху. Эта область является пересечением п множеств решений отдельных нера- венств, (пересечением п_ пол у плоскостей). Примеру Изобразите множество решений системы трех неравенств: Решение. Искомое множество решений есть объединение множества точек, лежащих внутри треугольника А ВС (рис. 24), и точек отрезка АВ (исключая точки А и В). 84
Упражнение 1.4.6 1. Изобразите множество решений каждой из следующих систем неравенств: (1) (x + z/>2; |х + 41/>4; (3) fx-+-t/<2; 1x4-4// < 4; (5) 1x4-1/>2; {х-]-4у < 4; Ь>0; (2) . (х+у < 2; 1x4-41/>4; (4) . fx4- У > 2; 1х4-4{/<4; (6) 1 Гх4-1/<2; x-f-4y < 4; [х>0, у > 2. Покажите, что следующие системы неравенств несовместны (т.е. что множество решений каждой из них пусто, так как нет ни одной точки, удов- летворяющей одновременно всем неравенствам системы): (1) х+у > 1; х—у< 0; .х4-2у<1; (2) 2х—у > 3; х-Н 21/ < 4; 2х—у < —2. в) Система неравенств с тремя и большим числом неизвестных. Изложенные идеи можно обобщить на действия с линейными неравен- ствами, содержащими более двух неизвестных. Конечно, при трех или более неизвестных графическое представление множества реше- ний неравенств становится трудным или невозможным. Тем не менее мы продолжаем пользоваться геометрическими терминами и в этом, более общем, случае. Обобщая понятие прямой на плоскости на много- мерный случай, можно ввести понятие гиперплоскости, которое ока- зывается весьма полезным для решения возникающих при этом новых задач. Определение1 (1) Упорядоченное множество п чисел (х1т х2, ..., хп) называется точкой х в п-мерном пространстве. Числа xlt х2, ..., хп называются координатами точки х. (2) Множество точек «-мерного пространства, координаты которых удовлетворяют линейному уравнению /34X1 4~ ct2x2 4“ называется гиперплоскостью. (Заметьте, что при п = 2 это уравнение будет уравнением прямой-, при п = 3 это уравнение определяет пло- скость в трехмерном пространстве.) (3) Линейное неравенство типа «Л 4- а2х2 4- ... 4- апхп < b определяет область в n-мерном пространстве, называемую полупро- странством. Эта область состоит из тех и только тех точек х = (xlt х2, ..., хп), координаты которых удовлетворяют неравенству. 1 Понятия «-мерного вектора, «-мерного пространства очень глубоки. Чи- татель, встречающийся с ними впервые, несомненно, будет с трудом воспринимать приведенные короткие определения. Это означает, что к этому материалу следует вернуться в процессе усвоения теоретических основ линейного программиро- вания для повторного чтения и углубленного изучения. Эти замечания относят- ся также к последующим параграфам, излагающим понятие выпуклости. 85
1.4.9. ВЫПУКЛОСТЬ Очень важным понятием (играющим большую роль в теории мате- матического программирования) является понятие выпуклости. Сна- чала мы определим его для множества точек в двумерном пространстве (т. е. на плоскости); позже мы укажем, как определяется выпуклость в пространстве п измерений. а) Определение. Множество точек называется выпуклым, если от- резок прямой, соединяющий две произвольные точки множества, целиком принадлежит этому множеству. Замкнутым выпуклым множеством называется такое выпуклое множество, которое содержит все свои граничные точки. (Заме- чание. Обратите внимание, что пустое множество, как это следует из определения, выпукло.) Примеры и контрпримеры Заштрихованные области на рис. 25 представляют собой выпуклые множества. В каждом из случаев отрезок, соединяющий пару произ- вольных точек Р и Q выпуклого множества, целиком лежит в заштри- хованной области. Внутренность круга Пересечение двур полуплоскостей Внутренность многоугольника (сравните с контр- примером, приведенным r г на рис. 26) Рис. 25 Читателю нетрудно будет найти для каждой из областей, изобра- женных на рис. 26, принадлежащие ей точки Р и Q, через которые нельзя провести отрезок, целиком лежащий в этой области. Заштрихованные на рис. 26 области не выпуклы, так как прямо- линейные отрезки PQ не лежат целиком внутри областей. б) Пересечение выпуклых множеств. Мы докажем простую теорему о выпуклых множествах. На основе этой теоремы получены весьма глубокие результаты, играющие важную роль в теории линейного программирования. Теорема. Пересечение двух или более выпуклых множеств является выпуклым множеством. 86
Доказательство. Пусть А и В — два произвольных вы- пуклых множества. Их пересечение обозначим I = А Г| В (на рис. 27 изображен двумерный случай). Мы хотим показать, что I — выпуклое множество. Пусть Р и Q — две произвольные точки из /. Тогда, так как А — выпуклое множество, все точки отрезка PQ принадлежат множеству А. С другой стороны, так как В — выпуклое множество, все точки отрез- ка PQ принадлежат множеству В. Следовательно, все точки отрезка PQ принадлежат как множеству А, так и множеству В\ следовательно, отрезок PQ целиком принадлежит пересечению множеств А и В, т. е. множеству 1. Таким образом, I — выпуклое множество. Невыпуклая Внутренность многоугольника Рис. 26 По индукции можно доказать, что пересечение любого счетного1 * * * * * * В наоора выпуклых множеств есть также выпуклое множество. Обобщение. При переходе к и-мерному пространству нагляд- ные геометрические представления должны быть выражены в алге- браических терминах. В определении выпуклости в n-мерном случае ключевым моментом является обобщенное алгебраическое определение отрезка. Читатель, несомненно, знаком с его определением для случая двух измерений (т. е. декартовой плоскости). Мы повторим это определение и предлагаем читателю в виде упражнения распространить его на п-мерный случай. Определение. Отрезком, соединяющим две точки Р (хп г/J и Q (х2, г/J, называется множество всех точек (х, у), координаты которых вычисляются по формулам: х = mxl +J1 — т) х2; 1 Слово «счетный» употребляется в специальном математическом смысле. Говорят, что совокупность объектов счетна (в нашем случае совокупностью бу- дет класс выпуклых множеств), если можно установить взаимно-однозначное соответствие между этими объектами и элементами ряда натуральных чисел 1, 2, 3, ..., п. Такая совокупность может быть конечной (объекты можно сосчи- тать и занумеровать с помощью п натуральных чисел) или бесконечной (процесс нумерации не может быть завершен; рассмотрите, к примеру, множество нату- ральных четных чисел {2, 4, 6, ...}). Если взаимно-однозначное соответствие между элементами множества и эле- ментами натурального ряда установить невозможно, то множество несчетно. В качестве примера несчетного множества можно привести множество точек от- резка [0, 1] на действительной числовой оси. 87
у = ту1А (1 — tn) y2, где параметр m удовлетворяет условию О tn 1. Пример ' Д® Пусть точка Р имеет координаты (1, 3), а точка Q— координаты (4,1). На рис. 28 отрезок PQ выделен жирной чертой; координаты всех его точек удовлетворяют уравнениям: х = т • 1 + (1 — т) • 4 = 4 — 3 т; у = т • 3 Т (1 — т) • 1 — 1 + 2 т, параметр т «пробегает» все значения из отрезка 10, 1]. Например, при tn = 1 уравнения дают нам точку с координатами х = 1, у = 3, т. е. точку Р; при zn = 0 полу- чаем точку Q. Любое другое значение т из отрезка 10,11 соответствует толь- ко одной точке, лежащей на прямой между точками Р и Q. «ч Замечание. Два уравнения, связывающие координаты точки и па- раметр т, называются параметрическими уравнениями прямой PQ. Упражнение 1.4.7 1. Получите уравнение прямой PQ в координатах х, у, исключив параметр т из параметрических уравнений. 2. Составьте параметрическое уравнение для точек отрезка, соединяющего точки Р (2, 5) и Q (—1, 4); найдите значение параметра т, соответствующее середине отрезка, и вычислите координаты его середины. 3. Выпишите параметрическое уравнение для координат (xb х2, ..., хп) точек отрезка, соединяющего точки А (щ, а2, .., «„) и В (bi, Ь2, .... Ьп) в п-мерном пространстве (т. е. обобщите определение отрезка на n-мерное пространство). Дадим алгебраическое доказательство теоремы, которая геомет- рически очевидна. Теорема. Полуплоскость есть выпуклое множество. Доказательство. Пусть ах -Т by < с — неравенство, определяющее полуплоскость, и пусть Р (х1, z/J, Q (х2, z/2) — две про- извольные точки на полуплоскости. Тогда координаты как точки Р, так и точки Q удовлетворяют данному неравенству: ахг + by у < с; (1) ах2 + Ъу2 < с. (2) Пусть, далее, 0 tn 1. Умножим неравенство (1) на т, а не- равенство (2) на 1 — т и сложим полученные неравенства: а[тх1 4- (1 — т) х21 + b 1ту± + (1 — tri) у2] < тс + + (1 — tri) с — с. (3) 88
Коэффициенты при а, Ъ в неравенстве (3) будут координатами (х, у) произвольной точки отрезка PQ; следовательно, все такие точки удов- летворяют неравенству. Другими словами, все точки отрезка принад- лежат полуплоскости. Это значит, что полуплоскость есть выпуклое множество 154]. Упражнение 1.4.8 1. Докажите, что полуплоскость, определяемая линейным неравенством Й1Х1 + агх2 + ... + ап хп < Ьп, есть выпуклое множество. 2. Докажите, что решение системы т линейных неравенств: °и х1+й12 х2+ • • • -pain хп <Z by, а21 Х1Ч-О22 Х2-р . . . хп < by, ат1 Х1~Ьйт2 X2 + •. • + amn xn есть выпуклая область точек в n-мерном пространстве.
1.5 ГЛАВА ТЕОРИЯ ГРАФОВ 1.5.1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ Рис. 29. Кёнигсбергская система мо- стов У многих слово «граф» ассоциируется с вычерчиванием по точкам (х, t)) графика на декартовой плоскости. В действительности существует обширная математическая теория графов, которая представляет собой нечто значительно большее, чем простое нанесение точек на график, и исключительно богата идеями и изящными теоремами. Более того, обнаружилось, что она служит основным инструментом во многих раз- делах науки и техники; ее тео- ремы и методы нашли успешное применение в теории информа- ции, промышленном планирова- нии, на транспорте, в линейном программировании, в теории се- тей, статистической механике и генетике. Можно сказать, что первое исследование графов, выполненное Л. Эйлером (1707— 1783), заложило основы тополо- гии, играющей большую роль в современной математике. Простейшим образом граф можно описать как набор точек, опреде- ленные пары которых соединены линиями. Слово «сеть», пожалуй, лучше, чем «граф», передает читателю общее представление о природе системы, с которой имеет дело теория графов. Действительно, слово «сеть» часто употребляется в качестве синонима слова «граф». Приведем два примера простых систем, исследование которых пол- ностью сводится к рассмотрению графов. Пример 1. Задача о кёнигсбергских мостах. Река Прегель те- чет через город Кёнигсберг (в настоящее время Калининград); посере- дине реки расположены два острова. Семь мостов соединяют острова с берегами и друг с другом, как показано на рис. 29. Жители города могли бы задуматься о возможности найти непре- рывный маршрут между берегами и островами, который проходил бы по каждому из мостов ровно один раз. В 1736 г. Эйлер (превосходный математик, один из наиболее плодовитых гениев в истории математики) занялся этой задачей и сумел доказать, что найти такой путь невоз- можно. 90
Система мостов может быть сведена к графу следующим образом. Берега обозначим точками (вершинами) Л и С, а острова—вершинами В и D (рис. 30). Возможные пути между берегами и островами становятся линиями (ребрами), соединяющими пары вершин. П р и м е р 2. Теория графов была применена к проблемам орга- нической химии (например, к перечислению изомеров химического сое- динения). Молекула этилена (C2HJ) предстает в форме графа, изобра- женного на рис. 31. Рис. 30. Граф кё- нигсбергской систе- мы мостов В одной короткой главе невозможно описать достаточно полно яр- кий образный язык теории графов и упомянуть все ее приложения. Однако, если эта глава даст читателю некоторое знакомство с основ- ными идеями и обозначениями и откроет для него огромное потенциаль- ное значение этой теории в изучении реальных систем, цель будет достигнута. Применения к задачам исследования операций рассматриваются в гл. 3.5. В частности, там решается задача планирования для комплек- сного объекта. При этом множество различных родов деятельности по выполнению проекта представляется в виде некоторого графа. Упражнение 1.5.1 1. Возьмите карандаш и, начиная с любой вершины, попытайтесь начер- тить непрерывающийся маршрут по графу кёнигсбергской системы. Задача со- стоит в том, чтобы пройти каждое ребро один (и только один) раз и вернуться в исходную точку. 2. Кёнигсбергская задача может быть поставлена для любого замкнутого графа. Срисуйте графы, изображенные на рис. 32, и попытайтесь затем пройти по ним кёнигсбергским способом, проходя каждое ребро только один раз. 3. Назовем вершину нечетной, если число ребер, сходящихся к ней, нечет- но, и четной, если число ребер четно. Для каждого из графов задачи 2 выпишите таблицу, показывающую (1) число нечетных вершин, (2) число четных вершин и (3) можно или нельзя пройти граф кёнигсбергским способом. Отметьте звездоч- кой случаи, когда можно вернуться к исходной вершине. Эйлер обнаружил, что граф такого типа может быть пройден с возвратом к исходной точке тогда и только тогда, когда в графе нет нечетных вершин. Он показал, что если в графе присутствуют две (и только две) нечетные вершины, то обход возможен, но без возвращения к исходной точке. В таком графе обход должен начинаться в одной нечетной вершине и заканчиваться в другой. Проверьте теоремы Эйлера для каждого из графов задачи 2 упражнения 1.5.1. 91
Рис. 32 Часто рассматривают множества, в которых отношения внутри дан- ной пары элементов односторонние (т. е. направленные, или ориенти- рованные). Нштример, в генеалогическом дереве отношение между от- цом и сыном—это одностороннее отношение происхождения. Мы можем показать направление родственной связи на графе, поместив стрелку на ребро между точкой, обозначающей отца, и точкой, обозначающей сына: О Если стрелки стоят на всех ребрах графа (т. е. каждое ребро на- правлено), то про весь граф говорится, что он направлен. Мы сначала будем иметь дело с ненаправленными графами, т. е. с графами, все ребра которых не направлены. Обозначения и определе- ния теории графов еще не стандартизированы в достаточной степени; мы будем придерживаться терминологии Саати [3]. 1.5.2. НЕНАПРАВЛЕННЫЕ ГРАФЫ а) Основные термины. (1) Множество X. Мы будем предполагать, что множество X объек- тов задано и каждый объект можно представить точкой на плоскости. Примеры таких множеств: совокупность городов (точки на карте), де- тали электроаппаратуры (точки иа схеме сети), группа людей, проис- ходящих от одного и того же предка (точки на генеалогическом дереве). (2) Вершины и ребра. Если два объекта из множества X каким-то образом связаны между собой, то связь может быть указана линией, соединяющей две точки, обозначающие эти два объекта. Таким образом, связь е между объектами и п v может быть обозначена так: ____Л и е Точки и, v называются вершинами, а линия е называется ребром. 92
Ребро е Называется инцидентным по отношению к вершинам и, V. Вершины и п v называются концевыми точками е. Концевые точки ребра называются смежными вершинами. Два ребра et и е2 называются смежными ребрами, если у них есть хотя бы одна общая концевая точка. Если для них общими будут обе концевые точки, то они называются параллельными ребрами. (3) Петли. Ребро, обладающее только одной кон- цевой точкой (рис. 33), называется петлей. Петля — это ребро, которое дважды инцидентно по отношению к одной и той же концевой точке. (4) Изолированная вершина. Если вершина не явля- ется концевой точкой какого-либо ребра, то она назы- вается изолированной. Рис. 33. Пет- ля к Пример. На рис. 34 изображен граф, для которого множество V вершин (представляющее собой множество объектов X) имеет вид V = {vlt и2, va, vt, t/5, v6, v7, 08}. Множество E ребер (представляющее собой отношения между па- рами объектов) выглядит следующим образом: Е — {<?!, с2, е3> ^5» ^б> Точки vj и и4 — концевые точки ребра е3; е4 инцидентно v4 и v5; eg— петля; v3—изолированная вершина; ег и е2—параллельные ребра; е8 и ев — смежные ребра. Упражнение 1.5.2 1. Запишите множество V вершин и множество Е ребер графа, изображен- ного на рис. 35. Определите (1) изолированную вершину, (2) концевые точки е4, (3) ребро, инцидентное v2 и v3, (4) петлю, (5) пару параллельных ребер, (6) ребра, смежные с е3, и (7) вершины, смежные с е3. 2. Начертите графы (1), (2) и (3) по следующим наборам данных: (1) Множество вершин V = {с,, и2, и3, и4}; множество ребер Е — {ех, е2, е3, е4, erJ; ех и е3 — петли с концевыми точками v2, v4 соответственно; е2 инцидент- но их и ei инцидентно vt и v2; v2 и v4 — концевые точки для е5. (Присутст- вуют ли здесь изолированные вершины? Присутствуют ли параллельные реб- ра? Можно ли достичь любой точки, выходя из Пх?) (2) Множество вершин V = {пх> uz> из> г4, и5}; множество ребер Е = {ех, е2, е3, е4, е3, ее, е7}; ребро ех имеет концевые точки vlt п4; е2, е3, е4 — парал- лельные ребра; е5 инцидентно v3 и п4; е6 инцидентно v3 и и6; v4 — концевая точка ребра е4; е7 — петля, инцидентная п5; изолированные вершины отсутствуют. (3) Множество вершин V = {их, v2, v3, и4}; множество ребер Е = 0 (т. е. пустое множество). (Замечание. Граф может иметь вершины и не иметь ребер, но не наоборот; графы, у которых Ё = 0, называются вырожденными.) 93
3. Начертите граф: V = {vx. v2, v3, u4, v5, u6}; E = {ex, e2, es, e4, e5}; е1 об- ладает концевыми точками v±, vz; e2 имеет концевые точки v2, v3; e3 инцидентно »2, e4 имеет концевые точки vs, v5; e5 инцидентно v3, v4. Можно ли провести путь от V! к любой другой вершине? Можно ли построить путь от произвольной вер- шины до любой другой вершины? Возможно ли пройти от одной вершины к любой другой одним путем, а возвращаться другим? Граф этой задачи — пример дерева с корнем vt. Деревья будут обсуждаться более подробно далее. б) Формальное определение ненаправленного графа. (1) Определение графа. Ненаправленный граф состоит из: (а) непустого множества V, его вершин; (б) множества Е (возможно, пустого), его ребер, все концевые точки которых являются элементами V. Таким образом, граф G полностью определен, если заданы два мно- жества V и Е. Мы можем написать G = (V, Е). (2) Конечные графы. Если как V , так и Е состоят из конечного числа элементов, то G называется конечным графом. В противном случае граф G бесконечен. 1.5.3. СООТНОШЕНИЯ МЕЖДУ ЧИСЛОМ ВЕРШИН И ЧИСЛОМ РЕБЕР а) Обозначение | X |. Символом | X | будет обозначаться число эле- ментов множества X. Например, на рис. 36 изображен граф с 5 верши- нами и 7 ребрами. Мы можем написать G — (V, Е) и | V | = 5, | Е | = 7. С помощью этих обозначений можно так записать определение ко- нечного графа: G = (V, Е) представляет собой конечный граф, если | V | < оо и|Е|<оо; в противном случае он бесконечен. б) Степень вершины 6 (v). Рассмотрим граф, приведенный на рис. 37. Вершине щ инцидентны три ребра и одна петля. Сосчитав эту петлю дважды, мы можем сказать, что вершина обладает 5 инцидентными ей ребрами; это число называется степенью vt. Степень вершины v обозначим символом б (и). Таким образом, в этом графе б (щ) = 5, б (о2)" =2,6 (о3) = 3.. Вершина будет нечетной, если ее степень — нечетное число, и четной, если ее степень — четное число; она изолированная, если б (о) = 0. Упражнение 1.5.3 1. Напишите числа | V |, | £ | и степени всех вершин для каждого из графов (а), (б), (в) на рис. 38. 2. Для каждого из графов (а), (б), (в) на рис. 38 определите величину суммы V6 (и) и сравните ее с | £ ]. v£V Установите закономерность, связывающую эти два числа. 3. Проверьте в графах задачи 1 (и во всех других, встречавшихся ранее гра- фах), что число нечетных вершин всегда четно. в) Две теоремы о степенях вершин. Сформулируем и докажем две простые теоремы. 94
Теорема 1. Для любого графа G~ (V, Е) сумма степеней вер- шин равна удвоенному числу ребер, т. е. 2 6(v) = 2|£|. об V Доказательство. Предположим, что ребро е имеет две раз- личные концевые точки и, v. Тогда его вклад в б (и) и в б (v) равен 1. Если ребро е является петлей, инцидентной и, то его вклад в б (о) равен 2. Отсюда в любом случае вклад ребра е в сумму степеней всех вершин равен 2. Поэтому удвоенное число ребер равно сумме степеней, что и требовалось доказать. Теорема 2. В конечном графе число нечетных вершин четно. Доказательство. Пусть Ve — множество всех четных вер- шин, a Vo — множество всех нечетных вершин. Тогда, очевидно, Vo U Ve = V и Vo Г) Ve = О ; таким образом: 2б(п)+ 2 6(о)= ^б(о). (1) t>ev« »eve Далее, суммы J]6 (у) и ^б (и) обе четные (первая по теореме 1, а вторая г?6Г потому, что она представляет собой сумму конечного числа четных чи- сел). Отсюда разность б (и) и V б (и) также четна. Следовательно, согласно (1) получаем, что 2 6Д) (2) кек» четно. Наконец, если бы | Vo | было нечетным, то сумма у, б (о) была бы t>er0 суммой нечетного числа нечетных чисел и поэтому была бы нечетной, что противоречит (2). Отсюда | Vo| должно быть четным, что и требова- лось доказать. 95
Упражнение 1.5.4 J3 P <5 .S 1. В каждом из графов (а), (б) и (в) на рис. 39 обозначьте вершины и опре- делите множества V, Vo, Ve и Е. Вычислите величины I Е | (V), X б(и) И veV vc-Vo (v). Проверьте в каждом случае, что V 6 (v) = 2| Е ( (теорема 1) и что veVe veV | Vn| четно (теорема 2). 2. Добавьте ребра к каждому из графов задачи 1 и установите, как изменятся различные величины, которые были использованы в двух теоремах. Попытайтесь так добавить ребра и вершины, чтобы получился граф с нечетным | Уо |. 3. После решения задач 1 и 2 прочтите еще раз доказательства теорем 1 и 2. 4. Граф на рис. 40 представляет часть карты, на которой изображены дороги, соединяющие города А, В, С, D и Е. Рис. 39 (1) Сколько здесь различных дорог, соединяющих города (чему равно I £1)? (2) Можно ли пройти из данного города в любой другой только по указан- ным дорогам? (3) Обозначьте дороги и запишите все маршруты, соединяющие город А с городом С. (Запишите их в виде последовательности ребер, например е2, е3, ... Не используйте данные ребра более одного раза в одном маршруте.) (4) Назовем длиной маршрута число ребер в последовательности. Определите длину каждого из маршрутов, полученных в примере (3). 1.5.4. НЕПРЕРЫВНЫЕ ПУТИ ПО ГРАФАМ Рассмотрим граф, изображенный на рис. 41. Пусть вершины — это города, а ребра — дороги. Последовательность ребер еъ е2, еб, ес со- ставляет непрерывный маршрут из города vr в v5: Последовательность е2, es, е2, еу составляет непрерывный маршрут из города v3 в город и2, далее — в город v3, затем обратно в у2 и к городу v4. Последовательность е5, ев, е4 задает кольцевой маршрут из города v3 через v4 и v5 и обратно к начальной точке v3. Из этого примера ясно, что можно выделить различные типы.движе- ний по графу, рассмотрение которых приводит к возникновению поня- тий и идей, имеющих основополагающее значение в теории графов. С их помощью удается классифицировать графы па несколько типов, важных при формулировке большинства задач. Приведем соответствующие определения. 96
а) Цепи. Цепью называется любая последовательность ребер ег, с2, е3, еп, обладающая тем свойством, что для каждого ребра, кроме первого и п-го, одна из его вершин является общей с предыдущим реб- ром, а вторая -— с последующим. Цепь называется простой, если каждое ребро встречается не более одного раза, в противном случае цепь сложная. Число ребер п называется длиной цепи. Примеры 1. В графе на рис. 42 последовательность е4, е2, е3, е4 представ- ляет собой простую цепь, идущую от v4 к п4. 2. В следующем графе на рис. 43 elt е2, еа, еБ — простая цепь, дли- на которой равна 4 и которая идет от ог к ц6; еъ ее, е4, е3, ев — сложная цепь, длина которой равна 5; е2, es, е6 — простая цепь, идущая от v2 к v2. б) Циклы. Рассмотрим последовательность ребер (цепь), начинаю- щуюся в вершине v0 и кончающуюся в вершине vn. Если и0 и vn — различные вершины, то последовательность назы- вается открытой. Если и0 = ип (т. е. последовательность начинается и кончается в ц0), то последовательность называется замкнутой. Замкнутая цепь называется циклом. Замкнутая простая цепь называется простым циклом. Замкнутая сложная цепь называется сложным циклом. Если каждая вершина в цикле (в цепи) встречается только один раз (кроме первой вершины в цикле), то цикл (цепь) называется элементар- ным (элементарной). Примеры 1. На рис. 44 изображен граф, па котором ег, еъ, е6, е2 — это простой цикл с вершинами plf v2, v3, v4, vv Так как никакая вершина (кроме ог) не повторяется, то это пример элементарного цикла. 2. еъ е4, е5, ев, е2 — простой цикл с вершинами v2, v2, vs, v4, v4. Он не элементарен, так как v2 встречается дважды в последовательно- сти вершин. 3. е7, е8, es, е4, еБ, ев, е7 — сложный цикл (он замкнут, и е7 — повто- ряющееся ребро). Упражнение 1.5.5 Для графа, изображенного па рис. 45, найдите следующее: 1. Простую цепь, соединяющую ut и и4. 2. Простую цепь, идущую от vx, к v5 через v7. 4 Зак. 973 97
3. Сложную цепь, соединяющую vt и v4. 4. Сложную цепь, соединяющую ц, и v2. 5. Простой цикл, начинающийся в и имеющий длину 6. 6. Сложный цикл, начинающийся в и имеющий длину 9. 7. Элементарный цикл, начинающийся вц и имеющий длину 5. 8. Покажите, что последовательность е7, ез, е5, е4, е10 не является цепью. Вставьте мысленно в эту последовательность одно ребро так, чтобы получилась цепь. Будет ли полученный результат простой или сложной цепью? 9. Классифицируйте последовательности: е7, е3, е4, е5, е6, е4, elt е1г, et, ее; еь е2, е8, е10, ев, е2; е2, ев, е10, ев; е2, ее, е10, es, е8; е7, е3, еи, еи, ее (т. е. устано- вите, являются ли они цепями или циклами, простыми, сложными или элемен- тарными). 10. Составьте цепь, идущую от v2 к и7 и проходящую через и6. Будет ли эта цепь простой или сложной? 11. Найдите элементарный цикл, который будет одновременно и простым циклом; найдите простой цикл, который не элементарен. Докажите, что элемен- тарный цикл всегда будет простым, но обратное выполняется не всегда. Пока- жите, что элементарный цикл не содержит петель. 1.5.5. ПОДГРАФЫ Рассмотрим граф G = (V, £), показанный на рис. 46; часть его об- ведена пунктирной линией. Множество вершин = {п3, v4, у5, р6} и множество ребер Е4 — = {е4, еБ, е9, е10} составляют графС4 = (Vj, Ег). ГрафС4 будем назы- Рис. 46 вать подграфом графа G. Вообще будем говорить, что GT =(V1,£1) представляет собой подграф графа G~- (V, Е), если: х (1) l\c V и £\с £; (2) каждое ребро в Ег имеет те же самые концевые точки в G, которые оно имеет в 6\; (3) концевые точки каждого ребра из £j лежат в Г1. 1.5.6. СВЯЗНЫЕ ГРАФЫ а) Определение. Граф называется связным, если для каждой пары- различных вершин существует по крайней мере одна цепь, их соединяю- щая. В противном случае граф называется несвязным. ’ , . 98
Примеры. На рис. 47 изображены графы (а), (б) и (в). Из них графы (а) и (б) связны; граф (в) несвязен. б) Связные компоненты. Рассмотрим граф на рис. 48, сначала не обращая внимания на пунктирные линии. Этот граф несвязен; в нем нет, например, цепей, соединяющих и п13. Однако он может быть раз- делен на три подграфа, каждый из которых связен (на чертеже подгра- фы окружены пунктирными линиями). Связный подграф называется компонентой исходного графа. Ясно, что любой конечный граф может быть разделен на компонен- ты следующим образом: 1. Выберем произвольную вершину v в V. Определим все вершины, которые могут быть соединены с v цепью. Множество этих вершин, содержащее вершину v, обозначим Ух. Тогда подграф, определяемый множеством Уъ будет компонентой. (Заметим, что если v изолирована, то ({и}, 0) есть компонента.) 2. Выберем произвольную вершину и, принадлежащую V, но не принадлежащую Пусть У2 — множество всех вершин, соединяе- мых с и какой-либо цепью (iz включается в 1/2). Тогда У2 определяет другую компоненту. 3. Будем повторять процедуры 1 и 2 до тех пор, пока в V не оста- нется вершин, не принадлежащих одному из множеств V2, ... Так как V конечно, то последовательность компонент должна быть ко- нечной. Обозначим последнее множество вершин Vh. То гда множество компонент, определяемых Уь У2, ..., Vh, дает раз- биение графа G на связные компоненты. Пр и м е р. Вернемся к графу, изображенному на рис. 48. Начнем процесс разбиения с выбора вершины vB. После этого видим, что вер- шины v7, ve и п10 могут быть соединены с vB цепью. Следовательно, V, = = {v7, v8, tzg, u1(1) определяет компоненту (обведенную на чертеже пунк- тиром). Выбрав далее v3 в качестве вершины из V, не принадлежащей Ух, находим, что V2 = {пъ v2, v3, v.lt v6, tze}. Компонента, определяемая множеством V2, на чертеже также обведена пунктиром. Остаются лишь вершины vn, v12, v13. А они могут быть соединены цепью, поэтому V3 = {ии, v12, о13} определяет третью компоненту. 4* 99
В V больше йет вершин, которые не входили бы в V2 или V3, нет также и ребра, которое не принадлежало бы одной из этих компо- нент. Формально читателю следовало бы доказать такую теорему. Теорема. Если граф G = (V, Е) обладает k компонентами и Vlt V2, Vk есть множества вершин, определяющие эти компоненты, то Vi, V2, ..., Vh задает разбиение V, т. е.: (1) Vt=£0, i = 1, 2, ..., k; (2) УгПУ;=0, i^i- (3) U Vt = V. Рис. 49 Рис. 50 Упражнение 1.5.6 1. Рассмотрите граф на рис. 49. (1) Связен ли он? (2) Останется ли граф связным, если убрать ребро е/? (3) Останется ли граф связным, если убрать ребро е3? (4) Останется ли граф связным, если убрать ребра eJt е2 и е4? (5) Покажите, что граф остается связным при удалении из него некоторого ребра тогда и только тогда, когда это ребро содержится в некотором цикле. 2. Определите компоненты графов, изображенных на рис. 50. 3. Докажите, что граф связен тогда и только тогда, когда он обладает лишь одной компонентой. 4. Докажите, что в каждом связном графе порядка п IE I п — 1. 5. Если граф связен и является элементарным циклом, что можно сказать о степенях его вершин? 6. Что можно сказать о степенях вершин связной элементарной цепи? 1.5.7. ДЕРЕВЬЯ а) Определение. В процессе изучения сетевых задач можно выде- лить тип графа, обычно называемый деревом. Пр и м е р. На рис. 51 изображено дерево. Заметьте следующее: (1) G связен и не имеет циклов; (2) |Е| = | V| — 1. Вопросы. Можно ли добавить ребро, не добавляя вершину, так, чтобы цикл не образовался? Сколько циклов можно образовать 100
добавлением одного ребра? Можно ли удалить ребро так, чтобы граф остался связным? Существует ли пара вершин, которые можно соеди- нить более чем одной цепью? Ответы на приведенные вопросы наводят на мысль, что можно дать несколько эквивалентных определений дерева. Мы объединим шесть определений в форме теоремы. Каждое, начиная со второго, выводится из предыдущего, а первое следует из шестого. Доказательства этих утверждений можно найти в книге Бержа [2]. Теорема. Пусть G — конечный граф порядка п > 1. G является деревом, если верно любое из следующих утверждений: (1) G связен и не имеет циклов; (2) G не имеет циклов и содержит п — 1 ребро; (3) G связен и содержит п — 1 ребро; ДереВо: 6 {У.Е). , £={е,,ег,...,еп} Циклов нет Рис. 51 (4) G не имеет циклов и, если добавить ребро, соединяющее две не- смежные вершины, то образуется ровно один цикл; (5) G связен, но становится несвязным при удалении любого ребра; (6) каждая пара вершин соединяется одной и только одной цепью. Если читатель возьмет некоторое дерево (например, граф, изобра- женный на рис. 51) и проверит на нем каждое из этих утверждений, он скорее усвоит рассмотренные понятия и идеи. б) Первые простые приложения. В этой книге речь о деревьях бу- дет идти только в связи с задачами теории вероятностей; однако, как уже было отмечено, они имеют гораздо большее значение в рамках об- щей теории сетей. Мы приведем здесь два простых примера, иллюстри- рующих использование деревьев в качестве диаграмм. П р и м е р 1. Проводится теннисный турнир с двумя участниками А и В. Победителем считается игрок, выигравший два матча подряд или просто три матча. Определить число возможных результатов тур- нира. Решение. Дерево на рис. 52 показывает все возможные результаты, каждая цепь (или, скорее, последовательность вершин в ней) соответст- вует некоторому варианту развития турнира. Вершины указывают по- бедителей в отдельных играх. Каждая цепь прерывается в случае, когда игрок победил в двух последних матчах или когда он победил в трех играх на протяжении всей цепи. Существуют десять различных вариантов исхода турнира, а именно: АА, ABAA, ABB, ABABA, АВАВВ, BAA, ВВ, ВАВАА, BABB, ВАВАВ. 101
Пример 2. В два учреждения (Л, В) надо Назначить одного ИЗ двух администраторов (Е, F), и они должны выбрать себе по одному сек- ретарю из трех имеющихся кандидатов (R, S, Т). Сколько существует различных комбинаций (администратор, учреждение, секретарь)? Решение. Ответ дается набором цепей, проходящих по дереву, изо- браженному на рис. 53, от корня до кончиков ветвей. Он содержит все возможные комбинации. Возможные комбинации : Рис. 53 (Е.А.ВУ (Е,А,3) (Е.Л.Г) (E.B.R) (E.B.S) (ЕВ. Г) (F.A.R) (F.A.S) (ЕА.Г) (ЕВ. В) (F.B.S) (ЕВ, Г) Упражнение 1.5.7 1. Найдите прямое произведение множеств А В С, где А = {3, 5}, В = = {2, 6}, С = {1, 4, 7}. Замечание. Прямое произведение есть множество всех точек (х, у, г), таких, что {x£A,y£B,z£ С}. 2. Определите прямое произведение множеств {1, 2, 3} {4, 5, 6} {5, 7}. Сколько имеется точек (х, у, г), таких, что х + у + г есть четное число? 3. Придумайте более простой способ ответа на вопрос 2, неж.ели полный перебор элементов произведения множеств. Воспользуйтесь деревом, каждая вершина которого отмечена буквой Н (нечетно) или Ч (четно), и укажите для каждой вершины число четных или нечетных результирующих сумм на каждом этапе. Примените ваш метод для нахождения числа четных сумм х + у+г+а' для точек из множества {1, 2}-{3, 5, 7) {9, 10} {2, 8, 12}. 4. С помощью диаграмм-деревьев найдите все перестановки: (а) букв R, S, Т\ (б) букв слова CART, где букве С не разрешается следовать за А. 5. В теннисном турнире с двумя участниками победителем считается тот, кто первый выиграет три партии. Определите с помощью дерева число возможных последовательностей исходов игр в турнире. Каково максимальное возможное число йгр? 6. В шахматном матче с двумя участниками победителем считается первый выигравший две партии подряд или выигравший всего три партии. В случае трех последовательных ничьих турнир объявляется закончившимся вничью. Каково число возможных различных течений матча? Сколько из них заканчиваются ничейным результатом? 7. Четыре мальчика А, В, С, D бросают друг другу мяч по следующим пра- вилам: (1) А никогда не бросает мяч С и D; (2) В никогда не бросает А и С; (3) С никогда не бросает В; (4) D никогда не бросает В; (5) никто из мальчиков, бросив мяч, не ловит его сам. Предположив, что мяч первоначально находится у А, начертите дерево- диаграмму,чтобы показать возможные пути мяча в течение первых пяти бросков.„ Предположим, что D никогда не бросает ни В, ни С, покажите, что С никогда" не получает мяч. 102
1.5.8. НАПРАВЛЕННЫЕ ГРАФЫ В предыдущих параграфах мы имели дело с графами, ребра кото- рых не были ориентированы. В огромном числе приложений существуют отношения внутри пары объектов (вершин), которые могут быть пока- заны стрелкой на линии, соединяющей пару точек. Например, граф может изображать систему городских улиц с односторонним движением, а стрелки будут показывать направление движения транспорта. Пример. На рис. 54 изображен направленный граф. Рис. 54. Направленный граф Многие понятия, требующиеся для описания структуры направ- ленных графов, аналогичны понятиям, которыми пользуются, когда речь идет о неориентированных графах, однако введение направлений усложняет ситуацию и требует некоторых изменений в определениях и обозначениях. Здесь мы не будем пытаться изложить полностью эти идеи и понятия. Следующая таблица дает сокращенные определения дуги, графа, пути и цикла и сравнивает их с аналогичными понятиями для неориенти- рованных графов: Ненаправленный граф Направленный граф Ребро G=(V, £) Цепь Цикл Дуга: ориентированное ребро G=(V, А): А—множество дуг Путь: открытая последовательность дуг (к концу одной примыкает начало другой) Цикл: замкнутая последовательность дуг 1.5.9. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА В книгах [2] и [3] содержатся отличное введение в теорию графов и ее многочисленные и разнообразные приложения.
ЧАСТЬ ВТОРАЯ ВЕРОЯТНОСТЬ И СТАТИСТИКА 2.1 ГЛАВА ТЕОРИЯ ВЕРОЯТНОСТЕЙ э 2.1.1. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ а) Эксперименты со случайным исходом. Теория вероятностей изу- чает эксперименты со случайным исходом (случайные эксперименты). Для разъяснения этого понятия рассмотрим два простейших примера. Эксперимент А. Бросание игральной кости и регистрация числа выпавших очков. Эксперимент В. Наблюдение за продолжительностью ожидания пассажиром автобуса па остановке. Хотя описания этих экспериментов сведены к минимуму, осуществ- ление их нетрудно себе представить. Далее объясняется, почему эти эксперименты называются случайными. б) Описание эксперимента. Каждый эксперимент состоит из выпол- нения некоторого действия и наблюдения за его результатом. Предме- том наблюдения может быть некоторый процесс, его часть или же дей- ствующая система. Осуществление намеченного действия и его резуль- тат будем называть экспериментом. Полученный результат (наблюде- ние) называется исходом эксперимента. Эксперимент будет случайным (эксперимент со случайным исхо- дом), если его результат (исход) нельзя точно предсказать до его осу- ществления. Потребуем также, чтобы эксперимент можно было повто- рять при первоначальных неизменных условиях неограниченное число раз (по меньшей мере теоретически, если такое повторение практически невозможно). Например, в эксперименте А с игральной костью невоз- можно предсказать выпадающее число очков, так как результатом тако- го эксперимента может быть любое число от 1 до 6. Строго говоря, прак- тически невозможно повторять этот эксперимент при первоначальных неизменных условиях неограниченное число раз, так как в конце кон- цов углы кости сотрутся и первоначальные условия эксперимента из-' менятся. Таким образом, в эксперименте с игральной костью исход нельзя точно предсказать, т. е. эксперимент будет случайным и его можно повторять (теоретически) неограниченное число раз. В эксперименте В время ожидания также невозможно угадать аб« солютно точно (за исключением тех случаев, когда автобусы ходят с постоянным интервалом времени, что неосуществимо с абсолютной точностью). Можно возразить, что этот эксперимент нельзя повторить. 104
Действительно, после того как ожидающий пассажир сел в автобус, эксперимент будет окончен. Из этого положения можно найти, напри- мер, следующий выход. Будем наблюдать то же лицо в другие дни. Можно также измерять время ожидания автобуса разными лицами. Очевидно, зарегистрированное время ожидания зависит от точности измерения, от уровня обслуживания на этом маршруте, от оживленно- сти уличного движения. Таким образом, при определенных условиях эксперимент В можно считать случайным. в) Необходимость вероятностной меры. Как правило, эксперимент предпринимается для изучения некоторых свойств интересующего нас физического процесса. Каждую ситуацию, которую можно наблюдать и которая может возникнуть в результате эксперимента, будем назы- вать событием. Результаты эксперимента (или последовательности экс- периментов) позволяют ответить на некоторые вопросы относительно частот появления событий. Любое утверждение о событиях, связанных со случайным экспе- риментом, следует принимать с некоторой долей сомнения. Например, лицо, бросающее кость (эксперимент Л), может утверждать, что ожидае- мое число очков будет больше единицы, однако мы должны учесть воз- можную ошибку такого предположения. Если кость правильная, то выпадение единицы докажет несправедливость этого утверждения. Таким образом, появляется потребность в измерении степени уверен- ности в наступлении данного события. Эта потребность и привела к по- явлению понятия вероятности. Когда бросающий игральную кость говорит, что на 90% он уверен в выпадении числа, большего единицы, он принимает величину 90% в качестве меры уверенности в правиль- ности своего высказывания*. Величина, которая служит для этой цели, называется вероятностью. Цель теории вероятностей — вычисление вероятностей событий, их комбинаций и изучение свойств вероятностей. г) Построение модели. Построение математической модели экспе- римента начинается с описания: 1) возможных исходов, 2) событий и 3) вероятностей наступления этих событий. Это описание должно быть выполнено так, чтобы обеспечить воз- можность вычисления вероятностей комбинаций событий. С помощью абстрактной модели физического процесса можно по- лучить некоторые его численные характеристики. При этом не надо за- бывать, что вводимые математические понятия представляют собой в не- котором роде идеализацию соответствующих аспектов реальности. Поэтому выводы, полученные из абстрактной модели, могут в точности не соответствовать поведению реального двойника. Они должны быть проверены экспериментально. * Девяностопроцентная уверенность в выпадении числа очков, большего единицы, выступает здесь как субъективная вероятность. Если предположить, что кость правильная, то имеется 5 шансов из 6, что единица не выпадет. Таким образом, объективная вероятность рассматриваемого события равна 5/6. В даль- нейшем в книге рассматриваются только объективные вероятности, т. е. вероят- ности, не связанные с представлениями субъекта об изучаемом процессе. — Примеч. ред. 105
В следующих параграфах изучается аксиоматический метод по- строения математических моделей случайных экспериментов. В его основе лежит теория множеств, и соответствующие главы книги пред- полагаются изученными. Примеры применения теории вероятностей приводятся почти в каждом параграфе, так что читатель будет знако- миться с различными идеями этой теории на большом числе эмпири- ческих ситуаций, к которым возможно ее применение. Дальнейшие приложения, содержащие вероятностные модели, можно найти в треть- ей части книги, посвященной исследованию операций. Практически в любой области знания можно указать многочисленные приложения тео- рии вероятностей. Однако следует отметить необходимость тщательной проверки правомерности таких приложений. Вместе с тем нет сомне- ний в том, что методы и теоремы теории вероятностей — одно из наи- более мощных средств в арсенале современной науки. 2.1.2. ПРОСТРАНСТВО ИСХОДОВ Результаты случайного эксперимента будем называть исходами. Слова «исход», «случайный», «эксперимент» неопределяемы. Разумеется, для придания смысла этим понятиям читатель может привлекать свою интуицию, призывая в некоторых случаях на помощь предваритель- ные замечания (см. 2.1.1). При аксиоматическом изложении тео- рии эти понятия будут элементарными. К сожалению, в приложениях теории вероятностей употребляются различные термины для обозна- чения одних и тех же понятий. В этой книге читатель также встретит большое количество синонимов, и он должен быть готов к этому с самого начала. Например, слова «случай», «выборочная точка», «элементар- ное событие», «состояние» обозначают одно и то же понятие «исход». Множество всех возможных исходов случайного эксперимента на- зывается пространством исходов. Обозначим его символом Sx (или S). Это пространство относится к эксперименту X. Мы будем пользоваться способами описания множеств, изложенными в первой части книги. Примеры (1) Эксперимент А: X — «число очков, выпавших при бросании игральной кости»: Sx = {1, 2, 3, 4, 5, 6}. В эксперименте может наблюдаться любое целое число от единицы до шести. Совокупность этих чисел определяет пространство исходов эксперимента А. (2) Эксперимент: X — «выпадение герба или решетки при бросании монеты»: Sx = {Н, Т}, где Н — выпадение герба, Т — выпадение решетки. Если предположить, что монета может встать на ребро, то необхо» димо включить и это состояние в пространство исходов эксперимента. Тогда Sx = {//, Т, Ребро}. 106
Из рассмотренного примера читатель может заметить, что простран- ство исходов эксперимента не всегда очевидно и единственно. Может существовать целый набор таких пространств. Окончательный выбор пространства исходов зависит от экспериментатора. Существенно, од- нако, чтобы все практически осуществимые исходы были приняты во внимание и включены в пространство исходов исследуемой модели. Вы- воды и прогнозы, полученные по модели, основанной на неправильно сформулированном пространстве исходов, могут оказаться ложными. (3) Эксперимент В: X — «наблюдение за продолжительностью ожи- дания пассажиром автобуса на остановке». Если интервал движения автобусов не больше М минут, то в качестве пространства исходов можно взять S = {t:t 6 [О, /И]}. Если Л1 неизвестно, то его значение необходимо взять достаточно боль- шим, чтобы охватить все практически интересные ситуации. Упражнение 2.1.1 Напишите пространство исходов каждого из следующих экспериментов, опи- сав множество его элементов. 1. Наблюдение пола новорожденного. 2. Наблюдение числа разбитых бутылок в доставленном ящике, содержащем 12 бутылок. 3. Определение расстояния от центра мишени до точки попадания пули. 4. Наблюдение числа выпадений герба при бросании двух монет. 5. Наблюдение числа автомобильных происшествий в данном городе за не- делю. 6. Наблюдение времени сгорания топлива в двигателе ракеты. а) Дискретные и непрерывные пространства. Пространство исходов может быть дискретным или непрерывным. К первым обычно относят пространства, имеющие счетные множества исходов. Ко вторым — все остальные. Следующие примеры иллюстрируют эти понятия. Примеры (1) Пространство эксперимента А содержит 6 исходов. Эти исходы можно пересчитать; таким образом, пространство исходов будет дис- кретным. (2) Для эксперимента В S = {t'.t Е [О, Л4]}. Отсюда следует, что воз- можным исходом эксперимента может быть любое действительное число от 0 до М. Как доказывается в теории действительных чисел, между элементами такого множества и множеством натуральных чисел 1, 2, 3, ... нельзя установить взаимно-однозначное соответствие. Можно сказать, что множество S будет несчетно, а пространство исходов экс- перимента В — непрерывно. (3) Рассмотрим эксперимент, в котором происходит бросание моне- ты до первого появления герба (число бросаний в этом эксперименте фиксировано). Пространство исходов S — {0, 1, 2, 3, ...}, где 0—«герб ни разу не выпал», т. е. {7, Т, ...}; 1 — «герб выпадает при первом бросании монеты», т. е. {//}; 107
2 — «герб выпадает при втором бросании монеты», т. е. {Т, Н}\ 3 — «герб выпадает при третьем бросании монеты», т. е. {У, Т, Н} и т. д. Описанный эксперимент может быть представлен в виде последова- тельности более простых экспериментов, осуществляемых до первого появления герба./ Поскольку имеется принципиальная возможность, что герб никогда пс выпадет, модель будет охватывать все возможные ситуации лишь в случае, если пространство исходов не ограничено. Оно счетно, поскольку исходы, как было показано, можно перенуме- ровать, и, следовательно, дискретно. Понятно, что против моделей реальных явлений с неограниченным числом исходов практики могут выдвинуть возражение. Однако в том случае, когда применение таких моделей упрощает математическое ис- следование и не ведет к выводам, сильно отличающимся от эксперимен- тальных результатов, этими возражениями можно пренебречь. б) Произведение пространств. Иногда сложный эксперимент может быть разбит на последовательность более простых, независимых экспе- риментов, или серий. В этом случае будем говорить, что такая после- довательность экспериментов определяет составной эксперимент. Проиллюстрируем это понятие на примере. Эксперимент X: «одновременное бросание монеты и игральной кости; наблюдение выпавшей стороны у монеты и числа очков на кос- ти». Очевидно, что этот эксперимент можно рассматривать как два экспе- римента (скажем, Лг и Х2), осуществляемые последовательно. Посколь- ку в составном эксперименте X делаются два наблюдения, для их запи- си необходимо ввести два символа. Обозначим результат первого экспе- римента Хг через х19 а результат второго эксперимента Х2 — через х2. Тогда исход эксперимента X можно записать в виде пары исходов (xlt х2). Таким образом, пространство исходов составного эксперимента X состоит из всевозможных упорядоченных пар исходов, в которых пер- вый элемент взят из пространства S, эксперимента Хг, а второй — из пространства S2 эксперимента Х2. Найдем теперь пространство исхо- дов для составного эксперимента X. Для этого можно воспользоваться стрелочной диаграммой (рис. 55 (а)) или двустрочной таблицей (рис. 55(6)). Оба эти метода должны быть освоены читателем; они будут применяться в упражнениях. Заметим, что результат эксперимента Х2 никоим образом не влияет на результат эксперимента Хг и наоборот. В таких случаях будем говорить, что эксперименты Хг и Х2 независи- мы. Дальнейшее обсуждение этого важного понятия читатель найдет в 2.1.6. Как видно из рис. 55, пространство исходов для составного экспери- мента X будет S = {(Я/), ..., (Н6), (ТТ), ..., (Тб)}. Пространства, построенные по такому образцу, называют прямым произведением пространств. Определение. Пусть пространства Sx и S2 заданы. Простран- ство S, состоящее из всех упорядоченных пар (хь х2), таких, что лу есть элемент из Slt а х2 — элемент из S2, называется прямым произве- дением пространств Sx и S2. 108
Пространство Пространство Пространство исходов S1 исходов 5г исходов S (НТ) (Н2) (ИЗ) (И4) (Ив) (Ив) (П) (Г2) (ГЗ) Правый конец ветви определяет упорядоченную пару (Г4) (Т5) (Тб) Рис. 55. Диаграмма пространства исходов составного эксперимента (б) Двустрочная таблица Обозначение:5 = 51Х S2, Таким образом, S = X S2 ~ {(М, У 2)- ^"1 С ^i> ^2 £ Идея прямого произведения пространств может быть легко обоб- щена на случай эксперимента, состоящего из последовательности боль- ше двух экспериментов. В случае трех испытаний пространство исходов будет состоять из всех упорядоченных троек (лу, х2, х8) и будет обозна- чаться как 5Л X Sg X S3. Упражнение 2.1.2 Запишите пространства исходов для приведенных экспериментов. Восполь- зуйтесь стрелочной диаграммой и (или) двустрочной таблицей. 1. Наблюдение пола двух первых детей одной женщины. 2. Наблюдение выпавших сторон при бросании трех одинаковых монет. (Замечание. Это эквивалентно бросанию одной монеты три раза подряд и наблюдению тройки полученных результатов.) 3. Наблюдение верхних граней двух брошенных игральных костей (одна из костей красная, другая — зеленая). Мы обсудили основное (неопределимое) понятие исхода случайного эксперимента. Описание пространства исходов — первый шаг в по- строении модели физического эксперимента. Все вопросы об экспери- менте должны быть сформулированы в терминах элементов пространст- 109
ва исходов. В этих же терминах будут получены и ответы на постав ленные вопросы. Для дальнейшего развития модели нео’бходимо ввести понятие события. •л 2.1.3. СОБЫТИЯ И ПОЛЕ СОБЫТИЙ а) События. Понятие «событие» — одно из центральных в теории вероятностей. Следующие определения уточняют смысл понятий «со- бытие» и «появление события». Для обозначения события будем поль- зоваться буквой Е. Определение I. Событием называется любое подмножество пространства исходов. Определение II. Будем говорить, что событие Е произошло, если результат (исход) эксперимента принадлежит Е. Таким образом, если х — наблюдаемый исход эксперимента и при этом х £ Е, то мы го- ворим, что событие Е произошло. Утверждение относительно исхода Соответствующее событие Исход (а) словесная формулировка события (б) список элементов события (1) число 5 (2) четное число (3) нечетное число (4) число меньше 4 (5) число меньше 10 (6) отрицательное число Е1= «исход—число 5» Еа= «исход—положительное четное число меньше семи» Е3= «исход—положительное нечет- ное число меньше шести» Et=«исход—целое число между еди- ницей и тройкой (включитель- но)» Е6 = «исход—целое число между единицей и шестеркой (вклю- чительно)» Ев = «исход—число, которого нет на кости» {2, 4, 6} {1, 3, 5) {1, 2, 3} {1, 2, 3, 4, 5, 6} = S {“}=0 Поясним смысл этих определений в применении к случайному эксперименту на примере с бросанием игральной кости (экспери- мент А, пространство исходов которого S= {1, 2....6}). В таблице приводятся шесть утверждений (высказываний), которые могут быть сделаны относительно предполагаемого исхода. Каждое высказывание определяет некоторое событие. Соответствующие события описываются сначала словесно, а в последнем столбце приведена их запись в виде подмножеств множества S. Рассмотрим высказывание (2) из этой таблицы. Оно будет верным тогда и только тогда, когда выпадет одно из чисел 2, 4 или 6. Если ис- ход эксперимента обозначить через х и если х £ {2, 4, 6}, то событие Ег произошло и содержащееся в высказывании утверждение подтверди- лось. Под событием Е2 можно понимать множество истинности соот- ветствующего высказывания. Таким образом, для проверки справедли- во
вести некоторого высказывания относительно эксперимента необходимо этот эксперимент выполнить и проверить, будет ли его исход входить в перечень элементов для соответствующего события. На таком языке удобно как задавать вопросы, так и формулировать утверждения. Любой из рассматриваемых нами вопросов об эксперименте может быть связан с появлением (или непоявлением) некоторого события Е, заданного списком множества его элементов. Изучая это событие со- вместно с остальными элементами пространства исходов, можно ответить на вопрос: насколько вероятно наступление события Е? Полезно уяснить себе, что любое подмножество множества S можно всегда представить как некоторое событие. Читатель должен по воз- можности избегать эмоциональной окраски, которую он зачастую свя- зывает с наступлением события. Например, если игрок, играющий в вист или бридж, имеет на руках одни «пики», то такое «событие» может привести к обвинению этого игрока в шулерстве. Это непра- вильно. С точки зрения теории вероятностей любой набор карт, полу- ченных игроком, необходимо рассматривать как событие некоторого эксперимента. При этом любой возможный набор (быть может, и не- интересный) будет исходом эксперимента, который можно определить как событие с одним исходом. После введения понятия события мы можем заняться обсуждением специальных событий, а также различных соотношений, которые можно установить между событиями. При этом большую роль будут играть понятия и символы теории множеств. б) Специальные события. А. Элементарные (или простые) события. События, содержащие только один исход, называются элементарными (или простыми) со- бытиями. Б. Невозможные и достоверные события. Все утверждения (вы- сказывания) о случайном эксперименте можно разделить на три класса: (1) утверждения, которые не могут осуществиться; (2) утверждения, которые всегда верны; (3) утверждения, не входящие ни в класс (1), ни в класс (2). Примеры класса (1): (а) выпавшее число при бросании игральной кости равно 85; (б) следующая карта, взятая из колоды игральных карт, будет 15 пик; (в) результат бросания двух монет будет (Н, Н, И). При исследовании соответствующего пространства исходов для каждого из этих утверждений мы обнаружим, что оно не содержит ни одного элемента, при котором утверждение было бы верным. Таким об- разом, в каждом из этих случаев «множество истинности» будет пустым, и утверждение эквивалентно наступлению невозможного события, которое иногда обозначают {—}. Очевидно, такое событие никогда не может наступить, поэтому утверждение не может осущест- виться. Определение. Любое событие, совпадающее с пустым мно- жеством, называется невозможным событием. 111
Примеры класса (2): (а) выпавшее число очков при бросании игральной кости будет меньше 10; (б) время жизни .^которого лица будет больше или равно нулю; (в) выпавшая сторона при бросании обыкновенной монеты будет или гербом, или решеткой. Для каждого из этих утверждений множеством истинности будет все пространство исходов S. Л поскольку хотя бы один исход из S должен наступить, то при этом наступает и все событие S. Таким об- разом, утверждение будет всегда верным. Определение. Любое событие, совпадающее с пространством исходов, называется достоверным событием. Очевидно, что истинность любого утверждения из классов (1) и (2) может быть определена до выполнения соответствующего эксперимен- та. Множество истинности этих утверждений равно либо 0, либо X, т. е. сами утверждения соответствуют либо невозможным, либо досто- верным событиям. Что касается утверждений, принадлежащих к классу (3), то здесь неопределенность существует до тех пор, пока соответствующий экспе- римент не выполнен. В этом случае, прежде всего, и возникает необхо- димость в теории вероятностей. Если событие ни невозможно, ни досто- верно, то его наступление будет возможным, но неопределенным. Воз- никает вопрос: какова неопределенность наступления этого события? Цель теории вероятностей состоит в получении шкалы, с помощью кото- рой можно количественно измерять неопределенность наступления дан- ного события. Способы достижения этой цели будут описайы в следую- щих параграфах. В. Противоположные события. Рассмотрим в эксперименте с иг- ральной костью появление двух событий: первое — «выпадение нечет- ного числа», второе — «выпадение четного числа». На языке теории множеств эти события можно записать как Е = {1,3, 5}и77= {2,4,6}. Ясно, что при выполнении эксперимента должно наступить либо Е, либо F, поскольку вместе эти события охватывают все пространство исходов S. Очевидно, что оба события не могут наступить одновременно. Такие пары событий называются противоположными (дополнительны- ми). Как и в теории множеств, дополнение к событию Е будем обозна- чать Е', тогда F равно Е'. Определение. События Ей Г называются противоположными, если Е наступает, когда не наступает F, и наоборот. Упражнение 2.1.3 1. Нарисуйте диаграмму Венна для любой пары противоположных событий £ и Г на некотором пространстве исходов S. Покажите, что Е U F = S и Е П F = 0. 2. Прочтите заново параграф, посвященный дополнительным множествам в гл. 1.1. 3. Выпишите события в эксперименте А, которые будут противоположны {2}, {1, 3, 4}, {2, 5, 6}, 0, S, «число больше 3». 112
Г. Взаимно несовместимые события. Любые два события, не имею- щие общих исходов, называются взаимно несовместимыми. Такие пары событий не могут произойти одновременно; появление одного исключает появление другого. Если Е и F—взаимно несовместимые события, то Е П F = 0, т. е. их пересечение пусто. в) Комбинации событий. Читатель, наверное, уже заметил, что со- бытия трактуются нами точно так же, как множества в первой части. Все правила включения, операции объединения, разности, пересе- чения совместно со всеми основными законами алгебры множеств будут применяться без изменений и к событиям. Рекомендуем читателю про- смотреть соответствующие параграфы гл. 1.1 и усвоить следующие оп- ределения, показывающие, как «язык событий» преобразуется в «язык множеств». (1) Е [J F — событие, соответствующее объединению событий, на- ступает при наступлении хотя бы одного события Е или F и только при этом. (2) Е — F, или EF', — событие, соответствующее разности собы- тий, наступает при одновременном наступлении Е и ненаступлении F и только при этом. (3) EF — событие, соответствующее произведению событий, насту- пает при одновременном наступлении Е и F и только при этом. Важное замечание. В последующих параграфах, посвя- щенных теории вероятностей, символ пересечения f| опускается. Это общее правило в теории вероятностей. Пересечение событий выражает- ся последовательной записью символов, обозначающих эти события. Например, EFG обозначает пересечение трех событий Е, F и G. (4) Е с F — событие, соответствующее включению; F наступает, если наступает Е. Основные понятия и законы алгебры событий те же, что и для ал- гебры множеств (см. гл. 1.1). Упражнение 2.1.4 1. Для событий эксперимента А, описанных в таблице на с. 111 найдите: (а) дополнения к событиям от Ех до Е6; (б) объединение, разность и пересечение пар событий Е\Е2, Е2Е3, E3Es, EtE3, Е3Ее, E2Eit Е2Е3, Е2Е3, (в) дополнения всех событий, найденных в (б). Попытайтесь дать ответ не только описанием соответствующего подмножест- ва, но и получить его в рамках словесных формулировок. 2. Пусть Е, F и G—три события пространства S исходов эксперимента. Вы- разите следующие события на языке теории множеств: (а)Е и F наступают оба, a G не наступает; (б) F наступает, а Е и G—нет; (в) наступает только G; (г) насту- пает хотя бы одно из Е, F, G; (д) наступает только одно из событий; (е) наступают по крайней мере два события; (ж) наступают все три события; (з) наступают точ- но два события; (и) наступает не больше двух событий; (к) наступают меньше чем два события; (и) наступают Е или F (но не вместе), а событие G не наступает. г) Поля событий. Мы говорили, что все подмножества пространства исходов S называются событиями. Если S конечно, то класс (см. с. 27) всех подмножеств множества S может быть построен с помощью опе- раций дополнения и объединения элементарных событий, что иллюстри- руется следующей таблицей: ИЗ
Возможные события в эксперименте с пространством исходов {а, Ь, с} Подмножество Построение Событие, не содержащее исходов Элементарные события (простые исходы) События, состоящие из двух исходов События, состоящие из трех исходов {-}=0 {«} и. м {ab}, {fee}, {са} {abc} — S S' даны {ч}и{^} ИЛИ {с}' ИТ. д. {а}и(Ь}Щс} В среднем столбце таблицы приведены все восемь подмножеств, ко- торне могут быть получены из S. Эти события образуют полный класс событий, участвующих в построении и применении модели этого экспе- римента. При построении вероятностной модели эксперимента мы должны, во-первых, определить пространство исходов этого эксперимента и, во-вторых, класс событий, которые, собираемся рассматривать. Для конечных пространств исходов будем пользоваться классом всех под- множеств множества S. Пример построения такого класса был приве- ден ранее. Если S непрерывно, то класс всех подмножеств слишком велик для того, чтобы с его помощью можно было ввести понятие ве- роятности простым и естественным способом. Поэтому мы ограничим- ся наименьшим классом событий, который обладает следующими свойствами: (1) пустое множество 0 принадлежит этому классу; (2) если событие Е принадлежит классу, то и его дополнение Е' принадлежит этому классу; (3) если каждый элемент счетной последовательности событий Еъ Е2, Е3, ... принадлежит классу, то и объединение событий El U E2UE3U ••• принадлежит этому классу. На приведенных замечаниях и соответствующих допущениях чита- телю не следует заострять свое внимание. Будет достаточно, если он усвоит тот факт, что эти предположения позволяют ограничить класс всех возможных событий, определенных на S, до некоторого подкласса событий. Семейство событий, обладающих свойствами (1), (2) и (3) ока- зывается достаточным для описания любого физического явления, воз- никающего в результате случайного эксперимента. Класс подмножеств пространства исходов, используемый в теории, вероятностей и удовлетворяющий свойствам (1), (2) и (3), известен как поле событий. Мы будем обозначать поле событий символом &. При описании дискретных или непрерывных пространств исходов чи- татель может встретить соответственно названия булевское поле, боре- левское поле. Эти названия даны по именам математиков Дж. Буля (G. Boole, 1815—1864) и Е. Бореля (Е. Borel, 1871—1956), которые исследовали структуру и свойства таких классов подмножеств. 114
Упражнение 2.1.5 1. Выпишите все события для эксперимента «наблюдение верхней стороны монеты при ее бросании» (т. е. найдите поле событий). 2. Найдите поле событий для эксперимента с игральной костью (экспери- мент Л). 3. Покажите, что число событий в поле, построенном на пространстве исхо- дов, состоящем из п элементов, равно 2П. У Казани е. Покажите, что это число будет равно затем рассмотрите разложение бинома (1 + 1)п. 2.1.4. ВЕРОЯТНОСТНАЯ МЕРА а) Обсуждение проблемы. Мы возвращаемся к проблеме построения правил количественного измерения неопределенности появления собы- тий и их комбинаций. Прежде чем непосредственно переходить к ре- шению проблемы, рассмотрим снова события £ъ Е2, Е5 и Ев из экспери- мента А. Напомним, что в эксперименте с бросанием игральной кости S = {1, 2, 3, 4, 5, 6}; событие £х — «выпадение 5» = {5}; событие Е2 — «выпадение нечетного числа очков» = {1, 3, 5}; событие Ей — «выпадение числа очков меньше 0» = {—}= 0; событие Еа — «выпадение числа очков меньше 10» = {1, 2, 3, 4, 5, 6} = = 5. Будем считать, что невозможное событие имеет вероятность, равную нулю, достоверное событие — вероятность, равную единице, а все остальные события имеют в качестве вероятности числа от нуля до еди- ницы. Таким образом, получаем Р (£5) = Р (0) = 0 и Р (£е) = Р (S) = 1, где символом Р (X) обозначается «вероятность того, что событие X произойдет». Выясним теперь, что следует понимать под Р (£), когда событие £ не является ни невозможным, ни достоверным. Интуитивно мы вправе ожидать, что при правильной игральной кости выпадение любой сторо- ны имеет одинаковый шанс. У нас, таким образом, появляется искуше- ние приписать каждому элементарному событию {1}, {2}, {3}, {4}, {5}, {6} вероятность 1/6. Принимая такое решение, мы должны сознавать, что оно основано на нашей интуиции, а не на логике — мы не можем доказать правильность или ошибочность выбора этой вероятности. Мно- жество вероятностей {1/6, 1/6, 1/6, 1/6, 1/6, 1/6}, приписываемых элементарным событиям, будет основным и последним необходимым условием построения вероятностной модели, описываю- 115
щей эксперимент с бросанием игральной кости. Правилен ли выбор этого множества или нет, будет исключительно зависеть от соответствия выводов, полученных из модели, и результатов экспериментов с броса- нием КОСТ . Итак, основываясь на интуитивных соображениях, мы видим, что Р (Ех) = 1/6. Что теперь можно сказать о значении Р (Е2), т. е. вероятности вы- падения нечетного числа очков? Рассматриваемое событие содержит три исхода, наступление каждого из которых ведет к наступлению события Е2- Учитывая это, можно оправдать такое определение вероятности: Р(Б2)=Р({1,3,5}) = Р({1}) + Р({3}) + Р({5}) = 44--^ + 4=4-. о о о 2 Это — так называемое правило сложения вероятностей, и оно пред- ставляет собой фундаментальное правило при отыскании вероятностей для комбинаций событий (см. аксиому III в следующем параграфе). Показав на примерах основные свойства вероятности, рассмотрим некоторые общие положения и правила использования вероятностей в математических моделях. б) Общие положения. (1) Мы предполагаем, что шкала измерения вероятностей нахо- дится на действительной оси и вероятность — действительное число между 0 и 1 включительно. (Иногда вероятность указывается в процен- тах между 0 и 100% включительно.) (2) Каждому событию, относительно которого с уверенностью можно утверждать, что оно не произойдет в данном эксперименте, в качестве его вероятности приписывается число 0, каждому достоверному собы- тию приписывается число 1. (3) Вероятности любых других событий — числа между 0 и 1. Такое правило сопоставления основано на интуиции и результатах простых экспериментов, выполненных ранее. Итак, число, приписываемое со- бытию Е в поле &, назовем вероятностью события Е и обозначим Р (Е). (4) Вероятности, приписываемые событиям, удовлетворяют следую- щим правилам (аксиомам). Аксиомы вероятности Аксиома I. Е (Е) 0 для любого события Е поля событий 2F. Аксиома II. Р (S) = 1 для достоверного события S. Аксиома III. Если Еъ Е2, .... Еп, ... — любая счетная после- довательность взаимно несовместимых событий на поле &, то вероят-' ность события, являющегося их объединением, равна сумме вероят- ностей отдельных событий, т. е. Р (Ej и Е2 и ... и Еп и ...) = Р (EJ + Р (Е2) + ... + Р (Еп) + ... Аксиомы I и II утверждают, что все вероятности неотрицательны и что вероятность достоверного события равна 1. Аксиома III постули- рует интуитивно ясное и естественное требование, в силу которого ве- роятность объединения событий можно получить суммированием ве- роятностей составляющих событий при условии, что эти события взаим- но несовместимы. 116
При желании читатель может представлять себе Р (•) как функцию, определенную на поле и принимающую значения на отрезке [0, 1]. Итак, каждому событию Е в поле & приписывается некоторое число между 0 и 1, которое обозначается Р (£). в) Первые результаты. Первые шаги в построении нашей модели закончены. На пространстве исходов S было построено поле событий &. На этом поле мы определили вероятность (удовлетворяющую аксиомам I, II, III) с помощью функции вероятностей Р на $•. Тройку (S, $, Р) будем называть вероятностным пространством случайного экспери- мента. Читателя необходимо предупредить, что нет непогрешимых правил построения подходящего вероятностного пространства для любого данного эксперимента. Исследователю могут потребоваться практи- ческие навыки, развитая интуиция и немалые затраты труда, чтобы правильно выбрать 5 и Р для изучаемого эксперимента. Сделав свой выбор, он должен быть готов к тому, что после предварительного экс- периментирования он столкнется с необходимостью модификации выбранных S и Р. Определив вероятностное пространство, мы можем развивать теорию вероятностей дальше. Следующие четыре теоремы показывают, как это можно сделать. Некоторые пункты доказательства читатель, когда это представляется возможным, может проверить с помощью диаграмм Венна. Теорема 1. В (0) = 0. Доказательство. Так как S С F, то S' = 0 также при- надлежит $. Однако S и 0 взаимно несовместимы и потому (аксиома III) Р (5 U 0) = Р (5) + Р (0); поскольку S U 0 = S, то Р (S) = Р (S) + Р (0), откуда Р (0) = 0. Теорема 2. Р (Е) = Р (EF) + Р (EF)'. Доказательство. Из диаграммы Венна для пересекающих- ся множеств Е и F следует, что Е = (EF) U (EF'), причем EF и EF' взаимно несовместимы. Утверждение теоремы следует из аксиомы III. Теорема 3. (Вероятности противоположных событий.) Р (Г) = 1 — Р (F). Доказательство. Заменяя в теореме 2 событие Е на S, по- лучим: Р (S) = Р (SF) + Р (SF'), 1J7
т. е., на основании аксиомы II, 1 = Р (F) + Р (F'), что и завершает доказательство. Теорема 4. (Вероятности объединения событий.) Р (Е U Д) = Р (Е) + Р (F) — Р (EF). Доказательство. Событие Е U F, которое означает «насту- пает или Е, или F (или же Е и F одновременно)», может быть записано как объединение двух взаимно несовместимых событий Е и E’F. Про- верьте это с помощью диаграммы Венна. Таким образом, Р (Е U F) = Р (Е (J (E'F)) = Р (£) Д Р (E'F) (аксиома III) = = Р (£) + Р (F) — Р (EF) (теорема 2). Заметим, что когда Е и F взаимно несовместимы, т. е. EF — 0, теоре- ма 4 превращается в аксиому III. Упражнение 2.1.6 1. Покажите, что Р (EF) < Р (£) < Р (Е IJ F) < Р (£) + Р (F). 2. Пусть, £, F и G — три произвольных события в JT. Обобщите теорему 4 и покажите, что Р (Е U F (J G) = Р (£) + Р (F) + Р (G) - Р (EF) — Р (FG) — Р (GE) + + Р (EFG). 2.1.5. МЕТОДЫ ЗАДАНИЯ ВЕРОЯТНОСТЕЙ Наиболее трудная задача математического моделирования реаль- ных явлений состоит в правильном задании множества вероятностей. Как было указано в 2.1.4, исследователь на этом этапе должен проявить весь свой опыт и интуицию. Далее даны два наиболее общих метода получения вероятностей1. В прошлом веке этими способами пользо- вались, пытаясь определить значения вероятностей в терминах эмпи- рических понятий. Сейчас установлено, что это, вообще говоря, не- возможно, однако имеет смысл применять эти способы для определения вероятностей в аксиоматических моделях. а) Вероятности и относительные частоты. При изучении некоторого события Е случайного эксперимента X вероятность Р (Е), приписывае- мая этому событию, может быть получена следующим образом. Выполним эксперимент многократно (скажем N раз) и подсчитаем, сколько раз событие Е произошло. Обозначим это число через пЕ- От- ношение iieIN назовем относительной частотой появления события Е в N испытаниях. Это отношение может быть полезным для оценки Р (Е) 1 В этой главе далее рассматриваются эксперименты только с дискретными пространствами исходов. Вопрос задания вероятностей в непрерывных прост- ранствах затрагивается в гл. 2.4. Определения условной вероятности и незави- симости, данные в 2.1.6, распространяются на любые вероятностные простран- ства. 118
Ч О 10 20 30 4Д 50 N Число бросаний Рис. 56. Относительная частота выпа- дений герба в N бросаниях монеты Справедливость такого способа основана на гипотезе о существова- нии константы (обозначим ее Р (Е)), около которой группируются от- носительные частоты nE/N, вычисленные по N различным сериям экс- периментов. Если N брать достаточно большим, то относительные часто- ты будут все ближе группироваться около этой константы. На рис. 56 показано, как.пЕ1М изменяется при увеличении N для эксперимента с бросанием обыкновенной монеты. И хотя доказать справедливость гипотезы невозможно, практика показывает, что такой способ приемлем. В действительности этой ги- потезой пользуются в большинстве приложений теории вероятностей при построении математических мо- делей реальных явлений. При выполнении следующих экспериментов для читателя будет полезно воспользоваться таким способом определения вероятности. Эксперименты (1) Бросьте монету N раз (7V = 10, 20, 30 и т. д.) и подсчитайте число выпадений герба. Найдите относительную частоту Н и нане- сите это число вместе с N на диаг- рамму. Заметьте, как все ближе группируются точки около некоторого числа лежащего между 0 и 1. Оцените Р (Я). (2) Бросьте две кости N раз (N = 10, 20, 30 и т. д.) и подсчитайте, в скольких из них сумма выпавших очков Т = 5. Относительную часто- ту и N нанесите на график. Оцените Р (Т = 5). б) Пространства с равновозможными исходами. Во многих прило- жениях теории вероятностей (например, случайные игры) простран- ство исходов может быть описано как конечное множество исходов, наступления которых можно считать «равновозможными». Если мы предполагаем, что каждый из п исходов в S имеет одинаковый шанс для его наступления, то мы должны приписать каждому из них вероятность, равную Мп. Таким образом, Р ({х}) = Мп для любого х Е S. Это соотношение известно как вероятностная функция Лапласа, по имени математика и философа, чья книга «Theorie analytique des probabilites» (1812) сделала так много для превращения теории вероят- ностей в математическую дисциплину. Поскольку любое событие, определенное на конечном пространст- ве исходов, может быть представлено как объединение элементарных событий, то вероятность его наступления можно найти с помощью функции Лапласа и аксиомы III. Таким образом, если Е {xlt х2, ..., хг} — {xj (J {х2} U ... U {хг}, то Р (Е) = Р ({хх}) + Р ({х2}) + ... + Р ({хг}) (аксиома III) — = Мп 4- Мп + ... + Мп = г/п. 119
Принято число исходов в Е обозначать через N (Е). Поскольку для конечного пространства исходов N (S) = п, то, предположив, что N (Е) = г, можно записать: Р(Е) = -ЛЮ. = _£_. ' JV(S) п Это соотношение часто называют классическим определением вероят- ности события. Примеры (1) Бросание игральной кости. Найти вероятность того, что выпа- дет четное число очков. Решение. Пространство исходов S = {1, 2, 3, 4, 5, 6}, событие Е = = {2, 4, 6}. Поэтому р (£) = ЛЮ. = А v ' JV(S) 6 в предположении, что исходы равнозначны. (2) Бросание двух игральных костей. Найти вероятность того, что сумма выпавших очков равна 5. Решение. Пространство исходов S = {(1,1), (1,2), ..., (6,6)} (см. 1.2.3 о произведении пространств), событие Т = {(1,4), (2,3), (3,2), (4,1)}- Поэтому Р(Т\= Л?(Г) _ 4 V ' M(S) 36’ (3) Бросание двух монет. Найти вероятность того, что появится только один герб. Решение. Пространство исходов S = {(ТЕ), (НТ), (TH), (НН)}, событие Е = {(НТ), (TH)}. Поэтому Р (£) = ЛЮ. = _L v ' JV (S) 4 в) Комбинаторные задачи. Итак, если вероятности заданы способом, описанным в п. б), то задача вычисления вероятности события сводится к подсчету числа элементов множества исходов события, числа элемен- тов пространства исходов и к вычислению отношения этих чисел. Во многих задачах возможно отыскание нужных величин без непосредст- венного составления списка элементов множеств Е и S или их описа- ния. Однако в любом случае необходимо дать точное определение этих множеств и указать способ их построения. При подсчете числа элемен- тов множеств Е и S очень часто пользуются приведенными далее че- тырьмя формулами. Читатель, наверное, уже знаком с ними. Он мог встретить их при первом знакомстве с комбинаторикой, и поэтому детали в объяснениях будут опускаться. 120
Формула 1. Если некоторое задание может быть выполнено т спо- собами, а другое задание — п способами, то число различных способов выполни ния двух заданий равно тп. Пример. Директор школы (мужчина) и заведующая учебной частью (женщина) выбираются из группы кандидатов, состоящей из четырех мужчин и пяти женщин. Сколько существует различных воз- можных способов такого выбора? Решение. Директор школы может быть выбран четырьмя способами, заведующая учебной частью — пятью способами. Таким образом, чис- ло различных возможных пар равно 4-5 = 20. Формула 2 (размещения). Если из п различных предметов сделана выборка объема г и предметы расставлены в соответствии с порядком их выбора, то число возможных различных упорядоченных выборок равно п (п — 1)...(« — г + 1). Это число может быть записано через факториалы и обозначено Лп или пРг. Итак, Агп = пРг = п (п— 1)... (п—г-|-1) = nl (« — 'В ' Отметим, что каждый предмет может быть выбран только один раз. Окончательная выборка называется размещением г объектов, и го- ворят, что выборка производилась без повторений или без возвращения выбранного предмета. Формула 3. Если выборка в формуле 2 производится с повторением или с возвращением (т. е. каждый выбранный предмет записывается и кладется обратно, прежде чем выбирается следующий предмет), то число различных возможных упорядоченных выборок равно пп...п = = пТ. Формула 4 (сочетания). Если число различных объектов равно п и производится выборка объема г без возвращения выбранного предме- та на место, то число возможных различных выборок при условии, что порядок не играет роли, равно A=_el_. г! г! (п—г) ! Такие выборки называют сочетаниями. Число сочетаний из п элемен- тов по г обозначают Ch, или пСг, или Оно совпадает с соответству- ющим биномиальным коэффициентом. Примеры (1) Урна содержит 4 цветных шара (красный, белый, синий, зе- леный), из нее производится выборка объема 2: (а) упорядоченная без возвращения шаров в урну, (б) упорядоченная с возвращением, (в) неупорядоченная без возвращения. Найдите число возможных выбо- рок в каждом случае. 121
Решение. (а) Список всех размещений из 4 шаров по 2 будет следующим: л== (кб), (кс), (кз), (бс), (бз), (сз) 1 (бк), (ск), |3к), (сб), (зб), (зс) J ’ таким образом, N (Л) — А\ = 4Р2 = 12. (б) Теперь выборка производится с возвращением, поэтому список будет таким: В = A U {(кк), (бб), (сс), (зз)}, таким образом, N (В) = 42 = 16. (в) Список сочетаний из 4 шаров по 2 будет следующим: С — {(кб), (кс), (кз), (бс), (бз), (сз)}. Сравним это множество с А. Очевидно; что множество выборок из А, для которых порядок не имеет значения, совпадает с С. Таким образом, - ДГ(С) = С2 = Р ) = 6. (2) Предположим, что шары в урне из примера (1) хорошо переме- шаны. При различных условиях этого примера (а), (б), (в) будем выби- рать из урны пару шаров (такой выбор называется случайной выбор- кой). Найти в каждом случае вероятность того, что выбранная пара содержит по крайней мере один белый шар. Решение. Пространствами исходов для соответствующих экспери- ментов будут множества А, В и С с соответствующими множествами событий: для А {(кб), (бк), (бс), (сб), (бз), (зб)}; для В {(кб), (бк), (бс), (сб), (бз), (зб), (бб)} для С {(бк), (бс), (бз)}. С помощью вероятностной функции Лапласа отсюда легко найти соот- ветствующие вероятности. Ими будут числа 6/12, 7/16, 3/6. Чтобы научиться уверенно и успешно пользоваться этими форму- лами, необходима практика. Читателю полезно будет проделать упраж- нения, предложенные в конце этого параграфа. Другие задачи подоб- ного рода он сможет найти в книгах по комбинаторике или теории ве- роятностей. В дальнейшем читатель увидит, что всякий раз, когда со- ставление списка пространства исходов возможно, такая процедура окажется весьма полезной для преодоления тех неясностей и неопреде- ленностей, которые еще долго будут возникать в подобных задачах. Упражнение 2.1.7 1. В таблице на с. 123 приводятся описания различных экспериментов. Для каждого эксперимента определяются два события (Е и F). (а) Составьте список элементов пространства исходов событий Е и F. (б) Опишите (словами и (или) с помощью списка элементов множества) собы- тия Е', F'. E (J F, (Е (J F)', EF, (EF)', (Е — F). (в) Найдите вероятности всех событий из (а) и (б), применяя вероятностную функцию Лапласа. 122
Эксперимент (выбор случаен, без возвращения, кроме особо оговоренных случаев) Событие Е Событие F 1. Бросается одна игральная кость 2. Бросаются две игральные кости 3. Выбираются две карты из ко- лоды 52 перетасованных карт 4. Из урны, содержащей 2 зеле- ных и 4 синих шара, выбира- ются 2 шара 5. Эксперимент 4 выполняется с возвращением 6. Три карты выбираются из ко- лоды 52 перетасованных карт 7. Из урны, содержащей 9 биле- тов, занумерованных от 1 до 9 включительно, выбираются 3 би- лета 8. За круглый стол случайным образом садятся двое мужчин и две женщины 9. Бросаются 3 монеты 10. Из ящика, содержащего 6 крас- ных, 2 синих и 8 желтых нос- ков, выбираются 2 Появление числа, большего 2 По крайней мере од- но число равно 4 По крайней мере од- на карта туз Оба шара будут си- ними То же Все карты будут ту- зами Выбранные билеты будут иметь номера меньше 5 Мужчины сидят ря- дом Выпадение по край- ней мере одного гер- ба Оба носка одного цвета Выпадение четно- го числа Сумма выпавших чисел равна 10 Обе карты будут пиковыми По крайней мере один шар будет синим То же Одна карта туз пик, а остальные меньше девятки Все выбранные билеты будут не- четными числами Слева и справа от мужчин сидят женщины Выпадение не бо- лее одного герба Оба носка желтые 2. В лотерее имеются 20 билетов. 8 из них помечены словом «выигрыш», ос- тальные — пустые. Найдите вероятность вытащить «выигрыш» (по крайней мере один), если (а) покупается один билет, (б) покупаются два билета, (в) покупаются три билета. 3. В колоде 52 хорошо перетасованные карты. Из нее случайным образом вынимаются две карты без возвращения извлеченной карты в колоду. Найдите вероятность того, что (а) обе карты будут тузами, (б) обе карты черные, (в) только одна карта красная, (г) одна карта туз пик, (д) ни одна карта не будет тузом пик, (е) выбранные карты составляют последовательную пару одной масти, например, дама и валет, девятка и восьмерка и т. д., (ж) карты составляют последовательную пару разной масти, (з) выбранные карты будут старшими, т. е. валетом, дамой, королем или тузом. 4. В колоде 52 хорошо перетасованные карты. Из нее случайным образом без возвращения вынимаются четыре карты. Найдите вероятность того, что (а) все карты короли, (б) три карты короли, (в) две карты короли, (г) все карты крас- ные, (д) три карты красные, (е) две карты красные, (ж) выбранные карты будут девяткой, валетом, дамой и королем одной масти, (з) десяткой, валетом, дамой и королем разных мастей, (и) все карты одной масти, (к) карты образуют две пары (например, два короля и две десятки, два валета и две шестерки и т. д.). 5. Производится случайная перестановка чисел 1, 2, ..., п. Найдите вероят- ность того, что числа (а) 1 и 2; (б) 1, 2 и 3 будут расположены в естественном по- рядке. 6. Производится случайный выбор трех цифр из множества {0, 1, 2, ..., 9} с повторениями. Найдите вероятность того, что (а) будет 2 повторения (т. е. три цифры будут одинаковыми), (б) будет 1 повторение (т. е. две цифры будут одина- ковыми), (в) не будет повторений. 123
7. Чему равна Вероятность того, что среди 5 случайных цифр (а) не будет цифры 9, (б) не будет цифры 1, (в) не будет ни 9, ни 1, (г) будет хотя бы одна из цифр 9 или 1, (д) не будет хотя бы одной из цифр 9 или 1? Обозначим через Е и F события, соответствующие (а) и (б). Выразите остальные события через Е и F. i 2.1.6. УСЛОВНАЯ ВЕРОЯТНОСТЬ: СТОХАСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ а) Определения. Рассмотрим еще два понятия, играющие фунда- ментальную роль в теории вероятностей. Прежде всего дадим определе- ния и проиллюстрируем их на примерах. В конце параграфа приведены упражнения, так что некоторые дополнительные сведения читатель может приобрести самостоятельно. Пусть Е и F — два события некоторого случайного эксперимента. Определение 1. Условная вероятность. Условная вероят- ность события Е при наступлении события F определяется по формуле P(E/F) = ^ff, причем Р (F) Ф 0. (Если Р (F) = 0, то условная вероятность не опре- делена.) Определение 2. Независимость. События Е и F называются стохастически независимыми (или просто независимыми), если Р (E/F) = Р(Е). Другими словами, если наступление события F не изменяет вероят- ность наступления события Е, то Е будет независимо от F. Легко до- казать*, что событие F также будет независимо от Е. Примеры Рассмотрим множество студентов, сидящих в одной аудитории: Число студентов.....................20 (множество S) Число курящих студентов............. 8 (подмножество Е) Число студентов в очках ...........12 (подмножество F) Число курящих студентов в очках .... 6 (подмножество EF) Эта таблица может быть графически изображена в виде диаграммы Венна (рис. 57, с. 125); студенты обозначаются крестиками. Дважды заштрихованная область соответствует подмножеству EF. Рассмотрим следующий эксперимент. Занумеруем всех студентов числами от 1 до 20. Пользуясь случайными числами или системой ло- терейных билетов, выберем одно число между 1 и 20. Студента под вы- бранным номером мысленно удалим из комнаты. Является ли этот сту- дент курящим и носит ли он очки? Пусть S будет пространством исходов, а Е, F и EF — событиями, определенными на S. С помощью функции вероятностей Лапласа можно легко определить следующие вероятности: * Воспользуйтесь одновременно формулами из определений 1 и 2. — При- меч. ред. 124
Р (Е} = = — • ' f N(S) 20’ P(F)=^=”-, ' A/(S) 20 P(EF) = -{Er> = — v ' JV(S) 20 (1) (2) (3) Эти вероятности приписываются событиям до того, как студент ото- бран и вышел из аудитории. Предположим теперь, что, когда студент выходил за дверь, мы за- метили ца немочки. В таком случае наверняка можно утверждать, что он принадлежит к подмножеству F, хотя мы пока и не знаем, курит он или нет. Очевидно, что такая до- полнительная информация изме- нит характер эксперимента и при- писываемые событиям вероятности должны быть пересмотрены. N(S) = 20 N(E) = 8 N(F)—12 N(EF) = 6 Рис. 57. Диаграмма Венна. Подмно- жество Е соответствует курящим сту- дентам, подмножество F— студентам, которые носят очки Легко согласиться с тем, что Р (F) = 1 и множество F для но- вого измененного эксперимента можно взять в качестве нового про- странства исходов. Так как в F есть только 6 курящих (обозначим это множество Е*), то ясно, что вероятность того, что студент курит, будет равна 6 ' ' N (F) 12 (4) Это и будет условной вероятностью события E/F. Объединяя описания первоначального и измененного эксперимента, из уравнений (2), (3) и (4) находим: P{E/F)=N-^ = ^ = 4 ’ N(F) N(F) __(EF) N (S) ___ p (ef). 1 N (S) ' N (F) V ' P (F) ‘ Эти формулы полностью совпадают с формулами из определения 1. Разобранный пример в некоторой степени мотивирует определение условной вероятности, и читатель много выиграет от его внимательного изучения. Короче говоря, вероятность, приписываемая событию,Изменяется тем больше, чем больше информации получено о случайном эксперимен- те. Наконец, если мы имеем полную информацию, эксперимент пере- стает быть случайным экспериментом. В действительности все вероят- ности вычисляются при заданном пространстве исходов; таким образом, все события будут условными и мы должны их записывать как Р (E/S), Р (F/S) и т. д. Новая информация, вообще говоря, заставляет нас из- 125
менить пространство исходов модели; при этом необходимо пересмот- реть и вероятности, приписываемые событиям. Рассмотрим теперь вопрос'о независимости событий «студент ку- рит» и «студент носит очки». Естественно считать, что ношение очков и курение — две совершенно не связанные вещи. С другой стороны, мо- жет случиться, что многолетнее и страстное увлечение курением по- влияет на остроту зрения у таких курильщиков. Для того чтобы пол- ностью ответить на этот вопрос, необходимо было бы провести полное статистическое обследование, которое включало бы проверку зрения у большого числа людей и исследование некурящих, непостоянно и постоянно курящих. Для ситуации в нашем простом эксперименте мы воспользуемся определением независимости и посмотрим, что это нам даст. Мы можем легко вычислить: (1) вероятность того, что студент окажется курящим, для случая, когда вся группа студентов рассматривается как пространство исходов. Таким образом, Р (£) = 8/20 = 4/10 (уравнение (1)); (2) вероятность того, что студент окажется курящим, для случая, когда во внимание принимаются только студенты, носящие очки. Тогда Р (E/F) = 6/12 = 5/10 (уравнение (4)). Как видим, Р(Е) Р (E'F); в соответствии с определением 2 мы должны сказать, что события Е и F не независимы. Мы должны остере- гаться от обобщения этого утверждения па подобного рода предположе- ния относительно всех студентов. Утверждение имеет место только в рамках нашего очень простого эксперимента. Вопросы обобщения выводов, полученных из статистических экспериментов, исследуются в теории статистических выводов, которая будет обсуждаться в даль- нейшей главе. Упражнение 2.1.8 1. Для описанного эксперимента укажите содержание событий Е', F', Е' F', Е U F, (Е U FY, (Е — F), F/E, E/F', (Е (J F)/F, (Е U F)’/E. Найдите вероят- ности для каждого события. 2. Оперируя результатами решения задачи 1, проверьте следующие утверж- дения: р (FE} (1) P(FIE) = -~r (заметим, что Р (FE) = P (EF)) - Р (Е) (2) £(£') = !-£.(£); (3) Р (Е (J F) = Р (Е) + Р (F) — Р (EF); (4) Р (F) =/= Р (F/Е) (отсюда следует, что F не независимо от Е); (5) Р((Е (J F)') = Р (Е'F') (воспользуйтесь правилом Де Моргана). 3. Повторите задания 1 и 2 из этого упражнения для следующего эксперимен- та. Случайным образом выбирается лицо из группы, состоящей из четырех муж- чин и восьми женщин. Известно, что в этой группе имеются три супружеские пары, остальные в браке не состоят. Е — событие «выбранное лицо — женщина»; F — событие «выбранное лицо состоит в браке». 4. Повторите задания 1 и 2 из этого упражнения для следующего эксперимен- та. Бросается правильная игральная кость. Е — событие «выпавшее число очков нечетное»; F — событие «число очков меньше 3». 5. Докажите, что если Р (E/F) = Р (Е), то Р (F/E) = Р (F). 126
6. Докажите, что если Р (E/F) = Р (Е), то Р (E/F') = Р (£). 7. Докажите, что если Р (E/F) = Р (£), то Р (EF) = Р (Е)-Р (£). (Опреде- ление независимых событий дается часто с помощью этой формулы.) 8. Докажите, что Р (E'/F) =1 — Р (E/F). 9. Если £ С F, то покажите, что Р (E/F) = Р (Е)/Р (£). 10. Если F С £, то покажите, что Р (E/F) = 1. И. Бросают игральную кость до первого появления 1. Предположив, что 1 нс появилась в первых двух бросаниях, найдите вероят- ность того, что для появления 1 потребуется больше 4 бросаний. 12. Бросают две игральные кости. Найдите условную вероятность того, что одна кость показывает 6, при условии, что другая показывает 4. 13. С помощью диаграммы Венна покажите, что £= (££')U (££), и, таким образом, покажите, что Р (£) = Р (EF') + Р (EF). 14. Воспользуйтесь заданием 13 и определением условной вероятности, чтобы показать, что _______£(£/£)•£ £(£/£)£(£) +P(EIF')-P(F'y Замечание. Это простейшая форма знаменитой теоремы, известной как теорема Байеса. 15. Предположим, что вероятность для мужчины дожить до 30 лет равна 4/5, а вероятность его жены дожить до 30 лет равна 5/6. Найдите вероятность того, что до 30 лет доживут (а) оба, (б) только мужчина, (в) только женщина, (г) ни мужчина, ни женщина, (д) хотя бы один из них. (П 2.. 1.7. ВЕРОЯТНОСТИ НА ПРОИЗВЕДЕНИИ ПРОСТРАНСТВ В 2.1.2, б) мы объяснили, как исходы последовательности экспери- ментов можно представить точками произведения пространств. Зай- мемся теперь обсуждением проблемы вычисления вероятностей на та- ких пространствах. Для иллюстрации этого метода вновь рассмотрим эксперимент, опи- санный в 2.1.2, б). Этот эксперимент состоял из последовательного «бросания монеты» и «бросания кости». Пространство исходов для всего эксперимента будет S1XS2, где = {Д, Т}, a S2 = {1, 2, 3, 4, 5, 6}, т. е. оно со- стоит из множества точек {(/И), (Д2), (ДЗ), (Н4), (Н5), (Н6), (Т1), (Т2),(ТЗ), (Т4), (Тб), (Тб)}. Какие вероятности необходимо придать этим точкам? Можно ответить, что для этой цели подойдет любое мно- жество вероятностей, которое удовлетворяет аксиомам I, II и III из 2.1.4, б). С математической точки зрения этот ответ годится для любого выборочного пространства. Однако мы выберем такое множество, кото- рое дает право определить его для «последовательности независимых испытаний». Этот выбор будет тем лучше, чем больше он будет соответ- ствовать эмпирическим экспериментам и чем полнее он отразит интуи- тивный смысл понятия независимых испытаний, описанного в 2.1.2, б). Рассмотрим событие {(Д/)} в выборочном пространстве S1xS2. Заметим, что {Н} будет событием в S15 а {1} — событием, определенным на Х2. Определим вероятность {(Д/)} какР[{(Д/)}1 = Р [{Д}]-Р [{1}]. Таким же способом можно определить вероятность для каждой точки из S2. Итак, если (х, у) — точка в X S2, ее вероятность опреде- ляется как р [<(х, I/)}] = Я{х}1 . Р [{//}]. 127
Это определение вероятности обеспечивает выполнимость трех ак- сиом. Оно соответствует нашему интуитивному представлению о неза- висимых экспериментах и связано с определением независимых собы- тий, которое приведено в предыдущем параграфе. Последнее утверж- дение мы проиллюстрируем на примере. Дальнейшую аргументацию можно найти, например, в [15]. I) Определение вероятности удовлетворительно*. Вероятность для каждой точки 5гХ52 не меньше нуля, так как она является произве- дением двух вероятностей. Сумма вероятностей всех точек равна 1, поскольку P[S1Xs2]= 2 2 Д К*}] Д [{*/}] = х е Si у esa - S ^[{х}] 2 Р [{//}] = *es, y^s3 = 1-1 = 1. Для иллюстрации этого факта вновь рассмотрим эксперимент с моне- той и игральной костью. Покажем, что двойная сумма вероятностей, соответствующих каждой точке, разбивается на две различные суммы, каждая из которых равна 1 (вероятность события {х} мы сокращенно будем обозначать Р (х)): Р [S1XS2] = Р (Н)-Р (1) + Р (Н)-Р (2) + ... + Р (Н)-Р (6) + + Р (Т)-Р (1) + Р (Т)- Р(2) + ... + Р (Т)-Р (6) = = [Р (И) + Р (Т)] •[ Р (1) + Р (2) + ... + Р (6)] = = 1-1. 2) Связь с интуитивным понятием независимых испытаний. Для иллюстрации рассмотрим пример двух событий, определенных на про- странстве исходов S1X<S2. Положим, Ег — «монета показывает Н, а игральная кость — любое число» и Е2 — «выпадает Н или Т, а кость показывает 3». Таким обра- зом, Ег — множество точек {(Д1), (Д2), (ДЗ), (//4), (Д5), (Д6)}, а Е2 — множество {(ДЗ), (ТЗ)}. События Е} и Е2 будут независимыми в рассмотренных эксперимен- тах. В интуитивном смысле это очевидно: событие Ег не влияет на число очков, выпадающих при бросании игральной кости, а событие Е2 не влияет на результат при бросании монеты. Убедимся в их статистической независимости формально. Пере- сечение событий, т. е. «одновременное наступление Ег и Т2», будет соответствовать {(ДЗ)}. Таким образом, Р (ЕгЕ2) = Р [(Д3)1. Учи- тывая, что р (Дт) = р (Нур (1) + ... + Р (Н)-р (6) = = Р (Н)-[Р (1) + Р (2) + ... + Р (6)] = Р(Н) * Удовлетворительно с точки зрения тех интуитивных требований, которые мы предъявляем на основе первого определения вероятности. — Примеч. ред. 128
и Р (£2) = Р (1Г)-Р (3) + Р (Т)-Р (3) = = [р (//) + Р (Т)]-Р (3) = Р (3), получим Р (Е^) = Р [(/73)] = Р (Н)-Р (3) = Р (EJ-P (£2), т. е. события Е} и £2 статистически независимы. Аналогично можно убедиться в независимости любой пары событий Ег и £2, определенных на SjXS2. Этот параграф мы закончим определением последовательности не- зависимых экспериментов. Определение. Допустим, случайные эксперименты X и Y имеют выборочные пространства Sx и S2; одноточечное событие {х} в X происходит с вероятностью рх, а одноточечное событие {у} в Y — с ве- роятностью ру. Тогда последовательность экспериментов (X, Y), т. е. Y следует за X, имеет выборочное пространство SiXSz, и эта по- следовательность независима, если вероятность для каждого одноточеч- ного события {(х, у)} в (X, Y) равна Я{(х, у)}1 = px-pv. Это определение очевидным образом обобщается на случай трех и большего числа экспериментов. Как определить вероятность Р [{(х, г/)}], если рассматриваемые эксперименты не являются независимыми? Задача удовлетворительного определения вероятностей на произве- дении пространств для зависимых экспериментов будет обсуждаться в гл. 3.1, посвященной марковским цепям*. Упражнение 2.1.9 Определите вероятности точек для каждого пространства исходов упраж- нения 2.1.2. Упражнение 2.1.10 (смешанные задачи) 1. При изучении группы из 270 студентов оказалось, что 90 студентов пре- успевают в математике, 90 — в музыке, 90 — в спорте. Кроме того, было обна- ружено, что 30 студентов преуспевают как в математике, так и в музыке, 30 — как в музыке, так и в спорте, 30 — как в математике, так и в спорте. И только 10 студентов преуспевали сразу в трех областях. Найдите для г = 0, 1, 2, 3 число студентов, преуспевающих (1) точно в г, (2) не более чем в г, (3) по меньшей мере в г областях. Предположим, что из группы в 270 человек студент выбирается случайным образом. Определите вероятность того, что он преуспевает (1) точно в двух облас- тях, (2) более чем в одной области. 2. Докажите, что N (A L) В (J С) = N (А) + N (В) -|- N (С) — N (АВ) — N (ВС) — N (СД)+ + N (АВС), где N (А) означает «число элементов множества Л», и т. д. * Дальнейшие свойства вероятности читатель может изучить по книгам [41], [44], [45], [42]. — Примеч. пер. 5 Зак. 973 129
\ 3. Из переписи была взята группа в 500 человек со следующими данными: пол, состоит ли в браке, имеет ли машину. При этом оказалось, что в этой группе 300 мужчин, 290 человек состоят в браке, 415 имеют машину, 200 мужчин жена- ты, 250 человек состоят в браке и имеют машину, 250 мужчин имеют машину, 190 мужчин женаты и имеют машину. Покажите, что число человек в разных категориях не соответствует друг другу. 4. В ящике находятся 94 хороших и 6 плохих болтов. Из ящика случайным образом выбрано пять болтов. Найдите вероятности того, что (1) пи один болт не будет плохим, (2) все плохие, (3) хотя бы один болт плохой. Дайте два ответа: один — для случая выбора с возвращением, другой — для выбора без возвраще- ния. 5. Случайным образом из телефонной книги выбираются два номера теле- фонов. Какова вероятность того, что числа в последнем разряде каждого номера будут (1) различными, (2) одинаковыми? 6. Из большой связки галстуков, в которой зеленый, красный и желтый цвет находятся в пропорции 5:3:2, трое мужчин случайным образом выбирают по цвет- ному галстуку. Какова вероятность того, что они выберут галстуки одинакового цвета? 7. Игрок бросает две игральные кости — одну белую, а другую красную. (1) Какова вероятность того, что суммарное число очков будет равно 8? (2) Какова вероятность, что суммарное число очков будет между 5 и 8 вклю- чительно? (3) После бросания кости игрок видит, что белая кость показывает 3, но не видит числа очков, выпавших на красной кости (закатилась под бумаги). Чему равна вероятность того, что суммарное число очков равно 8? 8. Четыре лица случайным образом выбираются из группы, состоящей из 4 англичан, 3 шотландцев и 2 ирландцев. Найдите вероятности того, что (1) точно 2 выбранных человека будут англичанами, (2) в выбранную группу входят 2 ир- ландца, (3) в выбранной четверке есть человек каждой национальности. 9. Два человека по очереди бросают две игральные кости. Выигрывает тот, кто первый при одном бросании наберет 8 очков. Покажите, что шансы выиграть для начинающего игру относятся к шансам другого как 36:31. 10. Два человека бросают поочередно кости, как в задаче 9. Каждый бро- сающий имеет р попыток. Покажите, что вероятность выиграть для игрока, на- чинающего игру, равна р (1 -|- г/2 |- с/4 ...), а вероятность выиграть для второ- го игрока равна pq (1 -р д2 + q9, + ...), где q = 1 — р. Убедитесь, что шанс выиграть для начинающего игру равен 1/(2 — р), а отношение шансов выигрыша равно l:q. 11. Три человека по очереди бросают монету. Выигрывает тот, у которого раньше выпадет решетка. Покажите, что шансы выиграть находятся в отношении 4:2:1 в соответствии со стартовым номером. 12. В шляпе содержится b синих и w белых билетов. Производится случайный выбор п = х + у билетов без возвращения, где х (<J6) — число синих билетов, у (<Jw) — число белых билетов в выборке. gi Покажите, что вероятность получения такого результата равна 13. Из ящика, содержащего 8 зеленых и 4 синих шара, случайно без возвра- щения выбираются шесть шаров. Найдите вероятность того, что число зеленых шаров в выборке превосходит число синих шаров больше чем на два. 14. Из колоды в 52 карты вытаскивается черная карта. Из оставшихся 51 карты случайным образом выбираются 13 карт, причем оказывается, что все они одного цвета. Покажите, что условная вероятность того, что они красные, равна 2/3. 15. В гардеробе на вешалке висят десять шляп (занумерованные от 1 до 10). С вешалки случайным образом снимают три шляпы. Найдите вероятность того, что (1) наименьший номер из снятых шляп равен 6, (2) наибольший номер равен 5. 130
16. Три урны А, В и С содержат цветные шары в следующем составе: А (3 белых и 2 черных), В (2 белых и 1 черный), С (2 белых и 4 черных). Из каждой урны производится случайный выбор одного шара. Найдите вероятность того, что среди трех вынутых шаров (1) 2 будут белыми и 1 черным, (2) по крайней мере 2 белых, (3) больше будет черных, чем белых. 17. Известно, что Р (Л) = 0,3, Р (В') = 0,6, Р (А/В) = 0,32. Найти вероят- ности: Р (Л U В). Р М П В), Р (A/В'), Р (В/A), Р [(Л U В)'], Р [(Л П В)Т- 18. (1) Сколько различных наборов можно выбрать из обычной колоды карт при игре в бридж* **? (2) Какова вероятность получить в наборе карт при игре в бридж 3 туза? (3) Какова вероятность получить в наборе карт при игре в бридж 2 короля? (4) При раздаче карт по ошибке одна карта перевернулась и оказалась тузом. Какова вероятность (условная) того, что в этом наборе карт будет 3 туза? 19. Пусть вероятность рождения мальчика равна 1/2. Найдите вероятности того, что в семье из четырех детей будет (1) только один мальчик, (2) больше чем один мальчик, (3) два мальчика и две девочки, (4) только три девочки. 20. Для стрелка вероятность попасть в буйвола при каждом выстреле равна 0,6. Найдите наименьшее число выстрелов, которое он должен сделать, чтобы ве- роятность убить по меньшей мере трех буйволов была больше 0,7. 21. Вероятность попасть в буйвола при каждом выстреле равна 0,6. При ус- ловии, что при пяти выстрелах стрелок убил трех буйволов, найти вероятность того, что уже первый его выстрел достиг цели. 22. Предположим, что случайно выбранный экзаменующийся отвечает на тест, выбирая ответ из пяти данных альтернатив. Вероятность того, что экзаме- нующийся знает ответ, равна 2/3, а вероятность того, что он будет отвечать, вы- бирая случайным образом одну из пяти альтернатив, равна 1/3. (Если он знает ответ, то из списка возможных ответов он выбирает правильный.) Определите условную вероятность того, что экзаменующийся знал ответ, при условии, что из списка возможных ответов он выбрал правильный. Покажите, что если р — вероятность того, что экзаменующийся знает ответ, и имеется п альтернатив, то эта условная вероятность равна пр /(1 + (п— 1)р). (Ук а з а н и е. Воспользуйтесь теоремой Байеса, см. задачу 14 из упражнения 2.1.8) 23. Две урны А и В содержат цветные шары в следующем составе: А (5 зе- леных и 7 красных), В (4 зеленых и 2 красных). Найдите вероятность вытащить зеленый шар, если (1) сначала случайно вы- бирается урна и затем вынимается из нее шар, (2) шары из двух урн перекла- дываются в третью и шары вынимаются из нее. 24. Предположим, из урн А и В в задаче 23 случайно выбирается одна урна и затем из нее вытаскивается шар. Чему равна вероятность того, что выбрана урна А, если извлеченный шар оказался красным? 25. Урна содержит 4 зеленых и 8 красных шаров. Из нее извлекается шар и фиксируется его цвет. Этот шар вместе с еще двумя шарами того же Цвета возвра- щается в урну, и все шары перемешиваются. Если из урны снова извлекается шар, то найдите вероятность того, что (1) второй шар будет зеленым, (2) первый и вто- рой шар будут оба красными, (3) первый шар будет красным, а второй зеленым. * Знак ' означает здесь дополнение.—Г1римеч. пер. ** При игре в бридж раздаются 52 карты. Каждый из четырех участников получает набор из 13 карт. — Примеч. ред. 131
22 ВВЕДЕНИЕ В СТАТИСТИКУ: глава РАСПРЕДЕЛЕНИЕ ЧАСТОТ 2.2.1. ВВОДНЫЕ ЗАМЕЧАНИЯ В процессе работы каждый инженер, менеджер или научный работ- ник непременно сталкивается со статистическим исследованием, будь то при сборе данных с производственной линии, при изучении спроса или анализе результатов эксперимента и т. п. Он может получить зада- ние написать отчет, который пойдет на рассмотрение руководству. В этом отчете может потребоваться выяснить, как изменяется выпуск продукции или как экспериментальные данные подтверждают некото- рую теорию, подлежащую проверке. Свои соображения исследователь должен аргументировать с помощью таблиц, диаграмм, графиков. От- четы по возможности должны быть достаточно наглядными и убедитель- ными, чтобы служить основой для принятия решений на будущее. Все эти вопросы входят в область исследований, известных под наз- ванием «статистика». 2.2.2. СТАТИСТИЧЕСКАЯ ПРОЦЕДУРА Даже в беглом описании статистической работы можно различить три этапа, присутствующие в любом приложении статистических мето- дов. Обсудим их вкратце. 1) Сбор данных. Множество, возникшее при измерении некоторою процесса или при проведении серии экспериментов, называется вы- боркой. Это множество содержит, как правило, небольшое число наблю- дений по сравнению со всеми возможными наблюдениями, которые мож- но осуществить над всей совокупностью и которые были бы возможны, если бы исследуемый процесс был непрерывным, а наблюдения прово- дились бы очень длительное время. В статистике слово «совокупность» употребляется для описания любого множества объектов (подсчетов, измерений и т. п.) , из которого делаются выборки. Прежде чем приступить к статистическому исследованию, необхо- димо ответить на целый ряд вопросов. Например, надо решить, какие из- мерения необходимо провести, в каком количестве и с какой точностью они должны быть осуществлены. Когда применяется анкетный опрос, как это делается при переписи населения или исследовании качества 132
обслуживания в магазине, ответы должны быть тщательно проанализи- рованы, чтобы исключить неправильную интерпретацию и возможную двусмысленность ответов и тем самым избежать смещения собранной информации. Смещения возникают в том случае, когда выборка участников опроса не случайна, т. е. они подбираются определенным образом. Например, если имена людей выбирались случайно по теле- фонному справочнику, то собранная информация имела бы смещение в сторону лиц, имеющих телефон. Необходимо тщательно проверить, являются ли полученные на- блюдения действительно типичной выборкой из исследуемого процес- са. Если выборка нетипичная и мы не знаем каково ее смещение, то любой вывод о процессе, который мы делаем на основе этой выборки, скорее всего будет неправильным. 2) Описательные статистики — запись в сокращенной форме. Прежде всего необходимо всю массу рядов наблюдений записать в виде таблиц, которые помогли бы выявить закономерности в колеба- ниях и тенденцию изменений. Можно также нарисовать графики, схемы и рисунки. Все это делается с той целью, чтобы полученные наблюде- ния представить наглядным образом и достаточно было одного взгляда, чтобы увидеть характерную особенность эксперимента или процесса, над которым велись наблюдения. Из наблюдений могут быть получены некоторые числа, известные как вычисляемые статистики или параметры. Каждое из этих чисел помогает описать один аспект процесса. Например, простое среднее, которое можно легко вычислить, определяет значение «середины» со- вокупности. Вокруг среднего группируются все измерения процесса. Другие параметры дают информацию о том, как сильно будут разбро- саны измерения по обе стороны от среднего значения. Некоторые пара- метры говорят о том, можно ли ожидать скоса в совокупности. Говорим, что совокупность скошена, если существует достаточная уверенность в том, что наблюдение будет находиться на большем расстоянии по одну сторону от среднего, чем по другую. В этом случае совокупность будет скошена в одну сторону, т. е. эта сторона будет более пологая. Оформление наблюдений в таком виде, из которого были бы видны тренды и характерные особенности совокупности, использование при этом графиков и рисунков, вычисление параметров — все эти вопросы относятся к области «описательных статистик». 3) Статистические выводы — прогнозы и решения. Этот раздел ста- тистики, наверное, один из наиболее важных. Выборка наблюдений несет сравнительно немного информации об изучаемом процессе. По выборке наблюдений статистик пытается сде- лать определенные выводы о всем процессе. Он мог бы вычислить пре- делы, в которых, как ему кажется, будет протекать процесс при нор- мальном развитии в будущем. Если бы статистику удалось обнаружить устойчивое изменение процесса, подлежащего прогнозу (назовем это трендом), то он мог бы внимательно изучить это обстоятельство в своем докладе. Если статистик решит, что выборка наблюдений недостаточ- на для формулирования надежных выводов, то он предпримет попытки для получения дополнительных наблюдений. 133
Для иллюстрации различных видов принятия решения в таких си- туациях мы ограничимся простым примером. Рассмотрим работу за- водского контролера качества, производящего выборку из некоторой товарной продукции. Предположим, в час производится 100 единиц то- вара, а контролер может проверить только 5 из них, которые он выби- рает в конце каждого часа. Возможно, контролер не имеет времени проверить большее количество товаров, возможно также, что такая проверка связана с порчей товаров, поэтому увеличивать число обсле- дуемых единиц бессмысленно. По выборке из 5 единиц товара он хочет установить, будут ли оставшиеся 95 единиц удовлетворять стандарту (т. е. лежать в границах определенной длины, качества и т. д.) и можно ли продолжать их производство. Контролер тщательно обследует выборку из 5 единиц и затем от- вечает на поставленные вопросы. Для этого он скорее всего будет при- менять графические методы, известные как схемы контроля качества; эти схемы основаны на математической» теории выборки. Было бы неплохо обратить внимание читателя на некоторые выводы при принятии решения. Это будет сделано на примере контроля ка- чества продукции. Прежде всего, контролер никогда не может быть уверенным в том, что он прав. Основываясь на одной выборке, никогда нельзя быть уверенным в правильности выводов, распространенных на всю сово- купность. Цель статистической теории заключается в том, чтобы помочь лицу, принимающему решение, как можно чаще делать правильные выводы или по крайней мере определить, насколько велика опасность ошибиться при принятии решения. Контролер на поставленный вопрос может ответить двояко; в случае, когда его решение неправильно, выводы (хотя и разные по смыслу) мо- гут дорого обойтись фирме. Он должен быть уверен в том, что долго- срочные издержки фирмы, связанные с неправильными выводами, долж- ны быть сведены к минимуму. Например, если качество каждой из 5 единиц в выборке хотя и находится в пределах установленных границ, но очень близко к ним, то контролер должен выбрать между двумя дей- ствиями; (а) остановить и демонтировать производство товаров, (б) продолжить выпуск, например, до следующего часа. Если качество товаров находится слишком близко к установленным границам (это может быть в том случае, когда механизм, производящий товары, мед- ленно изнашивается),™ решение (б) было бы неправильным,-Следующие 100 шт. товаров содержали бы очень много бракованных единиц, а это было бы невыгодно для фирмы, так как все их пришлось бы выбросить пли по меньшей мере индивидуально проверить и отобрать хорошие и плохие. С другой стороны, если бы в действительности 5 единиц това- ров оказались близкими по качеству к установленному пределу толь- ко из-за случайности в отклонении качества при их производстве, то решение (а) было бы неверным. Выборка может быть просто «неудач.- ной», и следующие 100 единиц будут вполне нормальными. В этом слу- чае остановка и демонтирование производства товаров, связанные с большими расходами, не будут оправданными. Таким образом, прежде чем принимать решение, контролер должен все внимательно обдумать. 134
На этом мы закончим описание работы статистика и того, как она помогает изучению различных процессов, среди которых могут быть и научные эксперименты, и промышленные операции. В следующем параграфе будут описаны первоначальные шаги, необходимые при изу- чении рядов наблюдений. 2.2.3. ПРИМЕРЫ ТАБЛИЦ С РЯДАМИ НАБЛЮДЕНИЙ Результаты, полученные экспериментально или из наблюдения про- цесса, прежде всего записываются в прямоугольные таблицы. Все необходимые сведения об эксперименте должны быть зафиксированы во время его осуществления рядом с таблицей. Такая информация, как число измерений, лабораторные условия (влажность, температура и т.п.), день, месяц и т. д.,играет большую роль при анализе; если эта информация не записана вовремя, она может быть забыта и получить ее снова окажется невозможным. Далее приводятся примеры записи рядов наблюдений. Пример 1 Производство фирмой некоторой модели радиоприемников (сстни штук за квартал) Год 1960 1961 1962 1963 Квартал 1 18 30 41 45 2 12 28 35 36 3 22 25 30 28 4 33 35 36 38 Пример 2 Число голосов (округлено до ближайшей 1000) Лейбористы 25 000 Выборы в парламент; Консерваторы 15 000 город X, население Либералы 8 000 70000 чел., Прочие 2 000 июнь 1967 г Пример 3 Число кроликов, появившихся за один помет 5355647456 20 пометов голландских 6453654565 кроликов; каждой самке 2 года, третий помет в мае Пример 4 Оценки, полученные на экзамене по математике 30 55 44 60 43 72 47 65 67 40 Оценки по 100-балльной системе; 59 58 14 32 58 46 41 35 68 50 50 студентов, средняя школа—У, 59 21 42 45 41 48 28 47 77 60 III ступень, июнь 1967 г. 30 57 45 49 33 48 47 52 38 61 54 42 54 42 49 51 39 60 61 53 135
2.2.4. ИЛЛЮСТРАТИВНОЕ ИЗОБРАЖЕНИЕ При изучении большого количества рядов наблюдений полезно представить их в виде некоторых рисунков или графиков. При изучении процессов многие важные особенности, которые нельзя очевидным об- разом получить из массы наблюдений, часто можно сразу увидеть на рисунке. По данным, приведенным в предыдущем параграфе, мы проиллю- стрируем различные виды диаграмм и графиков, известных под наз- ваниями «временной ряд», «круговая диаграмма», «прямоугольная диа- грамма», «частотный многоугольнику и «гистограмма». Эти виды на- глядных изображений применяются наиболее часто. а) Временные ряды. Временной ряд есть множество наблюдений над процессом, осуществленных в определенной временной последова- тельности. Рассмотрим, например, производство радиоприемников за четырехлетний период. Количество произведенных за квартал прием- ников образует последовательность шестнадцати наблюдений, соответ- ствующих концу каждого квартала с 1960 по 1963 г. Временной ряд обычно наносится на график, на горизонтальной оси которого откладывается время, как показано на рис. 58. Кварталы и годы Рис. 58. Временной ряд. Число радиоприемников (в сотнях), произведенных за квартал Замечания: 1) Производство радиоприемников каждый год' падает до минимума во втором и третьем кварталах, затем вновь под- нимается в четвертом и первом кварталах. Эти колебания называются сезонными. 2) Как видим, ежегодное производство приемников устой- чиво увеличивается. Такой тренд будем называть направленным вверх. б) Круговые диаграммы. Данные примера 2 о числе голосов на выборах можно хорошо изобразить на круговой диаграмме, как будет показано далее. Каждой политической партии будет соответствовать некоторый сектор круга, причем площадь сектора будет пропорцио- нальна числу голосов, отданных за эту партию. Это означает, что центральные углы при секторах также будут пропорциональны числу голосов. Поскольку число голосов, отданных различным партиям. 136
находится в пропорции 25:15:8:2, то и секторы должны быть выбраны в такой же пропорции. Лейбористы получают 25/50 (л радиан), кон- серваторы — 15/50 (0,6 л радиан) и т. д. (см. рис. 59). Часто секторы раскрашивают в разные цвета. Для того чтобы яс- нее различать секторы, их можно заштриховать под разным наклоном. город X, население 70 000 человек в) Прямоугольные диаграммы. Данные, которые можно изобра- зить с помощью круговой диаграммы, можно с успехом изобразить и на прямоугольной диаграмме. Прямоугольники могут быть горизонталь- ными (рис. 60 (а)) или вертикальными (рис. 60(6)). Каки в предыдущем случае, площадь прямоугольников пропорциональна числу голосов на выборах. Партия Голоса Лейбористы 7. /, 7//,\25000 Консерваторы '///.А 15000 Либералы Т7\ 8000 Прочие Л^ОО (aJ Голоса (Р/ cornu t) Рис 60. (а) Горизонтальная прямоугольная диаграмма, (б) Вертикальная прямоугольная диаграмма г) Частотный многоугольник. Рассмотрим данные примера 3, т. е. число кроликов в помете на одну самку. Как видим, для наблюдаемых 20 кроликов число новорожденных кроликов в одном помете колеблется между 3 и 7. Мы можем подсчитать, сколько раз появляется данное число кроликов в данном помете. Например, число 3 появляется дважды, приплод из 4 кроликов появляется четыре раза и т. д. Подсчи- тывая, сколько раз появляется некоторое наблюдение (х), будем назы- вать полученное число (/) частотой х. Частоты различных значений можно занести в частотную таблицу. Таблица частот данных о числе кроликов в приплоде Число кроликов в приплоде х 3 4 5 6 7 Частота f 2 4 8 5 1 137
Заметим, что суммарное число частот должно быть равно общему числу наблюдений. В нашем примере 2-|-4+8Ц-5+1 = 20. Всего было рас- смотрено тоже 20 пометов. Если мы нанесем на график частоты f для соответствующих х со шкалой х по горизонтали и соединим точки прямыми линиями, то мы получим частотный многоугольник (рис. 61). С помощью частотного многоугольника легко можно установить, как выборка для значений х из 20 пометов распределена на интервале от 3 до 7. Изменение частот называется распределением частот выбор- ки. 8 г 6 - ДВухеодовалЬ/е ' кролики 20 Наблюдений О 012365878 Число кроликоВ 6 одном приплоду Рис. 6]. Частотный многоугольник. Размер приплода голландских кроли- ков Рис. 62. Гистограмма. Размер при- плода голландских кроликов д) Гистограммы. Форму распределения частот можно отчетливо увидеть из другого типа диаграмм, известного как гистограмма. Для того чтобы нарисовать гистограмму, надо для каждого значения х по- строить колонку или прямоугольник. Площадь прямоугольника долж- на быть пропорциональной соответствующей частоте. Как правило, берутся прямоугольники одинаковой ширины, поэтому их высоты бу- дут пропорциональны частотам. Для данных о кроликах мы получим гистограмму, изображенную на рис. 62. Заметьте, что каждое значе- ние х будет серединой основания прямоугольника. е) Виды данных. Существуют четыре вида данных, различающихся по тому, как наблюдаемый объект измеряется или описывается. Эти виды с соответствующими примерами приводятся в следующей таблице: Вид Примеры 1. Данные классификации (но- минальные) 2. Ранжированные (ординарные) 3. Данные измерения на интер- вальной шкале 4. Данные измерения на отно- сительной шкале Лица, классифицированные по националь- ности, цвету кожи или по месту в спор- тивной команде Девушки, ранжированные по красоте. Ли- ца, ранжированные по социальным груп- пам Измерение температуры объекта (шкала имеет произвольные нулевую и единичную точки) Измерение веса, высоты, объема и т. д. (шкала имеет произвольную единицу, но фиксированную нулевую точку) 138
ж) Выбор диаграммы и графика. Иногда тип диаграммы для дан- ного случая определяется видом анализируемых данных. Чаще, одна- ко, возможно использование нескольких различных типов диаграмм и предстоит осуществить выбор. Читатель в таком случае должен руко- водствоваться практикой, личным вкусом, сроком и т. п. Его цель должна всегда заключаться в том, чтобы предложить такую иллю- страцию, которая несет как можно больше информации об изучаемом процессе, естественно, в ясной и удовлетворительной форме. Следует добиться уверенности в том, что передаваемое впечатление не окажется недоброкачественным или неправильным в любом смысле. Это может произойти при неправильной или неестественной шкале, при недоста- точном выделении названий, при опускании без объяснений экстре- мальных результатов и т. д. 2.2.5.. ГРУППИРОВКА ДАННЫХ При работе с большим множеством данных измерения приходится группировать, чтобы получить достаточно наглядную картину колеб- лемости распределения частот. Под группировкой будем понимать раз- биение шкалы х па определенное число интервалов и подсчитывание числа наблюдений, попавших в каждый интервал. Число попаданий в данный интервал называется частотой данного интервала. Для ил- люстрации этой процедуры рассмотрим данные примера 4 из 2.2.3. Наблюдения представляют собой оценки 50 студентов на экзамене по математике. Взглянув на эти оценки, мы сразу определим, что наи- меньшая из них равна 14, а наивысшая — 77. Возьмем семь одинако- вых интервалов 10—19, 20—29, ..., 70—79 и подсчитаем, сколько оце- нок попадут в каждый из них. Результаты этой процедуры показаны в следующей таблице сгруппированных частот: Г раницы группы 1 Пределы группы 2 Среднее группы 3 Единицы счета 4 Частота h 5 Кумулятивная частота Fi 6 9,5—19,5 10—19 14,5 7 1 1 19,5—29,5 20—29 24,5 77 2 3 W 77 29,5—39,5 30—39 34,5 ( 777 7 7 7 7/77 1 I ! 1 г г г г Тт 7 10 39,5—49,5 40—49 44,5 1W+ 111 18 28 49,5—59,5 50—59 54,5 Ш ///// 12 40 77 59,5—69,5 60—69 64,5 77W- 777 8 48 69,5—79,5 70—79 74,5 77 2 50 • Итого 50 — 139
Замечание. Если бы у нас было большее число данных, мы возможно взяли бы и большее число интервалов. Выбор числа интер- валов оказывает влияние на получаемые значения частот. Если после подсчета частот оказалось, что в несколько групп вовсе не попадали частоты или попало их очень мало, то целесообразно взять меньшее число интервалов. Приблизительно в таких процедурах можно взять от 6 до 15 интервалов, число которых зависит от того, насколько много имеется данных. а) Объяснение таблицы. (1) Колонки 1 и 2. Колонка 2 показывает пределы, которые опреде- ляются интервалами по шкале х. Очень важно, чтобы соседние группы не пересекались. Например, если бы первые две группы были 10—20 и 20—30, они бы пересекались для оценки х — 20. В таком случае Рис. 63. Пределы и границы группы невозможно было бы определить, в какую группу входит оценка 20. Если наблюдения представляют собой измерения на непрерывной шка- ле, то обычно берут интервалы с открытым правым концом, т. е. [10— [20—) и т. д. Колонка 1 определяет границы группы. В гистограмме концы осно- ваний прямоугольников совпадают с границами группы (см. 2.2.4,д). Середина прямоугольника должна совпадать со средней точкой груп- пы. Это иллюстрируется на рис. 63. Расстояние между парой границ группы называется шириной группы. (2) Колонка 3. В эту колонку входят средние оценки групп. Они могут быть найдены делением суммы пределов группы на два. В ранее приведенном примере для первой группы ю + ю 2 Для второй группы х2 = ху + ширина группы = 14,5 + 10 = 24,5. (3) Колонка 4. Это колонка единиц счета. Просматриваем последо- вательно все множество данных и в колонке 4 напротив группы, в кото- рую входит соответствующее наблюдение, ставим 1. Для простоты под- счета пятерки единиц перечеркиваем горизонтальной чертой, как пока- зано в таблице. ПО
Многоугольник кумулятивных частот Рис. 64. Данные оценок по математике. 7V=5O (4) Колонка 5. Единицы в колонке единиц счета суммируются, и ре- зультат записывается в колонку 5. Полученные суммы называются частотами групп\ они будут обозначаться буквой f. (5) Колонка 6. Числа, входящие в эту колонку, называются кумуля- тивными частотами и обозначаются буквой/Г Они получаются из чи- сел в колонке f. Каждое число этой колонки равно числу наблюдений, которые имеют значения, меньшие или равные значению верхней гра- ницы х' соответствующей группы. Так, для примера с оценками по ма- тематике: Fr — \, число студентов с оценкой, меньшей или равной 19,5; F2 = 1 + 2 = 3, число студентов с оценкой, меньшей или рав- ной 29,5; Fs — 1 + 2 + 7 = 10, число сту- дентов с оценкой, меныней или равной 39,5, и т. д. Множество кумулятивных частот, отнесенных к верхнему значению гра- ниц группы (F на х'), называется кумулятивным частотным многоуголь- ником или многоугольником кумуля- тивных частот. Если по вертикаль- ной шкале отложить (100/7М)% и кривую выровнять по точкам, то полученный график называется про- центной огивой. Гистограмма и диа- грамма кумулятивных частот для примера с оценками по математике приводятся на рис. 64. б) Обозначение S. В статистической работе очень часто пользуются знаком 2 (означающим суммирование). Подробности применения этой операции, примеры и упражнения даны в гл. 1.2. Очевидно, сумма частот всех групп (т. е. сумма всех чисел колонки 5) должна быть равна N —общему числу наблюдений. Таким образом, мы можем написать: ft fi + fz + = где k равно числу групп; r-я кумулятивная частота может быть запи- сана как 2— ft — fl Т А Г • • • + fr Pf = 1 Полезной проверкой может служить тот факт, что последняя кумуля- тивная частота должна быть равна 141
Упражнение 2.2.1 1. Для иллюстрации следующих множеств наблюдений сделайте соответст- вующие рисунки. Дайте названия рисункам, обозначьте все оси. Если будет возможно, то для каждого случая нарисуйте несколько диаграмм и сравните ре- зультаты. (а) Доля дорожных происшествий со смертельным исходом (на 100 млн. км, при- ходящихся на средства передвижения) для двух стран Год 1955 1956 1957 1958 1959 1960 1961 1962 1963 Страна А 4,6 4,8 3,6 4,2 4,1 3,4 3,5 3,3 4,0 Страна В 5,0 3,1 3,2 3,9 3,2 3,1 2,9 2,6 3,2 (б) Ежегодное количество осадков (в мм) на гидрометеорологической станции X Год 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 Количество осадков 116 84 173 90 165 171 138 146 149 183 105 (в) Налоговые поступления в процентах за 1956 г. (страна У) Источник поступлений Подоходный налог 31 Налог на земельные угодья 10 Таможенные пошлины и акцизы 40 Дополнительный налог 8 Почтовые поступления 3 Другие налоги 8 (г) Число дефектных товаров, обнаруженных : в 36 выборках (каждая объемом 10 единиц), ВЗЯТЫХ 1 случайно с производственной линии 0 0 1 0 2 0 1 2 1 0 0 0 0 0 3 1 0 0 0 0 0 2 0 0 1 1 0 0 0 1 1 0 1 0 1 1 (д) Импорт (Im) и экспорт (Ех) для страны, млн, фунтов стерлингов Год 1960 1961 1962 1963 1964 Квартал Im Ех Im Ех Im Ех 1m Ех Im Ех 1 261 163 192 103 147 90 164 105 177 92 2 230 141 190 96 149 85 170 101 154 94 3 225 137 191 94 156 93 169 105 150 86 4 240 130 223 100 175 99 201 112 170 95 2. Наименьшее из 100 измерений равно 4,6ж, а наибольшее — 50,1 м. Найди- те подходящие пределы групп в случаях, когда для построения распределения частот используются (а) 6, (б) 8 и (в) 10 групп. В каждом случае найдите (1) мно- жество границ групп, (2) ширину группы, (3) среднюю оценку 4-й группы, (4) верхнюю границу 5-й группы, (5) нижний предел 3-й группы, (6) нижнюю границу 2-й группы. 3. Ответьте на все вопросы в задаче 2 для случая 50 весовых измерений, наименьшее из которых равно 3,51 кг, наибольшее -— 12,38 кг. 4. Для каждой из приведенных таблиц выполните следующие упражнения: (1) найдите наибольшее и наименьшее наблюдения; (2) определите оптимальное число групп и найдите их ширину; (3) постройте таблицу частот с колонками, по- казывающими границы группы, пределы группы, средние значения, единицы счета, частоты и кумулятивные частоты; (4) нарисуйте гистограмму, частотный многоугольник и относительный частотный многоугольник; (5) нарисуйте много- угольник кумулятивных частот и процентную огиву. 142
(а) Веса 50 новорожденных мальчиков 1 (с точностью до одной унции) 148 154 148 151 144 177 168 153 133 151 150 161 150 167 152 167 130 164 142 134- 135 132 166 158 140 155 149 125 166 152 169 150 143 142 163 161 131 162 143 121 143 159 155 151 163 136 152 121 175 168 (б) Веса 40 шарикоподшипников (в унциях) 6,64 6,40 6,67 6,53 6,44 6,39 6,30 6,54 6,43 6,41 6,66 6,51 6,42 6,85 6,57 6,58 6,31 6,46 6,35 6,68 6,64 6,73 6,57 6,40 6,15 6,41 6,50 6,30 6,32 6,50 6,63 6,70 6,61 6,68 6,53 6,44 6,45 6,31 6,55 6,69 (в) Диаметры 40 шарикоподшипников (в микронах) 853 859 851 840 859 841 846 857 862 845 851 846 855 861 868 852 843 840 841 854 854 847 853 855 843 847 859 863 856 857 842 ( 858 860 852 856 856 860 854 861 868 (г) Продолжительность работы 30 электрических лампочек (в часах X1/Ю) 51 56 69 31 56 49 51 53 74 51 63 48 53 51 64 50 59 84 55 82 55 72 70 54 (д) Скорость автомобилей 51 77 98 на некотором участке 62 дороги 73 (в км/ч) 58 41 41 29 15 41 43 42 34 41 30 23 48 50 36 35 46 28 46 50 41 55 27 43 53 48 47 34 35 29 42 30 35 38 41 36 38 45 59 44 43 5. Для каждого из множеств, приведенных в задании 4, определите: (1) процент наблюдений, попавших в 3-ю группу; (2) процент наблюдений, значения которых меньше, чем нижняя граница 3-й группы; (3) процент наблюдений, значения которых больше, чем верхняя граница 3-й группы; (4) сумму процентов, найденных в (1), (2), (3); (5) численное значение (веса, диаметра, продолжительности работы и т. д.), для которого число не превышающих его наблюдений составляет 50%. (Это зна- чение определите из процентной огивы. Такая величина называется медианой выборки.)
ГЛАВА ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ 2.3.1. ОПИСАТЕЛЬНЫЕ НАИМЕНОВАНИЯ И ПАРАМЕТРЫ Когда для некоторого множества наблюдений нарисована гисто- грамма или частотный многоугольник, тем самым задана картина рас- пределения и разброса наблюдений по шкале х. Чтобы облегчить изучение распределений, некоторым стандартным формам распределений, часто употребляемым в статистических иссле- дованиях, даются свои наименования. В главе также будут рассмотре- ны способы описания и измерения специальных свойств и характерис- тик форм распределений. а) Некоторые стандартные формы распределений. (л) Нормальное колоколосбразное, симметричное, одновершинное I б) Ншмодрльнор (£) Мультимодальное двухвершин- мнбёбВеришн=~ ное ! \ ное (г) J-обрагное (djj-образное (е) U-образное б) Некоторые свойства. (1) Число вершин. Значение х, соответствующее вершине кривой, называется модой. Распределения с одной вершиной называют унимо- дальными. Распределения, имеющие вид (б) и (в), называются бимодаль- ными и три- или мультимодальными соответственно. 44
(2) Величина разброса (или дисперсия). Распределение может либо близко группироваться к некоторому центральному значению, либо быть сильно разбросанным по обе стороны от этого значения. Два возможных случая изображены на рис. 66. (3) Симметрия или асимметрия. Кривые типа нормальной (см. рис. 65(a)), часто встречающиеся на практике, симметричны относи- тельно вертикальной прямой, проходящей через моду. Иног- да одна сторона распределения более пологая, чем другая (име- ет хвост). В таком случае гово- рим, что распределение асимме- трично (или скошено). Направ- ление хвоста обозначается зна- Небольшой Большой разброс пазброс ком асимметрии (-]- или —). Рис. 66 Возможные случаи показаны на рис. 67. (4) Величина островершинности. Эта характеристика вида распреде- ления известна под названием эксцесса. Если вершина унимодального распределения плоская, то такое распределение называется туповер- Симметрия Положитель- Отрицательная относительна ОБ ниц асиммет- асимметрия рия Рис. 67 шинным (с эксцессом меньше нормального), в обратном случае — островершинным (с эксцессом больше нормального). Нормальное распределение называется нормальновершинным (с нормальным эксцессом). Все возможные типы распределений показаны на рис. 68. ГупоВершинное ОстроВершинное НормальноВер- шинное Рис. 68 в) Параметры. Если значение некоторой величины вычисляется по множеству наблюдений и это число дает определенную информацию о некоторой характеристике распределения, то такую величину назы- вают параметром распределения. Например, среднее значение мно- жества наблюдений определяет область расположения центра распреде- ления. В принципе мы могли бы определить центр распределения через его среднее. Существует большое количество параметров, несущих ин- 145
формацию о середине или о других специальных свойствах вида рас- пределения. Эти параметры позволяют также измерять величину раз- броса, асимметрии и эксцесса совокупности. В этой книге мы приведем определения и описания вычислений наиболее употребительных пара- метров. i 2.3.2 ЦЕНТРАЛЬНЫЕ ПАРАМЕТРЫ ИЛИ СРЕДНИЕ Наиболее употребительны три измерения центра распределения: мода, медиана и арифметическое среднее. а) Мода. Это понятие уже встречалось (см. 2.3.1, б)). Если распреде- ление имеет только одну вершину, то значение х, для которого эта вер- Оценки по математике (показаны только Рис. 69. Оценивание моды распределения шина достигается, назы- вается любой. Часто мода обозначается символом х (читается «х с крышеч- кой»). Очевидно, если рас- пределение не очень асим- метрично, то мода будет хорошим приближением «центра» совокупности. Если мода распределе- ния оценивается по мно- жеству группированных данных, то для нахожде- ния моды необходимо оп- ределить группу с наи- большей частотой. Эта группа называется модаль- ной группой. За оценку моды х берется среднее значение этой группы. Как показано на рис. 69, эту оценку можно улучшить с помощью простого дополнительно- го построения на гистограмме. Исходные данные — оценки на экза- мене по математике, взятые из примера 4 (см. 2.2.3). Из рисунка видно, как по пунктирным линиям построения нахо- дится новая оценка моды, лежащая правее среднего значения модаль- ной группы. Упражнение 2.3.1 Найдите модальную группу, грубую и улучшенную оценки моды совокуп- ности для каждого из распределений в задании 4 упражнения 2.2.1 (с. 142). б) Медиана. Значение х, для которого 50% множества наблюдений (пли совокупности) меньше этого значения, а 50% больше его, назы- вается медианой. Это значение обозначается х (читается «х с волной»). Вычисление этого значения в различных ситуациях иллюстрируется на численных примерах. 146
П р и ме р 1 Найти медиану выборки {9, 3, 5, 8, 4, 11, 13}. Решение. Вначале упо- рядочим наблюдения вы- борки. Получим 3, 4, 5, 8,9, 11, 13. Поскольку в выборке семь наблюдений, четвертое по порядку бу- дет иметь значение боль- шее, чем первые три, и меньшее, чем последние три наблюдения. Таким образом, четвертое наблю- дение будет медианой вы- борки. В нашем примере значение медианы набра- 100 Г 7. 70 -35 30 50 —25 10 - 5 - D Кумулятивный частотный многоугольник Оценки по мате- матике (пункти- ром показоно построение медианы ) О'— О 29,5 39,5/495 59,5 х Оценки Рис. 70 но полужирным шрифтом; ее значение будет равно 8. Пример 2. Найти медиану выборки {20, 9, 13, I, 4, 11}. Решение. Упорядочим выборку: 1, 4, 9, 11, 13, 20. Теперь, поскольку имеется всего 6 наблюдений, мы будем иметь две середины. Эти значе- ния набраны полужирным шрифтом. Так будет происходить всегда, когда число наблюдений в выборке четно. В таких случаях медиану определяем как полусумму этих серединных значений. Для нашего примера это дает x = 9-±ll = 10. 2 Упражнение 2.3.2 Найдите медианы для следующих выборок: 1. {5 1, 3, 8, 8, 2, 6}; 2. {2,7,9, 2, 4, 5}; 3. {2,4; 7,5; 6,7; 9,1; 5, 8}; 4. {8,0; 7,3; 7,1; 2,6; 1,6; 0,3; 5,8; 3,1}; 5. {8, 3, 10, 25, 112, 16, 83, 9}. Пр и м е р 3. (Вычисление х для группированных данных). Найти медиану (т. е. оценить медиану совокупности) для данных из таблицы сгруппированных частот (см. 2.2.5, с. 139). Решение. Так как выборка содержит 50 наблюдений, нам требуется найти значение х, для которого 25 наблюдений его не превосходят. В колонке 6 находим, что кумулятивная частота — 28. Отсюда сле- дует, что 25-е из упорядоченных наблюдений лежит в 4-й группе. Та- ким образом, значение медианы будет некоторой точкой четвертого интервала (39,5 — 49,5) но шкале х. Оценим положение этой точки методом линейной интерполяции на этом интервале. Эту процедуру легче усвоить с помощью многоугольника кумулятивных частот (см. 2.2.5, а)). Воспроизведем нужную нам часть рис. 64 в увеличенном масштабе с тем, чтобы на ней были изображены 4-я группа и две со- седних (рис. 70). 147
Взяв для построения пунктирные линии, мы видим, что медиана приближенно равна 48. Значение медианы можно вычислить следующим образом: x — OlEm, где А — точка нижней границы 4-й группы, величина т может быть вычислена в силу подобия заштрихованного треугольника и треуголь- ника CDE. Получаем отношения: т _CD_ 49,5—39,5 25—10 ~ 28—10 ’ откуда т = 15- — = 8,33. 18 Итак, х = 39,5+ 8,33 = 47,83. Этот пример показывает, как на основе линейной интерполяции может быть выведена общая формула для вычисления медианы. Чита- тель при желании может проверить, что верно следующее соотношение ~ / N/2—F \ \ г — г ] где L — нижняя граница медианной группы, N — число наблюдений в выборке, g — ширина медианной группы, F и F' — кумулятивные частоты медианной группы и предшествующей ей. Упражнение 2.3.3 Оцените медианы совокупностей по сгруппированным данным для каждого из примеров задания 4 из упражнения 2.2.1. в) Арифметическое среднее. Арифметическое среднее множества из N наблюдений получается суммированием всех значений множества и делением этой суммы на N. Эту величину обычно называют просто средней и обозначают буквой т или х (читается «х с чертой»), В симво- лической форме х — Zx/N. Примеры 1. Найдите среднее для множеств (1) {3, 5, 9, 4} и (2) {3, 3, 4, 9, 5, 4, 3, 9, 3}. Решение. (1) х = 3 5 9 — 4 = 5,25; (2) х = 3+3+4+9-|-5+4-|-з+9+3 __ 4 yg 2. Вычисление по данным частотной таблицы. Если данные пред- ставлены в виде частотной таблицы, то поступаем следующим обра- зом. 148
Воспользуемся вторым множеством из предыдущего примера. Это множество может быть перегруппировано следующим образом: {3, 3, 3, 3, 4, 4, 5, 9, 9} и записано в виде частотной таблицы: X 3 4 5 9 f 4 2 1 2 „ - 34-34-3+3 + 44-4+5 + 94-9 Теперь х=------------------------- что совпадает с предыдущими расчетами. Очевидно, это можно переписать и так: 4.3+2.4+1.5 + 2.9_4|78 9 Из частотной таблицы получим: ~ fl *1 + /:2*2+/з*з+/:4Х4 fl + ^ + fs + fa Отсюда следует, что общую формулу вычисления средней для таблицы с k значениями х и их частотами можно записать в виде k S fixi _ - _ fl xlPf2X2 + ... +fhXfc _ t =1 _ 2_fx ~ fi+/2+-+k N N (в последней записи опущен индекс суммирования). 3. Приближенное вычисление х. Вычислим среднюю распределения математических оценок по таблице частот (см. 2.2.5). Решение. Воспроизведем столбцы 3 и 5 частотной таблицы вместе с новым столбцом, обозначенным fx: Среднее группы X Частота f fx 14,5 1 14,5 24,5 2 49,0 34,5 7 241,5 44,5 18 801,0 54,5 12 654,0 64,5 8 516,0 74,5 2 149,0 Итого 2/; = 50 2+= 2425,0 Значения третьего столбца получают умножением частоты f на соответствующую среднюю оценку х. 149
Вычислим теперь среднее по формуле, предложенной в предыдущем примере. Необходимые для этого значения сумм S/ и Sfx получают суммированием второго и третьего столбца. Таким образом, ~ S Д = 2425 г Отметим, что полученный результат не абсолютно точен, поскольку ис- пользование этой формулы основано на предположении о совпадении каждого наблюдения в группе со средним значением этой группы, что, конечно, неверно. С другой стороны, нетрудно заметить, что получен- ные таким способом ошибки имеют тенденцию к взаимопогашению, так как в общем случае одни наблюдения группы будут иметь значения, которые больше средней, а другие наблюдения — меньше. Поэтому приближение, основанное на агрегировании элементов группы, как правило, бывает достаточно хорошим. Вычисление х для группированных данных по методу сечения будет изложено в 2.3.5. Упражнение 2.3.4 1. Вычислите х для каждой из следующих выборок: (1) {62, 13, 54, 60, 38}; (2) {5,2; 4,6; 7,3; 1,8}; (3) {2, 4, 6, 8, 10, 12}; (4) {а, а + d, а + 2d, .... а + + (п — l)d}; (5) {20 фунтов стерлингов, 25 фунтов стерлингов, 15 фунтов стерлингов, 18 фунтов стерлингов, 122 фунта стерлингов}. Будет ли х типичным значением для последнего множества? Допустим, элементы этого множества — жалования пяти служащих, тогда х как средняя заработная плата может привести к неудобной интерпретации. Предложите для этого случая другой, лучший спо- соб определения средней. 2. Вычислите х р,пя каждого из распределений задания 4 из упражнения 2.2.1 (с. 139). г) Взаимосвязь между модой, медианой и средним. Очевидно, что, если распределение симметрично, мода, медиана и средняя совпадают. Таким образом, для симметричного распределения х = х = х. Для унимодального и не очень асимметричного распределения су- ществует полезная приближенная формула, связывающая три вида средней: средняя — мода « 3-(средняя — медиана). Рис. 71 иллюстрирует эту формулу. Положительная Отрицательная асимметрия асимметрия X X Рис. 71 150
2.3.3. ДРУГИЕ ПОЛЕЗНЫЕ ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ В 2.3.2, б) мы видели, что медиана делит совокупность (или выбор- ку наблюдений) на две части: 50% наблюдений имеют значения, кото- рые меньше медианы, 50% — больше. Можно найти три значения х, которые делили бы совокупность на четыре части, обладающие аналогичными свойствами. Эти значения называются квартилями распределения и обозначаются Qx, Q2, Q3. Заметим, что Q2 совпадает с медианой (рис. 72). Таким же способом мы можем найти девять значений х, которые раз- бивают совокупность на десять равных частей. Эти значения х назы- ваются декатилями и обозначаются Dlt D2, .... Da. Qi называется нижней квартиль » Q3 называется У125%|верхней квартилью Y.57^ * __I___i__I______ Qi Qz Q3 Рис. 72. Квартили При желании можно разбить совокупность значений х на сто рав- ных частей. Эти значения называются персентилями и обозначаются А. Р2, ..., Pas. Заметим, что Qj = Р№, Q3 = Р75. Квартили, декатили и персентили могут быть оценены по много- угольнику кумулятивных частот, как это было сделано при нахожде- нии медианы в 2.3.2, б). Для них также может быть получена общая интерполяционная формула. Для иллюстрации оценивания некоторых из этих параметров мы вновь вернемся к примеру с распределением оценок по математике из 2.2.5 (рис. 73). Упражнение 2.3.5 Оцените квартили, а также Р1в,Р4В,РВо для каждого из распределений из за- дания 4 упражнения 2.2.1. 2.3.4. ИЗМЕРЕНИЕ РАЗБРОСА а) Вариация. В качестве простейшей меры разброса множества наблюдений можно взять разность крайних значений. Таким образом, если хтах — наибольшее значение в данном множестве, a xmin — наи- меньшее значение, то вариация = хтах — хт1п. Пример. Множество наблюдений {8, 3, 1, 20, 15, 5, 12). Для этого множества находим: вариация = 20 — 1 = 19. 151
Вариация легко вычисляется, и ею часто пользуются при работе с малыми выборками. Например, этой величиной часто оперируют при контроле качества, состоящем в проверке величины отклонений разме- ров массовой продукции от определенных границ. Поскольку при вы- числении вариации необходимы только два крайних значения множест- ва наблюдений, можно предложить более эффективные меры разброса, опирающиеся на все наблюдения. Одна из таких мер разброса предла* гается в следующем параграфе. Упражнение 2.3.6 Найдите вариации выборок {8, 3, 20, 1}; {9,1; 2,3; 4,6; 13) и {4, 8, 35, 2, 17, 6, 28). б) Стандартное отклонение. (1 ) Отклонение от средней. Рассмотрим выборку X = {1, 5, 8, 6}. Ее средняя равна х — 20/4 = 5. На рис. 74 значения выборки обозна- чаются темными кружками на шкале х. Рис. 74 Для каждого наблюдения вычисляются величины (х— х), которые также отмечены на рис. 74. Эти величины называются отклонениями от средней. Иногда для обозначения отклонения мы будем пользоваться символом d. Рассчитаем отклонения от средней (множество D) для рас- сматриваемой в качестве примера выборки X: D = {-4,0, + 3, + 1}. Очевидно, что чем больше будет разброс в множестве наблюдений X, тем больше будут отклонения в D. Таким образом, для измерения рас- сеяния наблюдений мы можем использовать некоторый вид средней для множества отклонений. Такая мера рассеяния и будет введена. Упражнение 2.3.7 г' 1. Найдите множество D отклонений от средней для каждой из следующих выборок: {2, 3, 4, 5, 6); {2, 8, 3, 7, 11, 6, 5}; {1,2; 8,7; 2,4; 6,5; 6,2}. 2. Найдите сумму отклонений для каждого множества D в задании 1. Про- комментируйте полученные результаты. Можно ли взять арифметическое среднее отклонений выборки как меру разброса? (2) Стандартное отклонение. Мера рассеяния, известная как стан- дартное отклонение, обозначается s и вычисляется следующим образом: определяется множество отклонений от средней (D); каждое отклонение возводится в квадрат ({с?2}); находится сумма квадратов и делится на п (ZdVri)', 152
наконец, извлекается квадратный корень. Таким образом, Эту величину часто обозначают через S.D.(x) или просто S.D. Квадрат стандартного отклонения, полученный на третьем шаге, называется дисперсией, которую мы будем обозначать Var (х). S.D. и дисперсия играют важную роль в статистической работе, поэтому формулы для их вычисления должны быть хорошо усвоены. Приведем иллюстри- рующий пример. Пример. Найдите стандартное отклонение множества наблюде- ний X = {4, 8, 6, 3, 7, 2}. Решение. Средняя равна х = 5, а множество отклонений D = {—1, 3, 1, —2, 2, —3}; множество отклонений в квадрате (или квадратов отклонений) будет {d2} = {1, 9, 1, 4, 4, 9}; сумма квадратов, деленная на п, равна 2 42 28 . —= V (/г=6)’ п 6 это и будет дисперсией; квадратный корень из дисперсии равен стандартному отклонению: S.D. (х) = ]/у=2.16. Формулу для вычисления стандартного отклонения можно запомнить из его определения: «S.D. равно квадратному корню из арифметичес- кой средней квадратов отклонений». Дисперсия равна арифметической средней квадратов отклонений, и S.D. есть квадратный корень из нее. Упражнение 2.3.8 1. Найдите стандартное отклонение выборок из упражнений 2.3.2, 2.3.4(за- дание 1), 2.3.6 и 2.3.7 (задание 1). 2. Покажите, что арифметическое среднее множества отклонении для любой выборки равно нулю. Отсюда следует, что эта величина не подходит для измере- ния разброса. 3. Покажите, что s2 = 2 (х — х)г1п можно записать в виде 2х2/п —х. (Раз- ложите по степеням (х — х)2 и просуммируйте члены. Примите во внимание, что 22хх = 2x2 х и 2х2 = пх2.) 4. Воспользуйтесь формулой из предыдущего задания для вычисления s выборки {4, 3, 5, 7, 9, 11}. Снова найдите s с помощью обычной формулы. Сравни- те затраты времени, необходимые для соответствующих вычислений. 5. Запомните формулу из задания 3. Воспользуйтесь ею для вычисления стандартных отклонений выборок из задания 1. 153
(3) Вычисление для группированных данных. Далее приводится про- стейший пример таблицы частот группированных данных. С помощью этих данных иллюстрируется вычисление стандартных отклонений по основной формуле. С помощью методов, излагаемых в 2.3.5, можно уменьшить затраты времени для таких расчетов. Среднее значение X Частота f (X—X) (JC—Х)3 f (х-х^ 10 5 —9,5 90,25 451,25 20 11 0,5 0,25 2,75 30 4 10,5 110,25 441,00 Всего 20 — —- 895 Величины в последнем столбце для каждой группы равны произведению частоты на квадрат отклонения. Таким образом, сумма величин в столб- це совпадает с 2/ (х — х)2. Соответствующая формула для вычисления стандартного отклонения имеет вид д2 2f (*~*)2 п где п — общее число наблюдений, и суммирование происходит по всем группам. Для данных примера получим: т. е. s2 = —= 44,75, 20 s = 6,7. Читатель должен был заметить, что полученный результат яв- ляется приближенным, так как вместо действительных наблюдений мы пользовались средним значением группы (см. замечания в 2.3.2, в) после вычисления х по группированным данным. Как правило, это приближение довольно хорошее. Группировка данных ведет к неболь- шому увеличению значения s2; в некоторых случаях необходима допол- нительная корректировка этой величины. Можно сомневаться или не сомневаться в пользе применения такой корректировки, однако в этой книге эта формула разбираться не будет. в) Формулы для s2. Приведем в табличной форме все формулы для вычисления s2, которые встречались нам раньше, вместе с их альтер- нативными записями. 154
s2, вычисленное по всем наблюдениям s2, вычисленное по группированным данным Определения (суммирование по выборке) 2(х —х)2 п (суммирование по группам) Zf(x — xjz п Альтернативная форма записи 2 X2 -2 п _~2 п Все эти формулы очень важны и поэтому должны быть выучены. В задании 3 упражнения 2.3.8 предлагалось получить одну из аль- тернативных формул. Приведем ее вывод. 2 £f(x—x)2 2f (х2—2хх-рх2) s ~ п ~ п " _ ЗЛ _ + 7 - 2х-Х + *1 = ?, п п п п п п что и требовалось доказать. Упражнение 2.3.9 Вычислите дисперсию выборки, для которой: (1) 2х = 80, Sx2 = 640, п = 20; (2) 2х = 40, Sx2 = 400, п = 8; (3) 2 f = 80, 2/х = 4 400, 2fx2 = 250 000; (4) 2f = 50, 2fx = 360, 2/х'2 = 2856,5. 2.3.5. ПРЕОБРАЗОВАНИЯ ПАРАМЕТРОВ а) Средняя и S.D. Применение следующего метода резко сокращает затраты труда, связанного с вычислением различных статистических величин. Этот метод мы проиллюстрируем на частотном распределении: Среднее значение X 8,5 18,5 28,5 38,5 48,5 Частота 8 12 20 15 5 Гистограмма этого распределения показана на рис. 75, под шкалой х проведена другая шкала у. Как видим, средние значения групп неудобны для вычислений, так как они представляют собой десятичные дроби со знаками после запя- 155
Той с шагом, равным 10. Отметим на шкале у число десятков, отделяю* щих среднее соответствующей группы от среднего всей совокупности. Очевидно, зависимость между значениями х и у будет линейной и равной х = Юг/ + 28,5. (1) Читатель может легко проверить, что если у принимает значения —2,—1, 0, 1,2, то х, найденный по уравнению (1), принимает значения 8,5; 18,5; 28,5; 38,5 и 48,5, которые и требовалось получить. Общее правило записи уравнения преобразования можно сформу- лировать следующим образом. Выберем в качестве начала отсчета (ну- ля) на шкале у середину интервала распределения. Обозначим ее через М. (Часто за М берут среднее значение модальной группы.) Тогда уравнение будет таким: x = gy^M, [‘2) где£ — ширина группы по шкале х, т.е. х = (ширина группы) у + (среднее значение, у = 0). (2') Отнесем теперь частоты распределения, заданного на шкале х, к соответствующим интервалам шкалы у. Вычислим среднюю у и S.D. (у).' Стандартные отклонения, найденные для разных шкал, мы будем обо- значать sK и sy. Если у и sy известны, то х и могут быть найдены с помощью сле- дующих формул: ~x = gy + M; (3) ^x=gSy. (4) Доказательство этих формул приводится далее в п. в) этого пара- графа. Для данных гистограмм вычисления выполняются следующим об- разом. Составляется таблица со столбцами, обозначенными х, f, у, fy и т. д. Последние три колонки используются только для проверки, их назначение будет объяснено далее. 156
Среднее значение X Частота 1 У fy fy’ W-l f (H-1) f (s+i)! 8,5 8 —2 —16 32 —1 —8 8 18,5 12 —1 —12 12 0 0 0 28,5 20 0 0 0 1 20 20 38,5 15 1 15 15 2 30 60 48,5 5 2 10 20 3 15 45 Всего 60 — —3 79 — 57 133 Перепишите первые два столбца таблицы х и f, а остальные вычисле- ния попытайтесь проделать самостоятельно, пользуясь в качестве ин- струкций заголовками соответствующих столбцов. Вы обнаружите, что необходимые вычисления проходят очень легко. Обратите внимание, что для получения fy2 достаточно fy умножить на у. По итоговой сумме четвертого столбца найдем: у = ^!-= — = — 0,05, п 60 после чего можем легко рассчитать S2 = —~yz= И-----0,0025 = 1,314. п 60 Наконец, принимая во внимание формулы (3) и (4), мы получим: Х-= 10у +28,5 = 28,0; = 10sy = 10 V1.314 = 11,5. Итак, распределение имеет среднюю 28 и S. D. = 11,5. б) Использование проверочных столбцов (проверка Чарли). С по мощью сумм 2f (г/+1) и 2/ (у + I)2 (последние значения предпослед- него и последнего столбца таблицы) проверяют суммы 2/, 2/у и 2/ц2 прежде, чем ими пользуются для вычисления у и sy. Для выполнения этих проверок мы воспользуемся следующими тождествами: 2/ (у + 1) = Vfy + 2/ и 2/ (у + I)2 = 2fz/2 + 22/г/ + 2f. (Читатель сможет доказать эти тождества самостоятельно.) Таким образом, для примера из 2.3.5, а) выполнимость равенств 57 = —3 + 60 и 133 = 79 + 2(—3) + 60 говорит о том, что все сум- мы вычислены правильно. При расхождении результатов все вычисления необходимо последо- вательно повторять до тех пор, пока не будет найдена ошибка. Хотя эта проверка требует дополнительных расчетов, она в большинстве случаев бывает полезной. 157
в} Доказательство формул преобразования. 1) Доказательство формулы (3). Для каждого наблюдения выборки х — ёУ + М. Суммируя по выборке и деля сумму на п, получим сле- дующее уравнение: 2// , 2Л4 ----ст —— -4------. из которого немедленно следует (3). 2) Доказательство формулы (4). Имеем: х = ёУ + м-, X=gy + М. Вычитаем из первого уравнения второе и возводим в квадрат обе час- ти: (х—x)2 = g2(y—'iy)2. Просуммируем обе части полученного уравнения по выборке и разде- лим сумму на п, получим s2 = g2Sy. Упражнение 2.3.10 1. Вычислите средние и стандартные отклонения (S.D.) по следующим табли- цам частот. Воспользуйтесь подходящим преобразованием для каждого случая. (1) Длина заготовок х в мм; 6,5 8,5 10,5 12,5 14,5 16,5 Частота f: 2 4 18 15 8 3 (2) Предельное растяжение р в мм: 7,2 7,3 7,4 7,5 7,6 7,7 7,8 Частота /': 1 5 8 20 17 12 7 (3) Точка плавления Т °C: 89,8 89,9 90,0 90,1 90,2 90,3 90,4 Частота f: 5 7 12 33 25 15 3 (4) Диаметр заклепок d в мм: 9,7 9,8 9,9 10,0 10,1 10,2 Частота/': 1 0 8 25 14 2 (5) Оценка s на экзамене: 15 25 35 45 55 65 75 85 Частота f: 1 3 9 15 44 22 5 1 2. Вычислите S.D. для каждого множества данных задания 4 упражнения 2.2.1. 2.3.6. ПОЛЕЗНОЕ СООТНОШЕНИЕ, СВЯЗЫВАЮЩЕЕ х, s И РАСПРЕДЕЛЕНИЕ Значение х грубо указывает, где расположен центр распределения, а значение s несет определенную информацию о его разбросе около х. С помощью этих величин можно вывести два очень полезных прави- ла, которые приблизительно выполняются для большинства унимодаль- ных распределений. Вот они: (1) 95% распределения лежит между значениями х—2s и x + 2s; (2) более чем 99% распределения заключено между х—3s и x4-3s. Эти приближенные границы совокупности иллюстрирует рис. 76. 158
Пример. Для распределения, рассмотренного в 2.3.5, среднее равно 28, a S.D. = 11,5. Поэтому приближенные 95%-ные и 99%-ные границы распределения будут равны 28+23 и 28±34,5 соответственно. Упражнение 2.3.11 Для каждого из распределений задания 1 упражнения 2.3.10 получите 95%-ные и 99%-ные границы совокупности. Набросайте гистограмму и отметьте получен- ные границы для разных масштабов. Выполняются ли в этих случаях правила (1) и (2) — см. рис. 76. Рис. 76. (а) За пределами интервала x±2s (в сред- нем) лежит менее одного наблюдения выборки из 20. (б) За пределами интервала x+3s (в среднем) лежит менее одного наблюдения выборки из 100 2.3.7. ИЗМЕРЕНИЕ АСИММЕТРИИ ПО ПИРСОНУ Рисунки в 2.3.2, г) показывают связь средней, медианы и моды. Из этих рисунков следует, что для распределений с положительной асим- метрией средняя х будет больше моды х. Для распределения с отрица- тельной асимметрией х будет меньшех. И чем больше будет асимметрия, тем больше будет разность между этими двумя величинами. Это поз- воляет рассматривать величину (х—х) как меру асимметрии. Для то- го чтобы эту меру сделать безразмерной, можно разделить ее на стан- дартное отклонениеs. Полученный параметр известен как первый коэф- фициент асимметрии Пирсона. Второй коэффициент Пирсона прибли- женно эквивалентен первому, при расчете его вместо моды берут ме- диану (см. формулу в 2.3.2, г)). Эти меры таковы: (1) 1-й коэффициент асимметрии Пирсона равен х ; (2) 2-й коэффициент асимметрии Пирсона равен-------------. Оба коэффициента равны нулю, если распределение симметрично. Они положительны или отрицательны в зависимости от того, имеет ли распределение положительную или отрицательную асимметрию. Для каждого из коэффициентов величина, большая 1 или меньшая— 1, указывает на значительную асимметрию. Упражнение 2.3.12 1. Найдите меру асимметрии по Пирсону для распределений в упражнении 2.3.10. 2. Сравните асимметрию в распределениях А, В и С для следующих значений параметров: для А: средняя = 4, мода = 3, S.D. — 1,5; для В: средняя = 5, медиана = 4, дисперсия = 36; для С: медиана = 22, мода = 20, S.D. = 3. 159
2.4 РАСПРЕДЕЛЕНИЕ ГЛАВА ВЕРОЯТНОСТЕЙ 2.4.1. ВВЕДЕНИЕ Как следует из первой главы, распределения вероятностей могут быть либо дискретными, либо непрерывными1. В этой главе будут даны определения соответствующих понятий и рассмотрены примеры. Мы об- судим также некоторые функции, которые получаются из распределе- ний вероятностей и очень полезны в статистике. а) Дискретные распределения. Если случайный эксперимент имеет выборочное пространство2 X = {хг, х2, ..., хл}, а величины plt р2. ..., рп — вероятности элементарных событий {хД, ..., {хп}, то мы гово- рим, что для эксперимента определено дискретное распределение вероят- ностей. В силу данного определения выборочное пространство для дис- кретного распределения счетно, в частности, оно может быть конечным. Функция р (X), принимающая значения р1т ..., рп, когда X принимает значениях!, ...,хп, называется функцией вероятности X. Примеры 1. Эксперимент. Наблюдается выпавшая сторона при бросании монеты. Вероятности определяются в предположении, что герб и ре- шетка — равновозможные события. Выборочное пространство: S = {Н, Т} ) Дискретное распределение Функция вероятности: р (S)~ {1/2, 1/2}J вероятностей Замечание. Часто каждой точке выборочного пространства приписывается действительное число. Например, в эксперименте с мо- нетой мы можем исходу И приписать 0, а исходу Т—число 1. Полу- ченное распределение будет иметь вид: Х = {0, 1} Переменная X, определенная на выборочном пространстве S, — простейший пример так называемых случайных переменных. Вообще, любая действительная (т. е. имеющая значения в области действитель- 1 Распределения смешанного типа (одна часть которых непрерывна, а дру- гая дискретна) довольно редко встречаются в приложениях. Распределения та- кого типа в этой книге рассматриваться не будут. 2 Выражение «выборочное пространство» — синоним выражения «простран- ство исходов». 160
них чисел) функция, определенная на выборочном пространстве, на- зывается случайной (или стохастической) переменной. 2. Эксперимент. Монету бросают до тех пор, пока не появляется ре- шетка (Т). Выборочное пространство. Выборочное пространство для этого экс- перимента обсуждалось в 2.1.2, а). Предположим, что рассматриваемое выборочное пространство счетное. Оно описывается следующим обра- зом: S = {(7'), (НТ), (ННТ), ...}; (Ill I р (S) = {-g- , , -g- , [ — соответствующие вероятности. Заметим, что сумма вероятностей равна 1, поскольку эти вероят- ности образуют бесконечную геометрическую прогрессию со знамена- телем 1/, и с суммой- V2 / (1—1/2). Чтобы задать случайную переменную на исходах этого эксперимен- та, можем каждому исходу поставить в соответствие число бросаний, необходимых для его наступления. Это приводит нас к дискретному распределению: действительная функция на S: X — {1, 2, 3, ...} /v4 ( 1 1 1 1 функция вероятности: р (л) = <-g- , -j- , -у , ... j . б) Свойства функции вероятности. Поскольку значения р (X) — вероятности, то непременно 0<р(х)<1. (1) Поскольку объединение всех элементарных событий равно S, мы получим SpW=1. (2) s Вероятность любого события Е может быть найдена по формуле Р(Е) = ^.р(х), Е где суммирование происходит по всем точкам из Е. Любая функция, удовлетворяющая условиям (1) и (2), бу дет функ- цией вероятности. На практике стремятся выбрать функцию вероятно- сти, принимающую значения, близкие (при повторении эксперимента большое число раз) значениям относительных частот. Рассмотрим, на- пример, эксперимент, состоящий в бросании двух монет и наблюде- нии выпавших сторон. Для этого эксперимента выборочное простран- ство будет S = {*!, х2, *з}> гДе хг — исход «выпадение двух гербов», или {Н, И}-, х2 — исход «выпадение герба и решетки», или '{Н,'Т}\ х3 — исход «выпадение двух решеток», или {Т, Т}. Для задания дискретной функции вероятности мы должны опреде- лить только вероятности каждого из событий {xj, {х2}, {х3}, удовлетво- ряющие условиям (1) и (2). Вот некоторые возможные функции ве- роятности для этого эксперимента: 1) р(Х) = {0, 0,1}; 2)р(Х) = 1±, -1 6 Зак. 973 (3) 161
3) Р (X) - СА, VJ, 4) р (X) = {0,22; 0,50; 0,28}. Если принять функцию 1, то окажется, что события {(//, И)} и {(//, Т)} невозможны, а событие ((Г, Г)} достоверно. Другими слова- ми, первые два исхода не наступят никогда, а третий исход появляется при любом испытании. Возможно ли это? С математической точки зре- ния у нас нет причин для отказа от этой функции, так как каждая ве- роятность лежит между 0 и 1 включительно и 0 + 0 + 1 = 1. На прак- тике это также могло иметь смысл в том случае, когда обе монеты с двух’сторон имели бы решетки! Однако, если мы обнаружили, что обе монеты имеют и герб и решетку, то мы не можем ни одному исходу аргументированно припи- сать вероятность, равную нулю. Поэтому необходимо выбрать функ- цию, например, имеющую вид 2, 3 или 4. Но какую? Предполагая, что появление х2 и х3 равновозможно, необходимо выбрать функцию 2, которая каждому элементарному событию приписывает вероятность, равную 1/3. На первый взгляд, это может показаться обоснованным; даже некоторые великие математики на заре возникновения теории ве- роятностей совершали такую ошибку, беря для рассматриваемого экс- перимента эту функцию вероятности. Однако достаточно выполнить хотя бы небольшое число испытаний, чтобы увидеть, что такое задание вероятностей ошибочно. Для проверки этого факта мы советуем читате- лю проделать этот эксперимент самостоятельно. Возьмем две монеты и бросим их 60 раз, запишем частоту появления (НН), (НТ) и (ТТ). Мы найдем, что отношения этих частот равны не 1 : 1 : 1, а близки к 1 : 2 : 1 *. Поэтому частоты будут приближенно равны 15, 30 и 15 соответственно. Таким образом, получается, что для рассматриваемого эксперимента лучше выбрать функцию 3. ъ С другой стороны, допустим при 60 бросаниях монет частоты исхо- дов эксперимента оказались равными 13, 30 и 17 соответственно. Не будет ли в этом случае предпочтительнее функция 4? Очевидно, на дан- ном этапе мы не знаем, функция 3 лучше или хуже, чем функция 4. Функция 3 будет более подходящей, если обе монеты правильно сба- лансированы (такие монеты будем называть правильными)', если же монеты неправильные (например, сторона герба у каждой более во- гнута и при этом чаще выпадает решетка), выбор функции 4 был бы более оправдан. Проверьте это последнее утверждение путем вы- числения функции вероятности в предположении, что для каждой монетм р (Т) = 0,53. Выбор между функциями 3 и 4 можно сделать только после много- кратного бросания монет и выяснения, какая из этих функций наиболее подходящая в длинной серии испытаний. Если мы осуществим такую проверку, то, скорее всего (а в действительности — наверняка!), обна- ружим, что ни одна из предложенных функций не будет «наилучшей», и построим другую функцию, основанную на большом числе бросаний. * Читателю станет яснее такое распределение вероятностей, если он не- сколько изменит эксперимент и будет бросать монеты поочередно. Легко заме- тить, что два исхода (НТ) и (TH), равновероятные для правильных монет исходам (ТТ) и (НН), были объединены в один исход эксперимента. — Примеч. ред. 162
pm Р(х) Д Р'х) pm А 0,50 2 х, хг х3 (3) X, х2 x3 (Ч Л, хг х3 х, хг х3 (Г) (2) S=[x,,x2, х3), где х, =(НН), хг= (НТ), х^(ТТ) Рис. 77. Распределение вероятностей для эксперимента с бросанием двух монет частот, которые рассматривались в вероятнос- Этот пример обсуждался довольно подробно, частично как допол- нение к содержанию 2.1.5, частично для демонстрации читателю того факта, что практическое задание вероятностей является не только ма- тематической, но и эмпирической проблемой. Суммируем сказанное: (а) любую функцию р (х), такую, что (х)< 1 и (х)= 1, s можно использовать в качестве функции вероятности (ф. в.); (б) выбирая ф. в. для практических задач, следует ее проверить, повторяя ис- пытания эксперимента; при необходимости выбранную ф. в. можно заменить. Очень часто в вопросах задания ве- роятности интуиция оказы- вается ложной. в) Графики функций ве- роятности. Между распреде- лениями вероятностей и рас- пределениями относительных гл. 2.2, имеется тесная связь. Под распределением тей можно понимать предельную форму распределений относительных частот при неограниченном увеличении числа наблюдений. Такое рас- пределение принято называть истинным распределением вероятностей совокупности данного эксперимента. Выборки из этой совокупности образуют распределения относительных частот, представляющие собой приближенную форму истинного распределения вероятностей. Распределения вероятностей можно изобразить графически, при- меняя для этого такие способы, как прямоугольные диаграммы или гис- тограммы, которые уже использовались при построении распределений относительных частот. Графики на рис. 77 иллюстрируют распределе- ния (1), (2), (3) и (4) для рассмотренного эксперимента с бросанием двух монет. Упражнение 2.4.1 1. Выборочное пространство X = {0, 1, 2, 3}, а функция вероятности р (х) = С/(2+х). Определите значение С и нарисуйте прямоугольную диаграмму для распределения. Найдите вероятности событий: (1) х=3, (2)х<3, (3)х£{2, 3} (т. е. х либо 2, либо 3). 2. Какая из следующих функций более подходящая как функция вероят- ностей для выборочного пространства X = {0, 1, 2, 3}? (1) 1/х, (2) 1/8 (l/2-f-x), (3) С/х, (4) (х2-3)/2, (5) С/(1 + х). 3. Для функций в задачах 1 и 2, которые могут быть использованы в качестве функций вероятности, нарисуйте прямоугольные диаграммы (в случае необходи- мости найдите константу С). Для каждого случая найдите вероятности событий: (а) х нечетное; (б) х четное; (в)х£{0, 1} (т. е. х либо 0, либо 1); (г) х меньше 1; (д) х больше 1. 4. Для счетного выборочного пространства X = {0, 1,2, 3, ...} соответст- вующая функция вероятностей будет р (х) = е~г.(1/х1), где е — основание на- туральных логарифмов. Покажите, что Sp (х) = 1, и нарисуйте прямоугольную X диаграмму для этого распределения. 163
2.4.2. НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ (1) ОСр(х}~Всюду Мы возвращаемся к проблеме задания вероятностей в непрерывных выборочных пространствах. В дальнейшем мы будем предполагать, что выборочное пространство есть множество или подмножество действи- тельных чисел. Если выборочное пространство некоторого эксперимента X несчет- но, то мы не можем каждому элементарному событию, как это делалось для дискретных пространств, приписать ненулевую вероятность, так как в противном случае, сум- мируя все вероятности, мы по- лучили бы в результате беско- нечность вместо необходимой единицы. Чтобы обобщить поня- тие вероятности для событий на несчетных выборочных про- странствах, мы введем функцию плотности вероятности (ф. п. в.), соответствующую случайно- му эксперименту X, которую, будем обозначать р (х). Приве- денные далее свойства этой функции постулируются. ,, а) Свойства функции плот- ности вероятности (ф. и. в.). Прежде всего потребуем, чтобы р(х)^0, — оо <;%<; +оо (1) и ft J р (х) dx = 1. (2) 7 О 7 2 3 X Выборочное пространство — все действи/пельнь/е числа р(х}- Сообщал площадь=фр(х)дх=1 Р1*) Площадь fi пп././ (3) Событие £,= “xto' Р(£,)=£р(Х)дх Событие "at, хс, Ъ " Р<Рг)-/р(£)дх Рис. 78 О а Ь к Необходимо также, чтобы для любого события Е из. поля- событий эксперимента (см. 2.1.3, г)) можно было вычислить интеграл j' р (х) dx. Е Любое событие Е можно представить как некое подмножество действи- тельных чисел; число, выраженное этим интегралом, назовем вероятно- стью Е. Итак, Р (Е) — J р (х) dx. (3) Е Если задана ф. п. в., обладающая указанными свойствами, будем го- ворить, что для данного эксперимента X определено непрерывное рас- пределение вероятностей, а X определяет непрерывную случайную пе- ременную. Графики на рис. 78 иллюстрируют свойства функции плотности ве- роятностей. Читатель заметит много г схожего между дискретными_и_непрерыв- ными функциями плотности вероятности. Их роли почти во всех во- 164
нросах одинаковы; знак 2 для дискретных распределений в любых ситуациях соответствует знаку f в непрерывных пространствах. Очень важно отметить, что в непрерывном случае р (х) не будет вероят- ностью в обычном смысле этого слова. Только если эту величину умно- жить на дифференциал dx, мы под результатом можем понимать вероят- ность события, которое определяется как событие «х принадлежит интервалу, обозначенному через dx». На- глядно эту ситуацию можно отождествить с разбиением на части некоторого стержня с заданной функцией плотности d. В таком слу- чае не имеет смысла говорить о «массе точки» тела, однако при рассмотрении малого объе- ма бV произведение d 6V уже имеет смысл, под которым и понимаю!' массу взятой части тела. Поэтому при использовании непрерывного распределения вероятностей для некоторого эксперимента X относительно вероятностей предполагаются выпол- ненными следующие условия: Р (X = х) = 0 для любого одноточечного события {х}; (1) Р (аС х С b) ~ Р (а х <Z b) = Р (а < х й) = = Р {а <х < Ь). (2) Для моделей, применяемых на практике, эти условия, как правило, выполняются. Некоторые замечания в конце примера 1, рассматривае- мого далее, также указывают на то, что условие (1) довольно есте- ственное. Примеры 1. Эксперимент. На вертикальной оси свободно вращается хорошо отрегулированная стрелка. В плоскости, перпендикулярной оси, под стрелкой помещается круглый диск. На всем периметре этого диска находится равномерная шкала с отметками от 0 до 10. Стрелка приво- дится во вращение, и после ее остановки записывается значение (х), которое соответствует показанию стрелки (рис. 79). Необходимо подобрать для этого эксперимента подходящее распре- деление вероятностей. Выборочное пространство X. Поскольку стрелка может остановить- ся против любого числа между 0 и 10, то это множество и будет выбороч- ным пространством X. Функция плотности вероятности р (х). Если стрелка хорошо сба- лансирована, то интуитивно ясно, что вероятность попадания стрелки в любую точку некоторого интервала будет пропорциональна длине этого интервала. Таким образом, для любого интервала (я, Ь) в множест- ве (0, 10) необходимо, чтобы Р (хб (а, Ь))=С [длина (а, Ь)], где С— некоторая константа. Это означает, что ф. п. в. должна быть констан- 165
той С. А поскольку суммарная вероятность равна единице, то ю ю J р (х) dx = J Cdx = 1; 6 о отсюда находим С = — ю График ф. п. в. для этого эксперимента показан на рис. 80. Полное описание р (х) выглядит следующим образом: 1 „ • если 0 х 10 (х — действительное число), 0 в других случаях. х Рис. 80. Прямоугольное распределение на (0,10) Последняя строчка «0 в других случаях» часто совсем опускается из описания ф. п. в., если выборочное пространство, представляющее собой подмножество действительных чисел, полностью определено. Замечания. Допустим, нас интересует вероятность того, что стрелка остановится против х = 3. Вопрос может быть поставлен в сле- дующей форме: когда стрелка может остановиться против х = 3? Если бы конец стрелки можно было рассмотреть в микроскоп, мы бы заметили, что стрелка никогда не показывает точно 3. Мы также не в состоянии абсолютно точно указать, где находится по шкале отметка 3. Мы ограничены степенью остроты нашего зрения и несовершенством измерительных приборов. Единственное, что мы можем сделать, это указать малый интервал, на который показывает стрелка и в котором находится отметка 3. Даже длину интервала мы можем измерить только приближенно. Таким образом, в действительности при работе с данными, представ- ляющими собой результаты измерений, мы можем лишь наблюдать, что результаты проводимого эксперимента принадлежат некоторому интервалу, быть может и очень маленькому. Далее, нетрудно согласиться с тем, что вероятность для стрелки ука- зать на меньший интервал меньше вероятности указать на интервал, больший по длине. И чем меньше рассматриваемый интервал, тем мень- ше будет соответствующая вероятность. Какой необходимо взять ин- тервал, который включал бы только одну точку х = 3? Легко пока- зать, что любой интервал, даже достаточно малый, содержащий х = 3, содержит также несчетное число других точек, соседних с 3. Если бы мы попытались продолжать разбиение интервала до тех пор,, 166
пока в нем останется только х = 3 и не останется других точек, то такой процесс будет продолжаться, пока интервал не исчезнет вовсе. Это произойдет, когда мы достигнем интервала длиной, равной нулю (если только это возможно). Таким образом, на практике мы никогда не спрашиваем, чему равна вероятность Р (х = 3), а пытаемся отве- тить, например, на такой вопрос: чему равна вероятность Р (х£ (2,95, 3,05)) или Р (х£ (2,995, 3,005))? Если же мы хотим найти вероятность одноточечного события в модели с непрерывными’’дан- ными, то, очевидно, такую вероятность мы должны положить равной нулю. 2. Случайная переменная X имеет следующую функцию плотности вероятности: р(х) = с (4—2х), 0<-х<2, 0 в других случаях. 1) Найдите значение с. 2) Нарисуйте распределение. 3) Найдите вероятности событий £, = «х < 1», £а = «х < 2», £3 = «1/2 < х 7/8», Ец - «х = 1/4», Еъ = «х^ 2», Ев = «х ле- жит между 1 и 2 при условии, что это значение больше 1/2» = «1 < х < 2»/«х > 1/2». Решение 1) Суммарная вероятность должна быть равна единице, поэтому 2 |’с (4—2 х) dx = 1, откуда получаем с = 1/4. о 2) График ф. п. в. приведен на рис. 81. 1 0 1 1 з 3) Р(Е1) = Р(х< 1) = J p(x)dx= J 0dx+ [(4 — 2x)dx= — . — оо —оо О Замечание. Интегралы, для которых р (х) = 0, в дальней- ших преобразованиях опускаются. 2 £(£2) = £(х<2) = J p(x)dx= 1; — оо 167
Р(ЕЛ) —Р^х = = J p(x)dx = O^ х = -^- —событие с 1/4 одним исходом); Р (Еб) = P(X^2) = J р (х) dx = 0; 2 (см. в 2.1.6, а) формулу условной вероятности) (поскольку интервал (1, 2) есть пересечение интервалов (1, 2) и (1/2,оо) J Р (*) dx 1 ОО J p(x)dx 1/2 Упражнение 2.4.2 1. Найдите ф.п.в. для непрерывного прямоугольного распределения на ин- тервале (2, 5) и равного нулю в других случаях. Нарисуйте распределение и най- дите вероятность событий: (1) «х <£ 1», (2) «х < 3», (3) «2 < х < 3», (4) «х > 3», (5) «х = 2Х/3», (6) «х = 2х/2 или х= 3», (7) «х< 3 и х> 2», (8) «х £ (4, 5) при условии X 2> 3». 2. Нарисуйте распределение с ф.п.в. ф о < X < 2, о в других случаях. Найдите значение С. Рассмотрите события Е = «х <Z 1», F = «х £ (1/2, 1)», Q = «х>1/2». Найдите вероятности событий: (1) Е, (2) F, (3) G, (4) EF, (5) FG, (6) GE, (7) E/F, (8) F/G, (9) G/E, (10) Е (J F, (11) F U G, (12) G U Е. 3. Нарисуйте график распределения, для которого ф.п.в. равна [ Се-ах, о 0x2, в других случаях. Найдите значение С и вероятности событий (I)—(12) из предыдущего зада- ния с чтим распределением вероятности. 1Q8
2.4.3. КУМУЛЯТИВНАЯ ВЕРОЯТНОСТЬ Функция плотности вероятности р (х) (она может быть как дискрет- ной, так и непрерывной) порождает кумулятивную функцию распре- деления (к. ф. р.) F (х) = Р (X < х), которая каждому значению х из выборочного пространства ставит в соответствие вероятность того, что случайная переменная X окажется не больше х.] « ГТ. । Us Кумулятивная функция распределения вычисляется по формулам: 1) F (0*=0 = У, р (х) в дискретном случае; / t 2) F (/) = Р (X 0 = (' р (х) dx в непрерывном случае. Значения к. ф. р. F (х) и соответствующие значения х можно на- нести на график; в таком случае мы получим кумулятивную вероятно- стную огиву. Такие огивы аналогичны кумулятивным огивам относи- тельных частот, построенным по выборкам и описанным в гл. 2.2. Оги- ву к. ф. р. можно считать огивой совокупности, тогда соответствующая огива выборки будет ее оценкой. Примеры 1. Дискретное распределение вероятностей. Выборочное пространство X = {0, 1, 2, 3}. ( I Функция плотности вероятности р (х) = 1 -у , 1 3 Ч Т ’ Тб ’ 16 J • Как легко видеть, кумулятивная функция распределения будет иметь вид: 0, если X < 0, I п - 1 — , если 0 si х < 1, 4 1 , 1 3 . -------= — , если 1 х < 4 2 4 1 , 1 ,13 15 , q ~ —I----р — — - , если 2 4 ; 2 16 16 _L + _L + A+_L = i, ecJ 4 2 16 16 График F (х) изображен на рис. 82. F(x) = 15 3, 7 - ____- г 7 - -— 1 2 1 ---- 0 7 2 3 x Рис. 82. График к. ф. р. Дискретный случай 169
Заметим, что F (х) определена для всех действительных значений х; в некоторых точках х происходит скачок (разрыв) значений функции F (х), равный величине р (х). 2. Непрерывное распределение вероятностей (прямоугольное). Выборочное пространство X — интервал (0, 4). Ф. п. в. р(х)=-|-, 0<х<4. К. ф. р. F(x)= ( p(x)dx, откуда если х < О, если 0<х<4, если х^>4. График F (х) показан на рис. 83. Рис. 83. График к. ф. р. Непрерывный случай Заметим снова, что F (х) определена для всех вещественных значений хот — оо до + 00 • В графике к.ф. р. для непрерывных распределе- ний разрывы отсутствуют*.) Замечания. Мы видели, как к. ф. р. можно получить из ф. п. в. Возможна и обратная операция: заданная к. ф. р. определяет ф. п. в. Таким образом, для задания распределения вероятностей можно ис- пользовать либо ту, либо другую функцию. В элементарной статистике чаще всего используют ф. п. в., а в более серьезных курсах, как пра- вило, имеют дело с к. ф. р. Упражнение 2.4.3 1. Найдите кумулятивную функцию распределения для эксперимента «бро- сание правильной игральной кости и наблюдение выпавшей грани» и нарисуй- те ее график. 2. Найдите к. ф. р. для эксперимента с функцией плотности вероятности. р (х) = */3 р/гх + 1), 0<х<2и нарисуйте ее график. По этому графику опре- делите вероятности следующих событий: (1) «х < 1», (2) «х В/а», (3) «1 < х < <В/а»,(4) «х > 3/4». Найдите значение х. для^которого Р (X < х) = 1/2. ___________ g * Смешанные распределения, как было уже отмечено в тексте, не рассмат- риваются в этой книге. — Примеч. ред. 170
2.4.4. МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ Напомним, что в главе, посвященной описательным статистикам, для характеристики некоторых свойств распределения относительных частот мы вычисляли значения таких величин, как среднее и дисперсия; при этом мы пользовались наблюдениями выборки. Сейчас мы опре- делим аналогичные величины для распределения вероятностей. Рассмотрим случайную переменную X с функцией плотности веро- ятности р (х). Если значения X дискретны, то р (х) представляет собой счетное множество чисел; в том же случае, когда значения X непрерыв- ны, р (х) будет плотностью вероятности, определенной на несчетном множестве*. Поэтому мы дадим параллельные определения, одно—для дискретного случая с использованием знака S, а другое—для дискрет- ного случая с использованием знака f. В обоих случаях 5 будет вы- борочным пространством для X. Любое обсуждение для одного случая с небольшими изменениями может быть перенесено на другой случай. а) Математическое ожидание X. Математическое ожидание X обозначается Е (X) и определяется как (1) E(X) = Sx-p(x) s о или (2) Е (X) = (' х • р (х) dx. s Таким образом, для получения значения Е (X) мы берем каждое значение х, умножаем его на соответствующее значение р (х) и сум- мируем по всем точкам из X. Тесная связь между средней х выборки объема N и математическим ожиданием Е (X) совокупности может быть обнаружена в результате сравнения двух определений. Если в выборке значения хх, ха, ..., X}, появляются с частотами f2, ... fk и Sf = N, то k У fi*i X = ----= — xx + — x2 + ... + — xh. N N 1 N 2 N h Коэффициент при хг в дискретном случае будет оценкой ft/N, со- ответствующей вероятности для всей совокупности. При больших зна- чениях N мы получим: х « р (Xj) х, + р (х2) х2 + ... + р (xfe) xft ж Е (X). Отсюда следует, что в качестве Е (X) можно взять среднее совокуп- ности, из которой производится выборка. Обычно среднее совокупно- сти обозначают греческой буквой р. (В дальнейшем в большинстве слу- чаев для параметров совокупности будут взяты греческие буквы, а для жвивалентных параметров выборки — латинские.) * Эти утверждения справедливы в рамках определений дискретного и не- прерывного распределения, приведенных в 2.4.1, 2.4.2, — Примеч. ред. 171
К интерпретации Е (X) можно подойти и с несколько иной точки зрения: эта величина определяет координату х центра «формы» р (х). Говорят также, что Е (X) есть первый момент распределения. Примеры w 1. Найти Е (X) для эксперимента «бросание правильной игральной кости и наблюдение выпавшей грани». Решение Выборочное пространство X = {1, 2, 3, 4, 5, 6}. Функция плотности вероятности р (Х) = {1/6, 1/6, 1/6, 1/6, 1/6, 1/6}. Тогда р = Е (X) = 1 • 1/6 + 2 • 1/6 + 3 1/6 4-4- 1/6 4-5- •1/64-6-1/6 = 3,5. 2. Некое лицо держит пари о появлении (или непоявлении) события Е, шанс наблюдения которого равен 25%. Лицо платит 1 фунт стерлин- гов в случае, если событие Е появляется, и получает 2 фунта стерлин- гов, если оно не появляется. Требуется найти ожидаемый выигрыш. Решение Выборочное пространство (возможные выигрыши в фунтах стер- лингов) X = {2, — 1}. ( 1 3 1 Функция вероятностей р (X) = j J . Тогда Е(Х) = 2-4- + (-1)~=—Г’ 4 4 4 Эта величина может служить мерой справедливости пари. Мы говорим, что пари справедливое, если Е (X) = 0. Если для некоторой азартной игры Е (X) > 0, то игру называем «выигрышной». Результат этого примера можно интерпретировать следующим об- разом. Если лицо будет заключать такое пари много раз, то его проиг- рыш составит в среднем 0,25 фунта стерлингов на одну игру. Очевидно, что такая игра не будет «выигрышной». 3. Случайная переменная X имеет ф. п. в. р (х) = 3/8 (5—4х 4-х2), 1 х 3. Нарисуйте график распределения и найдите Е (X). Решение. Распределением будет часть параболы (рис. 84). Из симметричности распределения очевидным образом следует, что Е (X) = 2. С другой стороны, по определению найдем: Е (X) = С хр (х) dx = — \ х (5—4х + х2) dx = 2. i 8 i ' 172
Упражнение 2.4.4 Найдите E (X) для следующих распределений вероятностей: (1) X = {1, 2, 3, 4}, ( 1 1 1 1 ] Р(Х)=|Т’ Т’ Т' (2) X = {л:х С (1.2)}. 2 / 9 \ pW=T7-2«. ’ < х < 2- О \ Z / б) Математическое ожидание Хг. Через Е (Хг) мы обозначим мате- матическое ожидание r-й степени X; определим его как (1) ^хг р{х) s или (2) j" xr p (x) dx. s Эту величину можно назвать r-м моментом распределения. Мы уже рассматривали случай г = 1, т. е. Е (X). Очень часто нам будет требо- 1 ваться вычислить Е (X2). в) Математическое ожидание любой функции X. Аналогично мож- но определить математическое ожидание любой функции f (X). Положим: (1) £[f(X)J = Sf(x)p(x) S или (2) £[f(X)] = J/(x)p(x)dx. з В частности, определив математическое ожидание функции f (X) ~ = (X — р)2, где р = Е (X), мы получим величину, которая назы- вается дисперсией. Эту величину обозначим Var (X). Таким образом: Var (X) = Е [ (X — р)2] = у (х — р)2 р (х)* (дискретный случай), Var (X) = [ (х — р)2р (х) dx (непрерывный случай), з Отметим тесную связь между этой величиной и выборочной диспер- сией з2, определенной в гл. 2.3. Значение з2 дает меру разброса наблю- дений выборки около среднего х, a Var (X) будет мерой разброса всей совокупности около среднего р. Для Var (X) часто будет употребляться символ о2. Квадратный ко- рень из Var (X) называется стандартным отклонением совокупности. Итак, S. D. (X) = VVar(X) = cr. 173
Теорема. Var (X) = Е [(X — р)* 2] = Е (X2) — р2. Доказательство (непрерывный случай): Е [(X—р)2] = j (х—р)2 р (х) dx = J (х2—2рх + р2) р (х) dx = S S = Jx2p(x)dx — 2р J xp(x)dx + p2y p(x)dx = £(X2)— 2р-р + s s s + р2-1=£(Х2) — р2. Доказательство для дискретного случая аналогично, при этом ис- пользуется операция S. Примеры 1. Для распределения вероятностей X = {0, 1, 2}, р (X) = {-у , , 4}най™ (2)£(*2). (3) Е [(Х-р) ] и (4)£[(Х—р)21. Решение (1) £(Х) = 2х.р(х) = 0-4+1-4 + 2-4-=Т( = И)' (2)£(X2) = Sx2.p(x) = 02-4 + l2~ + 22-T = T- (3) Е [(Х-р)] = S (х-р) р (х) = ( - AV _L + _|_з + \ О / Z о о (Замечание. Е ! (X — р) 1 = Е (X) — Е (р) = р — р = 0.) (4) Е [(Х-р)2] =.S (х-р)2 р (х) = -g-. А. + ±-.А + 121 1 _ 31 64 ’ 8 — 64 (Замечание. По теореме Е [ (X — р)2] = Е (X2) — р2 = - 25 _ 31 \ 64 ~ 64 • ) 2. Для случайной переменной с ф. п. в. р (х) = -у(-у х + 1) , 0 < х < 2, найдите (1) Е (X), (2) Е (X2), (3) Var (X), (4) S. D. (X). Решение (1) Е(X) = f хр(х) dx = (4 х2 + x'j dx = t) О i) \ S 0 2 (2) £(X2)=4^4x3 + x2)dx = 4-. 0 174
(3) Var(X) = E(X^ = ^-4|L = ^-( = o2). (4) S. D. (X) = V'Var(X) = 1/ — --= 0,845 (= a). Упражнение 2.4.5 1. Для распределений вероятностей (а) X = {0,1}, (б) X = {0,1}, (в) X = {0, 1, 2}, ПИ 1131 11111 ₽М=(?т): ₽(X)=U’7}’’ pW=|??i| найти (1) Е (X) = р, (2) Е (X2), (3) Е [(X — р)2] = о2, (4)5 (X3). 2. Непрерывная случайная переменная X имеет функцию плотности вероят- ности, равную константе С на интервале 1 < х < 4 и нулю—вне его. Нарисуйте график распределения и найдите значение С. Найдите также (1) Е (X), (2) Е (X2), (3)о2. Вычислите (4) Р (х < 3) и (5) Р (2 < х < 4). 3. Значения непрерывной случайной величины X лежат на интервале 0 < <~х < 2. Ее ф.п.в. равна С (2х + 1). Нарисуйте график распределения и найди- те значение С. Определите (1) Е (X), (2) Е (X2) и (3) Var (X). 4. Продавец мороженого в солнечный день может заработать 6 фунтов стер- лингов, а в дождливый день — 2 фунта стерлингов. Чему равна ожидаемая вы- ручка от дневной продажи мороженого, если вероятность того, что день окажется дождливым, равна 0,35? 5. Вычислите среднее, дисперсию и S.D. для каждого распределения в за- даниях 1—4 упражнения 2.4.1. 6. Вычислите среднее, дисперсию и S.D. для каждого распределения в зада- ниях 1—3 упражнения 2.4.2. 7. Покажите, что для любого распределения (1) Е (сХ) = »Е (X), (2) Е [cf (X)] = сЕ[ f (X)], (3) Е ЦаХ + &)] = аЕ (X) + Ь, (4)5 [(X - р)3) = = 5 (X3) — Зр5 (X2) + 2р3 (а, Ь, с — константы). 8. Из урны, содержащей 6 синих шаров и 4 красных, случайным образом вы нимают 3 шара. Пусть X — случайная переменная, которая равна общему числу синих шаров, содержащихся в одной выборке. (а) С помощью прямоугольной таблицы выпишите распределение вероятно- стей для X в случаях, когда: (1) шары вынимаются без возвращения; (2) выборка производится с возвращением. (б) Вычислите среднее, дисперсию и S.D. для каждого из распределений, най- денных в (а). 9. Выполните задание 8 в предположении, что урна содержит: (1) 3 синих шара и 7 красных; (2) 5 синих и 5 красных. 10. Случайная переменная X имеет распределение вероятностей Х={0, 1}, р(Х)={9, р}. Покажите, что р = р, о2 = pq, Е (Хг) — р, 5 [(X — р)3] = pq (q — j»). 11. Рассмотрим случайную переменную X со средним р и S.D. = о. Величи- на Z = (X — р)/о называется стандартизированной случайной переменней. Пока- жите, что 5 (Z) = 0, Var (Z) = 1. 2.4.5. НЕКОТОРЫЕ СТАНДАРТНЫЕ РАСПРЕДЕЛЕНИЯ Статистики, а фактически все исследователи, работа которых тре- бует применения теории вероятностей, сталкиваются с большим много- образием вероятностных распределений. Они встречаются при исполь- 175
зовании уже изученных статистических тестов, а также при разработке новых, при экспериментальном изучении случайных переменных или при подборе подходящей вероятностной модели. Существует небольшое число распределений, возникающих в уди- вительно большом числе ситуаций. Функции этих распределений, их графики и свойства будут впоследствии нами изучены. В табл. 1 приведены названия и функции плотности вероятности трех наиболее часто встречающихся дискретных распределений. В этой же таблице даны их средние и дисперсии. За таблицей идут упражнения, помогаю- щие ближе познакомить читателя с формами распределений и их свой- ствами. Далее, в табл. 2, таким же образом приведены три наиболее важных непрерывных распределения. Более детальное обсуждение биномиального и нормального распре- делений — в 2.4.6. а) Важнейшие дискретные распределения Таблица 1 Три дискретных распределения Название Функция плотности вероятностей р(х) Параметры и возможные значения Среднее Е(Х) Дисперсия Var(X) Биномиальное (”) pxqn~x, х = 0.1,..., п 0 в других случаях (? = 1—р) п (1, 2, ...) р (0<р<1) пр пр<7 Пуассоновское е~к —, х = 0,1, ... х! 0 в других случаях X (Х>0) к к Г еометрическое р-9*~*, х = 1,2,... 0 в других случаях (9= 1—Р) р (0 < р < 1) 1 р q pi Упражнение 2.4.6 Замечание. Для некоторых из следующих заданий читателю буд^т очень полезно воспользоваться таблицей логарифмов факториалов. 1. Для биномиального распределения (а) Напишите функции плотности вероятностей для случаев: (I) п=3, р=~; (2) п=б, р = ~; о 2 (3)п=15, (4)П=1О, Р = (б) Для случаев (1) и (2) вычислите значения функции плотности вероятности для всех возможных значений х (т. е. для х = 0, 1, 2, 3 в (1) и х = 0, 1, .... 6 в (2)). В каждом случае проверьте, что Sp (х) = 1. Нарисуйте прямоугольную диаграмму для этих двух распределений вероят- ностей. Вычислите среднее и дисперсию в соответствии с их определениями; проверь- те ваши результаты значений средних и дисперсий по формулам, приведенным в табл. 1. 176
(в) Вычислите значения р (х) при х = 0, 6, 9, и 14 для случаев (3) и (4). Найдите по формулам среднее и дисперсию распределения. (г) Для случаев (3) и (4) напишите отношение р (х + 1)/р (х) и по возможности упростите полученный результат. Воспользуйтесь результатами и вероятностями, найденными в (в) для получения значений р (х) при х = I, 7, 10 и 15. (д) Найдите общую формулу для р (х + 1)/р (х). (е) Разложите биномы по степеням: (1) (3) (р+д)”- Сравните члены разложений (1) и (2) с вероятностями, найденными в (а). Как вы думаете, почему биномиальное распределение назвали именно так? п (ж) С помощью результатов задания (е) докажите, что У, р (х) = 1 для всех х=0 допустимых в биномиальном распределении значений вероятности. 2. Для пуассоновского распределения (названо в честь С. Д. Пуассона (S.D. Poisson), французского математика, 1781—1840) (а) напишите функцию вероятностей для случаев; (1) X = у, (2) Л = 3, (3) Л = 1,5; (б) получите формулу для р (х + 1)/р (х) в случаях (1)—(3) из (а); найдите общую формулу для этого отношения; (в) найдите первые шесть членов в каждом случае из (а). Сравните их с соот- ветствующими членами распределений (1), (2) и (3) задачи 1 (а). Нанесите эти зна- чения на один график. (Заметим, что для любой пары сравниваемых распределе- ний пр = X.); ОО (г) выпишите несколько первых членов ряда 2 р (х). Покажите, что значение х = 0 этого ряда равно ё~откуда и следует, что суммарная вероятность равна 1 для любого Л; (д) проверьте, что в общем случае р = 2хр (х) — 'k. 3. Для геометрического распределения (а) вычислите несколько первых членов распределения, для которого: 1113 (1)р=—, (2)р=—, (3)р=у, (4) р = — . ОО Нарисуйте график распределения. В каждом случае найдите Sp (х); Х=1 оо (б) в общем случае покажите, что 2р (х) = 1; 4 х=1 (в) проверьте формулу для среднего и дисперсии в общем случае; d ( s \ (Замечание. — | --------1 = 1 + 2s + 3s2 + ...) as \1 —s / (г) правильная игральная кость бросается до тех пор, пока не появится шес- терка. Пусть х —число необходимых для этого бросаний (считая и бросание, в ко- тором выпала шестерка). Покажите, что геометрическое распределение представ- ляет собой подходящую вероятностную модель для этого эксперимента. Найдите среднее и дисперсию необходимого числа бросаний. 177
б) Важнейшие непрерывные распределения Таблица 2 Гри непрерывных распределения Название Функция плотности вероятности Р (X) Параметры и возможные значения Среднее Диспер- сия Равномерное или прямо- угольное Ь—а ’ а<х<Ь’ 0 в других случаях a, b‘t (а, Ь) — любой интервал на оси действи- тельных чисел а-|- 6 2 (6—а)2 12 Экспонен- циальное •Ке~Кх, х>0 0 в других случаях X (7.>0) 1 X 1 7.2 Нормальное Или гаус- совское 1 I 1 / *—н\2 j oV-2SeXP| - 2\ а )]’ ОО X <С4~ оо pt, и, — ОО у -|- оо О>0. О2 Упражнение 2.4.7 1. Для равномерного распределения (а) нарисуйте график распределения для случаев: (1) а = 1, b = 3; (2) а = —1, 6 = 3; (3)о = 0, 6 5. Найдите в каждом случае среднее и дисперсию; ' (б) проверьте формулу для вычисления среднего и дисперсии в общем слу- чае. Вычислите Е[(Х — р)8] и Е[(Х — р)4|; (в) на стол с радиусом г падают капли дождя. Пусть х — расстояние от места падения капли до центра стола. Найдите удовлетворительную ф.п.в. для вели- чины х. 2. Для экспоненциального распределения (а) вычислите значение р (х) для х = 0, 1, 2, 3 в следующих случаях: (1) X = 1/2, (2) X = 1, (3)2. = 10. Нарисуйте график этих трех распределений. Определите среднее и дисперсию для каждого случая; (б) чему равен максимум значения р (х) и где он достигается? Покажи гй, что на этой кривой нет точки перегиба; (в) проверьте общую формулу для среднего и дисперсии. 3. Для нормального распределения (а) исследованием ф.п.в. установите, что кривая симметрична относительно прямой х = р; (б) напишите ф.п.в. для случая р = 0, о = 1. Эта функция известна’как стандартная нормальная ф.п.в. С помощью следующей таблицы с ординатами стандартной нормальной кривой постройте ее график: X 0,0 0,2 0,4 0,6 0,8 1,0 1,5 2,0 р(х) | 0,40 0,39 0,37 0,33 0,29 0,24 3 0,13 0,05 (в) следующий интеграл очень важен, его следует запомнить: СО Р / 22 \ __ I exp I — — I dz= Д/2л. 178
С помощью этого интеграла проверьте, что р, и о2 действительно будут средним и дисперсией в общем случае; (Замечание. Воспользуйтесь стандартизирующим преобразованием 2 = (Х — Ц)/О.) (г) приравнивая нулю вторую производную р (х), покажите, что на кривой имеются две точки перегиба х = ±о. в) Полезное обозначение для функций плотности вероятности. Как уже заметил читатель, функции плотности вероятности могут со- держать параметры. Форма и расположение распределения зависят от их конкретных значений. Если такую зависимость от параметров необходимо подчеркнуть и чтобы выделить случайную переменную, удобно пользоваться следующим обозначением для функции плотно- сти вероятности: X сп р (х; а, Ь, с, ...). Эта запись означает, что X «распределено» с ф. п. в. р ( ), перемен- ной является х, а параметрами будут а, Ь,с, ... Параметры распределе- ния записывают буквами после точки с запятой. Часто вместо буквы р для обозначения ф. п. в. употребляют другую, более подходящую по смыслу букву. То же относится и к кумулятивной функции распре- деления. Примеры 1. Биномиальная случайная переменная X cv> b (х; п, р). 2. Пуассоновская случайная переменная X се р (х; X). 3. Нормальная случайная переменная X N (х; р, о2) или просто N (р, о2). 2.4.6. БИНОМИАЛЬНОЕ И НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ а) Биномиальное распределение. Это распределение часто возни- кает при решении практических задач. Иногда его называют также распределением Бернулли (по имени Якоба Бернулли, который открыл его в конце XVII в.). Это распределение возникает естественным образом как вероятно- стный закон последовательности независимых испытаний Бернулли. Испытание Бернулли—это эксперимент, имеющий только два возмож- ных исхода. Как правило, их обозначают буквами S (успех) и F (не- успех). Такие последовательности экспериментов нам уже встречались в гл. 2.1 при определении вероятностей на произведениях пространств. Следующий пример поможет читателю выяснить некоторые важные детали. П р и м е р. Правильную игральную кость бросают 3 раза. Пока- зать, что вероятность получения х = 0, 1, 2, 3 шестерок при трех ис- пытаниях подчиняется биномиальной ф. п. в. (ЗУ. I 1 V / 5 V-* гъ- / 1 V /' 5 ( J (?) (?( ИЛЙ С5 (?) (?) • 179
Решение. Обозначим через S выпадение шестерки в одном испыта- нии, а через F — непоявление шестерки (т. е. F означает выпадение 1, 2, 3, 4 и 5). Выборочным пространством для каждого испытания будет U = {S, F); функция вероятностей р (U) = {1/6, 5/6}. С помо- щью стрелочной диаграммы мы сейчас попытаемся на каждом шаге проиллюстрировать все возможные результаты и соответствующие ве- роятности для трех испытаний (рис. 85). Каждый из восьми объединенных результатов (SSS), (SSF) и т. д. будет точкой произведения пространств Us — U X О X U', поэтому соответствующая вероятность получается умножением вероятностей на каждой ветви, приводящей в точку произведения пространств. Таким образом, Р {(SSS)} = 1/6 • 1/6 • 1/6 = (1/6)3, Р {(SSF)} = (1/6)2х X (5/6)1 и т.д. Исследуем теперь число успехов х, появившихся в трех ис- объеди- Испытания ценный первое второе третье результат Рис. 85 Вероят- выпаданий ность шестерок х 3 РМ’ 2 I'M 2 ('/оУР/вУ 7 Г/вУР/в)' 2 ('/вУР/б)г 7 У/вУР/вР 7 W3 О пытаниях. Как видим, х — 3 только в том случае, когда появляется со- бытие {(SSS)}. Таким образом, Р (х = 3) = Р {(SSS)} = (1/6)3. Собы- тие же х = 2 наступает только при появлении одного из соЗытнй {(SSF)}, {(SFS)} и {(FSS)}. Каждое из этих одноточечных событий имеет вероятность, равную (1/6)2 (5/6)1. Применяя правило сложения- вероятностей, получаем: Р (х = 2) => 3 (1/6)2 (5/6)1. Аналогично най- дем: Р (х = 1) = 3 (1/6)1 (5/6)2 и Р (х = 0) = (5/6)3. Как уже, наверное, читатель заметил, что вероятности будут члена- ми биномиального распределения, которые получаются при разложе- нии бинома (1/6 + 576)3. Упражнение 2.4.8 Для каждой из предлагаемых задач нарисуйте стрелочную диаграмму и вы- числите необходимые вероятности. 1. Правильная монета бросается 6 раз. Чему равны вероятности получить (1) ровно 2 герба, (2) меньше чем 2 герба, (3) больше чем 2 герба, (4) не меныпё чем 2 герба, (5) по крайней мере 2 герба? 2. Шанс А выиграть в одной игре с В равен 2/3. Найдите шанс А выиграть у В в матче из 5 партий (1) ровно 1 раз, (2) по крайней мере 2 раза, (3) ровно 3 ра- за, (4) больше чем 3 раза. I Для решения следующих задач примените формулу биномиального распреде- ления. 180
3. Из колоды 52 хорошо перетасованных карт случайным образом с возвра- щением вынимаются восемь карт. Найдите вероятность того, что среди выбран- ных карт будет 6 червей. 4. Одновременно бросают восемь правильных монет. Покажите, что вероят- ность получения по крайней мере шести гербов равна 37/256. 5. 20% болтов, производимых машиной, оказываются дефектными. При ус- ловии, что случайным образом выбираются 4 болта, найдите вероятности того, что дефектными окажутся (1) 0, (2) 1, (3) 2 или больше болтов. 6. Чему равна вероятность при семи бросаниях пары игральных костей полу- чить в сумме 7 очков (1) дважды, (2) по меньшей мере один раз, (3) больше чем 3 раза. 7. Имеются 200 семей, в каждой по 4 ребенка; каково ожидаемое число се- мей, имеющих (1) трех мальчиков, (2) двух мальчиков и двух девочек, (3) одну девочку, (4) двух пли трех мальчиков? (Примите, что вероятность рождения мальчика равна 1/2.) 8. Вероятность для стрелка, стреляющего по мишени, попасть в «яблочко» равна 1/4. Если стрелок делает 5 выстрелов, найдите вероятности попасть в «яб лочко» (1) 3 раза, (2) больше чем 3 раза, (3) по крайней мере 1 раз. 9. Известно, что для некоторой группы людей 20% из них имеют голубые глаза. При условии, что делается случайный отбор 10 человек, найдите вероят- ности того, что в выборке окажется (1) 4, (2) не меньше 1, (3) по крайней мере 2, (4) меньше чем 3 человека с голубыми глазами. 10. Найдите среднее и дисперсию для каждого из биномиальных распределе- ний в задачах 1—9. ОБЩИЕ РЕЗУЛЬТАТЫ (1) Пусть выполняются п независимых испытаний Бернулли с Р (S) = р, Р (F) = q, р + q = 1 для каждого испытания. Тогда вероятность получения х .успехов и п — х неуспехов в п испытаниях равна Ь(х\ п, р)=~-^П^рх qn~x, х = 0, 1,..., п. Доказательство. Выборочное пространство для каждого испытания будет U — {S, /’}, а каждый возможный результат в п ис- пытаниях является точкой в произведении пространств Un = U X X U X ... X U. Каждая точка из этого пространства имеет вид (SSFS... SF), т. е. каждая координата равна либо S, либо F. Событие Е = «появление х успехов» есть подмножество точек из Un, которое содержит ровно х букв S и и—х букв F. Число таких точек равно числу способов распределения букв S средн п координатных по- зиций. Таким образом, событие Е содержит точек в произведении пространств Un. Предположим, что (SSFS... SF) представляет собой точку этого подмножества. Поскольку испытания независимы, то вероятность, ко- торую мы приписываем этой точке, равна Р (S) Р (S) • Р (F) X X Р (S) • ... • Р (S) • Р (F) = р • р • q - р • ... • р q = рх • qn~x. Каждая точка в Е имеет эту же вероятность; по правилу сложения вероятностей мы получим: Р(Е)= (n^pxqn~x = b(x; п, р). 181
(2) Члены биномиального распределения являются коэффициентами при t разложения производящей функции вероятности (q + pf)n. Доказательство. Раскладывая функцию по биномиально- му закону, получим: (g+ pt')n = qnp°t° + ( J'T"-’ Plfl+ ••• + n X q'l-x pxtx+ ...-\-q°pntn. Как видим, коэффициент при tx для х = 0, 1, 2, п будет ра- вен b (х; п, р). Замечание. Это первый пример с производящей функцией. Эти функции играют большую роль в более серьезных курсах теории. (3) Среднее и дисперсия биномиального распределения равны соот- ветственно пр и npq. Доказательство. Эти результаты можно получить с по- мощью производящей функции вероятности следующим образом: п н= 2 х-р (х) = [-4(9 + рОп1 L at Jt = l о2= у х2-р(х)— р2 = /• —+ —п1 p2----npq. dt j J г = i Читатель может применить метод дифференцирования рядов для проверки результатов, полученных в (2). Упражнение. С помощью метода производящей функции покажите, что Е [(X — р)3] = npq (q — р). Отсюда следует вывод о симметрии распределения при р = q. б) Нормальное распределение. Это распределение наиболее важное как в статистической теории, так и на практике. Распределения боль- шинства случайных переменных реальных экспериментов хорошо при- ближаются к нормальной кривой. Такими хорошо известными экспе- риментами, например, будут: рост людей, ошибки в наблюдениях при экспериментальном измерении, измерения большинства характеристик живых организмов. Результат, известный под названием центральная предельная теорема, помогает объяснить, почему это распределение так часто появляется в статистической работе. Этот результат говорит о том, что многие распределения при определенных условиях прибли- женно такие же, как и нормальное распределение. Эта теорема, а также следствия из нее кратко обсуждаются в гл. 2.6. (1) График стандартной кривой. Общая нормальная ф. п. в. была дана в 2.4.5 (см. табл. 2). Если переменная X имеет среднее р и диспер- сию о2, то »<*<+»• 182
Выразим переменную в стандартных единицах, используя для этого преобразование1 z = (х — р)/о. Мы получим стандартное нормальное распределение с ф. п. в. *и“Йехр(_1г')’ — оо < г < ф-оо. Небольшая таблица значений этой функции была дана в задании 3 упражнения 2.4.7. Нанеся значения z и ф (г) в прямоугольной системе координат, мы получим график этого распределения (рис. 86). Заметим, что вершина, через которую прохо- дит ось симметрии кривой, находит- ся в точке z = 0. (2) Площади под стандартной кривой. Если случайная перемен- ная X подчиняется нормальному закону, то вероятность события «X лежит между а и 6» определяется площадью под кривой между дву- мя значениями координат х = а и х = Ь. Нам часто в статистической работе будет нужно находить та- кие площади; для этого мы будем Рис. 86. График стандартной нор- мальной кривой пользоваться таблицей интегралов нормальной ф. п. в. Следующие величины полезно помнить для практического приме- нения, соответствующие границы показаны на графике, приведенном на рис. 86. (а) 68,3% нормального распределения лежит между — 1 и + 1. (б) 95,4% распределения лежит между — 2 и 4-2. (в) 99,7% распределения лежит между — 3 и 4- 3. Интеграл оо J ехр ——-'j dz=V2n — оо также необходимо запомнить* *. (3) Моменты нормального распределения. Первый момент распре- деления равен его среднему [г. 1 Это преобразование выбирается в результате приравнивания р (х) dx и р (z) dz, при этом dx = adz. z * Таблицы составляются для значений интеграла 1/ ]/2л j ехр (—х2/2) dx, о которые в дальнейшем обозначаются ф (г). Если с помощью этих таблиц необ- ходимо найти площадь под кривой, проходящей над точкой г = 0, то соответ- ствующий интеграл разбивается на сумму двух интегралов (см. пример 1).— Примеч. ред. 183
ПосколькуТраспределепне симметрично относительно х = ц, все нечетные моменты, подсчитанные относительно р, будут равны нулю. Для четных моментов, вычисленных относительно среднего, можно воспользоваться интегрированием по частям, которое приводит к сле- дующей рекуррентной формуле: р2п = (2 п — 1) о2 • р2я-2- Подставляя п = 1, 2, 3 и т. д., получим все четные моменты. Теперь приведем примеры вычислений, связанных с нормальным распределением и таблицами интегралов. Примеры 1,1. Было обнаружено, что оценки, полученные на экзамене большой группой студентов, подчиняются приближенно нормальному закону. Среднее распределения оказалось равным 58, а стандартное отклоне- ние — 10. Рис. 87. Нормальная кривая относительных частот оценок л:=58, s=10 (а) По данной информации нарисуйте график распределения. (б) Переведите следующие оценки в стандартные единицы: 63,41, 58. (в) Переведите следующие стандартизированные оценки в первона- чальные: 2,9; —1,5; 0. (г) При условии, что из группы случайным образом выбирается один студент, найдите вероятность того, что его оценка будет (1) в точности 68, (2) меньше чем 63, (3) больше 41, но меньше 63. Решение. (а) Нам известно, что распределение приблизительно совпадает с нормальным, поэтому оно будет симметричным относительно ор- динаты среднего х = 58. Практически все оценки будут лежать между ординатами х = х — 3s и х = х + 3s, т. е. между х = 28 и х — 88. График кривой оценок показан на рис. 87. (б) Для перевода реальных оценок в ^стандартизированные мы воспользуемся преобразованием z = (х — x)/s. На приведенном гра- фике шкала стандартизированных оценок показана под шкалой реальных оценок. Указанные в задании оценки после преобразова- ния будут равны: 63 —58 п г- Z. =-------= 0,5; 1 10 184
41—58 , _ z2 = —— = — 1,7; 2 10 58—58 n z4 ----------- 0. 3 10 (в) Для обращения стандартизированных оценок в реальные мы должны произвести обратное преобразование, т. е. х = х + s • z: х2 = 58—15 = 43; х3 = 58 4- 0 = 58. (г) (1) Если бы данные были действительно непрерывными, то ве- роятность получить оценку, в точности равную 68, была бы равна нулю. Однако оценки обычно берутся на дискретной шкале 0, 1, 2, ..., 100 и непрерывное нормальное рас- пределение будет только ап- проксимацией истинного ди- скретного распределения, оп- ределенного на этой шкале. Таким образом, Р (х = 68) приближенно можно выра- зить площадью под нормаль- ной кривой между значения- ми координат х = 67,5 их — 68,5, как показано на рис. 88. Для того чтобы вычислить эту вероятность, необходимо сначала перевести по- лученные пределы в стандартные единицы; они легко находятся и бу- дут равны 0,95 и 1,05. Тогда Р (х = 68) » Р (0,95 1,05) = Ф (1,05) — Ф (0,95) = 0,3531 — — 0,3289 - 0,0242. Замечание. В случае, когда исходные данные дискретны или когда непрерывные данные были округлены, пределы для вычисления интеграла вероятности должны быть найдены таким же образом. (2) Требуемая вероятность будет численно равна площади под нор- мальной кривой между — оо и 63,5 (обратите внимание на верхний предел,’ смЛрис. 89). Преобразуя эти пределы в стандартные единицы с помощью таблицы нормального интеграла, (мы найдем,'^что интере- сующая нас площадь будет равна 0,5 + Ф (0,55) = 0,7088, таким образом, Р (х С 63) « Р (z < 0,55) = 0,7088*. * Обратите внимание, что] Р (г С 0) = G,5, поэтому Р (г < 0,55) = Р (г < 0) Т Ф (0,55) == 0,5 + 0,2088 = 0,7088. — Примеч. ред. 185
(3) На этот раз нам необходимо найти площадь в пределах х = 40,5 их — 63,5 (рис. 90). Переводя эти пределы в стандартные единицы, получим, что они равны соответственно — 1,75 и 0,55. Далее имеем Р (41 С х С 63) « Р ( — 1,75 С г С 0,55) = Ф (0,55) + Ф ('— 1,75) Таблицы дают значения Ф (г) только для г > 0. Однако легко видеть, что в силу симметрии кривой ф ( _ г) = ф (г). Поэтому необходимая вероятность будет равна Р (41 < 63) = Ф (0,55) + Ф (1,75) = 0,2088 + 0,4599 = 0,6687. 2. Средний рост 1000 солдат равен 1,81 м со стандартным отклоне- нием 50 мм. Измерения производились с точностью до 10 мм. Предпо- Рис. 90 ложив, что рост подчиняется нормальному распределению, оцените число солдат в группе, рост которых (1) больше или равен 1,87 м, (2) лежит между 1,72 м и 1,80 м. Решение (1) Поскольку измерения были округлены (до ближайших 10 мм), нам требуется найти число солдат, рост которых равен 1,865 м и больше. Переводя 1,865 м в стандартные единицы, мы получим: t 1,865—1,81 . . г =----------=1,1. ' 0,05 Из рис. 91 видим, что доля солдат с ростом не меньшим чем 1,87 м будет равна 0,5 — Ф (1,1) = 0,5—0,3643 = 0,1357. Таким образом, среди 1000 солдат ожидаемое число солдат с инте- ресующим нас ростом будет равно 0,1357 • 1000 « 136. (2) Доля солдат с ростом между 1,72 м и 1,80 м численно будет рав- на площади под нормальной кривой между 1,715 м и 1,805 м (рис. 92). Стандартизированные пределы равны — 1,9 и — 0,1, а искомая шки щадь показана на графике. Таким образом, доля солдат с ростом меж- ду 1,72 м и 1,80 м будет равна Ф (1,9) — Ф (0,1) = 0,4713—0,0398 = 0,4315. ’86
Число солдат в группе с ростом между указанными пределами (если их распределение по росту нормальное) будет равно 0,4315 х X 1000 « 432. Рис. 92 Упражнение 2.4.9 1. Распределение оценок на экзамене по математике приближенно совпадает с нормальным распределением со средним 50 и стандартным отклонением 12. (а) Нарисуйте кривую распределения, (б) Стандартизуйте следующие оцен- ки: 25, 73, 41, 50, 62 и 38. (в) Переведите следующие стандартные оценки в реаль- ные: 1; 3,2; —0,5; —0,75; 0 и 2,2. (г) С помощью таблиц найдите вероятность того, что студент получит (1) меньше 40 баллов, (2) больше 56, (3) его оценка будет лежать между 50 и 60 баллами, (4) равна 45. (Замечание. Прежде чем пользоваться таблицами, читателю рекомен- дуется нарисовать от руки график распределения, найти и заштриховать необ- ходимую площадь.) 2. В нормальном распределении со средним 5 и S.D., равным 2, найдите (а) значение х, для которого 40% значений не превышают его, (б) значение х, такое, что вероятность попасть в интервал (4, х) равна 0,53, (в) значение х, для кого рого площадь над интервалом (х, 6) равна 0,58. 3. Было установлено, что длина среднего пальца руки мужчины для некото- рой группы людей подчиняется нормальному закону со средним 60 мм и стандарт- ным отклонением 3 мм. Измерения проводились с точностью до 1 мм. Предполо- жив, что в группе 800 человек, найдите, у скольких из них средний палец (а) длиннее 62 мм, (б) короче 57 мм, (в) длиной между 60 мм и 66 мм, (г) длиной 58 мм. 4. Допустим, измерения нормально распределены. Чему равен процент из- мерений, отличающихся от среднего (а) больше чем на одну четверть стандарт- ного отклонения, (б) меньше чем на половину стандартного отклонения? 5. Нормальное распределение имеет среднее 15 и S.D., равное 3. Найдите площади под кривой между следующими парами координат: (а) х = 15 и х = 16; (б) х = 13 и х = 15; (в) х = 12,6 и х = 16,4; (г) х = 9 и х = 21. 6. В нормально распределенной совокупности 15% значений х меньше 12 и 40% значений х имеют значения, большие 16,2. Найдите среднюю и стандарт- ное отклонение распределения. 7. При условии, что 49% значений нормально распределенной совокупности лежит между средним, равным 83, и значением х = 99, найдите стандартное от- клонение совокупности. . 8. Коробки с шоколадом упаковываются автоматически; их средний вес равен 1,06 кг. Если только 5% коробок имеют вес меньше 1 кг, найдите стан- дартное отклонение, предполагая, что вес коробок распределен нормально. 187
2.4.7. СВЯЗЬ МЕЖДУ БИНОМИАЛЬНЫМ , ПУАССОНОВСКИМ И НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЯМИ Существует несколько замечательных соотношений (очень полез- ных на практике), связывающих между собой биномиальное, пуас- соновское и нормальное распределения. Можно показать, что при не- которых условиях на пир пуассоновское распределение представимо предельной формой биномиального распределения, а нормальное рас- пределение получается из каждого из этих двух распределений. а) Получение пуассоновского распределения из биномиального. Покажем, что биномиальная функция вероятностей b (х; п, р) стремит- ся к пуассоновской функции вероятностей р (х; X) при неограниченном увеличении п и одновременном стремлении р к нулю, причем пр остает- ся постоянным числом (равным X). Так как пр = X, то , , . । п\ г/. х п (п—1).. .(п—х-р 1)/X \* , . X о(х; п, р) = рл(1—р) = — -----------— ---------- — 1 —— I \ х ) х! \ П J \ П J (подстановка р = X/n, X — константа). Правую часть последнего равенства можно представить в виде Устремляя п к бесконечности, мы видим, что первый член в произве- дении стремится к е~\ второй остается постоянным и равным Х-*7х! (х — считается фиксированным целым), а все оставшиеся сомножите- ли (их конечное число) стремятся к 1. Таким образом, предел b (х; п, р) равен е~к Х*/х1, а это и есть р (х; X). Пуассоновская функция вероятностей вычисляется в общем слу- чае значительно легче; проще ею оперировать и с математической точки зрения. Поэтому важно установить условия, при которых вмеЬго биномиальной функции можно приближенно рассматривать пуас- соновскую. Положительный ответ будет в случае, если р достаточно мало (на- пример, меньше чем 0,1), а п достаточно велико (скажем, больше 50), откуда пр 5, т. е. при этих условиях вместо биномиальной функции приближенно можно рассматривать пуассоновскую (с X = пр). Эти условия, разумеется, не являются абсолютно точными, однако если они выполняются, то приближение будет очень хорошим. Вместе с тем в зависимости от специфических целей исследования можно вос- пользоваться такой аппроксимацией и для п < 50. Чтобы оценить, насколько хороша будет аппроксимация в случае достаточно редких событий (т. е. когда р мало), сравните значения функций b (х\ 20; 0,05) и р (х; 1) в табл, на с. 189. б) Получение нормального распределения из биномиального (и пуассоновского). Пусть X будет биномиальной случайной перемен- ной с параметрами п и р. Можно показать, что если п достаточно вели- ко и ни р, ни (1 — р) не очень малы, то распределение X хорошо ап- 188
X Распределения X Распределения биномиальное /9=0,05, н —20 пуассоновское Х=1 биномиальное р=0,05, п — 20 пуассоновское К = 1 0 0,3585 0,3679 5 0,0133 0,0153 1 0,3774 0,3679 6 0,0022 0,0031 2 0,1887 0,1839 7 0,0003 0,0005 3 0,0596 0,0613 8 0,0000 0,0000 проксимируется нормальным распределением, имеющим стандартизи- рованную переменную Z = (X — np)P/npq. Этот результат представ- ляет собой одну из форм центральной предельной теоремы; доказатель- ство этого утверждения можно найти в [13]. С увеличением п аппрокси- мация улучшается и в пределе она становится абсолютно точной. В качестве практического руководства можно сказать, что если и пр, и п (1 — р) больше 5, то соответствующая нормальная функция будет очень хорошим приближением к биномиальной. Наконец, поскольку пуассоновское распределение может быть по- лучено из биномиального (см. 2.4.7, а) ), то между пуассоновским и нормальным распределением также существует аналогичная взаимо- связь. В самом деле, можно показать, что если X — пуассоновская переменная с параметром X, то при X -> оо распределение X будет стремиться к нормальному распределению, имеющему стандартизи- рованную переменную Z = (X — X)/VX. Примеры I. Некоторая сложная система состоит из 100 взаимосвязанных компонент. При условии, что каждая компонента имеет вероятность выйти из строя, равную 0,03, требуется найти вероятность того, что ровно четыре компоненты сразу выйдут из строя. Решение. Разыскиваемая вероятность определяется значением функ- ции b (х; п, р) при х = 4, п — 100, р = 0,03. Таким образом, Р [число вышедших из строя компонент равно 4] = ^4^ ' (0,03)4 (0,97)96 = = 0,171. Поскольку р < 0,1, и > 50 и пр </ 5, мы можем восполь- зоваться пуассоновским распределением как аппроксимацией к ис- ходному. Поэтому X4 Р [число вышедших из строя компонент равно 4] л; е~3 • = = 0,168, где X = пр = 3. 2. Предположим, что вероятность для некоторого орудия попасть в танк при одном выстреле равна 1/2. Требуется найти вероятность того, что при 10 выстрелах из орудия будут поражены ровно 4 танка. При этом используйте (а) биномиальное распределение, (б) нормаль- ную аппроксимацию. Полученные два результата сравните. Решение. При каждом выстреле вероятность успеха р = 1/2. 189
(а) биномиальное распределение: /10\ /1 V / 1 \6 Р [при 10 выстрелах будут подбиты ровно 4танка]=( 4 I I ~ I 1~1 = = 0,2051. (б) Нормальная аппроксимация. Нормальная кривая с р = пр = 5 и ст2 = npq = 2,5 показана на рис. 93. Мы будем рассматривать пло- щадь под этой кривой в промежутке между Хх=3,5 и х2 = 4,5 в качест- ве аппроксимации к биномиальной вероятности Ь (4; 10, 1/2).' Стандартизированные значения х будут следующими: 21 = .3’^ = —0,9486 и z2- 4,5Z.5 = —0,3162. /2.5 2 1/2,5 1 2 3 't 5 S 7 8 S JO X Числе подбитых танков Рис. 93 Поэтому Р [ровно 4 танка будут подбиты] ж Ф (z2) — Ф (zj = = 0,2038. Найденные значения очень близки, несмотря на небольшое значе- ние и, равное 10. Упражнение 2.4.10 _ 1. Некоторое произведете выпускает детали, 10% из которых дефектны. Производится случайная выборка 20 деталей. Найдите вероятности того, что в данной выборке окажутся бракованные детали: (1) 1, (2) 2, (3) меньше 4. Восполь- зуйтесь (а) биномиальным распределением, (б) его аппроксимацией пуассоновским распределением, (в) нормальным распределением. Сравните ваши результаты,- 2. Известно, что в среднем 3% электрических лампочек, производящихся некоторой фирмой, бракованные. Найдите вероятности того, что в выборке из 30 обследуемых лампочек будут бракованными (1) 0, (2) 1, (3) 2 лампочки. Эти вероятности вычислите с помощью биномиальной функции и соответствующего приближения пуассоновским распределением. Результаты сравните. 3. С помощью аппроксимации биномиального распределения нормальным найдите вероятности того, что в 80 бросаниях правильной монеты (1) будет точно 39 гербов, (2) число решеток будет лежать между 35 и 50 включительно, (3) будет меньше 30 гербов, (4) будет больше 44 решеток. 4. Для заданий 3, 4, 6 и 9 из упражнения 2.4.8 вычислите соответствующие вероятности с помощью аппроксимации биномиального распределения нормаль- ным. Сравните ваши результаты с точными значениями вероятностей. 190
2.5 ГЛАВА ВЫБОРКА 2.5.1. ЦЕЛЬ ВЫБОРКИ Если исследователь повторит эксперимент несколько раз, он полу- чит выборку измерений или наблюдений явления, которое он изучает. Предположим, по результатам этой выборки он хочет сделать общие выводы об этом явлении. При этом исследователь понимает, что каж- дое наблюдение содержит ошибку1, которая может возникнуть, на- пример, из-за погрешностей в лабораторных приборах или же из-за присутствия случайных помех в самом явлении. Например, если изме- рять изменение в длине металлического бруска в соответствии с из- вестным изменением его температуры, то измерения будут несколько отличаться от эксперимента к эксперименту. Эти отличия могут быть объяснены либо несовершенством измерительных приборов, либо не- равномерностью температуры бруска, либо изменением влажности и давления воздуха в лаборатории, либо, наконец, неоднородностью материала. Если будет возможно, исследователь, конечно, попытается устра- нить случайные помехи и изменить эксперимент так, чтобы в конце исследования явления можно было определить суммарный эффект та- ких колебаний или случайностей. Случайности, для которых это можно сделать, называются оцениваемыми помехами. В каждом эксперименте всегда присутствуют помехи, которые вызывают колебание результатов эксперимента. Отдельное наблюде- ние, как правило, принадлежит некоторой гипотетической неограни- ченной совокупности, которая организована в соответствии с некото- рым законом, называемым распределением совокупности. Каждое наблюдение, производимое исследователем, дает дополнительную ин- формацию о расположении и виде распределения. Итак, цель повторения наблюдений (т. е. получения выборки), как видим, состоит в том, чтобы иметь возможность сделать определенные утверждения о распределении совокупности. На основе информации, полученной из выборки, можно прийти к заключению о величине ее параметров. Обычно в оценивании нуждаются такие параметры рас- пределения, как среднее, дисперсия, коэффициенты асимметрии и эксцесса. 1 Слово (ошибка» в статистике понимается в смысле «отклонение» или «раз- брос» около истинного значения. 191
Для того чтобы быть уверенным в правильности наших оценок и выводов, надо быть уверенным в том, что наша выборка является репрезентативной (представительной) выборкой всей совокупности. Очевидно, чем больше наблюдений в нашей выборке, тем больше мож- но доверять сделанным на ее основе выводам. Теория выборки занимается такими вопросами, как установление репрезентативности выборок совокупности, изучение видов выборок, которые можно получить из данной совокупности, эффект изменения размера (объема) выборки, определение наилучших способов оценива- ния параметров совокупности, определение степени уверенности в по- лученных выводах. Это краткое введение в теорию выборки мы закончим некоторым довольно занятным (гипотетическим) примером, на котором будет вид- но, насколько выводы, сделанные по выборке, могут отличаться от истины. Предположим, что марсианский космический корабль впервые приземлился в центре Африки. Приземлившись в районе диких джунг- лей, экипаж марсианского космического корабля производит наблю- дение за растительным миром в этой окрестности, записывает состав, температуру, влажность и давление атмосферы, обследует пойманных трех детей пигмеев. Возвратившись на Марс, исследователи несколько недель анализируют собранные данные и по результатам анализа де- лают доклад. Основные выводы будут следующими: Земля покрыта непроходимыми джунглями, атмосфера Земли плотная с высокой тем- пературой, Земля населена голыми людьми с черной кожей, средний рост которых равен 1 м. Можно возразить, что ни один ученый, принимающий участие в кос- мическом полете, не будет делать подобных скоропалительных выводов. Может быть, это и так. Однако, к сожалению, некоторые бизнесмены, политики, генералы, инженеры и даже ученые, которые не знакомы с теорией выборки, зачастую еще делают подобные преждевременные заключения. А потом они удивляются тому, что прогнозы, получен- ные на основе этих выводов, расходятся с результатами дальнейших проверок и экспериментов. 2.5.2. ВИДЫ ВЫБОРОК Проблеме получения наилучшей выборки из данной совокупности посвящена обширная литература. Производя выборку, необходимо продумать целый ряд вопросов. Прежде всего должен быть определен объем выборки, который зависит не только от суммарной информации выборки и удовлетворительной степени уверенности в получаемых выводах, но зависит также и от затрат на процесс построения выборки. Многие проверки при контроле качества ведут к порче товара, из которого производится выборка. Например, при исследовании распре- деления времени безотказной работы нового типа телевизионных тру- бок (или лампочек, детских моторчиков и т. д.) необходимо сделать выборку, каждый элемент которой работает при нормальных усло- виях£до выхода из строя. Такие тесты,’очевидно, сопряжены с боль- 192
шими затратами времени производителя, поэтому размеры выборки, производящейся для проверки качества с порчей исследуемого то- вара, должны быть по возможности сведены к минимуму. Вопрос определения размера выборки нами будет рассматриваться позднее. Коротко остановимся на аспектах организации выборки. Как мы в действительности решаем, какие из элементов совокупности должны быть взяты для нашей выборки? При изучении некоторого явления исследователь при контроли- руемых условиях многократно выполняет эксперимент, и последова- тельность наблюдений образует его выборку. Например, контролер качества продукции, исследуя производство, на котором за час каждая машина выпускает, скажем, 200 единиц товара, может в конце каждого часа с каждой машины брать для проверки по десять единиц товара. Менеджер по продаже некоторого вида товара при обследовании рын- ка с целью получения информации о продаже исследуемого товара имеет гораздо более широкий выбор методов обследования. Делать ли выборку обследуемых людей по телефонному справочнику и зада- вать соответствующие вопросы по телефону? Может быть, лучше адре- са людей выбрать по избирательным спискам и анкеты посылать по почте? Или послать помощников на улицу и прямо задавать вопросы прохожим? Эти проблемы осложняются еще и тем, что выборка может охватывать либо всю страну в целом, либо быть региональной, либо локальной. Кроме того, целью выборки может быть как обследование определенной социальной группы, так и обследование нескольких групп. Каков бы ни был план получения выборки, первым, самым главным условием должно быть требование, чтобы выборка давала по возмож- ности наиболее правильную картину всей совокупности, из которой эта выборка производилась. Все элементы выборки должны получать- ся на основе случайного отбора по некоторым объективным правилам; экспериментатор не должен доверяться своей интуиции и на основе этого производить выборку, которая, как он думает, будет несмещен- ной. Например, контролер качества, производя самостоятельно вы- борку производимого товара (скажем, 15-миллиметровых болтов), мог бы интуитивно выбирать только подозрительные болты, полагаясь на свою интуицию. В таком случае его выборка содержала бы относи- тельное чисто плохих болтов, большее, чем во всей совокупности, а ру- ководители производства беспричинно решили бы произвести ремонт машин, выпускающих эти болты. Опишем два метода выборки, обеспечивающие случайность и гаран- тирующие репрезентативность выборки. а) Простая случайная выборка. Простейшей формой выборки бу- дет выборка, которая состоит из элементов, отобранных из совокупно- сти таким образом, что каждый элемент совокупности имеет одинако- вый шанс попасть в выборку. Выборка, получаемая таким способом, называется простой случайной выборкой. Один из способов получения простой случайной выборки из конеч- ной совокупности заключается в том, что каждому элементу совокупно- сти ставят в соответствие билет с номером (т. е. лотерейный билет); 7 Зак. 873 193
все билеты помещают, например, в шляпу, трясут ее и выбирают тот элемент совокупности, который соответствует извлеченному билету. Вместо билетов и шляп чаще используют таблицу случайных чисел, состоящую из цифр от 0 до 9, расположенных таким образом, что любая цифра имеет одинаковый шанс появиться на случайно выбранном мес- те таблицы. С помощью такой таблицы, как показано в примере, мо'ж- но легко получать случайную выборку из занумерованной совокуп- ности. Пример. Произвести простую случайную выборку объема 5 из группы в 30 студентов. Предположим, что студенты по журналу зану- мерованы от 1 до 30. Решение. Обратимся к таблице случайных чисел. Выберем первое число (для того чтобы обеспечить случайность выбора, можно, напри- мер, закрыть глаза и определить это число методом «тыка»). Предпо- ложим, что, читая по строке (или по столбцу), начиная с этого места, мы обнаружим следующие числа: 01, 53, 25, 73, 49, 82, 35, 15, 10, 32, 97, 08, ... В последовательности выбранных чисел отберем лежащие между 1 и 30, а остальные не будем принимать во внимание. Числа, которые подходят нашей задаче, подчеркнем. Таким образом, выбранные сту- денты будут под номерами: 1, 25, 15, 10 и 8. Упражнение 2.5.1. 1. Возьмите любую книгу, относящуюся к художественной литературе, и оп- ределите в ней число страниц. С помощью случайных чисел произведите из этой книги выборку объемом 20 страниц. 2. Поставим себе задачу исследовать распределение числа слов в предложе- ниях, употребляемых автором книги, о которой говорится в задании 1. На каждой из 20 страниц случайно выберите одно предложение следующим способом. С по- мощью случайных цифр выберите строку на странице, возьмите предложение в этой строчке или первое предложение, которое начинается в ней. Подсчитайте число слов в выбранных 20 предложениях; вычислите среднее и дисперсию выбор- ки. 3. Повторите задания 1 и 2 из этого упражнения для (1) научно-технической книги, (2) книги по истории. Сравните ваши результаты для трех случаев. 4. Произведите случайную выборку объемом 20 фамилий из телефонного справочника следующим образом. Сначала выберите 20 страниц, а потом на каж- дой странице выберите строчку. б) Стратифицированная случайная выборка. Часто бывает возмож- но разбить элементы совокупности на страты (группы) соответственно по некоторым характеристикам. Например, при обследовании спроса на некоторый товар исследуемую совокупность желательно разбить на группы, различающиеся по величине дохода, социальной принад- лежности или же по географическому местоположению. Если произведена подобная разбивка совокупности и случайная выборка производится отдельно из каждой группы, то полученное множество наблюдений называется стратифицированной случайной выборкой. 194
Предположим, имеется k групп, причем число элементов в этих группах равно соответственно Nlt N2, Nh. Если nt, n2, nh—- число наблюдений соответствующих групп, то общее число наблюде- ний будет равно и = гц + п2 + ... + nk. Можно показать, что для большинства целей наиболее эффектив- ным будет такой способ отбора, при котором числа пъ п2, , nh выб- раны так, что «1 П2 __ П/> __ п /\Ц ~ N2 Nh ~N‘ Если эти числа подобраны именно таким образом, то выборку назы- ваем пропорциональной стратифицированной выборкой. Для оценивания стратифицированные выборки значительно эф- фективнее, чем простые выборки; усилия, необходимые для страти- фикации совокупности, окупаются потом хорошими результатами. Упражнение 2.5.2. Рассмотрим совокупность, состоящую из людей одного из городов с фамилия- ми Браун, Хилл, Джонс, Джексон, Тёрнер, имеющих собственный телефон. По телефонной книге получите из этой совокупности пропорциональную стратифи- цированную выборку объема 50 (разбиение на группы производите по соответст- вующим фамилиям). 2.5.3. ВЫБОРКА МЕТОДОМ МОНТЕ-КАРЛО Для сложных процессов часто бывает невозможно получить доста- точное количество выборок. Это может происходить из-за больших затрат на осуществление таких выборок или же при невозможности повторения процесса. Тогда на помощь может прийти раздел матема- тики, изучающий теоретические аспекты многошаговых процессов. С помощью метода, позволяющего получить моделированную вы- борку, соответствующие процессы можно выполнять многократно «на бумаге» и таким способом быстро и точно накопить большое коли- чество ценной информации об их результатах. Этот метод основывается на предположениях о распределении ве- роятностей для переменных, участвующих на различных ступенях изучаемого процесса. После этого применяют таблицы случайных чисел, обеспечивающие репрезентативность выборок из принятого в качестве гипотезы распределения. В итоге возникают различные чис- ленные реализации процесса, совместное рассмотрение которых дает возможность изучить его особенности. Такой метод получения выбо- рок сложных процессов называется методом Монте-Карло. Далее описан метод получения репрезентативной выборки из пространства с заданным вероятностным законом. а) Метод получения случайной выборки. Пусть случайная перемен- ная X имеет кумулятивную функцию вероятности F (X). Тогда пере- менная х может быть случайным образом получена из выборочного пространства путем осуществления следующих шагов: 7* 195
1) Нарисуем график кумулятивной вероятности F (х). Эту кривую часто называют огивой. 2) Выберем непосредственно по таблице случайных чисел случай- ную десятичную дробь у (с необходимым числом разрядов) из равномер- ного распределения на интервале [0, 1] (см. 2.5.2, а)). 3) С помощью огивы определим значение х, соответствующее деся- тичной дроби у. Таким образом, найдем*: х — F-1 (у). Это значение х возьмем в качестве значения выборки. Рис. 94 иллюстрирует этот шаг 4) Повторяем шаги 2 и 3 Рис. 94 столько раз, сколько это не- обходимо. Полученная сово- купность значений х и будет случайной выборкой из дан- ного распределения. б) Проверка метода. Для оправдания метода, изложен- ного в 2.5.3, а), необходимо показать, что значения х, найденные таким образом, подчиняются распределению, соответствующему выбранно- му вероятностному закону. Все рассуждения будут произведены для дискретной функции вероятности, пространство исхода в которой со- держит только три точки. Обобщение доказательства на пространст- во с п исходами очевидно. Пусть распределение вероятностей имеет следующий вид: X = {хъ х2, х3}, р (X) = {рг, р2, р3}. Кумулятивная функция распределения изображена на рис. 95. Ясно, что длины отрезков ОА, АВ, ВС равны соответственно ръ р2, р3. Если случайным образом выбирается десятичная дробь у, то вероят- ность ее попадания в отрезок О А равна р±. Но когда у попадает в О А, то соответствующим элементом выборки будет xt. Таким образом, Р (выборочное значение X = хг) = Р (у попадает в^О/1) = рг, что и требовалось доказать. Аналогично, можно показать, что Р (X = х2) = р2 и Р_(Х = х3) = р3. Для непрерывных распределений с ф. п. в. f (х) и к. ф. р. F (х) до- казательство выглядит следующим образом (рис. 96): Р (выборочное значение х лежит в интервале (х, х -j- dx)) = Р (у попадает в dy) = = р (у) dy — dy (поскольку**/? (у) = 1) = dF (х) = / (х) dx (поскольку dF (x)/dx = f (х)). Таким образом, выборочные значения имеют ф. п. в. / (х), что и требовалось доказать. * 77-1 обозначает функцию, обратную функции F. Так как функция F мо- нотонна, то у нее существует обратная, т. е. значение х = F-1 (у) будет единст- венным. — Примеч. ред. ** Значения десятичных дробей распределены на отрезке [0, 1] равномерно с плотностью р (у) = 1. — Примеч. ред. 196
в) Применение таблиц. Использование случайных чисел. Чтобы про- извести случайную выборку из равномерного (прямоугольного) рас- пределения, определенного на интервале от х = а до х — Ь, мы посту- паем следующим образом: 1) производим выборку случайных десятичных дробей по таблице случайных чисел; 2) умножаем каждую дробь на (Ъ — а) и к полученному результату прибавляем а. Числа, полученные по такому способу, образуют выборку с требуе- мыми свойствами. Упражнение 2.5.3 • 1. Покажите правильность сформулированного выше метода построения равномерно распределенной на интервале (а, Ь) случайной выборки с помощью преобразования х = (Ь — а)у -|- а, где у — десятичная случайная дробь. (Най- дите отсюда выборочное пространство и ф.п.в. для х). 2. Примените этот метод для получения случайной выборки объемом 20 из прямоугольного распределения, заданного на (1) интервале (—1, -pl), (2) интер- вале (4, 8). Нарисуйте график, найдите среднее и стандартное отклонение полученных выборок.Сравните ваши результаты со средним и S.D. распределения совокуп- ности. Использование случайных нормальных отклонений. С помощью таблиц в конце книги сразу определяются значения случайной выборки, произведенной из стандартного нормального распределения. Эти значения называют случайными нормальными отклонениями. Поскольку они соответствуют совокупности с нулевым средним и S. D., равным единице, с помощью простого преобразования из них можно получить выборку для совокупности со средним (г и S. D., равным о. Это можно сделать следующим способом: 1) производим выборку случайных нормальных отклонений из стандартной таблицы; 2) умножаем каждое значение на о и прибавляем к полученному результату р. Множество чисел, построенное по такому способу, будет случайной выборкой из интересующего нас распределения. Пример Известно, что точки попадания пуль при стрельбе по мишени из некоторого оружия распределены по двумерному нормальному закону. Имеется такая информация: 1) цель представляет собой квадрат площадью 100 мм2. Воображае- мые оси координат расположены в его центре, как показано на рис. 97; 197
2) горизонтальные отклонения точек попадания в цель (х) нормаль- но распределены со средним 40 мм и S. D. = 40 мм. Среднее х = 40 означает, что либо стрелок неправильно целится (берет правее), либо Рис. 97. Рассеяние пуль на мишени прицельные приспособления ружья смещены вправо. Возможно также, что на стрельбу оказывают влия- ние некоторые внешние условия (например, ветер, смещающий нор- мальную траекторию пули); 3) вертикальные отклонения точек попадания пуль (у) нормаль- но распределены со средним 0 и S. D., равным 30 мм; 4) х и у распределены незави- сима. Для получения моделированной выборки десяти выстрелов по мише- ни следует воспользоваться таблицей случайных нормальных отклоне- ний. Найти долю выстрелов, попадающих в цель. Решение. Каждая точка попадания определяется своими координа- тами (х, у), где хиг/ распределены, как указано в п. 2) и 3). ~ х — 40 у — 0 Когда и = —эд— и v — - Зр- будут независимыми нормальными стандартными отклонениями. Из таблиц выберем десять пар случай- ных нормальных отклонений, которые соответствуют десяти точкам (ц, и). Каждая из выбранных пар переходит в пару (х, у) при преобразо- вании х = 40 и + 40, у = 30 V. Так можно построить моделированную выборку десяти точек попадания. Точка попадания будет лежать внутри квадратной мишени, если одновременно — 50 х 50, — 50 <1 у 50; с помощью этих не- равенств легко проверить, какой из моделированных выстрелов пора- зит цель. Далее в таблице приводятся возможный вариант выборки и соот- ветствующее ей решение. Выстрел Пара случайных нормальных отклонений Координаты точек попадания Результат выст- рела (попадание в цель или непопадание) и 1 X 1 « 1 —2,761 —0,923 —70,44 —27,69 Нет 2 0,440 0,318 57,60 09,54 Нет 3 0,210 0,624 48,40 18,72 Да 4 —0,996 —2,841 00,16 —85,23 Нет 5 — 1,693 0,281 —27,72 08,43 Да 6 —1,463 —0,631 —18,52 — 18,93 Да 7 —0,058 0,582 37,68 17,46 Да 8 —0,913 —0,713 03,48 —21,93 Да 9 —0,494 0,631 20,24 18,93 Да 10 — 1,447 —0,182 — 17,88 —05,46 Да Доля попадания в цель равна 0,7. 198
Упражнение 2.5.4 1. С помощью метода Монте-Карло произведите случайную выборку объемом 10 из следующих совокупностей: (1) нормальная со средним 0 и S.D. = 3; (2) нормальная со средним 3 и S.D. = 1; (3) нормальная со средним —2 и S.D. = 4; (4) нормальная со средним 1,5 и S.D. = 10; (5) прямоугольная на интервале [3,81; (б)прямоугольная на интервале [—2,1]; (7) пуассоновская со средним 1 (с помощью таблицы случайных чисел, пуас- соновской огивы или таблицы кумулятивного распределения); (8) пуассоновская со средним 3; (9) экспоненциальная с ф.п.в. 2е—2(, 0 < t < +<xj (нарисуйте огиву); (10) экспоненциальная с ф.п.в. 0 < t < +°°; (11) биномиальная с п = 4 и р = 1/2; (12) биномиальная с п = 6 и р = 1/4. 2. Покупатели в универсальном магазине подходят к кассе таким образом, что время между двумя последовательно подходящими покупателями подчиняет- ся экспоненциальному распределению со средним 1. Если ожидающих нет, то покупатель обслуживается сразу, в противном случае он становится й очередь. Время обслуживания покупателей подчиняется экспоненциальному распре- делению с ф.п.в. 2e~2t. Используя случайную выборку, найденную в заданиях 1(9) и 1(10), смоде- лируйте очередь и ее обслуживание для десяти покупателей. Составьте таблицу, содержащую время подхода каждого покупателя к кассе, время начала и оконча- ния его обслуживания, продолжительность ожидания в очереди, общее время на ожидание и обслуживание. Нарисуйте график числа людей в очереди в зависимости от времени t. Вы- числите среднее время, которое тратит покупатель (1) на ожидание в очереди, (2) на обслуживание у кассы, (3) на ожидание и оплату покупки. 3. Выполните предыдущее задание, используя случайные выборки: найден- ную в задании 1(9) — для времени подхода покупателей ив 1(2) — для времени обслуживания (если появится отрицательное число, возьмите t = 0). 4. Выполните задание 2, взяв для времени обслуживания случайную выбор- ку, найденную в задании 1(10). 5. Предположим, что распределение времени безотказной работы телевизион- ных трубок нормально со средним 24 месяца и S.D., равным 6 месяцам. Если вы покупаете новый телевизор и пользуетесь им десять лет, сколько в среднем вам надо будет купить трубок за этот период? Проследите за работой десяти (или более) телевизионных приемников за 10- летний срок, пользуясь таблицей случайных нормальных отклонений или мето- дом огивы. Усредните полученные результаты. 6. Было найдено, что время службы шин автобусов городского транспорта до их изнашивания подчиняется распределению вероятностей, определяемому по следующей таблице: Время до изнаши- вания шин (в меся- цах) <6 8 10 12 14 16 18 20 22 24 Кумулятивная веро- ятность 0,01 0,06 0,18 0,33 0,53 0,76 0,91 0,95 0,98 1 Оцените число замен шин, необходимых для 10 автобусов за двухлетний пе- риод, при следующих условиях: (1) вначале автобус имеет все четыре шины новые; (2) временем отказа автобуса пренебречь; (3) износ одной шины не зависит от других. (Это «плохое» предположение в том случае, если шины заменяются не одинаково часто.) 199
26 ВЫБОРОЧНЫЕ ГЛАВА РАСПРЕДЕЛЕНИЯ 2.6.1. ВЫБОРОЧНЫЕ СТАТИСТИКИ С помощью значения х, принадлежащего некоторой выборке (хх, х2, ..., хп) из совокупности, мы хотим получить информацию о всей совокупности в целом. Например, нас может интересовать центр рас- пределения, и для этого целесообразно взять выборочное среднее х в ка- честве оценки соответствующего среднего значения совокупности р. Аналогично для оценивания дисперсии всей совокупности о2 мы можем воспользоваться выборочной дисперсией s2. Значения х и s2 представляют собой функции наблюдаемых значе- ний хъ х2, ..., хп; подобные функции называются выборочными статис- тиками. Неизвестные параметры всей совокупности, такие, как среднее, ме- диана, дисперсия и коэффициент асимметрии, должны оцениваться с по- мощью выборочных статистик, которые с ними тесно связаны.. Выбор подходящей оценки для некоторого параметра совокупности — одна из проблем теории статистического оценивания. Чтобы удовлетвори- тельно решить эту проблему, необходимо исследовать взаимосвязь между выборочными статистиками и параметрами совокупности, из которой производится выборка. 2.6.2. ВЫБОРОЧНЫЕ РАСПРЕДЕЛЕНИЯ Чтобы ввести важное понятие выборочного распределения, читате- лю предлагается рассмотреть (а лучше выполнить самостоятельно) следующий эксперимент. Эксперимент. Четыре правильные игральные кости бросают пять раз, каждый раз записываются числа, появляющиеся на верхней грани костей. Затем вычисляют среднее для каждой выборки из четырех чисел. Результаты. Результат отдельного эксперимента будет следую- щим: Выборка: Среднее х 1, 5, 4 6, 4 200
Значения пятидесяти выборок 5 12 4 3 6 4 4 4 2 3 3 1 1 24 2 4 4 4 6 1 42 6 2 1 3 24 2 4 3 3 2 3 3 4 1 А 3 5 6 5 4 6 2 16 4 4 5 3 6 4 1 3 5 2 2 3 4 2 4 3 2 1 1 6 3 4 2 13 3 4 5 3 5 4 6 5 4 5 4 4 6 3 1 4 4 4 1 3 4 5 5 3 5 3 4 1 3 2 4 3 2 6 4 4 4 3 3 3 4 5 5 5 6 3 44 3 2 6 5 3 4 4 1 5 4 6 3 6 4 5 1 42 5 1 1 4 3 4 5 2 4 6 2 5 6 4 1 44 4 5 4 4 3 15 6 3 3 34- 3 2 4 з| 6 2 3 2 2 1 6 3 11 4 5 3 3 3 1 6 15 2 4 2 1 1 2 4 2 4 1 4 4 6 2 4 3 4 5 5 3 3 34 2 2 5 4 6 1 44 5 6 5 1 42 2 4 2 4 4 5 3 5 4 1 4 3 6 4 3 44 6 15 4 1 3 24 5 2 5 4 2 6 4 2 4 1 4 4 3 6 ' 4 5 6 2 1 44 4 а) Обсуждение. Функциях = (хх + х2 + х3 + х4)/4 будет выбороч- ной статистикой; каждый раз, получая выборку результатов бросания четырех костей, а именно (х1( х2, х3, х4),мы можем вычислить значение этой функции. Очевидно, если результат хг случаен и подчиняется ве- роятностному закону для одной кости, то функция х также будет слу- чайной величиной с собственным распределением вероятностей. Рассмотрим, как связано распределение вероятностей для индиви- дуального значения х со значением х. Выясним также, как значение х влияет на значение х. Для ответа на эти вопросы обратимся к численным результатам вы- борки, приведенным ранее. Таблица группированных частот для мно- жества из пятидесяти значений х выглядит следующим образом: 201
b * ’ J1/2> 2> 21/2, 3, 3i/2, 4, 4V2, 5, 5V2. I pynna x P/4 1зд 2Ч4 2з/4 3V« 33/4 4»/4 4з/4 5l/4 6 Частота f 0056 10 10 11701 Относительная часто- 0 0 0,10 0,12 0,20 0,20 0,22 0,14 0 0 02 та /7 50 На рис. 98 показана гистограмма экспериментального выборочного распределения х. Рис. 99 иллюстрирует распределение для одного бро- сания кости, т. е. для значения х. б) Сравнение двух распределений. Распределение х отличается от первоначального распределения. (Вспомним, что первое было получено экспериментально и приближенно показывает, как выглядит истинное выборочное распределение среднего.) Экстремальные значения х, такие, как 1 или 1Ч4 и 53/4 или 6, появ- ляются значительно реже, чем средние значения х: 3, ЗЧ2 или 4. Это аметно расходится с исходным распределением, в котором все значе- ия х имеют одинаковую вероятность. Приняв во внимание способ об- ‘ I Средние в выборках объема 4 О.2О - 0,10 - о.оо L 0 Результат однократного бросание кости Рис. 99. Прямоугольное распреде- ление вероятностей для правиль- ных костей Рис. 98. Выборочная гистограмма (50 выборок) разования выборочного среднего, легко показать, почему экстремаль- ным значениям соответствуют небольшие вероятности. Например, что- бы получить значениех, равное 1, каждая из игральных костей должна показать 1, т. е. возможна лишь одна выборка (1, 1, 1, 1), для которой X =1. Вместе с тем получить значение в середине можно при многих различных выборках. Например, к х = 3 нас приведет или (3, 3, 3, 3), или (2, 3, 4, 3), или (3, 1, 6, 2) и т. д. Читатель может самостоятельно подсчитать, сколько всего имеется таких выборок. Распределение выборочного среднего ближе группируется к своему центру, чем это происходит в исходной совокупности, т. е. значения х имеют меньший разброс, чем значения х. Это верно для любых распре- делений; средние имеют меньший разброс, чем исходные совокупности. Более того, величина уменьшения разброса зависит от объема произ- водимой выборки. Чтобы уяснить это, рассмотрим вычисление среднего при бросании шести костей. Получить значение среднего х = 1 у нас имеется только один шанс, соответствующий выборке (1, 1, 1, 1, 1, 1), а для получения значения х = 3 появляется гораздо больше способов, чем прежде. 202
Таким образом, чем больше объем производимой выборки, тем мень- ше разброс выборочного распределения среднего. Этот вывод уточняет- ся в теореме 1, которая формулируется далее. Что можно сказать о центре выборочного распределения? Как он связан с центром исходной совокупности? В нашем примере с играль- ными костями, очевидно, ожидаемое значение х будет равно 3,5 и сов- падает со средним совокупности. Число выборок, для которых х = 3,25 будет равно числу выборок с х = 3,75, а число выборок со средним х = 3 равно числу выборок со средним х = 4 и т. д. до х = 1 и х = 6. Мы видим, что выборочное распределение х симметрично около х = = 3,5. В общем случае можно показать, что для любого исходного рас- пределения и выборок любого объема Е (х) = р. Сейчас без доказательства мы приведем теорему, связывающую средние и дисперсии двух рассмотренных распределений. Теорема 1. Если случайная выборка объема п производится из большой совокупности {гипотетически бесконечной), которая имеет среднее р и стандартное отклонение ст, то теоретическое выборочное распределение х имеет среднее р и стандартное отклонение ст Vп. Эта теорема вместе с результатом теоремы2 (с. 188) часто применяет- ся в статистике. Она утверждает, что среднее выборочного среднего равно среднему исходной совокупности. Появляется также возможность точно установить связь между раз- бросом выборочного распределения среднего и разбросом исходного распределения. Мы видим, что стандартное отклонение выборочного распределения можно быстро вычислить, зная, что величина разброса изменяется обратно пропорционально квадратному корню из объема выборки. Например, если мы бросаем четыре игральные кости, то раз- брос среднего уменьшится вдвое; если наша выборка состоит из 16 кос- тей, то величина разброса будет четвертью разброса исходной совокуп- ности. Определение. Сгандартное отклонение выборочного распре- деления будем называть стандартной ошибкой рассматриваемой выбо- рочной статистики. Таким образом, = ст/Vn — стандартная ошибка х. Упражнение 2.6.1 1. Из большой пачки письменных экзаменационных работ по математике производятся случайные выборки. Известно, что оценки всех работ в пачке имеют среднее 53, a S.D., равное 12. Найдите среднее и S.D. выборочного распределе- ния среднего в производимых выборках. Объем выборок равен 9. 2. Содержание азота в некотором сплаве измеряется с помощью бромтри- флористого реагента. Известны среднее и S.D. процентного содержания азота в сплаве, которое составляет 0,027 и 0,011. Определите среднее и стандартную ошибку выборочного распределения среднего для выборок из 25 сплавов. 3. При условии, что выборочное распределение х для выборок объема 16 имеет дисперсию 8, найдите, чему будет равно S.D. для исходной совокупности. 4. Для приведенных ранее результатов бросаний четырех игральных костей вычислите среднее и S. D. распределения частот х. Найдите также среднее и S.D. для исходного прямоугольного распределения. Соответствуют ли ваши результаты теореме 1? 203
5. Получите выборки объема 9, выполняя эксперимент с игральной костью (или смоделируйте его с помощью таблицы случайных чисел). Для выборочного среднего нарисуйте график относительных частот. Выполните задание 4 для этого эксперимента и сравните ваши результаты. 6. Вычислите размах w выборки из 50 бросаний четырех костей (с. 184). Объедините результаты в таблицу группированных частот и нарисуйте гисто- грамму. Найдите среднее и S.D. для распределения выборочного размаха в этом эксперименте. Будет ли поведение выборочного размаха таким же, как и поведение выбо- рочного среднего? Предположим, объем выборки результатов бросаний игральных костей равен 100; чему будут равны приближенно вероятности событий w = 1, w = 2, ..., w = 6 в таких выборках? Набросайте форму распределения. Что случится со средним распределения w если п увеличивать? в) Форма выборочного распределения. Мы видели, как можно по- лучить среднее и S. D. выборочного распределения среднего из со- ответствующих параметров исходной совокупности. Теперь нам пред- ___ стоит выяснить связь между формами /У/\ 7S.D=4 этих двух распределений. / Если мы посмотрим на график / । средних выборок четырех бросаний / игральной кости, то увидим, что фор- \//л х. _ ма этого распределения унимодаль- 53 57 ^*~х на, а относительные частоты быстро уменьшаются по обе стороны от сред- р,ис- 100 него. Мы можем задаться вопросом, как близко это распределение к тео- ретической кривой нормального распределения с теми же значе- ниями среднего и S. D. Замечателен тот факт, что независимо от формы распределения исходной совокупности (имеющей конечную дисперсию) выборочное распределение средних будет хорошо аппроксимироваться соответст- вующим нормальным распределением, если объем выборки достаточно велик. Этот факт формулируется в следующей теореме. Теорема 2 (центральная предельная тео- рема). Теоретическое выборочное распределение х при большом п мо- жет быть хорошо аппроксимировано соответствующим нормальным распределением. Замечание. Если исходное распределение нормально, то х бу- дет нормальной величиной независимо от п. Эта теорема может быть доказана при весьма слабых ограничениях на исходное распределение. Математики уделяли ей много внимания. Простейший вариант теоремы был установлен П. Лапласом в начале XIX в. Точно указать, для каких п выполняется теорема 2, довольно слож- но. Однако мы уже видели, что при малых значениях п, равных 4, и исходном прямоугольном распределении экспериментальное выбороч- ное распределение х выглядит приближенно как нормальное. Таким образом, для достаточно больших выборок (скажем, для п 30) теоре- му можно применять с большой уверенностью. Для п < 30 в зависимо- сти от различных ситуаций необходимо дополнительное исследование, 204
если не известно, что исходное распределение само хорошо аппрокси- мируется нормальным. Пример. Для оценок по математике из задания 1 упражнения 2.6.1 найти вероятность того, что при объеме выборки, равном 9, среднее значение будет лежать между 53 и 57. Решение. Дано р, = 53 и сг = 12. Тогда для выборки объемом 9 распределение х будет иметь среднее Е (х) = 53 и стандартную ошибку а- = сг/1/9 = 4 (на основании тео- ремы 1). Более того, по центральной предельной теореме распределение х будет приближенно нормальным. Поэтому мы можем ответить на пос- тавленный вопрос, вычисляя площадь А под нормальной кривой, сред- нее которой равно 53, a S. D. равно 4 (см. рис. 100). Приведя 53 и 57 к стандартным нормальным значениям zr и г2, получим z± — (53—53)/4 = 0 и z2 = (57—53)/4 = 1. Из таблиц стандартного нормального распределения мы найдем, что А = 0,3413. Таким образом, вероятность получить выборку из девяти работ так, чтобы среднее их оценок лежало между 53 и 57, приближенно равна 0,34. Упражнение 2.6.2 1. Из нормальной совокупности со средним 18,1 и S.D., равным 2,3, про- изводится выборка объемом 9. Найдите вероятности получить: (1) выборку, среднее которой меньше 16; (2) выборку, среднее которой лежит между 15 и 17; (3) выборку, среднее которой меньше 16 и больше 19. 2. Выполните задание 1 для выборки объемом 25. 2.6.3. ВЫБОРОЧНОЕ РАСПРЕДЕЛЕНИЕ ДЛЯ СУММЫ И РАЗНОСТИ Пусть имеются две случайные переменные X и У, осуществляются два независимых выбора — один из совокупности X, а другой из сово- купности У. Под независимым выбором мы подразумеваем следующее: выбираемое значение х не должно влиять на выбор из совокупности У и обратно. Предположим также, что обе совокупности достаточно вели- ки, так что повторяющийся выбор не оказывает влияния на распреде- ление вероятностей; другими словами, предположим, что исходные со- вокупности бесконечны. Рассмотрим теперь две новые переменные, которые назовем суммой (S) и разностью (О) X и У. Каждый раз, производя выбор х и у, мы по- лучаем значения s = к-[ у и d = х — у для величин S и D соответст- венно. Очевидно, S и D будут случайными переменными со своими собст- венными выборочными распределениями. Определим, как связаны сред- ние и стандартные отклонения этих величин с соответствующими зна- чениями для X и У. Результат будет приведен без доказательства (доказательство требует знания свойств совместных распределений случайных величин). 205
Теорема 3. Если X uY — две независимые случайные перемен- ные со средними р,ж и р;/ и дисперсиями о| и of, то случайные перемен- ные S = X -| У и D — X — Y имеют средние и дисперсии, равные Их = Рх + Ру, Var (S) = а* + ст* и pD = р,х — Рл,, Var (D) = а2 + ст|. Мы видим, что для получения дисперсии как суммы, так и разности X и Y необходимо сложить соответствующие дисперсии. Другими сло- вами, Var (S) = Var (X) + Var (У) = Var (D). Пример. Последовательно бросают две игральные кости, выпа- дающие числа записывают в виде пары (х, у). Определите среднее и S. D. распределений (a) х = х + у, (б) d = х — у. Решение. Для каждой кости имеем р = 3,5 и о2 = 2,92 (исходная совокупность рассмотрена в 2.6.2, а) — рис. 99; для проверки этих значений воспользуйтесь стандартными формулами среднего и дис- персия). Таким образом: (а) рх = рж + Pj, = 2 • 3,5 = 7, Var (S) = ст£ + ст| = 2 • 2,92 = 5,84, следовательно, S. D. для суммы S будет равно cts = VW=2,42; (б) Р'О — Рж Ру — О, oD = VVar (Х) + Var (K) = cts = 2,42. Упражнение 2.6.3 1. Возьмите две кости (красную и зеленую) и бросьте их пять раз. При каж- дом бросании запишите значения S = R С и D = R — G, где R соответст- вует числу очков, выпавших па красной, a G — на зеленой кости. Найдите рас- пределение относительных частот для S и Л и вычислите их средние и S.D. Соот- ветствуют ли ваши результаты теореме 3 и приведенному ранее примеру? 2. Две независимые случайные переменные X и Y имеют распределения со средними 52 и 41 и дисперсиями 9 и 16 соответственно. Определите среднее и S. D. распределений S = X + У н D = X — Y. 3. Из совокупности X и из совокупности У (см. задание 2) производятся случайные выборки объемом 25; при этом вычисляются их средние х и у. Найдите среднее и S. D. выборочных распределений случайных перемен- ных S = Х+У и Р = Л — у. 4. Обобщите естественным образом теорему 3 (для сумм п независимых случайных переменных); с помощью полученных результатов докажите тео- рему 1. (Если S=X14-X'2+... + Xn, то Ps=2Bxi. Var (S) = 2 Var (Л,). Если предположить теперь, что все переменные выбираются из общей (бес- конечной) совокупности, то %!, ..., хп можно рассматривать как выборку объе- S мом п из этой совокупности, а отношение — будет средним х.в выборке, Е> 206
Отсюда |ii = — [is = — («Г) = И. ra Var W = ~ VarL(S) = —- X X n n n2 ti2 02 X (ИО2) = --, n что и доказывает теорему 1.) 2.6.4. РАЗНОСТИ СРЕДНИХ Следующая теорема применяется в проверках на равенство средних двух различных генеральных совокупностей. Допустим, случайная выборка объемом /ц произведена из совокуп- ности со средним р.хи стандартным отклонением S. D. = о,., предполо- жим также, что из другой совокупности со средним и S. D. = <зу произведена независимая случайная выборка объемом /г2. Таблица свойств важнейших выборочных распределений Выборочная статистика Свойства выборочного распределения среднее S.D. (стандартная ошибка) замечания Среднее X И- = Р а — ° х Распределение нормально, если исходная совокупность распре- делена нормально, и близко к нормальному, если п > 30 и исходная совокупность не яв- ляется нормальной Медиана X L'Med = Г Распределение очень близко к нормальному, если п > 30. Фор- мула для оМе<! абсолютно точ- на, если исходная совокупность распределена нормально. Фор- мула для cMed верна, если совокупность симметрична, л =3,141 Доля Р Ир = 6 Распределение приближенно нормально при /г>30. 6 —доля в совокупности Стандартное отклонение S P'S О’ Распределение очень близко к нормальному при п>100. Фор- мула для оЕ будет точной толь- ко для нормально распределен- ной исходной совокупности Разность средних О=(Х—У) Ро = Рх Ру /~ 9 2 1 / Gx G.. Г Hi И2 Выборки независимы и произ- водятся из двух разных рас- пределений. Распределение D приближенно нормально, если nj и п2>30 207 I
Рассмотрим случайную величину D = X — У, т. е. разность сред- них двух выборок. Теорема 4. D имеет выборочное распределение со средним ро = Рх — Рг/ 11 дисперсией о2 о2 Var(D) = — П1 п2 Доказательство следует непосредственно из теорем 1 и 3. 2.6.5. ЗАМЕЧАНИЯ И ВЫВОДЫ Результаты этой главы — основные в теории статистики. Содержа- щиеся в ней идеи и теоремы должны быть хорошо изучены и усвоены; они составляют основу теории статистических выводов, которой пос- вящена гл. 2.7. Важнейшие свойства и теоремы для общего случая выборочных распределений (включая также те, на которых мы не останавливались) приведены в таблице на с. 207. Упражнение 2.6.4 1. Совокупность состоит из шести элементов: 1, 2, 4, 5, 7, 8. Выпишите все возможные выборки объемом 2, которые можно из нее про- извести с возвращением (1,1), (1,2), (1,4), ..., (2,1), (2,2), (2,4) и т. д. Вычислите: (а) среднее р и стандартное отклонение о совокупности; (б) среднее каждой возможной выборки и среднее этих средних; эта вели- чина будет равна среднему выборочного распределения средних выборок объе- мом 2; (в) стандартную ошибку средних. Покажите, что р- = р и о~=о/1/« (и=2). 2. Выполните задание 1 для выборок объемом 3, производимых из совокуп- ности 2, 4, 6. 3. Что случится со стандартной ошибкой выборочного среднего, если (а) размер выборки возвести в квадрат, (б) размер выборки увеличить с 16 до 144? 4. Проверьте, что среднее, вычисленное по выборке объемом 64, надежнее для оценивания р, чем медиана, найденная по выборке объемом 100. (Сравните их стандартные ошибки.) 5. Сравните стандартную ошибку медианы в выборке объемом 25 со стан- дартной ошибкой среднего для выборки объемом 16. Какая из величин для дан- ных выборок будет лучшей оценкой для р. (среднее или медиана)? 6. Из нормально распределенной совокупности со средним р = 73 и S. D. = = 110 осуществлена случайная выборка объемом 100. Найдите: (а) вероятность того, что среднее выборки лежит между 60 и 78, (б) вероятность того, что медиана лежит между 60 и 78. (Указание. Воспользуйтесь свойствами выборочных распределений и таблицей величины площади под нормальной кривой.) 7. Найдите вероятность того, что при 64 бросаниях правильной монеты (а) число выпавших решеток будет от 20 до 45% числа бросаний, (б) число гер- бов будет меньше, чем 3/8 общего числа бросаний. (Указание. Воспользуйтесь свойствами выборочного распределения доли Р, описанными в итоговой таблице.) 8. Известно, что в очень большой группе людей 35% курящих. При усло- вии, что производится случайная выборка 100 человек из этой группы, найдите вероятность того, что из них более 40 курят. 208
9. Две компоненты Л и В соединены в линию последовательным образом. Длины компонент А и В представляют собой случайные величины со средним 3 мм и S. D. = 0,1 мм для компоненты А и со средним 6 мм и S. D. = 0,03 мм для компоненты В. До соединения две компоненты выбираются из соответст- вующих совокупностей независимо друг от друга. Чему равны среднее и S. D. комбинированной компоненты, если предположить, что соединение не увеличивает и не уменьшает длину компонент? 10. Вес плиток шоколада имеет распределение со средним 1 и S. D. = 0,01 единицы веса. Случайным образом выбирают четыре плитки и складывают в один пакет. Найдите среднее и S. D. веса пакета, если вес бумаги пакета распределен со средним 0,1 и S. D. = 0,003 единицы веса. 11. При измерении двух железных прутов оказалось, что длина первого составляет 2 м, а второго — 1,5, причем стандартная ошибка для первого из- мерения была 11 мм, а для второго — 9 мм. Вычислите среднее и S. D. для (а) суммы длин и (б) разности длин. 12. Некоторый кандидат набрал на выборах 45% голосов. Чему равна ве- роятность того, что разность между долями голосов, поданных за этого канди- дата, и Р2 в двух выборках окажется больше 0,05? __ (Указание. Измените формулу, данную в таблице для D = X — У, на соответствующую для D == 1\— Р2, затем воспользуйтесь таблицей нор- мального распределения.)
27 СТАТИСТИЧЕСКИЕ ГЛАВА ВЫВОДЫ В предыдущих главах мы видели, что любая статистика, вычислен- ная по наблюдениям выборки, сама может рассматриваться как случай- ная величина. В некоторых случаях нами была установлена связь между выборочным распределением статистики и распределением со- вокупности, из которой производилась выборка. В следующих главах мы рассмотрим фундаментальную статистичес- кую проблему извлечения информации о совокупности в целом по на- блюдениям выборки. Этот раздел статистики называется статистиче- ские выводы-, теория выборочного распределения играет в этой области огромную роль. К этой проблеме можно подойти в основном двумя путями. Первый путь заключается в том, чтобы найти выборочную статисти- ку, которая была бы подходящей оценкой соответствующего парамет- ра совокупности. Например, выборочное среднее х может служить оценкой среднего р совокупности. Для этого можно воспользоваться и выборочной медианой х. Спрашивается, какая из этих оценок р будет лучше? Можно ли найти другую выборочную статистику, в некотором смысле лучшую, чем и х и х? Решение этих вопросов составляет основу так называемой теории статистического оценивания. Второй путь заключается прежде всего в формировании гипотез относительно совокупности. Затем с помощью наблюдений выборки проверяют, являются ли выдвинутые гипотезы удовлетворительными или нет. Например, мы выдвигаем гипотезу о том, что среднее совокуп- ности равно нулю (т. е. р = 0). Если мы затем получаем случайную выборку из этой совокупности, выборочное среднее которой равн£» х = = 3, то что можно сказать о выполнении или невыполнении нашей ги- потезы? Верна она или нет? Изучением таких проблем занимается раз- дел статистики, известный под названием статистическая теория проверки гипотез. В этой главе мы познакомим читателя с важнейшими идеями, ле- жащими в основе статистического оценивания и теории проверки гипо- тез. Эти понятия и идеи в той или иной форме встречаются практически на любом этапе статистического исследования. Мы надеемся, что за деталями формул и тестов, предлагаемых далее, читатель будет видеть соответствующие идеи и принципы. В большинстве случаев мы будем иметь дело с так называемой теорией больших выборок, т. е. со случаями, когда объем выборки 210
превосходит 30 (приближенно). Поэтому выборочные распределе- ния, используемые в различных тестах, будут нормальными или по крайней мере близкими к нормальным, что позволяет пользовать- ся таблицами. Как правило, тесты остаются верными и для п, лежащих между 15 и 30; однако для п 15 они должны быть модифицированы. Этот случай исследуется в теории малых выборок. 2.7.1. ТЕОРИЯ СТАТИСТИЧЕСКОГО ОЦЕНИВАНИЯ а) Точечное оценивание. Выборочная статистика, применяемая для получения оценки соответствующего параметра совокупности, называется точечной оценкой. Примеры 1. х может служить оценкой для ц. 2.3с может служить оценкой для ц. 3. s2 может служить оценкой для дисперсии совокупности о2. Замечания 1. На практике, как правило, для обозначения параметров сово- купности употребляют буквы греческого алфавита, а соответствую- щими латинскими буквами обозначают их оценки. Например, если буквами р и о обозначают среднее и стандартное отклонения совокуп- ности, то буквами т и s будут обозначаться их оценки. 2. Существует другой способ обозначения оценки, соответст- вующей некоторому параметру: для оценки выбирают ту же букву, что и для параметра, только с крышечкой наверху (хч). Например, р означает оценку р; о2 — оценку о2. б) Свойства оценок. Для данного параметра совокупности может существовать много выборочных статистик, которые вполне подхо- дящи для того, чтобы служить оценками. Например, любая из ста- тистик — среднее, медиана, мода — может показаться вполне при- емлемой для оценивания среднего совокупности р. Чтобы решить, какая из статистик в данном множестве предлагаемых оценок «наи- лучшая», необходимо определить некоторые желаемые свойства та- ких оценок. Три важнейшие из них — несмещенность, эффектив- ность и состоятельность. 1. Несмешанные оценки. Пусть р — некоторый параметр сово- купности, а выборочная статистика b = f (хъ .... х„) — оценка этого параметра. Статистика b имеет свое выборочное распределение, кото- рое, в свою очередь, имеет среднее (или математическое ожидание) Е (Ь) и стандартное отклонение S. D. (Ь) (эту величину часто называют стандартной ошибкой Ь). Определение. Если Е (Ь) = р, то b называется несмешанной оценкой р. В других случаях говорят, что оценка смещена. Очевидно, несмещенность — очень важное свойство, обладание которым желательно для любой оценки. Это свойство означает, что если мы пользуемся несмещенной оценкой, то в одних случаях может случиться, что мы завышаем искомый параметр совокупности, в дру- гих — мы его занижаем. Однако в среднем мы будем «попадать в цель». 211
На рис. 101 и 102 показано выборочное распределение двух оценок (/«! и т2) для среднего р некоторой совокупности. Истинное распре- деление совокупности обозначено пунктиром и изображено на той же шкале. Поскольку Е (trij) = р, статистика т1 будет несмещенной оценкой р. С другой стороны, т2 есть смещенная оценка, поскольку в среднем значение этой оценки превосходит р, т. е. Е (т2) > р. Примеры 1. х есть несмещенная оценка р. (Е (х) = р, гл. 2.6, теорема 1.) 2. х также будет несмещенной оценкой р, если выборка произ- водится из совокупности с симметричным распределением. о о 2 (х—х)2 9 3. s2 = ———- = смещенная оценка о , поскольку £(s*) \ п ) В среднем s2 дает заниженную оценку дисперсии совокупности. Рис. 101. Распределение Рис. 102. Распределение оценки mi оценки т2 Л *5 / ч \ 9 2 (х х) 9 4. о2=|---- sz= —--------несмещенная оценка о2 \п—1 ' п—1 е " -1 2 (*—х)2 5. о= 1/ —------- — смещенная оценка о. V п— 1 2. Эффективные оценки. В общем случае желательнее выбирать несмещенную оценку, чем смещенную. Однако часто встречаются ситуации, когда для некоторого параметра существует больше, одной несмещенной оценки. Тогда проблема выбора возникает вновь. В качестве основы сравнения оценок, т. е. определения меры эф- фективности оценивания, можно взять их выборочные дисперсии. Очевидно, что наилучшей будет оценка с наименьшим разбросом вы- борочного распределения. Численные значения, которые определяют- ся такой оценкой, будут наиболее близки к истинному значению параметра совокупности по сравнению с оценками, имеющими боль- шую дисперсию. Будем говорить, что оценка более эффективна, если она имеет меньшую выборочную дисперсию. Определения а) Если Ьг и Ь2 — две несмещенные оценки параметра р и Var (t>x) < Var (b2), то br — более эффективная оценка, чем Ь2. 212
б) Рассмотрим семейство всех возможных несмещенных оценок параметра. Оценка с наименьшей дисперсией из этого семейства называется наиболее эффективной, или наилучшей, оценкой. Осталь- ные оценки иногда называют неэффективными оценками. П ример. При выборке из нормально распределенной совокуп- ности среднее х и медиана х будут несмещенными оценками средней р совокупности. Как было показано в гл. 2.6, Var (х) =— , Var (х)=—• — . п 2 п Таким образом, х имеет меньшую выборочную дисперсию, поэтому х будет и более эффективной оценкой для р, чем х. Более того, можно показать, что среди всех несмещенных оценок р, оценка х обладает наименьшей дисперсией. Таким образом, х бу- дет наиболее эффективной оценкой. 3. Состоятельные оценки. При использовании той или иной оценки желательно, чтобы точность оценивания увеличивалась с возрастанием объема производимой выборки. Предельная точность будет достигну- та в том случае, когда численное значение оценки будет совпадать со значением параметра для любой производимой выборки. Это озна- чало бы, что оценка является несмещенной и что ее выборочная дис- персия равна нулю. Однако такое положение дел невозможно на прак- тике1, хотя точность большинства оценок стремится к этому идеаль- ному случаю при неограниченном увеличении объемов выборки. Та- кие оценки будем называть состоятельными. Определение. Если выборочная статистика b представляет собой несмещенную оценку параметра совокупности и выборочная дисперсия Var (Ь) зависит от объема выборки таким образом, что Var (£>)-> О при п -> оо , то b называется состоятельной оценкой |3. Примеры - -о2 1. х есть несмещенная оценка р. Далее, Var (х) = —, откуда Var (х) -> 0 при п -* оо . Итак, х — состоятельная оценка р. 2. При выборке из нормально распределенной совокупности х будет зт несмещенной оценкой р, а ее выборочная дисперсия • — стремится к нулю при неограниченном увеличении п. Таким образом, медиана будет состоятельной оценкой среднего совокупности. 3. $2 = 2 (*—*) есть несмещенная оценка ст2. Можно показать, п— 1 1 / п—3 \ что ее дисперсия равна Var (s2)= ~ I р4 — фДф I н ПРИ стремлении п к бесконечности она стремится к нулю. Таким образом, s2 будет состоятельной оценкой о2. 1 Если бы это произошло, то исследуемая переменная перестала бы быть случайной. Вся ее вероятность концентрировалась бы в одной точке, и это значе- ние всегда можно было бы точно указать. 213
4. Итоговая таблица свойств оценок с примерами выглядит сле- дующим образом: Несмещенность Эффективность Состоятельное ть. Определения Ь — несмещенная оценка, если £(6) = Р Ь — наиболее эффек- тивная оценка, если она несмещена и Var (Ь) — минимальная Ь — состоятельная оценка, если она несмещена и Var (b) 0 при П->оо Примеры х — несмещенная оценка р х — несмещенная оценка р (для нор- мально распределен- ном совокупности) s2(/z—1 в знаменате- ле) — несмещенная оценка о2 s — смещенная оценка о х — наиболее эффек- тивная оценка х — неэффективная оценка s2 — эффективная оценка s — неэффективная оценка х — состоятельная оценка х — несостоятель- ная оценка* s2 — состоятельная оценка s — несостоятель- ная оценка* * Обычно для состоятельности оценки не требуют, чтобы она была несме- щенной. В таком случае оценки х и s будут состоятельными. — Примеч. пер. При выборе оценок необходимо принимать во внимание перечис- ленные свойства. Могут быть изучены и другие полезные свойства оценок (например, важное свойство достаточности), их обсуждение можно найти в более полных курсах статистического оценивания. Следует учитывать и такое немаловажное обстоятельство, как отно- сительная простота вычислений и затраты на получение выборки. Нередко выбирается неэффективная оценка только на том основании, что ее вычисление намного проще, чем вычисление соответствующей эффективной. Например, при контроле качества продукции часто мерой разброса совокупности служит выборочный размах, исполь- зуемый вместо более сложной и более эффективной оценки —выбороч- ного стандартного отклонения. При оценивании на основе малого числа наблюдений различие в эффективности невелико, если к тому же необходимо быстро получить много оценок, то затраты времени на вычисление оценки становятся решающим фактором. 5. Оценки, основанные на объединении выборок. Предположим, из большой совокупности со средним р и дисперсией о2 производятся две. случайные выборки объемом /ц и п2. Предположим также, что оценки хг и х2 величины р и оценки sf и s2 величины о2, полученные по этим выборкам, являются несмещенными. Возникает проблема комбинации пар этих оценок для получения несмещенных оценок р и о2. Соответ-* ствующий процесс, использующий две или больше выборки, называет- ся объединением. 214
Чтобы получить объединенные несмещенные оценки среднего и дис- персии, следует воспользоваться формулами: среднее дисперсия «1+«2—2 Легко показать, что Е (р) = р, Е (о2) = ст2. Формулы (1) и (2) легко обобщить на случай k выборок. Численные примеры 1. Предельная нагрузка для выборки из 5 стальных стержней равна соответственно 16, 13, 11, 14, 16 усл. единиц. Известно, что совокупность подчиняется нормальному закону. (а) Дайте несмещенную и эффективную оценку средней предельной нагрузки совокупности стальных стержней. (б) Дайте несмещенную и неэффективную оценку среднего сово- купности. (в) Получите смещенную и несмещенную оценки дисперсии сово- купности. (г) С помощью несмещенной оценки о2 получите смещенную оценку ст. Ответы (а) х = — — несмещенная и эффективная оценка р. По выбороч- 70 . . ным данным получим: х = -у = 14. (б) Выборочная медиана х будет несмещенной оценкой р. По данным выборки находим х = 14. (в) Смещенная оценка о2: ~2 2(х-х)2 22 + 12+324-02+22 18 ст, =-------=------------------——-—о,о. п 5 5 Несмещенная оценка ст2: ~2= S(x-x)2 18 5 п — 1 4 Обратим внимание на различие двух оценок. Смещение первой оценки вправо наиболее заметно при малых значениях п. (г) ст = Vo2 = 1/4,5 = 2,12 — смещенная оценка. 2. Вторая выборка из 7 стержней в условиях примера 1 дала сле- дующие несмещенные оценки: р = 15 и о2 = 5,2. Найти объединен- ную несмещенную оценку для среднего и дисперсии совокупности. 215
Ответ. По формулам (1) и (2) й ответам 1 (а) и 1 (в) получим сле- дующие значения для объединенных оценок: ^=5114+7115 б 5+7 а2±+5±б±,2=4 4 + 6 Упражнение 2.7.1 1. Для наблюдений каждой из шести случайных выборок получите оцен- ки среднего совокупности, которые (а) несмещены, эффективны, состоятельны, (б) несмещены, неэффективны, состоятельны, (в) смещены, неэффективны и не- состоятельны, (г) найдите смещенную и несмещенную оценки дисперсии сово- купности. Предполагается, что либо распределение нормально, либо оно приб- лиженно нормально. (1) Выборка 5 сопротивлений: 0,32; 0,28; 0,31; 0,30; 0,29 Ом. (2) Диаметры шести шаров в шарикоподшипниках: 2,01; 1,99; 2,00; 2,00; 2,01; 1,98 мм. (3) Оценки на экзамене по физике: 43, 64, 55, 59, 80, 46, 61, 72, 53, 47. (4) Увеличение частоты пульса солдат после проверки физических данных: 10, 13, 6, 8, 12, 8, 7, 10, 12, 14 ударов. (5) Процентное содержание витамина С в выборке витаминных драже: 14,3; 15,2; 16,3; 14,8; 12,9. (6) Увеличение быстроты чтения у детей, отстающих в развитии, после спе- циальных занятий: 35, 27, 40, 45, 38, 39, 41, 38 слов/мин. 2. В каждом из экспериментов задания 1 была произведена повторная вы- борка. По полученным данным были вычислены несмещенные оценки х~ и s2. Объемы выборок и значения х и s2 приведены далее. Найдите объединенные не- смещенные оценки среднего и дисперсии каждой совокупности. (1) Сопротивления: х = 0,30 Ом; s2_= 10-4; п = 9. (2) Шары в шарикоподшипниках: х = 2,00 см; s2 = 6,4 , 10~5; п = 8. (3) Оценки по физике: х = 53; s2 = 100; п = 10. (4) Увеличение частоты пульса: х — 9 ударов; s2 — 4; п = 11. (5) Процентное содержание витамина С: х = 14,0; s2 = 0,25; п = 7. (6) Увеличение быстроты чтения: х = 36 слов/мин; s2 = 21; п — 12. 3. Покажите, что (1) оценки ц и ов для объединенных выборок (см. 2.7.1, б)) несмещены и (2) оценка, образованная как взвешенная средняя несмещенных оценок некоторого параметра (веса могут быть любые), сама является несмещен- ной оценкой этого параметра. 4. Обобщите формулы (1) и (2) из 2.7.1, б) на случай k выборок. 5. Из большой совокупности со средним р и дисперсией о2 произведены три выборки объема 9,13 и 17, которые дали средние 10,1; 11,3 и 14,2 и диспер- сии (п — 1 в знаменателе) 4,1; 6,3 и 5,4 соответственно. Найдите объединенную несмещенную оценку среднего и дисперсии совокупности. ' в) Интервальное оценивание. Вас попросили определить (т. е. оценить) возраст некоторого человека. Допустим, после некоторых колебаний вы сказали, что ему 35 лет. В таком случае вы произвели точечное оценивание, т. е. назвали единственное число без уточнения меры уверенности в том, что ему именно столько лет. Однако возможен и другой ответ в виде интервала, которому принадлежит возраст, данного человека. Например, можно ответить: ему от 32 до 38 лет или между 30 и 40 годами. При этом можно определить и меру уверенности в правильности данного ответа. Например, некто может сказать: 216
Рис. 103. Выборочное распределение оценки Ь\ среднее р. (Как правило, хоро- шо аппроксимируется нормальным рас- пределением; значение Р находится из таблиц) «Наверняка его возраст лежит между 20 и 50 годами» или «Мне ка- жется, ему от 30 до 40 лет» или «Его возраст должен быть между 32 и 35 годами, но я в этом не уверен». Очевидно, чем больше длина ин- тервала, тем скорее этот интервал будет содержать значение оцени- ваемой величины и поэтому тем больше уверенность в том, что оцени- ваемая величина будет принадлежать этому интервалу. Приведенный пример хорошо иллюстрирует идеи, лежащие в основе методов, известных под названием доверительного интервального оценивания. Сейчас мы покажем, каким образом вычисляются дове- рительные интервалы для пара- метров совокупности и как для этих интервалов строятся меры доверия. Общие принципы построе- ния доверительных, интервалов. Предположим, что доверитель- ный интервал отыскивают для некоторого параметра р сово- купности и в качестве точечной оценки этого параметра берут несмещенную выборочную ста- тистику b = f (лу, х2, хп). Оценка b должна иметь выборочное распределение со средним Е (b) = Р и стандартным отклонением S. D. (Ь) = сгь. Установим прежде всего, что нам известно и что предстоит найти. Параметр р неизвестен, наша цель состоит в его оценке. Однако имеет- ся некоторая информация о совокупности, полученная в предыдущих экспериментах. Чтобы получить представление о выборочном рас- пределении оценки Ь, мы рассмотрим ее вместе с данными выборки и при построении доверительного интервала для р воспользуемся вы- борочным распределением. Замечателен тот факт (см. центральную предельную теорему и замечания к ней в 2.6.2, в)), что большинство выборочных статистик на практике имеют нормальное или близкое к нормальному выбороч- ное распределение. Этот результат позволяет с помощью вероятностей для нормального распределения найти такой интервал (Р — d, Р + d), в котором лежит значение Ь, вычисленное по данной выборке (рис. 103). Можно решить и обратную задачу — по данной величине вероят- ности отыскать значение d. Например, для вероятности, равной 0,95, из таблиц стандартного нормального распределения найдем d/ub = = 1,96. Другими словами, вероятность того, что значение Ь, опре- деленное по выборке, лежит в интервале [р — 1,96 оь, р-|- 1,96 аь] равна 0,95. Это можно записать следующим образом: Р [р — 1,96 аь < b < р + 1,96 сгь1 = 0,95. Неравенства в квадратных скобках могут быть записаны в другой эквивалентной форме lb •— 1,96 иь Р «С Ь + 1,96 сгь 1 (вычитаем b + Р из каждой части и умножаем неравенство на — 1, при этом знак 217
неравенства изменится на противоположный). Таким образом, можно сделать следующее вероятностное утверждение: Р[Ь — 1,96 оь < р < b + 1,96 оь] = 0,95. Это приводит нас к 95%-ному доверительному интервалу для р, т. е. к интервалу [Ь — 1,96 сть, b + 1,96 оь]. В общем случае доверительный интервал выражается в виде [Ь — — z<yb, b + zob], где z — число, полученное из таблиц выборочного распределения Ь. Это число выбирается исходя из желаемого доверия, выраженного в процентах, которое приписывается интервалу, и на- зывается коэффициентом доверия, доверительным коэффициентом или, иногда, критическим значением. Граничные точки доверитель- ного интервала называются соответственно нижним и верхним дове- рительными пределами. Пример. Случайная выборка измерений роста 100 студентов- юношей с шестого семестра колледжа дала следующие результаты: средний рост равен х = 1,73 м, а выборочная дисперсия (несмещенная) s2 = 0,00245. Найти (а) 95%-ные, (б) 99%-ные доверительные границы для среднего совокупности студентов-юношей исследуемого колледжа. Решение (а) Нужно оценить среднее р совокупности. Выборочное среднее х = 1,73 м может быть использовано в качестве несмещенной точеч- ной оценки р. Нам известно, что х имеет распределение, близкое к нормальному, со средним Е (х) = р и стандартным отклонением _ о S. D. (х) = , где о — стандартное отклонение всей совокупности, Vn , а и = 100. Поэтому 95%-ный доверительный интервал для р будет следующим: Для вычисления границ этого интервала нам известно все кроме ст. Можно показать, что для п > 30 (ориентировочно) замена ст вы- х — 1,96 > х + 1,96 борочным стандартным отклонением s = _ не изменяет п—1 уровня доверия интервала. Таким образом, приближенные 95%-ные доверительные пределы для р равны: — s I нижняя граница — х — 1,96 ~zz = 1,73—1,96 • 0,00495 = 1,720 м; . |/ п — S верхняя граница = х 1,96 = 1,73 Д- 1,96 • 0,00495= 1,740 м; •_ 95%-ный доверительный интервал будет [1,720; 1,740]. (б) Для определения 95%-пого интервала мы воспользовались коэф- фициентом доверия z — 1,96. Если мы хотим обеспечить нашему оце- ниванию большую уверенность, мы должны построить более широкий интервал. Для 99%-ного интервала из таблиц нормального распреде- ления находим, что доверительный коэффициент будет равен г = 2,58. (Здесь читателю будет полезно вернуться к 2.4.6 и повторить свойство 218
нормального распределения.) Итак, приближенные 99%-ные дове- рительные пределы для р будут следующими: _ s нижняя граница — х — 2,58 —— — 1,73—2,58 • 0,00495 = 1,717 м; у п _ S верхняя граница = х + 2,58 = 1,73 -ф 2,58 • 0,00495 = у п = 1,743 м; 99%-ный доверительный интервал будет [1,717; 1,743]. Вывод ы. Чтобы определить доверительный интервал для пара- метра р, необходимо сначала найти несмещенную выборочную оценку Ь, для которой известны выборочное распределение и стандартное отклонение сть. Тогда 100 Р%-ный доверительный интервал будет равен b ± гоь, где доверительный коэффициент z выбран так, что Р [Ъ — z • сгь С Р С b + z • оь1 = Р. Иногда значение сть известно из полученной ранее информации о совокупности. В противном случае в больших выборках вместо зна- чения оь можно подставить оценку sb, вычисленную по наблюдениям выборки. Такой способ ведет, как правило, к незначительному из- менению степени доверия. Вероятностное утверждение, содержащееся в доверительном ин- тервале, необходимо правильно интерпретировать. При чтении записи Р [а <1 р bl — Р мы не должны думать, что Р есть случайная переменная, лежащая с вероятностью Р между а и Ь. Параметр р — константа, нам не известная, принимающая фиксированное значение, и поэтому относительно Р вероятностные утверждения не допускают- ся. А вот верхний и нижний пределы а и b будут случайными перемен- ными. Любой интервал [а, Ь], найденный по выборке, можно рассмат- ривать как элемент интервалов соответствующей совокупности. Та- ким образом, доверительный интервал имеет свое выборочное распре- деление. Поэтому утверждение Р [а р <2 й] — Р означает, что для данного интервала, выбранного из совокупности интервалов, вероят- ность содержать значение р равна 100 Р%. Другими словами, если бы мы рассмотрели большое число выбо- рок и каждый раз вычисляли бы интервал [cz, bl, то приближенно 100 Р% из них содержали бы значение р. В таком смысле и нужно понимать степень доверия интервала. Упражнение 2.7.2 1. Вычислите (а) 95%-ный и (б) 99%-ный доверительные пределы для среднего совокупности в каждом из следующих случаев: Измерение Выборочные наблюдения S.D. сово- купности (известно) а X Число сигарет, выкуренных за день 12 144 4 Число слов в предложении 27 225 7 Длина предплечья 18,1 единицы 100 0,82 Диаметр мускульной мышцы 17,1 » 625 3,4 Длина антенны 37,2 » 324 4,5 219
2. Найдите точный доверительный коэффициент для (а) 90%-ного, (б) 60%-ного, (в) 99,9%-ного и (г) 50%-него доверительного интервала при усло- вии, что соответствующее выборочное распределение нормально. 3. Получите (а) 90%-ный и (б) 50%-пый доверительные интервалы для сред- них совокупностей из задания 1. Замечание. 50%-ный доверительный интервал часто исполь- зуется в экспериментальных работах по физике, астрономии и т. д. Половину длины интервала (=0,674 о) называют вероятной ошибкой оценивания. Точечное оценивание и доверительные интервалы для некоторых параметров. Наиболее часто точечные и интервальные оценки тре- буется определять для средних, отношений, разностей двух средних и стандартных отклонений. Необходимые для этого оценивания фор- мулы приведены в таблице. Стандартная запись доверительного интер- вала b ± zob является наиболее общей. Параметр совокупности (fS) Точечная оценка (Ь) Доверительный интервал (для Р) Выборочные оценки (для оь) Среднее р. Доля л Разность сред- них (pi—р2) Стандартное отклонение о X р (Xi—Xz) S X i zox Р ± 2Ор (*1— Х2) ±2-0^^) s ± zas х Д/ п ‘ п(п—1) - Рд-Р) °Р V п а(71-72)=8‘|Л где s определяется по формуле (2) для объеди- ненной оценки дисперсии (см. 2.7.1,б), с. 215) Os-l/2n Замечания (1) Формулами из таблицы следует оперировать в случаях, когда выборка случайная. Формулы для разности средних основаны на предположении, что выборки независимы. (2) В некоторых случаях сть известно из априорной информаций о совокупности. Тогда соответствующая выборочная оценка не при- нимается во внимание. (3) Для каждой формулы доверительных интервалов и для любого уровня доверия коэффициент z может быть найден из таблиц нормаль- ных интегралов. Этот путь приведет к точному результату, если со- вокупность, из которой производится выборка, имеет нормальное распределение; в другом случае получающаяся ошибка будет мала при достаточно большом п (п > 30). 220
Приведем несколько значений z: Уровень доверия, % 50 90 95 99 99,7 Доверительный коэффициент 0,674 1,645 1,96 2,58 3,00 Примеры 1. Для предварительного опроса населения некоторого города в связи с избирательной компанией была произведена случайная вы- борка 400 участников. 160 человек заявили, что они проголосуют за кандидата лейбористов. Получите точечную оценку и 95 %-ный доверительный интервал доли избирателей данного города, которые отдадут предпочтение на выборах кандидату-лейбористу. Решение (см. формулу 2 в таблице). Доля отдавших предпочтение партии лейбористов в выборке р = 160/400 = 0,4. Это число и будет нашей точечной оценкой л — доли голосов в городе за кандидата этой партии. Оценка S. D. выборочного распределения р в выборке объема 400 будет равна а -1/|/21±£^=0,0245. р V п V 400 Отсюда получаем, что 95 %-ный доверительный интервал для л будет следующим: р + 1,96 ир =0,4 + 1,96 • 0,0245 = 0,4 ± 0,048, т. е. [0,352; 0,448]. 2. Почва двух участков земли была тщательно проанализирована и оказалась одинаковой по составу. На этих участках была посеена пшеница одного сорта. На участок А внесено удобрение, а на участок В нет. Через месяц со дня посева пшеницы с каждого участка была произведена случайная выборка 50 растений, при этом измерялась их длина. Средние значения и выборочные дисперсии (несмещенные), вычисленные по полученным данным, оказались равными: хл=323мм, хв = 297 мм, si = 441, si = 529. Оцените разность средних рл — рв (эту величину можно при- нять за меру эффекта воздействия удобрения на рост пшеницы). Най- дите также для разности средних 99%-ный доверительный интервал. Решение (см. формулу 3 в таблице на с. 220). Точечная оценка для Ра — Рв будет равна ха — хв = 323—297 = 26 мм. Нам необходимо оценить стандартную ошибку этой величины. Прежде всего найдем несмещенную оценку дисперсии этой оценки. s2 =-------------------=(см. формулу (2) из 2.7.1, б) = 49-4414-49-529 485 504-50 — 2 221
Это число можно назвать внутренней дисперсией. Тогда стандартная ошибка переменной (хА — хв) будет следующей: o=s-i/ — ± J_=V485.|/—=4,4. |/ пА ПВ |/ 50 Окончательно с помощью доверительного коэффициента z — 2,58 мы получим 99%-ные доверительные пределы для цА— которые будут равны (хА~хв) ±20=26 ± 2,58-4,4=26 ± 11,35 мм. Итак, мы нашли 99%-ный интервал (14,65; 37,35). Упражнение 2.7.3 1. В 100 бросаниях копейки герб выпал 63 раза. Найдите 90%-ные довери- тельные границы доли бросаний, при которых появляется герб, при большом числе бросаний монеты. Замечание. Найденный интервал определяет доверительные границы (приближенЯЬ1е) Для вероятности Р (И), где событие Н означает, что выпал герб. Можно ли иа основании выборки и вычисленных границ сказать, что монета неправильная? 2. Из урны, содержащей синие и зеленые шары в неизвестной пропорции, производится случайная выборка 64 шаров (с возвращением). Оцените долю л зеленых шаров в урне, если 16 шаров в выборке оказались зелеными. Найдите (а) 95%-ные и (б) 99%-ные доверительные пределы для л, (в) вероятную ошибку оценивания. 3. С производственной линии, производящей сигареты, было отобрано 900 сигарет, 45 из них оказались бракованными. Оцените долю дефектных сига- рет во всей совокупности л и найдите 90%-ные доверительные границы для этой величины. 4. Какой объем выборки с производственной линии надо взять в предыду- щем пример6 для того, чтобы со степенью доверия (а) 95%, (б) 99,7% можно было утверйДать> что зх не отличается от выборочной доли р более чем на 5%. (При вычисЛ6НИИ °р возьмите л = 45/900.) 5. Были произведены выборки из пяти различных совокупностей, для каж- дой выборки были вычислены средние и S. D. Для каждого из множеств выбороч- ных данных, приводимых далее, найдите: (а) 95%-ные и 99%-ные доверительные интервалы для средних' каждой совокупности- (б) 90%-ные и 99,7%-ные доверительные интервалы для стандартных от- клонений совокупностей (в условных единицах): Измерения Выборочное среднее х S.D. получено на основе s2 Объем выборки п Скорость чтения Предельная нагрузка на прут Вязкость нефти Урожай зерна, удобрение А Добыча парафина из торфа (в %); рас- творитель А по 7,4 4,600 43 5,3 12 0,1 0,012 5 2,1 100 49 65- 30 40 6. После изменения некоторых условий экспериментов из предыдущего задания выбоРки были повторены. При этом вычислялись значения средних и S. D. Результаты представим в виде таблицы (в условных единицах): 222
X S п Скорость чтения после специальных упражнений 130 14 81 Предельная нагрузка на прут после химической обработки 8,2 0,11 54 Вязкость нефти с добавлением примеси 4,721 0,013 70 Урожай зерна, удобрение В 40 4,5 45 Добыча парафина из торфа с примене- нием растворителя В 6,4 2,4 50 (а) По данным таблицы вычислите 95%-ные и 90%-ные доверительные интер- валы для средних новых совокупностей. (б) Для каждого эксперимента сравните выборочные характеристики с соот- ветствующими характеристиками из задания 5. В каждом случае вычислите раз- ность выборочных средних. Можно ли сказать, что полученные разности отража- ют истинные изменения в совокупностях или же эти расхождения полностью объ- ясняются только случайностью выборок — они могли возникнуть в силу имеющегося разброса выборок. Найдите 95%-ные доверительные интервалы для каждой раз- ности средних. Помогут ли вам эти интервалы ответить на вопрос о характере расхождений между выборками? Что делать, если выборки небольшие? В этой книге мы не даем полного изложения теории малых выборок, а ограничиваемся лишь несколькими практическими советами. Прежде всего, очевидно, что чем меньше выборка, тем меньше будет степень доверия, соответст- вующая оцениваемому интервалу. И обратно, при заданном уровне доверия ширина интервала для малых выборок будет больше, чем для выборок большего объема. Учесть это обстоятельство можно, обеспе- чив зависимость доверительного коэффициента от п. Учитывающий эту зависимость доверительный коэффициент обозначают в отличие от z буквой /. Естественно, что соответствующие формулы будут совпа- дать с формулами для больших выборок, только вместо z будет стоять t. Далее приводятся формулы вычисления доверительных интервалов для среднего совокупности р и для разности средних двух совокупно- стей. Доверительный интервал Степень свободы (v) Среднее р Разность рх—1'а X ± /-О'- X (Х1-Х2)±/О-- - (Л-1 —Л-2) л-1 ПХ-1-Л2--2 Выборочные оценки для о- и о- умножаются на истинное значение t, получаемое из таблиц так называемого /-распределения Стьюдента. Значение t для данного уровня доверия определяется не 223
по объему выборки, а по числу, которое известно под названием степень свободы. Эту величину будем обозначать греческой буквой v. Для предлагаемых в книге задач приведенной сокращенной таб- лицы значений t будет достаточно. Таблица значений t Степень свободы 3 4 5 7 9 10 15 20 25 30 Доверитель- 90% 2,35 2,13 2,02 1,89 1,83 1,81 1,75 1,72 1,71 1,70 ные 95% 3,18 2,78 2,57 2,36 2,26 2,23 2,13 2,09 2,06 2,04 уровни 99% 5,84 4,60 4,03 3,50 3,25 3,17 2,95 2,85 2,79 2,75 Пример. Рассмотрим данные экспериментов (1) — (6) из зада- ний 1 и 2 упражнения 2.7.1. Первое множество наблюдений пред- ставляет собой выборку сопротивлений; измерения сопротивлений дали следующие результаты: выборка 1 : 0,32; 0,28; 0,31; 0,30; 0,29 Ом; выборка 2: известно, что х = 0,30 Ом, s2 = 10-4, п = 9. (а) Найти границы 95%-ного доверительного интервала для сред- него совокупности по данным выборки 1. (б) Вторая выборка была произведена месяцем позже первой. В те- чение этого промежутка времени значения сопротивлений могли изме- ниться. Найти границы 99%-ного доверительного интервала для изменения средних всей совокупности сопротивлений в течение месяца. Решение (а) Для выборки из пяти измерений вычисляем х = 0,30 Ом и s = = 0,0158 (по смещенной оценке s2). Для 95%-ного уровня доверия из таблицы значений t при 4 сте- пенях свободы найдем доверительный коэффициент t = 2,78. Таким образом, искомые границы доверительного интервала будут равны х + t -^==0,30 + 2,78--в’0*58 =0,30 + 0,0197 Ом. ~ 1 — ’ у-5 (б) Разность средних двух совокупностей по истечении одного ме- сяца можно оценить как хх — х2 = 0,30—0,30 = 0, т. е. выборочное среднее не изменилось. Но мы должны помнить, что хх — х2 есть слу- чайная переменная и обе выборки малы. Рассматриваемые совокупно- сти на самом деле могли иметь разные средние, хотя разность выбо- рочных средних и оказалась равной нулю (это могло произойти чисто случайно). Однако по выборочным данным можно оценить доверитель- ный интервал, с помощью которого найдем границы доверительного интервала изменения среднего, предполагая, что такое изменение произошло. 224
Сначала оценим сг _ — стандартное отклонение выборочного распределения хх — х3. Объединяя наблюдения двух выборок, получим: где s2 Qi-1) sl + Oz —l)s^ 4-0,00025+8-10-4 Л1+Л2 — 2 5+9 — 2 поэтому s = 0,0122. Таким образом, ст- - = 0,01221/ — =0,0068. *i-*2 I/ 45 Для 99% степени доверия и при 12 степенях свободы доверитель’ ный коэффициент будет равен t = 3,05. Отсюда следует, что границы искомого доверительного интервала для цх — ц2 будут равны (хх—Хо) -4- t<5- - = 0 + 3,05 • 0,0068 = 0 + 0,021 Ом. Итак, если в течение месяца изменение среднего произошло, то мы можем быть уверены на 99% в том, что величина этого изменения лежит в интервале [ — 0,021; + 0,021]. Упражнение 2.7.4 1. Для каждого из экспериментов (2) — (6)-заданий 1 и 2 упражнения 2.7.1 выполните вычисления, аналогичные предыдущему примеру. В каждом случае найдите 95%-ные и 99%-ные доверительные границы изменения средних. На основе полученных доверительных интервалов ответьте на вопрос, произошло ли изменение в действительности. Замечание. Если нуль входит в интервал, то, очевидно, мы должны допустить, что цх — |12 = 0, т. е. изменения на самом деле не произошло. Если нуль не принадлежит интервалу, то можно сделать вывод, что налицо некоторый сдвиг в значениях средних совокупностей. Более аргументированный ответ на этот вопрос будет дан в следующем параграфе. 2. Химик делает шесть измерений концентрации серной кислоты и обнару- живает, что средняя концентрация равна 9,234 со стандартным отклонением 0,12. Проводя опыты с кислотой из другой бутылки, он делает одиннадцать из- мерений, для которых средняя концентрация равна 8,86, а стандартное откло- нение — 0,21. Найдите границы (а) 90%-ных, (б) 95%-ных, (в) 99%-ных довери- тельных интервалов разности средних величин концентрации кислоты в двух 'бутылках. Были ли наполнены бутылки одной и той же кислотой? 3. С помощью случайной выборки, состоящей из 16 витаминных драже, исследовалось содержание витамина Е. Среднее значение содержания витамина Е оказалось равным 18,1 весовой единицы, а стандартное отклонение — 7,2 (вычисленное по несмещенной оценке а2). Найдите границы 95%-ного доверитель- ного интервала среднего содержания витамина Е во всей совокупности вита- минных драже. 4. Выборка лампочек некоторого сорта Л исследовалась на продолжитель- ность свечения. Время непрерывного свечения выбранных лампочек (в условных единицах): 21, 32, 28, 14, 30, 27, 30. 8 Зак. 973 225
Исследование выборки лампочек другого сорта В дало следующие резуль- таты: 27, 35, 29, 16, 25, 28, 29, 34, 18, 30. (а) Найти границы 99%-ного доверительного интервала для средней про- должительности безотказной работы лампочек каждого сорта (рл и р5). (б) Найти границы 95%-ного доверительного интервала для разности Рд — Ид средней продолжительности работы лампочек двух сортов. 5. Покрышки, произведенные на заводе А, исследовались на износ (в км пройденного пути). При этом оказалось, что средний пробег равен 25 000 км, s = 1200. При тех же условиях испытывались покрышки, изготовленные на заводе В. Средний пробег равен 23 500 км, а в = 1000. Найти 99%-ный доверительный интервал разности средних для покрышек, изготовленных на двух заводах. 2.7.2. ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ Рассмотрим второй подход к проблеме статистического вывода, известного как принятие решений. Соответствующие методы тесно связаны с методами доверительных интервалов и вместе с тем содер- жат новые идеи, такие, как мощность критерия и проверка гипотез. а) Статистические решения. Информация, полученная на основе выборки из некоторой совокупности, может быть использована для формулировки некоторых утверждений обо всей совокупности. На- пример, приступив к выпуску нового вида покрышек для автомоби- лей, мы отберем некоторое число этих покрышек и подвергнем их определенным тестам. Полученные результаты должны послужить основой для вывода о том, являются ли новые покрышки лучше ста- рых или нет, и для решения о целесообразности их производства. Подобные решения называются статистическими решениями. Очень важен их вероятностный характер, благодаря которому мы всегда в состоянии вычислить вероятность того, что принимаемое ре- шение будет ошибочным. Основное достоинство теории принятия статистических решений состоит в возможности объективного измере- ния в рамках вероятностных категорий степени риска, соответствую- щего тому или иному решению. б) Статистические гипотезы. Осуществляя эксперимент броса- ния монеты, будем записывать результаты в виде Н (герб) или Т (ре- шетка) в порядке их появления. На основании полученных наблюде- ний мы хотим сделать вывод, является монета правильной или нет. Предположим вначале, что монета правильная. Затем исследуем ре- зультаты наблюдений для выяснения, согласуются они со сделанным предположениями или нет. Мы отвергнем (примем) наше предполо- жение, если результаты не соответствуют (соответствуют) принятой гипотезе. Вообще говоря, исходное предположение должно быть переформу- лировано как предположение относительно одного или нескольких параметров совокупности. Например, в эксперименте с бросанием монеты предположение о правильности монеты равносильно тому, что вероятность р выпадения герба при каждом бросании равна 0,5. Зная р, мы получаем возможность найти распределение вероятностей числа выпадений герба при п бросаниях, т. е. соответствующее бино- миальное распределение. 226
Предположения такого рода называются статистическими ги- потезами. Очень часто они формулируются как предположения о не- изменности того или иного параметра совокупности, об отсутствии его смещения или же относительно характера изменения параметра в нескольких совокупностях. Одно из таких предположений выби- рается в качестве исходного; оно называется нулевой гипотезой и обозначается символом Нп. Например, для обозначения гипотезы «монета правильная» мы запишем Но: р = 0,5. Наряду с нулевой гипотезой рассматривают и другие возможно- сти — альтернативные гипотезы. Таким образом, процедура про- верки гипотез, представляющая собой основание статистического решения, может быть выполнена довольно точно. В случае экспери- мента с монетой альтернативной гипотезой будет р 0,5 или, воз- можно, р > 0,5. Альтернативную гипотезу будем обозначать Н1. в) Проверка гипотез. После того как нулевая гипотеза сформу- лирована, можно выяснить, какого рода выборку мы вправе ожидать при ее выполнении. Если произведенная случайная выборка заметно отличается в некотором смысле от той, которую мы ожидаем, то мы говорим, что наблюдаемое различие значительно и вправе отвергнуть нулевую гипотезу и принять альтернативную. Если наблюдаемое раз- личие невелико, то мы можем принять нулевую гипотезу или же об- ратиться к дополнительным статистическим данным, прежде чем прий- ти к окончательному выводу. Однако где проходит линия между значимостью и незначи- мостью, принятием и отвержением гипотезы /Д? Хотя в силу присут- ствия в эксперименте случайных колебаний эта граница не может быть проведена абсолютно точно, можно рассмотреть возможность опреде- ления вероятностного уровня значимости. Далее читатель увидит, каким образом принимаемое решение в проверке гипотез зависит от случайной переменной, известной как статистика критерия (теста). Примерами таких статистик, с помощью которых находят доверительные интервалы, могут служить коэффициенты доверия г и /. В общем случае также можно определить критическое значение соот- ветствующей статистики, которым пользуются не только для выясне- ния, значима ли выборочная разность или нет, но также и для оценки величины этой значимости. Для объяснения основных принципов значимости тестов мы снова рассмотрим эксперимент с бросанием монеты. На этом же примере мы обсудим некоторые важные детали. г) Принципы значимости тестов. Пример. На основании результатов бросаний мы хотим опре- делить, является монета правильной или нет. Решение этой задачи разобьем на следующие шаги. Шаг 1. Формулировка нулевой и альтернативных гипотез. В экс- перименте с монетой мы можем принять следующие гипотезы: нулевая гипотеза Но : р — 0,5 (монета правильная); альтернативная гипотеза /Дгр^-ОД (монета неправильная); эквивалентная гипотеза : р <_ 0,5 или р > 0,5; такая гипотеза называется двусторонней альтернативой. 8* 227
Шаг 2. Выбор соответствующего уровня значимости. Допустим, наше первоначальное решение состояло в отклонении нулевой гипо- тезы -— монета неправильная; тогда можно найти вероятность того, что это решение ошибочно. Уровнем значимости критерия назовем вероятность ошибочного отклонения нулевой гипотезы. Для обозначения этой вероятности, как правило, употребляют греческую букву а. Прежде чем выпол- нять эксперименты, выберем значение а. В статистике наиболее упот- ребительны следующие значения: 0,05; 0,01 и 0,001. Для эксперимента с монетой возьмем а = 0,05. Это означает, что мы должны выполнить такую процедуру проверки, при которой в 5 случаях из 100 мы приходим к выводу о неправильности монеты, хотя на самом деле она правильная. Шаг 3. Определение объема выборки п. Определение объема про- изводимой выборки зависит от таких условий, как затраты экспери- ментирования; время, необходимое на получение выборки; соблю- дение статистически неизменных условий; величина случайных коле- баний, присутствующих в эксперименте; возможность принятия не- правильного решения. Дальнейшее обсуждение проблемы определе- ния объема выборки потребовало бы более полного изучения теории проверки гипотез*. Для эксперимента с монетой выбор значения п может быть осу- ществлен в достаточно широких границах, поскольку затраты можно считать несущественными — каждое бросание и запись результата занимают немного времени. Очевидно, что если монета неправильная, то чем больше значение п, тем ярче результаты эксперимента будут подтверждать этот факт. Поэтому мы выберем п по возможности до- статочно большим — это позволит более эффективно установить ее смещение, если оно невелико. Шаг 4. Выбор тестовой статистики критерия. (Выборочное рас- пределение этой статистики в предположении /Д должно быть из- вестно.) При п бросаниях монеты число появлений герба (х) имеет биномиальное распределение вероятностей со средним пр и дисперсией пру (см. 2.4.5, а)). Известно, что если п велико и р не близко к значе- ниям 0 или 1, то биномиальное распределение может быть аппрокси- мировано нормальным с тем же средним и той же дисперсией. Величиной х мы будем пользоваться в качестве тестовой статисти- ки (статистики критерия). Информация о ее выборочном распределе- нии потребуется на следующем шаге. Шаг 5. Вычисление критической области и области принятия гипотезы. Предполагая, что пулевая гипотеза верна, а значения п и а выбраны, вычислим область значений тестовой статистики, позво- ляющую принять гипотезу Н0. Значения х, лежащие вне ее, назовем критической областью. Область значений х, позволяющая принять гипотезу /70, выбирается таким образом, что если значение тестовой * Раздел статистики, занимающийся этими вопросами, называется планиро- ванием экспериментов. — Примеч. пер. 228
статистики, полученной по данным выборки, не попадает к нее, то выполнимость предположения Нп подвергается сомнению. Для эксперимента с монетой //0 : р = 0,5 и а = 0,05. На рис. 104 показано, как нормальное распределение аппроксимирует биномиаль- ное выборочное распределение числа выпадений герба в п бросаниях. На этом же рисунке видно, как надо выбирать критические значения хг и х2 с тем, чтобы вероятность попадания значений х выборки вне интервала [хх, х2] была равна а. В нашем эксперименте нет оснований для выбора несимметричной области, поскольку нет предварительной информации, позволяющей определить направление смещения, если оно существует на самом де- ле. Герб может появляться чаще, чем решетка, и наоборот. Мы отверг- ли бы гипотезу /70, если бы число выпадений герба было бы очень мало, точно так же мы отвергли бы эту гипотезу при очень большом числе появлений решетки. Рис. 104. Выборочное распределение числа выпа- дений герба в п бросаниях. Среднее рав- но пр, S.D.—^npq В подобных ситуациях мы будем применять так называемый дву- сторонний тест, процедура которого подразумевает возможность существования смещения в обоих направлениях. (Пример односторон- него теста будет приведен далее.) Возможность ошибочно отвергнуть гипотезу Но возникает в силу того, что выборочное значение может случайно попасть в критическую область. Это произойдет, когда значение х окажется на одном из «хво- стов» распределения. Принимая во внимание симметричность области принятия гипотезы, мы приписываем каждому «хвосту» вероятность, равную а/2 (вероятность попадания х в критическую область равна а). Величина а и есть заданный уровень значимости. Для эксперимента с монетой из таблиц нормального распределения мы находим, что приблизительно для 95% выборок объемом п число выпадений герба будет лежать между хг = (пр—1,96 V npq) и х2 = (flP + 1,9бУ пр<?). Эти значения х будут критическими, они оп- ределяют границы области принятия гипотезы Но. Для их вычисления мы воспользуемся значением п, установленным для данного экспери- мента на третьем шаге, а величину р найдем из определения нулевой гипотезы (т. е. р = 0,5). Читатель, наверное, уже заметил большое 229
сходство предыдущей формулы и формул определения доверительных интервалов доли выпадения гербов в совокупности при многократ- ном бросании монеты. Очень важно подчеркнуть, что к тому же самому интервалу мы подошли с других позиций, хотя область принятия ги- потезы и доверительный интервал совпадают. Для того чтобы оконча- тельно понять сходство и различие изложенных подходов, необходи- мы большая практика в их применении, внимательное изучение этих вопросов по более полным курсам статистики. В общем случае у нас имеется тестовая статистика х, выборочное распределение которой известно и определяется с помощью некоторых параметров, например, таких, как р, и сг. Значения этих параметров определяются в условиях нулевой гипотезы Но. Критические зна- чения хг и х2 находятся из интегральных таблиц выборочного рас- пределения с тем, чтобы Р [%! < X < Х2] = 1 — а- Интервал хг < х < х2 определяет область, обеспечивающую про- верку нулевой гипотезы с соответствующим уровнем значимости (а). Как правило, предполагают, что стандартизированная величина z = либо нормальна, либо по крайней мере является прибли* женно нормальной, поэтому критическое значение коэффициента z может быть найдено из таблиц нормального распределения. Соот- ветствующие значения х находятся затем с помощью линейного пре- образования. Шаг 6. Формулировка правила проверки гипотезы. Общее правило проверки гипотезы может быть сформулировано следующим образом: а) Гипотеза Но при заданном уровне значимости а отвергается, если выборочное значение х попадает в критическую область (т. е. лежит вне интервала [xlt х2]). В таком случае принимается альтернативная гипотеза б) Гипотеза Но принимается, если выборочное значение принад- лежит области принятия гипотезы [xj, х21. (В некоторых случаях, особенно при небольшом объеме выборки, а также для значения х, близ- кого одному из критических значений хх или х2, решение о принятии гипотезы Но откладывается до момента, когда будет собрана допол- нительная информация.) Шаг 7. Выполнение эксперимента и проверка гипотезы. Выполним п испытаний эксперимента и на основе полученных результатов най- дем значение выбранной тестовой статистики. Затем применим пра- вило проверки гипотезы, сформулированное на предыдущем шаге. Замечание. Прежде чем выполнять эксперименты, необхо- димо тщательно сформулировать все процедуры статистической про- верки гипотез. До начала работы с полученными наблюдениями вы- борки нужно выбрать тестовую статистику, уровень значимости, ре- шить вопрос об использовании одностороннего или двустороннего критерия. Изменение условий проверки гипотез на основе интуитив- ных соображений, как правило, ведет к неверным вероятностным выводам. 230
Окончательное решение примера. Проверка монеты на смещение. Шаг 1. Гипотезы: Но: р = 0,5; Т/i: р 0,5. Шаг 2. Уровень значимости: а = 0,05. Шаг 3. Объем выборки: предположим, мы решили монету бро- сать 100 раз, т. е. п — 100. Шаг 4. Тестовая статистика: х — число гербов, выпавших в 100 бросаниях. В условиях гипотезы Но х имеет приближенно нормальное рас- пределение со средним 100 • 0,5 = 50 и стандартным отклонением V100 • 0,5 • 0,5 = 5. Шаг 5. Область принятия гипотезы и критическая область. Критическими значениями х (в предположении, что измерения непрерывны) будут следующие: хг=пр—1,96 V пр</=40,2 и х2=пр + 1,96 l/np<7=59,8. Областью принятия гипотезы будет множество целых чисел, лежащих между 41 и 59 включительно. Критической областью будут множества целых чисел между 0 и 40 и между 60 и 100 включительно. Шаг 6. Правила проверки гипотезы. а) Гипотеза Но (монета несмещенная, т. е. правильная) должна быть отвергнута при 5%-ном уровне значимости, если число появле- ния герба в выборке принадлежит одному из множеств критической области. б) Гипотеза Но должна быть принята (или же ее принятие отло- жено), если наблюдаемое число появлений герба лежит в области принятия гипотезы, т. е. между 41 и 59 включительно. Шаг 7. Выполнение эксперимента и проверка гипотезы. Чита- тель может самостоятельно выполнить этот эксперимент, т. е. взять монету и подбросить ее 100 раз, записав при этом число выпадений герба. На основании этого эксперимента необходимо решить, являет- ся монета правильной или нет. Для обсуждения процесса проверки гипотезы мы рассмотрим сле- дующие три возможных результата: 1) х = 38, 2) х = 46, 3) х = 58. Результат 1. х = 38 принадлежит левому множеству критиче- ской области. Мы отвергаем гипотезу Но и делаем вывод о том, что мо- нета смещена в сторону выпадения решетки по сравнению с выпаде- нием герба. Сделанный вывод может оказаться неверным в 5% слу- чаев. Результат 2. х = 46 лежит внутри области принятия гипоте- зы, поэтому мы принимаем Но. Поскольку значение 46 далеко от гра- ниц критических значений, у нас нет оснований подозревать смещение у монеты. ?3|
Результат 3. х = 58 находится внутри области принятия гипо- тезы, хотя и близко к правому критическому значению. Можно было бы принять гипотезу Но, основываясь на правиле (б). Однако целе- сообразнее на этом этапе не принимать никаких решений. У нас мо- жет возникнуть подозрение в том, что в монете имеется смещение, которое ведет к тому, что герб выпадает чаще, чем решетка. В таком случае желательно получить вторую выборку и провести проверку ги- потезы о подозреваемом смещении с помощью одностороннего теста. Альтернативной гипотезой будет Нх : р > 0,5. Недопустимо пользоваться теми же данными выборки (х = 58) для повторной проверки. Если бы мы пошли на это, то укрепились бы в подозрении о существовании смещения в монете; изменился бы и ко- эффициент г, соответствующий 5 %-ному уровню значимости. Упражнение 2.7.5 1. Проверяется правильность обыкновенной игральной кости. В S00 бро- саниях наблюдалось 140 выпадений шестерки. Проверьте нулевую гипотезу о правильности игральной кости. Воспользуйтесь двусторонним тестом для уровней значимости (а) 0,05 и (б) 0,01. 2. Урна содержит большое число цветных шаров, про которые известно только, что они двух цветов — черные и белые. Какое решение можно принять относительно следующих гипотез, если в случайной выборке объемом 100 (с возвращением) 57 шаров оказались белыми? (1) Н :р = 0,5; (2) Н : р = 0,45; (3) И : р = 0,6; (4) И : р = 0,7. Каждое утверждение запишите на языке нулевой гипотезы; определите полные двусторонние альтернативные гипотезы. Для каждой проверки возьмите а = 0,05, р — доля белых шаров в урне. 3. Некто утверждает, что 5% выпускаемых с производственной линии то- варов бракованные. В качестве нулевой гипотезы рассмотрите Но : р = 0,05 и сформулируйте правило принятия решения при ее проверке с 1%-ным уровнем значимости, предполагая альтернативную гипотезу двусторонней. Объем произ- водимой выборки п = 400. ₽** Каково будет ваше решение относительно гипотезы если в произведен- ной выборке окажется 26 бракованных единиц? Пример односторонней проверки. За ряд лет рассматривается уровень результатов сдачи вступительных экзаменов по математике в высшую школу. Средний процент сдавших экзамены за этот проме- жуток времени оказался равным 55%. В 1968 г. из экзаменовавшихся 100 абитуриентов экзамены по математике выдержали 62 человека. Проверьте гипотезу о том, что это довольно высокий процент, т. е. 1968 г. был «удачным годом» в области математики для этого колледжа. Возьмите а = 0,01. Решение. Под рассматриваемой совокупностью мы подразумеваем результаты сдачи абитуриентами экзаменов по математике за все годы. Пусть р будет долей абитуриентов в этой совокупности, успешно вы- державших экзамен по математике. Процедура проверки гипотезы будет такой. Шаг 1. Гипотезы: Но : р = 0,55; П1 : р > 0,55 (односторонняя проверка). 232
Альтернативной гипотезой будет утверждение, состоящее П том, что доля успешно сдавших экзамен по математике в 1968 г. была больше обычной доли сдающих этот экзамен. Шаги 2 и 3. а = 0,01; п = 100. Шаг 4. Доля Р абитуриентов, успешно сдавших экзамен, в груп- пе^из 100 человек будет случайной переменной; эта величина имеет приблизительно нормальное распределение со средним р и дисперсией Мы можем в качестве тестовой статистики выбрать Р. Шаг 5. Область принятия гипотезы. Для этого примера требует- ся найти только одно критическое значение Р, поскольку мы интере- Рис. 105. Выборочное распределение Р (ап- проксимировано нормальным распределением) суемся смещением лишь в одну сторону от нормы. На рис. 105 показа- но выборочное распределение Р, область принятия гипотезы и кри- тическая область. Из таблиц нормального распределения находим критический ко- эффициент’г = 2,33 для одностороннего 1%-ного уровня значимости. Итак, критический уровень доли Р будет: /\=р + 2,33 |/ =0,55 + 2,33 ]/ °;5150°’45 =0.666. Поэтому областью принятия гипотезы будет интервал [0; 0,66]. Шаг 6. Правило проверки гипотезы. а) Если выборочная доля сдавших экзамены в 1968 г. больше чем 0,66, то гипотеза Но о том, что подготовка абитуриентов по математике в 1968 г. значительно превышает средний уровень, должна быть от- вергнута при 1%-ном уровне значимости. б) В других случаях До не отвергается. Шаг 7. Выполнение проверки. Выборочное значение Р равно 0,62. Это недостаточно большое значение для Р, чтобы можно было отверг- нуть гипотезу Но. Таким образом, при 1%-ном уровне значимости мы не можем сделать вывод о том, что абитуриенты 1968 г. имеют лучшую по сравнению с предыдущими годами подготовку по математи- ке. 233
Упражнение 2.7.6 1. В случайной выборке, состоящей из 900 человек с темными волосами, 150 имеют голубые глаза. Предположим, что доля голубоглазых людей среди всего населения известна и равна 0,25. Проверьте гипотезу о том, что доля тем- новолосых людей с голубыми глазами меньше, чем доля голубоглазых среди всего населения. Возьмите а = 0,05. 2. Известно, что 5% всех застраховавших свою жизнь умирает но достиже- нии 60 лет. В группе из 1000 человек этого возраста, работающих в строитель- стве, умерло 68. Проверьте гипотезу о том, что застрахованные люди, работаю- щие в строительстве, чаще умирают в 60 лет, чем все остальные застрахованные. 3. Считается, что завод, производящий за неделю 1000 единиц некоторого вида продукции, работает удовлетворительно, если в среднем доля бракованных изделий при контроле качества не превышает 3%. Допустим, в течение некоторой педели контролером было забраковано 38 изделий. Стоит ли директору завода провести более полную проверку качест- ва изделий производственной линии или же следует отнести высокий процент дефектной продукции этой недели на счет случайных изменений в условиях производства? Воспользуйтесь односторонней проверкой гипотезы с 5%-ным уровнем значимости. На примерах, в которых для тестовой статистики применялось биномиальное распределение, мы познакомили читателя с основ- ными принципами проверки гипотез. При других тестовых статистиках и распределениях проверка гипотез осуществляется аналогично. Далее будут рассмотрены три основные задачи, состоящие в про- верке гипотез о средних; их решение иллюстрируется на примерах. Эти проверки применяются в большинстве статистических исследова- ний; читателю следует внимательно изучить их и хорошо запомнить. После каждого примера следуют упражнения. Большое число различ- ных задач приводится в конце этой главы; решение этих задач поможет читателю проверить способность правильно выбирать ту проверку, которая требуется для конкретной ситуации. Для удобства приведем короткую таблицу значений критического- коэффициента z для случая, когда тестовая статистика имеет нормаль- ное распределение. Уровень значимости (а) 0,05 0,01 0,001 Критический коэффициент г Односторонняя проверка 1,65 2,33 3,08 Двусторонняя проверка 1,96 2,58 3,27 д) Проверка гипотезы о среднем совокупности. Пусть из нормаль- ной совокупности с неизвестным средним р и известным S.D. о про- изведена случайная выборка объема п. Задача состоит в том, чтобы проверить гипотезу Но: р = р', т. е. проверить предположение о ра- венстве среднего всей совокупности значению р'. Если гипотеза Но верна, то величина z = имеет стандарт- ов/п 234
ное нормальное распределение. Поэтому z (или х) может служить тестовой статистикой. Пример. Предположим, фирма, производящая электрические лампочки, гарантирует, что среднее время безотказной работы лампо- чек мощностью 60 Вт равно по меньшей мере 800 ч со стандартным от- клонением 120 ч. Из некоторой партии шестидесятиватных лампочек производится случайная выборка 25 лампочек, для которой выбороч- ное среднее времени работы лампочек оказалось равным 750 ч. Можно ли на основании этого сказать, что исследуемая выборка лампочек не удовлетворяет гарантии? Решение. Пусть р — среднее партии лампочек. Шаг 1. Нулевая гипотеза Но : р = 800. Альтернативная гипотеза Нг : р < 800 (односторонняя проверка; нас интересует, будет ли среднее меньше гарантированного миниму- ма). Шаги 2 и 3. п — 25 (дано); выбираем а = 0,05. Шаг 4. Если х — выборочное значение среднего, то х—800 г—--------- 120 1/25 есть стандартная нормальная (возможно, приближенно) величина при условии, что Но верна. Величиной г мы будем оперировать в ка- честве тестовой статистики. Шаг 5. При 5%-ном уровне значимости для односторонней про- верки наименьшее значение, при котором /70 еще не отвергается, как следует из таблиц нормального распределения, будет г = — 1,65. Таким образом, область принятия гипотезы — интервал — будет [— 1,65; + оо). Шаг 6. Правило проверки гипотезы. а) Партия лампочек не удовлетворяет гарантии, если значение z, вычисленное по выборке, меньше чем — 1,65. б) В других случаях считаем, что партия удовлетворяет гарантии. Шаг 7. Выполнение проверки. По выборочным данным находим, что У 25 Вывод. Исследуемая партия лампочек должна быть забрако- вана, поскольку — 2,83 < — 1,65. Время безотказной работы лампо- чек в партии значительно расходится с гарантированным временем работы 800 ч и более. Это решение будет неверным менее чем для 5% всех случаев. 235
Упражнение 2.7.7 1. В выборке, состоящей из 625 болтов, средняя длина болтов оказалась равной 20,05 мм. Можно ли эту выборку считать случайной выборкой из сово- купности болтов со средней длиной 20 мм и S. D., равным 0,1 мм? Примите а = 0,001. 2. Известно, что одна химическая реакция при производстве некоторого вещества дает в среднем 220 кг этого вещества; S. D. = 12 кг. После некоторых изменений в производственном процессе каждая химическая реакция в среднем стала давать 225 кг вещества с тем же самым отклонением от средней. Проверьте нулевую гипотезу о том, что изменения в технологическом про- цессе не привели к значительному увеличению производства (а) при уровне зна- чимости 0,05, (б) при уровне значимости 0,001. 3. Предельная сила натяжения некоторого вида прядильной нити в сред- нем равна 8 г. Выборку этого вида прядильной нити из 64 мотков обработали некоторым химическим составом. После просушки была заново измерена пря- дильная сила натяжения нитей, в среднем она оказалась равной 8,5 г. I Предполагая, что S. D. предельной силы натяжения равно 2 г до и после обработки химическим составом, проверьте гипотезу о том, что эта обработка не увеличила предельной силы натяжения нити. (Сделайте проверку при уровне значимости 0,05 и 0,01. Подумайте, нужна ли здесь односторонняя или двусто- ронняя проверка.) е) Критерии сравнения. Пример. Группе из 10 школьников младших классов был дан стандартный тест на проверку скорости чтения. Затем со школьника- ми был проведен специальный курс занятий, после чего детям дали второй тест. Скорость чтения оценивалась в баллах, результаты пер- вого и второго тестов таковы: Школьники 123456789 10 Первый тест Второй тест 7568387824 6798677947 Можно ли сказать, что занятия по увеличению скорости чтения дали пользу? Предполагается, что оба теста сравнимы по трудности и соответствуют нормальному распределению баллов. Решение. Как видим, для каждого теста имеется заметное разли- чие скорости чтения от школьника к школьнику. Эти колебания не дают возможности определить «на глаз», произошло ли увеличение баллов после курса занятий. Чтобы обойти это препятствие, можно рассмотреть для каждого школьника только изменения в баллах; таким образом, если занятия не принесли эффекта, то среднее измене- ний будет равно нулю. Наблюдения, в которых результаты экспериментов объединены в пары и каждая пара представляет собой самостоятельную экспери- ментальную единицу, можно исследовать, применяя критерии срав- нения. Каждая пара дает одно сравнение, которое определяет меру эффекта некоторого действия (в нашем случае курса занятий). Обозначим через d разность результатов данной пары; d будет иметь нормальное распределение со средним р и S.D. — о (в этом при- 236
мере оба параметра известны.) Значения величин для баллов за чте- ние представлены следующим образом: Школьники 1 23456789 10 d = 2-й— 1-й балл —1 2303 —1 012 3 Шаг 1. Нулевая гипотеза Но : р = 0 (т. е. курс занятий не при- вел к увеличению скорости чтения). Альтернативная гипотеза Нг: р, > 0 (т. е. занятия способствовали беглости чтения). Нг — односторонняя гипотеза, поэтому мы должны применить одностороннюю проверку. Шаги 2 и 3. Поскольку тесты предназначались для десяти детей, то п = 10. Возьмем а — 0,05. d—0 Шаг 4. Величина z = — стандартная нормальная перемен- ная, она может служить тестовой статистикой, если значение о из- вестно из предыдущих экспериментов. В нашем случае о не дано, оно должно быть оценено по выборочным наблюдениям. В качестве тесто- d—0 вой статистики рассмотрим величину t = ~ (см. 2.7.1, в)), которая sFVп имеет /-распределение Стьюдента с п — 1 степенями свободы. Шаг 5. Область принятия гипотезы. Критическое значение t при уровне значимости 0,05 (односторонний тест) равно верхнему 90 % -ному доверительному коэффициенту (см. с. 224). Для 9 степеней свободы это значение равно 1,83. Отсюда находим, что область приня- тия гипотезы будет представлять собой все множество от — оо до 1,83. Шаг 6. Правило проверки гипотезы. а) Если значение t, вычисленное по данным выборки, больше чем 1,83, то мы можем сделать вывод, что курс занятий, направленных на увеличение скорости чтения, принес значительный эффект. б) Если значение t 1,83, то мы не можем отвергнуть (при 5%-ном уровне значимости) гипотезу о том, что наблюдаемое среднее увеличе- ние баллов связано только со случайными колебаниями в результатах тестов. Шаг 7. Выполнение проверки. Из данных выборки имеем 2d = 12 и 2d2 = 38. Затем находим . 12 , „ 2 Td2—nd2 38 — 14,4 d—----= 1,2 и s2=-----------=-------'— — 10 п — 1 9 Поэтому 9,34, s И0,262 w 237
Вывод. Поскольку 2,34 > 1,83, мы утверждаем, что при 5 %-ном уровне значимости занятия заметно увеличили скорость чтения школьников. Замечания. Мы привели пример применения так называемой теории малых выборок; малое число наблюдений для оценивания S.D. = <т приводит в случае проверки гипотез к Z-статистике. Теория малых выборок коротко обсуждалась в 2.7.1, в). Другие способы проверки гипотез читатель найдет в специальных курсах статистики. Приведенные здесь критерии сравнения помогут в усвоении изложенных в этих курсах идей. Упражнение 2.7.8 1. Два химика анализируют ежедневный выпуск некоторого вида химичес- кой смеси. Каждый производит случайную выборку из дневной партии и опре- деляет процентное содержание воды в этой выборке. Результаты, полученные в течение 8 дней, следующие: День 1 2 3 4 5 6 7 8 Химик А 53 46 55 53 48 45 50 52 Химик В 50 47 53 53 47 46 45 50 Следует ли из этих данных, что методы анализа, применяемые химиками, существенно различаются между собой? Выполните проверку этой гипотезы: (а) оценивая а по различию в данных, (б) предполагая, что а — 1,23. В каждом случае возьмите rf = 0,05. Можно ли объединить данные в пары? Какого рода колебания взаимопогашаются при таком объединении? Какую проверку сле- дует применить — одностороннюю или двустороннюю? 2. Тридцать студентов выполняли контрольную работу до и после спе- циальных занятий по математике. Для каждого студента записывалась разница полученных оценок (из оценки, полученной по второй контрольной работе, вычиталась первая оценка). Среднее и S. D. этих разностей оказались равными соответственно: d= 6,1 и s = 2,3. Были ли проведенные занятия эффектив- ными? (Замечвние. Поскольку выборка большая, величина t будет хорошо аппроксимироваться нормальным распределением, поэтому вместо о можно под- ставить ее оценку s.) 3. Для исследования на растяжимость некоторого вида резины после хи- мической обработки было отобрано и перенумеровано шесть мотков резины. Каждый отобранный моток был разделен пополам, одна половина подвергалась химической обработке, другая — нет. Затем с помощью прибора, измеряю- щего растяжение материала, было замерено растяжение (в %) двенадцати кус- ков резины. Результаты представлены в таблице: Исследуемый кусок 1 2 3 4 5 6 Обработанная половина Необработанная половина 18,1 16,3 17,3 17,0 19,1 18,4 18,4 17,6 17,2 17,0 16,7 16,2 Увеличила ли химическая обработка растяжимость резины? 238
ж) Разность двух средних. Следующий критерий очень часто встре- чается в статистических расчетах. Пример. Студенты последних семестров двух высших школ сдавали экзамены по физике. В вузе А, где экзаменовались 30 сту- дентов, средняя оценка оказалась равной 52. Во втором вузе В—36 студентов и их средняя оценка оказалась равной 47. Стандартное от- клонение оценок на экзаменах по физике, вычисленное для нескольких тысяч студентов, равно <т = 12. Подготовлены ли студенты вуза А по физике лучше, чем студенты вуза В, или нет? Решение. Как видно из данных, студенты из вуза А подготовлены по физике в среднем лучше, чем студенты из вуза В. Для студентов, о которых имеются данные, это бесспорно. Однако мы можем рассмотреть этот вопрос более широко: можно ли утверждать, что вуз А дает лучшую подготовку по физике, чем вуз В. После установления этого факта можно было бы выяснить причины лучшей подготовки студентов в вузе А. Возможно, при этом оказалось бы, что в вузе А лучше лабораторное оборудование, сильнее препода- вательский состав по физике. Более хорошая подготовка могла быть следствием и того, что в вузе А было проведено больше занятий по физике, чем в вузе В, и т. д., и т. п. Изучение причин подобного ре- зультата не является предметом статистического исследования, кото- рое в основном ограничивается лишь демонстрацией значимой раз- ницы между двумя выборочными средними. Проверка гипотезы состоит в следующем. Шаг 1. Обозначим через р,д и р,в средние совокупности оценок по физике для студентов вузов А и В соответственно. Нулевая гипотеза Но-. р.д = рв (рл — рв = 0). Альтернативная гипотеза Н-Ц. рл > рв- Поскольку нас интересует только, лучше ли подготовлены сту- денты вуза А, чем студенты вуза В, то мы пользуемся односторонней альтернативной гипотезой. Шаги 2 и 3. Па = 30 и пв = 36 (дано). Возьмем а — 0,05 — уро- вень значимости. Шаг4. Тестовая статистика. У нас нет другой информации, кроме двух выборочных средних. Если бы мы даже имели индивидуальные результаты студентов, мы не могли бы применить парный критерий сравнения, так как для объединения в пары у нас нет объективных причин. Разность средних хд—Хв представляет собой меру сравнения подготовки студентов вузов А и В. Эта величина распределена при- ближенно нормально со средним рд— рд и стандартным отклонением Поэтому в качестве тестовой статистики мы можем взять.стандартную нормальную величину 239
(хл-Хд)-(рл-р.д) о' Если Но истинна, то — цд = 0, поэтому тестовая статистика в этом случае превращается в такую: Z = *А~ХВ о' Шаг 5. Область принятия гипотезы. Критическое значение z при 5 %-ном уровне значимости для односторонней проверки гипотез равно 1,65. Поэтому областью принятия нулевой гипотезы будет множество значений z, не превосходящих 1,65. Шаг 6. Правило принятия гипотезы. а) Если выборочное значение z> 1,65, то делаем вывод, что вуз Л дает подготовку по физике лучше (при 5%-ном уровне), чем вуз В. б) Если z < 1,65, то заключаем, что общая подготовка по физике в вузах А и В практически одинакова. Шаг 7. Выполнение проверки. Значение о дано и равно 12. Поэтому Таким образом, выборочное значение тестовой статистики будет: z ХА~ХВ 52—47 2,96 ^1,69. О Вывод. Подготовка по физике студентов из вуза А значительно лучше, чем подготовка студентов из вуза В при 5%-ном уровне зна- чимости. Преподавателям из вуза В было бы полезно установить при- чину различия в качестве подготовки студентов по физике. Упражнение 2.7.9 1. С целью ускорения производства некоторого товара производственная линия подверглась модификации. Для исследования эффекта от этой модифика- ции было зафиксировано время изготовления каждой из 50 единиц товара при старом и новом процессе. Для немодифицированного процесса среднее время из- готовления одной единицы товара оказалось равным 35 с, а для процесса, под- вергшегося модификации — 33 с. Стандартные отклонения времени изготовле- ния товаров для первого и второго процессов можно приблизительно считать одинаковыми. Вычисленное значение объединенной оценки S. D. равно 1,5 с. Можно ли сделать вывод, что скорость изготовления товаров при модифи- цированном процессе больше? 2. Выборка из 50 стальных пружин исследовалась на растяжение. При этом оказалось, что среднее растяжение при нагрузке в 1 кг равно 3,8 мм. Другую вы- борку, состоящую из 40 таких же пружин, подвергли горячей обработке и измерили среднее их растяжение при той же нагрузке. Выборочное среднее растяжение оказалось равным 4,0 мм. Общее стандартное отклонение растяже- ний для одной пружины можно положить равным 0,5 мм. Можно ли утверждать, что горячая обработка значительно увеличила растяжимость пружин? 240
3. Для проверки эффекта нового лекарства были отобраны две случайные группы страдающих гриппом по 60 человек в каждой. Одной группе давали таблетки, не содержащие никакого лекарства, другой группе давали по внеш- нему виду такие же таблетки, но содержащие новый вид лекарства от гриппа. В первой выборке люди выздоровели в среднем через 7 дней, тогда как во второй — в среднем через 6 дней. Стандартное отклонение для продолжитель- ности лечения гриппа (для одного человека независимо от того, принимал или не принимал он лекарство) можно положить равным 2 дням. Можно ли на основании полученных результатов сказать, что новое лекарство существенно ускоряет выздоровление от гриппа? Упражнение 2.7.10 (смешанные задачи) 1. Сельскохозяйственный эксперимент показал, что 50 участков, засеян пых некоторым сортом пшеницы, дали в среднем урожай, равный 76,3 х X 103 м3/км2, со стандартным отклонением, равным 5,2 103 м3/км2. Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов для среднего урожая с одного участка при посеве данного сорта пшеницы. 2. На том же поле (см. задание 1) выбрано еще 50 участков, которые засея- ны другим сортом пшеницы. Средний урожай на участках с этим сортом оказался равным 80,1 • 103 м3/км2, a S. D. = 7,5 • 103 м3/км2. Будет ли средний урожай этого сорта пшеницы значимо превосходить,, средний урожай пшеницы пер- вого сорта. Предположите, что все условия двух экспериментов совпадают. Возьмите а = 0,05. 3. Предположим, что при выполнении эксперимента в задании 2 выбира- лось небольшое поле из 25 участков. Каждый участок был разделен на две рав- ные части: случайным образом выбиралась одна половина и засеивалась первым сортом пшеницы, другая часть засеивалась другим сортом. Урожай измерили и записали разность урожаев для каждого участка (урожай пшеницы второго сорта минус урожай пшеницы первого сорта). Выборочное среднее разности урожаев оказалось равным 3,5 • 103 м3/км2, а подсчитанная дисперсия — 16 х X 103 м3/км2. (а) Дает ли второй сорт пшеницы существенно больший урожай, чем пер- вый? (б) Проверьте гипотезу о том, что разность средних урожаев больше чем 5 • 103 м3/км2. (в) Получите границы 95%-ного доверительного интервала для совокуп- ности разностей средних урожаев. (г) Что можно сказать о планировании экспериментов в этом задании и в заданиях 1 и 2? 4. В школе случайным образом отобрали 40 мальчиков и 40 девочек. Каж- дый из отобранных учеников получил один и тот же тест для выявления умст- венных способностей. Результаты теста: Мальчики Дерочки Средний балл Стандартное отклонение 71 5 76 6 Проверьте при уровне значимости 0,05 гипотезу о том, что опрошенные девочки более способны, чем мальчики. Получите границы 99%-ного доверительного интервала для разности сред- них двух рассмотренных совокупностей (среднее для девочек минус среднее для мальчиков). 5. Фирма, производящая новый вид лекарства, объявила, что оно излечи- вает от гриппа менее чем за 4 дня и его эффективность равна 95%. В случайной выборке из 300 человек, заболевших гриппом и принимавших это лекарство, 241
272 поправились менее чем за 4 дня. Было ли заявление фирмы состоятельным? (Примените односторонний критерий с 1%-ным уровнем значимости.) 6. Было произведено 10 измерений диаметра оси пропеллера. При этом ока- залось, что среднее х = 6,20 мм, а стандартное отклонение s = 0,05 мм (ис- пользовалась несмещенная оценка). Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов истинной величины диаметра. Поскольку выборка мала, примените /-статистику. 7. Пропеллер из задания 6 поместили в условия с высокой температурой и произвели еще 7 измерений диаметра его оси. Среднее на этот раз оказалось равным 6,25 мм, а стандартное отклонение — 0,05 мм. Можно ли из этого сде- лать вывод, что диаметр оси пропеллера существенно увеличивается (при 5%-ном уровне значимости) в пространстве с высокой температурой? 8. Проведено шесть измерений времени реакции насекомого на некоторый возбудитель: 0,20; 0,22; 0,19; 0,21; 0,20; 0,21 с. Найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов среднего времени реакции для всей совокупности измерений. 9. Автомобиль имеет четыре покрышки, каждая наполовину сделана из ре- зины сорта А, а наполовину — из резины сорта В. Все колеса автомобиля вра- щаются с одинаковой скоростью, поэтому можно считать, что они находятся в одинаковых условиях. После 10 000 км пути покрышки были исследованы на износ, результаты исследования (в баллах) приводятся в таблице: Покрышка 1 2 3 4 Износ резины А Износ резины В 32 25 40 28 36 27 35 26 Сделайте проверку односторонней гипотезы о том, что резина В больше изнашивается, чем резина А. Возьмите а = 0,05.
28 ГЛАВА ПАРНЫЕ (ДВУМЕРНЫЕ) ЭКСПЕРИМЕНТЫ 2.8.1 ПРИМЕРЫ ПАРНЫХ ЭКСПЕРИМЕНТОВ В экспериментах, рассматриваемых до сих пор, при каждом испы- тании проводилось только одно измерение. Очень часто выполняются такие эксперименты, в которых измеряют две или более наблюдаемые характеристики. Подобные эксперименты называются многомерными. В приведенной таблице даются примеры объектов измерения и их ха- рактеристики, полученные в результате случайных экспериментов: Объекты измерения И змеряемые характеристики 1 2 3 1. Солдат 2. Пенни 3. Студент 4. Образец сплава металлов 5 Сеянец 6 Яйцо кукушки 7. 11-летний школь- ник Вес Время обращения Математические способности Твердость Возраст Диаметр Средний школь- ный балл Рост Вес Способности в других областях Прочность на растяжение Высота Объем Годы пребывания в школе Вес Принадлежность родителей к соци- альной группе В каждом из экспериментов 1—5 над объектом производится два измерения; такие эксперименты называются двумерными, или парными. Эксперименты 6 и 7 содержат три измеряемые характеристики; их можно назвать трехмерными. 2.8.2. ПОНЯТИЕ СТАТИСТИЧЕСКОЙ ЗАВИСИМОСТИ Цель проведения парных экспериментов заключается в выясне- нии, существует ли зависимость между полученными в результате переменными. Если такая зависимость существует, то можно вычислить меру этой зависимости и найти математическое уравнение, более или менее точно ее отражающее. Для иллюстрации различного рода зави- симостей, которые мы будем в дальнейшем обсуждать, рассмотрим не- которые числовые примеры парных экспериментов. 243
а) Иллюстративные примеры. Эксперимент 1. Случайным образом были отобраны десять детей, для каждого ребенка измерили его рост и вес. Результаты измерений: Ребенок 1 2 3 4 5 6 7 8 9 10 Рост, м 0,62 0,58 0,54 0,59 0,60 0,65 0,58 0,62 0,58 0,60 Вес, унция 150 120 100 120 130 170 ПО 140 130 140 Эксперимент 2. Из большого мешка, содержащего монеты оди- накового достоинства, случайным образом отобрали десять монет. Каждая из них была взвешена и для каждой был определен ее возраст. Результаты полученных наблюдений: Пенни 1 2 3 4 5 6 7 8 10 Время обращения, лет Вес, унция/100 9,41 9 9,50 14 9,33 17 9,34 23 19,31 31 9,26 35 9,22 42 9,30 46 9,15 50 9,08 Эксперимент 3. Из старшего класса некоторой школы случайно отобраны десять учеников. Данные об их среднегодовых оценках по математике и другим дисциплинам (по стобалльной системе в %): Ученик 1 2 3 4 5 6 7 8 9 10 Математика, % 80 48 62 53 45 72 60 41 53 57 Другие дисциплины, % 53 61 56 72 48 51 45 58 50 46 Обсуждение. Каждый из приведенных экспериментов со- стоит в получении случайной выборки десяти объектов измерения из некоторой совокупности; для каждого объекта измеряются две харак- теристики. Таким образом, все три эксперимента будут парными, . а объем выборки в каждом случае равен десяти. Чтобы выявить зависимость (или связь) между двумя соответствую- щими парами переменных, мы должны изучить множества результа- тов наблюдений. Однако, прежде чем приступить к выполнению этой задачи, полезно обсудить некоторые предварительные идеи. Какого рода зависимости мы можем получить? Будет ли тяжелый по весу маль- чик высоким? Будет ли старая монета меньше весить, чем новая? 244
Если ученик имеет хорошие оценки по математике, будет ли он иметь хорошие оценки и по другим дисциплинам? Очевидно, что на эти вопросы нельзя дать однозначные, абсолют- но точные ответы, однако мы можем аргументированно на первые два вопроса ответить «да, в среднем» и «не знаем» — на третий. Наши наблюдения помогут нам решить, является ли ответ «да» правильным, и позволят найти способ уточнить ответ «не знаем». б) График рассеяния. Как всегда, когда наблюдения представле- ны в таблицах, первый шаг в анализе процесса состоит в построении различного рода графиков и диаграмм, с помощью которых можно было бы исследовать его основные характеристики и направление Рис. 106 развития. Наиболее простую иллюстрацию парных наблюдений дает график (или диаграмма) рассеяния. Любые два измерения объекта можно рассматривать как упорядоченную пару чисел и изобразить ее точкой на плоскости в прямоугольной системе координат. Таким образом, каждому наблюдаемому объекту соответствует точка на плоскости. Множество этих точек образует график рассеяния экспери- мента. На рис. 106 изображены графики рассеяния для трех экспери- ментов из 2.8.2, а). Замечание. Для простоты численная разметка шкал опуще- на; разумеется, при практической работе с данными такое упрощение нецелесообразно. 245
Упражнение 2.8.1 1. Изучите графики на рис. 106 и ответьте на следующие вопросы: (1) Всегда ли ребенок данного роста весит больше, чем ребенок меньшего роста? (2) Будет ли в среднем менее высокий ребенок чаще весить больше, чем ре- бенок высокого роста? (3) Легче ли старая монета более новой? (4) Приведите возможные причины этой зависимости. (5) Отличается ли зависимость в росте и весе мальчиков от зависимости возраста и веса для монет? Если да, то попытайтесь объяснить это различие. (6) Интересуется ли студент, успешно занимающийся математикой, дру- гими предметами больше, чем студент, который не выделяется математически- ми способностями. Подтверждается ли ваш ответ графиком рассеяния? (7) Можете ли вы сказать, что между ростом и весом ребенка существует определенная связь? Если это так, опишите эту связь. (8) Существует ли зависимость между величинами возраста и веса монеты? Если это так, то дайте словесное описание этой зависимости. (9) Связаны ли математические способности с успехами в других дисцип- линах? Если да, то опишите эту зависимость. 2. Вновь нарисуйте приведенные выше графики, пользуясь осями коорди- нат с разметкой шкал. После этого ответьте на следующие вопросы. (1),Известно, что рост ребенка из совокупности эксперимента 1 оказался равным 0,6 м; как выдумаете, чему будет равен его вес? (Для аргументированной оценки воспользуйтесь графиком рассеяния.) (2) Известно, что вес другого ребенка оказался равным 100 унциям; как вы думаете, чему равен приблизительно его рост? (3) Если у вас есть монета выпуска 1940 г. (эксперимент 2), то сколько (приблизительно) она будет весить? Считайте, что эксперимент проводится в 1976 г. (4) Если ученик на экзаменах по другим дисциплинам (кроме математи- ческих) получил 85 баллов (эксперимент 3), получит ли он хорошую оценку на экзамене по математике? Попытайтесь предсказать его оценку по матема- тике (по стобаллыюй системе). 3. Для каждого из следующих множеств данных определите подходящим способом термины «эксперимент», «совокупность», «выборка», «объект измерения», «переменные» и установите объем выборки. Нарисуйте графики рассеяния и опишите любые зависимости между переменными, которые могут быть выявлены; (1)____________________________________________________ Возраст 1 6 1 7 9 10. 1 10 1 11 Тестовый балл 1 1 1 5 11 30 1 25 1 32 (2) Сила яда 1 30 1 35 | 40 1 45 1 50 Число погибших 1 ° 1 3 1 7 1 9 1 10 (3) Балл до тренировки 1 9 18 17 | 10 15. 21 Балл после тренировки 1 12 15 26 24 | 16 18 27 (4) Кровяное давление 115 118 122 129 135 132 150 Длина руки 6,0 5,5 6,3 5,8 6,1 6,4 5,9 246
которое выражено YA (К Рис. 107. (а) Сильная корреляция (па- раболическая). (б) Переменные не кор- релируют. (в) Слабая отрицательная кор- реляция (возможно, линейная), (г) Сильная положительная линейная кор- реляция в) Описание зависимостей. Теперь попытаемся объяснить чита- телю, что нужно понимать под словами зависимость между переменны- ми. В многомерных экспериментах, когда говорят о статистической зависимости, обычно пользуются словом корреляция. Таким образом, для эксперимента 1 соответствие большого веса высокому росту, маленького веса — небольшому росту ребенка, в приближенно линейной фор- ме, может быть описано как положительная линейная корреляция. В эксперименте 2 с мо- нетами переменные, которы- ми являются измерения воз- раста и веса монет, показы- вают сильную линейную за- висимость, но в противопо- ложном направлении. В та- ком случае будем говорить о высокой отрицательной ли- нейной корреляции. Оценки математических способностей и способностей по другим дисциплинам по- казывают очень малое соот- ветствие, т. е. эти перемен- ные некоррелированы. Если все пары значений из парного эксперимента удовлетворяют некоторому уравнению абсолютно точно, что рассматриваемые переменные полностью коррелированы (функцио- нально связаны). В других случаях существует некоторая меньшая степень корреляции, зависящая от того, насколько близко точки на графике рассеяния приближаются к некоторой кривой. Если точки рассеяны по плоскости беспорядочно, не группируясь друг с другом, то мы говорим, что переменные некоррелированы. На рис. 107 показаны различные виды зависимостей, которые могут возникнуть на практике. то в таком случае мы говорим, 2.8.3. ИЗМЕРЕНИЕ КОРРЕЛЯЦИИ Мы видели, что две переменные могут быть коррелировапы в Мень- шей или большей степени. Направление в расположении точек на гра- фике рассеяния может характеризовать либо линейную, либо нелиней- ную зависимость. Перейдем теперь от анализа парных экспериментов на уровне графиков к дальнейшему исследованию вопроса корреляции. Для этого нам надо решить некоторые задачи: 1) получить численную меру степени корреляции; 247
2) пойытаФься ВыяйниТь, возникает ли наблюдаемая корреляция вследствие эффекта случайности в выборке; 3) выбрать наилучшую функциональную связь (математическое уравнение, связывающее X и Y) для использования ее при описании корреляционной зависимости. При этом мы должны всегда помнить, что совокупность в целом может намного отличаться от картины, полученной на основе выборки, особенно, если объем выборки мал. Полное решение этих задач лежит за пределами нашей книги. Здесь будут затронуты лишь некоторые понятия и разобраны методы, кото- рые применяются в простейшем случае, когда график рассеяния ука- зывает на линейную корреляцию. Прежде всего мы дадим формулу вычисления статистики, представ- ляющей собой численную меру корреляции между двумя переменными, в предположении существования между ними линейной связи. Затем мы обсудим критерий значимости для этой статистики и границы до- верительных интервалов для соответствующего параметра совокуп- ности. Далее мы рассмотрим проблему регрессии, т. е. перейдем к на- хождению функциональной связи между наблюдениями. а) Коэффициент корреляции. Пусть выборочные наблюдения со- стоят из п пар измерений (хъ yt), i = 1, ..., п. Соответствующей мерой степени линейной зависимости между пе- ременными X и Y будет статистика 1 л ~ 2 (Xi—x) (yt—y) п 1=1 г =------1--------------, sx'sy где sx — стандартное отклонение множества значений х, a sy — стан- дартное отклонение значений у. Статистика г называется коэффициентом произведения моментов линейной корреляции, или просто коэффициентом корреляции. Числитель в формуле для г есть среднее произведение соответст- вующих отклонений х и у от их выборочных значений (отсюда название произведение моментов). Эту величину называют выборочной ковариа- цией X и Y и обозначают sxy. С помощью этого обозначения коэффи- циент корреляции можно переписать следующим образом: г 5 ХУ Sx'Sy Позже мы покажем, почему эта статистика будет хорошей мерой линейной корреляции. Сначала найдем значение г для двух простых случаев. (Замечание. Другие способы вычисления г приводятся в 2.8.3, в).) Пример 1 Наблюдения: х 2 4 6 8 у 2 5 7 10 248
График рассеяния показан на риС- 108- Вычисление г: х = 5; У—У 16+1 + 1 + 16 4 (—3) (—4) + ( —1) ( —D +1 1 + 3 4 1 3 1 4 _________26/4 У'2б~ ]/34~ 2 2 =0,997. ю - 8 - 6 - 4 - УК 10 - • в - 6 - 4 - 2 - • __i—i—।—।—।— О 2 4 6 8 10 X __I--1--1—1--L—>. О 2 4 6 8 10 X Рис. 108 Рис. 109 Пример 2 Наблюдения: х 2 4 6 8 у 10 7 5 2 График рассеяния показан на рис. 109. Вычисление г: х = 5; У = 6. (-3)4+(-1)1 + 1(-1) + 3-(-4) 3 —4 26 4~ 1/20~ . ~|/34~ 2 2 = -0,997. В обоих примерах абсолютная величина г одна и та же и равна 0,997, но отличается по знаку. Любому множеству данных, у которых гра- фик рассеяния имеет отчетливое линейное направление, будет соот- 249
ветствовать значение г, близкое по абсолютной величине к 1; оно будет положительным, когда обе переменные одновременно либо воз- растают, либо убывают, и отрицательным, когда одна переменная воз- растает, а другая убывает. Упражнение 2.8.2 Нарисуйте график рассеяния и вычислите г для каждого из следующих множеств наблюдений. Сравните коэффициенты1корреляции и графики рассеяния. (1) X 1 2 3 4 5 (2) X 1 2 3 4 5 У 1 2 3 4 5 У 2 1 3 3 6 (3) X 1 2 3 4 5 (4) X 1 2 3 4 5 [У 4 3 1 2 0 У 1 -1 1 —1 1 б) Свойства коэффициента корреляции. Из определения коэффи- циента корреляции г следуют его свойства: 1) г — число, лежащее между — 1 и + 1 включительно; 2) если г = + 1 (или — 1), то точки выборки лежат на одной пря- мой; 3) если значение г близко к + 1 (или — 1), то существует сильная линейная зависимость между переменными; 4) если г мало (близко к нулю), то корреляция между переменны- ми слабая, даже в том случае, если график рассеяния указывает на некоторую нелинейную зависимость между переменными; 5) г — безразмерная величина; опа не зависит от единиц измерения Хи У йот выбора начала координат (см 'цания 6 и 7 из упражнения 2.8.3). Коэффициент корреляции будет хорошей мерой тесноты линейной связи двух переменных. в) Формула для вычисления. Как показано в п. а), коэффициент корреляции может быть вычислен непосредственно по формуле Sxy/iSxSy). Однако вычисления значительно упростятся, если восполь- зоваться следующей формулой для нахождения sxy: s =^-—ху. (1) п Читателю рекомендуется проверить эквивалентность этой формулы определению sxy = 1/лЕ (х —х) (у — у)Л (Раскройте скобки и просуммируйте все члены.) Аналогичные формулы могут быть записаны и для дисперсий: а Sx2 ~2 Sx=-------х. (2) п С помощью формул (1), (2), (3) и при необходимости линейного пре- образования переменных (г не изменяется при таких преобразованиях) вычисление г становится сравнительно простой^процедурой. 250
Примерь! 1. (Пример 1 из п. а).) Данные: Решение X2 У2 ху 2 4 6 8 2 5 7 10 X = 5; y — 6. 4 16 36 64 4 25 49 100 4 20 42 80 Sx2= 120 Sy2= 178 Sxi/= = 146 s2=- 120 4 -25 = 5; s£=- 178 -36= 17 . 4 2 146 13 sxy 4 —30= ~ 2 ’ 13 =0,997, как и раньше. х У 2. (Данные эксперимента 1 из 2.8.2, а).) X и Y предварительно под- вергаются линейному преобразованию. Вычисления удобно записы- вать в столбцы, из которых находятся пять сумм Sh, Sv, St/2, Sv2 и Stzv, необходимых для вычисления г. X у и V Vя UV 0,62 150 8 5 64 25 40 0,58 120 4 2 16 4 8 0,54 100 0 0 0 0 0 0,59 120 5 2 25 4 10 0,60 130 6 3 36 9 18 0,65 170 11 7 121 49 77 0,58 ПО 4 1 16 1 4 0,62 140 8 4 64 16 32 0,58 130 4 3 16 9 12 0,60 140 6 4 36 16 24 Всего 56 31 394 133 225 Преобразование: и — 100х — 54, v = 0,1л/ — 10; [s2 = 0,lSu2 — ua = 8,04, s? = 0,1 Sv2 — v = 3,69; Suo = 0.1S (uv) — и • v = 5,14. 251
1/8,04-3,69 из множеств данных, пользуясь схемой (2) х 1 2 3 4 5 </21336 (4) х 1 2 3 4 5 а 1—1 1—1 1 Таким образом, г r suv _ 5,14 гху—' UV— — 5 и Sv Упражнение 2.8.3 1. Найдите значения г для каждого примеров 1 и 2: (1) х 1 2 3 4 5 1/ 1 2 3 4 5 (3) х 1 2 3 4 5 у 4 3 1 2 О 2. Вычислите г для множеств данных из задания 3 упражнения 2.8.1. 3. Вычислите г для данных о монетах из 2.8.2, а), эксперимент 2. 4. Вычислите г для данных об учениках из 2.8.2, а), эксперимент 3. 5. Покажите, что для вычисления г можно воспользоваться формулой r _ sxy_______________________nXxy—jZx) (Sy)________ ' sxsy ~ V[nSx2—(Sx)2] [nSy2-(Sy)2] 6. Рассмотрите множество данных X I 2 3 4 5 у 2 1 3 3 6 (1) Составьте новое множество данных, умножая каждое значение х на 2 и прибавляя к результатам 3, каждое значение у умножая на 3 и вычитая из ре- зультата 1 (эти операции будут линейными преобразованиями переменных). (2) Нарисуйте график рассеяния и вычислите г для нового множества данных. (3) Сравните полученный график и найденное значение г с результатом, полученным для этих же данных без линейного преобразования. (4) Пусть над переменными X и Y произведены линейные преобразования и = ах + b, v — су + d. Покажите, что Syp --- acsxy't Sy — csy. Докажите, исходя из этого, что rxy — ruv. г) Значимость г. Возвратимся к проблеме получения выводов о величине корреляции, существующей в двумерной совокупности, из которой производятся выборки. Предположим, из двумерной совокупности производится слу- чайная выборка объема п пар значений (xif уг). Например, в экспери- менте 2 из 2.8.2, а) мы имели десять пар значений, полученных по де- сяти монетам (время обращения, вес). Эту выборку можно рассматри- вать как случайную выборку объемом 10, полученную из большой со- вокупности таких пар, соответствующих большому числу (допустим, миллиону) подобных монет. Предположим далее, что выборочные данные привели к значению коэффициента корреляции, равному г, а данные всей совокупности (если бы они были собраны) дали бы значение, обозначаемое греческой буквой р. Основная цель эксперимента заключается в том, чтобы по данным выборки определить, чему равна корреляция во всей совокупности, 252
т. е. получить оценку р. Разумеется, в качестве оценки р можно взять г, однако мы должны отдать себе отчет в том, насколько хороша эта оценка. Это главный вопрос в любой статистической работе, исполь- зующей статистические выводы. Каждый раз, когда, производя выборку из совокупности, мы можем вычислять значения г, причем эти значения будут отличаться друг от друга, коэффициент корреляции будет случайной переменной со своим собственным выборочным распределением. Очевидно, что форма и рас- положение этого распределения зависят от формы распределения сово- купности и значения р, а также от объема выборки. Поэтому для того, чтобы ответить на вопрос, насколько хорошо г оценивает р, мы должны иметь информацию о выборочном распределении г и о его связи с р и п. В 1915 г. английский математик Р. А. Фишер (R. A. Fisher), за- ложивший основы современной статистической теории, нашел точное выборочное распределение у для нормального случая. Исследованием этой функции было установлено, что форма распределения г значи- тельно изменяется для различных значений р и (или) п. Методы про- верки значимости г, основанные на выборочном распределении, очень громоздкие и требуют использования различных таблиц значе- ний рассматриваемой пары (р, п). В том случае, когда выборочное распределение статистики (такой, как г) имеет сложную форму, пытаются преобразовать эту величину в новую переменную, выборочное распределение которой проще. Решая проблему таким способом, Р. Фишер нашел, что преобразова- 1 14-/* ние г — у In (= arth f) обладает тем свойством, что новая случайная переменная имеет приближенно нормальное распределе- ние. Чем больше объем выборки, тем больше точность вычислений. Среднее распределения равно arth р, а дисперсия 1/(п — 3) не зави- сит от р. Таким образом, переменная г подходит для целей построе- ния критерия значимости. Таблицы th х и arth х приводятся в большинстве справочников ста- тистических таблиц. д) Использование z-преобразования. Проверка гипотезы о р осно- вана на точно той же идее, что и проверка гипотезы относительно р, описанная в начале гл. 2.7. Мы рекомендуем читателю вспомнить со- держание этой главы, прежде чем приступать к изучению проверки гипотезы относительно р. Мы проиллюстрируем на примерах некоторые аспекты приме- нения ^-преобразования. Проверка гипотезы Н : р = р0. Пример. Случайная выборка объема 39 из двумерной нормаль- ной совокупности дала значение г — 0,8. Проверим гипотезу Но: р === 0,6 (т. е. мы проверяем, могла ли быть получена наша выборка из совокупности с коэффициентом корреляции, не превышающим 0,6. Альтернативная гипотеза р > 0,6). Решение. Сначала преобразуем значение г и гипотетическое зна- чение р. Получим; z - arth г = arth 0,8 = 1,099; 253
pz = arth p = arth 0,6 = 0,693. Если гипотеза истинна, то z распределено приближенно нормально со средним р,2 = 0,693 и дисперсией о2 — 1/(39 — 3) = 1/36. Поэтому величина и = ——— есть стандартная нормальная величина (среднее cz 0 и дисперсия 1). Ее значение в этом случае будет равно и = 1,099 —0,693 о /1О1 “ 0,167 ~ 2,461 ’ 0.05 Рис. 110 Гипотеза Н принимается Применяя односторонний критерий при уровне значимости 0,05, мы отвергаем гипотезу, только если и будет больше 1,64 (рис. ПО). Поскольку и = 2,431 > 1,64, мы отвергаем Н: р = 0,6. Таким образом, при заданном уровне значимости мы можем утверждать, что коэффициент корреляции со- вокупности больше, чем 0,6. Проверка различия между двумя коэффициентами кор- реляции. Пример. По двум не- зависимым выборкам объе- мом п1 = 53 и п2 — 40 бы- ли вычислены коэффициен- ты корреляции г} = 0,6 и г2 = 0,4. Имеется ли в коэф- фициентах значительное отличие? (Другими словами, можем ли мы отвергнуть гипотезу о том, что выборки взяты из совокупностей с одинаковым коэффициентом корреляции.) Решение. Гипотеза, подлежащая проверке, И: р, — р2 = 0. Для ее проверки мы воспользуемся выборочным распределением — г2 следующим образом. Преобразование гг и г2 приведет нас к 1.М и 1 Гипотеза Н отвергается zt = arth 0,6 — 0,693; z2 — arth 0,4 = 0,424. Если H истинна, то величина z± — z2 будет нормальной переменной с нулевым средним и дисперсией о2х= Var (zl—z2)= —1---р -—1— =0,047*. 53—3 40—3 Применяя двусторонний критерий (поскольку в альтернативной гипотезе мы должны рассмотреть обе возможные ситуации: Pi < р2 и Рг < Pi)> мы отвергаем гипотезу р, — р2 = 0, если величина = |д— z2|/o оудет больше 1,96. Как видим, „=lW-0.<24| = 0,217 * Известно, что если выборки независимы, то любые статистики, построен- ные на их основе, также будут независимыми. Поэтому из независимости Г1 и г2 следует независимость Zi и z2, т. е. Var (z, —z2) = Var (Zj) -f- Var (z3). — Примеч. nep. 254
Поскольку и = 1,24 < 1,96 (критический коэффициент при 5%-ном уровне значимости), мы не отвергаем гипотезу о том, что выборки взя- ты из совокупностей с одинаковым коэффициентом корреляции. Доверительный интервал для р. Коэффициент корреляции выборки (и z-преобразование) может быть использован для вычисления доверительных границ, в которых с не- которой вероятностью будет лежать коэффициент корреляции совокуп- ности. Эти границы определяют доверительный интервал для р. Пр и м е р. Коэффициент корреляции, вычисленный по выборке объемом 28, оказался равным г = 0,71. Найти 95%-ный доверительный интервал для коэффициента корреляции р всей совокупности. Решение. Величина (г — p2)/crz имеет приближенное стандартное нормальное распределение. Поэтому р[— 1,96 < fг—’М <+ 1.9б1 «0,95. L \ щ / J Преобразуя выражение в квадратных скобках, получим Р \z — 1,96стг < р,г < z + 1,96ст21 « 0,95. Отсюда Р [arth г--*'86_ < arth р < arth г 4- - ] « 0,95. [ Ул—3 Ул—3 J В нашем примере г = 0,71 и п = 28, поэтому Р [arth 0,71---< arth р< 0,71 +-ЬШ —0,95, ! 5 5 J т. е. Р (0,495 < arth р < 1,279] « 0,95. Таким образом, приближенный 95%-ный доверительный интервал для arth р будет равен (0,495; 1,279). С помощью таблицы гиперболиче- ского тангенса окончательно получим 95%-ный доверительный интер- вал для р: (0,46; 0,86). Упражнение 2.8.4 1. Найдите значение г-преобразования следующих величин: 0,2; 0,8; 0,63; 0,41; 0,88. При необходимости воспользуйтесь таблицами гиперболического тангенса или таблицами натуральных логарифмов. 2. Случайная выборка объема 33, произведенная из двумерной нормальной совокупности, дала значение г =0,41. Проверьте следующие гипотезы: (1) Коэффициент корреляции для совокупности равен нулю против аль- тернативной гипотезы р + 0 (двусторонний критерий). (2) Но -р = 0 против альтернативной гипотезы Нг : р > 0 (односторонний критерий). (3) р меньше 0,22. (4) р меньше — 0,1. (5) р больше 0,55. (6) р больше 0,88. Сделайте все проверки при уровнях значимости 0,05 и 0,01. 255
3. Выполните задание 2 для следующих пар значений: (1) г = 0,62; п = 52; (2) г = 0,88; п = 103; (3) г = — 0,36; п = 12; (4) г = — 0,71; п = 124; (5) г = 0,00; п =228; (6) г = 0,13; п = 24. Замечание. При проверке гипотез «меньше» или «больше» в каждом случае необходимо делать одностороннюю проверку альтернативной гипотезы. 4. Найдите доверительные границы при 95%-ном и 99%-ном уровнях зна- чимости для коэффициента корреляции всей совокупности в каждом из шести случаев задания 3. 5. Случайная выборка 21 пары чисел из двумерной нормальной совокупно- сти дала значение коэффициента корреляции, равное г — 0,55. Вторая выборка объемом 30, произведенная на следующей неделе, привела к результату г — 0,48. Говорят ли эти результаты об изменении коэффициента корреляции совокупности за прошедшую неделю? Чему будет равно при 5%-ном уровне зна- чимости (а) наибольшее значение г, (б) наименьшее значение г, которое могло получиться при второй выборке и не указывать на значительное изменение в р? 6. Выполните задание со следующими выборочными данными: 1-я выборка 2-я выборка (1) г = 0,62; п = 52; (2) г = 0,36; п = 28; (3) г = 0,71; п = 19; (4) г = — 0,88; п = 103; (5) г = — 0,41; п = 12. г = 0,88; п = 60; г = 0,41; п = 33; г = 0,62; п = 28; г = — 0,71; п = 84; г = — 0,62; п = 19. 2.8.4. РАНГОВАЯ КОРРЕЛЯЦИЯ Очень часто наблюдения представлены не в виде измерений, а в форме рангов. Например, десять солдат могут быть поставлены в линию в порядке их роста. Число 1 будет присвоено самому высокому сол- дату, 2 — следующему и т. д., десятый получит номер 10. Числа от 1 до 10, приписываемые каждому солдату (соответственно их росту), называются рангами солдат..Та ко го рода упорядочение возможно, когда невозможно выполнить действительные измерения. Например, в кон- курсах красоты или конкурсах качества (где могут участвовать дети, девушки, кабачки, шиншилловые кролики и т. п.) судья оценивает качественно каждого из участников соревнования И приписывает им числа 1, 2, 3, ... соответственно его решению, какой из всех участни- ков будет наилучшим, вторым за наилучшим, третьим и т. д. Другими словами, он ранжирует участников конкурса. Часто бывает возможным ранжировать объекты эксперимента по двум или более характеристикам, откуда и возникает вопрос о корре- ляции. Например, представленные на конкурс кабачки могут быть ранжированы по размеру и сочности. Возникает вопрос, существует ли связь между размером кабачка и его сочностью. а) Коэффициент ранговой корреляции. Предположим, что п объек- тов эксперимента, ранжированные по уровню качества, привели к па- рам рангов (хг, pi). Требуется найти статистику для измерения степени корреляции между двумя переменными. В качестве такой статистики можно воспользоваться формулой произведения моментов (т. е. коэффициентом корреляции), предназна- ченной для данных измерения (см. 2.8.3, а)); для рангов эта формула упрощается (вместо г будем теперь употреблять обозначение R):-. 256
6 У 2 = 1 п(п2— 1) где dj = xt — yt — разность рангов для i'-го объекта эксперимента. R называется коэффициентом ранговой корреляции Спирмана (Spearman’s coefficient of rank correlation). Этой формулой очень легко пользоваться. Более того, если в дву- мерном эксперименте получен большой объем данных измерения, имеет смысл сначала ранжировать их и вычислить по полученным рангам R. Это значение R может служить аппроксимацией значения г; точность теряется из-за того, что при ранжировании исчезает важная информация о численном значении величины, а учитывается лишь ее порядок, однако существенное сокращение затрат при вычислении коэффициента ранговой корреляции компенсирует этот недостаток. Проверку на значимость, предложенную для г в 2.8.3, д), строго говоря, нельзя перенести на коэффициент Спирмана, однако эта про- цедура все же будет полезной для получения грубых значений границ доверительных интервалов. Дальнейшее знакомство с анализом ран- жированных данных читатель может продолжить по работе [17]*. Пример. Восемь кабачков ранжированы по размеру и сочности следующим образом: Кабачки 1 2 3 4 5 6 7 8 Ранг размера (хг) 8 3 1 4 О 7 5 6 Ранг сочности ({//) 3 5 6 7 8 4 1 2 Разность рангов (di) 5 —2 —5 —3 -6 3 4 4 Вычислить разности в рангах и найти коэффициент Спирмана ран- говой корреляции R. Следует ли из данных, что между размером и соч- ностью кабачков имеется некоторая зависимость? Решение. Разности di вычислены в третьей строке таблицы. Для формулы R нам необходимо вычислить 2d? = 25 + 4 + 25 + 9 + 36 + 9 + 16 + 16 = 140. Таким образом, n(/l2—1) , 6-140 . = 1---------, (n=8) 8-63 = —0,67. * Рекомендуем также читателю недавно переведенную на русский язык книгу: М. К е н д э л. Ранговые корреляции. М., «Статистика», 1975.-— Примсч. пер. 0 Зак !173 ?57
Даже если учесть небольшой объем выборки, значение R указывает на обратную зависимость между размером и сочностью кабачка. Это говорит о том, что больший кабачок, как правило, будет менее сочным и наоборот. (Замечание. Данные этого примера условны.) (3) Десять детей были ранжированы по двум тестам. Один тест проверял языко- вые способности (v), другой — общий кругозор (s). Результирующие пары (v, s) оказались следующими: (2,1), (3,6), (8,5), (1,4), (4,3), (7,2), (9,8), (10,7), (6,9), (5,10). Можете ли вы сказать, что существует связь между общим кругозором и языковыми способностями у детей? 2. Возьмите множество данных из задания 3 упражнения 2.8.1 и для каж- дого случая проранжируйте объекты эксперимента по рассматриваемым харак- теристикам. Затем для каждого множества вычислите значение R. Сравните по- лученное значение со значением г, вычисленным ранее (задание 2 упражнения 2.8.3). 3. Какова будет связь между рангами xi и у, i-го наблюдения, если между этими переменными существует точная линейная зависимость. Покажите, что в этом случае R — 1. 4. Если ранги двух характеристик соответствуют точно противоположно- му порядку, то для каждого объекта эксперимента xi + yt = п Д 1. Получите отсюда следствие, в силу которого все точки на графике рассеяния будут лежать на прямой линии с отрицательным наклоном, т. е. в этом случае R = — 1. 258
2.8.5. ПРЕДУПРЕЖДЕНИЕ: КОРРЕЛЯЦИЯ И СЛУЧАЙНОСТЬ Предупреждение заключается в опасности спутать понятия ста- тистической зависимости с более фундаментальным понятием причин- ной связи. Очень часто коэффициент корреляции неправильно интер- претируется; если значение г оказывается близким к 4-1 или —1, то отсюда делается вывод, что существует тесная зависимость между переменными. Для того чтобы понять, какого рода опасности могут встретиться при интерпретации двумерных наблюдений, рассмотрим следующие примеры. Допустим, что в течение некоторого промежутка времени, число книг, издаваемых за год в некоторой стране, неуклонно росло; также росло число покупок телевизионных приемников; предположим так- же, что в течение этого времени происходил рост преступлений. Если для этих величин построить соответствуюгцие графики и вычислить коэффициенты корреляций, то с большой вероятностью окажется, что на данном отрезке времени количества проданных книг и телеви- зоров имели положительную корреляцию, количество проданных те- левизоров положительно коррелировало с числом преступлений, а число преступлений имело положительную корреляцию с количеством проданных книг. Какой вывод можно сделать из существования этих трех положи- тельных, возможно, высоких корреляций? Оказывает ли влияние про- смотр телевизионных передач на рост преступности? Возможно. Покупают ли преступники больше телевизоров, чем честные люди? Наверняка нет. Ведет ли просмотр телевизионных передач к тому, что зритель становится более просвещенным и начинает покупать новые книги? Может быть, имеется другой способ объяснения этого фено- мена? А каким образом продажа книг влияет на рост преступности? Очевидно, между такими переменными, как продажа книг и рост преступности, нет действительной причинной связи. Корреляции, в которых данные показывают высокое значение г, в то время как между переменными нет разумной связи, называют ложными корреляциями. Этим примером мы хотели показать, что, после того как между дву- мя переменными установлена статистическая зависимость, необходимо провести дальнейшее исследование этой зависимости, прежде чем сде- лать вывод о существовании между ними реальной связи*. * Читателю, безусловно, следует с осторожностью относиться к резуль- татам статистического исследования. Однако вряд ли точные математические формулы могут в большей мере претендовать на отражение причинно-следствен- ных связей, чем корреляционные зависимости. Даже в формулировках физиче- ских законов, вызывающих неизменно большую долю доверия по сравнению с эм- пирическими зависимостями в экономической и социальной жизни, как правило, нельзя указать направленность причинно-следственного механизма. Поэтому, говоря об условности статистического исследования, следует, прежде всего, иметь в виду целенаправленность интерпретации полученных результатов. Не исключено, что зависимость между количеством купленных телевизоров и числом преступлений может оказаться вполне пригодной для прогностической модели, если только будет найден соответствующий причинно-следственный механизм, объясняющий (пусть даже косвенным образом) подобную корреляцию. — Примеч. ред. 9* 259
2.8.6. РЕГРЕССИЯ Если точки (х,-, tjt) на графике рассеяния близко располагаются к не- которой кривой, то естественно попытаться найти математическую за- пись у = f (х) кривой, приближающей кривую рассеяния. Такая кри- вая называется линией (кривой) регрессии, она может быть использо- вана для целей предсказания. Например, рассмотрим в качестве пере- менных твердость X и предел прочности на разрыв Y некоторого сорта стали. Предположим, что эксперименты показали высокую корреля- цию между X и Y. Тогда в последующих экспериментах предел проч- ности на разрыв бруска из данного вида стали можно легко и довольно точно оценить, измеряя сначала твердость стали X и затем вычисляя Y по уравнению регрессии, связывающему X и Y (непосредственное измерение Y ведет к разрушению материала). Общая проблема подгонки математической кривой к статистическим данным в целях прогнозирования решается регрессионным анализом. По этому вопросу имеется обширная литература; здесь мы рассмотрим только простейшие примеры и случаи. Слово регрессия было впервые употреблено Фрэнсисом Гальюном (Francis Gallon, 1822 — 1911), который также открыл коэффициент корреляции, при анализе двумерных данных, представляющих собой рост отцов и сыновей. Он обнаружил, что сыновья высоких отцов в среднем ниже, чем их отцы, и назвал это регрессией посредственности. а) Линии регрессии. Предположим, что корреляция между пере- менными X и Y линейная. Пусть также эксперимент позволяет ото- брать наблюдения с некоторым значением X, определенным заранее, и измерить соответствующие значения Y. Например, можно исследо- вать эффект, оказываемый различными дозами (переменная X) неко- торого средства от насекомых. Мы можем отобрать определенный вид насекомых и проверять на них действие доз заранее фиксированной концентрации; затем мы можем найти число насекомых, погибших от этой дозы (переменная Y)*. Такая ситуация называется задачей чистой регрессии. При этом X будет независимой или объясняющей переменной, a Y— статистически зависимой переменной. Хотя для большинства реальных ситуаций такая задача является только приближением, излагаемые далее методы допускают широкую область применения. Предположим, для задачи чистой регрессии имеется множество выборочных наблюдений и мы хотим «подогнать» прямую к точкам на графике рассеяния. На рис. 111 показано множество точек и четыре возможные прямые А, В, С и D, которые проходят через эти данные. Очевидно, что и Л и В будут «плохими» регрессиями. Эти прямые плохо приближают данные, и ни одна из них не может быть описанием зависимости между X и Y, как бы мы ни ставили задачу. Однако пря- мые С hD уже нельзя отвергнуть по этому принципу. Если нескольким людям раздать карандаши и линейки и попросить провести прямую, «наилучшим» образом подогнанную к нашим данным, то одни провели бы прямую, близкую к С, другие—кО, а третьи, возможно, построили * То же самое повторяется для других значений переменной -X, в резуль- тате чего возникает график рассеяния. — Примеч. ред. 260
бы прямую, отличающуюся заметно и от С, и от D. Как определить, какая из прямых «наилучшая» и в каком смысле «наилучшая»? Ясно, что чисто субъективный способ подгонки линии регрессии «на глаз» не выдерживает критики; для решения этой задачи требуется некоторый объективный метод. Наиболее обоснованным методом, име- ющим в своей основе строгую аргументацию (мы не будем обсуждать ее в этой книге), является так называемый метод наименьших квад- Рис. 111. Прямые на графике рассеяния, проведенные «на глаз» ратов. Этот метод указывает систематическую процедуру построения прямой, проходящей через множество точек, и будет лучшим в теоре- тическом смысле. б) Метод наименьших квадратов. Рассмотрим график рассеяния п точек (хг, у,) (рис. 112). Предположим, что при отсутствии случайных отклонений в пере- менной Y все точки графика лежали бы на некоторой истинной линии регрессии. Таким образом, если изобра- женйая на графике прямая будет истин- ной линией регрессии, то величины dlt d2, ..., dn — случайные отклонения от этой прямой. Основа метода наименьших квадратов состоит в том, чтобы по имею- щимся данным выбрать из всего множе- ства прямых па плоскости прямую, ко- торой соответствует наименьшее зна- чение суммы квадратов отклонений от нее до точек графика рассеяния. Други- Рис. 113 ми словами, мы ищем прямую у — а'х Ь', такую, X = d\ -f- dl -f- ... 4- dn имеет наименьшее возможное значение. что Для ее отыскания запишем уравнение прямой в общем виде: у = ах 4 Ь, вычислим соответствующее ей значение X и с помощью методов диффе- ренциального исчисления найдем значения а и Ь, минимизирующие выражение для X. Прямая, найденная таким способом, будет наилуч- шей оценкой истинной линии регрессии. Ордината i-й точки (xf, </;) на прямой у — ах 4 b соответствует точке (хг, axt 4 Ь). Отсюда следует, что dt = yt — (axt 4 b) (рис. 113). Поэтому X = d® 4 4 dn = 2dt = 2 [yt — (ах^ 4 &)I2. (1) 261
Вспомним теперь, что х; и г/г — фиксированные числа (данные выборки), а в качестве переменных мы рассматриваем параметры а и Ь. Таким образом, S рассматривается как функция параметров S (а, Ь). Значения а и Ь, минимизирующие S, будут решением системы уравнений: dS п dS „ „ , , да ~ ’ дЬ ~ Дифференцируя первое уравнение по а и Ь, прирав- нивая результаты нулю, получим: — = 22 (t/f — axt—b)(—1)=0 и —=22 —axt—b) (—Xt)=0. Эти уравнения называются нормальными уравнениями регрессии', несложным преобразованием их можно свести к более простому виду: 2t/z = а 2х; -ф bw, ^XiPi = ci2>Xi + b 2хг. (2) (3) Решением системы уравнений (2), (3) будет пара чисел (а', Ь'). Прямая у = а'х + Ь' называется прямой «наилучшей подгонки» к точ- кам на графике рассеяния. Эта прямая называется также регрес- сией Y на X. Если бы мы предположили, что случайные возмущения присутствуют только в переменной X, мы минимизировали бы сумму квадратов отклонений, которые бы измерялись параллельно оси X- В таком случае мы бы пришли к новому уравнению регрессии — рег- рессии X на Y. Вообще, если нам необходимо предсказать значение у по данному значению х, мы воспользуемся регрессией Y на X; для предсказания х по данному у мы рассматриваем регрессию X на Y. Примеры 1. Методом наименьших квадратов найдите (а) регрессию Y на X, (б) регрессию X на Y. X 1 2 3 4 5 6 7 1/ 2 3 1 4 6 7 5 х = 4; // = 4. 262
Решение (а) регрессия Y на X X У X» V* ху 1 2 1 4 2 2 3 4 9 6 3 1 9 1 3 4 4 16 16 16 5 6 25 36 30 6 7 36 49 42 7 5 49 25 35 Сумма 28 28 140 140 134 2х = 28 = Si/; Sx2 = 140 = Sj/2; Хху = 134. Подставляя полученные суммы в нормальные уравнения (2) и (3), получим: 28 = а • 28 + b • 7; 134 = а • 140 + 6-28. Решением этой системы будут числа а' — и/14, Ь' = ®/7. Итак, по- лучена прямая регрессия, найденная методом наименьших квадратов: у = и/и х + ®/7, или 14г/ = Их + 12. б) Регрессия X на Y. На этот раз мы должны минимизировать квадра- ты отклонений от х. Нормальные уравнения в этом случае получаются из уравнений (2) и (3) простой подстановкой у вместо х и наоборот. Таким образом, если уравнение регрессии в общем виде будет х = су + d (для ясности вместо ранее использованных букв а и b возь- мем новые буквы с и d), то нормальные уравнения выглядят следую- щим образом: 2х = сХу + dn (2') и 2хр = с Уу2 + dXy. (3') Подставляя значения сумм из таблицы, получим: 28 = с 28 + d • 7 и 134 = с 140 + d • 28. Таким образом, регрессия X на Y будет иметь вид 14х = 11г/ + 12. (Замечание. Совпадение коэффициентов в уравнениях регрес- сии X на Y и Y на X — это особый случай. В общем случае система нормальных уравнений (2) и (3) отличается от системы (2') и (3')-) 263
2. Нарисуйте график рассеяния наблюдений для примера 1 и по- стройте обе линии регрессии. Обратите внимание на тот факт, что обе прямые проходят через точку (х, у) = (4,4); это имеет место для любой регрессии. Заметьте также, что две прямые имеют разные направления. Вообще, чем ближе друг к другу расположены линии регрессии У на X и X на Y, тем сильнее линейная зависимость между переменными (рис. 114). 3. В эксперименте из примера 1 известно значение х, равное ЗУ3. Предскажите соответствующее значение у с помощью уравнения рег- рессии. (Найденное значение у будет наилучшей оценкой истинного значения.) Решение. Рассмотрим регрессию У наХ(ее график или уравнение). Предсказываемое значение у будет равно: II 7 . 6 101 У=------------—----- . 14 2 7 28 Рис. 114. График разброса и прямые регрессий (пример 1) начальный коэффициент b 4. В эксперименте из примера 1 значение у известно и равно 6. Предскажите по этому значению у значение х. Решение. Для решения этой задачи воспользуемся регрессией — X на У. Предсказываемое значение х следую- щее: X==_1L.6+_L=_39_, 14 7 7 в) Формулы для вычислений. 1) Систему нормальных уравнений для получения коэффициентов регрессии у = — ах-\-Ь легко запомнить. Однако чита- телю может понадобиться окончатель- ная формула для вычисления а и Ь. Они выглядят следующим образом: коэффициент наклона а= nZxy—(Zx) (St/) . raSx2 —(Sx)2 ’ (St/) (Sx2)-(Sx) (Sxt/) иХх2—(Sx)2 Аналогичные формулы для регрессии X на Y могут быть получены подстановкой х вместо у и наоборот. 2) Упростить вычисление коэффициента наклона а можно с помощью линейного преобразования X и Y. При этом необходимо обратить вни- мание на следующий факт. Если си d — подходящим образом выбран- ные числа и формула подсчета коэффициента наклона применяется к переменным u = x-\-cmv—y-\-d, то значение а будет тем же, что и для переменных х и у. Однако полное линейное преобразование и = ех + с и и = fx + d не может быть использовано кроме случая, когда е = f. (Покажите, что если е #= Д то формула коэффициента на- клона приведет не к значению, равному а, а к значению fa/e.) Когда а найдено, для отыскания b может оказаться полезным урав- нением у = а х + Ь. 264
Пример. Найдите прямую регрессии Y на X для точек выбор- ки (1,5; 2,1), (3,1; 2,7), (3,8; 3,0), (4, 3; 5, 4). Решение 1) Непосредственное использование формул X У X* У* ху 1,5 3,1 3,8 4,3 2,1 2,7 3,0 5,4 2,25 9,61 14,44 18,49 4,41 7,29 9,00 29,16 3,15 8,37 11,40 23,22 Сумма 12,7 13,2 44,79 49,86 46,14 4-46,14—(12,7) (13,2) _ 184,56 — 167,64 _ 16,92 4-44,79 —(12,7)2 ~ 179,16—161,29 17,87 2) Использование линейного преобразования. и = 10х -|- 30 и и = 10(/ + 35 (Замечание. Коэффициенты при х и у одинаковы.) X У и V иг о* UV 1,5 3,1 3,8 4,3 2,1 2,7 3,0 5,4 —15 1 8 13 —14 —8 —5 19 225 1 64 139 196 64 25 361 210 —8 —40 247 Сумма ч- ’«! 12,7 13,2 7 ОО 1 1- А 459 646 409 Применяя те же формулы, но подставляя значения для и и и, по- лучим: 4-409 —7 (—8) 1 692 — 4-459—72 ~ 1 787 ’ что совпадает с предыдущим результатом. Поскольку х— 12^*7 =3,175 и у= -З^*2 = 3,3, находим & из урав- нения у = ах + Ь. Отсюда Ь=у—ах=3,3—-3,175=0,293. 3) Формулы, связывающие прямую регрессии и коэффициент кор- реляции. Прямая регрессии может быть записана следующим образом: а) регрессия Y на X : у' = гх'\ б) регрессия X на Y : х' = гу', 265
1ще г—коэффициент корреляции между х* и у1, а х'и у*— стайдартй- зированные переменные: X'=(X-X)lsx- Y'=(Y-Y)/sy. Таким образом, если начало координат перенести в центр графика рассеяния и за единицы измерения масштаба взять стандартные откло- нения, то прямая регрессии, как следует из формул, будет очень простой. В качестве упражнения мы предлагаем читателю доказать, что эти уравнения полностью эквивалентны предыдущим. (Это упраж- нение очень полезно, и читатель многое уяснит в процессе его выпол- нения.) Упражнение 2.8.6 1. Имеются следующие результаты тестирования (в баллах) 10 студентов. Первый тест проверяет память (X), второй — способности к логическому мыш- лению (У). Оценка за тест по проверке памяти (X): 5, 8, 7, 10, 4, 7, 9, 6, 8, 6. Оценка за тест по проверке способности к логическому мышлению (У): 7, 9, 6, 9, 6, 7, 10, 7, 6, 8. (а) Нарисуйте график рассеяния. (б) Найдите коэффициент корреляции между X и У. (в) Примените каждый из методов, описанных в 2.8.6, в), для нахождения регрессии методом наименьших квадратов. (г) Нарисуйте линию регрессии на графике рассеяния. (Заметьте, что точ- кой пересечения будет (х, у)). 2. Для каждого из следующих множеств данных выполните задание 1 этого упражнения. (Для упрощения вычислений данные можно преобразовать к стан- дартизированным переменным.) Упругость (X) и процентное содержание никеля (У) в восьми образцах сплавов стали (1) Упругость (X) 36 41 42 43 44 45 47 50 Процент никеля (У) 2,5 2,7 2,8 2,9|3,0 3,2 3,3 3,5 Оценка за тест по способностям (X) шести продавцов-практикантов и первый год работы (У) в сотнях фунтов проданного товара (2) Оценка за тест по способностям (X) 25 42 33 54 29 36 Первый год работы (У) 42 73 50 90 45 48 Твердость (X) и предельная нагрузка (У) 10 образцов сплавов легких металлов (3) Твердость (X) 53 56 60 63 66 67 70 72 75 80 Предельная нагрузка (У) 10,1 10,4 12,3 13,8 13,9 14,1 14,0 15,1 15,4 16,5 3. Постройте следующие прогнозы с помощью графиков и (или) уравне- ний, полученных в задании 2. (1) Упругость образца стали, процентное содержание никеля в которой равно 3,1. Процентное содержание никеля в стали, упругость которой равна 38. (2) Возможное число фунтов товара, проданного продавцом-практикантом за первый год, если его оценка за тест по способностям равна 48. (3) Твердость образца сплава легких металлов, предельная нагрузка ко- торого равна 12,0. Предельная нагрузка образца, твердость которого равна 73. 4. Покажите, что регрессии У на X и X на У можно записать так: (1) у-у=~-(х-х), sx 266
(2) х—х=-^~ (у—у), sy где sxy, s2, s2 — выборочная ковариация, дисперсия х и дисперсия у соответ- ственно. Величины Say/s® и sXyls2 называют коэффициентами регрессии. 5. Покажите, что квадратный корень из произведения коэффициентов рег- рессии равен коэффициенту корреляции. 6. С помощью методов из 2.8.3, д) найдите границы (а) 95%-ного и (б) 99%-ного доверительных интервалов для коэффициента корреляции р всей со- вокупности в каждом из экспериментов заданий 1 и 2. Для каждого множества данных выполните проверку гипотезы Нв: р = 0,8 против соответствующей односторонней альтернативной гипотезы при уровне значимости 0,05. 7. Объясните значение фраз «высокая положительная корреляция» и «низкая отрицательная корреляция». Приведите примеры и графики, иллюст- рирующие эти понятия. Численные значения снашивания и твердости резины пяти выборок равны: Выборка 1 Снашивание 21 Твердость 5 2 3 4 5 15 12 22 5 6 7 4 8 (а) Нарисуйте график рассеяния; найдите и нарисуйте на этом графике две линии регрессии. (б) Вычислите коэффициент корреляции г и получите границы 99%-ного доверительного интервала для р. (в) Предскажите снашивание резины для выборки резины, твердость ко- торой равна 6,4. 8. Докажите, что для п пар (х;, у,) из двумерного распределения: (a) S(x—х) (у—у)=^ху—пху, (б) 2 (х-\-у)2 = п (x+y)2-)-n (s* + 2sxy+s2). 9. Две переменные X и Y функционально связаны уравнением ах + by + + с = 0. Покажите, что коэффициент корреляции между переменными будет равен + 1, если а и b имеют разные знаки, и — 1, если знаки одинаковые. 10. Предполагается, что для множества п наблюдений (х<, у;) регрессия будет представлять собой параболическую кривую у = ах2 + Ьх + с. С помощью метода наименьших квадратов найдите формулы для определения а, b и с. (За- ме ч а н и е. Возьмите сумму квадратов отклонений S=2 [у—(ах2 + Ьх + с)]2. „ 5S SS 3S приравняйте —, —, — нулю и получите систему нормальных уравнении.) да дЬ дс 2.8.7. ДАЛЬНЕЙШАЯ РАБОТА В этой главе мы рассмотрели понятия корреляции и регрессии в двумерных распределениях. За этими понятиями в курсе статистики следуют вопросы, связанные с вычислениями коэффициентов корреля- ции и регрессии для группированных данных, затем теория выборок получает дальнейшее развитие (изучаются отклонения от линии рег- рессии, границы доверительных интервалов для коэффициентов урав- нения регрессии и т. д.), предлагаются методы проверки соответствия многочленов выборочным данным. Теория может быть обобщена на случай, когда рассматриваются две или более независимые переменные. Изучение многомерных рас- пределений требует определения частных и множественных корреля- ций, развития методов по нахождению плоскости регрессии (или по- верхности) по выборочным данным. 267
2.9 ЗАДАЧИ КО ВТОРОЙ ГЛАВА ЧАСТИ Следующие задачи1 предлагались в письменных экзаменационных рабо- тах последних лет в университетах Шеффилда, Бирмингема, Ланкастера, Лидса и Лондона на присуждение степени бакалавра наук (экономических). 1. (а) Сформулируйте три фундаментальные аксиомы теории вероятностей. С помощью этих аксиом докажите, что для любых двух событий: (1) Р (АВ') = Р (Л) — Р (АВ)-, (2) Р (Л1)В) = Р (Л) + Р (В) — Р (А В); (3) Р(Л)<Р(ЛиВ). (б) Пусть Л, В и С — произвольные события. В терминах Р (Л), Р (В), Р (С), Р (АВ), Р (ЛС), Р (ВС) и Р (АВС) найдите вероятность наступления хотя бы одного из событий Л, В и С. (в) 60 банок с фруктами не могут быть проданы в магазине из-за того, что этикетки на этих банках перепутаны. Директор магазина случайным обра- зом выбирает каждую банку и дает ее одному из трех своих помощников. Из- вестно, что И банок содержат персики, а остальные банки — груши. Чему равна вероятность того, что каждый помощник директора магазина получит по край- ней мере одну банку персиков? 2. (а) Сформулируйте и докажите теорему о полной вероятности. Выве- дите из нее теорему Байеса. (б) Три урны содержат соответственно 5 черных и 7 белых шаров, 12 черных и 10 белых шаров, 8 черных и 8 белых шаров. Случайным образом выбирается урна и шар из нее. Найдите вероятность того, что (1) шар будет белым, (2) шар взят из i-й урны, если известно, что он белый (i = 1, 2, 3). 3. (а) Покажите, как эксперимент получения выборки из некоторой сово- купности, содержащей два вида объектов, ведет к гипергсомстрическому рас- пределению. Покажите, что это распределение при некоторых условиях может быть аппроксимировано биномиальным распределением. (б) Объясните, как биномиальное распределение возникает в эксперименте, состоящем из п независимых испытаний. Получите аппроксимацию биномиаль- ного распределения пуассоновским. (в) В универсаме имеется 180 бутылок молока, 60 из которых датированы предыдущим числом, а остальные — свежие. Покупатель случайным образом покупает 6 бутылок молока. Чему равна вероятность (найдите ее с точностью до 3 значащих цифр), что по крайней мерс две бутылки будут датированы предыду- щим числом? Приведите аргументы для оправдания использованной вами ап- проксимации. 4. (а) Определите производящую функцию моментов для непрерывной слу- чайной переменной X. Найдите производящую функцию моментов при условии, что X нормально распределено со средней р и стандартным отклонением ст. По- лучите распределение X — Y, где X и Y — независимые нормально распре- деленные случайные величины со средними р1я р2 и дисперсиями о|, ст|. 1 Все вопросы и задачи приводятся без изменений, поэтому для решения некоторых задач необходимы сведения, отсутствующие в этой книге. Читателю следует самостоятельно найти их в более полных руководствах по статистике. (Рекомендуем читателю книги [49] и [50]. — Примеч. пер.) 268
(б) На конвейере штифт и муфта подбираются случайно. Диаметры штифтов и муфт имеют нормальное независимое распределение со средними 14,985 мм и 15,011 мм и стандартными отклонениями, равными 0,05 мм и 0,012 мм соответ- ственно. Какова в среднем доля штифтов, которые войдут в муфту? 5. (а) Подробно объясните, что означает: (1) случайная выборка из еско- печной совокупности, (2) выборочное распределение статистики. (б ) Из нормально распределенной совокупности со средним р и дисперсией о2 производится случайная выборка объемом п. Покажите, что выборочное сред- нее х имеет нормальное распределение со средним р. и дисперсией о^/п. Про- анализируйте, как изменится выборочное распределение х, если выборку про- изводить из совокупности со средним р и дисперсией о2, имеющей распределе- ние, отличное от нормального. (в ) Известно, что в среднем 5% некоторого вида электропредохранителей, изготовляющихся производственной линией, дефектны. Чему (приближенно) равна вероятность того, что в случайной выборке из 400 таких электропредохра- нителей 6% окажутся дефектными? 6. (а) Кратко объясните смысл следующих терминов: (1) нулевая гипотеза, (2) значимость критерия, (3) мощность критерия. (б) Исследуются два производственных процесса изготовления поршневых рычагов. В выборке из 100 поршневых рычагов, изготовленных с помощью пер- вого процесса, оказалось 5 дефектных, а в выборке из 150 рычагов, изготовлен- ных с помощью второго процесса, оказалось 9 дефектных. Найдите 95%-ный доверительный интервал для разности между истинными долями дефектных единиц для этих процессов. Есть ли значимое различие между этими долями? (Используйте 5%-ный уровень значимости.) 7. (а) Из двух нормальных совокупностей N (pij, о2) и N (р.2> °!) произво- дятся две независимые случайные выборки объемом и п2, причем общая дис- персия о2 неизвестна. Постройте процедуру проверки двусторонней гипотезы Но'- Вт ~ Ва- (б) Двумя лабораториями А и В исследовалось содержание никотина в че- тырех видах табака; результаты исследования представлены в таблице (в услов- ных единицах): Содержание никотина лаборатория А лаборатория В 16 18 14 21 13 18 17 19 Предполагая, что обе совокупности имеют нормальное распределение с оди- наковой дисперсией (которая неизвестна), проверьте гипотезу о том, что резуль- таты исследования двух лабораторий не отличаются друг от друга при 5%-ном уровне значимости. 8. (а) Обозначим через р парный коэффициент корреляции между X и Y-. Покажите, что (1) — 1 р < 1, (2) р не зависит от масштаба и начала отсчета. (б) Объясните смысл коэффициента корреляции и напишите формулу для его вычисления. (в) Величина X равномерно распределена на ( — 1,1) и Y = X2. Покажите, что X и Y некоррелированы*. * Можно доказать, что X и У будут зависимы. Этот пример показывает, что случайные величины могут быть одновременно некоррелируемы и стохастически зависимы. С другой стороны, если переменные независимые, то они обязательно некоррелируемые. — Примеч. пер. 269
9. Дайте объяснение следующим четырем понятиям: (а) статистическое мо- делирование выборки, (б) центральная предельная теорема и ее применение в статистической проверке гипотез, (в) коэффициент ранговой корреляции, (г) метод наименьших квадратов в регрессивном анализе. 10. (а) Десять участниц конкурса красоты были ранжированы тремя судь- ями следующим образом: Судья II 6 5 10 Судья II 3 5 8 4 Судья III 6 4 9 8 3 2 4 9 7 8 7 10 2 1 6 9 1 2 3 10 5 7 С помощью коэффициента ранговой корреляции найдите пару судей, оцен- ки которых наиболее близко соответствуют друг другу. (б) Лаборант ставит ряд экспериментов по определению связи между коли- чеством растворившегося в воде химического вещества и температурой воды. Получены следующие результаты: Температура С® (х) 10 20 30 40 50 60 70 80 Количество химического ве- щества (у) (в условных еди- ницах) ‘ 48 60 63 71 72 84 89 90 Для приведенных данных подгоните прямую у = а + Ьх и нарисуйте ее на графике. Оцените ожидаемое количество химического вещества, которое раст- ворится в воде, при температуре 35° С. Найдите для этой величины 95%-иый доверительный интервал. 11. Для исследования вопроса о том, имеют ли жители двух островов в юж- ной части Тихого океана одинаковое расовое происхождение, антропологом были выполнены необходимые измерения черепов жителей и проведено сравне- ние полученных индексов. Антропологом было обследовано 6 черепов жителей первого острова и 6 черепов жителей второго острова. Результаты получились следующие: Первый остров 72,4 78,9 75,4 73,5 74,7 81,1 Второй остров 71,8 74,6 72,0 73,5 70,2 75,9 (а) При 2%-ном уровне значимости проверьте предположение, что диспер- сии двух совокупностей, из которых производились выборки, в действитель- ности равны. (б) Предполагая истинность гипотезы (а) при 5%-ном уровне значимости, проверьте, будет ли различие между выборочными средними совокупностей значимым. Исходную совокупность можно считать приблизительно нормально рас- пределенной. Можно ли на основе этих наблюдений сказать, что жители двух островов имеют одинаковое расовое происхождение? 12. Из таблицы случайных чисел получите 100 выборок, в каждой из ко- торых по десять случайных чисел от 0 до 99. Для каждой выборки из десяти чисел найдите частоту х чисел, делящихся на 10 (0 делится на 10). Найдите ожи- даемые биномиальные частоты для этого распределения и сравните их с полу- ченными значениями из выборок. Результат объясните (не прибегая к статисти- ческой проверке). Сравните также наблюдаемые и ожидаемые значения среднего и дисперсии. Подберите к полученным данным наиболее подходящее пуассоновское рас- пределение и проанализируйте, будет ли это распределение хорошей альтерна- тивой. 13. (а) Правильная монета подбрасывается дважды. Пусть А — событие выпадания герба при первом бросании, а В — событие выпадания решетки при втором бросании. (1) Будут ли события А и В взаимно противоположными? 270
(2) Будут ли события А и В независимыми? Аргументируйте ваши ответы. (б) Три случайные переменные X, Y и Z одинаково и независимо распре- делены. Объясните, что это означает. (1) Определите, будут ли следующие вероятностные утверждения истин- ными или нет: Р (X > 0/У > 0) = Р (У > 0), Р (X < х, Y < у) = [Р (Z < z)l2; Р (X + У < х + у) = Р (X < х) + Р (У < у). Аргументируйте ваши ответы. (2) Предположим далее, что переменные X, У и Z непрерывны. Одно на- блюдение над этими переменными привело нас к значениям х, у иг. Чему равна вероятность того, что х, у, z не удовлетворяют ни одному из неравенств х > у > , z или х < у < z? 14. Дайте объяснение понятию условной вероятности. Некоторый вид биологической клетки подвергается воздействию. При этом воздействии клетка погибает с вероятностью, равной 1/4, и делится на две клет- ки того же вида с вероятностью 3/4. Клетки реагируют на воздействие незави- симо друг от друга, и умершая не оживает. Обозначим через X] число живых клеток после воздействия на одну клетку, Х2 — число живых клеток после воздействия на Хх клеток, Х3 — число живых клеток после воздействия на Х2 клеток. Найдите: (1) Р (Ха = 0); (2) Р (Хл = 0/Х2 = 0); (3) Р (Х3 > 0). 15. (а) Найдите условия, при которых события Bit В2, и В3 удовлетворяют условию Р (А) = Р (A/В,) Р (BJ + Р (А/В2) Р (В2) + Р (А/В3) Р (В3) при любом событии А. (б) Число X случайным образом выбирается из чисел 1, 2 и 3. Затем из того же множества целых чисел случайно выбирается другое число У, большее или равное первому. Обозначим Z = X + У. Требуется найти: (1) функцию распределения вероятностей У; (2) функцию распределения вероятностей Z; (3) среднее и дисперсию Z. 16. (а) X и У — независимые нормально распределенные величины. X имеет среднее 1 и дисперсию 16, а У имеет среднее 3 и дисперсию 9. С помощью таблиц найдите вероятность того, что обе величины X и У положительны и мень- ше 9. Найдите также вероятность того, что X превосходит У. (б) Два небольших завода Вх и В2 производят некоторый товар. Количества товара Хх и Х2, производимого соответственно заводом Л, и Л2 за неделю, рас- пределены независимо и можно считать, что они имеют приближенно нормаль- ное распределение. Хх имеет среднее, равное 6000, и дисперсию 900, а Х2 имеет среднее 15 000 и дисперсию 3600. Товар, производимый на заводе Flt приносит прибыль 3 пенса в расчете на единицу, а товар, производимый на заводе К2, — 2 пенса. Предполагая, что сумма издержек производства заводов Fx и К2 составляет 100 фунтов стерлингов, найдите вероятность того, что за некоторую неделю суммарная чистая прибыль заводов А, и F2 будет больше, чем 100 фунтов стерлингов. 17. Объясните, что надо понимать под «независимыми испытаниями Бер- нулли». Два игрока в теннис Рг и Р2 играют один круг, который состоит из 5 се- тов. Для каждого игрока шансы выиграть в одном сете равны, причем результа- ты сетов взаимно независимы (ничьих не бывает). 271
Пусть X обозначает число сетов, выигранных Р,. Нарисуйте график рас- пределения X. Пусть Y обозначает разность сетов, выигранных первым игроком Рх и вто- рым Р2. Найдите среднее и дисперсию Y. Нарисуйте график Р (Y < у). Чему равна вероятность того, что первый игрок выиграет у второго? 18. Приведите формулировку центральной предельной теоремы. Случайная переменная X имеет равномерное распределение на отрезке а < х < а + 2, где а — неизвестный параметр. Нарисуйте кривую плотности вероятности для X. Над X производится одно наблюдение х'\ с помощью этого значения най- дите 90%-ный доверительный интервал для а. Известно, что дисперсия X равна 1/3; найдите приближенные 90% ные до- верительные границы для а, используя среднее х п. независимых наблюдений X. Найдите такое п, при котором 90%-ный доверительный интервал имеет длину меньше 0,2. 19. Бросают пять монет. Некто подозревает, что в этой пятерке есть моне- ты с гербом с двух сторон (двугербовые). Известно, далее, что монета может быть либо правильной, либо двугербовой. (а) С помощью следующей проверки проверяется нулевая гипотеза о том, что все монеты правильные: нулевая гипотеза принимается, если при одном бро- сании пять монет выпадают меньше, чем четыре монеты, в других случаях она отвергается. (1) Найдите вероятность ошибки первого рода. (2) Чему равна вероятность отвергнуть нулевую гипотезу, если в пяти мо- нетах 1, 2, 3, 4, 5 из них будут двугербовыми: (б) Альтернативная проверка следующая: отобрать случайным образом одну монету из данных пяти, бросить ее три раза и отвергнуть нулевую гипоте- зу, если гербы выпадут во всех трех бросаниях. Повторите для этого критерия вопросы (1) и (2) и сравните предложенные проверки гипотез. 20. В доме отдыха были случайным образом отобраны 100 человек и запи- сан их возраст. Полученные данные были сведены в частотную таблицу: Возраст группы 2,5—7,5 7,5—12,5 12,5—17,5 17,5—22,5 22,5—27,5 Частота 5 16 35 42 2 среднее — мода Обсудите использование величины w = --------------------------- как меру стандартное отклонение симметричности распределения и вычислите w для приведенных данных. Найдите также медиану и среднее отклонение для предложенных данных. 21. Длительное наблюдение за производственным процессом изготовления химической смеси привело к заключению, что величину выпуска можно считать приближенно нормальной со средней 250 единиц и стандартным отклонением 50 единиц. Производственный процесс подвергся модификации, которая не из- менила стандартное отклонение. При 5%-ном уровне значимости проверяется нулевая гипотеза о том, что выпуск продукции стал меньше 250 единиц, против альтернативной гипотезы, что выпуск продукции увеличился. (1) Найдите критическую область при 25 наблюдениях. (2) Известно, что число наблюдений равно 25, а модификация процесса при- ’ вела к увеличению выпуска продукции до 260 единиц. Найдите в этом случае вероятность отвергнуть нулевую гипотезу. ’ (3) Найдите такое число наблюдений, которое необходимо взять, чтобы вероятность отвержения нулевой гипотезы при условии, что произошло увели- чение выпуска продукции до 260 единиц, была бы не меньше 0,9. 22. Игрок подозревает, что некоторые две игральные кости неправильные. Для проверки своего предположения он подбрасывает их 360 раз и записывает сумму очков, выпадающих при каждом бросании. Полученные наблюдения следующие: Сумма 23 4 5 6 7 8 9 10 11 12 Число наблюдений суммы 11 13 24 34 48 63 51 42 36 24 14 272
Нарисуйте гистограмму для этих данных и сравните полученные ЧастотЫс тео- ретическими. Для этих данных примените критерий подгонки Оправдано ли подозрение игрока? 23. Новая техника изготовления резиновых трубок проверяется следующим образом. Пара трубок (одна из которых изготовлена по старому методу, а вто- рая — по новому) обрабатывается различными видами кислот. Данные о сроке службы трубок (в годах) следующие: 1 Новый метод 1,7 Старый метод 1,2 Тип кислоты 2 3 4 5 4,6 3,7 3,9 2,8 4,4 3,1 4,0 2,4 6 7 8 9 10 3,1 2,4 4,2 3,6 3,3 2,7 2,6 3,7 3,5 3,0 Проверьте, улучшает ли новая техника качество изготовления резиновых тру- бок, предполагая, что (1) обе величины распределены нормально, (2) распреде- ление не нормальное и неизвестно. 24. К показаниям двух приборов, измеряющих кровяное давление, подби- рается прямая. Обозначим показание прибора 1 через у, а соответствующее по- казание прибора 2 — через х. Методом наименьших квадратов для приведенных данных постройте прямую регрессии у на х при условии, что прямая проходит через начало координат. х: 1,5 1,7 1,8 1,9 2,3 2,4 2,5 2,6 2,9 у: 1,4 1,8 1,7 1,9 2,3 2,3 2,5 2,4 2,8 Sx2 = 44,46; 2р2 = 42,13; Ъху = 43,25. Нарисуйте полученную прямую и нанесите на этот же график точки наблю- дений. Проверьте гипотезу о том, отличается ли коэффициент регрессии от еди- ницы. 25. Для исследования растворимости некоторого вещества (на единицу веса) было проведено два независимых эксперимента при пяти различных тем- пературах t (измерение в абсолютной шкале). Результаты оказались следующими: х: 3,9 1,32 3,8 1,20 3,7 1,09 3,6 0,81 3,5 0.64 У- 1,42 1,26 1,03 0,83 0,60 2 (у — у)* = 0,746; Sy = 10,20, где х = 1000/? — величина, обратно пропорциональная температуре. (1) Постройте прямую регрессии растворимости на величину, обратную температуре. (2) Будет ли зависимость между у и х на самом деле линейной? 26. В терминах вероятностей пересечения событий А, В, С, D, Е найдите вероятность наступления ровно двух событий. Из таблицы случайных чисел выбираются двухразрядные числа до тех пор, пока не получатся пять четных чисел: нечетные числа не принимаются во вни- мание. Найдите вероятность того, что последние цифры выбранных чисел будут в точности тремя из следующих цифр: 0, 2, 4, 6, 8. 27. X и Y — случайные переменные с совместной функцией плотности ве- роятности f (х, у) = k (ху + t/2) для 0<х<2, 0<у<2. Найдите значение k. Чему равна Р (х + у < 2)? Найдите коэффициент корреляции между X и У (ответ дайте с тремя верными знаками). 28 Найдите производящую функцию моментов для геометрического распределения f (х) = (1 — а) а*-1 (х = 1, 2, 3...). Определите среднее и дисперсию х. Найдите Е [(х — а)2]. 29. Сформулируйте условия, при которых нормальное распределение мо- жет служить аппроксимацией к биномиальному. 273
Игральная кость бросается 30 000 раз. Найдите вероятность того. Что число выпадения шестерки (а) будет меньше 4770, (б) будет лежать между 5100 и 5200. Найдите п, для которого вероятность того, что число выпадений шестерки заключено между 4900 и п, равна 0,5. 30. (а) Дайте определение несмещенной оценки и покажите, что ns2/ (и — 1) есть смещенная оценка ст2, где s2 — дисперсия выборки объема п. (б) х и у — независимые случайные переменные и г = х + у. Покажите, что дисперсия г равна ст2 = ст2 + ст2. Покажите также, что £ (ху) = Е (х) Е (у). (в) Выборка 25 значений из большой совокупности имеет дисперсию 5, а повторная выборка 20 значений имеет дисперсию 4. Найдите 95%-ный довери- тельный интервал для р.ж — р?/ при условии, что выборки производились из двух различных нормальных совокупностей с одинаковой дисперсией и со сред- ними |гк и р.у соответственно. 31. Сформулируйте основные математические свойства Р (£) — вероятно- сти события £. Дайте определение статистически независимым событиям. А, В, С — статистически независимые события. Вероятность наступления А и ненаступления В и С равна а. Вероятность наступления только события В равна Ь, вероятность наступления только события С равна с. Покажите, что а b с Р(А) = ———; £(£)=——; Р(С)=——, a-f-x о-|-х с-|-х где х — корень уравнения (а + х) (Ь + х) (с + х) = х2. 32. Из физического колледжа была произведена случайная выборка 16 сту- дентов; была также произведена случайная выборка 16 студентов университета. Для каждого студента был определен индекс подготовки по физике. Результаты оказались следующими. Университет Физический кол- ледж Выборочное Несмещенная оцен- среднее ка дисперсии совокупности 84 81 90 49 Проверьте гипотезу о том, что уровень знания физики у студентов физичес- кого колледжа выше, чем у студентов университета. При этом сделайте необ- ходимые предположения. Как можно раскритиковать подобный эксперимент? 33. Докажите, что если А и В — два случайных события, то Р (А) + Р (В) = Р (АВ) + Р (AЦВ). Докажите теорему Байеса: если Blt В2, ..., Вп — непересекающиеся события, объединение которых дает все выборочное пространство, то 2 P(A/B})P(Bj) 1=1 Известно, Что события А, В, С таковы, что Р (В) = 3/5, Р (А/В) = 3/4, Р (С) = = 1/2, Р (А/В') = 1/2, Р (А/С’)=2/3, Р (АС'/В') = 1/4. Найдите Р (А), Р (А/С), Р (А В'С) и покажите, что Р (ВС/А) = 1/3. 34. «Все научные гипотезы являются нестатистическими гипотезами, а все статистические гипотезы являются научными». Прокомментируйте это заявле- ние, обращая особое внимание на роль нулевой гипотезы при проверке ста- тистических гипотез. 35. В случайной выборке объемом 10, взятой из большой совокупности лю- дей, было обнаружено, что два лица поддерживают политику государства. Проверьте гипотезу о том, что доля людей, поддерживающих политику прави- тельства, равна 0,5, с помощью (а) биномиального распределения, (б) нормаль- ного распределения. . 274
Покажите, что в данном случае последнее распределение будет хорошей ап- проксимацией первого. F 36. Случайная переменная х имеет распределение Пуассона с парамет- ром X, т. е. 1 Р(х) = е~х--------- (х = 0, 1,2, ...). х! Найдите среднее и дисперсию х. На некотором заводе были обследованы рабочие, получцВШие на производ- стве незначительные увечья. За 52 недели результаты обсл^лования были сле- дующие: Число рабочих, по- лучивших увечья за неделю О 1 2 3 4 и более Число недель, в течение которых увечья получили х рабочих 31 17 3 1 О Предполагая, что эти данные можно адекватно аппРСк с соновским распределением с параметром л, оцените это таблицы. С помощью вычисленного значения найдите теоЪрТнцрг1.ир " г.„рт,, числа недель, в течение которых будет 0, 1, 2 и 3 увечья. 37. Одновременно бросают две игральные кости и монету рсли выпадает герб, то значение х получается суммированием очков, выпц:вщих на nBVXK0 стях. В том случае, когда выпадает решетка, число х по^уЧают вычитанием большего числа очков выпавших костей из меньшего. у Составьте таблицу возможных значений х с их соответст^ ющими вероятно- стями. Чему равны среднее, мода, медиана х? Покажите, что вероятность полу- чить значение х < 2 больше, чем вероятность получить зна^р^ > у 3 38. В приведенной таблице W означает вес в ньютона^ Некот* - хими. ческого вещества, растворяющегося в воде при ТС. г Т W т W т W 5 42 20 53 35 10 43 25 56 40 ля 15 47 30 60 45 71 Найдите уравнение регрессии, которое необходимо дл^ оценивания спел- него значения W для данного значения Г. Оцените средне^ w если т =28 Вычислите коэффициент корреляции между У и IF. ’ 39. Случайная переменная X со средним р. имеет прои^ Лункпию моментов, равную mx (Z) = Е [ехр (АЧ)]. При условии, что Y пДоверьте, что ту (/) = е тх (/). Покажите, что среднее X равно п ’ известно’ что X имеет биномиальное распределение с параметрами п и /если Y = X * — пр, докажите, что тогда ту (t) = (qe-pt+pe4t)n- 40. Для каждого из следующих случаев найдите пр еде.о г роятностью 95% будут лежать значения R: , к рь (a) R есть число бактерий в выборке объемом 1 мм3 про-;.. ич „ППП111О прпр мешанной смеси, содержащей в среднем в 1 мм3 50 бактерий . р (б) R есть чИСЛО выигранных вбрасываний капитаном ^рикетной комаНды в серии из 100 вбрасывании; г (в) R есть процент выигранных вбрасываний капитаном В серии из 200 вбрасываний. Аргументируйте ваши ответы. брикетной команды 275
ЧАСТЬ ТРЕТЬЯ ПРИКЛАДНАЯ ТЕОРИЯ ВЕРОЯТНОСТЕЙ и исследование ОПЕРАЦИЙ 3.0 ВВЕДЕНИЕ 3.0.1. МОДЕЛИРОВАНИЕ Общим для всех научных исследований является построение мо- делей реальной действительности. Слово «модель» используется здесь в более широком смысле, чем обычно, когда оно употребляется в связи с моделью судна, моделью автомобиля, моделью аэроплана и т. д., моделью, вырезанной из обыч- ного дерева или же любовно изготовленной из кусков бальсовой дре- весины, бумаги и клея. Говоря о моделировании, мы предполагаем охват этим понятием действий гораздо более общих. Мы моделируем всякий раз, когда представляем в уме то, что пытаемся сделать или понять, когда рисуем планы проекта, когда с помощью одной уже из- вестной ситуации описываем другую, похожую на нее (т. е. пользуемся аналогией), а также выражая наши мысли письменно, с помощью ри- сунка, скульптуры, символов или в иной форме. Ученый при столкновении с некоторой системой или явлением при- роды, не поддающимся объяснению в рамках существующих теорий, попытается построить несколько различных моделей. Он начнет с на- копления довольно-таки неопределенных идей и мысленного их обду- мывания, с проверки различных взаимосвязей и разных функцио- нальных соотношений и будет это делать до тех пор, пока его модель не начнет приобретать более или менее законченную форму. Тогда появляется возможность перейти к некоторой конкретной форме мо- делирования, т. е. попытаться представить систему или как физическую модель, или в виде схем, или с помощью каких-либо символов. Могут быть выделены три «чистых» типа моделей. 1) Иконической называют модель, точно повторяющую объект. Например, модель автомобиля (в уменьшенном масштабе) и модели химических молекул (в увеличенном масштабе) представляют собой модели, точно повторяющие объект. 2) Аналоговой моделью называется модель, свойства которой оп- ределяются законами, аналогичными законам изучаемой системы. Например, соотношение между током и напряжением в электрической сети при некоторых условиях аналогично соотношению между грузом и растяжением пружины. И следовательно, когда изучаемая система 276
содержит нагруженные пружины, представляется возможным исполь- зовать электрическую цепь как аналоговую модель. Манипулирование напряжением, прикладываемым к цепи, дает информацию о соотно- шениях напряжения и силы тока в электрической системе; тогда (если модель хороша для наших целей) прямая трансформация этих резуль- татов приведет к новым знаниям о системах с нагруженными пружи- нами. 3) Символической называют модель, в которой используются сим- волы, например х, у, 0, чтобы представить физические величины, такие, как расстояния, углы, напряжения и т. д. Тогда соотношения между величинами описываются (т. е. моделируются) посредством ал- гебраических или дифференциальных уравнений, связывающих сим- волы. Вообще, модель системы может быть комбинацией двух, а возмож- но, и трех чистых типов моделей. Цель построения модели заключается в изучении и, как следствие, в более глубоком понимании представляемой физической системы. Фундаментальный процесс, известный как научный метод, состоит в формулировании модели системы, в манипулировании моделью и по- лучении с ее помощью определенных выводов, в перенесении этих вы- водов на физическую систему, в постановке экспериментов для про- верки правдивости этих выводов, и, наконец, в переформулировании модели в свете результатов такой проверки. Непрерывное взаимодей- ствие идей, возникающее при попытках построения физической и схе- матической моделей, хорошо согласующихся с результатами наблю- дений за реальной системой, ведет к более глубокому проникновению в сущность изучаемых взаимосвязей. Постановки новых экспериментов, новые объекты для изучения, новые области знаний и приложений воз- никают на каждой стадии научного исследования. Процесс добывания знаний—это важнейший факт, понимание которого невозможно пере- оценить. В связи с необходимостью более или менее точного согласо- вания с реальными системами объяснения дальнейших эксперименталь- ных результатов модели непрерывно проверяются, отбрасываются или модифицируются, упрощаются или становятся более сложными. Дальнейшая полезная классификация моделей состоит в подраз- делении их на детерминированные и стохастические. (Многие модели являются смесью этих двух типов, т. е. они включают в себя как детер- минированные, так и стохастические элементы.) Детерминированной моделью называется модель, в которой могут быть установлены точные соотношения между входящими в нее величинами. В стохастической модели величины следуют статистическим законам. Например, для описания системы нагруженных пружин целесообразно использовать детерминированную модель, так как интересующие нас соотношения между грузом и растяжением пружины подчиняются точному закону. При описании дорожного движения прибытие автомобилей в систему будет, вообще говоря, носить статистический характер; следовательно, применяемая модель должна быть стохастической. 277
3.0.2. ПЛАН ТРЕТЬЕЙ ЧАСТИ КНИГИ Во второй части книги было введено понятие вероятности и ука- зано, какую важную роль оно играет в развитии методов статистиче- ского анализа. В третьей части будет показано, как теория вероят- ностей применяется при изучении многих физических систем. Всякий раз, когда для представления системы берется стохастическая модель, привлекаются вероятностные понятия и законы. Сначала они исполь- зуются при формулировании модели, а затем при манипуляциях с нею для объяснения соотношений между переменными и получения новых знаний о системе. Во всех областях науки происходит быстрое развитие направлений, связанных с применением стохастических моделей. Огромная роль этих моделей в изучении природных явлений становится очевидной всякому, кто осознает, что фактически все (или почти все) соотношения между реальными величинами на некотором уровне но- сят скорее стохастический, чем детерминированный характер. Главу 3.1 мы начинаем с описания и анализа некоторых последо- вательностей экспериментов. В этих последовательностях возможные результаты одного эксперимента связаны с результатами предыдущего эксперимента некоторыми «вероятностями перехода». Мы имеем дело с простейшими последовательностями этого типа. Они называются конечными цепями Маркова. Знакомство с ними поможет читателю ус- воить многие идеи, необходимые для более глубокого изучения случай- ных процессов. В гл. 3.2 изучаются основные моменты теории очередей (теории мае сового обслуживания), рассмотрены модели нескольких различных типов очередей, показано применение метода Монте-Карло. Надеемся, что эта глава будет полезна читателю во многих отно- шениях, а именно: 1) он узнает, как строится символическая модель и как она может изменяться при согласовании с различными физиче- скими ситуациями; 2) получит представление о том, как вероятностные идеи применяются в моделировании; 3) познакомится с содержанием одной из наиболее интересных областей исследования операций. В трех следующих главах читатель знакомится с такими разделами исследования операций, как линейное программирование, сетевое пла- нирование, управление запасами. 3.0.3. ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Уместно сказать здесь несколько слов о том, что такое исследование операций. За последние полвека масштабы и сложность созданных че- . ловеком организаций чрезвычайно возросли. Тенденция к увеличению размеров имеется фактически во всех образованных человеком системах: на национальном и международном уровнях, в предпринимательской деятельности, в военном деле, в образовании ит. д. Рост сложности си- стем неизбежно сопровождается соответствующим увеличением как количества возникающих задач управления, так и их сложности. Ко- гда требуется принимать решения относительно больших объемов ка- питальных ресурсов, причем каждое решение сказывается на много- 278
Численных работниках, число управленческих ошибок должно быть минимальным. Продолжается развитие методов изучения систем, призванных помочь управляющим органам в процессе принятия ре- шений и дать им возможность поддерживать вверенные им организации на высоком уровне. Совокупность теорий и методов, применяемых для построения моделей систем и последующего их изучения, сформиро- валась после второй мировой войны и получила название исследования операций. Новая наука черпает идеи из многих других наук, но наиболее тесно она связана с математическими методами; действительно, мно- гие важные ветви прикладной математики возникли при изучении раз- личных экономических систем. Много математических методов было развито при решении вопросов, связанных с экономикой. Программирование, теория очередей, сетевое планирование, уп- равление запасами, теория надежности и теория восстановления — наиболее интересные разделы исследования операций. Каждый раздел находит собственное применение в промышленности. Каждому соот- ветствуют свои типы моделей и разнообразные математические методы. В этой книге мы обрисуем лишь контуры идей из первых четырех раз- делов. Обобщая, можно сказать, что операционные исследования пред- ставляют собой попытку применить научные методы к сложным си- стемам. Необходимо заменить старые, «высосанные из пальца» управ- ленческие методы объективными способами решения, основанными на количественных методах системного анализа. Коротко их можно назвать «количественным здравым смыслом».
3.1 ГЛАВА ЦЕПИ МАРКОВА А. ОСНОВНЫЕ ИДЕИ И ОПРЕДЕЛЕНИЯ 3.1.1. ВВОДНЫЕ ЗАМЕЧАНИЯ Марковские процессы получили свое наименование по имени рус- ского математика А. А. Маркова (1856 — 1922), который впервые сфор- мулировал соответствующие определения и изучил свойства этих про- цессов. С тех пор теория марковских процессов широко развивалась и нашла применение в таких областях науки, как ядерная физика, педагогическая психология, экономика, эпидемиология и т. д. Об- ласть ее применения расширяется по мере развития теории. 3.1.2. ОСНОВНЫЕ ИДЕИ а) Два примера случайных процессов. С идеями теории марковских процессов мы познакомимся, обсудив два очень простых эксперимента. Эксперимент 1. Правильную монету бросают шесть раз, и каждый раз фиксируют выпадение герба (Н) или решетки (Т). Эксперимент 2. Человек сидит на среднем стуле в ряду из пяти стульев (обозначим их А, В, С, D, Е слева направо). Он перемещается шесть раз со своего стула на соседний стул, причем его перемещения каждый раз определяются бросанием правильной монеты, по сле- дующим правилам: (1) Если он не на крайнем стуле, то он движется вправо, когда вы- падает герб (Я), и влево, когда выпадает решетка (Т). (2) Если он на крайнем стуле, то он должен на нем оставаться в лю- бом случае, т. е. независимо от выпадения герба или решетки. Пусть последовательность занимаемых стульев записывается. Обсуждение. Оба эти эксперимента состоят из шести шагов (или испытаний), результат каждого шага определяется вращением монеты. Любой результат фиксируем буквами Н и Т в эксперименте 1 и буквами А, В, С, D или Е в эксперименте 2. Таким образом, конеч- ный результат каждого Из этих экспериментов есть последовательность из шести букв. Например, возможными последовательностями будут Н, Т, И, Н,Т, Н и Н, Н, И, Т, Т, Т для эксперимента 1 и С, D, С, В, А, А, А (начальный стул плюс шесть «движений») и С, D, Е, Е, Е, Е, Е — для эксперимента 2. 280
Можно предположить, что одни последовательности будут для нас более интересными, чем другие, и рассмотреть их. Например, рассмат- ривая вторую последовательность в эксперименте 2, мы видим, что че- ловек направился сразу в сторону крайнего стула, расположенного справа от него, и остался на этом стуле. Возникает вопрос: с какой вероятностью это может случиться? Также интересно знать вероят- ность, с которой человек, прежде чем попадет в «ловушку», т. е. на стулья, обозначенные А и Е, совершает несколько движений между средними стульями В, С, и D. На вопросы, возникающие в аналогич- ных ситуациях, можно ответить с помощью таких моделей вероятно- стных процессов, как марковские цепи. Результаты очень многих экспериментов в науке, технике, коммер- ческой деятельности могут быть записаны в виде некоторой последо- вательности букв или цифр. Удобно рассматривать их как процессы или цепи событий, в которых на каждом шаге происходит переход из одного состояния в другое. Обычно нельзя точно предсказать, каким путем процесс будет развиваться на произвольном шаге, и можно лишь оценить вероятности для каждого возможного направления. Например, в эксперименте 1 на каждом шаге процесс попадает в одно из двух со- стояний (Н, Т). Поскольку в опыте бросают правильную монету, то разумно считать, что процесс попадает в Н с вероятностью 1/2 и в Т — с вероятностью 1/2. Математическое представление (или модель) процесса, в описании пошагового развития которого участвуют вероятности, называется случайным процессом. Слово «случайный» — синоним слова «вероят- ностный». В понятие случайного процесса существенным образом вхо- дят как множество состояний, так и множество вероятностей перехода из состояния в состояние. Также необходимо знать начальное состоя- ние или по крайней мере вероятностное правило для его определения. б) Пространство состояний процесса. Множество всех возможных состояний, которые может принимать процесс, называется простран- ством состояний. Примеры (1) В эксперименте 1 пространством состояний будет множество {Н, Т}. (2) В эксперименте 2 пространство состояний есть множество {Л, В, С, D, Е}. Пространство состояний может быть конечным, как в рассмотрен- ных примерах, или бесконечным (счетным или несчетным). В этой главе будут рассмотрены процессы только с конечным пространством состояний. Обозначения. Символами s1( ..., sn будут обозначаться п состояний (точек) в данном пространстве состояний. Запись s, -> s} будет означать, что процесс переходит из i-ro состояния в /-е состоя- ние. Упражнение 3.1.1 1. Человек может вернуться с работы домой тремя разными маршрутами. Придумайте разумный набор условий, при которых последовательность марш- 281
рутов, выбранная для заданного числа дней, может быть описана как случайный процесс. Каково его пространство состояний? . 2. Предположим, что в конце каждого учебного года студента можно либо исключить, либо потребовать, чтобы он повторил пройденный курс, либо пере- вести его на следующий курс (либо он вообще оканчивает учебное заведение). Допустим, что каждый такой случай происходит с определенной фиксированной вероятностью. Тогда продвижение студента может быть описано как случайный процесс. Найдите подходящее пространство состояний, предполагая, что учеб- ная программа рассчитана минимум на три года. в) Одношаговые вероятности перехода. Вероятность P(si -> Sy) есть условная вероятность того, что процесс, находясь в состоянии sit перейдет из состояния st в состояние Sj за один шаг. Ее можно обо- значить через ptj. Она называется одношаговой вероятностью пере- хода. Если такие вероятности известны для любой пары состояний, то они могут быть расположены в виде квадратной матрицы. Получен- . ная матрица называется матрицей переходов. Обозначим ее Р, Р = = Ipfjl. Где pij есть элемент, стоящий на пересечении i-й строки и /-го столбца. Примеры (1) В эксперименте 1 есть только четыре возможных случая. Процесс может перейти из состояния Н в состояние Н, из Я — в Т, из Т — в Т или из Т — в И. Обозначим Sj = Н s2 = Т, тогда мат- рица перехода будет такой: 1 1 ’ 2 2 А Р=В С D Е так как Р (Н Н) = Р(Н -э- Г) = 1/2, Р (Т Т) = Р (Т Н) = = ~ и каждый шаг определяется бросанием монеты. (2) В эксперименте 2 возможных случаев гораздо больше. Пять имеющихся состояний определяют 5 • 5 = 25 вероятностей перехода. Матрица выглядит следующим образом' А В С D Е “ 1 0 0 0 0 “ 1/2 0 1/2 0 0 0 1/2 0 1/2 0 0 0 1/2 0 1/2 0 0 0 0 1 Вероятности Р (А -> Л) = 1 = Р (Е -> £), так как человек остается на стуле А или стуле Е, однажды его достигнув. Вероятность Р (В -> С) равна вероятности того, что при бросании монеты выпа- дает герб, т. е. 1/2; аналогично Р (В -+ Д) = 1/2. Поскольку правило перемещения человека (если только он не на крайнем стуле) состоит в том, что он должен двигаться либо направо, либо налево, то вероят- ность остаться ца том же самом месте равна нулю, т. е. ?8?
Р (В В) = 0. Читатель может проверить, что другие элементы мат- рицы найдены правильно. Замечания (1) Все элементы матрицы есть вероятности, и, следовательно, они представляют собой числа от 0 до 1 включительно. (2) Сумма элементов матрицы по любой строке равна единице, п т. е. S pi} — 1 для каждого i. Это действительно так, потому что если /=1 процесс находится в состоянии s;, то на следующем шаге он должен перейти точно в одно из п достижимых состояний. Это достоверное со- бытие, вероятность которого равна 1. Состояние sit конечно, включают в множество достижимых состояний, так как, вообще говоря, процесс может сохранять любое из своих прежних состояний, — в этом случае Ра > 0. (3) Матрицы, в которых все элементы неотрицательны и суммы элементов по строкам равны единице, называются стохастическими матрицами. (4) До сих пор неявно предполагалось, что ptj одинаковы на каждом шаге процесса. Если это предположение выполняется, то говорят, что это процессы со стационарными вероятностями перехода. Упражнение 3.1.2 1. Пусть в задании 1 упражнения 3.1.1 три маршрута помечены буквами А, В и С. Предположим, что вероятность того, что человек при выборе маршрута предпочитает маршрут предыдущего дня, всегда равна вероятности, что он выбе- рет какой-нибудь из оставшихся маршрутов и что отдельные вероятности двух других маршрутов равны. Запишите матрицу переходов для этого процесса. 2. В задании 2 упражнения 3.1.1 предположим, что вероятность исключе- ния студента равна г, вероятность повторения курса есть s, а вероятность пе- ревода на другой курс (или завершения учебы) есть t. Запишите матрицу пере- ходов для этого процесса. г) Начальный вектор вероятностей. Первое состояние, из которого процесс начинается, может быть либо известно (как в эксперименте 2), либо оно определится по некоторому вероятностному правилу (как в эксперименте 1). Для любого процесса должен быть задан начальный вектор вероятностей а = (ах, ..., ап), где элемент есть вероятность того, что начальное состояние процесса есть s,-. Для эксперимента 1 начальный вектор есть а = (1/2, 1/2), для эк- сперимента 2 — это вектор а = (0, 0, 1, 0, 0), так как известно, что процесс начинается с того, что человек сидит на стуле С. д) Вероятность произвольной, наперед заданной последователь- ности. Рассмотрим последовательность Н, Т, Н, И, Т, Н, полученную в эксперименте 1. Исходя из определения произведения пространств (см. 2.1.7, с. 127) получаем вероятность появления этой последователь- ности: Р (И, Т, Н, И, Т, Н) = Р(Н) . Р (Т) • Р (Я) • Р (Я) • Р (Г) Р (Н) = = 1/2 - 1/2 1/2 • 1/2 - 1/2 • 1/2 = 1/64, так как испытания независимы. 283
Невозможно применить это правило к последовательности, полу- ченной в эксперименте 2. В этом случае переходные вероятности на каждом шаге зависят от конкретного стула, на котором сидит человек, бросающий монету. Другими словами, испытания не будут незави- симыми. Ясно, что считать испытания независимыми и применять для определения вероятности выпадения заданной последовательности правило перемножения вероятностей можно тогда и только тогда, когда все строки матрицы перехода идентичны. Для тех процессов, у которых строки матрицы различаются, естественно обобщить правило перемножения вероятностей следующим образом. Рассмотрим выборочную последовательность sj, sh, sm в экс- перименте, для которого известны начальный вектор вероятностей и матрица перехода. Тогда вероятность последовательности опреде- ляется по формуле Р (Sj, SR, Sm) — P(Sj) • P (Sj —> Sft) • P (sk —> sm) = = dj • pjh • Pkm- Ясно, как распространить это правило на случай последователь- ностей с любым числом шагов (п шагов). Можно показать, что эта про- цедура согласованным образом приписывает определенные вероят- ности каждой из всех возможных последовательностей; для любого значения п сумма соответствующих вероятностей равна единице. Процессы, к которым применимо это правило, называют марков- скими. Для таких процессов вероятность направления следующего шага зависит лишь от текущего состояния процесса и не зависит ни от одного из состояний, достигнутых ранее. Примеры (1) В эксперименте 1 испытания независимы, и процесс является марковским лишь в самом тривиальном смысле. Цепное правило впол- не применимо, но в силу равенства pi} = as для каждого i оно вырож- дается в обычное правило перемножения вероятностей. (2) Вероятность последовательности С, D, С, В, А, А, А в экс- перименте 2 равна Р (С, D, С, В, А, А, А) = Р(С) Р(С -> О) ... = I - 1/2 - 1/2 . 1/2 • 1/2 • 1 • 1 = 1/16. Упражнение 3.1.3 1. Определить вероятности следующих последовательностей: (1) Эксперимент 1: И, Н, И, Н, Н, И; Н, Т, И, Т, Н, Т; Т, Т, Т, Н, И, И (2) Эксперимент 2: С, В, С, В, А, Л, A; D, С, В, Л, А, А, А; С, В, С, D, Е, Е, Е. 2. Пусть человек в эксперименте 2 производит лишь два перемещения. Каж- дая возможная последовательность содержит тогда три буквы. Выпишите все возможные последовательности, определите соответствующие им вероятности и покажите, что суммарная вероятность равна единице. е) Определение стационарной конечной марковской цепи. Стацио- нарная конечная марковская цепь полностью определена, если задано: (1) конечное пространство состояний; 284
(2) матрица Р = [ро] стационарных одношаговых вероятностей перехода; (3) начальный вектор вероятностей а. Цепное правило, описанное в 3.1.2, д), применяется для определения вероятностей выборочных последовательностей. Когда эти характеристики заданы или удовлетворительно оце- пены, можно ответить на целый ряд вопросов, касающихся поведения процесса. Упражнение 3.1.4 Следующие упражнения помогут читателю поближе познакомиться с идея- ми теории марковских цепей и укажут на разнообразие ситуаций, в которых эта теория может применяться. Необходимо, однако, понимать, что большая часть практических примеров идеализирована и упрощающие предположения могут затруднить объяснение полученных выводов и даже сделать такое объяс- нение невозможным. Тем не менее даже очень простые модели часто применяют- ся при изучении реальных процессов. 1. Предположим, что в эксперименте 2 человек для определения своих перемещений каждый раз бросает игральные кости и поступает следующим образом: (1) если он сидит не на крайнем стуле, то: (а) перемещается налево при выпадении 1 или 2; (б) перемещается направо при выпадении 3 и 4; (в) остается на том же месте при выпадении 5 или 6. (2) Если он сидит на крайнем стуле, то: (а) возвращается на стул С, когда выпадает нечетное число; (б) остается на том же месте при выпадении четного числа. Выпишите матрицу переходов в соответствии с новыми правилами. Подсчитайте вероятности следующих последовательностей: С, D, Е, С, D, А, С; С, В, D, Е, Е, А; С, В, А, А, С, D; С, D, Е, С, Е, С. Теперь предположим, что начальное состояние не зафиксировано, а опре- деляется бросанием монеты. Если при бросании монеты выпадает герб (//), то стартовой точкой будет стул В, а если выпадает решетка (Т), то — стул С. Вы- пишите новый начальный вектор вероятностей. Подсчитайте теперь вероятности ранее приведенных последовательностей, а также вероятности следующих последовательностей: В, С, D, С, В, А; В, A, A, C,D, Е; В, С, D, В, Е, С; В, А, С, D, Е, Е. 2. В следующем эксперименте со стульями предположим, что условия те же, что и в эксперименте 2, за исключением того, что крайние стулья не являют- ся «ловушками». Если человек сидит на крайнем стуле, то на следующем шаге он должен переместиться на стул В. Выпишите новую матрицу переходов и выпол- ните предыдущее задание. 3. Рассмотрим снова эксперимент 2; изменим правило (2) следующим об- разом: «Если человек сидит не на крайнем стуле, то на следующем шаге он дол- жен переместиться на ближайший внутренний стул». Стулья А и Е действуют как отражающие стенки, и человек возвращается в игру всякий раз, когда он достигает какого-либо конца ряда. Выпишите новую матрицу переходов и выполните задание I этого упраж- нения. [1 — г г 1 . Если эта матрица стохастическая, s 1 — sj то каковы пределы изменения г и s? 5. Предположим, что имеются только три воскресные газеты: «Корабль», «Чепуха», «Чемпион» и что все люди покупают только одну из них. Пусть в среднем люди стремятся поменять газету (т. е. подписаться на какую-либо другую) не более одного раза в год и вероятности таких изменений постоянны. Задано следующее процентное соотношение: (1) 80% читателей возобновляют 285
Подписку на ту же самую газету в следующем году; (2) 15% читателей «Корабля» подписываются на «Чепуху»; (3) 10% читателей «Чепухи» подписываются на «Чемпиона»; (4) 8% читателей «Чемпиона» подписываются на «Корабль». Выпишите матрицу переходов. Определите вероятности следующих после- довательностей, считая, что выбор первой газеты каждый раз происходит с вероятностью 1: «Корабль» — «Чепуха» — «Чемпион»; «Чемпион» — «Че- пуха» — «Корабль»; «Чепуха» — «Корабль» — «Чемпион». 6. Рассмотрим следующий эксперимент. Первый шаг. Выбрать и записать случайное однозначное число (т. е. выб рать наугад одну из цифр 0, 1, ..., 9). Второй шаг. Выбрать случайным образом еще одну цифру и сложить ее с первой. Если результат будет меньше десяти, то записать его. Если результат больше или равен десяти, то записать только число " единиц. g Например, последовательность выбранных чи- —>— сел 6, 7. Последовательность записанных чисел С будет 6, 3, так как 6 + 7 = 13. Третий шаг. Повторить второй шаг, только при рис 115 этом выбранное число суммируется со вторым за- писанным числом. Например, последовательность выбранных чисел 6, 7, 8. Последовательность за- писанных чисел будет 6, 3, 1, так как 3 |- 8 = И, и т. д. для последующих шагов. Определите пространство состояний и матрицу переходов. Будет ли этот процесс марковской цепью? (См. пример (1) из 3.1.2, д).) 7. Более интересным, чем в предыдущем задании, получается процесс, если случайные числа перемножать, а не суммировать, и записывать число еди- ниц результата. Учитывая это изменение, выпишите матрицу переходов, ис- пользуя (1) пространство состояний {0, 1...9} и (2) пространство состояний {si, s2, s3, s4}, где Sj = {fl}, s2 = {5}, s3 = {2, 4, 6,