Текст
                    ЫЧ1
МИНИСТЕРСТВО ОБОРОНЫ СССР
О.
Г. АЛЕКСЕЕВ, В. Г. АНИСИМОВ, Е. Г. АНИСИМОВ
ш
МАРКОВСКИЕ МОДЕЛИ БОЯ
1985

МИНИСТЕРСТВО ОБОРОНЫ СССР О. Г. АЛЕКСЕЕВ, В. Г. АНИСИМОВ, Е. Г. АНИСИМОВ МАРКОВСКИЕ МОДЕЛИ БОЯ 1985
Учебное пособие посвящено применению марковских цепей к моделированию боевых действий. Марковские цепи являются част- ным видом случайных процессов с дискретным множеством состоя- ний. Вместе с тем они занимают особо важное положение среди по- добных процессов. Это обусловлено тем, что для цепей Маркова хорошо разработан математический аппарат, позволяющий решать многие содержательные задачи, связанные с исследованием реаль- ных (в том числе и боевых) процессов, формализуемых в виде таких цепей, и тем, что очень многие реальные процессы могут быть до- статочно точно аппроксимированы марковскими цепями. В пособии используются разрозненные публикации. Часть ре- зультатов публикуется впервые. При отборе материала авторы стремились достаточно полно охватить прикладные методы исследования марковских цепей. При этом для сокращения объема пособия ряд доказательств резуль- татов опущен. Доступность изложения достигается за счет рассмот- рения применения основных методов на простых примерах.
I. СТОХАСТИЧЕСКИЕ МОДЕЛИ БОЕВЫХ ДЕЙСТВИИ 1.1. Природа стохастичности в моделях боевых действий Существенной особенностью процессов вооруженной борьбы яв- ляется невозможность однозначно предсказать ход и исход борьбы на основе имеющейся априори информации. Несмотря на то, что боевые действия подчиняются определенным объективным зако- нам, в каждом конкретном бою или операции эти законы прояв- ляются через множество неопределенностей. Математическая модель боевых действий может содержать ли- бо детерминированные параметры и связи, либо стохастические, но не может (по крайней мере, при нынешнем состоянии науки) содержать неопределенности. Выбор детерминированного либо стохастического подхода к моделированию боевых действий зависит от целей моделирования, возможной точности определения исходных данных, требуемой точности результатов и отражает информацию исследователя о природе причинно-следственных связей реального боя. При этом неопределенные факторы, которые могут иметь место в реальных боевых действиях, должны быть приближенно представлены как детерминированные или стохастические. Характер параметров, входящих в модель, относится к тем исходным допущениям, кото- рые могут быть обоснованы только эмпирическим путем. Соответ- ствующая гипотеза о детерминированном или стохастическом ха- рактере параметров и связей модели принимается в том случае, если она в пределах требуемой или возможной точности определе- ния этих параметров не противоречит опытным данным. Большинство современных моделей боевых действий основано на теоретико-вероятностных конструкциях. В связи с этим целесо- образно рассмотреть вопрос об исходных посылках применимости таких конструкций к моделированию процессов боя. Теория вероятностей изучает математические модели экспери- ментов (реальных явлений), исход которых не вполне однозначно определяется условиями опыта. Поэтому неоднозначность боевых процессов часто является решающей в выборе стохастического 3
(вероятностного) подхода к моделированию боевых действий. Вме- сте с тем не всегда учитывается, что аппарат теории вероятностей применим для описания и изучения не любых экспериментов с неопределенными исходами, а лишь экспериментов, исходы кото- рых обладают статистической устойчивостью. Тем самым важней- ший вопрос об эмпирическом обосновании применимости теорети- ко-вероятностных методов к рассматриваемым конкретным харак- теристикам боевых процессов иногда полностью выпадает из поля зрения. Применимость методов теории вероятностей для исследования тех или иных процессов вооруженной борьбы может быть обосно- вана только эмпирически на основе анализа статистической устой- чивости характеристик этих процессов. Статистическая устойчивость представляет собой устойчивость эмпирического среднего, частоты события или каких-либо других характеристик протокола измерений исследуемого параметра. Рассмотрим один из возможных подходов к анализу статистиче- ской устойчивости. Пусть проводится серия испытаний, заключающаяся в стрельбе противотанковых орудий по танкам при одних и тех же контро- лируемых условиях эксперимента. Протокол серии этих однород- ных испытаний имеет вид числовой последовательности {*(«)}? = {Х(1),Х(2),. . ., Х(т),. . X(N)\, где п — номер испытания (n=l,N); Х(п)—количество уничтоженных танков при n-м испытании. Пусть, по мере увеличения количества проведенных испытаний, мы анализируем протокол т=1, N (т — номер послед- него испытания) с целью предсказать значение Х(т+1). Простей- ший подход к предсказанию заключается в вычислении эмпириче- ского среднего Л-1 Протокол величин Мт[Х] обозначим через {Мт [X] При этом может оказаться, что эмпирическое среднее число поражен- ных танков Х(п) обнаруживает устойчивость в том смысле, что разброс значений Л4т[Х] в конце концов ощутимо уменьшается по мере возрастания т, т. е. Мт [Д'] гМ [А"] при N> здесь М [X] некоторая константа, а т£ — то наименьшее количество испытаний, начиная с которого \М[Х]-~Мт[Х]\<*, е>0. <4
Если это условие выполняется, то гипотеза о том, что величина Х(п) является случайной (статистически устойчивой), не проти- воречит опыту и для ее анализа применимы методы теории вероят- ностей. В частности, величина М [X] — математическое ожидание числа уничтоженных танков — может служить в качестве прогно- за величины Х(п), n=l, N. На практике часто полагают М [Х] = МдДХ], пренебрегая анали- зом последовательности {Мт Такая упрощенная процедура «измерения» математического ожидания, которую принято назы- вать схемой фиксированной серии, означает отказ от анализа ста- тистической устойчивости. Схема фиксированной серии доставляет значение М[X] и тогда, когда рассмотрение последовательности {Л4т[Х]}^ не выявило бы статистической устойчивости и тем са- мым прогноз Х(/г) ~Л1[Х], п=1, явился бы заведомо ложным. В рамках рассмотренного примера последнее имело бы место, если Х(п) возрастало по мере увеличения п (например, вследствие улучшения навыков личного состава) или убывало (например, вследствие усталости), т. е., как говорят статистики, имел место монотонный тренд. Аналогично ЛЦХ] по схеме удлиняющейся серии могут «изме- ряться» и другие характеристики случайных величин (функции распределения вероятностей, моменты более высоких поряд- ков). Вообще применение схем удлиняющихся серий, на наш взгляд, является разумной альтернативой «домысливанию ровно одного этажа вероятностей, называемых доверительными вероятностями, или уровнями значимости, сверх тех, которые действительно изме- ряются в эксперименте» [3], характерному при применении методов математической статистики для анализа результатов статистиче- ских моделей боевых действий. Более подробно с этими вопросами можно ознакомиться по работам [1], [2], [3]. Следует, однако, отметить, что вопрос о статистической устойчи- вости реального боя в целом, а следовательно, и о применимости теоретико-вероятностных понятий к его моделированию в настоя- щее время может быть решен только на интуитивном уровне. Это объективно обусловлено отсутствием достаточного числа опытов, касающихся боя (операции) в целом. Вместе с тем большинство «элементарных» процессов, составляющих боевые действия, носят случайный характер (т. е. гипотеза об их статистической устойчи- вости не противоречит имеющемуся опыту). Так, например, факт поражения той или иной цели противника в результате огня ар- тиллерии или бомбометания является случайным событием; случай- ным является число самолетов, преодолевших систему ПВО, слу- чайный характер носят процессы разведки и опознавания объектов противника; случайными являются отказы техники, моральное со- стояние личного состава и т. д. Случайность этих явлений эмпири- чески подтверждена достаточно большим числом экспериментов. 5:
Все указанные «элементарные» случайные процессы взаимо- действуют между собой, объединяясь в едином процессе боевых действий. Несмотря на то, что управление войсками направлено на то, чтобы снизить элемент случайности и придать боевым дей* ствиям детерминированный целенаправленный характер, реальные боевые действия столь сложны, что как бы ни была высока сте- пень централизации управления, случайные факторы в них всегда присутствуют, поэтому природа боевых действий остается случай- ной в широком смысле. Это служит основанием для применения стохастических моделей при исследовании боевых действий и управления ими, хотя полную стохастическую устойчивость боя в целом вряд ли можно вполне гарантировать. Опыт применения стохастических моделей в нашей стране и за рубежом содержит примеры их высокой эффективности. 1.2. Основные подходы к построению стохастических моделей боевых действий В настоящее время сложились два основных подхода к стоха- стическому моделированию боевых действий. Первое направление связано с построением стохастических моделей на основе метода статистических испытаний (Монте-Карло) [4]. Второе направление заключается в построении аналитических моделей боевых дейст- вий [4], [20], [21]. Оба эти направления развиваются параллельно и взаимно дополняют друг друга. Главной особенностью моделей, основанных на методе стати- стических испытаний, является то, что они приближенно воспроиз- водят боевой процесс на основе имитации его элементарных со- ставляющих и их взаимосвязей. Это позволяет моделировать про- цессы очень сложной структуры, зависящие от большого числа разнообразных факторов. Вместе с тем модели статистических ис- пытаний, как правило, громоздки. Их применение требует боль- шого объема памяти ЭВМ и связано с большими затратами ма- шинного времени. Существенным недостатком этих моделей яв- ляется отсутствие конструктивных способов оптимизации. Некоторые из недостатков имитационных статистических моде- лей боевых действий преодолеваются применением аналитических моделей. В настоящее время для построения аналитических моделей сто- хастических процессов боевых действий применяются два основ- ных подхода — микроскопический и макроскопический. Микроскопический подход состоит в детальном изучении пове- дения каждого элемента системы сил и средств сторон в бою. Макроскопические модели изучают только макросвойства системы Сил и средств сторон и учитывают только средние характеристики для состояний системы, например среднее количество элементов системы, находящихся в некотором определенном состоянии. Это приводит к потере информации о состоянии каждого элемента си- 6
стемы сил и средств, участвующих в бою, так как одни и те же макросостояния могут быть результатом различных сочетаний микросостояний. В то же время макроскопический подход позво- ляет сократить размерность математической модели, сделать ее более обозримой, сократить затраты ресурсов ЭВМ при производ- стве расчетов. Микроскопический подход предпочтителен в случае, когда требуется более детальная информация о поведении систе- мы. Макроскопический подход применяется для достаточно быст- рых оценочных расчетов. Формальные соотношения для стохастических моделей боевых действий в ряде случаев могут совпадать по форме с аналогич- ными соотношениями детерминированных моделей, но они принци- пиально различаются интерпретацией параметров и результатов моделирования. Классический пример такого сходства представ- ляют ланчестерская квадратичная модель боя [5] и модель боя типа А динамики средних [6]. Дифференциальные уравнения этих моделей имеют вид - -ММО; 01) 7П1 (0) = /V, т2 (0) = М. Для детерминированной ланчестерской модели: ^2 — текущие численности боевых средств сторон; Af, М — начальные численности боевых средств сторон; Ль ^2 — скорострельности боевых средств сторон. Для модели динамики средних: т2 — математические ожидания численностей боевых средств сторон; Xi, Л2— эффективные скорострельности боевых средств сто- рон. Отличительная черта детерминированной модели (L1) состоит в том, что при заданных Ль Л2, N, М процесс полностью определен для любого момента времени />0. При стохастической трактовке модель (1.1) описывает динамику математических ожиданий чис- ленностей боевых средств, участвующих в бою, и следовательно, характеризует бой в среднем, представляя лишь оценки для каж- дой конкретной реализации. Непредсказуемость точных результа- тов боя — отличительная черта стохастических процессов. Отраже- ние этой черты в стохастических моделях боевых действий прояв- ляется в том, что они позволяют предсказать только средние ре- зультаты (моменты распределения результатов боя) или вероят- ности наступления тех или иных результатов. Для динамических процессов боевых действий аналитические модели удается построить, если эти процессы представляют собой (точно или приближенно) так называемые марковские случайные процессы. Это обстоятельство наряду с тем, что любой случайный 7
процесс путем соответствующего выбора (построения) простран- ства состояний может быть достаточно точно аппроксимирован марковским процессом [12], явилось основой для широкого приме- нения марковских случайных процессов при моделировании бое- вых действий. 1.3. Определение и классификация марковских случайных процессов Марковские случайные процессы получили свое наименование по имени выдающегося русского математика Андрея Андреевича Маркова (1850—1922), который впервые в 1907 г. ввел основные понятия и в дальнейшем исследовал основные свойства процессов. Уже по своему определению марковские случайные процессы близки ко многим процессам реального мира. Это обусловило бур- ное развитие их теории и приложений. В настоящее время марков- ские случайные процессы широко применяются в математической биологии и генетике, в экономике, физике, химической кинетике и теории массового обслуживания. Исключительно важная роль отводится марковским случайным процессам при моделировании боевых действий. В математическом описании боевые действия рассматриваются как система, которая в силу ряда факторов может переходить в различные состояния. Под системой может пониматься группа самолетов, артиллерий- ский дивизион, группировка войск, участвующих в операции (бою), и т. п. Состояниями системы могут быть те или иные собы- тия, например количество непораженных орудий в артиллерийском дивизионе, или глубина продвижения войск, участвующих в опе- рации, или их пространственное расположение, или степень боеспо- собности, или совокупность этих событий и т. п. Если состояние системы меняется во времени случайным обра- зом, то говорят, что в системе протекает случайный процесс. Слу- чайный процесс X(t) называется марковским (или процессом без последствия), если вероятности состояний в любой будущий мо- мент времени t>t0, t С [0, Т] при условии, что точно известно со- стояние X(to)=xQ в текущий момент времени to, не изменяются при учете дополнительной информации о прошлом данного про- цесса, т. е. при заданных значениях xh х2, . . хп справедливо со- отношение P\X(tn)<xn\X(tx) = x^ ^(4) = х2, X(tn^=xn_i\ = = Р\х (t„) < хп IX (6,-0 = хл-4 (1.2) при любых tn > tn_\ > . . . >tx из отрезка [0, Г], где Р — вероят- ность события, указанного в скобках. Чтобы формально опреде- лить марковский случайный процесс в системе, необходимо: 1) определить отрезок [0, Т], из которого может принимать значения параметр /; 2) определить множество Y — всех возможных достояний си- стемы; 8
3) определить условные вероятности Rk] (t, т) того, что слу- чайная функция X(t) в момент т>/ (/, [О, Т]) равна xy- g У, если в момент t эта функция была равна xk £ У, т. е. Rkj(t, х) = Р{Х (х) = xf\X (t) = хк}, t, te[O, T\,xh Х*€Г;(1.3) 4) определить вероятности Pk(t) того, что в момент времени t X(i)^xki xke Y. В основу классификации марковских случайных процессов по- ложены характер множества У и характер изменения параметра /. В зависимости от того, непрерывное или дискретное множество значений принимают X(t) и параметр t, различают следующие виды марковских случайных процессов [13]. 1. Марковская цепь (дискретная случайная марковская по- следовательность) — это дискретный процесс с дискретным вре- менем. В данном случае t пробегает дискретный ряд значений f0, Л, • • tN и случайная величина X(/Z) = x. может принимать лишь дискретное множество значений У={х2, . . ., хп]. Множе- ства значений {xz}, /=1, п и / = 0, N могут быть как конеч- ными, так и бесконечными (счетными). Примером процесса, формально описываемого цепью Маркова, может служить нанесение последовательных (в строго определен- ные моменты времени t0, tb . . ;, ударов по некоторому объ- екту противника. Состояние объекта, в котором он окажется после очередного удара, зависит только от того, в каком состоянии он находился перед этим очередным ударом, но не зависит от того, каким образом он был переведен в это состояние. 2. Марковская последовательность (непрерывный процесс с ди- скретным временем). Этот процесс отличается от цепи Маркова тем, что случайная величина X(tn), n = 0, N может принимать кон- тинуум значений (т. е. У — непрерывное множество). Примером процесса, формализуемого в виде марковской последовательности, может служить нанесение последовательных ударов в строго опре- деленные моменты времени /л, n = 0, N по некоторому объекту про- тивника, состояние которого определяется уровнем боеспособности, принимающим значение на отрезке [0, 1]. 3. Дискретный марковский процесс (дискретный процесс с не- прерывным временем). В этом случае X(t) принимает дискретные значения (т. е. У — дискретное множество), а параметр t прини- мает континуум значений из отрезка [0, Т]. Примерами дискретных марковских процессов (или, как их ино- гда называют, непрерывных цепей Маркова) могут служить про- цессы, протекающие в системах массового обслуживания с пуассо- новским потоком заявок и экспоненциальным временем обслужива- ния. 4. Непрерывный марковский случайный процесс. В данном слу- чае X(t) принимает значения из непрерывного пространства У и аргумент t принимает континуум значений из отрезка (0, Г]. 9.
Примерами непрерывных марковских случайных процессов яв- ляются диффузионные процессы, процесс броуновского движения. При моделировании боевых действий процессы этого типа могут применяться для описания перемещения линии фронта. Характер временных реализаций для указанных четырех типов марковских случайных процессов приведен в табл. 1.1 [13]. Таблица 1.1 Пространство состоянии Дискретное Непрерывное Марковская последовательность XW г <ь XW Дискретный марковский процесс {непрерывная цепь Маркова) t Непрерывный марковский случайный процесс Процессы боевых действий, как правило, описываются вектор- ными случайными процессами Т(0 =[%,(/), х2(/),. . х„(0]. В общем случае компоненты (/), /=1, п могут относиться к раз- ным типам марковских случайных процессов, перечисленных выше. В дальнейшем мы более подробно остановимся на двух типах марковских случайных процессов — цепях Маркова и дискретных марковских процессах. 10
II. ПРИМЕНЕНИЕ ДИСКРЕТНЫХ ЦЕПЕЙ МАРКОВА К МОДЕЛИРОВАНИЮ БОЕВЫХ ДЕЙСТВИИ 2.1. Основные понятия и свойства При применении теории марковских цепей для моделирования боевых действий моделируемый боевой процесс рассматривается как некоторая физическая система, которая в каждый момент вре- мени t С [О, Т] может находиться в одном и только одном из п возможных состояний У={хь х2, . . В фиксированные мо- менты времени t2, h, . . . эта система под воздействием случай- ных факторов может переходить из одного состояния в другое или оставаться в прежнем состоянии. Вероятность того, что система в момент времени tk окажется в состоянии Ху, /=1, и, полностью определяется состоянием, в ко- тором система находилась в момент времени Полное вероятностное описание поведения этой системы дости- гается заданием вектор-строки вероятностей начального состоя- ния P(0) = Ha(QII. i = (2.1) и последовательности матриц вероятностей одношаговых перехо- дов ИЗ СОСТОЯНИЙ Xi, i= 1, П В СОСТОЯНИЯ X/, п: R W = || Rlf (tk) И, i, j=T^, k= 1, 2, 3, . . . (2.2) Каждая из матриц R(k), k—\, 2, 3, . . . представляет собой квад- ратную матрицу конечного (если множество У конечно) или бес- конечного (если У — счетное множество) порядка. Так как все элементы матриц (2.2) являются вероятностями, то они — неотрицательные числа, не превосходящие единицу. Элементы i-той, i=l, п строки матриц (2.2) являются вероят- ностями переходов при A-том, £=1, 2, 3, . , . шаге процесса из co- ll
стояния Xi соответственно в состояния хь х2, . . хп. Так как на каждом шаге обязательно происходит один из этих переходов, то имеет место равенство S Rij(tk) = 1, i=T7^ k=l, 2, 3, . . . (2.3) /-1 Свойство (2.3) может использоваться для проверки правильности определения элементов матриц (2.2). В каждом столбце матриц (2.2) всегда имеется хотя бы один отличный от нуля элемент, так как в противном случае из усло- вия Rtj(tk) =0, /=1, п следовало бы, что на £-том шаге процесса невозможен переход в состояние Xj из любого xf, Z=l, п (в том числе и из х;), а это противоречит условию неизменности прост- ранства состояний системы от испытания к испытанию. Матрицы (2.2), удовлетворяющие этим условиям, называются стохастическими. Зная стохастические матрицы (2.2) цепи и вектор-строку ве- роятностей начального состояния (2.1), можно вычислить вероят- ности состояния цепи после т шагов по формуле т Р(т)=Р(0) ПЯ(*)- (2-4) Среди дискретных цепей Маркова различают однородные и не- однородные. Однородные цепи характеризуются тем, что вероят- ности переходов 7?/у(^), i, j=l, п не зависят от т. е. Ri}(tk) = Rij9 i, fc=l, 2, 3, . . . Для однородных марковских цепей соотношение (2.4) прини- мает вид Р(т)=Р(0)/?^. (2.5) Для матрицы переходов цепи за m + k шагов имеет место ра- венство R(m+k) = ftntQk (2.6) где Rm, Rk — матрицы вероятностей переходов за т и k шагов. Уравнение (2.6) представляет собой функциональное уравнение Колмогорова—Чепмена в матричной форме. Частный случай этого уравнения для конечных цепей был получен А. А. Марковым и но- сит название уравнения Маркова. Функциональное уравнение (2.6) имеет фундаментальное зна- чение в теории марковских цепей и их приложениях. Использова- ние соотношения (2.6) позволяет сократить объем вычислений при определении матрицы, вероятностей переходов однородной цепи 12
за п шагов. Например, необходимо вычислить матрицу вероятно- стей переходов однородной цепи за 16 шагов. Процесс вычисления в соответствии с (2.6) можно организовать следующим образом: = R8=RiR*-t ^>6=^8^ т е вместо 15 последова- тельных перемножений матриц R к тому же результату можно прийти с помощью четырех. Множество состояний цепи и возможных переходов часто удоб- но представлять в виде графа, т. е. схемой, образованной верши- нами (соответствующими состояниям хг£У), соединенными между собой ориентированными дугами (соответствующими воз- можным переходам). Например, для цепи со стохастической матрицей 0,1 0,1 0,7 0,1 0 0,5 0,5 0 ед=/?= 0 0 0,8 0,2 0,9 0 0 0,1 _ (2.7) граф состояний имеет вид, как на рис. 2.1. На размеченном графе состоя- ний проставляются только те пере- ходные вероятности, которые не рав- ны нулю и меняют состояние систе- мы. Вероятности /?ц, #22, ... на графе не проставляются, так как каждая из них дополняет до едини- цы сумму переходных вероятностей, соответствующих всем стрелкам, ис- ходящим из данного состояния. Для иллюстрации применения марковских цепей рассмотрим не- сколько примеров. Пример 2.1. По объекту против- ника, содержащему две цели, нано- сятся два независимых удара. При рис 2 i fe-том ударе, £=1, 2 вероятность по- ражения только первой цели равна только второй цели — r2(k), первой и второй цели — r3(k). Требуется определить вероятности поражения целей после двух ударов. Решение. Пусть состояние Xi означает непоражение обеих целей, состояние х2 — поражение только первой цели, состояние х3— поражение только второй цели, х4 — поражение первой и вто- рой целей. До нанесения ударов вероятности этих состояний равны р = 11а II = [юоо]. 13
Чтобы найти вероятности поражения целей после нанесения ударов, необходимо сначала построить стохастические матрицы Я(*)=||Я//(*)И. »./= ГТ 6=1,2. Если исходным состоянием является Xi, то вероятность пере- хода в состояние х2 (вероятность поражения только первой цели) при 6-том ударе равна /?|2(6) =П(6), вероятность перехода в со- стояние х3 равна /?1з(6) = r2(k), вероятность перехода в состояние х4 равна /?н(6) =г3(6). Вероятность остаться в состоянии Xi равна (см. (2.3) 1 -/?12(6) -/?13(6) ~/?14(6)=1 -гД6) — r2(6) -г3(6)=г0(6). Если исходным состоянием является х2 (т. е. поражена только первая цель), то вероятность перехода в xt равна нулю (так как не может быть непораженных целей) и вероятность перехода в состояние Хз также равна нулю (так как не может быть поражена только вторая цель). Вероятность перехода в состояние х4 равна ^24=^2 (6) + г3(6); вероятность остаться в состоянии х2 равна 1—Гг(6)+г3(6) =г0(6)+Г](6). Если исходным состоянием являет- ся Хз, то R31 = 0> |/?зг = 0; /?зз = 1 — г\ (6) — г3(6) = г0(6) + г2(6); /?34 = ''|(6) + Г2(6). Если исходным состоянием является х4, то R4i = R42 = R43 = 0, R44=\. Таким образом, матрица перехода для 6-того удара равна Г, (6) г2(6) г3(6) О r0(6) + rt(6) 0 г2(6) + г,(6) О 0 г0 (6) + г2 (6) г\ (6) + г3 (6) ООО 1 Теперь для определения вероятностей поражения цели после двух ударов можно воспользоваться формулой (2.4). Получим: 1) вероятности состояний после первого удара равны ^(1) = Пго(1) П(1) г2(1) гз(1)||; 2) вероятности состояний после второго удара равны Р (2) = || го (1) го (2); г0 (1) г0 (2) + (г0 (2) +о(2) ] г, (1); /-2(2)го(1) +[г0(2) +г2(2)]г2(1)гз(2)г0(1) + +[/-2(2) + г3(2)]г, (1) +[г, (2) +г3(2)] г2(1) +г3(1) ||. (2.8) Анализ вероятностей состояний системы после двух последова- тельных ударов показывает, что вероятность непоражения ни од- ной цели (вероятность состояния %i) не зависит от последователь- ности ударов. Вероятности же остальных состояний зависят от 14
последовательности ударов. Поэтому при различной важности це- лей для этой цепи может быть сформулирована оптимизационная задача, например, следующего вида. Пример 2.2. В условиях примера 2.1 определить последо- вательность ударов, максимизирующую математическое ожи- дание ущерба противнику, если важность первой цели рав- на Д1, второй А2. Математическое ожидание ущерба может быть вычислено по формуле (7=Д1Р2+^2Рз'+ (Д1+Дг)Р4, (2.9) где pi (1 = 2, 4) —вероятности состояний xt после двух ударов. Задача решается путем перебора. На первом шаге из (2.8) оп- ределяются вероятности р^\ i = 2, 4 при первом варианте органи- зации последовательности ударов и по формуле (2.9) определяется ущерб На втором шаге из (2.8) определяются вероятности р№ при втором варианте организации последовательности ударов и по формуле (2.9) определяется ущерб. Оптимальным является вариант организации последовательности ударов, доставляющий большее значение ущерба. Если количество вариантов велико, то для решения оптимиза- ционных задач на цепях могут применяться методы целочислен- ного программирования. Пример 2.3 [7]. Эскадрилья бомбардировщиков насчитывает 4 самолета. Как правило, эскадрилья получает боевое задание один раз в день. Если к концу дня наличный состав самолетов уменьшается до 0, 1 или 2 из-за потерь, нанесенных противником, командир эскадрильи получает один самолет из резерва; этот са- молет доставляется ему ночью. Если наличный состав окажется равным 3 или 4 самолетам, командир не имеет права на пополнение. На следующий день, если в наличии 3 или 4 самолета, эскадрилье дается боевая задача. В противном случае задача отменяется. Во время выполнения задачи каждый самолет может быть выведен из строя с вероятностью р. Если на задание посылаются п само- летов, вероятность того, что k из них будут выведены из строя, за- дается биномиальным распределением РМ = Необходимо определить математическое ожидание числа само- летов в эскадрилье, если длительность боевых действий /~>оо. Эскадрилья самолетов может рассматриваться как некоторая система, состояния которой характеризуются количеством самоле- тов. Динамика системы заключается в изменении количества са- молетов в силу действия случайных факторов и может быть фор- 15
мально описана в виде марковской цепи, граф состояний и стоха- стическая матрица которой изображены на рис. 2.2. Решение задачи 2.3 связано с исследованием поведения цепи после достаточно большого количества испытаний. (1) С2) (3) (4) (1) 0 1 0 0 (2) 0 0 1 0 (3) Рг З/’Ч W+ч3 0 (4) Р* W+ + 4/?<J!3 состояние системы на i -том шаге Рис. 2.2 состояние системы на ииаее ? = !-/> Применение соотношений (2.4), (2.5), (2.6) к решению задач подобного типа приводит к очень громоздким вычислениям, нера- циональному расходу машинного времени ЭВМ, а иногда и вовсе не позволяет получить решение в разумные сроки1. Вместе стем задачи, связанные с определением характеристик цепи после до- статочно большого числа шагов, являются важными для приложе- ний (в том числе и при моделировании боевых процессов). Это обусловливает необходимость построения специальных подходов к решению подобных задач. При этом построение единых и доста- точно эффективных в вычислительном отношении методов возмож- но только для частных типов цепей. Последнее приводит к необхо- димости деления цепей на такие типы, т. е. к их классификации. 1 Решение примера 2.3 будет завершено в п. 2.5. 16
2.2. Классификация состояний и цепей Состояния марковской цепи могут быть классифицированы раз- личными способами. В настоящее время наибольшее распростра- нение получил подход Колмогорова, в соответствии с которым со- стояния классифицируются в зависимости от того, может ли си- стема перейти из данного состояния в другое данное состояние. Эта классификация имеет большое значение при изучении асимпто- тического поведения вероятностей перехода за &->оо шагов. Определение 2.1. Состояние x^Y называется существен- ным, если для каждого состояния х;- £ У, достижимого из X/, со- стояние xt достижимо за конечное число шагов из х;-. Состояние, не являющееся существенным, называется несущественным, напри- мер для цепи, граф состояний которой изображен на рис. 2.3. Рис. 2.3 Состояния х2, х3, х4, х5, х6, х7, х8, х9 являются существенными, состояние Xi является несущественным. Определение 2.2. Существенные состояния X/ и Ху назы- ваются сообщающимися, если Xj достижимо за конечное число шагов из хь и наоборот. Для цепи рис. 2.3 состояния х2 и х3 являются сообщающимися, а состояния х4 и х5 не сообщаются. Определение 2.3. Множество состояний S'с= К называется замкнутым, если невозможны одношаговые переходы из любого состояния множества 5 в любое состояние множества S\K — до- полнения множества S. Для цепи рис. 2.3 состояния х8, х9 обра- зуют замкнутое множество. Все существенные состояния цепи можно разбить на I (1 классов Ui, и2, . . ., ut таким образом, что состояния, 2 Зак. 559 17
относящиеся к одному классу, сообщаются, а состояния различ- ных классов между собой не сообщаются. Например, для цепи РИС. 2.3 = \Х2, = {*4}, ^3={^5» Х6, ^4=={Х8, ХэЬ Каждый из классов сообщающихся состояний образует эрго- дическое множество, т. е. такое множество состояний, в котором из любого состояния можно попасть в любое другое состояние этого множества и из которого, попав в него, нельзя уйти. Если эргодическое множество состоит из одного состояния, то это состояние называется поглощающим. Любая марковская цепь содержит хотя бы одно эргодическое множество состояний, в то время как несущественных состояний может и не быть. В соответствии с приведенной классификацией состояний и их групп все цепи Маркова можно классифицировать следующим образом. В зависимости от количества замкнутых множеств со- стояний различают: 1) цепи, содержащие более чем одно замкнутое множество со- стояний; 2) цепи, содержащие только одно замкнутое множество состоя- ний. Цепи, содержащие более чем одно замкнутое множество со- стояний, называют разложимыми. Примером разложимой цепи яв- ляется цепь, граф состояний которой показан на рис. 2.3. Эта цепь включает следующие два замкнутых множества состояний: {х1э ..., х7|; |х8, х9|. Марковская (стохастическая) матрица разложимой цепи может быть записана в виде блочной матрицы, например ’ /?! О ' . О _ R = где и /?2 — стохастические матрицы, описывающие переходы внутри двух замкнутых множеств состояний. Система, выходящая из некоторого состояния, соответствую- щего никогда не может оказаться в любом состоянии, соответ- ствующем /?2, и наоборот. Поэтому разложимая цепь распадается на отдельные цепи, которые могут изучаться независимо друг от друга. Тем самым изучение поведения разложимых цепей Марко- ва сводится к изучению поведения неразложимых (содержащих только одно замкнутое множество) цепей. Неразложимые цепи Маркова в свою очередь можно разделить на цепи без несущественных состояний и цепи с несущественными состояниями. Цепи без несущественных состояний могут содержать одно или более эргодических множеств. Если цепь без несущественных со- стояний содержит более чем одно эргодическое множество, то меж- 18
ду ними йет никакого взаимодействия и, следовательно, такая цепь распадается на несколько (по числу эргодических множеств) изо- лированных цепей, каждую из которых можно изучать по отдель- ности. Поэтому, не теряя общности, можно полагать, что цепь без несущественных состояний содержит только одно эргодическое множество (т. е. является эргодической). Примером эргодической цепи может служить цепь, изображенная на рис. 2.1. Среди эргодических цепей выделяют регулярные и цикличе- ские. Циклической называется эргодическая цепь, в которой в каж- дое состояние можно попадать только через определенные проме- жутки времени (определенное количество шагов). Самая простая циклическая цепь показа- на на рис. 2.4. Регулярными называ- Гп ют эргодические цепи, не (х ) ( х ) = являющиеся циклически ми. Примером цепи с несу- щественными состояниями является цепь, граф со- Рис- 2,4 стояний которой изобра- жен на рис. 2.2, или цепь, образованная состояниями {хь Х2, . . х7} рис. 2.3. В таких цепях процесс движется к эргодическим мно- жествам и вероятность того, что процесс находится в одном из эр- годических множеств, стремится к единице по мере увеличения времени. Кроме того, попав в одно из эргодических множеств, про- цесс не может его покинуть. Поэтому цепи с несущественными со- стояниями естественно классифицировать по типу эргодических множеств. Принято различать: а) поглощающие цепи (цепи, все эргодические множества ко- торых содержат только по одному состоянию); б) цепи, у которых все эргодические множества регулярны, но не все из них являются поглощающими; в) цепи, у которых все эргодические множества цикличны; г) цепи, содержащие циклические и регулярные эргодические множества. Как следует из классификации, основными типами марковских цепей, из которых можно построить цепи произвольного вида, яв- ляются: эргодические регулярные цепи; эргодические циклические цепи; поглощающие цепи. Поэтому далее мы рассмотрим некоторые методы определения характеристик поведения этих типов цепей и подходы к анализу цепей общего вида на основе этих методов. 2* 19
2.3. Поглощающие цепи В данном пункте мы ограничимся изучением только конечных поглощающих цепей. Это обусловлено, с одной стороны, тем, что конечные цепи наиболее интересны с точки зрения приложений для моделирования боевых процессов, а с другой — тем, что для характеристик конечных цепей можно построить достаточно про- стые матричные выражения. При этом мы ограничимся только формулировкой основных результатов в виде, удобном для прило- жений. Подробные доказательства результатов, изложенных в дан- ном и последующих пунктах раздела, можно найти в работе [8J. Напомним, что поглощающей называется марковская цепь, все эргодические множества которой являются поглощающими. При- мером поглощающей цепи может служить цепь, граф состояний и марковская матрица которой изображены на рис. 2.5. 1 О I О О I О 1’10 о ! ^31 0-j ^33 ^34 ° ^42 | ^43 ^44 Рис. 2.5 Эта цепь содержит два несущественных (невозвратных) со- стояния *4} и два поглощающих состояния Х2|. Для ана- лиза поглощающей цепи удобно матрицу вероятностей переходов записывать в канонической форме. Пусть имеется некоторая поглощающая цепь, содержащая s невозвратных и п—s поглощающих состояний. Тогда, нумеруя эти состояния последовательно, начиная с поглощающих, мы получим цепь с матрицей вероятностей переходов вида n—s S ' 1 01} га — s (2.10) R Lp qJ}s ’ где I — единичная матрица размерности (п—s)X(n—$); 0 — нулевая матрица размерности (га—s)X$; Q — квадратная матрица размерности sXs; Р — матрица размерности sX (п—s). Матрица вида (2.10) называется канонической матрицей по- глощающей цепи. Например, матрица вероятностей переходов для поглощающей цепи рис. 2.5 записана в каноническом виде. 20
Матрица Q описывает поведение цепи до выхода из множе- ства невозвратных состояний. Так как в любой конечной поглоща- ющей цепи Маркова вероятность оказаться в одном из поглощаю- щих состояний стремится к единице, если количество шагов &->оо, то limQ* =0. k -► t» Матрица Р соответствует переходам из невозвратных в по- глощающие состояния. Из определения операции произведения матриц следует, что при возведении матрицы R в степень подматрица I не меняется. Это является формальным отражением того факта, что, достигнув одного из поглощающих состояний, система уже не может его по- кинуть. Мйогие важные характеристики поглощающей цепи Маркова могут быть получены на основе фундаментальной матрицы этой цепи. Определение. Фундаментальной матрицей поглощающей цепи называется матрица #=(/ —Q)-’, где I — единичная матрица размерности sXs; Q — матрица, определяемая из (2.10). Обозначим: ni — функция, равная общему числу моментов времени (ша- гов) нахождения системы в состоянии Ху. Эта функция определена (имеет конечное значение) только для невоз- вратных состояний; [fly] — математическое ожидание для и у при условии, что про- цесс начался из состояния xf; Di [яу]—дисперсия для Пу при условии, что процесс начался из невозвратного состояния xz. Тогда имеют место соотношения {Л1г [zzj} = 7V = (/— Q)-1, (2.11) т. е. элемент, стоящий на пересечении Z-той строки и /-того столб- ца фундаментальной матрицы, равен математическому ожиданию числа моментов времени нахождения системы в состоянии Xj при условии, что процесс начался из невозвратного состояния xz, IA [«/В = N(2Ndq - /) - Nsq, (2.12) где Ndq— матрица, получаемая из N заменой всех элементов, не лежащих на главной диагонали, нулями; Nsq—матрица, получаемая из N возведением в квадрат каж- дого элемента. 21
Важными характеристиками поглощающей цепи являются так- же следующие: ti — количество шагов, за которое система достигнет погло- щающего состояния при условии, что процесс начался из состояния bjj — вероятность того, что система, выйдя из состояния xh до- стигнет поглощающего состояния ху; mi—количество невозвратных состояний, в которых система побывает до поглощения; —время пребывания системы в невозвратном состоянии xz до выхода из этого состояния; htj— вероятность того, что система, выйдя из состояния Xi хотя бы один раз, побывает в состоянии х;«. Приведем формулы для определения математических ожида- ний и дисперсий этих характеристик: [М [Ь]\ = Ne = т; (2.13) {D [/,]} = (22V- /)т- (2.14) где 8 — вектор-столбец размерности $, все компоненты которого равны единице; —вектор-столбец, полученный из т возведением в квадрат каждого элемента. Соотношения (2.13), (2.14) определяют вектор-столбцы, эле- менты в /-той строке которых равны соответственно математиче- скому ожиданию и дисперсии количества шагов, за которые систе- ма достигает поглощающего состояния при условии, что процесс начался из состояния X/. = (2-15) где Р — матрица, определяемая из (2.10). Элемент, стоящий на пересечении f-той строки и /-того столб- ца матрицы В, определяемой соотношением (2.15), равен вероят- ности достижения поглощающего состояния Xj при условии, что процесс начался из состояния хг {М [тп.-П = М/7Д (2.16) Соотношение (2.16) определяет вектор-столбец, элементы кото- рого равны математическим ожиданиям числа невозвратных со- стояний, через которые система проходит до поглощающего со- стояния, если процесс начинается из состояния X/. = (2.17) р (2-18) где Иц, / = 1, п — элементы матрицы R вероятностей переходов цепи. H=\\h4\\ = {N-\)NIg\ (2.19) 22
Элемент, стоящий на пересечении f-той строки и /-того столб- ца матрицы Я, равен вероятности достижения системой хотя бы один раз состояния Xi при условии, что процесс начался из невоз- вратного СОСТОЯНИЯ Ху. Соотношения (2.11) — (2.19) позволяют решать широкий круг задач, связанных с анализом поведения поглощающих цепей. Пример 2.4. Артиллерийский дивизион в ходе боевых действий может находиться в одном из следующих состояний: Xi — дивизион не боеспособен в результате поражения против- ником; х2 — дивизион не боеспособен из-за израсходования боеприпа- сов; %з — дивизион боеспособен, но не выполняет огневую задачу; х4 — дивизион выполняет огневую задачу. Возможные переходы и их вероятности за каждый час боевых действий показаны на рис. 2.6. Требуется определить: 1) матема- тическое ожидание числа огневых задач, выполненных дивизио- ном до потери боеспособности; 2) вероятность поражения дивизио- на до израсходования боеприпасов; 3) вероятность израсходования боеприпасов до поражения дивизиона противником. I о | о 1 I о 1 О--------I 0,4 0,1 | 0,3 I о о 0,5 0,4 Рис. 2.6 Решение. Математическое ожидание числа огневых задач, выполненных дивизионом до потери боеспособности, зависит от со- стояния, из которого начались боевые действия, и равно Из соотношения (2.11) определяем 1 О {Л4,-[«/]} = (/-(?)-> = ’ 0,6 —0,51"* .-0,3 0,6. О' 1 (3)Г <4)L '0,4 0,51V1 ’ .0,3 0,4]/ (3) 2,9 1,4 (4) 2,4 ‘ 2,9. Л14[х4]=2,9 (бой начинается с выполнения огневой задачи); ^3[х4]=2,4 (дивизион с начала боя не выполняет огневую за- дачу) . 23
2,9 2,4' 1,4 2,9 B = NP = Вероятность поражения дивизиона до израсходования боепри- пасов и вероятность израсходования боеприпасов до поражения дивизиона зависят от состояния в начале боевых действий и рав- ны соответственно Ьц и i = 3, 4. Из соотношения (2.15) находим матрицу (1) (2) 0,1 0 1^<3> 0,77 0,23 0,2 0,1 J ~ (4)10,72 0,28 _ Вероятности поражения дивизиона до израсходования боеприпасов равны &з1 = 0,77, 64i = 0,72. Вероятности израсходования боеприпа- сов до поражения дивизиона противником равны 6з2 = 0,23, 642 = = 0,28. Анализ результатов решения показывает, что количество бое- припасов, выделенное дивизиону на бой, явно завышено, так как вероятности их израсходования до поражения дивизиона противни- ком малы по сравнению с вероятностями поражения дивизиона до израсходования боеприпасов, а живучесть дивизиона низка. По- этому требуется проведение мероприятий по повышению живу- чести дивизиона, а количество боеприпасов может быть снижено. 2.4. Эргодические цепи Маркова Наряду с поглощающими цепями эргодические марковские цепи являются тем основным «элементарным» типом цепей, из ко- торых можно построить марковские цепи произвольного вида. Основным свойством эргодической марковской цепи является возможность за конечное число шагов перейти из каждого состоя- ния цепи Х[ £ У в любое другое х}- £ У. Из п. 2.2 следует, что эргодические цепи могут быть либо ре- гулярными, либо циклическими. Необходимым и достаточным условием регулярности цепи яв- ляется существование такого числа что все элементы матрицы RN вероятностей переходов за N AG шагов не равны нулю. Фи- зически это означает, что через конечное число шагов N^Ni си- стема может перейти в любое из возможных состояний. Для циклической цепи такого числа Afi не существует. Никакая степень матрицы вероятностей переходов для циклической цепи не является положительной матрицей, и различные степени матрицы содержат на разных местах нули, положение которых циклически повторяется с увеличением числа шагов процесса. Это циклическое повторение расположения нулей в матрицах вероятностей перехо- дов цепи является формальным отражением того факта, что пере- ход системы из одной группы состояний в другую происходит за 24
строго определенное конечное число шагов. Каждая из этих групп состояний составляет один циклический класс. Поэтому циклическая цепь может определяться как эргодиче- ская марковская цепь, содержащая более чем один циклический класс, а регулируемая цепь — как эргодическая цепь, содержащая только один циклический класс состояний. Убедиться в регулярности цепи можно с помощью матрицы вероятностей переходов (марковской матрицы) эргодической цепи. Достаточным условием регулярности является следующее: п S Ru Ф 0. (2.20) Z = 1 Условие (2.20) означает, что хотя бы один элемент матрицы ве- роятностей переходов цепи, лежащий на главной диагонали, от- личен от нуля. Физически это означает, что система за одно испы- тание (за один шаг) может не сменить своего состояния и, следо- вательно, все состояния ее непериодические, т. е. множество Y всех состояний системы составляет только один циклический класс. Для регулярных марковских цепей имеет место следующая ос- новная теорема [8]. Теорема 2.1. Если R— регулярная переходная матрица, то: 1) степени Rm стремятся (при т->оо) к вероятностной мат- рице А; 2) каждая строка матрицы А представляет один и тот же ве- роятностный вектор a=[ai, аг, . . ., ал]; 3) все компоненты вектора а положительны (т. е. а/ >0, i = = 1, и); 4) при любом начальном распределении Р (0) = [pi (0), Рг(О), . . ., рп(0)] последовательность векторов P(0)Rm сходится к вектору а при т->оо; 5) вектор a— единственный вероятностный вектор, для кото- рого a>R = a. (2.21) Матрицу А принято называть предельной матрицей, а вектор a — финальным распределением (предельным вектором) марковской цепи, определяемой регулярной матрицей R. Физически компоненты вектора a=[ai, аг, . . ., ап] выражают ожидаемую (среднюю) долю времени, которую система проводит в соответствующих состояниях {хь х2, . . ., хп}, если процесс в ней протекает достаточно долго. Из теоремы 2.1 следует существование для регулярных эрго- дических цепей, не зависящих от начальных распределений, фи- нальных вероятностей состояний. Теорема 2.1 определяет также два конструктивных подхода к вычислению этих вероятностей. 25
Первый подход заключается в возведении матрицы /? — веро- ятностей переходов цепи в достаточно высокую степень и позво- ляет определять приближенные значения финальных вероятно- стей. Чтобы сократить необходимый для этого объем вычислений, можно воспользоваться приемом, предложенным в п. 2.1, т. е. каж- дую из стохастических матриц возводить в квадрат: R2=RR; R4 = rzrz> R* = R*R4- Процесс вычислений заканчивается, когда элементы столбцов ре- зультирующей стохастической матрицы с заданной точностью ста- нут равны друг другу. Любая из строк этой матрицы может быть взята в качестве приближения вектора финальных вероятностей. Пример 2.5. Батарея самоходной артиллерии в ходе боевых действий может находиться в одном из трех позиционных районов. Возможные переходы из района в район и их вероятности за каж- дый час боевых действий изображены на рис. 2.7. Требуется опре- делить финальные вероятности нахождения батареи в каждом из районов. Рис. 2.7 Решение. Процесс переходов батареи в различные районы представляет собой эргодическую регулярную цепь Маркова. По- этому финальные вероятности могут быть определены возведени- ем матрицы вероятностей переходов в достаточно высокую сте- пень. Имеем ' 0,40009 0,20010 0,39981 ' R8 — 0,40010 0,19998 0,39992 0,39998 0,20001 0,40001 Элементы столбцов матрицы вероятностей переходов за во- семь шагов Rs с точностью 3- 10~2 % равны друг другу. Поэтому любая строка этой матрицы может быть принята в качестве при- ближения (с точностью 3-10~2 %) вектора финальных вероятно- стей состояний батареи. 26
Второй конструктивный подход к вычислению финальных ве- роятностей регулярной эргодической цепи заключается в решении относительно а матричного уравнения (2.21) при дополнительном условии п S а(. = 1 (2.22) i = l и позволяет вычислить точные значения финальных вероятно- стей состояний цепи. При этом для определения п неизвест- ных компонент вектора а=[аь аг, . . ап] имеется и+1 урав- нение. Однако вследствие условия связи (2.22) система алгебраи- ческих уравнений, определяемая матричным уравнением (2.21), оказывается линейно-зависимой. Поэтому (2.21), (2.22) содержат только п линейно-независимых уравнений относительно п неиз- вестных а/, f=l, п. Пример 2.6. В условиях примера 2.5 определить финальные ве- роятности на основе соотношений (2.21), (2.22). Решение. Система алгебраических уравнений, определяемая матричным уравнением (2.21) и условием (2.22), в данном слу- чае имеет вид а 1 + а2 + аз = 1; 0,5 ai + 0,5 аг + 0,25аз= ах; 0,25ai+ 0,25аз= а2; 0,25а 1 + 0,5 аг+ 0,5 аз=»з- Единственное решение этой системы есть ai = 0,4; а2 = 0,2; аз = 0,4, т. е. вектор а=[0,4; 0,2; 0,4] определяет финальное распределение для рассматриваемой цепи. Достаточным условием цикличности эргодической цепи Марко- ва является представимость ее матрицы вероятностей переходов в виде 0 В' С 0 (2.23) где 0 — квадратные нулевые подматрицы. В этом случае эргодическая цепь содержит по крайней мере два циклических класса состояний. Первый класс составляют со- стояния, соответствующие матрице В, второй — состояния, соответ- ствующие матрице С. Все четные степени матрицы R в этом слу- чае дадут матрицу вида а все нечетные степени — матрицу вида (2.23). Система будет по очереди переходить от состояний, соответствующих В, к состоя- 27
ниям, соответствующим С, и обратно. Значит, последовательность jRn (Af->oo) не может сходиться к предельной матрице Л, т. е. п. 1 теоремы 2.1 не выполняется. В этом и состоит основное раз- личие между циклическими и регулярными цепями. Вместе с тем для циклических цепей, так же как и для регулярных, существует единственный вероятностный вектор, удовлетворяющий (2.21), (2.22) и определяющий финальное распределение цепи. Как и в случае поглощающих цепей, для эргодических цепей важную роль играет фундаментальная матрица. Определение. Матрица Z=[I — (./?-Л)]-’ (2.24) называется фундаментальной матрицей эргодической цепи, опре- деляемой марковской матрицей R. Здесь / — единичная матрица; А — квадратная матрица, все строки которой представляют вектор а. Фундаментальная матрица (2.24) является тем основным сред- ством, с помощью которого вычисляется большинство интересных характеристик, описывающих поведение системы, формализуемой в виде эргодической марковской цепи. Обозначим: fk—функция, равная числу шагов, за которые цепь впер- вые попадет из начального состояния в состояние xk\ Mi [/J — математическое ожидание fk при условии, что процесс начался из состояния лу, М — матрица средних времен первого достижения состоя- ний Цепи, т. е. матрица с элементами тц = Mi [/J. Тогда для М имеет место соотношение M=(I — Z+EZdg)D, (2.25) где Е— матрица, все элементы которой равны 1, а размерность совпадает с размерностью матрицы Z; Zdg—матрица, получаемая из Z заменой всех элементов, не лежащих на главной диагонали нулями; D — диагональная матрица с диагональными элементами du 1, л; —f-тый компонент вектора финально- го распределения. Обозначим через М2= { Dt f/J} матрицу дисперсий времен первого достижения. Тогда имеет место равенство [8] М, = М (2ZdgD _/) + 2(ZM-E (ZM)dg) - Msq, (2.26) где Msq—матрица, получаемая из М возведением в квадрат ее членов; ZMdg матрица, получаемая из (ZA1) заменой всех эле- ментов, не лежащих на главной диагонали нулями. 28
Пример 2.7. В условиях примера 2.5 построить матрицу сред- них времен достижения (М) и матрицу дисперсий времен первого достижения (Л/г) состояний цепи. Решение: а) фундаментальная матрица цепи имеет вид Z=[l- (7?-Л))-' = б) матрица средних времен достижения состояний цепи опре- деляется соотношением (2.21): M=(I-Z+EZdg)D = О’] Г 1,147 0,040 —0,187’ 0 - 0,080 0,840 0,080 1J 1_0,187 0,040 1,147. ’1 1 + 1 1 _1 1 11Г1.147 0 1 0 0,840 1 JLo 0 0 0 ’ 5 0 0 2,5 _ "2,5 4 3,3' 2,7 5 2,7 .3,3 4 2,5. в) матрица дисперсий средних времен достижения состояний цепи определяется соотношением (2.22). Вычислим матрицу ZM, имеем 1,147 0,040 —0,187’ ’2,5 4 3,3’ глг= 0,080 0,840 0,080 2,7 5 2,7 _—0,187 0,040 1,147- .3,3 4 2,5. '2,347 4,040 3,466’ 2,707 4,840 2,707 -3,466 4,040 2,347 _ ' 6,25 16 10,89' Msq= 7,29 25 7,29 110,89 16 6,25_ 29
Подставив эти значения в формулу (2.2), получим '2,5 4 1_3,3 4 3,3' 2,7 2,5. О 0,840 0 о о - 5 О О 2,5- ЛТ2 = 2,7 5 О 1 О 0]\ /Г 2,347 4,040 3,466' О I + 21 2,707 4,840 2,707 11/ \|_3,466 4,040 2,347. L1 1JLO О Г [2,347 О 1 0 4,840 ' 6,25 7,29 .10,89 10,89' 7,29 6,25- 1 1 1 1 1 '5,58 12 6,89' 6,22 12 6,22 .6,89 12 5,58, 2.5. Цепи общего вида В данном пункте мы рассмотрим вопрос исследования боевых процессов, формализуемых в виде дискретных марковских цепей общего вида. Чтобы распространить методы исследования предельных харак- теристик для поглощающих и эргодических цепей на цепи общего вида, достаточно, как показано в п. 2.2, распространить эти мето- ды на неразложимые цепи. Неразложимая цепь общего вида содержит некоторое множе- ство S| невозвратных состояний и одно или несколько эргодиче- ских множеств Sj, j — 2, 3, 4, . . ., k. Для определенности положим, что необходимо исследовать не- разложимую марковскую цепь общего вида с пространством со- стояний У={хь х2, • • ., хп} и матрицей вероятностей переходов Я = 11 Я//II. i./ = Г~п. Пусть данная цепь содержит k — 1 эргодических множеств О2 = { , Ха — ( Ха+1, . . • , хь . . ., = • • • > 1 } и множество невозвратных состояний | хп Хг+1, ..., хп }. (2.27) Начальное распределение вероятностей состояний для этой цепи задается вектором m = iPi(0),p2(0),..Рпт 30
Примером такой цепи может служить цепь, граф состояний и мат- рица вероятностей переходов которой изображены на рис. 2.8. Цепь на рис. 2.8 содержит множество Si={x6, х7| невозврат- ных состояний и два эргодических множества S2 = { Хг }, S3 = { х2, ..., х5}. Другим примером является цепь рис. 2.2. Эта цепь содержит множество Si={%4} невозвратных состояний и одно эргодическое множество S2= {хь х2, х3}. 1 О О О О 0,5 0 0 0 0 0 0 0,5 О та та та та та о о о о о 0 0 10 0 0,25 0,25 0 0 0 0 0 10 0 0,5 0 0,5 0 0 0,5 0 0 0,25 0,25 0 0 0 0,5 О Рис. 2.8 Исследование боевых процессов, формализуемых в виде нераз- ложимых цепей общего вида, включает их исследование до попа- дания представляющей точки цепи в одно из эргодических мно- жеств и их исследование после достижения какого-либо эргодиче- ского множества. Основными задачами исследования поведения цепи до момента выхода представляющей точки в одно из эргодических множеств является решение следующих вопросов: 1. Какова вероятность попасть в данное эргодическое множе- ство Sy (/=2, k), если процесс начался из некоторого невозврат- ного состояния Xi £ Si? 2. Каковы математическое ожидание и дисперсия числа ша- гов, после которых представляющая точка покидает множество Si невозвратных состояний, если процесс начался из некоторого со- стояния xt С Si? 3. Каковы математическое ожидание и дисперсия времени, про- водимых процессом в некотором невозвратном состоянии х7- G Sx до момента достижения представляющей точкой одного из эргоди- 31
ческих множеств (при условий, что процесс начался из состояния Si)? 4. Каково математическое ожидание числа невозвратных со- стояний, в которых побывает представляющая точка процесса, на- чавшегося из состояния до момента перехода в одно из эргодических множеств? Для решения этих вопросов структура эргодических множеств исследуемой цепи несущественна. Поэтому все эргодические мно- жества могут быть заменены поглощающими состояниями и тем самым цепь общего вида сводится к эквивалентной поглощающей цепи, которая содержит всю необходимую информацию для полу- чения ответов на сформулированные вопросы. Пространство состояний эквивалентной поглощающей цепи имеет вид , Sft, xr, ХГ4-1, ...» xn | = = {У1, .... y*_i, yk, ..., y*+i...Ул+л-г}. (2.28) Матрица вероятностей переходов для этой цепи принимает вид (Ух) (Уг) • • • (У*-1) (Уй) • • • (Уй+л-г) — (^й) (Уй—1) (*,) (Ул) (хл) (Уй+л-г) ($,) (У1) №) (у») 1 0 . .. 0 0 .. ... 0 0 1 . .. 0 0 .. ... 0 0 0 . .. 1 0 .. ... 0 S Rrl- .. S Rri Rrr • • Rm ^es2 *iesk • Rm • • • S Rm Rnr • • • Rnn € ^2 xiesk (2.29) Начальное распределение вероятностей состояний для эквива- лентной поглощающей цепи задается вектором Рэ(О) = Г S А(0), .... S А(0), р2(0), ..., рп(0) Kes. xiesk (2.30) Для цепи рис. 2.8 эквивалентная поглощающая цепь изобра- жена на рис. 2.9. К исследованию полученной таким образом экви- валентной поглощающей цепи применимы все результаты, приве- денные в п. 2.3. 32
Важным вопросом, связанным с использованием боевых про- цессов, формализуемых в виде дискретных цепей общего вида, является определение финальных вероятностей. Для конечных марковских цепей имеет место следующая тео- рема [8]. рУО ш 1 о О 1 О 0,5 0,5 0 (Уз) (У4)’ 0 0 0 0 0,25 0,25 0,5 0 Рис. 2.9 Теорема 2.2, В любой конечной цепи Маркова независимо от того, из какого состояния начался процесс, вероятность после т шагов оказаться в одном из эргодических состояний стремится к 1 при оо. Из теоремы 2.2 непосредственно следует, что финальные вероят- ности для всех невозвратных состояний цепи равны нулю. Поэтому определение финальных вероятностей сводится к определению ве- роятностей достижения каждого из эргодических множеств и последующему исследованию поведения цепи после вы- хода представляющей точки из множества Si невозвратных состояний. Покинув множество невозвратных состояний, представ- ляющая точка попадает в одно из эргодических множеств и уже не может из него выйти. Поэтому исследование поведения цепи после достижения представляющей точкой каждого из эргодиче- ских множеств может осуществляться независимо от остальных состояний цепи, не принадлежащих данному множеству. Из теоремы 2.2 и соотношения (2.15) следует, что матрица ус- ловных финальных вероятностей поглощающей цепи Маркова имеет вид k— 1 п — г I \ о В : О \k- 1 \tl — Г (2.31) где / — единичная матрица размерности (k—1)х (*-1); О — нулевые матрицы; В — матрица, определяемая соотношением (2.15) для эквива- лентной поглощающей цепи. 3 Зак. 559 33
Элементы матрицы С представляют собой финальные веро- ятности нахождения цепи в состоянии г/у, если процесс начался из состояния у/. Безусловные финальные вероятности поглощающей цепи, экви- валентной рассматриваемой марковской цепи общего вида, опре- деляются соотношением Z) = {dz} = P9(0)C, i=l, k + n — r—i. Первые k — 1 из элементов матрицы строки D определяют вероят- ности достижения представляющей точкой процесса соответствую- щих эргодических множеств S;-, / = 2, k, а остальные элементы рав- ны нулю. Условные финальные распределения вероятностей состояний для каждого отдельного эргодического множества Sy, / = 2, k рас- сматриваемой цепи определяются соотношением (2.21). Обозна- чим их соответственно а</)(/ = 2, k). Тогда безусловные финальные вероятности а(7) для каждого из эргодических множеств находятся из соотношения а</) = a</Wy_p J = 2?!. (2.32) Так как финальные вероятности для невозвратных состояний рав- ны нулю, то безусловные финальные вероятности (2.32) для эрго- дических множеств цепи полностью определяют финальные веро- ятности состояний рассматриваемой дискретной марковской цепи. Таким образом, методы исследования предельных характери- стик для поглощающих и эргодических цепей, изложенные в п. 2.3, 2.4, могут быть применены для исследования дискретных марков- ских цепей общего вида. Пример 2.8. Завершить решение примера 2.3 при р = 0,5. Решение. Математическое ожидание числа самолетов в эскадрилье при /->оо 4 м = S н>к, где k — количество самолетов в эскадрилье; Pk—финальная вероятность того, что в эскадрилье имеется ровно k самолетов. Из графа состояний системы (рис. 2.2) следует, что состояние х4, соответствующее наличию в эскадрилье ровно четырех самоле- тов, является несущественным. Поэтому в соответствии с теоремой (2.2) р4 = 0. Состояния xh х2, х3 образуют единственное для данной системы эргодическое множество. Следовательно, представляющая точка системы при /->оос вероятностью 1 попадает в это множе- ство. 34
Финальные вероятности р\, р2, рз состояний хь х2, х3 удовлет- воряют системе алгебраических уравнений (2.21), (2.22), которая в данном случае принимает вид Р1+Рг+Рз = 1; р2=Р1+рз-3(р2<7); Рз=Рг+Рз(Зр<72 + <73); Р1=Р3РЗ- Решение этой системы имеет вид рз рЗ 2p2q __ 1 ~ 1 -Ь 3p»q + 2рз 1 Рз 1 + 3p2q + 2рЗ 1 Рз — ] + 3p2q _|_ 2рз • Подставив значения финальных вероятностей в выражение для М, получим искомое математическое ожидание числа самолетов в эскадрилье: —______21_______2____р3 + ^p2q 4- 3______1_______Ь 4 • О- т 1 + 3p3q + 2рз z 1 + 3p3q 4- 2д< ° 1 + 3p2q + 2рз т * и’ при р=0,5, q= \ — р = 1 — 0,5 = 0,5 получим М = 1,62. 3*
III. ПРИМЕНЕНИЕ НЕПРЕРЫВНЫХ ЦЕПЕЙ МАРКОВА К МОДЕЛИРОВАНИЮ БОЕВЫХ ДЕЙСТВИЙ 3.1. Структура и основные характеристики непрерывных цепей Так же как и в случае дискретных цепей, при применении тео- рии непрерывных цепей к моделированию боевых действий моде- лируемый боевой процесс рассматривается как некоторая система, которая в каждый момент времени t £ [О, Т] может находиться в одном и только в одном из п возможных состояний, принадлежа- щих некоторому дискретному (счетному или конечному) множе- ству У= | хь х2, . . ., хп}. Однако, в отличие от дискретных цепей, переходы из состояния в состояние осуществляются скачком в лю- бые заранее неизвестные моменты времени. При этом вероятность нахождения системы в любом состоянии Xi Q Y в момент времени r>Z зависит только от состояния, в котором находилась система в момент /, и не зависит от того, каким образом система перешла в это состояние и сколько времени уже находилась в нем, т. е. вы- полняется соотношение (1.2). На практике ситуации, когда переходы системы из состояния в состояние осуществляются не в фиксированные, а в случайные мо- менты времени, встречаются очень часто. Например, такая ситуа- ция возникает при контрбатарейной борьбе. Если под состоянием системы понимается количество непораженных орудий каждой из противоборствующих сторон, то переходы системы в различные состояния осуществляются в случайные моменты времени, так как нельзя заранее предсказать момент поражения того или иного ору- дия. Аналогичная ситуация возникает при моделировании боя про- тивотанковых средств с танками, при моделировании процессов подавления огневых средств противника и в ряде других случаев. При моделировании боевых процессов в виде непрерывных це- пей Маркова можно выделить два формальных аспекта проблемы: с одной стороны, множество состояний системы и возможных пере- ходов между ними образует случайную цепь, которую, как и в случае дискретных цепей, удобно представлять в виде ориентиро- 36
ванного графа, и с другой стороны, те значения t £ [О, Г], в кото- рых происходят какие-либо изменения состояний системы, обра- зуют так называемый точечный случайный процесс (в теории мас- сового обслуживания этот процесс обычно называют потоком одно- родных событий). Процесс функционирования системы в данном случае можно рассматривать как случайное блуждание представляющей точки по графу состояний, которое возникает вследствие воздействия на систему случайных потоков событий. Поток событий представляет собой последовательность одно- родных событий, следующих одно за другим в случайные моменты времени (например, поток сообщений об объектах противника, по- ступающих от разведывательных органов, поток выстрелов огне- вых средств, поток отказов технических систем и т. п.). Потоки событий являются важнейшей характеристикой систе- мы. Их характер определяет характер случайных процессов, проте- кающих в системе. Поток событий называется пуассоновским, если число событий, попадающих на любой участок (^0, /о+ДО € [О, Т], распределено по закону Пуассона, т. е. ak p(k)=^-e~“, £ = 0,1,2,..., (3.1) где p(k)—вероятность попадания ровно k событий на участок (^0, + ДО \ а — среднее число событий, приходящихся на участок (^0> /о +ДО , a — f (3.2) К А,(0 —интенсивность потока событий (среднее число событий в единицу времени). Основными свойствами пуассоновского потока являются орди- нарность и отсутствие последействия. Ординарность потока означает практическую невозможность появления более одного события на достаточно малом отрезке вре- мени (4, tQ+St), Отсутствие последействия означает, что события появляются в потоке независимо друг от друга, т. е. вероятность появления определенного числа событий на некотором промежутке времени (/0, ^о+ДО не зависит от того, сколько событий произошло рань- ше (т. е. не зависит от предыстории изучаемого потока). Очень часто при моделировании боевых процессов рассматри- ваются пуассоновские потоки событий, у которых Х(/)=% — const. Это свойство потока называется стационарностью. Для стационар- ного пуассоновского потока выражение (3.2) примет вид (3.3) 37
Пуассоновский поток, обладающий свойством стационарности, называют простейшим. Название «простейший» обусловлено тем, что математическое описание событий, связанных с этим потоком, оказывается наиболее простым. Непрерывные цепи Маркова тесно связаны с пуассоновскими потоками событий. Для этих цепей имеет место следующая тео- рема. Теорема 3.1. Для того чтобы процесс в системе с дискретным множеством состояний был марковским, необходимо (в случае ординарных потоков и достаточно), чтобы все потоки, пере- водящие систему из состояния в состояние, были пуассонов- скими. Следует отметить, что пуассоновские и близкие к ним по струк- туре потоки событий встречаются на практике наиболее часто. Как показали А. Я. Хинчин и А. Реньи, пуассоновские потоки являются предельными как в случае суммирования, так и в случае случай- ного разрежения потоков. Эти результаты являются важными пре- дельными теоремами и объясняют причину того, что пуассоновские потоки столь часто встречаются в реальных системах. Например, одно из первых упоминаний пуассоновского процесса относится к исследованиям Фрая (9], который показал, что пуассоновский про- цесс хорошо описывает число солдат в армии, убитых копытами своих коней. Тот факт, что при моделировании боевых процессов, как пра- вило, имеет место суммирование потоков (например, при ведении беглого огня артиллерийской батареей суммируются потоки выст- релов, производимых каждым орудием) и их случайное разреже- ние (например, не каждый из выстрелов достигает цели, и тем са- мым поток успешных выстрелов батареи оказывается разрежен- ным по отношению к их общему потоку), позволяет предполо- жить, что пуассоновские потоки достаточно точно аппроксимируют реальные потоки в боевых процессах и, как следует из теоремы 3.1, описание различных боевых процессов непрерывными цепями Мар- кова является достаточно точным. По крайней мере, такое описа- ние соответствует точности исходной информации. Основная задача исследования непрерывных цепей Маркова со- стоит в определении вероятностей р£ (^)==Р[Х(^)=л£] состояний системы для любого момента времени t или в определении услов- ных вероятностей г, /=1, п того, что случайная функция X(t) в момент т>Нравна х^У, если в момент t она была равна £ К, т. е. Я/(А'') = Р[Х(т) = х/И(^) =Лг], z,/=i7T (3.4) Функция Rijt i, /=1, п называется вероятностью перехода из состояния х{ в состояние xf. Непосредственно из определения сле- дует, что при r=i 38
D ц. x f0 ПРИ Rti (Л T) = i 1 (/' ’ (1 при I = J. (3.5) Для непрерывных марковских цепей при любых t и т выполня- ются равенства п = (3.6) S Rtj(t, t)=i, /=17т: (3.7) Я Физически равенство (3.6) означает, что в каждый момент вре- мени t система может находиться в одном и только одном из воз- можных состояний. Равенство (3.7) означает, что на любом отрезке времени [/, т] С [О, Т] система с вероятностью 1 либо изменяет свое состоя- ние, либо остается в прежнем состоянии. Следует отметить, что условие (3.7) может нарушаться, если случайный процесс X(t) за ограниченное время может принять бесконечное число возможных значений, т. е. возможен своего рода взрыв, что имеет место, например, при цепной реакции. В этом случае [10] п т)<1. 7 = 1 Цепи такого типа называются нерегулярными. Однако нерегу- лярные цепи практически не встречаются при моделировании бое- вых процессов, и поэтому в данном пособии мы их рассматривать не будем. Определим связь между вероятностями переходов R^ (/, т) при различных значениях аргументов. Для этого воспользуемся фор- мулой полной вероятности п Р (А) — £ Pt(Hk) Р (A/Hk). (3.8) Л-1 Пусть событие А в (3.8) означает, что в момент времени т слу- чайный процесс Х(/)=ху, если в момент t выполнялось равенство X(/)=xz. Тогда P(A)=R4(t, т). Пусть гипотеза Hk заключается в том, что в момент времени Г(/<Г<т) случайный процесс X(t) принимает значение хк, если X(t)=Xi. Тогда P(Hk) = Rlk (Л Г), a P{AIHk) = Rki(t'y т). 39
Подставив эти значения в (3.8), получим равенство п ____ Ri, (t, '')= О х)> t <*'<*, i, J= 1, «• (3.9) k =» 1 Соотношение (3.9) называется уравнением Колмогорова—Чепме- на—Смолуховского и является аналогом уравнения (2.6). Если известны вероятности pi (/0), /=1, п того, что в начальный момент времени t = t0 система находится в состояниях xh i=l, и, то для безусловных (абсолютных) вероятностей (t) =P[X(t) = — Xj] в соответствии с (3.8) получается соотношение п Pi (О = S Pi(t0) Rij (t0, t), J=\,n. (3.10) i==1 Непрерывная марковская цепь называется однородной, если ве- роятности переходов (/, т) зависят от t и т как от разности, т. е. если Rtj т) ==: Rij (т — т > t, /, 7=1, п. В этом случае условные вероятности (/, т) зависят только от одного аргумента и поэтому вместо R^ (/, т) при t можно пи- сать Rij (t) при t 0. Уравнение Колмогорова—Чепмена—Смо- луховского (3.9) для однородного процесса принимает вид п Rii^ = liRik{t)Rki^-t), i,j=TJT. (3.11) ft = 1 Выражение (3.10) в этом случае можно записать в виде PiW) = i> pi(Q)Rii(t), J=T7n. (3.12) Для однородности непрерывной марковской цепи необходимо и достаточно, чтобы все потоки событий, переводящие систему из со- стояния в состояние, были простейшими. Таким образом, мы рассмотрели структуру и основные харак- теристики непрерывных цепей Маркова. Далее подробно остано- вимся на вопросе вычисления основных характеристик этих про- цессов. 3.2. Дифференциальные уравнения Колмогорова Вероятности pz(0, *=1, п состояний системы в любой момент времени t и условные вероятности Rij(t, т) перехода для непре- рывных цепей Маркова обычно вычисляются как решения соот- ветствующих систем обыкновенных дифференциальных уравне- ний, которые впервые были получены академиком А. Н. Колмого- ровым в 1938 г. в его фундаментальной работе [11], заложившей 40
основы теории непрерывных цепей, и поэтому называются его име- нем. Рассмотрим непрерывную марковскую цепь, описывающую по- ведение системы с п состояниями £ Y. Будем полагать, что по- токи событий в системе ординарны, т. е. за достаточно малое вре- мя Д/“->0 не может быть более одной смены состояний. Тогда Ru(t, t+\t) является вероятностью того, что в промежутке вре- мени [/, t 4- А/] система не изменит состояния в котором она находилась в момент /, а разность 1 —t+&t) в соответст- вии с (3.7) означает вероятность того, что на этом промежутке произойдет смена состояния xt. Так как в соответствии с (3.5) Ru(t, 0 = h а t) = 0, i^j, то 1 - Rit (t, t + M) = Ra (Л t) - Ru t + Д0, i = Г7; R4 (t, t + Д0 = Ru (Л t + Д0 - R4 (t, i± J, iy j = 17T. Положим, что существуют конечные пределы X (0 = Um = * + = 1 Д/->0 М =-dRu£т) L-r <злз> —*—=----------------a----------- dRu(tt т) I ---- = |T„,, (3.14) Функция X/ (0 является временной плотностью вероятности того, что в момент t система не изменит свое состояние xh а функ- ция (0, i =£j является временной плотностью вероятности пере- хода системы в момент времени t из состояния xt в состояние х;-. Из (3.13), (3.14) с учетом (3.7) следует, что \(0=S\/(0, i = \77i. (3.15) J-l Чтобы получить систему дифференциальных уравнений относи- тельно вероятностей перехода цепи Ri} (t0, /), i, /=1, и, восполь- зуемся уравнением Колмогорова—Чепмена—Смолуховского (3.9). Заменив в этом соотношении t на t0, t' на t и т на получим п ___ Rtj (t0, t + ДО = S Rlk (t0, t) Rkj (t, t + Д0, i, J = 17^. ^’1 41
Полагая Д/ = 0, получим п ____ Rtl(t0, t) = S Rik(0. t)Rk)(t, t), i. j=i, n, fc— 1 откуда ^(/0> f + t) Vd // \Rkj^t + ^ AZ ~~ ^ik [ Ы k~ 1 k*j — Rij(to, t) --------—t--------- . «,/=!,« Переходя в этом равенстве к пределу при Д/-»-0 с учетом (3.13), (3.14), получим п п = - J] \h (t) R4 (t0, t) + £ \k]Rlk (t0, t), i, j= 15Г Л-l Jfe-1 k*j k-/j (3.16) Система (3.16) называется прямой системой дифференциальных уравнений Колмогорова для вероятностей перехода. При фиксированном значении первого индекса i у функций Rii (io, i), t=l, п система (3.16) образует систему п обыкновенных дифференциальных уравнений относительно п искомых функций Rij (to, t), j=l, n. Начальные значения искомых функций опреде- ляются равенствами (3.5). Составим теперь систему дифференциальных уравнений для аб- солютных вероятностей p/(t) состояний системы. Для этого вос- пользуемся соотношением (3.10). Заменив в (3.10) to на t, a t на t+^t, получим Рj (t + АО = S Pi (t) Rij (t, t + Л0. /= Полагая Д^ = 0, получим n Pi(t)= S Pi^Ri^t, o, j=TTn. i = 1 Тогда Pj(t^M)-Pj{t) уч t + bty-Rijit, t) . --- ---------------= 2j Pi (t)--------дт---------, ! = \,n. /-1 42
Переходя в этом выражении к пределу при Д^->-0 с учетом (3.13), (3.14), получим п d-^T = S Р‘ & \ MPj / = 1 l + j откуда с учетом (3.15) имеем п п d^= /=ТП7 (3.17) Z-l Z-1 I * j i * J Система (3.17) называется прямой системой обыкновенных диф- ференциальных уравнений Колмогорова для абсолютных вероят- ностей состояний. Эта система совместно с начальными условиями /?у(/0), /=1, п и нормирующим условием (3.6) позволяет опреде- лить абсолютные вероятности /=1, и состояний системы Ху £ Y в любой момент времени t до- запись прямых систем дифференциальных уравнений Колмого- рова для вероятностей перехода и вероятностей состояний соответ- ственно в форме (3.16) и (3.17) позволяет сформулировать прак- тически удобные правила построения этих уравнений по размечен- ному графу состояний. Размеченный граф состояний для непрерывной цепи Маркова представляет собой ориентированный граф, вершины которого со- ответствуют состояниям системы, а дуги — возможным переходам из состояния в состояние, при этом «вес» каждой дуги (/, /) равен соответствующей временной плотности вероятности (t) перехо- да из состояния Xi g Y в состояние Ху £ У, z #= /. Сформулируем правила построения прямых систем дифференциальных уравнений Колмогорова по размеченному графу состояний непрерывной цепи Маркова. Правило 3.1.Производная по времени от вероятности Rtj (Jo* /=1, n пребывания системы в момент времени t в со- стоянии Xj£ Y при условии, что в момент времени to эта система находилась в состоянии xz £ У, равна алгебраической сумме произ- ведений временных плотностей вероятности переходов на соответ- ствующие вероятности пребывания системы в тех состояниях (вер- шинах графа), откуда совершается непосредственный переход в другие состояния. Слагаемые, которым соответствуют выходящие из /-той вершины дуги графа, берутся со знаком минус, а слагае- мые, которым соответствуют входящие из других вершин в верши- ну / дуги, берутся со знаком плюс. Общее число слагаемых в пер- вой части уравнения для t) равно общему числу входящих и выходящих дуг для /-той вершины размеченного графа состоя- ний системы, 43
Правило 3,2, Производная по времени от абсолютной вероят- ности /=1, и пребывания системы в состоянии Х] в момент времени t равна алгебраической сумме числа членов, равного ко- личеству дуг, связанных с /-той вершиной размеченного графа со- стояний цепи. Каждый из этих членов равен произведению времен- ной плотности вероятности перехода, соответствующей данной дуге, на абсолютную вероятность нахождения системы в момент времени t в состоянии, из которого рассматриваемая дуга исходит. Если дуга входит в /-тую вершину графа состояний цепи, то член берется со знаком плюс, а если дуга выходит из /-той вершины, то член берется со знаком минус. Правила 3.1 и 3.2 были впервые сформулированы Е. С. Вент- цель [6], [14]. Они являются общими для всех непрерывных цепей Маркова и позволяют чисто механически записывать прямые диф- ференциальные уравнения Колмогорова для вероятностей перехо- дов и абсолютных вероятностей состояний непосредственно по раз- меченному графу. Пример 3.1. Артиллерийский дивизион в ходе боевых действий может находиться в одном из сле- дующих состояний: Xi — находится на огневой по- зиции в готовности к от- крытию огня; х2 — ведет огонь; х3 — свертывается для переме- щения в новый позицион- ный район; х4 — перемещается в новый позиционный район; %5 — развертывается в новом позиционном районе. Записать систему дифференци- альных уравнений Колмогорова для абсолютных вероятностей со- стояний и начальные условия для решения этой системы, если из- вестно, что в начальный момент дивизион находится в состоянии %1, а возможные переходы из со- стояния в состояние и их временные плотности заданы размечен- ным графом рис. 3.1. Решение. Система уравнений Колмогорова для абсолютных вероятностей состояний в соответствии с правилом 3.2 имеет вид ———^i2Pi + А.21Р2 + Х51Р5— ==^12^1 — (^21 + ^23) р2'9 44
= ^13P1 + ^23^2----^34Рз‘, —кмрз------А/45Р4; =^45Р4 — ^51Р1- Начальные условия при /—О Pi = l; р2=Рз=Р4=Р5 = 0. Пример 3.2. Через зону обстрела зенитного комплекса прохо- дит группа из двух самолетов. Зенитный комплекс тратит на об- стрел одного самолета в среднем Т=60 с и при этом наносит ему поражение с вероятностью q = 0,5. Требуется определить математическое ожидание числа само- летов, преодолевших эту зону, если они входят в зону обстрела одновременно и находятся в ней 3 мин. Решение. Под состоянием системы будем понимать количе- ство самолетов, успешно преодолевших зону обстрела зенитного комплекса. Тогда граф состоя- ний системы имеет вид, как на рис. 3.2. Xi — два самолета преодо- лели зону обстрела; х2 — зону обстрела преодо- лел один самолет; х3 — все самолеты пораже- ны зенитным комплек- рис 32 сом. Математическое ожидание M(t) числа самолетов, успешно преодолевших зону обстрела, определяется формулой М(0=2Р1(0 + 1р2(/)+0.р3(0, где Pi(0, Рз(0 —вероятности нахождения системы в соот- ветствующих состояниях xh х2, х3 в момент времени t. Так как для зенитного комплекса известны только среднее вре- мя обстрела и вероятность поражения каждой цели, то можно предположить, что поток успешных выстрелов является пуассонов- ским с интенсивностью (1/мин) X =<? =-J-• 0,5 = 0,5. Вследствие того, что поток событий, вызывающий переходы систе- мы в различные состояния, является пуассоновским, протекающий в системе процесс является марковским. В соответствии с графом рис. 3.2 система дифференциальных уравнений Колмогорова для вероятностей состояний имеет вид 45
dPs _\п Так как в начальный момент оба самолета не поражены, то эту систему следует интегрировать с начальными условиями Pi(0) = l; р2(0) =р3(0) =0. С учетом нормирующего условия Pi(0 +p2(t) +рз(0 = 1 систему дифференциальных уравнений мож- но записать в виде dPi (0 ) п . dp& (0 1 /1 ~ п \ В результате интегрирования этой системы получим Pi (3) «0,125; р2(3)«0,25; р3(3) «0,625, откуда математическое ожидание числа самолетов, успешно прео- долевших зону обстрела зенитного комплекса, будет М (3) « 2 • 0,125 + 1 • 0,25 + 0 • 0,625 = 0,5. моделировании их пространст- мы рассмотрим моделей на ос- 3.3. Примеры моделей боевых процессов Рассмотрим два примера боевых процессов, формализуемых в виде непрерывных цепей Маркова. Пространственно-временная модель боя. При боевых действий часто возникает проблема учета венно-временной протяженности. В данном пункте один из возможных подходов к построению таких нове аппарата непрерывных марковских цепей. Имеем две противоборствующие стороны. В состав первой сто- роны входит п подгрупп средств, имеющих численности W2, . . Nn соответственно. В состав второй стороны входит т под- групп средств, имеющих численности Мь М2, . . ., М т соответст- венно. Средства, принадлежащие одной подгруппе, будем считать однородными. Предположим, что k первых подгрупп обеих сто- рон — средства ближнего боя, расположенные непосредственно в окрестности линии боевого соприкосновения. Остальные п — k и т — k подгрупп средств первой и второй сторон — поддерживаю- щие и обеспечивающие средства. Полосу, в которой действуют войска сторон, покроем сеткой (рис. 3.3) с k полос по ширине (по числу действующих в ней под- групп средств ближнего боя) и L (0<£ оо) рубежей по глуби- не. Расстояние между рубежами примем равным некоторой вели- чине d (d>0). 46
Очевидно, что процесс перемещения линии боевого соприкосно- вения неразрывно связан с перемещением средств ближнего боя, действующих в ее окрестности. Будем полагать, что каждая из k подгрупп средств ближнего боя сторон перемещается только в результате взаимодействия с противостоящей ей подгруппой средств и это перемещение не зави- сит от перемещения других подгрупп. Это допущение принято только с целью упрощения конечных соотношений и может быть снято введением соответствующих дополнительных условий связи. Рис. 3.4 Процесс перемещения каждого из k участков линии боевого соприкосновения будем рассматривать как ординарный марковский процесс блужданий представляющей точки в одномерном дискрет- ном пространстве состояний У={0, 1, 2, . . L\. Нахождению i-того участка (i=l, k) линии боевого соприкосновения в состоя- нии / в момент времени t соответствует равенство х(0 (/)=/, / = 0, 1, 2, . . ., L. Из ординарности процесса следует, что за достаточно малое время Д/ из любого состояния / £ Y практически возможен пере- ход только в соседнее состояние /+1 или /— 1, т. е. граф состоя- ний каждого из k участков имеет вид, как на рис. 3.4. 47
Обозначим через (f), /=1, k, j = 0t L временную плотность вероятности перехода /-того участка линии боевого соприкоснове- ния из состояния / в состояние /+1, а через /=1, k, /=0, L — временную плотность вероятности перехода из состояния / в со- стояние j—1. Тогда в соответствии с правилом 3.2 можно запи- сать следующую систему дифференциальных уравнений Колмого- рова для вероятностей pjz)(O, *=1, k, i = L нахождения /-того участка линии боевого соприкосновения в состоянии / в момент времени t: (t) + (t)p{l) (t); (t) 4- + r=l, L-l; = . (t)p^(t), i=T,T. Начальными условиями для системы (3.18) служат значения (/0), / = 0, L, /=1, k искомых функций в начальный момент вре- мени t = t$. Система уравнений (3.18) описывает процесс переме- щения линии боевого соприкосновения во времени. Чтобы вос- пользоваться моделью (3.18) для исследования конкретного боя, необходимо идентифицировать функции X/Z) (/) и p/Z)(/), *=1, / = 0, L, которые характеризуют среднюю скорость перемещения линии боевого соприкосновения в каждый момент времени: (/с) = J2-LL , z = l, k, J = 0, Ц (3.19) ,n ------------- И/ W = —V2- ’ / = 1, = О, L, (3.20) где Vjl) (i), —математические ожидания темпов наступ- ления первой и второй сторон соответственно. Величины i=l, k, j = 0, L зависят от ряда фак- торов, к которым в частности относятся: количество и качество средств ближнего боя сторон в окрест- ности каждого Z-того участка линий боевого соприкосновения; количество и качество поддерживающих средств; характер построения обороны; 48
инженерное обеспечение наступающих войск; боеспособность и морально-боевой дух войск сторон и т. д. Качество боевой техники вооружения может оцениваться эф- фективностью стрельбы и маневренными возможностями на поле боя. Эффективность стрельбы можно характеризовать дальностью и эффективной скорострельностью при поражении тех или иных целей в ходе боевых действий. Маневренные возможности определяются временем разверты- вания /раз, свертывания /св и скоростью перемещения 1/п. Характер оборудования обороны влияет на эффективность огневого воздей- ствия по обороняющимся войскам и затрудняет перемещение на- ступающих войск. С учетом инженерного оборудования (и есте- ственных препятствий) допустимая скорость передвижения войск может определяться по формуле ^доп== ^ин^п» где 0 /’Син Построение обороны можно характеризовать относительными потерями наступающих за единицу времени: dm (t) 1 dt т (t) ’ где m(t) —текущая численность или боевой потенциал наступаю- щей группировки. Боеспособность войск определяется потерями, понесенными войсками с начала боевых действий Дт('/). Морально-боевой дух войск можно характеризовать максималь- ным уровнем потерь <?, который могут понести наступающие войс- ка. При уровне потерь больше q войска переходят к обороне. Таким образом, величины 1Ао(0, WjZ) (0, *=U / = 0, L мож- но представить как некоторые функции следующих аргументов: IW) №1; <?}'>; Arf») ; V ’ (3.21) Am!?). \ C44 '*41 / Определив конкретные зависимости (3.21) и входящие в них па- раметры, мы тем самым замыкаем систему уравнений (3.18) для перемещения линии боевого соприкосновения в процессе боя. Модель динамики численностей боевых средств. Важнейшими процессами, которые присущи боевым действиям, являются про- цессы поражения боевых средств, органов управления войсками и оружием, органов разведки, органов боевого обеспечения и т. п., а также процессы восстановления боеспособности этих элементов. Ряд этих процессов может быть формализован в виде следую- щей модели. 4 Зак. 559 49
Имеем две противоборствующие группировки. Предположим, что в состав первой группировки входит N статистически однород- ных боевых средств, а в состав второй — М. На первый взгляд, допущение об однородности может показаться достаточно жест- ким. На самом деле это не так. При моделировании боевых дей- ствий практически всегда можно выделить группы боевых средств, которые ведут себя статистически одинаково. Это вовсе не озна- чает, что все боевые средства группы ведут себя в точности оди- наково, а лишь означает, что все они имеют одинаковый вероят- ностный закон поведения. Примерами таких статистически одно- родных групп могут служить артиллерийская батарея, танковая рота, эскадрилья самолетов и т. п. Пусть каждое боевое средство первой группировки производит случайный пуассоновский поток выстрелов с параметром Aj и при каждом выстреле с вероятностью Л1 поражает одну боевую едини- цу второй группировки. Вероятность поражения одним выстрелом более одного боевого средства будем полагать бесконечно малой O(.Tti). Тогда в соответствии с теоремой А. Реньи о разрежении потока поток успешных выстрелов каждого боевого средства пер- вой группировки будет пуассоновским с параметром %1=Л1Ль Аналогично каждое боевое средство второй группировки осуще- ствляет пуассоновский с параметром А,2 = Л2Л2 поток успешных вы- стрелов по боевым средствам первой группировки. Допущение о пуассоновском характере потоков успешных вы- стрелов каждого из боевых средств группировок также не являет- ся слишком жестким. Положим, что каждое пораженное боевое средство первой и второй группировок восстанавливает боеспособность с интенсив- ностью и ц2 соответственно. Состояние боя в каждый момент времени будем характеризовать двумя целыми положительными числами а, b — текущими численностями непораженных боевых средств группировок. Боевую мощь (средний поток успешных вы- стрелов) первой и второй группировок в целом запишем в виде wi=iXi<p(a, b); <O2=Atfip(a, ^), (3.22) где ф(а, 6), ф(а, Ь) — некоторые функции, показывающие, как пер- вая и вторая группировки проводят бой. Так, если <р(а, Ь) = =ф(а, &) = 1, то в каждый момент времени в бою участвует толь- ко по одному боевому средству группировок и бой представляет собой совокупность последовательных дуэлей. Если ф(а, Ь) = а, ф(а, b)=b, то в бою участвуют все непора- женные боевые средства группировок и их огонь распределен рав- номерно по всем непораженным боевым средствам противника. Это эквивалентно тому, что если какая-либо боевая единица одной из группировок поражена, то огонь противника мгновенно пере- носится на другую боевую единицу. 56
Если ф(а, = ф(а, 6) = 77»ТО в каждый момент времени в бою участвуют все наличные боевые средства сторон и их огонь равномерно распределен по всем (пораженным и непораженным) боевым средствам противника, т. е. отсутствует перенос огня. Описанный процесс боя можно представить как блуждание представляющей точки по графу состояний рис. 3.5, начинающееся из точки (N, М), Интенсивности переходов в сторону уменьшения численностей боеспособных боевых средств первой и второй груп- пировок определяются соотношениями (3.22), а интенсивности вос- становления боеспособности равны соответственно yi = Yi(W — а); У2=У2(М — Ь). (3.23) В соответствии с правилом 3.2 рассматриваемый процесс боя Рис. 3.5 можно описать следующей системой дифференциальных уравне- ний Колмогорова для абсолютных вероятностей состояний: 'ДДуД! = _ [0)1 (/V, М) + ф2 (N, М)]р (N, М, t) + + ъ(1)Р(Л/-1, м, + М-1, t)- . = - [«>, (N, b) + Ф, (М 6)] р (N, b, t) + (3.24) b + \)p(N, 6+1) + т2(М-й-1)Х Xp(N,b-\,t)-^{M-b)p(N,b, t) + t), д-1, УИ-1; 4* 51
d-P(a'™' = - [Oj (a, M) + Ш2 (a, M)]p(a, M, t) + + <i>2(a + 1, M)p (a + 1, M, £) + "h (N— a— \)p(a— 1, M, t) — — — a) p (a, M,t)+ 7JI)p(a, M—1, £),a= f7"/vZT; dp(a^, t) = _ [o)i (д> b) + (fl> &)] p (fl[) b, t} _ - lli (#-«) +l2 (M - 6)] p (a, b, t) + кj (TV-a - 1) X Xp(a-1, b, t)— b — Y)p(a, 6 — 1, 0 + + <i>1(a, b-\- V)p(a, b-\- 1, t) +<o2(a4- 1, b)p(a-\-1, b, t), (3.24) a = 1, N- 1, b = 1, Л4-1; ЧГ— = ~ bi W + Ъ (M - b)]p (0, b, t) + + ®2 (1, b)p(\, b, t) + y2(M-b-\)p(Q, 6-1, t), 6=1, M- 1; rfF - = - tb + b(^)]/>(^, 0, t) + 4-a>1(a, l)p(a, 1, t) + 7i (N— a — \}p (a — 1, 0, t), a= 1, ^-l. Начальные условия для интегрирования этой системы опреде- ляются выражением / I. л\ ( 1 ПРИ a = N, Ь = М; р(а, 6, 0)={ г (3.25) ( 0 в противном случае. Система (3.24) с начальными условиями (3.25) позволяет опре- делить вероятность любого состояния описанного процесса боя двух однородных группировок в произвольный момент времени I. 3.4. Интегралы уравнений Колмогорова для некоторых типов непрерывных цепей С формальной точки зрения модели боевых действий, описан- ные в п. 3.3, представляют собой так называемые многомерные марковские случайные процессы гибели и размножения. К про- цессам такого типа сводится большинство моделей боевых дейст- вий, формализуемых в виде непрерывных цепей Маркова. Поэто- му представляется целесообразным определить аналитические ин- тегралы уравнений Колмогорова для некоторых частных, но прак- тически важных типов процессов гибели и размножения, 52
Рассмотрим некоторую систему, состояние которой описывает* ся n-мерным вектором х=(хь х2, . . хп) £ 5 С Е, где Е—n-мерное дискретное фазовое пространство; S ={xz: (0<х{</?г < со), 1 = 1, п\, т. е. S — некоторая область пространства Е, такая, что 0<1хг < Rt, i= 1, п. Динамика системы заключается в изменении ее состояния с течением времени t и представляет собой неоднородный марков- ский случайный процесс с ординарными потоками событий. Собы- тие, заключающееся в том, что в момент времени t система нахо- дится в состоянии х=(хь х2.......х„), обозначим x(t), а вероят- ность этого события р(х, /)=р(хь . . ., х„, t). Обозначим также ja, (х, t) — [1/ (хь ..., xt —-1, ..., хп, t) — интенсивности переходов (хн ..., xz — 1, .... х„) -> (хь ..., xit ..., xn), i = 1, л; X/ (x, t) — \(хь x2, ..., Xi + 1, ..., x„, t)— интенсивности перехо- дов (X], ..Xi + 1, ..., xn) -> (xH .... xt, ..., x„), i = 1, «. Тогда систему дифференциальных уравнений Колмогорова (3.17) для абсолютных вероятностей состояний можно записать в виде dp{xbx2, ...,XJ...xn,t) = _р(Х11 , х t) х п X 2 h (X, t) A (Xi) (X, t) В (xz)] + 1 = 1 п + •••> Xi—1, ..., хп, t)?.i(x, t)A(Xi) + i^l п + 2 р (хь . . ., Xi + 1, . . ., Х„, t) \(х, t)B(Xi), i — 1 Xj = 0, 1, ..., Rj, j = T7«7 (3.26) где ( 1 при Xi > 0; ----- A (xt) = { Л , n i — 1, п\ ' " (0 при Х( < 0, [ 1 при Xt < Re, ------- B(xi) = \ n ' n i = \, n. v (0 при Xi > Rt, Начальные условия для интегрирования системы (3.26) имеют вид 11 при xz = xzo, Z = l, «; р(х, 0)—p(xlt ..., х(, ..., хп, 0) = С |0 в противном случае. (3.27) 53
Интегрирование системы (3.26) с начальными условиями (3.27) при достаточно большом количестве различных состояний системы представляет большие трудности вследствие ее высокой размерности. В ряде случаев эти трудности могут быть преодоле- ны путем перехода от системы обыкновенных дифференциальных уравнений для вероятностей отдельных состояний к уравнению в частных производных для производящей функции вероятностей этих состояний. Производящая функция вероятностей состояний процесса (3.26) имеет вид [15] Rn п z2....*„) = ?(*, z) = 2 П X Хр(хь ............хп, t). (3.28) Умножив обе части уравнения (3.26) на соответствующие п ["] z*j и просуммировав полученные таким образом равенства, /-о имеем n Rx Rn п. 2 S ••• S Н*’ X [271В (Xi) - А (х,)] + Р (*, t) (х, t) П Zji х 7=1 X[zM(Xz)-B(X/)]J. (3.29) Подставляя конкретные функции X/(х, /), рДх, I) в уравнение (3.29), его в ряде случаев можно свести к замкнутому виду. Положим \(х, t) = \(t)Xi, v-i(x, t)=v.i(t)Xi\ B(xz)sl, где X/ (/), |Л/ (t) —некоторые функции времени (далее для сокра- щения записи параметр t будем опускать). В этом случае уравне- ние (3.30) принимает вид п = £ (zz -1) (м - М . (3.30) /=1 Это линейное дифференциальное уравнение с частными производ- ными первого порядка. 54
Начальным условием для (3.30) является значение искомой производящей функции <р(/, z) при t=0. С учетом (3.27) имеем п ? (О, Z) = п zp°- (3-31) /-1 Задача Коши для (3.30) с начальным условием (3.31) форму- лируется следующим образом. Требуется определить такое ре- шение <р(/, z) уравнения (3.30), которое при t = 0 удовлетворяет условию (3.31). Из теории дифференциальных уравнений в част- ных производных известно, что для решения этой задачи необхо- димо определить интегралы так называемых уравнений характе- ристик [16], которые для (3.30) имеют вид ’ - (г - 1) (|*z z, - X,.), i =17п-, Уравнения (3.32) проинтегрируем при следующих начальных условиях: z(/0) =т] = (пь П2, • • ^л); <р(*о, п) =фо; ^о=о. (з.зз) Решение последнего уравнения системы (3.32) имеет вид <р(/, z)=<po- Поэтому с учетом (3.31), (3.33) получим л <р(/, z) =<р(4л]) = ГЪ?- (3-34) /-1 При X,- ф |л(, i=l, п первые п уравнений системы (3.32) можно пе- реписать в виде (к._И/)Л--^-г + —^5-г=о, / = тгг 1 21---- Pi Отсюда, полагая, что — const, в результате интегри- рования получим J (xz — Pi) dt — In (Zi ~ 1) + In ( zz — = In Di, i = 1, n, Q ИЛИ -^y-e0 = Dhi = l,n, (3.35) где Di — произвольные постоянные. 55
С учетом начальных условий (3.33) имеем 1)/h ----у- =Di: i = 1, 7)Z — 1 *» Разрешив эти выражения относительно^, t=l, п, получим = z=T“«. Подставив в эти соотношения значения Л/ из (3.35), имеем t Х< (ц« - [U/—*MI(zi — 1)) exp J (Xz - W) dt 4=---------------------------Г/-----------= 1 - [(г,- - - 1)] exp J (Xz - pz) dt Lo или, введя обозначения i = 1, n, t = * = 1, и (3.36) получим + (0-^(0) 1 - Wi (0 (3.37) Подставив (3.37) в (3.34), получим искомую производящую функ- цию вероятностей состояний <р(0 г)= р / «г (О + г<[1 - 9; (t) - ТЦ (01) (3.38) Формула (3.38) справедлива и при Xz = р., i= 1, п. Однако при этом МО = Т/(0 = 7^7- (3.39) Чтобы получить вероятности состояний рассматриваемого про- цесса, необходимо разложить функцию (3.38) в ряд по степе- ням z в окрестности точки z=l и сравнить члены при одинаковых степенях данного разложения и соотношения (3.28). Имеем ж/о (в, (0 + z, [1 _в/(t) _ Т/ (0]р = £ [1 - 0Z (t) - Tz (OH X Х[е(0Г/0~‘, 56
При |г>| <1 справедливо разложение [19] (1 C^k-ivk, Л-0 поэтому при \Zifi (t) | < 1, i= 1, п получим [1 - ziV (01 х‘° =S [гп/ (01*. / — 6Г"Й7 Тогда П Х№ «« *> “ п {2cji («г«и’»-' s х Z=1 5=0 /г = 0 Из последнего выражения для искомых вероятностей р(х, t) = = p(x]t . . х„, t), которые совпадают с произведением членов при z*i, 1=1, п, находим п /х/о р(хп Х>, Хп, t) = П 2^й^'’ + х.-.5-1Х /.1 [j_0 х {1 _ 0/ (t) -11 (014 (оХ/о “5 та ох‘~s i=\,n, xz=0,1, 2....Rt. (3.40) Пусть теперь (x, t) = 0; В (xt) = 1; ix, (x,'t) = p.z (t) Xi, i = 1, n. Тогда из (3.38) с учетом (3.36) следует, что п <р (Л z) = П Z-1 (3.41) откуда t / t Х*;—1 п ~xio у dt I Jp.. at I p(xh .... xn, t)= П C^-.1 e ° \1—e° ) /-it J / = !,«, xt = 0, 1, 2, ..., Ri. (3.42) Формула (3.41) определяет вероятности состояний системы, в которой протекает процесс чистого восстановления (размножения). В случае процесса чистого поражения (без восстановления) имеем ^i(x, t) = \(t)xt\ н(х> 0=0. Тогда из (3.38) с учетом 57
(3.36) следует, что производящая функция вероятностей состоя- ний этого процесса равна (3.43) Откуда, разложив <р(/, z) в ряд по степеням г и сравнив члены при одинаковых степенях этого разложения с соотношением (3.28), получим п p(xlt хп, 0=П i = l Ч X, dt е 0 (3.44) Таким образом, получены аналитические выражения (3.40), (3.42) и (3.44) для интегралов дифференциальных уравнений Кол- могорова, описывающих широкий круг явлений, присущих воору- женной борьбе. Для применения этих выражений при моделирова- нии конкретных боевых процессов необходимо определить вид за- висимостей |^(£), 1, п. Пример 3.3. На ремонтной базе находится 10 неисправных ар- тиллерийских орудий. Все орудия ремонтируются независимо друг от друга. Среднее время, необходимое для ремонта одного орудия, составляет Т = 5 ч. Необходимо определить вероятность того, что через 10 ч все орудия будут отремонтированы. Решение. Полагаем, что процесс ремонта орудий является ординарным марковским случайным процессом с непрерывным временем. Состояние этого процесса будем описывать величиной % — количеством неотремонтированных орудий. Рис. 3.6 Так как орудия ремонтируются независимо друг от друга, то интенсивности переходов цепи определяются соотношением X = 4^ х = 4- х = 0,2 х. 1 О Граф состояний процесса имеет вид, как на рис. 3.6. 58
Таким образом, рассматриваемый процесс представляет собой марковский процесс гибели. Поэтому для определения искомой вероятности воспользуемся формулой (3.44). Имеем «ГЛ1П\ Л,-0,210\0 Г. —0,2-10110 101 п оо р(0,10)=(е )[1-е ] • 01(10 — 0)! =°>22-
IV. МЕТОДЫ ИССЛЕДОВАНИЯ КОНЕЧНЫХ НЕПРЕРЫВНЫХ ЦЕПЕЙ Многие процессы, присущие вооруженной борьбе, могут быть описаны, как показано в разделе III, конечными непрерывными це- пями Маркова. При этом формально рассматривается динамиче- ская система S с множеством возможных состояний У= = {xi, х2, • • •, хп}. Динамика системы есть ординарный марков- ский случайный процесс блужданий представляющей точки на множестве Y, Обозначим: Xi (t)—событие, заключающееся в том, что в момент време- ни t система S находится в состоянии У; pi(t) —вероятность события xz(/); P(t) —вектор-строка элементов pt (/), /=1, и; — интенсивность перехода системы из состояния Xi в со- стояние Xj в момент времени t\ _____ А(0—квадратная матрица элементов МДО, i, /=1, п; /?^0, О — условная вероятность того, что x(t) =х^ если x(tQ) = = t) = [Rif(tOi /)], f, /=1, п — квадратная матрица. В принятых обозначениях дифференциальные уравнения Колмо- горова для вероятностей переходов (3.16) и вероятностей состояний (3.17) можно записать соответственно в виде ==Я(4>, ^)ЛЮ; (4-1) = (4.2) Основная задача исследования непрерывных марковских цепей заключается в определении величин Rij (tOf t), pi(t), i, /=1, и. Общим методом вычисления этих величин является интегрирова- ние соответствующих систем дифференциальных уравнений Колмо- горова (4.1), (4.2). Однако при высокой размерности систем (4.1), (4.2) их непосредственное интегрирование связано с большими за- 60
тратами ресурсов ЭВМ. Эти затраты могут быть снижены приме- нением подходов, изложенных далее. 4.1. Сведение к дискретным цепям Дискретная цепь Маркова полностью определяется заданием матрицы строки начальных вероятностей состояний и заданием квадратных матриц R(k)=[Rtj(k)]t i, / = ТГ7О=1, 2, . . . (4.3) условных вероятностей переходов из состояний xlf t=l, п в со- стояния Ху, /=1, п на Л-том шаге. Суть сведения непрерывной марковской цепи к дискретной заключается в разбиении отрезка [О, Т] времени функционирования системы 5 на й отрезков длиной т \t = — и построении матриц R(k) = [Rti (Л)] = (0-i, tk_. + Л*)], k (4.4) условных вероятностей переходов системы на интервале времени (^-ь *л). где ^ = ^_1 + АЛ 0 = 0- Непрерывная марковская цепь при известных начальных ве- роятностях состояний pi (t0), 1=1, п полностью описывается мат- рицей интенсивностей переходов A(t) =[XZ;(t)]. Интенсивности пе- реходов %Z/(t), Z, /=1, п для непрерывных марковских цепей свя- заны с соответствующими вероятностями переходов (t, t+At) соотношениями (3.13), (3.14). При этом для удобства записи мат- рицы A(t) принято, что п Ч (t) = - К = S Х"(/)’ >=<4-5) < +J Из соотношений (3.13) и (^. 14) с учетом (4.5) следует, что Rij (t, t + М) (t) M 4- 0 (ДО, I Ф J, I, J=TTn-, (4.6) Ru(t, г + Д0=1 4-Xzi(W + 0(A0, i=!Tn. (4.7) Положив в соотношениях (4.6), (4.7) t = tk, £=1, п и опустив бесконечно малые величины 0(Д/)> можно записать Rii (k) ж(^.,) ДО k =ТГ«, i*J, I, J =Т~«; (4.8) Rtl (k) « 1 + Ki (^_i) ДО k = 1, п, i = 1ГЙ7 (4.9) Соотношения (4.8), (4.9) приближенно (с точностью до бесконеч- но малых величин 0(Д0 определяют элементы матрицы R(k) ус- ловных вероятностей переходов системы на &-том шаге, соответ- ствующем интервалу времени (0_i, 0)» по соответствующим эле- 61
ментам матрицы Л(/) интенсивностей переходов системы в раз- личные состояния в каждый момент времени. Тем самым соотно- шения (4.8), (4.9) определяют дискретную марковскую цепь, ап- проксимирующую рассматриваемую непрерывную цепь. Точность аппроксимации при этом зависит от величины шага дискретиза- ции ДЛ К исследованию полученной таким образом дискретной цепи Маркова применимы все методы, изложенные в разделе II. В ча- стности, для определения матриц t) и P(t) можно восполь- зоваться соотношениями (2.6) и (2.4). Процесс вычислений по формулам (2.6), (2.4) значительно проще, чем непосредственное интегрирование систем дифференциальных уравнений Колмогоро- ва (4.1) и (4.2). Последнее обусловливает целесообразность ап- проксимации непрерывных цепей Маркова дискретными цепями во многих прикладных задачах. Такая аппроксимация особенно удобна для однородных непрерывных цепей, так как получаемые в результате расчетные формулы оказываются очень простыми и удобными для реализации на ЭВМ. Пример 4.1. Решить пример 3.2 путем сведения исходной не- прерывной марковской цепи к дискретной. Решение. Матрица интенсивностей переходов рассматривае- мой цепи имеет вид ' —X X 0 ' -о, 5 0,5 0 ' Л = 0 —X X = 0 —0,5 0,5 _ 0 0 0 . - 0 0 0 . Примем Д/=1 мин, тогда в соответствии с формулами (4.6), (4.7) ’1 —X X 0 '0,5 0,5 0 ' /?== 0 1—X X 0 0,5 0,5 . 0 0 1 .001. В соответствии с формулой (2.6) матрица условных вероятно- т стей переходов за h= (7\— время пребывания самолетов в зоне обстрела /?(3)=Я3 зен итного ком плев ’0,5 0,5 0 " 0 0,5 0,5 .001. сса) 3 । равна '0,125 0,25 0 0,125 .0 0 0,375 ' 0,875 1 Безусловные вероятности СО( стояний после Л = 3 ш ' 0,125 0,25 0,625 “I агов равны Р(3)=Р(0)/?3«[1 0 0]- 0 0,125 0,875 .0 0 1 = [0,125 0,25 0,625]. 62
Математическое ожидание числа самолетов, успешно преодо- левших зону обстрела, равно М(3) =2pi (3) + 1 р2(3) +0 • р3(3) ~2 • 0,125+ 1 • 0,25 = 0,5. 4.2. Вычисление вероятностей достижения поглощающих состояний в строго несущественных поглощающих цепях Теория непрерывных цепей Маркова во многом аналогична теории дискретных цепей. В частности, классификация дискрет- ных марковских цепей, изложенная в п. 2.2, полностью переносит- ся и на непрерывные цепи. Поэтому, не останавливаясь на опреде- лении непрерывных поглощающих цепей, дополнительно выделим строго несущественные поглощающие цепи. Определение 4.1. Непрерывная поглощающая марковская цепь называется строго несущественной, если ее представляющая точка не может более одного раза пройти через любое состояние, принадлежащее этой цепи. Граф состояний такой цепи не содержит циклических маршру- тов. Примером строго несущественной цепи может служить цепь, граф состояний которой изображен на рис. 4.1, а. Цепь рис. 4.1,6 не является строго несущественной, так как содержит циклический маршрут Л1{ хь х2, %5, Xi}. а) 6) Рис. 4.1 Строго несущественные поглощающие цепи играют важную роль при моделировании боевых действий. В частности, в виде та- ких цепей формализуются процессы чистого поражения (без вос- становления) . Рассмотрим непрерывную строго несущественную поглощаю- щую цепь Маркова с множеством состояний У. Множество состоя- ний этой цепи можно разбить на два непересекающихся подмно- жества У1 — несущественных и У2— поглощающих состояний. Для цепи рис. 4.1 Yi = \xt, x2J; Г2 = {х3, xlt х5}. Важной задачей исследования системы, формализуемой в виде строго несущественной непрерывной поглощающей цепи Маркова, 63
является определение вероятностей достижения поглощающих со- стояний xtQ Y2 в произвольный заданный момент времени т. Эта задача может быть решена на основе интегрирования си- стемы дифференциальных уравнений Колмогорова для вероятно- стей состояний (4.2). Однако, как уже указывалось, при большом количестве состояний цепи и достаточно большом т такой путь яв- ляется громоздким и связан с большими затратами ресурсов ЭВМ. Вместе с тем специфика задачи позволяет построить эффективный вычислительный алгоритм определения вероятностей pi (т) (xz £ К2) для однородных непрерывных строго несущественных поглощаю- щих цепей. Для вычисления вероятностей р£(т) достижения поглощающих состояний Xi £ Y2 к моменту времени т воспользуемся предвари- тельным определением вероятностей дДт) прохождения представ- ляющей точки через состояния Xj £ Y к этому же моменту вре- мени. Для поглощающих состояний xt £ У2 имеет место равенство А(т) = ^(х)- (4-10) Физически формула (4.10) означает, что, попав в поглощаю- щее состояние, представляющая точка цепи уже не может из него выйти и, следовательно, вероятность прохождения через погло- щающее состояние совпадает с вероятностью нахождения в нем. Из (4.10) следует, что вероятности <7/(^),Х/С Y для строго не- существенной поглощающей цепи могут быть рекуррентным об- разом вычислены из уравнений Колмогорова, получаемых из (4.2), в предположении, что все состояния xt £ У, для которых qt (т) определяются на данном шаге рекуррентной процедуры, являются поглощающими. Достаточным условием строгой несущественности цепи являет- ся верхний треугольный вид матрицы Л интенсивностей перехо- дов. Это обстоятельство, наряду с тем, что алгоритм вычисления вероятностей qt (т) для цепи с верхней треугольной матрицей ин- тенсивностей переходов формулируется наиболее просто, обуслов- ливает целесообразность преобразования матрицы Л для строго несущественной поглощающей цепи Маркова к треугольному виду. Пусть имеется некоторая неособенная матрица V, такая, что B=VAV-\ (4.11) где В= [&£;], &/7 = 0 при />/, г, /=1, и, т. е. В — треугольная мат- рица. Матрицы Л и В являются подобными. Известно, что для любой квадратной матрицы Л может быть построена подобная ей тре- угольная матрица [17]. Если процесс (4.2), (4.4) является строго несущественным, то 64
Матрица V представляет собой произведение квадратных матриц n-го порядка вида 0...0...1...0 О ... 1 ... О ... О г=1, 2, 3, . . . 0...0...0...1 и эквивалентное преобразование матрицы Л к треугольному виду заключается в перестановке местами kr и 1Г строк (при умножении Л на V~l слева) и столбцов (при умножении Л на V справа). Процедура построения треугольной матрицы В, подобной ис- ходной матрице Л, в этом случае совпадает с процедурой ранжи- рования и нумерации вершин графа, используемой в теории сетей. Суть процедуры ранжирования и нумерации определяется сле- дующим правилом. Правило 4.1, Вершинам, в которые не входит ни одна дуга, присваивается первый ранг. Вычеркнув все дуги, выходящие из вершин первого ранга, получим одну или несколько вершин без входных дуг. Этим вершинам присваивается второй ранг. Вычерк- нув все дуги, выходящие из вершин второго ранга, снова получим вершины без входных дуг. Этим вершинам присваивается третий ранг и т. д., пока не будут проранжированы все вершины графа состояний цепи. Проранжированные таким образом вершины графа состояний цепи нумеруются в порядке возрастания рангов. Вершинам перво- го ранга присваиваются (в произвольном порядке) номера 1, 2, . . ., Вершинам второго ранга присваиваются номера Л1 + 1, & + 2, . . . и т. д., пока не будут пронумерованы все вер- шины. Полученный в результате этой процедуры граф состояний об- ладает тем свойством, что из вершины с большим номером нельзя перейти в вершину с меньшим номером, т. е. матрица интенсив- ностей переходов имеет верхний треугольный вид. Из (4.11) следует, что A=V~1BV. Подставив это значение в (4.2), получим =p(t)V~1BV, at ' ' ’ или, введя подстановку Z(t) = P(t) V~l, -^Г~ (4.12) 5 Зак. 55» 65
Z(0) =Р(0) V-1. (4.13) Интегралы уравнений (4.12), (4.13) связаны с интегралами уравнений (4.2), (4.4) соотношением P(/)=Z(/) V. (4.14) Уравнения (4.12) представляют собой дифференциальные урав- нения Колмогорова для вероятностей состояний непрерывной мар- ковской цепи с пространством состояний ¥*={у^ у2, . . ., у п} и матрицей интенсивностей переходов В= f, / = 1, п верхнего треугольного вида. Значения Q, (т) — вероятностей прохождения представляющей точки рассматриваемой преобразованной цепи через состояния yi Q У* к моменту времени т могут быть вычислены с помощью следующего алгоритма. Алгоритм 4.1. 1. Qi(t)=z1(0). 2. Присвоить d = 0. 3. Присвоить (т) = гДО), /=1, п. 4. Присвоить i= 1 +d, 5. Вычислить by I Q/W—/----- 1-е bik ' k-i + l + J=i+\, п- (4.15) 6. Присвоить Q. + 1 (т) = z^+1 (т). 7. Если i+Kn, то присвоить d=d+l и перейти к четвертому шагу, в противном случае конец вычислений. В результате вычислений по алгоритму 4.1 получается вектор- строка Q = [Q/ (т)], /=1, и. Пусть Y2 —множество поглощающих состояний рассматриваемой цепи. Тогда из (4.10) следует, что MT) = Q/(T) Для всех (4.16) Таким образом, алгоритм 4.1 совместно с соотношением (4.16) позволяет вычислить вероятности (т) достижения поглощающих состояний С К* к моменту времени т для непрерывной марков- ской цепи с матрицей интенсивностей переходов, имеющей верх- ний треугольный вид. 66
Для получения вероятностей дДт) прохождения представляю- щей точки исходной цепи через состояния xt £ Y необходимо умно- жить вектор-строку Q справа на матрицу подобия V: ?(t)=(?£(t)] = QV,(4.17) Соотношение (4.17) по сути представляет собой перестановку эле- ментов Q7 (t), /=1, п матрицы-строки Q(t) в соответствии с нуме- рацией состояний исходной цепи. Вероятности достижения представляющей точкой исходной цепи поглощающих состояний к произвольному заданному момен- ту времени т определяются выражением Л(т) = ^(т) Для всех Y2. (4.18) Рис. 4.2 В большинстве практических задач нумерация вершин графа состояний цепи не играет значительной роли. В этих случаях це- лесообразно осуществлять исходную нумерацию в соответствии с правилом 4.1. Тем самым матрица интенсивностей переходов ис- ходной цепи будет иметь верхний треугольный вид и снимается необходимость построения матрицы подобия V (матрица V в этом случае является единичной матрицей размерности иХ^). Пример 4.2. Определить веро- ятности исходов боя двух проти- вотанковых орудий (ПТО) про- тив двух танков, если на обстрел одного танка каждому ПТО необ- ходимо в среднем Т\ = 10 с и танк поражается с вероятностью pi = = 0,5. Танку для осуществления поиска и выстрела по ПТО необ- ходимо Т2 = 20 с и поражение осуществляется с вероятностью Рг = 0,5; длительность боя т = = 5 мин. Решение. Будем полагать, что каждое ПТО осуществляет пуассоновский поток выстрелов с интенсивностью Ai = l/10. Тогда поток успешных выстрелов будет также пуассоновским с парамет- ром Xi = Aipi = 0,l • 0,5 = 0,05. Ана- логично поток успешных выстрелов каждого танка является пуас- соновским с параметром Х2 = Л2Р2 = 0,05 *0,5 = 0,025. Граф состояний системы изображен на рис. 4.2. Нумерация состояний системы проведена в соответствии с пра- вилом 4.1. 5* 67
Матрица интенсивностей переходов имеет вид (xi) (хз) (хз) (*<) (х&) (*е) (х7) (*8) (*1) ”—0,15 0,05 0,1 0 0 0 0 0 (*г) 0 —0,1 0 0,05 0,05 0 0 0 (хз) 0 0 —0,125 0 0,025 0,1 0 0 М 0 0 0 0 0 0 0 0 (хз) 0 0 0 0 - 0,075 0 0,025 0,05 (хв) 0 0 0 0 0 0 0 0 (•*-7) 0 0 0 0 0 0 0 0 (*8) Be 0 0 роятность победы 0 танков Рт(т) = 0 0 Р4(т)+р7(-г); 0 0 0 вероятность победы ПТО /’пто(т)=/?в('г)+р8(т). Осуществляя вычисления в соответствии с алгоритмом 4.1, по- лучим <Э(т)=[1; 0,3; 0,7; 0,15; 0,29; 0,55; 0,1; 0,2], откуда для поглощающих состояний х4, хб, xlf х8 на основании (4.16) имеем р4(5) =0,15; р6(5)=0,55; р7(5)=0,1; р8(5)=0,2. Следовательно, вероятность победы танков рт (5) =0,15 + 0,1 =0,25; вероятность победы ПТО Рпто (5) =0,55 + 0,2 = 0,75. 4.3. Вычисление вероятностей достижения поглощающих состояний в поглощающих цепях общего вида Если граф состояний непрерывной поглощающей цепи содер- жит хотя бы один циклический маршрут М(Х;, . . xz), то такая цепь не является строго несущественной и подход к вычислению вероятностей достижения поглощающих состояний к некоторому моменту времени т, рассмотренный в предыдущем пункте, к ней неприменим. В этом случае целесообразно ввести строго несуще- ственную цепь, квазиэквивалентную в смысле вероятностей дости- жения поглощающих состояний рассматриваемой поглощающей 68
цепи общего вида. Построение такой квазиэквивалентной цепи за- ключается в следующем. Введем максимально допустимую суммарную погрешность А определения вероятностей достижения поглощающих состояний исходной цепи с графом состояний б(У). Пусть в этой цепи имеет- ся циклический маршрут с начальным состоянием х^К; M(xif Ху, ..., хп хь Для каждого из состояний Ху, ..., xr, xz, принадлежащих этому маршруту, введем k фиктивных состояний: х хг, ..., хг ; Гз rk xi^ ’ xik't а для состояния х, введем k+\ фиктивное состояние xZj, ..х.^ xik + l- При этом фиктивное состояние *ik г положим поглощающим, а все остальные несущественными. Положим, что представляющая точка цепи, достигнув состояния xlt не может перейти в состояние xt (т. е. условно примем =0), а с интенсивностью пе- реходит в состояние х/4 и далее в состояние х71, ..., хл, x/t соот- ветственно с интенсивностями Z/171 = Из состоя- ния xit с интенсивностью XZi/a = осуществляется переход в со- стояние х/3 и т. д., пока не будет достигнуто поглощающее состоя- ние х/л+1. Кроме движения по такой условной «спирали» представляю- щая точка из любого фиктивного состояния может покинуть дан- ную «спираль» и перейти в те же состояния с теми же интенсив- ностями, что и из соответствующего нефиктивного состояния, при- надлежащего рассматриваемому циклическому маршруту. Подобным образом в й-витковые спирали разворачиваются все контуры размеченного графа состояний цепи. Тем самым полу- чается некоторая строго несущественная цепь с графом состояний G(Y^). Вероятности достижения поглощающих состояний этой цепи к моменту времени т могут быть вычислены с помощью алго- ритма 4.1. При этом вероятности достижения поглощающих со- стояний цепи с графом G(Y^) отличаются от соответствующих вероятностей для исходной цепи с графом состояний G(Y) не бо- лее чем на величину Д(Л) = S Pd<*>), (4.19) 69
где — множество фиктивных поглощающих состояний; pz(oo) —финальная вероятность нахождения цепи в состоя- нии X/, pz(oo) = lknpz(i:). Число k фиктивных состояний для всех контуров (циклических маршрутов) рассматриваемой цепи общего вида выбирается та- ким, чтобы выполнялось условие А. (4.20) Таким образом, алгоритм 4.1 совместно с методом построения квазиэквивалентной цепи позволяет определить вероятности до- стижения поглощающих состояний для однородных поглощающих цепей общего вида. Пример 4.3. Построить граф состояний цепи квазиэквивалент- ной в смысле вероятностей достижения поглощающих состояний для цепи, граф состояний которой изображен на рис. 4.3. Решение. При &=1 граф состояний квазиэквивалентной цепи имеет вид, как на рис. 4.4. При построении графа рис. 4.4 принято, что начальной верши- ной контура является вершина х4. Для нее введены два фиктивных состояния: х4Ь х42. Для вершины х3 введено одно фиктивное со- стояние хзь Тем самым контур М(х4, х&, х4) развернут в одновит- ковую «спираль» (х4, х3, х4Ь хзь х42). Рис. 4.4 4.4. Исследование установившихся режимов Важной задачей исследования боевых процессов, формализуе- мых в виде непрерывных цепей Маркова, является исследование установившихся режимов, т. е. определение вероятностей состоя- 70
ний цепи После Достаточно большого времени блуждания Пред- ставляющей точки по этим состояниям. Исследование установившегося режима в непрерывной цепи Маркова сводится к исследованию решения P(t) дифференциаль- ного уравнения Колмогорова (4.2) с начальными условиями (4.4) при t—> оа P=limP(rf). (4.21) t -* 00 Матрицу-строку P=(pi, pi, . . ., pn] принято называть матрицей финальных вероятностей, а ее элементы pt, i=l, п — финальными вероятностями состояний цепи. Задача определения вероятностей (4.21) может быть решена численным интегрированием уравнений (4.2) с начальными усло- виями (4.4) на ЭВМ. Однако при достаточно большой размер- ности системы (4.2) это приводит к значительным затратам ма- шинного времени. В связи с этим возникает проблема построения эффективных алгоритмов вычисления финальных вероятно- стей (4.21). В соответствии с классификацией, изложенной в п. 2.2, множе- ство всех непрерывных цепей Маркова можно разделить следую- щим образом: процессы без несущественных состояний, включающие эргоди- ческие процессы (т. е. процессы с одним эргодическим множест- вом) и процессы с более чем одним эргодическим множеством; процессы с несущественными состояниями, включающие под- класс процессов со множеством несущественных состояний общего вида и подкласс процессов со множеством только строго несущест- венных состояний. Для получения полной совокупности алгоритмов вычисления финальных вероятностей в рассматриваемых марковских цепях необходимо построить их для всех рассмотренных классов процес- сов. Если множество У= [хь . . ., хя| состояний цепи является эр- годическим, то финальные вероятности (4.21) не зависят от на- чальных условий (4.4) и удовлетворяют системе линейных алгеб- раических уравнений [18] РЛ = 0; (4.22) п ^Pi = X‘ (4.23) dP Уравнение (4.22) получается из (4.2) при — Если множество Y состояний цепи содержит непустое подмно- жество У] несущественных состояний, то llmpz(£) = 0 для всех xt£ КР (4.24) 71
Равенство (4.24) непосредственно следует из теоремы 2.2. Если 0, а множество существенных состояний ¥2 содержит k эргоди- ческих множеств Y2i, i=l, k, то финальные вероятности (4.21) удов- летворяют соотношениям (4.22), (4.24) и дополнительным соотно- шениям pt^PU\ /=1, k- (4.25) (4.26) k У, p(/) = i, где Р<Я — финальная вероятность попадания представляющей точ-. ки цепи в эргодическое множество У2/С ^2- Соотношения (4.25), (4.26) при k=l совпадают с (4.23). Поэтому финальные вероятности для всех типов неразложимых непрерывных цепей могут быть вычислены решением системы ли- нейных алгебраических уравнений (4.22), (4.24) — (4.26). Однако эта система оказывается неопределенной, так как за исключением случая k=l величины Р(у), / = 1, k в уравнениях (4.25) неизвестны. Для замыкания данной системы и получения тем самым общего эффективного алгоритма вычисления финальных вероятностей цепи необходимо построить подалгоритм вычисления вероятностей Р(7)» / = 1, k. С этой целью воспользуемся возможностью замены эргодических множеств У2/, /—1, k рассматриваемой цепи без из- менения величин Р(у), /=1, k поглощающими состояниями. В этом случае проблема определения величин Р^\ /=1, k сводится к про- блеме вычисления финальных вероятностей для поглощающих не- прерывных цепей Маркова и может быть решена на основе подхо- да, изложенного в п. 4.2, 4.3. При вычислении финальных вероят- ностей для строго несущественных непрерывных однородных по- глощающих цепей выражение (4.15) принимает более простой вид: Пример 4.4. Артиллерийский дивизион может находиться в од- ном из следующих состояний: Xi — дивизион не боеспособен в результате поражения против- ником; х2 — дивизион не боеспособен из-за израсходования боеприпа- сов; х3 — дивизион боеспособен, но не выполняет огневую задачу; х4 — дивизион выполняет огневую задачу. 72
Возможные переходы между состояниями и их интенсивности показаны на рис. 4.5. Необходимо определить вероятности небоеспособных состоя- ний дивизиона, если бой длится достаточно долго и Р(0) = =(0 0 0 1]. Решение. Введем строго несущественную поглощающую цепь, квазиэквивалентную в смысле финальных вероятностей ис- ходной цепи. Такая цепь при k= \ изображена на рис. 4.6. Контур М(х4, х3, х4) исходной цепи развернут в «спираль» (Х<, Хз, Х4Ь Хзь х42). Рис. 4.5 Рис. 4.6 Матрица интенсивностей переходов для квазиэквивалентной цепи (рис. 4.6) в соответствии с правилом 4.1 может быть запи- сана в виде верхней треугольной матрицы следующего вида: (А) (А) (At) (А) (А1) (*42. )(А) (х4) Г-3 1 0 1 0 0 1 (х8) 0 —2 1 0 0 0 1 (х41) 0 0 —3 1 1 0 1 М о 0 0 0 0 0 0 (x3i) 0 0 0 0 —2 1 1 (х42) 0 0 0 0 0 0 0 (*х) 0 0 0 0 0 0 0 Вычислим на основании алгоритма 4.1 вероятности прохожде- ния представляющей точки квазиэквивалентной цепи через состоя- ния |х4, х3, х4Ь х2, х31, х42, Xi}, получим Q(oo)=[l 1/3 1/6 7/18 1/18 1/36 21/36]. 73
Для поглощающих состояний х2, Аг, А имеем / ч 7 Z ч 1 7 Ч 21 р2 (°°)--18~ *, Jp42 (°°)- 36' 5 Pl (°°) 36 • Таким образом, в процессе боя дивизион может потерять бое- способность вследствие израсходования боеприпасов с вероятно- 7 стью р2(оо) = уз или вследствие поражения огневыми средствами 21 противника с вероятностью р1(оо) = д^-. Погрешность определения величин р2(оо) и pi(oo) в данном случае не превышает величи- НУ Р42(ОО)= -gg . 4.5. Примеры анализа боевых процессов Рассмотрим бой однородных группировок при следующих до- пущениях. 1. Начальные численности боевых средств первой и второй группировок равны соответственно Л1ь Л12. 2. Каждое боевое средство одной из группировок может вести огонь по любому средству другой группировки. 3. Одним выстрелом нельзя поразить более одного боевого средства. 4. Если боевое средство поражено, огонь немедленно перено- сится на другое средство. 5. Пораженное боевое средство в дальнейших боевых дейст- виях не участвует. 6. В каждый момент времени в бою участвуют все непоражен- ные средства группировок. 7. Каждое боевое средство первой (второй) группировки осу- ществляет пуассоновский поток успешных выстрелов с парамет- ром Х1(Л2). Состояние боя в каждый момент времени t будем характери- зовать двумя целыми положительными числами (а, 6) — текущи- ми численностями боевых средств группировок. Этот процесс боя можно рассматривать как марковский случайный процесс блуж- даний представляющей точки по вершинам графа (рис. 4.7) из со- стояния (Л4Ь М2) до границы Г= {(а, 0); (0, &)}. Состояния, при- надлежащие границе, являются поглощающими. Процесс блужданий представляющей точки представляет собой строго несущественную поглощающую цепь Маркова и описывает- ся системой дифференциальных уравнений Колмогорова (3.24), в которой принято (Di = Xi6z; gj2 = X2&; yi — уг —0« (4.28) Типичными при исследовании описанной модели боя являются следующие задачи. 74
Задача 1. Определить вероятности Р{ (a*, t), Рп (b*, t) того, что к моменту времени t потери первой группировки превысят (A4( — а*), а второй (М2 — Ь*) боевых средств. Задача 2. Определить вероятности /-,(0, t), Рп (0, t) истощения сил первой и второй группировок к моменту времени t. Рис. 4.7 Задача 3. Определить полные вероятности победы первой Рп(Ь*, сю) и второй Р, (а*, оо) группировок, если первая группи- ровка прекращает бой (считается побежденной) при потерях не менее (Л1| — а*), а вторая — при потерях не менее (М2— Ь*) бое- вых средств. Для решения задачи 1 положим, что состояния Г*={(а*, Ь), (а, 6*)), а = а*, 6 = 6*, М2 (4.29) являются поглощающими. Тогда м2 Р,(а*, t) = 2 Р(а*. 0; ь-ь*+1 ЛГ, P"(b\ t) = 2 P^b\t), а~а* +1 (4.30) (4.31) где р(а*, 6, t), р(а, b*, t) —вероятности достижения представляю- щей точкой цепи к моменту времени t соответствующего погло- щающего состояния (а*, 6) £ Г*; (а, 6*) С Г*- 76
Задача 2 является частным случаем задачи 1 при а* = 6* = 0. Задача 3 является частным случаем задачи 1 при Величины р(а*, Ь, /), р(а, b*, t) в выражениях (4.30), (4.31) могут быть определены численным интегрированием системы диф- ференциальных уравнений Кол- могорова (3.24) при условиях (3.25), (4.28). Однако такое интегрирование при больших начальных численностях бое- вых средств группировок и вы- соких уровнях допустимых по- терь связано с большими за- тратами ресурсов ЭВМ. Вме- сте с тем специфика исследуе- мого процесса боя позволяет воспользоваться для определе- ния указанных вероятностей эффективным алгоритмом, опи- санным в пп. 4.2, 4.4, который значительно сокращает необхо- димый объем вычислений в сравнении с непосредственным численным интегрированием соответствующей системы дифференциальных уравнений Колмо- горова. Пример 4.5. Определить вероятности Р^О, /), Рп(0, /) уничто- жения противотанковых орудий и танков для боя трех танков и двух ПТО, если их эффективные скорострельности Х1=^2 = = 1 выстр/мин и бой длится 1 мин. Решение. Граф состояний процесса боя изображен на рис. 4.8. Нумерация вершин графа осуществлена в соответствии с правилом 4.1. Матрица интенсивностей переходов имеет вид Л = 1 2 34 5 67 89 10 11 ~5 3 20 0 00 0000 0 —4 03 1 00 0000 0 0—40 2 20 0000 0 0 00 0 00 0000 0 0 00—3 02 1000 0 0 00 0—30 1200 0 0 00 0 00 0000 0 0 00 0 00—2011 0 0 00 0 00 0000 0 0 00 0 00 0000 0 0 00 0 00 0000 76
Вероятности достижения поглощающих состояний { 4, 7, 9, 10, 11} определяются по алгоритму 4.1. При t=0 имеем Р(0) = (р,(0), р2(0), . . ., Р11 (0)] = (1,0, . . .,0]. Осуществив вычисления по алгоритму 4.1, получим вектор-стро- КУ Q=(Q/(t)], /=1; И вероятностей прохождения представляю- щей точки через соответствующие состояния к моменту времени т=1. Имеем Q=[l; 0,594; 0,396; 0,436; 0,339; 0,194; 0,215; 0,168; 0,123; 0,072; 0,072]. В. соответствии с (4.16) вероятности достижения поглощающих состояний | 4, 7, 9, 10, 11} к моменту времени т=1 равны вероят- ностям прохождения представляющей точки через эти состояния к этому же моменту времени. Следовательно, р(0; 3; 1)=р4(1) =0,436; р(0; 2; 1) =р7(1) =0,215; р(2; 0; 1)=р9(1) =0,123; р(0; 1; 1) =р10(1) =0,072; Р(1; 0; 1)=рн(1) =0,072. Вероятность уничтожения ПТО определяется выражени- ем (4.30): Pi(0; 1)’ = р(0; 3; 1)+р(0; 2; 1)+р(0; 1; 1) = = 0,436+0,215+0,072 = 0,723. Вероятность уничтожения танков определяется выражени- ем (4.31): рп(0; 1)=р(2; 0; 1) +р(1; 0; 1) =0,123 + 0,072 = 0,195. Таким образом, в данном примере превосходство имеет группи- ровка танков. Рассмотрим теперь, как зависят результаты боя от начальных численностей группировок при постоянном соотношении сил. В табл. 4.1 представлены результаты расчетов полных вероятностей победы группировки противотанковых средств Рпто и группировки танков Рт при li = %2=l в зависимости от начальных численностей боевых средств при условии, что бой прекращается при потере 50 и 100% боевых средств. Анализ данных табл. 4.1 позволяет сделать следующие выводы. 1. Вероятности победы зависят не только от соотношения на- чальных численностей боевых средств группировок, но и от самих начальных численностей боевых средств. При этом с ростом на- чальных численностей при сохранении их соотношения вероятность победы сильной стороны возрастает. 2. При любом начальном соотношении сил группировок суще- ствует уровень потерь, при котором слабой группировке целесооб- разно прекратить бой и вывести свои боевые средства из зоны воз- действия группировки противника, так как в противном случае она будет полностью уничтожена, не нанеся при этом существен- 77
Таблица 4.1 МХ:М2 Бой прекращается при потере 50% боевых средств Бой прекращается при потере всех боевых средств Лпо рт Математи- ческое ожи- дание ПТО ^пто рт Математи- ческое ожи- дание ПТО 4:2 0,87000 0,13000 3,00 0,92000 0,08000 2,99 8:4 0,94400 0,05600 6,70 0,98000 0,02000 6,50 12:6 0,97500 0,02500 10,30 0,99300 0,00700 9,99 16:8 0,98900 0,01100 14,00 0,99800 0,00200 13,40 20:10 0,99500 0,00500 17,17 0,99930 0,00070 17,00 24: 12 0,99750 0,00250 21,40 0,99980 0,00020 20,40 36:18 0,99980 0,00020 32,00 0,99999 0,00001 31,00 48:24 0,99997 0,00003 43,00 1 0 41,00 матема- следует из сравнения вывод ных потерь противнику. Этот тических ожиданий численностей боевых средств группировки ПТО при условии, что бой прекращается при потере группировкой 50 и 100% танков и является проявлением общего закона воору- женной борьбы — закона возрастания превосходства. Эффективность предложенного в пп. 4.2—4.4 подхода к анализу конечных однородных цепей Маркова с непрерывным временем иллюстрируется тем, что для вычисления всех данных, представ- ленных в табл. 4.1, потребовалось 1 мин 12 с машинного времени ЭВМ ЕС-1030, а на определение вероятностей истощения сил только для одного варианта (Mi = 16, М2 = 8, Xi = X2=l) путем непосред- ственного интегрирования соответствующей системы дифференци- альных уравнений Колмогорова — 1 ч 4 мин. Наряду с уравнениями Колмогорова для исследования конеч- ных непрерывных цепей Маркова широко применяются уравнения динамики средних [14]. Динамика математических ожиданий численностей боевых средств рассматриваемого процесса боя однородных группировок приближенно описывается уравнениями (1.1), в которых N—M\, М = М2. Превосходство той или иной группировки в модели (1.1) вычисляют на основе показателя потенциального превосходства х, который определяется выражением [14] *=“SL1/4L- (4-32) Если х>1, то первая группировка имеет больше шансов на победу. Если х=1, то шансы группировок равны. Если же х<1, то в сред- нем побеждает вторая группировка. Так как показатель (4.32) определен из модели (1.1), прибли- женно описывающей рассматриваемый процесс боя однородных группировок, то возникает вопрос — насколько корректны выводы, полученные на его основе? Следующий простой пример показы- 78
вает, что данный показатель не всегда позволяет выделить более сильную группировку. Пример 4.6. Определить группировку, шансы которой на побе- ду выше, если Mi = 5, Л12=1, Xj = l, Х2 = 25. Решение. Из выражения (4.32) следует, что х=1, т. е. в рам- ках модели (1.1) обе группировки имеют одинаковые шансы на победу. Проверим корректность этого вывода на основе анализа точ- ной модели рассматриваемого процесса — непрерывной цепи Мар- кова. Граф состояний процесса боя имеет вид, как на рис. 4.9. Вер- шины графа пронумерованы в соответствии с правилом 4.1. Рис. 4.9 Полная вероятность победы первой группировки Рц(0, со) =р3(оо)4-р5(со) +р7(со) +/>9(°°) +/’11(0О) = 1—Ао(°°)- Полная вероятность победы второй группировки PJ0, оо)=р10(оо). Финальные вероятности pz(oo), f = 3, 5, 7, 9, 10, 11 достижения соответствующих поглощающих состояний определим в соответст- вии с алгоритмом 4.1. Получим Рю = 0,571; Pj (0, оо) =0,571; Рп (0, оо) =0,429, т. е. вторая группировка имеет более высокую вероятность побе- ды, чем первая. Следовательно, вывод, полученный на основе по- казателя (4.32), в данном случае несправедлив. ifi 4* В настоящее время в связи с внедрением средств автоматиза- ции управления в практику войск возрос интерес к аналитическим моделям боя. Для построения таких моделей широкое применение находит математический аппарат марковских случайных процессов. Изложение в данном пособии основных положений теории цепей Маркова и их приложений к моделированию боевых процессов 79
преследовало цель дать систематизированное представление о воз- можностях применения аппарата марковских процессов к модели- рованию боевых действий и методах исследования этих моделей. При этом основное внимание уделено прикладным методам иссле- дования конечных цепей Маркова. Ограниченный объем пособия не позволил дать полное обоснование рассмотренным методам и сузил их перечень. Помимо изложенных в пособии существуют и другие эффективные методы исследования марковских цепей. Это в первую очередь относится к цепям с бесконечными множествами состояний, которые реже применяются при моделировании боевых процессов и поэтому менее освещены в пособии, чем конечные цепи.
приложение НЕОБХОДИМЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МАТРИЦ Матрицей порядка тХп называется система тп элементов, расположенных в виде прямоугольной таблицы, имеющей т строк и п столбцов, Обозначение: Я=пм = П1П2...П» ^22 • -Гщ ГпЛГт2- -гтп Матрица R называется числовой, если ее элементами г if явля- ются числа. Матрица R называется функциональной, если ее элементы г,-/ являются функциями от некоторого аргумента t (т. е. ri;- = rtj (t). Матрица может иметь любое количество (конечное или счет- ное) строк и столбцов. Матрица R, состоящая из п элементов, расположенных в стол- бец, называется «-мерным вектором-столбцом: Матрица R, состоящая из п элементов, расположенных в стро- ку, называется «-мерным вектором-строкой: Я-ki. г* г„[| Для вектора-столбца и вектора-строки элементы достаточно помечать одним индексом, б Зак. 559 81
Матрица 7? порядка nXn называется диагональной, если ее эле- менты удовлетворяют условию г tj = 0 для всех / ¥= i, т. е. гп0 О ...О 0 г210 ...О О 0 г21...О О 6 6 ... гпп Диагональная матрица, в которой все элементы, лежащие на главной диагонали, равны 1, называется единичной. Например: 10 0 0 /= ° 1 ° ° 0 0 10 0 0 0 1 Матрица, все элементы которой вой. Например: равны нулю, называется нуле- 0 0 0 0 0 = 0 0 0 0 0 0 0 0 0 0 0 0 Транспонированная матрица по отношению к матрице R= Цг^Ц обозначается R* и определяется по формуле /?*= Например: /? = Г11 г12 г13 /21 г22 /23 >31 Г32 г33 /’ll Г21 Г31 _ fl2 /*22 Г32 /"13 г23 г33 Суммой двух матриц Л=|(аг/|| и 5=1^11 одинаковых типов называется матрица C=|]cz/||, элементы которой определяются по формуле ctj = aij + Например: 2 3 1 1 2 3 II 3 5 4 л = 3 4 2 В = 123 С=Л+В= 4 6 5 2 8 5 1 2 3 II 3 10 8 Произведением двух матриц А-В называется матрица D = = (lrf/Д элементы которой определяются по формулам dtj — п = е’ элементы dy равны сумме произведений элемен- ы 82
тов i-той строки матрицы А на соответствующие элементы j-того столбца матрицы В. Например: 2 5 1 О 1 2 3 2 1 1 3 1 О А = 2 4 D=A-B = 2-1+0-2 + 3-4 5-1 + 1-2 + 2-4 1-1+2-2+1-4 Результат умножения матрицы порядка пгХп на матрицу по- рядка nXk представляет собой матрицу размерности mXk. Детерминант (определитель) матрицы А= ||az/|| порядка пХп обозначается det Л и представляет собой число, получаемое на ос- нове элементов матрицы по определенным правилам. Так, опреде- литель матрицы порядка 2X2 вычисляется по формуле det А = «п «21 «12 «22 = #11^22 — «21«12- Определитель матрицы А порядка пХп вычисляется в общем случае разложением по элементам любой f-той строки по формуле det А = CLtiA^ 4- а^А^ + ... + ainAitv где AZ/-—алгебраическое дополнение соответствующего элемента. Алгебраическим дополнением элемента а называется опреде- литель п — 1 порядка, образованный из данного определителя вы- черкиванием строки и столбца, на пересечении которых стоит дан- ный элемент az/, и взятый со знаком плюс, если i + j четное, и со знаком минус, если i + j — нечетное число. Например: «11 «12 «13 deM = «21 «22 «23 — «И «22 «32 «31 «32 «33 «23 Л «21 — «12 «33 «31 + «13 «23 «33 «2! «22 I = «ц«22«33 — «11«23«32 — «12«21«33 + «31 «32 I + #12«23«31 4“ «13«21«32— «13«22«ЗЬ Обратная матрица для матрицы /? обозначается Она удов- 6* 83
летворяет равенствам /?• R-'=R-'R = I, где У— единичная матри- ца, и имеет структуру p-i — - 1 n “det У? ДцДгХ- • • Д«1 Д 12^22* • *Дд2 • • • Д/171 где Д/;- —алгебраическое дополнение элемента матрицы У?. Операция дифференцирования матрицы определяется следую- щим образом: dA I day II "ST = I “ЗГII В частности, для вектора dR dt dr^ || ”5Г||
ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА 1. Тутубалин В. Н. Статистическая обработка рядов наблюдений. М.: Знание, 1973. 2. Тутубалин В. Н. Теория вероятностей в естествознании. М.: Зна- ние, 1972. 3. Алимов Ю. И. Альтернатива методу математической статистики. М.: Знание, 1980. 4. Т к а ч е н к о П. Н. и др. Математические модели боевых действий. М.: Сов. радио, 1969. 5. М о р з Ф. М., Кимбелл Д. Е. Методы исследования операций. М.: Сов. радио, 1956. 6. Вентце ль Е. С. Введение в исследование операций. М.: Сов. радио, 1964. 7. К о ф м а н А., К р ю о н Р. Массовое обслуживание. Теория и приложе- ния. М.: Мир, 1965. 8. Кемени Дж., Снелл Дж. Конечные цепи Маркова. М.: Наука, 1979. 9. Фрай Т. Теория вероятностей для инженеров. М.; Гостехиздат, 1934. 10. Ганин М. П. Прикладные методы теории марковских случайных про- цессов. Л.: Изд-во ВМА, 1974. 11. Колмогоров А. Н. Об аналитических методах в теории вероятно- стей.— Успехи математических наук, 1938, № 5, с. 5—41. 12. Т а р а к а н о в К. В., Овчаров Л. А., Т ы р ы ш к и н А. Н. Аналити- ческие методы исследования систем. М.: Сов. радио, 1974. 13. Тихонов В. И., Миронов М. А. Марковские процессы. М.: Сов. ра- дио, 1977. 14. Вентце ль Е. С. Исследование операций. М.: Сов. радио, 1972. 15. Баруча-Рид А. Т. Элементы теории марковских процессов и их при- ложения. М.: Наука, 1969. 16. Курант Р. Уравнения с частными производными. М.: Мир, 1964. 17. Г а нт махер Ф. Р. Теория матриц. М.: Наука, 1967. 18. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. М.: Нау- ка, 1973. 19. Корн Г., Корн Т. Справочник по математике. М.: Наука, 1974. 20. Исследование операций: Методологические основы и математические ме- тоды. М.: Мир, 1981. Т. 1. 21. Исследование операций: Модели и применения. М.: Мир, 1981. Т. 2.
ОГЛАВЛЕНИЕ Стр. Л. Стохастические модели боевых действий........................... 3 1.1. Природа стохастичности в моделях боевых действий.......... 3 1.2. Основные подходы к построению стохастических моделей бое- вых действий.................................................... 6 1.3. Определение и классификация марковских случайных процессов 8 II. Применение дискретных цепей Маркова к моделированию боевых действий................................................: . . . И 2.1. Основные понятия и свойства.............................. 11 2.2. Классификация состояний и цепей.......................... 17 2.3. Поглощающие цепи......................................... 20 2.4. Эргодические цепи Маркова................................ 24 2.5. Цепи общего вида......................................... 30 III. Применение непрерывных цепей Маркова к моделированию боевых действий.......................................................... 36 3.1. Структура и основные характеристики непрерывных цепей ... 36 3.2. Дифференциальные уравнения Колмогорова................... 40 3.3. Примеры моделей боевых процессов....................... 46 3.4. Интегралы уравнений Колмогорова для некоторых типов непре- рывных цепей................................................... 52 IV. Методы исследования конечных непрерывных цепей................ 60 4.1. Сведение к дискретным цепям.............................. 61 4.2. Вычисление вероятностей достижения поглощающих состояний в строго несущественных поглощающих цепях........................ 63 4.3. Вычисление вероятностей достижения поглощающих состояний в поглощающих цепях общего вида.......................... 68 4.4. Исследование установившихся режимов...................... 70 4.5. Примеры анализа боевых процессов......................... 74 Приложение........................................I............... 81 Использованная литература ........................................ 85 Формат 60X 90716 Объем 53/в уч.-изд. л. Бесплатно Для внутриведомственной продажи — цена 40 коп. 1985 Зак. 559