Текст
                    Федеральное государственное образовательное бюджетное учреждение
высшего профессионального образования
«Сибирский государственный университет телекоммуникаций и информатики»
(ФГОБУ ВПО «СибГУТИ»)
МОДЕЛИРОВАНИЕ ФУНКЦИОНИРОВАНИЯ
ЭЛЕМЕНТОВ ТЕЛЕКОММУНИКАЦИОННЫХ
СЕТЕЙ И РАЗРАБОТКА МЕТОДА РАСЧЕТА
ПОКАЗАТЕЛЕЙ НАДЕЖНОСТИ
Новосибирск 2012
О.Г. Шерстнева
Учебное пособие


1 Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования «Сибирский государственный университет телекоммуникаций и информатики» (ФГОБУ ВПО «СибГУТИ») МОДЕЛИРОВАНИЕ ФУНКЦИОНИРОВАНИЯ ЭЛЕМЕНТОВ ТЕЛЕКОММУНИКАЦИОННЫХ СЕТЕЙ И РАЗРАБОТКА МЕТОДА РАСЧЕТА Новосибирск 2012
2 УДК625.395.7:51 Шерстнева О.Г. Моделирование функционирования элементов телекоммуникационных сетей и разработка метода расчета показателей надежности: Учебное пособие. О.Г . Шерстнева. – Новосибирск: ГОУ ВПО «СибГУТИ», 2012. – 65с. Учебное пособие имеет научно-исследовательскую направленность и предназначено для подготовки магистров, аспирантов по специальности 210406 «Сети связи и системы коммутации» по направлению 21000 «Теле- коммуникации». Также может быть использовано при изучении соответс т- вующих дисциплин близких по тематике направлений в других высших учебных заведениях. Приведены особенности работы пунктов сетевого управления, методы оценки соответствия требованиям по надежности сетевых элементов, составлены математические модели и разработан метод расчета показателей надежности по данным системы управления и мониторинга сетью. Рекомендовано ГОУ ВПО «СибГУТИ» в качестве учебного пособия для магистрантов и аспирантов вышеперечисленных направлений и специально- стей. Кафедра автоматической электросвязи © ГОУ ВПО «СибГУТИ», 2012 © Шерстнева О.Г ., 2012
3 Новосибирск 2012 Содержание Введение......................................................................................... 4 Раздел 1. Анализ методов обеспечения надежности в телекоммуникацион- ных сетях.................................... ................................. 5 1.1. Особенности работы центральных пунктов сетевого управле- ния............................................................................... 5 1.2. Методы оценки соответствия элементов сети требованиям по на- дежности....................................................................... 10 1.3. Виды контроля технического состояния сетевого элемента....... 15 Раздел 2. Разработка математической модели функционирования сетевых элементов с учетом особенностей системы контроля и управл е- ния............................................................................... 19 2.1. Разработка математической модели функционирования сетевого элемента при достоверной комбинированной системе контроля и управления..................................................................... 20 2.2. Исследование влияния ошибок системы контроля и управления на показатели надежности контролируемых объектов.. ............. 25 Раздел 3. Разработка метода расчета показателей надежности сетевого элемента на основе данных системы контроля и управле- ния............................................................................... 30 3.1. Разработка модели технического обслуживания сетевого элемен- та................................................................................. 31 3.2. Разработка метода расчета показателей надежности с учетом данных сетевого мониторинга.................................................... 34 3.3. Пример использования разработанного метода расчета показате- лей надежности............................................................... 43 Раздел 4. Методика сбора и обработки статистических данных системы контроля и управления...................................................... 52 4.1. Постановка задачи сбора и обработки статистических дан- ных............................................................................... 52 4.2. Оценка средней наработки на отказ....................................... 53 4.3. Оценка среднего времени восстановления.............................. 55 4.4. Оценка вероятностей состояний........................................... 56 4.5. Оценка показателей надежности .......................................... 57 4.6. Оценка интенсивности событий для случая полностью и непол- ностью определенной выборки............................................. 60 Раздел 5. Рекомендации по сбору и обработке статистических дан- ных............................................................................... 64 Заключе- ние ............ ........................... ............... ..................... ......... 76 Приложе- ние А ............ ........................... ............... ............ ............... ... 77 Список литературы .................................................................................... 79
4 Введение. В настоящее время исследователи и разработчики современных систем управления решают задачи, связанные, прежде всего, с управлением трафи- ком, оперативным перестроением сети и обеспечением достоверности пере- дачи информации. Однако заслуживает внимание и тот факт, что для эффек- тивного решения необходимо использовать информацию, получаемую от систем управления и контроля, а также учитывать надежность работы от- дельных сетевых элементов. При эксплуатации телекоммуникационных се- тей возникает множество нештатных ситуаций, обусловленных нестационар- ностью входящей нагрузки и конечной надежностью не только сетевых эле- ментов, но и элементов самой системы контроля и диагностики. Каждая та- кая задача порождает специфическую прикладную задачу, при решении ко- торой определяется вид соответствующего управляющего воздействия. Мо- дели сетей связи с учетом управления разработаны, как правило, с использо- ванием предположений об идеальной надежности сетевых элементов. Одна- ко, исследования в этой области показывают, что уменьшение коэффициента готовности на 0,01 и 0,025 приводит к увеличению вероятности потерь на 8% и 20% соответственно [14]. Таким образом, учет параметров надежности в моделях сетей – вопрос актуальный. Как показывает опыт эксплуатации, су- ществующие методы сетевого мониторинга и диагностики сами по себе не гарантируют достоверное обнаружение и локализацию отказов и не могут оперативно предотвратить перегрузку маршрутов и вносить изменения в протоколы маршрутизации. Это объясняется несовершенством существую- щих методов анализа и обработки статистических данных, что определяет необходимость проведения дальнейших работ в этом направлении.
5 1. Анализ методов обеспечения надежности в телекоммуника- ционных сетях. 1.1. Особенности работы центральных пунктов сетевого управле- ния. В связи с интенсивным внедрением новых технологий, позволяющих операторам телекоммуникационных сетей предоставлять пользователям ши- рокий спектр современных услуг связи, произошло значительное усовершен- ствование самих сетей связи. При этом возрастают и требования, предъяв- ляемые к пропускной способности сети. Удовлетворение этих требований в основном происходит за счет использования большого числа протоколов и механизмов для контроля и управления сетевыми ресурсами. На первый взгляд внедрение на сеть множества разнородных подсистем, дополняющих друг друга и существенно улучшающих характеристики сети в целом, приве- ло к созданию высоконадежных систем и сетей связи. Возможность постоян- ного наблюдения за состоянием сети, контроль за работоспособностью от- дельных сетевых элементов, оперативное вмешательство в работу подсистем управления в случае обнаружения перегрузки на сети или сбоя при обслужи- вании группы вызовов обеспечивает достаточно высокие показатели надеж- ности ее эксплуатации. Однако, при анализе эффективности функционирова- ния сложных систем, к которым, безусловно, относится и современная сеть связи, исследователями этой области были выявлены недостатки, которые за- служивают отдельного рассмотрения. Например, передача служебных сигна- лов различными телекоммуникационными протоколами, используемыми для управления элементами сети на разных уровнях функционирования, согласно модели взаимодействия открытых систем, занимает до 20% всей пропускной способности. Также, при обнаружении неисправности в одном элементе сети, не предусматривается автоматическая инициализация, в результате чего об- наруживается значительная задержка информации. Если добавить к этому, что внутренняя система контроля сетевого элемента охватывает только опре- деленный перечень отказов и неисправностей и не учитывает нарушения нормальной работы, произошедшие по вине обслуживающего персонала или вызванные воздействием внешних факторов, то вопрос какие статистические данные необходимо обрабатывать для определения достоверных показателей надежности сетей связи остается актуальным. Разработка определенной ме- тодики сбора и обработки данных сетевого мониторинга так же представляет интерес. Применение статистических методов оценки технологических про- цессов в телекоммуникационных сетях определило задачу выявления круга статистических данных (эксплуатационных показателей надежности) с по- мощью которых впоследствии можно определить расчетные качественные показатели работоспособности всей сети с учетом ее конфигурации, техниче- ской оснащенности и т.п. Предъявляемые требования к увеличению объѐмов передаваемого трафика, повышению показателей качества, надѐжности и ус-
6 тойчивости функционирования сетей связи, совершенствованию процедур работы с пользователями также подтверждают сделанный вывод. Анализируя работу системы оперативного контроля и диагностики на реальных сетях можно говорить о том, что в настоящее время развитие циф- ровых телекоммуникационных сетей требует разработки автоматизирован- ной системы управления на новом уровне с целью обеспечения комплексного автоматизированного управления первичной и вторичными цифровыми се- тями для повышения эффективности использования сетевых ресурсов [31]. В Рекомендациях МСЭ-Т по TMN (Рекомендации М и Q , в частности М3010, М3200, М3400) задачи всякой системы управления сетями связи оп- ределены как функциональные области управления, к которым относятся управление конфигурацией сети, управление устранением последствий отка- зов, управление качеством, управление взаиморасчетами, управление защи- той информации (безопасность). При управлении конфигурацией решаются следующие задачи: - формирования и развития сети; - реконфигурации сети; - планирования работ при масштабировании сети и услуг связи; - создания и ведения банка данных. При управлении устранением последствий отказов должны решаться за- дачи: - организации контроля за состоянием сети и ее элементов в реальном масштабе времени; - обнаружения и локализации неисправностей; - восстановления связей; - оперативного перестроения сети; - устранения неисправностей; - оповещение пользователей о проводимых работах. При управлении качеством должны быть решены задачи: - сбора и анализа статистических данных по функционированию сетей и их элементов; - регулирования трафика; -разработки рекомендаций по улучшению эксплуатационных характери- стик телекоммуникационных сетей, улучшению и расширению диапазона предоставления услуг связи; - анализа функционирования систем управления и контроля с целью усовершенствования методов управления сетями связи. При управлении расчетами должны решаться задачи: - сбора данных по предоставляемым (арендуемым) средствам и услугам связи; - разработки тарифов за предоставляемые средства связи и услуги; - проведение взаиморасчетов межу участниками предоставления услуг. При управлении защитой информации должны решаться задачи:
7 - разработки мер по обеспечению закрытости информации, контроль за их осуществлением; - защиты баз данных от несанкционированного доступа; - соблюдения конфиденциальности при предоставлении данных; - классификации уровня безопасности сети связи. Все перечисленные задачи тесно взаимосвязаны между собой. Невоз- можно решить задачу реконфигурации сети, оперативного перестроения се- ти, регулирования трафика без сбора и анализа статистических данных о функционировании отдельных элементов сети к которым относятся не толь- ко телекоммуникационное оборудование, но и системы передачи , линии свя- зи. Для того, чтобы обеспечить решение комплекса оперативных задач каж- дое подразделение оперативно-технического управления должно хранить массивы статической конфигурационной информации с целью описания се- тевых узлов и станций, зоновых сетей, всех пунктов управления, а также иметь в своем распоряжении данные, влияющие на функционирование всех составляющих телекоммуникационной сети. В общем виде база данных – это набор однородной, как правило, упоря- доченной по некоторому критерию информации. База данных может быть представлена в «бумажном» или электронном виде. В результате исследования работы узловых пунктов управления выясне- но, что при ведении некоторой оперативно-технической документации по учету, анализу и отчетности о качестве работы сетевых узлов, линий переда- чи, сооружений, оборудования, аппаратуры и т.д . данные обрабатываются вручную. При таком способе обработки, во-первых, затрачивается довольно много времени, и, во-вторых, возникает вероятность получения неточности результатов. В настоящее время результаты анализа работы сети связи пред- ставляются в виде диаграмм, учитывающих долю обслуженных вызовов и отказов в обслуживании. Причины, по которым был отказ, в основном клас- сифицируются по таким признакам, как неправильно набран номер или не- полный набор, фиксирование состояние абонента (заблокирован, занят), от- сутствие линейных сигналов. Однако такой важный параметр, как перегрузка на линии, также фиксируемый, не указывает действительной причины пере- грузки. Это могут быть как ошибки сигнализации, так и несовместимость серверов. Действительное отсутствие соединительных путей или одновре- менное занятие нескольких линейных комплектов (каналов) при использова- нии двунаправленной линии связи. Таким образом, для получения реальных показателей надежности необ- ходима программа обработки статистических данных для каждого информа- ционно-исполнительного пункта и решение вопроса какие именно статисти- ческие данные подлежат сбору и в каких объемах. С этой целью, в работе все исходные параметры надежности функциони- рования телекоммуникационной сети в системах управления с точки зрения их статистической оценки разбиты на две группы. В первую группу входят
8 такие показатели как интенсивности событий, являющиеся параметрами экс- поненциального распределения, к ним относятся. Ко второй группе относятся вероятности событий, вычисляемые как соотношения чисел соответствую- щих событий, т.е . ошибки контроля I, II, III рода. Интенсивности событий, являются параметрами экспоненциального распределения. К этим параметрам относятся: - параметр потока отказов; - интенсивность восстановления участка или элемента сети; - интенсивность проведения периодического контроля за работоспособно- стью; - интенсивность повторной передачи информации. Вероятности событий, вычисляются как соотношение чисел соответст- вующих событий, т.е . ошибки контроля I, II, III рода. Под ошибкой контроля I рода понимают ложный отказ, когда работоспо- собный сетевой элемент признается как неработоспособный. Под ошибкой контроля II рода понимают необнаруженный отказ, когда неработоспособный сетевой элемент признается как работоспособный. Под ошибкой контроля III рода понимают ситуацию, когда неправильные действия оператора приводят к тому, что сетевой элемент оказывается в не- работоспособном состоянии или не может выполнять заданных функций [3, 4]. При оценке интенсивности событий выборка может быть следующей: - полностью определенной объема n, т.е . такая выборка, в которой все значения случайной величины определены; - неполностью определенной объема n, т.е . такая выборка, в которой из- вестны только m значений случайной величины, а про остальные (n-m) зна- чений известно только то, что они больше некоторого числа. Полностью определенной выборкой характеризуются интенсивности вос- становления, завершения проверки функционирования сети или ее элемента, например цифровой системы коммутации, а также интенсивность проведения периодического контроля за работоспособностью сети. Неполностью определенной выборкой характеризуется интенсивность от- казов сетевого оборудования или системы сигнализации. При этом можно принять, что интенсивности, характеризующиеся неполной выборкой, оцени- ваются по результатам плана испытаний, согласно которому испытанию под- вергаются отдельные участки сети. При таком методе испытаний нижняя и верхняя границы интенсивностей при односторонней доверительной вероят- ности для полностью определенной выборки вычисляются по формулам, о п- ределенным в [3, 4] и в Рекомендациях серии М.2100 ITU-T. Все события, происходящие на сети, регистрируются, как правило, системой мониторинга или системой контроля и диагностики, а также обслуживающим персоналом (оператором сети) при прямых наблюдениях. Для определения теку- щей оценки среднего времени восстановления и средней наработке на отказ мож- но выделить два типа событий.
9 Первый тип событий состоит в исключении сетевого элемента из рабочей конфигурации после обнаружения отказа аппаратным или программным спосо- бом. После чего только запускается тест поиска неисправности, локализации не- исправности. В этом случае необходимо фиксировать момент времени исключе- ния элемента из рабочей конфигурации. Второй тип событий состоит во включении элемента сети в рабочую конфигу- рацию. Этому типу событий предшествует, как правило, или замена отказавшего функционального блока сетевого элемента или блокировка канала. Но в том и другом случае необходим послеремонтный контроль технического состояния восстановленного функционального блока, сетевого элемента или канала (линии) с обязательной фиксацией времени включения элемента в рабочую конфигура- цию. Если принять, что первое событие является началом восстановления, а второе - его завершением, то воспользовавшись Рекомендациями ITU-T, например Рек.G.821., можно произвести оценку средней наработки на отказ и среднего времени восстановления для одной и той же совокупности однотипных функ- циональных блоков или сетевых элементов. Для оценки вероятности событий необходимо фиксировать число событий, соответствующих каждому состоянию функционального блока или сетевого элемента. Эта задача легко выполнима при современных возможностях систе- мы мониторинга сети. Таким образом, регистрации подлежит следующая ин- формация: - число групп однотипных функциональных блоков или сетевых элемен- тов; - суммарное время наблюдения; - суммарное число проведенных периодических проверок; - число функциональных блоков, сетевых элементов, попавших на восста- новление с отказами, обнаруживаемыми разными видами контроля (непрерыв- ным, периодическим, в результате плановых проверок и т.д.); - число устройств, попавших на восстановление в работоспособном со- стоянии, например из-за ошибки системы контроля или сбоя программного обеспечения; - момент времени обнаружения отказавшего сетевого элемента и момент включения его в рабочую конфигурацию. Полученную информацию можно использовать для вычисления реальных показателей эксплуатации сети и ее элементов. Теме определения, например, требуемой полосы пропускания мульти- медийного трафика, или оценки характеристик пропускной способности в пакетных сетях, надежности функционирования современных телекоммуни- кационных сетей связи посвящено достаточное количество работ, опублико- ванных в научно-технических изданиях. В статьях, посвященных этой теме, составлены математические модели, позволяющие вывести аналитические выражения для определения требуемых показателей к которым прежде всего
10 относятся коэффициенты готовности и простоя, среднее время необнаруже н- ного отказа, среднее время восстановления и многие другие. Аналитические модели ненадежных распределенных сетей можно полу- чить, применяя методы работ [15, 22]. Однако точность математических рас- четов зависит, прежде всего, от достоверности параметров, используемых в формулах расчета. Достоверность параметров может быть обеспечена только при прямых наблюдениях за функционированием сети в реальном времени с использованием результатов системы мониторинга, тестирования, контроля и диагностики, а также оперативной обработке этой информации. В работе предлагается разработанный расчетно-экспериментальный ме- тод определения достоверных показателей надежности, основанный на дан- ных систем мониторинга и позволяющий получать аналитические зависимо- сти, связывающие расчетные, эксплуатационные и наблюдаемые параметры надежности функциональной зависимостью. Также, к рассмотрению предла- гается разработанная обобщенная методика анализа, сбора и обработки ста- тистических данных системы управления сетевого мониторинга, учитываю- щая интенсивности и вероятности наблюдаемых событий, классификацию событий, исходные вероятностные характеристики, суммарное время наблю- дений. Разработанная методика позволяет анализировать множество стати- стических данных сетевого мониторинга при оценке реальных показателей надежности, оперативно обрабатывать полученную информацию. 1.2. Методы оценки соответствия элементов сети требованиям по надежности. Надежность объекта [3] – свойство объекта сохранять во времени и ус- тановленных пределах значения всех параметров, характеризующих качество передачи информации в заданных режимах и условиях применения, техниче- ского обслуживания, ремонтов, хранения и транспортирования. Основными показателями надежности являются: - коэффициент готовности Г К - определяет вероятность работоспособ- ности объекта в произвольный момент времени; - коэффициент простоя П К - определяет вероятность того, что объект окажется в неработоспособном состоянии в произвольный момент времени. К основным показателям качества обслуживания сети относятся такие показатели как, доступность, бесперебойность, качество передачи, надеж- ность, качество обслуживания. Доступность включает расчет следующих па- раметров: - суммарные потери в пределах сети; - суммарные потери при выходе на сеть общего пользования; - доля состоявшихся разговоров (эффективные попытки); - среднее время установления соединения; - обобщающие оценки доступности к сетевым ресурсам по результатам опроса потребителей услуг.
11 Бесперебойность включает: - расчет вероятности прерывания установленного соединения; - обобщающие оценки бесперебойного обслуживания по результатам опроса потребителей услуг; - потери при «handoff» и др. Качество передачи характеризуется: - расчетными обобщающими оценками качества передачи информации по результатам опроса потребителей услуг; - разборчивостью речи; - расчетным коэффициентом ошибок, например, в цифровых каналах связи. Надежность характеризуется коэффициентом готовности и простоя, а также средним временем восстановления. Качество обслуживания характеризуется: - процентом жалоб, устраненных в контрольные сроки; - максимальным временем рассмотрения жалоб абонентов на качество предоставляемых услуг; - обобщающими оценками качества обслуживания по результатам опро- са потребителей услуг связи. Перечисленные показатели качества в равной степени относятся и к ор- ганизации радиотелефонной связи. В таблице 1 приведены факторы, влияющие на качество предоставляе- мых услуг (7, 10, 25, ITU-T Рек.Е.800). Из приведенной таблицы видно, что возможность пользоваться услуга- ми, предоставляемыми телекоммуникационной сетями, зависит от состояния готовности всех элементов сети. Состояние готовности, в свою очередь, н е- посредственно зависит от надежности элементов сети, проведения своевре- менного технического обслуживания и, наконец, материальным обеспечени- ем техобслуживания. Что касается технического обслуживания, то в большей степени свое- временность и качество его проведения зависит от профессиональной подго- товленности обслуживающего персонала. Можно представить, что будет, ес- ли к обслуживанию современных цифровых систем коммутации с программ- ным управлением допустить человека не прошедшего специального обуче- ния. Одно нажатие кнопки на клавиатуре, подключенной к системному блоку администрирования, может привести порой к необратимым последствиям, вплоть до выхода из строя процессора, содержащего, например, алгоритмы всех программ, обслуживающих вызовы. Или стиранию записей о тарифика- ции и т.д . Подобные ситуации в литературе описываются как ошибка кон- троля III рода. Особое внимание на практике эксплуатации цифровых систем коммута- ции заслуживает процесс организации маршрутизации вызовов, создание альтернативных маршрутов, описание алгоритма сигнализации, составление таблиц маршрутизации и коммутации.
12 С целью обеспечения оптимального функционирования сети связи и со- вершенствования процесса управления необходимо разрабатывать мероприя- тия по повышению эффективности работы системы оперативного управле- ния. К таким мероприятиям относятся рассмотрение инновационных, творче- ских разработок работников, внедрение новых технологий и программного обеспечения, осуществление обратной связи с потребителем и др. Для своевременного предупреждения возможности появления отказа или ухудшения функционирования объекта связи рекомендуется проведение дополнительных профилактических работ. Профилактические работы необ- ходимо проводить не только на основном оборудовании, но и обязательно на резервном. Резервное оборудование должно находиться в состоянии посто- янной готовности. Таблица 1. Факторы, влияющие на качество предоставляемых услуг. Для уменьшения времени простоя доступа к сети связи существует не- обходимость не только в оперативном устранении повреждения, но и в ох- ранно-предупредительных мероприятиях. Здесь следует уделить особое внимание уровню профессионализма обслуживающего персонала (ошибка контроля III рода). Большое значение для работников предприятий связи имеет проведение профессионального обучения, курсов повышения квали- фикации, технической учебы с применением наглядных пособий, макетов, проведение тренировок и имитаций повреждений с использованием свобод- ного оборудования. Разработано достаточное количество нормативных до-
13 кументов по правилу применения и эксплуатации современных средств связи [19, 20, 21, 29, 35]. Согласно нормативным документам [3, 4, 23] по надежности известны следующие методы ее определения: 1. Расчетный метод – метод, основанный на вычислении показателей на- дежности по справочным данным о надежности компонентов и комплек- тующих элементов объекта, по данным о надежности объектов-аналогов, по данным о свойствах материалов и др. информации. Расчетный метод применяется, как правило, на стадиях технического предложения, эскизного и технического проектов. Расчет проводится: - для вычисления оценки принципиальной возможности обеспечения за- данных или желательных требований по надежности; - для выбора варианта схемно-конструктивного построения, или, приме- нительно к телекоммуникационным сетям, выбора построения структуры (топологии) сети; - для выявления наименее надежных составных частей или опять же применительно к телекоммуникационным сетям, выявление наименее на- дежных участков сети, на которых, например, ожидается перегрузка или предполагается развитие общей инфраструктуры, что также неизбежно при- ведет к потребности увеличения пропускной способности; - для разработки мероприятий по выполнению «Программы обеспечения надежности» (ПОНр) (ГОСТ В20.39 .302). 2. Расчетно – экспериментальный метод – метод, при котором показате- ли надежности всех или некоторых составных частей объекта определяют по результатам испытаний или эксплуатации, а показатели надежности объекта в целом рассчитывают по математической модели. Расчетно-экспериментальным методом пользуются для оценки ком- плексных показателей надежности объекта, в нашем случае сети, испыты- ваемой в целом или по частям в случаях, когда применение эксперименталь- ного метода невозможно или нецелесообразно. Испытания на надежность вновь разрабатываемой или модернизируе- мой сети или ее отдельных элементов или ее отдельной части, например, корпоративной сети передачи данных, относятся к периодическим и типовым испытаниям. 3. Экспериментальный метод – метод, основанный на статистической обработке данных, получаемых при испытаниях или эксплуатации объекта в целом. Определительные испытания на надежность – испытания, проводимые для определения показателей надежности с заданной точностью и достовер- ностью. Об уровне надежности принято судить по способностям объекта безот- казно работать в течении заданного времени в определенных условиях. По- этому для оценки надежности и оценки степени соответствия объекта, предъ-
14 являемым к нему требованиям осуществляют технический контроль. Полу- ченная при этом информация о качестве работы объекта, в данном случае те- лекоммуникационной сети, и о причинах ее отказов совместно с данными эксплуатации позволяет принять своевременные меры по совершенствова- нию ее структуры. В таблице 2 приведены рекомендуемые методы испытаний [24] обору- дования телекоммуникационных сетей. Таблица 2. Методы испытаний. Методы испытаний Автоматические (объективные) Ручные (субъективные) Возможность постоянного контроля Наличие минимального числа обо- рудования Использование большого объ- ема выборки (контроль всех вызовов) Определение неисправностей, об- наружение которых невозможно при автоматическом контроле Автоматическая обработка данных Распределение отказов по видам предоставляемых услуг Устранение ошибок по вине обслуживающего персонала Совмещение различных методов определения надежности могло бы дать возможность получить более достоверные показатели надежности, поскольку при их расчете учитывалось бы совокупность определяющих факторов. Но при этом вопрос, каким методом и какого рода информацию желательно по- лучить для определения различных показателей остается открытым. При оценке показателей надежности все отказы, фиксируемые системой контроля технического состояния, предлагается разделять на отказы, которые необходимо фиксировать в бланках отчетов для последующей обработки и отказы, вызванные воздействием внешних факторов, нарушением обслужи- вающим персоналом инструкции по эксплуатации. Отказы, устраняемые в процессе доработок, эффективность которых очевидна или подтверждена экспериментально при дальнейших испытаниях на надежность и не влияющие на оцениваемый при испытаниях показатель надежности, в настоящее время не учитываются и таким образом, нет воз- можности выявить реальное воздействие на объект отказов определенного вида.
15 1.3. Виды контроля технического состояния сетевого элемента Надежность и качество функционирования телекоммуникационных се- тей и систем существенно зависят от системы контроля и диагностики их технического состояния. Главной функцией системы контроля и диагностики является обнаружение и локализация отказов сетевых элементов. Сущность системы контроля и диагностики технического состояния сводится к выполнению двух основных этапов. На первом этапе необходимо получение информации о фактическом со- стоянии объекта технического контроля, о признаках и показателях его свойств. На втором этапе необходимо сопоставить информацию, полученную на первом этапе, с заранее установленными требованиями, нормами и крите- риями. Виды технического контроля классифицируются по определенному при- знаку. Таким признаком может служить полнота контроля и влияние системы контроля на контролируемый объект. По признаку влияния на контролируемый объект контроль делится на разрушающее влияние и неразрушающее. Известно, что системы контроля, предназначенные для сложных систем, зачастую сами представляют собой сложные системы, требующие обоснова- ния их надежности. Ухудшение надежности и качества функционирования системы контроля технического состояния может привести к резкому ухуд- шению качества функционирования телекоммуникационной сети в целом или отдельной ее части. Поэтому проблема контроля привлекает к себе вни- мание разработчиков таких сетей. При организации системы контроля и мониторинга следует отметить, что контролируемый сетевой элемент может быть как одиночным, так и ре- зервированным. Это зависит от важности выполняемых сетевым элементом функций. В свою очередь резерв может выполнять функции основного сете- вого элемента (работать в «горячем» режиме – Hot Standby) или не выпол- нять этих функций до определенного момента (работать в холодном режиме – Cold Standby). Существует несколько способов резервирования. Основны- ми способами являются: - дублирование; - скользящее резервирование по принципу « », при этом если m со- ставляет необходимое количество однотипных модулей, то устанавливается не менее, чем « ». Дополнительный модуль служит резервом для всей группы; - функциональное резервирование, когда в случае выхода из строя одно- го из группы однотипных модулей, его нагрузку берут на себя другие. Резервный элемент, как и основной, может быть восстанавливаемым и невосстанавливаемым. Под восстановлением понимается не только ремонт
16 той или иной части сетевого элемента, но и полная его замена. Восстановле- ние также является ограниченным или неограниченным. Ограниченным восстановление является тогда, когда в любой момент времени восстанавливаться может только ограниченное число отказавших элементов. Если в любой момент времени может восстанавливаться любое число сетевых элементов, то восстановление является неограниченным. При выполнении функции обнаружения отказов и поиска отказавших элементов работоспособность средств контроля может быть нарушена. Это, в свою очередь, может привести к ошибкам контроля I и II рода. Рассмотрим случаи, приводящие к ошибкам контроля при двух видах системы контроля: непрерывном и периодическом. При непрерывном контроле отказ обнаруживается одновременно с его возникновением, т.е . при непрерывном контроле проверка работоспособно- сти совмещена с функционированием элемента сети. После обнаружения и локализации отказа сетевой элемент отправляется на восстановление. При периодическом контроле отказ обнаруживается во время проведе- ния периодической проверки. Период проверки устанавливается согласно существующим нормам проверки технического состояния объекта в целом. Считаем, что контролируемый сетевой элемент в момент проверки мо- жет находиться в двух состояниях, а именно: работоспособном и неработо- способном. 1. Периодический контроль. 1.1. Контролируемый сетевой элемент работоспособен, но система кон- троля ложно обнаруживает отказ. Причин такой ситуации может быть несколько. Назовем некоторые из них: а) отказ оборудования системы периодического контроля; б) несовершенные методы контроля; в) сбой в работе программного обеспечения сети при проведении про- верки. Прямые методы диагностики, основанные на логических методах, мо- гут привести к вероятности ошибок контроля I рода от 0,001 до 0,01. 1.2. Контролируемый сетевой элемент неработоспособен, т.е . имеет ме- сто отказавший элемент. В этом случае может иметь место ошибка контроля II рода, если во время проведения проверки неработоспособное состояние сетевого элемента не было обнаружено. Причины такой ситуации могут быть следующие: а) ограниченная полнота контроля, т.е . не все отказы выявляются про- веряющим тестом. Это возможно из-за ограниченного времени одной про- верки; б) отказ оборудования системы контроля или той его части, которая включена в контур контроля во время проверки.
17 2. Непрерывный контроль. 2.1. Контролируемый сетевой элемент работоспособен. Система непре- рывного контроля ложно обнаруживает отказ. Причины ложного обнаружения отказа могут быть следующие: а) сбой в работе программного обеспечения сетевого элемента. Это может быть вызвано как внутренними причинами (старение элементов, не- стабильность источников питания и т.д.), так и внешними помехами. Напри- мер, сбоем в работе системы контроля. 2.2. Контролируемый сетевой элемент неработоспособен, т.е . имеется отказавший элемент. Система непрерывного контроля отказ не обнаружива- ет. Такая ситуация может быть вызвана тем, что не обеспечивается доста- точная глубина контроля. Если ошибки системы непрерывного и периодического контроля вы- званы отказом оборудования самой системы контроля, то контролируемый сетевой элемент может находиться в неработоспособном состоянии неопре- деленное время. Ошибки контроля I и II рода различно влияют на надежность контро- лируемого объекта. В связи с этим отметим некоторые особенности: - ошибки непрерывного и периодического контроля I рода характери- зуются интенсивностью и условной вероятностью того, что сетевой элемент попадет на восстановление в работоспособном состоянии; - ошибки непрерывного и периодического контроля II рода характери- зуются условной вероятностью того, что сетевой элемент, находясь в нерабо- тоспособном состоянии, не будет исключен из эксплуатации. На практике также известны случаи, когда при проведении контроля технического состояния работоспособность сетевого элемента была наруше- на (ошибка периодического контроля III рода). Возникший при этом отказ может быть выявлен только при очередных периодических проверках. Ошибки восстановления (неполнота восстановления) характеризуется вероятностью того, что после окончания восстановления сетевой элемент ос- тается в неработоспособном состоянии и включается в режим эксплуатации. Таким образом, недостоверность системы контроля технического со- стояния снижает надежность и затрудняет процесс эксплуатации сетевого элемента или сети в целом. Поэтому влияние ошибок контроля на надеж- ность и качество обслуживания вызовов необходимо учитывать при разра- ботке и эксплуатации как сети в целом, так и самой системы контроля. В таблице 3 приведена ориентировочная оценка факторов, обуславли- вающих ошибки контроля.
18 Таблица 3. Ориентировочная оценка ошибок контроля. Вид контроля Ошибки контроля I рода Ошибки контроля II рода Периодический Весьма малая вероятность при поиске прямыми мето- дами. Для логических мето- дов поиска вероятность от 0,001 до 0,1 Вероятность 0,1 – 0,3 из- за неполноты контроля. Интенсивность из-за от- каза системы контроля 0 5,0   П П а  Непрерывный Весьма малая интенсивность при поиске прямыми мето- дами. Интенсивность при поиске логическими мето- дами составляет: 0 ) 5,0 1 )(1,0 001 , 0(   Н Н а    . Интенсивность при поиске средствами непрерывного контроля: 0 5,0   Н Н а  Для коммутационного оборудования и синхрон- но работающих СЭ: 0 ) 5,0 1(   Н Н Н а В   , где Н В =0,1 – 0,2 – коэффи- циент полноты контроля. Для автономно прове- ряемых СЭ: 0 5,0   Н Н а  В процессе обслу- живания вызовов Весьма малая вероятность при поиске прямыми мето- дами. Для логических мето- дов поиска вероятность со- ставляет: 0,001-0,1 Высокая вероятность (0,1-0,3) из-за неполноты контроля с учетом на- грузки Профилактический То же, что и при периодиче- ском контроле с учетом на- грузки. То же, что и при перио- дическом контроле с уче- том нагрузки. Статистический Вероятность 0,001-0,01 Вероятность 0,001-0,01 В таблице приняты следующие обозначения: 0  - интенсивность отка- зов контролируемого оборудования; П а - доля оборудования системы кон- троля от контролируемого оборудования; 0,5 - коэффициент, учитывающий возможность несрабатывания системы периодического контроля при нали- чии отказа в основном оборудовании; Н а - доля оборудования системы встроенного контроля от основного оборудования ( 1,0  Н а ). В процессе эксплуатации телекоммуникационной сети состояние сете- вых элементов в любой момент времени характеризуется сочетание фазы эксплуатации и состоянием безотказности. Краткая характеристика этих со- стояний следующая: 1) сетевой элемент функционирует и работоспособен – состояние характеризуется нормальной работой сетевого элемента; 2) сетевой элемент функционирует и неработоспособен – имеет ме- сто необнаруженный отказ, т.е . после отказа сетевой элемент продолжает на- ходиться в рабочей конфигурации незаблокированным;
19 3) сетевой элемент проверяется (тестируется) системой периодиче- ского контроля, но при этом он может находиться как в работоспособном, так и в неработоспособном состоянии; 4) состояние неработоспособного сетевого элемента, заблокирован- ного системой контроля и диагностики. Состояние необнаруженного отказа оказывается возможным из-за того, что не все отказы обнаруживаются системой непрерывного контроля. Время нахождения в этом состоянии равно промежутку времени от момента воз- никновения отказа, до очередной периодической проверки. Рассмотренные особенности функционирования сетевого элемента взя- ты за основу для составления математической модели и разработке метода расчета параметров надежности с учетом реальных данных систем монито- ринга и управления телекоммуникационным сетями. 2. Разработка математической модели функционирования сетевых элементов с учетом особенностей системы контроля и управления. При организации системы контроля и управления необходимо соблю- дать основные принципы ее построения в соответствии с ее основным назна- чением. Организация управления сетью включает в себя [14]: - сбор контрольной информации о состоянии элементов сети; - анализ качественных характеристик работы сети на предмет их со- ответствия пользовательским требованиям; - выработку управляющего решения; - доведение этого решения через технические средства реализации управляющих решений до элементов сети. В разделе разработана математическая модель функционирования эле- мента телекоммуникационных сетей и систем (сетевого элемента) с учетом характеристик самой системы контроля, диагностики и управления. Исследо- ваны показатели надежности функционирования сети в условиях достовер- ной и недостоверной системы комбинированного контроля. Проведение контроля технического состояния сетевых элементов и се- ти в целом, т.е . мониторинг сети, является необходимым условием обеспече- ния надежности ее функционирования. Показатели надежности сетевого эле- мента телекоммуникационной системы зависят от характеристик не только самого сетевого элемента, условий его функционирования, соблюдений всех правил и норм эксплуатации, но и достоверности результатов, полученных при работе системы контроля технического состояния, а также выбора мето- да обработки этих результатов и целей эксплуатации. Однако, система кон- троля в большинстве случаев представляет собой сложную систему, также требующую обоснования ее надежности.
20 Поэтому актуальной представляется задача, связанная с расчетом пока- зателей надежности сетевого элемента в процессе его функционирования и определение влияния характеристик системы контроля на эти показатели. 2.1. Разработка математической модели функционирования сете- вого элемента при достоверной комбинированной системе контроля и управления. В соответствии с информацией, изложенной в первом разделе, при со- ставлении математической модели функционирования сетевого элемента и дальнейших расчетах показателей надежности учитываются следующие фак- торы: – виды отказов и виды контролируемого объекта с точки зрения обна- ружения и локализации отказов при различных видах контроля; – множество возможных отказов сетевого элемента разделено на два ви- да: а) отказы, обнаруживаемые непрерывным контролем б) отказы, приводящие к продолжительному неработоспособному со- стоянию; – интенсивность отказов сетевого элемента приведена в соответствии с принятыми обозначениями видов отказов; – сочетание разных видов отказов, обнаруживаемых средствами систе- мы технического контроля; – глубина контроля; – периодичность контроля; – использование систем контроля совместно с другими способами обес- печения надежности (резервирование и т.п.); – время проведения периодического контроля неработоспособного и ра- ботоспособного сетевого элемента. Рассмотрим сетевой элемент, процесс функционирования которого за- ключается в смене трех фаз эксплуатации: сетевой элемент используется по назначению; сетевой элемент проверяется (тестируется) и сетевой элемент восстанавливается (рисунок 2.1 .) . Рисунок 2.1. Фазы эксплуатации Введем следующие обозначения: W – множество возможных отказов сетевого элемента;
21 Wн – множество отказов сетевого элемента, обнаруживаемых непре- рывным контролем; Wп - множество отказов сетевого элемента, не обнаруживаемых непре- рывным контролем; очевидно, что W= Wн + Wп. Следует отметить, что отказы вида Wп приводят к достаточно продол- жительному неработоспособному состоянию. Это состояние фиксируется системой периодического контроля. Отметим особенности сетевого элемента, охваченного достоверным комбинированным контролем: 1) сетевой элемент находится в постоянном использовании по назначе- нию; 2) отказы вида Wн обнаруживаются непрерывным контролем, а отказы вида Wп - периодическим контролем; 3) отказы вида Wн совместны с отказами вида Wп, т.е . один из них мо- жет произойти при наличии другого; 4) после обнаружения и локализации отказа сетевой элемент блокиру- ется и поступает на восстановление; 5) время между случайными событиями распределено по экспоненци- альному закону. Граф состояний сетевого элемента при достоверной комбинированной системе контроля и управления приведен на рисунке 2.2 . Рисунок 2.2 . Граф состояний сетевого элемента при достоверной системе контроля. Все состояния графа пронумерованы и имеют обозначения: Р – работоспособное состояние сетевого элемента; ПР и ПН - проводится периодическая проверка работоспособного и не- работоспособного сетевого элемента; Н - неработоспособное состояние в результате отказа вида Wн; В – состояние восстановления. Переходы между состояниями графа также имеют обозначения:
22 0 – интенсивность отказов; н – интенсивность отказов вида Wн; п - интенсивность отказов сетевого элемента вида Wп; в – интенсивность восстановления сетевого элемента;  - интенсивность проведения периодического контроля; п - интенсивность завершения периодического контроля. Для вывода формул для расчета показателей надежности сетевого эле- мента воспользуемся методом анализа вероятностных систем, предложенным в работе [16, 17]. Для этого составим матрицу интенсивностей Н (таблица 4) и матрицу вероятностей прохождений Р на множестве состояний W, где 0 = н + п (таблица 5). Согласно матричному методу все множество состояний разбиваем на два подмножества: U и V, где: U - множество состояний, в которых сетевой элемент используется по назначению или осуществляется периодическая проверка его работоспособ- ности; V – множество состояний восстановления. Кроме этого, выделим входные и выходные подмножества этих мно- жеств:U={1,2,3,4};U+ = {1}; U- = {1,2,4};V+ =V - =V={5}. Таблица 4. Матрица интенсивностей. 5 4 3 2 1 0 0 0 0 0 0 0 0 0 0 ) ( 0 0 ) ( 5 4 3 2 1 0 В В П П П П Н Н Н П Н                        Таблица 5. Матрица вероятностей прохождений. (3.2) 5 4 3 2 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 5 4 3 2 1 0 0 0                      Н Н Н Н П Р
23 Пунктирной линией показано разбиение матрицы Р на подматрицы ве- роятностей прохождений РUU и PVV внутри множеств U и V, а также подмат- рицы вероятностей прохождений между этими подмножествами РUV и PVU. Матрица условных времен нахождения в состояниях при однократном попадании в них является диагональной. Ее диагональными элементами я в- ляются: Q11=1/(0 + ); Q22 = 1/(н + ); Q33=Q44=1/п; Q55=1/в. Поскольку входное подмножество U + состоит из одного состояния, то относительные частоты состояний множества U в стационарном режиме яв- ляются элементами первой строки матрицы относительных частот. Усечен- ная матрица относительных частот вычисляется по формуле: nu=||nu(j)||, где j – номер состояний, определенных на рисунке 2.2 . Строка средних значений времени нахождения в состояниях множеств U и V вычисляется по формуле: tu=||tu(j)||, где j – номер состояния, определенного в таблице 5. С помощью этих промежуточных характеристик получены формулы для вычисления показателей надежности сетевого элемента, охваченного досто- верным комбинированным контролем (таблица 6). К ним относятся: - среднее время безотказной работы; - среднее время необнаруженного отказа; - условный коэффициент готовности; - условный коэффициент простоя; - среднее число проверок, приходящееся на одно восстановление. Для удобства пользования формулами использованы относительные па- раметры: 0 /   Н Н , 0 /   П П , 0 /   В В , 0 /    , где: - Н иП  имеют смысл доли отказов сетевого элемента, обнаруживаемых соответственно непрерывным контролем и доли отказов сетевого элемента, приводящих к продолжительному неработоспособному состоянию; - 0  - интенсивность отказов сетевого элемента; - В и   - показывают, во сколько раз соответствующая интенсивность пре- вышает интенсивность отказов сетевого элемента.
24 Полученные формулы дают возможность определить среднее время без- отказной работы и среднее время необнаруженного отказа с учетом времени проверки технического состояния (тестирования). Также, с учетом времени проверки работоспособности определяются ко- эффициенты простоя и условные коэффициенты готовности и простоя. Формула для определения среднего числа проверок (тестов), приходя- щихся на одно восстановление, дает возможность корректировать число про- верок (тестов) непосредственно при эксплуатации системы таким образом, чтобы время нахождения контролируемого объекта в состоянии проверки было минимальным. И в то же время, изменение числа проверок не отража- лось на качестве обслуживания вызовов. Таблица 6. Формулы для расчета показатели надежности при достовер- ной системе контроля. Наименование показателей надежности Формулы для расчета показателей при достоверном комбинированном контроле Среднее время безотказной работы 0 1   P t Среднее время необнаружен- ного отказа        Н П н t 0 1 Условный коэффициент го- товности       1 Н ГУ К Условный коэффициент про- стоя     1 П ПУ К Коэффициент простоя ) 1(              В Н Н П Н П К Среднее число проверок, приходящееся на одно вос- становление.        Н П n 1
25 2.2. Исследование влияния ошибок системы контроля и управления на показатели надежности контролируемых объектов. Как было сказано ранее, показатели надежности сетевого элемента теле- коммуникационной системы зависят от характеристик надежности не только самого сетевого элемента, но и системы контроля и управления. Объем аппаратных средств контроля в отдельных случаях может состав- лять от 5 до 20% от основного оборудования телекоммуникационных сетей и систем, а объем программных средств может составлять от 50 до 60% [17]. Ухудшение надежности и качества функционирования системы контроля и управления может привести к резкому ухудшению качества функционирова- ния сетевых элементов и телекоммуникационных сетей в целом. Поэтому, проблема контроля привлекает к себе внимание эксплуатационных служб, разработчиков, исследователей в области телекоммуникаций. Далее приведены результаты, полученные в ходе проведенных исследо- ваний о влиянии характеристик системы контроля и управления на показате- ли надежности сетевых элементов. На рисунке 2.3 . приведен граф возможных состояний сетевого элемента при недостоверном комбинированном контроле. Недостоверность системы контроля и управления характеризуется наличием ошибок I, II, III рода. Кроме того, учитывается и такой параметр как неполнота восстановле- ния, который характеризуется вероятностью того, что после окончания вос- становления сетевой элемент остается в неработоспособном состоянии и включается в рабочую конфигурацию. Все состояния графа пронумерованы идентично графу на рисунке 2.2. и имеют дополнительные обозначения: Р2 - работоспособное состояние сетевого элемента, при котором имеет место отказ системы непрерывного контроля, приводящий к ошибке II рода; НН - неработоспособное состояние сетевого элемента в результате ошиб- ки непрерывного контроля II рода; НП2 - неработоспособное состояние сетевого элемента, обнаруживаемое только периодическим контролем при наличии ошибки непрерывного кон- троля II рода; НПН - неработоспособное состояние сетевого элемента, обнаруживаемое периодическим контролем при наличии отказа, обнаруживаемого непрерыв- ным контролем; ПР, ПР2, ПНП2, ПНН, ПНПН, ПНП – состояния в которых проводится пе- риодическая проверка работоспособного и неработоспособного сетевого элемента.
26 Рисунок 2.3. Граф состояний сетевого элемента в условиях недостовер- ного комбинированного контроля. Переходы между состояниями характеризуются следующими парамет- рами: -  и - вероятности ошибок контроля I и II рода соответственно; - 2 - интенсивность отказов непрерывного контроля, приводящих к ошибке II рода; - 1 - интенсивность отказов сетевого элемента, приводящих к ошибке контроля I рода. Переходы между состояниями, показанными на графе рисунка 2.3, обу- словлены следующими причинами: - наличием отказа сетевого элемента, обнаруживаемого непрерывным контролем; - наличием отказа сетевого элемента, приводящего к продолжительному неработоспособному состоянию. Это состояние фиксируется периодическим контролем; - наличием ошибки непрерывного контроля II рода, при условии, что имеет место отказ, обнаруживаемый этим видом контроля; - наличием ошибки периодического контроля II рода, при условии, что имеет место отказ, приводящий к продолжительному неработоспособному состоянию;
27 - наличием ошибки I рода как непрерывного, так и периодического ви- дов контроля. Для нахождения расчетных формул был также использован метод ана- лиза вероятностных систем [16, 17]. В данном случае приведен только ко- нечный результат без вывода. Для удобства вычислений все множество состояний разбито на три подмножества: U1= {1, 4, 7, 9}; U2 = {2, 5, 8, 10, 9}; U3 = {3, 6, 11, 12}. Тогда значение среднего времени нахождения сетевого элемента в ра- ботоспособном состоянии состоит из tp1, tp2 - значений средних времен нахо- ждения в состояниях 1 и 2. Значение среднего времени нахождения сетевого элемента в неработоспособном и незаблокированном состоянии tп можно оп- ределить в виде суммы 3-х составляющих tп1, tп2, tп3, каждая из которых пред- ставляет собой значение среднего времени нахождения сетевого элемента в подмножествах U1, U2, U3. Аналогично среднее число проверок, приходящееся на одно восстанов- ление nп, состоит из суммы 3-х составляющих nп1, nп2, nп3, каждая из которых представляет собой среднее число проверок в подмножествах U1, U2, U3 со- ответственно. В соответствии с принятыми обозначениями: o р1 aω 1 t ; (1) p1 2 p2 t b ω t ; (2) o н н1 dcω ω t ; (3) н1 2 н2 t b ω t ; (4)     o н н 2 н3 acdω β 1 γ β) (1 γ2 1 ω с β 1 γ ω b ω t       ; (5)   ac β 1 γ γ nп1    ; (6) п1 2 п2 n b ω n ; (7)      o п н 2 п3 acdω β 1 γ β 1 γ2 1 ω с β 1 γ ω b ω n       ; (8) где γ α ω 1 a 2   ; γ α 1 b  ; β 1 γ ω c н    ; β 1 γ ω dп    . Относительный параметр о 2 2 ω ω ω показывает, во сколько раз интенсив- ность ошибок непрерывного контроля превышает интенсивность отказов се- тевого элемента. Формулы для расчета показателей надежности сетевого элемента при недостоверном комбинированном контроле приведены в таблице 7. Заметим,
28 что отношение значения среднего времени безотказной работы при недосто- верном контроле к такому же времени при достоверном контроле равно: )γα 1/(1 /t tд p н p   . (9) Таблица 7. Показатели надежности при недостоверном комбинированном контроле. Наименование показателей на- дежности Формулы расчета при недосто- верном комбинированном контроле Среднее время безотказной работы 2 1 Р Р Р t t t   Среднее время необнаруженного от- каза 3 2 1 Н Н Н Н t t t t    Условный коэффициент готовности Р Н Р ГУ t t t K   Условный коэффициент простоя Р Н Н ПУ t t t K   Коэффициент простоя  1    Р Н Н П t t t K Среднее число проверок, приходя- щееся на одно восстановление 3 2 1 П П П n n n n    Таким образом, разработана обобщенная математическая модель, позво- ляющая проводить исследования в области влияния ошибок системы контро- ля и управления на показатели надежности контролируемых объектов. В полученных формулах отражены аналитические зависимости, связы- вающие показатели надежности сетевого элемента и параметры системы контроля в условиях, когда все возможные отказы, обозначенные в соответ- ствии с видами контроля их обнаруживающими, совместны и независимы. Разработанная обобщенная математическая модель позволяет учесть: - продолжительность проведения периодического контроля работоспо- собного и неработоспособного сетевого элемента; - среднее число проверок, приходящееся на одно восстановление; - влияние ошибки непрерывного контроля в условиях, когда отказ сис- темы непрерывного контроля произошел перед отказом сетевого элемента, обнаруживаемым этой системой контроля; - влияние отказов сетевого элемента, разделенных по видам контроля их обнаруживающим.
29 Полученные аналитические зависимости позволяют определить значе- ния показателей надежности с учетом всех перечисленных выше факторов. Подобные исследования проводились в работах [28, 27]. Были также по- лучены формулы для расчета коэффициента готовности и простоя. Однако, особенностью графа состояний, показанного на рисунке 2.3, является то, что при его составлении выделено каждое новое состояние сетевого элемента, образующееся в процессе его функционирования. Использование полученных формул дает возможность более точно про- следить связь показателей надежности с обусловливающими их причинами. На рисунке 2.4 . приведены графики зависимости коэффициента простоя от доли интенсивности отказов сетевого элемента, обнаруживаемых непре- рывным контролем, при разных значениях доли интенсивности ошибок не- прерывного контроля II рода 2 . Рисунок 2.4 . График зависимости коэффициента простоя КП от доли отказов сетевого элемента Пунктиром обозначена зависимость коэффициента простоя, рассчитан- ного по известным формулам [28]. Анализ полученных результатов показы- вает, что значение коэффициента простоя, рассчитанного по формуле из таб- лицы 7, в 10 раз превышает значение коэффициента простоя, рассчитанного по известной формуле. В процессе проведенных исследований была составлена математиче- ская модель функционирования сетевого элемента и показано, что наличие ошибок непрерывного контроля II рода приводит к трем ранее не исследо- ванным состояниям с необнаруженным отказом, что увеличивает среднее время нахождения сетевого элемента в неработоспособном состоянии. Получены аналитические зависимости, связывающие показатели на- дежности функционального блока и параметры системы контроля. Они от-
30 ражены в формулах, позволяющих уточнить значения показателей надежно- сти сетевого элемента в условиях, когда: - отказ системы непрерывного контроля произошел перед отказом кон- тролируемого функционального блока, обнаруживаемого этим видом ко н- троля; - все возможные отказы контролируемого сетевого элемента, обозна- ченные в соответствие с видами контроля их обнаруживающими, совместны и независимы. Анализ полученных показателей надежности показывает, что при ма- лых значениях общей интенсивности отказов, зависимость значения коэффи- циента простоя от интенсивности отказов системы непрерывного контроля незначительна. Однако, при увеличении общей интенсивности отказов, зави- симость коэффициента простоя от величины интенсивности отказов системы непрерывного контроля значительно возрастает, при общей тенденции к уменьшению с увеличением доли отказов сетевого элемента, обнаруживае- мых системой непрерывного контроля. Также, наличие ошибок непрерывно- го контроля и периодического контроля I рода приводит к уменьшению среднего времени работоспособного состояния сетевого элемента. 3. Разработка метода расчета показателей надежности сетевого эле- мента на основе данных системы контроля и управления При расчете основных показателей надежности значения исходных ха- рактеристик (исходных данных) считаются заранее известными, идеально надежными или рассчитываются по справочной литературе. При таких до- пущениях не учитываются процессы отказов и восстановлений, что, в свою очередь, не позволяет исследовать взаимовлияние надежности элементов се- ти и управления. При различных видах обслуживания телекоммуникацион- ной сети в целом основными источниками сведений о работоспособности технических средств систем коммутации и других элементов сети являются сообщения, поступающие от средств автоматического контроля техническо- го состояния или непосредственно от пользователей сети. Однако, как уже говорилось выше, достоверность этих сообщений существенно зависит от характеристик самой системы контроля и управления. Это и определило по- становку задачи в данном разделе. Раздел посвящен определению показателей надежности, к которым от- носятся и ошибки системы контроля и управления, по данным, получаемым в результате сбора и обработки статистической информации в процессе экс- плуатации, технического обслуживания оборудования телекоммуникацион- ных сетей и систем. Задача имеет аналитическое решение, если предполага- ется, что все оборудование телекоммуникационной сети классифицировано на группы однотипных сетевых элементов.
31 В разделе разработана математическая модель непрерывно действующе- го сетевого элемента, отражающая реальный процесс технического обслужи- вания при его эксплуатации. На ее основе даны рекомендации по сбору и обработке данных об ошиб- ках системы контроля и отказах оборудования. Исследовано несколько моде- лей функционирования сетевого элемента, охваченного разными видами кон- троля. Получены формулы для определения эксплуатационных и расчетных показателей надежности. Это позволило определить значения показателей надежности, значения вероятностей попадания в состояния восстановле ния неработоспособных сетевых элементов при различных видах технического контроля с учетом достоверности системы контроля и управления. 3.1. Разработка модели технического обслуживания сетевого эле- мента Эксплуатация и техническое обслуживание телекоммуникационных сис- тем включает в себя все виды работ, выполняемых техническим персоналом. Под эксплуатацией понимается комплекс мероприятий, проводимых по задачам текущего и оперативного управления системой. Мероприятия вы- полняются на нормально функционирующем оборудовании и включают в се- бя работу с абонентскими линиями, управление маршрутизацией, организа- цию измерений, получение данных о тарификации, управление периферий- ными устройствами, а также контроль за общестанционными параметрами. Техническое обслуживание предназначено, прежде всего, для поддер- жания эффективной работы телекоммуникационной системы. И в задачи технического обслуживания входят своевременное обнаружение возникших неисправностей и сбоев в работе системы, их локализация, проведение за- щитных мероприятий, предотвращающих распространение неисправностей на другие функциональные блоки. При современных системах мониторинга сети сбор статистических дан- ных не представляет никакой сложности. По этим данным можно легко вы- числить такие показатели, как интенсивность поступления вызовов, интен- сивность обслуженных вызовов, интенсивность отказов в обслуживании и многих других, позволяющих оценить не только качество работы сети, но использовать эти данные для совершенствования системы управления отно- шениями с клиентами. Однако, повысить эту оценку без детального рассмот- рения работы отдельных элементов сети невозможно. Для решения задачи определения показателей надежности по данным системы контроля и управления с учетом надежности последней, первона- чально все характеристики надежности были классифицированы на два типа: исходные и эксплуатационные. В таблице 8 представлены типы показателей надежности, а также фор- мулы для вычисления их точечных оценок. Плюсом отмечена принадлеж- ность характеристик к исходным или эксплуатационным показателям.
32 В таблице приняты следующие обозначения: ТИ - суммарное время использования сетевого элемента по назначению; ТП - суммарное время проведения периодической проверки; ТВ - суммарное время восстановления; N - суммарное число проведенных периодических проверок; NВ - суммарное число восстановления; NН , NП, NНП - число восстановления с отказом вида WН, вида WП и число восстановления с двумя видами отказов одновременно, соответственно; NР - число восстановлений работоспособного оборудования. На восста- новление работоспособное оборудование попадает вследствие ошибки кон- троля I рода. Таблица 8. Типы показателей надежности. Наименование Обозначе- ние Исход- ные Эксплуа- тацион- ные Формулы расчета Интенсивность отка- зов + Интенсивность вос- становления + + Интенсивность прове- дения периодической проверки (тестирова- ние) γ + + Интенсивность за- вершения периодиче- ской проверки + + Вероятность ошибки периодич. контроля I рода α + Вероятность ошибки периодич. контроля II рода β + Среднее число прове- рок + Вероятности попадания в состояния восстановления ВН РН + ВП РП + ВР РР + ВНП РНП +
33 Для определения показателей надежности составлена математическая модель (рисунок 3.1 .), которая отражает реальный процесс технического об- служивания сетевого элемента при его эксплуатации. Это означает, что в эту модель включены только те эксплуатационные процессы, которые фиксиру- ются системой технического контроля и управления. При составлении математической модели были сделаны следующие допущения: - сетевой элемент находится в непрерывном использовании по назна- чению; - сетевой элемент охвачен одновременно непрерывным и периодиче- ским контролем. Таким образом, часть отказов обнаруживается непрерыв- ным контролем (отказы вида WН). Неработоспособное состояние, которое наступает вследствие отказа вида WП фиксируется системой периодического контроля. Здесь также сле- дует отметить, что отказы вида WН и вида WП совместны и независимы; - фиксируется время нахождения каждого устройства в состоянии пе- риодической проверки и оценивается суммарное время проведения периоди- ческих проверок (тестов); - при каждом отказе фиксируется время его обнаружения, время посту- пления отказавшего сетевого элемента на восстановление и время возврата его в рабочую конфигурацию. Таким образом, оценивается суммарное время восстановления; - восстановление отказавшего сетевого элемента заключается в его за- мене на эквивалентное по надежности, работоспособное такого же типа; - при ремонте отказавшего сетевой элемент отмечают несколько типов восстановления, различие между которыми заключается в причинах попада- ния на восстановление объекта контроля: восстановление работоспособного оборудования; восстановление с отказом вида WН , вида WП и с двумя вида- ми отказов одновременно. На рисунке 3.1 обозначены следующие состояния сетевого элемента, на- блюдаемые в процессе его эксплуатации: И - использование по назначению; П - проведение периодической проверки; ВР - восстановление работоспособного сетевой элемента. ВН, ВП, ВНП - восстановление с отказом вида WН, вида WП и восста- новление с двумя видами отказов одновременно. Характеристики переходов между состояниями обозначены через эксплуатационные показатели надеж- ности. Необходимо отметить, что независимо от того, достоверна или нет ис- пользуемая система технического контроля (имеют ли место ошибки контро- ля), полученная модель пригодна для использования при прочих равных ус- ловиях. К этим условиям, прежде всего, относится организация системы кон- троля и управления.
34 Рисунок 3.1 . Модель технического обслуживания 3.2. Разработка метода расчета показателей надежности с учетом данных сетевого мониторинга Для исследований взаимовлияния надежности элементов сети и систе- мы управления сетью составлены две математические модели. Первая математическая модель составлена для дискретного случайного процесса функционирования сети, описываемого графом возможных состоя- ний элемента сети в процессе его эксплуатации. Характер процесса – Мар- ковский. Во второй модели учитываются параметры системы управления и мо- ниторинга сетью наряду с возможностью нарушения выполняемых ею функ- ций. На рисунке 3.2 . показан граф возможных состояний сетевого элемента при наличии ошибок сиcтемы непрерывного и периодического контроля I, II, III рода. При его составлении было сделан ряд допущений: - сетевой элемент находится в непрерывном использовании по назначе- нию; - отказы, обнаруживаемые непрерывным контролем не совместны с от- казами, обнаруживаемыми периодическим контролем; - все события происходят в случайные моменты времени; - время между событиями имеет экспоненциальный закон распределе- ния. Все состояния графа пронумерованы и имеют обозначения идентичные графу, изображенному на рисунке 2.3. Характеристики переходов между состояниями имеют следующие обо- значения:
35  - интенсивность отказа оборудования; В  - интенсивность восстановления;  - вероятность ошибки периодического контроля первого рода;  - вероятность ошибки периодического контроля второго рода; 2  - вероятность ошибки непрерывного контроля второго рода при ус- ловии, что отказ произошел;  - вероятность ошибки контроля третьего рода. Рисунок 3.2 . Граф возможных состояний сетевого элемента Для расчета показателей надежности также использовался метод относи- тельных частот [16] в соответствии с которым, были составлены матрица ин- тенсивностей, матрица вероятностей прохождения и выведены формулы для определения коэффициента простоя П К и среднего времени нахождения в состоянии необнаруженного отказа Нt :     ; ) ( ) 1( ) 1)( ( ( ) 1( 2 2                                        В В П К (9)  . ) ( ) 1( 2                 Н t (10) Очевидно, что П КиН t зависят от вероятностей ошибок периодического контроля   , , и вероятности ошибки непрерывного контроля 2 .Дляих определения по данным системы мониторинга был составлен граф состояний сетевого элемента в процессе его эксплуатации (рисунок 3.3.) . Обозначения на графе идентичны обозначения на рисунке 3.1.
36 Рисунок 3.3 . Граф состояний сетевого элемента в процессе эксплуатации. Характеристики переходов между состояниями обозначены через экс- плуатационные показатели надежности: П НР Р, - вероятность поступления на восстановление с отказом, обнару- живаемым непрерывным и периодическим контролем соответственно; Р Р - вероятность поступления на восстановление работоспособного се- тевого элемента (блокировка из-за программного сбоя; несоответствия на- строек параметров передающей и принимающей стороны по портам и т.п.);  - интенсивность проведения периодической проверки; В  - интенсивность восстановления. Формулы для оценок и расчета этих параметров следующие: ; И T N   (11) ; В В В Т N   (12) В Н Н N N Р ; (13) ; В П П N N Р (14) В Р Р N N Р , (15) Где: И Т - суммарное время использование сетевого элемента по назначению; В Т - суммарное время восстановления; N - суммарное число проведенных периодических проверок; П НN N, - число восстановлений с отказом, обнаруживаемым непрерывным и периодическим контролем соответственно;
37 Р N - число восстановлений работоспособного сетевого элемента. На восста- новление работоспособный сетевой элемент попадает вследствие ошибок контроля первого рода. Путем сопоставления математических моделей, выраженных через гра- фы состояний и показанных на рисунке 3.2 и 3.3 , составлена система уравне- ний (16), в которой эксплуатационные показатели надежности выражаются через вероятности ошибок системы контроля и управления.                                    ) ( )( 1( ) 1( ) ( ) ( ) ( )) 1( ( ) ( ) 1( 2 2 2                                  П П Р Н n Р Р Р (16) В приведенной системе уравнений (16) параметр П n означает общее число проверок, приходящееся на одно восстановление. Сумма вероятностей 1    П Р Н Р Р Р , поэтому одну из этих вероятностей необходимо исключить. Какую вероятность исключать зависит от цели про- водимых исследований, полноты и достоверности данных, имеющихся ста- тистических данных и др. В данном случае для удобства вычислений использовалось соотношение Р Н Р Р и был введен новый параметр    . Обычно   »1. В этом случае сис- тема уравнений (16) будет иметь следующий вид:                           ) ( 1 )( 1( ) 1( ) ( 1 1 ) 1( 1 2 2 2                      П Н Р Н n Р Р Р (17) Неизвестными параметрами в системе уравнений (17) являются     , , , 2 . Система же состоит из трех уравнений. Это значит, что можно найти только три неизвестных. Заметим, что ошибки контроля третьего рода являются незначительными, если допустить, что отказы, вносимые по «вине»
38 периодического контроля, осуществляемого обслуживающим персоналом, обнаруживаются немедленно и с вероятностью ) 1( 2  . Поэтому вполне дос- таточно вычислить вероятность ошибки непрерывного контроля второго рода 2  . Предположим, что 0   . Тогда система уравнений (17) имеет следующее решение (18):                  ) 1( ) 1( ) 1( 2 Р П П Р П Р Р Р n Р Р Р Р Р          (18) Для рассматриваемого случая показателями надежности, характеризую- щими эффективность работы системы контроля и управления, являются ве- роятности ошибок периодического контроля первого, второго рода и вероят- ность ошибки непрерывного контроля второго рода. Для их определения дос- таточно знать вероятность того, что оборудование попало на восстановление вследствие отказа, обнаруживаемого периодическим контролем, и вероятно- сти того, что было заблокировано работоспособное устройство. Такие ситуа- ции являются не редкостью на практике. Особенно таким коллизиям подвер- жено канальное оборудование, когда заблокированным оказывается поток (порт). При более детальной проверке оказывается, что для восстановления достаточно выполнить «Reset» и порт восстанавливается. Полученные аналитические выражения (17, 18) удобны при практиче- ском применении и показывают наличие зависимости между эксплуатацион- ными и расчетными показателями надежности. С их помощью определяются показатели надежности системы контроля и управления, например, ошибка непрерывного контроля второго рода и ошибки первого, второго рода перио- дического контроля. Следует отметить, что число уравнений определяется числом, наблю- даемых системой сетевого мониторинга, характеристик. Большего числа уравнений, чем число наблюдаемых характеристик получить невозможно. Но число искомых характеристик может превышать число наблюдаемых. Отсю- да следует вывод, что каждая задача подобного рода требует индивидуально- го подхода и решения. Например, если бы в рассматриваемом случае возник- ла задача определения качества работы обслуживающего персонала, то пре- небрегать ошибкой непрерывного контроля третьего рода было бы неразум- но. В этом случае, можно было бы предположить, что отсутствует ошибка периодического контроля первого рода )0 (  , и определить   , , 2. В процессе проводимых исследований была составлена программа имитационного моделирования, названная «Программа имитации функцио- нирования телекоммуникационной сети с учетом реальных показателей на-
39 дежности» [36]. Разработанный программный продукт предназначен для по- вышения эффективности работы системы управления сетью связи. Для исследований взаимовлияния надежности элементов сети и систе- мы управления сетью составлены две математические модели. Первая мате- матическая модель составлена для дискретного случайного процесса функ- ционирования сети, описываемого графом возможных состояний элемента сети в процессе его эксплуатации. Характер процесса – Марковский. В нее вошли только те состояния сетевого элемента, которые можно наблюдать в процессе его эксплуатации. К ним относятся состояния использования сете- вого элемента по назначению, состояние проверки и состояние блокировки (рисунок 3.3). Для учета параметров системы управления и мониторинга се- тью составлена вторая математическая модель, в которой описываются все возможные состояния сетевого элемента (общее число состояний равно 22). Время между случайными событиями распределено по экспоненциальному закону. Параметры классифицированы. На основе применения матричного метода анализа вероятностных систем разработан расчетно- экспериментальный метод, при котором показатели надежности сетевых элементов определяются по результатам эксплуатации, а показатели надеж- ности сети в целом рассчитываются по математической модели. При выпол- нении функций обнаружения отказов и поиска отказавших сетевых элемен- тов работоспособность средств контроля может быть нарушена. Это, в свою очередь, может привести к ошибкам контроля первого, второго и третьего рода. Этот факт учитывался при составлении второй математической модели. Согласно рекомендациям МСЭ-Т по TMN (Рекомендации серий M и Q) задачи всякой системы управления сетями связи определены как функцио- нальные области управления, к которым относятся управление устранением последствий отказов и управление качеством. Основными компонентами функциональной модели сети, требующими математической формализации, является структура сети, описание вызова и алгоритма обслуживания. Струк- тура сети включает структуру первичной сети, как совокупность узлов сети и наличие связей между ними. Математическое описание такой совокупности даѐт теория графов. Каждому узлу на сети соответствует вершина графа, а связи между вершинами отображаются в виде матрицы смежности вершин. Поскольку программа решает задачу вычисления вероятностных показа- телей функционирования сетевого элемента, в качестве исходных данных вводятся статистические данные, полученные с помощью системы монито- ринга сети. При этом использована двухуровневая система контроля ввода данных, которая позволяет увеличить достоверность получаемых результа- тов, подвергая проверкам ввод и обработку статистических данных. При вводе исходных данных для построения сетевой модели функцио- нирования использовался метод получения случайных чисел (), основанный на применении уравнения:  = F(), где  - случайная величина, равномерно распределенная на интервале [0,1].
40 Для получения  необходимо использовать обратную функцию: =F -1 (). Программа написана на объектно-ориентированном языке программи- рования C# с использованием интегрированной среды разработки компании Майкрософт ―Microsoft Visual Studio‖. Внутренняя структура представлена XML-отчетом. В тегах <doc> размечена вся структура программы. Тег <assembly> содержит информацию о сборке программы. Тег <members> содержит все члены-классы программы (модули, инкапсулирую- щие всю логику программы). Логика программы, изображенная далее на а л- горитмической блок-схеме содержится в классах: - First Processing; - Simulation Processing. Логика, отвечающая за расчет параметров исследуемой задачи, заклю- чена в классе ―Надежность.First Processing", который состоит из переменных, хранящих массивы промежуточных данных и самого метода формульного расчета необходимых параметров ―First Processing.FP ‖. Логика, отвечающая за моделирование процесса по рассчитанным пара- метрам, заключена в классе ―Надежность.Simulation Processing‖. На рисунке 3.4. приведена краткая алгоритмическая блок-схема про- граммы. нет НАЧАЛО Ввод параметров Расчет парам етров Вывод результатов ВЫХОД Согласование данных на этапе ввода. Данные верны? нет Требуется ли проверка на сходимость данных? да Проверка данных на сходим ость да Рисунок 3.4. Краткая алгоритмическая блок-схема
41 В основе функциональной модели сетевого элемента, модели дискретно- го случайного процесса, описываемого графом возможных состояний эле- мента сети, лежат формульные математические модели, реализованные про- граммно. Пользовательский интерфейс программы имитационного модели- рования выполнен в виде стандартного для операционной системы MS Windows оконного вида (рисунок 3.5). Программа позволяет автоматизировать процесс расчета основных пока- зателей надежности по статистическим данным системы мониторинга и ди- агностики сети. Также применение разработанного программного продукта позволяет экономить вычислительные ресурсы конкретных систем, обеспе- чивать их гибкость по отношению к изменениям исходных данных и прово- дить автоматическую проверку адекватности полученных результатов. При этом, значительно снижается время обработки исходных статистических данных, повышается точность расчета и появляется возможность оптимиза- ции исследуемых параметров по заданному уровню качества обслуживания. Для удобства результаты исследований выводятся на графиках. Фраг- мент вывода результатов приведен на рисунке 3.6 . На рисунке 3.6 показаны графики зависимости вероятностей попадания на восстановление неработоспособного сетевого элемента или устройства вследствие отказов разного вида и вероятности попадания на восстановление работоспособного сетевого элемента (устройства) от параметра  при раз- ных значениях   , , . Рисунок 3.5 . Интерфейс программного продукта
42 Рисунок 3.6 . Фрагмент программы. Вывод результатов. Представленные графики зависимости (рисунок 3.6) иллюстрируют раз- личные пути определения ошибок контроля I, II, III рода системы непрерыв- ного и периодического контроля. Также по графикам можно определить возможные значения вероятно- стей попадания на восстановление вследствие разных видов отказов в усло- виях, когда интенсивность отказов оборудования колеблется в пределах от 1х10-5 до 0,1час -1 . Пути определения указанных вероятностей зависят от имеющихся в распоряжении обслуживающего персонала эксплуатационных данных, статистических данных на момент оценки надежности тестируемого оборудования или его системы управления. Новизна компьютерной программы заключается в применении матема- тического метода анализа вероятностных систем для описания процесса функционирования телекоммуникационной сети, применении разработанных математических моделей, применении разработанного аналитического мето- да расчета основных показателей надежности взамен традиционных эксперт- ных методов. Для работы с программой необходимо иметь персональный компьютер типа IBM PC Pentium IV с операционной системой Windows XP оперативной памятью от 512 Мб.
43 3.3. Пример использования разработанного метода расчета показа- телей надежности. В настоящем разделе приведен пример использования моделей функ- ционирования сетевых элементов и разработанного аналитического метода для расчета показателей надежности участка сети сигнализации [32, 33, 34]. Подсистема контроля и диагностики систем сигнализации (ПКД СС) QUEST7 представляет собой интеллектуальную систему мониторинга ком- пании GN Nettest для сетей ОКСNo7, GSM и IN. Данная система контроля вследствие присущей ей гибкости может использоваться как с одним цен- тром контроля, так и в виде сложной иерархической системы, включающей региональные центры контроля больших сетей, соединенных с главным цен- тром. Система выполнена на платформе UNIX и осуществляет сбор и пере- дачу данных с использованием устройств удаленного тестирования (RTU), основанных на специализированном многоканальном анализаторе протоко- лов (МРА) той же компании, что позволяет уменьшить затраты при повыше- нии качества и доступности функционирования [1]. В рабочем состоянии сети осуществляется непрерывный или периодиче- ский контроль исправности, сбор данных о состоянии подконтрольного обо- рудования и системы в целом. Помимо контроля оборудования осуществля- ется извещение оператора сети о качественном состоянии сети, а также про- изводится инициация профилактического контроля. Задача обнаружения сбо- ев в работе, аварий сводится не к простому их обнаружению и извещению оператора, но и к указанию конкретного места неисправности или аварии для дальнейшей локализации данного места. При локализации, то есть выключе- нии из сети неисправного оборудования, может произойти негативный эф- фект от данных действий, и задача системной защиты состоит в том, чтобы вовремя ввести в действие резервное оборудование или обходные каналы. Наличие распределенных баз данных, сохраняющих большое количест- во информации о сигнализации, совместно с трассированием вызова по всей сети даже спустя несколько часов после его поступления, значительно облег- чает поиск неисправностей при обнаружении проблем в сети. Таким образом, использование централизованной подсистема контроля и диагностики систем сигнализации (ПКД СС) обеспечивает корпоративных пользователей определенным набором средств, позволяющих снизить стои- мость эксплуатации, улучшить качество предоставляемых услуг и получае- мых результатов. Результаты мониторинга сигнального обмена ОКСNo7 представляют со- бой средство управления предоставлением новых услуг абонентам, оформле- ния счетов транзитной сигнализации и проверки счетов от операторов. Более того, доступность данных в режиме реального времени позволяет предупре- дить возникновение неблагоприятных условий, обнаружить факт несанкцио- нированного доступа, произвести оценку функционирования коммутатора
44 оператора, статистических доказательств качества предоставляемых услуг и т.д . В настоящее время система установлена и успешно эксплуатируется в таких компаниях, как Sonofon (Дания), Mannesmenn Mobilfunk GmbH (Гер- мания), Bell Emergis (Канада), Post  Telecom (Австрия), ETISALAT (Объе- диненные Арабские Эмираты), Global One, Malav (Венгрия) и др. Система сигнализации ОКСNo7 представляет собой совокупность средств, обеспечивающих прием требований на передачу линейных, регист- ровых и информационных сигналов, формирование пакетов данных пере- менной длины с сигнальной и другой информацией, передачу и прием кад- ров, обеспечение требуемой верности и удовлетворение требований по до- пустимой задержке. Сообщение ОКСNo7 названо сигнальной единицей (СЕ) – Signal Unit (SU) [18]. Существует три типа сигнальных единиц: заполняющая сигнальная единица - Fill-in Signal Unit (FISU), сигнальная единица состояния звена (СЗСЕ) - Link Status Signal Unit (LSSU), значащая сигнальная единица (ЗНСЕ) - Message Signal Unit (MSU) [2]. У всех трех типов СЕ имеется общий набор полей, которые отвечают за безошибочную передачу информации в сигнальной сети. К ним относятся (Рек.ITU-T Q.702, Q.706, Q.707, Q.104): BSN — номер подтверждаемой сигнальной единицы; BIB — бит индикации обратного направления; FSN — номер передаваемой сигнальной единицы; FIB — бит индикации прямого направления; LI — индикатор длины. Защита от ошибок при передаче СЕ обеспечивается протоколом второго уровня эталонной модели взаимодействия открытых систем (МВОС). МСЭ-Т рекомендует использовать два метода защиты: основной (базо- вый) и метод превентивного циклического повторения (ПЦП). Идея защиты от ошибок по базовому методу, аналогична идее, реализо- ванной в процедуре HDLC (High-Level Data Link Control – бит- ориентированный протокол канального уровня сетевой модели OSI). Теку- щим стандартом для HDLC является ISO 13239. ISO (International Organization for Standardization) - Международная организация по стандарти- зации. Кратко суть этой идеи такова: 1) каждая СЕ однозначно определяется FSN в диапазоне от 0 до 127; 2) с помощью FIB в передаваемой СЕ указывается, имеет ли место по- вторная передача или СЕ передается впервые; 3) подтверждение (положительное или отрицательное) принятой СЕ обеспечивается с помощью BSN и BIB в той СЕ, которая передается в обрат- ном направлении.
45 Под "положительным" подтверждением понимают информирование удаленной стороны об отсутствии ошибок в принятой СЕ, под "отрицатель- ным" - запрос о необходимости повторения СЕ, принятой с ошибкой. Звено сигнализации обязано предотвращать потерю СЕ. Если в канале возникает прерывание, то это приводит к искажениям СЕ. Для предотвраще- ния потери СЕ обе стороны (передающая и принимающая) должны нахо- диться в фазированном состоянии. Состояние проверки, выдачи, повторной передачи СЕ можно фиксиро- вать, например, при снятии Signal Trace с управляющего устройства (MN - Management Node). Поэтому данные состояния являются состояниями, на- блюдаемыми в процессе эксплуатации. Для сбора и обработки статистиче- ских данных с помощью ПКД СС можно запустить счетчики для каждого ти- па сообщений по всем линиям. Эти счетчики обеспечивают реальные стати- стические данные о качестве обслуживания вызовов. Таким образом, в процессе отслеживания прохождения конкретной сиг- нальной единицы возможно наблюдение за следующими ее состояниями (ри- сунок 3.7): 1 И - исходное состояние источника сигнальной информации; Н ВП П, - состояние проверки верно и неверно принятой СЕ; – состояния выдачи источником следующей сигнальной едини- цы при неверно принятой и верно принятой СЕ; Н ВПП ПП, – состояния повторной передачи верно и неверно принятой сигнальной единицы; В И Н ИР Р 2 2, – вероятность попадания в состояние И2 неверно и верно приня- той СЕ; – вероятность попадания в состояние ПП неверно и верно при- нятой СЕ; В П Н ПР Р, – вероятность повторения процесса, когда была неверно и верно принята СЕ. Передаваемая сигнальная информация может быть искажена в связи с недостаточным качеством используемого канала связи и большим объемом передаваемой информации. Метод защиты от ошибок предполагает определение верности прини- маемой информации с помощью циклического кодирования и организации «обратного» канала связи. При обнаружении искажения принятой сигналь- ной единицы по «обратному» каналу связи передаются обратный порядковый номер сигнальной единицы и обратный бит индикатора, которым присвоены определенные значения. Таким образом, рассматриваемая система сигнали- зации относится к системам с решающей обратной связью (РОС). В системах с РОС приемник, приняв кодовую комбинацию (КК), анали- зирует ее на наличие ошибок. Затем принимает окончательное решение или о выдаче КК потребителю информации, или об ее стирании и посылке по об- ратному каналу связи сигнала о повторной передачи этой КК (переспрос). в н И И2 2, В ПП Н ППР Р,
46 Рисунок 3.7 . Граф наблюдаемых событий прохождения СЕ В случае безошибочного приема приемник формирует и направляет в канал обратной связи сигнал подтверждения, получив который передатчик передает следующую КК. Этот процесс и наблюдается в системе ОКСNo7. Системы с обратной связью подразделяются на системы с ограниченным числом повторений или с неограниченным числом повторений. В ОКС число повторений ограничивается объемом памяти буфера повторной передачи. При его переполнении, равно как и при перегрузке звена сигнализации, про- исходит перенос трафика на другое звено с учетом структуры сигнальной се- ти. Наличие ошибок в каналах обратной связи приводит к тому, что в сис- темах с РОС возникают потери информации, называемые «вставки» и «выпа- дения». Вставки получаются в тех случаях, когда приемник посылает сигнал решения о правильности принятой КК, в канале обратной связи этот сигнал трансформируется в сигнал переспроса. На получателя информации данный факт не оказывает влияния, но скорость передачи информации может значи- тельно снижаться. В этом случае передатчик повторяет предыдущую КК, а приемник воспринимает ее как следующую, т.е . одна и та же информация выдается дважды. Выпадения получаются тогда, когда выработанный прие м- ником сигнал переспроса трансформируется в сигнал подтверждения пра- вильности приема. В этом случае по каналу прямой связи передается сле- дующая КК, а предыдущая стирается и к получателю не поступает. Т .к . сис- тема ОКС работает, как система с РОС, то и здесь также наблюдаются встав- ки и выпадения, что приводит к снижению качества обслуживания абонентов в условиях, когда предполагается, что ОКС может обслуживать до 1500 циф- ровых речевых каналов и до 2500 аналоговых. Описанную ситуацию можно смоделировать на математической моде- ли. Граф возможных состояний СЕ и переходов между ними показан на ри- сунке 3.8 .
47 Рисунок 3.8 . Граф возможных состояний СЕ и переходов. При составлении математической модели учитывалось то обстоятель- ство, что передаваемая сигнальная информация может быть искажена в связи с недостаточным качеством используемого канала связи и большим объемом передаваемой информации. Приведенная математическая модель составлена лишь для одного участка сети, без учета структуры построения сети ОКС в целом. При составлении математической модели были сделаны допущения: - каналы системы сигнализации находятся в непрерывном использова- нии по назначению; - все события происходят в случайные моменты времени; - закон распределения времени между событиями – экспоненциальный. В модели рассматриваются следующие состояния системы сигнализа- ции: 1 И – исходное состояние источника сигнальной информации; Н В, – состояния, при которых сигнальная информация (сигнальная единица) получена без искажений (верно) и с искажением (неверно) соотве т- ственно; Н ВП П, - состояния передачи сигнала подтверждения верно и неверно принятой сигнальной единицы соответственно; Н ВЗ З, - состояния передачи сигнала запроса верно и неверно принятой сигнальной единицы соответственно;
48 Н В И И2 2, – состояние выдачи источником следующей сигнальной едини- цы после верно принятой СЕ и неверно принятой СЕ; в случае Н И 2 будет на- блюдаться выпадение информации (безвозвратная потеря СЕ); Н ВПП ПП, – состояние повторной передачи верно и неверно принятой сигнальной единицы соответственно. Переходы между состояниями характеризуются следующими вероятно- стями: -  – вероятность искажения сигнальной единицы; - – вероятность того, что сигнальная единица принята без искаже- ний; - – вероятность подтверждения верно принятой сигнальной еди- ницы; -   1 – вероятность запроса неверно принятой сигнальной единицы; -  – вероятность трансформации сигнала подтверждения в сигнал за- проса (ошибка контроля I рода); -  - вероятность трансформации сигнала запроса в сигнал подтвержде- ния (ошибка контроля II рода); - – вероятность повторной передачи верно и неверно принятой сигнальной единицы соответственно, 1  ПП Р ; - В П Н ПР Р, – вероятность передачи следующей сигнальной единицы при по- лучении подтверждения на верно и неверно принятую СЕ, 1  П Р . Эти вероятности описывают процесс смены состояний. В дальнейшем будем называть их вероятностями прохождений. С помощью этих вероятно- стей можно исследовать характеристики, описывающие указанные события. Для вывода формул расчета показателей надежности воспользуемся матричным методом анализа вероятностных систем, предложенным в работе [16]. Для этого составим полную матрицу вероятностей прохождений в со- стояния и произведем ее разбиение до 7-го состояния (таблицы 9, 10, 11, 12). Поскольку входное подмножество  1И U  состоит из одного состояния, то относительные частоты состояний множества U в стационарном режиме являются элементами первой строки матрицы относительных частот: . (19) Таким образом, получены формулы для расчета следующих вероятно- стей:     1 , 1 В ПП И Р ; (20)    1 , 1 Н ПП И Р ; (21)      1 1 , 2 1 В ПП И Р ; (22)    Н И И Р 2 1, ; (23   1   1 В ПП Н ППР Р,  UU U P E N  
49 Таблица 9. Матрицы вероятностей UU P Таблица 10. Матрица вероятностей VU P 1234567 11 1 0 000 2010   100 30010 0 40001000  UU P50000100 60000010 70000001 12 34567 80 0000 90 0000  VU P 1 0 00 00000 1 1 00 00000   1   1
50 Таблица 11. Матрица вероятностей VVP Таблица 12. Матрица вероятностей UV P Полученные вероятности являются линейно-зависимыми и представ- ляют собой долю (число) попаданий в состояния, приходящееся на одну сиг- нальную единицу. Вывод полученных формул был произведен без учета повторной пере- дачи сигнальной единицы. Задачу определения вероятности попадания СЕ в состояния повторной передачи можно решить путем разделения полной ма т- рицы прохождений (таблицы 9, 10, 11, 12) до 8-го состояния (второй вариант разбиения). Для данного случая получены формулы зависимости среднего числа повторных передач одной СЕ от вероятностей трансформации сигнала запро- са и сигнала подтверждения, а также вероятности искажения СЕ:        1 ) 1( , 1 В ПП И Р ; (24)  Н ПП И Р,1     1 ) 1( ; (25)  В ПП И Р 2 1, ) 1(  ; (26)  Н И И Р 2 1,      1 ) 1( . (27) 891011 10000 20000  UV P300 00 4000 В П P 500 Н П P 0 60Н ПП P 00 7Н ПП P0 00 891011 8100 0  VV P 9010 0 1 0 001 0 1 1 000 1
51 В общем случае задача этой работы заключается в математическом мо- делировании качества обслуживания вызовов за счет предварительного рас- чета показателей надежности на участке сигнальной сети. Используя, результаты проведенных исследований и сопоставив их с наблюдаемыми характеристиками, получим следующие системы уравнений: Для 1-ого варианта разбиения:                       Н И В И Н ПП В ПП Р Р Р Р 2 2 ) 1 )( 1( ) 1( ) 1( (28) Решение системы уравнений (28) имеет вид:                     1 1 1 2 в ПП в ПП в и н ПП Р Р Р Р (29) Для 2-го варианта разбиения система уравнений (граф наблюдаемых событий тот же) имеет вид:                               1 ) 1( 1 1 1 1 ) 1( н П в П н ПП в ПП Р Р Р Р ( 30) Решение системы уравнений (30) приведено в виде, удобном для прак- тического применения:                н ПП н ПП н ПП н П в П Р Р Р Р Р     1 1 (31)
52 При некоторых сочетаниях   , , имеем малые значения вероятностей. Это означает, что события соответствующие этим параметрам на практике могут не фиксироваться. Причиной отсутствия события может быть не толь- ко их фактическое отсутствие, но и то, что события являются редкими. Но, как известно, редкие события предшествуют неисправности. Таким образом, на примере приведенных выше исследований системы сигнализации ОКСNo7, показано применение разработанного метода расчета реальных показателей надежности функционирования участка сигнальной сети с учетом данных подсистемы контроля и диагностики систем сигнали- зации. Предложен подход к расчету эксплуатационных и расчетных показате- лей надежности, основанный на сборе и обработке данных, полученных при эксплуатации подсистем контроля и диагностики систем сигнализации. Разработаны математические модели и получены аналитические фор- мулы для определения показателей надежности, к которым относятся: -  - вероятность трансформации сигнала подтверждения в сигнал за- проса (ошибка контроля I рода); -  - вероятность трансформации сигнала запроса в сигнал подтвер- ждения (ошибка контроля II рода); -  - вероятность искажения сигнальной единицы. Показано, что такие показатели качества обслуживания вызовов, как , ,  могут быть получены расчетным путем по характеристикам, наблюдае- мым в процессе эксплуатации систем сигнализации. Проведенные расчеты также, могут быть применены и к протоколу HDLC. 4. Методика сбора и обработки статистических данных системы контроля и управления. 4.1. Постановка задачи сбора и обработки статистических данных Методика сбора и обработки статистических данных о надежности сете- вых элементов приведена при условии, что сетевой элемент используется не- прерывно в течении всего периода наблюдений в условиях нормальной экс- плуатации с регистрацией параметров его функционирования [21, 22, 23, 24, 25, 26]. Экспериментальному определению подлежат следующие показатели, оценивающие надежность: 1) средняя наработка на отказ; 2) среднее время восстановления; 3) интенсивности событий, являющиеся параметрами экспоненциаль- ного распределения: параметр потока отказов; интенсивность восстановле- ния; интенсивность проведения периодического контроля; 4) вероятности событий, вычисляемые как соотношения чисел соответ-
53 ствующих событий. Обработка исходных статистических данных заключается в получении интервальной оценки средней наработки на отказ и среднего времени восста- новления работоспособности составных частей станции, а также среднего времени продолжительности наблюдения и вероятности попадания в состоя- ния. Доверительная вероятность продолжительности наблюдений выбирается исходя из требований оценок показателей надежности. Наибольшая продол- жительность наблюдений составляет один год. 4.2. Оценка средней наработки на отказ Средняя наработка на отказ - это отношение наработки восстанавливае- мого объекта к математическому ожиданию числа его отказов в течении этой наработки.  )(   t m M t T , (32) где t - суммарная наработка объекта; ) (t m - число отказов на наработку t ; М – знак математического ожидания. Статистически средняя наработка на отказ одного объекта определяется отношением суммарной наработки объекта к наблюдаемому числу отказов:            ) ( 1 ) ( ) ( ˆ t m K K t t m I t m t T  , (33) где ) (t m - наблюдаемое число отказов за суммарную наработку; K t - наработка на к-ый отказ;  - наработка объекта от момента устранения последнего отказа до окончания наблюдения за объектом. Будем считать однотипными сетевыми элементами (здесь и далее объек- тами) те, которые имеют одинаковое назначение, одинаковое конструктивное и схемное исполнение и которые эксплуатируются в одинаковых условиях, в частности, охвачены одинаковой системой контроля технического состояния. Пусть имеются N однотипных объектов, которые непрерывно использу- ются по назначению и наблюдаются в течении времени t. Отказавший объект мгновенно заменяется на работоспособный. Фиксируются моменты возник- новения отказов. Исходные статистические данные представляют собой не полностью определенную выборку. Оценка проводится по плану испытаний NRT, согласно которому одновременно испытывают N объектов. Отказавшие во время испытаний объекты заменяются новыми, испытания прекращают по истечении наработки t.
54 m NT T ˆ , (34) где t – продолжительность наблюдения, совпадающая с наработкой на отказ одного объекта; N – число однотипных объектов; m – суммарное число отказов за время наблюдения. Точечная оценка средней наработке на отказ производится согласно ISO 2836-80: Оценка интенсивности отказов при экспоненциальном определении на- работки на отказ: Nt m T I   ˆ . (35) Интервальная оценка может быть выполнена в следующем варианте. Нижняя и верхняя доверительные границы для средней наработки на отказ при экспоненциальном распределении наработки на отказ определяются со- гласно [СТ СЭВ 2836-80]. 2 2 2,2 1 2 2 2,2 1 ˆ 2 2      m m H T m Nt T     ; (36) 2 2,2 2 2,2 ˆ 2 2 m m B T m Nt T       , (37) где m – число отказов за время наблюдения; 1-α – доверительная вероятность; 2 ,k p  - квантиль 2  - распределения уровня Р с числом степеней свободы, равным К. Таблица квантилей 2  - распределения приведена в [9]. По найденным доверительным границам находятся доверительные гра- ницы для интенсивности отказов: ) 39 .( ) 38 (; H B B H T I T I     Кроме интервальной оценки можно найти предельную относительную ошибку оценки Tˆ зависящую от объема наблюдений (N и Т) и от принятой доверительной вероятности при экспоненциальном распределении наработки на отказ [6].
55 4.3. Оценка среднего времени восстановления. Среднее время восстановления - это математическое ожидание восста- новления работоспособного состояния [II].       0 0 )( )( ˆ dt t tg t tgG  , (40) где G(t) - функция распределения времени восстановления; g(t) - плотность распределения времени восстановления. Статистическое определение среднего времени восстановления объекта:   n i i n I 1 ˆ   , (41) где n - число восстановлений объекта; i  - восстановления объекта после i-го отказа. Пусть имеется некоторая совокупность однотипных объектов. После каждого отказа любого объекта определяется время восстановления его рабо- тоспособного состояния. Оценка среднего времени восстановления произво- дится для данной совокупности однотипных модулей по плану NUN, соглас- но которому получают N значений оцениваемой случайной величины. Под объектом здесь понимается восстанавливаемый сетевой элемент, т.е . числом объектов плана NUN в данном случае является суммарное число восстанов- лений для данной совокупности сетевых элементов. Выборка по такому пла- ну является полностью определенной.   n i i n I 1 ˆ   (42) где n - число восстановлений; i  - продолжительность i-го восстановления. При экспоненциальном распределении времени восстановления оценка интенсивности восстановления:   I  . (43) Интервальная оценка выполняется следующим образом. Нижняя и верх- няя доверительные границы для среднего времени восстановления опреде- ляются: 2 2,2/ 1 ˆ 2 n H n       , (44)
56 2 2,2/ ˆ 2 n B n     . (45) По найденным доверительным границам находятся доверительные гра- ницы для интенсивностей восстановления: B H I  ; (46) H B I   . (47) По объему наблюдений n и доверительной вероятности при экспоненци- альном распределении времени восстановления может быть найдена пре- дельная относительная ошибка оценки  [6]. 4.4. Оценка вероятностей состояний. В соответствии с применяемыми данными оценке подлежат вероятности попадания в состояния восстановления: - вероятность того, что устройство попадет в состояние восстановления с отказом, обнаруживаемым непрерывным контролем РН; - вероятность того, что устройство попадет в состояние восстановления с отказом, приводящим к продолжительному неработоспособному состоянию РП. - вероятность того, что устройство попадет в состояние восстановления с двумя видами отказа одновременно РНП; - вероятность того, что устройство попадет на восстановление в работо- способном состоянии РР Кроме этого, оценке подлежат условные вероятности ошибок контроля I и II рода и числовые характеристики случайных величин (наработки до от- каза, времени восстановления и др.). В [10, 11] приведена формула для оцен- ки вероятности диагностирования, которая вычисляется через соотношения соответствующих чисел испытания. Точечная и интервальная оценка произ- водятся по известным формулам. Например, интервальная оценка вероятно- сти события при 0,1<P <0,9 производится по формулам: n t n t n v v t n t H / 1/ 4/ /) 1( 2/ [ 2 2 2 2             ; (48) n t n t n v v t n t B / 1/ 4/ /) 1( 2/ [ 2 2 2 2             , (49)
57 где n m v -точечная оценка вероятности, n v n nv     ) 1( , 4 . При 10 ) 1( , 10     v n nv формулы интервальной оценки (48, 49) упрощают- ся. )51 (, /) 1( ) 50 (, /) 1( n v v t v v n v v t v v H H           Коэффициент t берется из таблиц [10, 11]. Наиболее общая схема об- работки статистических данных для оценки показателей надежности включа- ет в себя следующие этапы: - выбор предположения о виде распределения наработки или времени восстановления; - анализ однородности статистического материала; - оценка параметров распределения; - проверка согласия эмпирического распределения с заданным теорети- ческим распределением; - оценка показателей надежности. В большинстве случаев при расчетах надежности коммутационных уз- лов и станций принято, что наработка до отказа, время восстановления и слу- чайное время между проверками распределены по экспоненциальному зако- ну. Проверка согласия эмпирического и теоретического распределений про- изводится по [8, 13, 12]. 4.5. Оценка показателей надежности Исходными данными для оценки средней наработки на отказ в течении одного квартала являются: - продолжительность испытаний t = 2160час. - доверительная вероятность интервальной оценки 95 , 0   ; - число однотипных объектов, находящихся в эксплуатации, N=2, 5, 10, 16, 250, 256, 500. - числе отказов m однотипных объектов в течении квартала. Формулы для нижней и верхней доверительной границы следуют из формул интервальной оценки средней наработки на отказ среднего восста- новления: )55 (;ˆ ) 54 (, ˆ )53 (;ˆ ) 52 ( , ˆ     B B H H B B H H a a T a T T a T    
58 где и - коэффициенты для нижней и верхней границы соответст- венно; эти коэффициенты вычисляются по формулам (для 95 , 0   ): 2 2; 975 , 0 / 2 m H m a   ; (56) 2 2; 025 , 0 / 2 m В m a   . (57) Точечные оценки средней наработки на отказ и среднего восстановления вычисляются по формулам: ) 59 (, 1 ˆ ) 58 ( ; / ˆ 1    m i i m m Nt T   где m – число отказов для оценки Т и число восстановлений для оценки I m  . В таблице 1 приложения А, приведены квантили 2  распределения, взя- тые в [8, 12,13], а также значения коэффициентов и , вычисленные по приведенным формулам. В таблице 2 приложения А приведена точечная оценка средней нара- ботки на отказ по результатам испытаний за квартал. Значения оценки округлены до целых чисел. Если испытания проводятся в течении шести месяцев или года, то m -число отказов за этот период испы- таний; значения точечной оценки следует увеличить в 2 и в 4 раза соответст- венно. 4.5 .1. Текущая оценка средней наработки на отказ и среднего времени восстановления. Для решения задачи вычисления точечной оценки путем корректировки текущего значения запишем оценку средней наработки на отказ в виде: m t N m T m ` ˆ  , (60) где m - суммарное число отказов; m  - момент последнего, m-го отказа, отсчитываемый от начала наблю- дения. Вообще говоря, tm- это любой момент времени, отсчитываемый от на- чала наблюдения, между m-м и (m+1)-м отказами. В дальнейшем точечную оценку будем называть текущей оценкой. Вы- разим ее через предыдущую оценку  I m T ˆ . П утем несложных преобразо- ваний текущая оценка может быть представлена в виде:
59 0 0 , 1 ˆ      T m T m T m T ; (61)    m m T N m T m m / 1 ˆ 1         , (62) где ) (ˆm T  - корректирующее слагаемое за счет m-го отказа (приращение оценки на m-м шаге). Аналогично, оценка среднего времени восстановления:   n i i n n 1 /1 )(ˆ   (63) может быть представлена в виде: 0 )0( ), ( )1 ( )(ˆ          n n n , (64) , / )]1 ) [ ) (ˆ n n n n       (65) где )(ˆ n   - корректирующее слагаемое за счет n-го восстановления (или приращение оценки на n-м шаге). Видно, что с увеличением объема выборки (как m, так и n) корректи- рующие слагаемые )(ˆ n   и ) (ˆm T  имеют тенденцию к уменьшению. Итак, текущая оценка как средней наработки на отказ, так и среднего времени восстановления производится при каждом отказе и при каждом вос- становлении путем корректировки оценки, полученной при предыдущем со- бытии. Таким образом, для вычисления текущей оценки средней наработки на отказ необходимы следующие сведения: I) число однотипных объектов N; 2) значение предыдущей оценки Т(m-1); 3) текущий номер отказа m; 4) момент последнего отказа tm; 5) момент предыдущего отказа tm-1 ; Замечание. Момент времени tm-1 и tm отсчитываются от нуля, являюще- гося началом периода испытаний. Для вычисления текущей оценки среднего времени восстановления   n  необходимы следующие сведения: 1) значение предыдущей оценки )1 (ˆ  n  ; 2) текущий номер восстановления n; 3) продолжительность последнего восстановления n  4.5 .2. Объединение точечных оценок средней наработки на отказ и среднего времени восстановления
60 В процессе проводимых испытаний будет возникать задача объединения оценок, полученных в разные периоды эксплуатации. Предполагается, что объединяемые оценки получены для одной и той же совокупности однотип- ных объектов. Пусть имеются две оценки средней наработки на отказ, полученные в разные периоды эксплуатации: Т1(m1) и Т2(m2), где m1 и m2 - количество отказов на первом и втором периоде соответст- венно. После несложных преобразований оценка для объединения этих двух периодов будет иметь вид:  2 1 2 2 1 1 2 1 / )] (ˆ ) (ˆ [ ˆ m m m T m m T m m m T     . (66) Аналогично определяются оценки среднего времени восстановления для двух периодов эксплуатации:  ] /[ )] (ˆ ) (ˆ [ ˆ 2 1 2 2 2 1 1 1 2 1 n n n n n n n n        . (66) где ) (ˆ1 1n  и ) (ˆ 2 2n  - оценки среднего времени восстановления для двух периодов эксплуатации; n1 и n2 количество восстановлений на первом и втором периоде соответ- ственно. Видно, что объединенная оценка является линейной комбинацией объе- диняемых оценок, при этом коэффициенты линейной комбинации пропор- циональны числам событий (числам отказов и числам восстановлений соот- ветственно). 4.6. Оценка интенсивности событий для случая полностью и непол- ностью определенной выборки. Несмещенная оценка x для интенсивности ω, а также нижняя и верхняя (H xиB x соответственно) доверительные границы интенсивности при одно- сторонней доверительной вероятности вычисляются по следующим форму- лам: для n>1    n i ix n x 1 /]1 [ ; , , 4 5 r x x r x x B H   (67) n=1 , , 2 1 r x x r x x B H   (68)
61 для n>100 коэффициенты 4 r и 5r вычисляются по формулам:  2 4 1 4 / )] (4[ t n I n r     , (69)  2 5 1 4 / )] (4[ t n I n r     , (70) t r r , , 2 1 берутся из соответствующих таблиц [9]. Несмещенная оценка интенсивности события производится по следую- щей формуле: Э T N m x   , (71) где m - число отказов за время Э T, N - число объектов. Нижняя и верхняя доверительные границы для неполностью оп- ределенной выборки параметра  при односторонней доверительной веро- ятности вычисляются по формулам: для ; , ; 100 0 2 1 r x x r x x m B H     (72) для m=0 ; , 0 0 0 NT r x x B H   (73) для m>100 коэффициенты r1 и r2 вычисляются по формулам:  2 1 1 4 / 4 t m m r    ; (74)  2 2 3 4 / 4 t m m r    , (75) где коэффициенты t r r , , 2 1 берутся из таблиц [9] 4.6.1 . Обоснование продолжительности наблюдений. В соответствии с [6] цель планирования наблюдений заключается в оп- ределении требуемого объема наблюдений для получения показателей на- дежности с заданной точностью и достоверностью. При этом под объемом наблюдений понимается: 1. Число объектов наблюдения N для плана NUN. 2. Число объектов наблюдения N и продолжительность наблюдений t для
62 плана NRT. При планировании наблюдений используется понятие предельной отно- сительной ошибки, которая является мерой точности оценки показателя на- дежности. Предельная относительная ошибка определяется из двух чисел: )), ( , /) max(( A A A A A B H     (76) где: А - точечная оценка показателя надежности; АН - нижняя граница одностороннего доверительного интервала   , H A при заданной доверительной вероятности  ; АВ - верхняя граница одностороннего доверительного интервала  BA , 0 при заданной доверительной вероятности  . В соответствии с [6] предельную относительную ошибку  выбирают из ряда 0,05; 0,1; 0,15; 0,20. Применительно к испытаниям сетевых элементов под объемом наблю- дений следует понимать: 1. Количество отказов или восстановлений сетевых элементов (уст- ройств) данного типа при оценке среднего времени восстановления. 2. Количество сетевых элементов (устройств) каждого типа и плани- руемая продолжительность испытаний при оценке средней наработке на от- каз. Согласно [6] для экспоненциального распределения времени восстанов- ления и наработки на отказ при односторонней доверительной вероятности 90 , 0   зависимость между предельной относительной ошибкой и объемом наблюдений представлена таблицами 14, 15. Таблица 14. Предельная относительная ошибка при оценке среднего времени восстановления. T  0,20 0,15 0,10 0,05 m 50 80 200 650 Таблица 15. Предельная относительная ошибка при оценке средней на- работке на отказ. T  0,2 0,15 0,10 0,05 m 59 114 217 684 В таблицах обозначено:  иT  - предельные относительные ошибки при оценке среднего вре- мени восстановления и средней наработке на отказ; m - количество восстановлений устройств данного типа;
63 x - коэффициент, вычисляемый по формуле: t Nt x ПЛ/  (77) N - количество устройств данного типа; t - расчетное (теоретическое) значение средней наработки на отказ; N xt tПЛ /  (78) Будем исходить из следующих условий при расчете продолжительности наблюдений: 1) предельные относительные ошибки  иT  приняты 0,20; 2) двусторонняя доверительная вероятность оценки принята 95 , 0   ; 3) количество устройств каждого типа равно начальному и при наблю- дениях остается неизменным. В соответствии с [6] вводятся предельные относительные ошибки для двусторонних доверительных интервалов. 1. При оценке средней наработке на отказ: )1 1 max( )ˆ/ ˆ , ˆ / ˆ max( 1 2      r r T T T T T T B H T  . 2. При оценке среднего времени восстановления: ),1 1 max( )ˆ/ ˆ , ˆ / ˆ max( 1 3      r r B H        Поскольку 2 3r r,то . 1 1 3 2 r r    Поэтому при планировании продолжительности наблюдений необходи- мо ориентироваться на предельную относительную ошибку T , поскольку    T . Так, планирование продолжительности наблюдений целесообразно проводить по достоверности оценки средней наработке на отказ. Значение предельной относительной ошибки 0,20 соответствуют значе- ния коэффициентов r1=1,20, r2=0,8, r3=0,8, а этим значениям коэффициентов - количество отказов 80, 70, 130. Видно, что для обеспечения принятой досто- верности оценок следует установить x=130. Для принятых условий плани- руемая продолжительность наблюдений определяется по формуле: ) 79 (, / 130 N t tПЛ  Планируемая продолжительность наблюдений прямо пропорциональна количеству сетевых элементов (устройств) N. Поэтому для разных типов се- тевых элементов получаются разные продолжительности наблюдений. Итак, расчетная продолжительность наблюдения сетевых элементов ка- ждого типа определяется по предельной относительной ошибке (которая
64 принята 0,20), по доверительной вероятности интервальной оценки (которая принята 0,95), по количеству устройств в начале наблюдений и по расчетной наработке на отказ. 5. Рекомендации по сбору и обработке статистических данных. В современных условиях функционировании СРФ, создания принципи- ально новой организации управления отраслью методологической основой управления является метод функционального управления (менеджмента), ко- торый определятся как система организационных, технических, экономиче- ских и социальных мер, направленных на достижение цели в условиях раз- личных воздействий путем сочетании научного обоснования, практического опыта и интуиции. В основе функционального менеджмента лежат два взаимосвязанных подхода: усиление роли децентрализованного управле ния, предоставление самостоятельности в управлении объектами малого размера, расширение го- ризонтальных линий управления и усиление роли человеческих ресурсов, управленцев (менеджеров) в принятии решений, формировании стратегии управления с использованием новых информационных технологий. Эти два подхода активно используются и развиваются при осуществле- нии управления СРФ. Функции управления ориентированы на управление организационной структурой в целом для достижения главной цели функционирования данной структуры. Функциональная организация представляет собой разделение процесса на обособленные виды действий с целью освоения содержания их исполнения и последующей кооперации в ходе разработки и осуществления задуманного. Основными функциями менеджмента являются: - планирование: - организация; - мотивация; - координация; - контроль. Эффективность управления в новых условиях во многом определяется средствами технического обеспечения, применяемыми аппаратно- программными и комплексами функционального менеджмента. Исходя из общих подходов функционального менеджмента, техника управления опре- деляется как комплекс технических средств, программ и систем, обеспечи- вающих техническую поддержку процедур управления в части автоматиза- ции получения и обработки данных об управляемом объекте, выполнения расчетных операций, выработки и реализации управляющих решений. Структура технических средств, включает в себя: - средства сбора и регистрации управленческих данных; - системы и средства передачи управленческой информации;
65 - системы и средства обработки управленческой информации; - системы и средства подготовки и принятия управленческих решений. Основные требования, предъявляемые к аппаратно-программным сред- ствам, заключаются в обеспечении: - надежности; - оперативности; - качества передачи и обработки управленческой информации. На пути создания и реализации технических средств управлении необ- ходимо было пройти длинный путь от ручного конторского труда управлен- ческого работника до совершенных автоматизированных систем управления (АСУ). АСУ основаны на применении сложных компьютеризированных экс- пертных систем с использованном искусственного интеллекта, а также про- цедур общении человек-машина. Основными технологическими процессами групп технической под- держки услуг являются: - прием заявлений об отсутствие доступа к сети связи, или некачест- венного предоставления услуги; - предоставление справочной информации, касающейся отсутствия доступа к сети или некачественного предоставления услуги; - техническое обслуживание заявления, предусматривает выявление и устранение причины отсутствия доступа к сети связи, или некачественного предоставления услуги; - выполнение маршрутизации заявлений; - регистрация заявлений согласно инструкции; - статистическая отчетность; - эксплуатация кроссового оборудования сетей связи - взаимодействие с другими звеньями структуры предприятия. Взаимодействие и консолидирование данных процессов в единую сис- тему, организация рабочих мест и локальной сети, разработка и внедрение программного обеспечения KROSS(lite) стало началом проекта сети «Цен- трализованного бюро ремонта» (ЦБР). На структурном уровне комплекс «ЦЕНСОР» подразделяется на цен- тральную часть и периферийное оборудование, соединенные между собой через каналы передачи данных, образованные самой сетью электросвязи. Центральная часть представляет собой совокупность вычислительной техники, программного обеспечения и микропроцессорных контроллеров (МК). МК обеспечивают аппаратное подключение центральной части к большинству типов каналов связи (кроме соединения через Ethernet). МК по- зволяют организовывать многоуровневые схемы сбора информации, обеспе- чивая концентрацию каналов в промежуточных точках и их уплотнение. Периферийное оборудование состоит из датчиков и устройств сбора информации (УСИ), обеспечивающих сбор информации с датчиков, ее пер- вичную обработку, хранение и передачу в центр через каналы связи. Исполь-
66 зуемые системой датчики в большинстве своем являются выходами сигнали- зации и индикации контролируемой аппаратуры. Оригинальными являются: - климатические датчики (датчик температуры, датчик затопления (во- ды)); - датчики контроля вскрытия крышек смотровых устройств (колодцев) ЛКС; - датчики целости контрольной пары охраняемого магистрального либо рас- пределительного кабеля; - преобразователи выходных сигналов «авария» АЦО систем ИКМ. Устройства сбора информации подразделяются на универсальные и специализированные. Универсальные УСИ могут использоваться при орга- низации подсистем общестанционной сигнализации АТС всех типов, контро- ля систем передач, контроля доступа в РШ, контроля объектов ЭПУ, контро- ля КСУ, контроля ОПС, климатического контроля зданий и сооружений, ох- раны кабельного хозяйства (по схеме с выделенной парой). В качестве интегрированного решения для небольших объектов и БС ПСС, используется блок измерений и контроля БИК. БИК содержит встро- енные датчики и узлы контроля и охраны. Он обеспечивает: - измерение напряжения станционного питания и передачу в центр ко- довой комбинации, соответствующей его величине; - контроль наличия фаз на трехфазном питающем вводе (одном или двух) и выдачу по результатам контроля дискретных сигналов типа нор- ма/авария; - контроль огней СОМ и выдачу по результатам контроля дискретных сигналов типа норма/авария (для базовых станций ПСС); - измерение температуры в двух произвольных точках и передачу в центр кодовых комбинаций, соответствующих ее величинам; - контроль появления открытой влаги в двух произвольных точках и выдачу по результатам контроля дискретного сигнала типа норма/авария; - организацию системы авторизации доступа в помещение путем счи- тывания цифровой комбинации с индивидуального ЧИП-ключа типа Touch Memory, идентификации субъекта и передачи условного кода в центр; - выдачу сигнала управления сиреной и (или) синтезатором, речевых предупреждающих сообщений при несанкционированном доступе в помеще- ние; - считывание и передачу в центр состояний восьми внешних дискрет- ных датчиков типа "сухой контакт". Все устройства сбора информации питаются от станционных вторич- ных источников электропитания 60 Вольт, либо 48 Вольт. УСИ обеспечивают передачу собранной информации в центр по всем видам связей существующих на сети: - по выделенным физическим парам проводов; - через выделенные каналы ТЧ любых систем передач, а также через постоянно проключенные каналы цифровых АТС;
67 - по коммутируемым телефонным каналам связи ГТС; - через цифровые каналы систем передач; - по компьютерным сетям типа Ethernet. При этом возможны варианты организации комбинированных каналов в разных сочетаниях. Структура элемента системы качества «Статистические методы» при- ведена на рисунке 5.1 . Рисунок 5.1 . Статистические методы. Статистический метод контроля технологических процессов применя- ется в случае, когда отсутствует возможность непосредственного контроля воздействия отдельных факторов на технологический процесс в целом (влия- ние температуры на частоту отказов технологического оборудования, опре- деление тяготения вызовов в направлениях МСС и т. д .). Потребность в ста- тистических методах оценки характеристик продукции, возможностей техно- логического оборудования возникает в случаях:  эпизодического снижения качества, количества реализуемых ус- луг;  эпизодического увеличения претензий на работу предприятия;
68  участившиеся случаи неадекватного действия персонала, занятого в технологическом процессе;  внедрение новых технологий и услуг и т. д . Применение статистических методов оценки функционирования тех- нологических процессов осуществляется руководителями структурных под- разделений регулярно при проведении анализа сбоев и отказов технологиче- ского оборудования. Применение статистических методов оценки характеристик продукции, возможностей технологического оборудования с участием персонала не- скольких структурных подразделений определяет администрация или Совет по качеству и технической политике предприятия. Ответственность за соответствие применяемых статистических методов контроля функционирования технологического процесса возлагается на ру- ководителя структурного подразделения, инициировавшего проведение ана- лиза. При необходимости проведения оценки статистическими методами выполняется следующее:  формулируется проблема;  определяются основные и второстепенные факторы, влияющие на результаты функционирования технологического процесса и деятельности персонала;  определяются возможность контроля параметров функционирова- ния технологического процесса и оценки множества влияющих факторов;  устанавливается согласованная периодичность проведения контро- ля параметров;  определяется форма документирования результатов контроля каж- дого параметра в отдельности (график, таблица, распечатка и т. д.). Разрабатывается документация, объединяющая разрозненные данные в едином, удобном для анализа виде. Разрабатывается план мероприятий с указанием:  время начала /конца сбора данных;  ответственных за сбор данных;  координатора, выполняющего оперативное управление процессом сбора и обработку полученных результатов; Полученная информация анализируется и оценивается на предмет вы- явления (не выявления) факторов, способствующих возникновению пробле- мы. Результаты анализа доводятся до Совета по качеству и технической по- литике предприятия, которое на заседании принимает решение о методах устранения, снижения неблагоприятного влияния факторов, а в случае не выявления таковых – корректировке плана проведения мероприятий сбора данных. На основе, проведенных на телекоммуникационных сетях, исследова- ний взаимодействия различных сетевых элементов, методов обслужива-
69 ния и анализа способов контроля, а также в соответствии с действующими нормативными документами [19, 20, 21 , 29], составлен алгоритм ключе- вых технологических процессов (рисунок 5.2 .) . Алгоритм был составлен на основе результатов анализа работы централизованного бюро ремонта. Для выполнения алгоритма ключевых технологических процессов, положенного в основу программного обеспечения системы контроля и диагностики, пер- сонал группы технической поддержки услуг должен знать [35]: - схему организации соединения от оконечного абонентского устройства до оборудования станционных сооружений; - характеристики повреждений и методы выявления участка поврежде- ния; - правила и инструкции согласно должностным инструкциям; - основы и навыки выполнения статистического анализа; - умение логически мыслить; - иметь навыки работы на персональном компьютере на уровне пользо- вателя; - этику делового общения; - правила корпоративной культуры. Каждый элемент алгоритма имеет определенную суть и является логи- ческим звеном в процессе выполнения той или иной поставленной задачи. Детальное изучение каждого ключевого элемента алгоритма позволяет выполнять подробную классификацию не только имеющихся статистических данных, но и действий обслуживающего персонала в разных производствен- ных ситуациях. Пример детального изучения такого технологического процесса, как статистика и анализ абонентского трафика показан на рисунке 5.3. Пример детального изучения такого технологического процесса, как об- работка поступающих заявлений от абонентов приведена на рисунке 5.4. На рисунке 5.5 . приведен разработанный обобщенный алгоритм работы по абонентскому доступу. Данная структура позволит получать достоверную информацию в ко- роткие сроки, принимать решения и координировать действия для устране- ния причин, препятствующих предоставлению услуг с высоким качеством. Централизованное хранилище информации устраняет дублирование и неод- нозначность потоков данных. В системах управления способы организации контроля технического состояния сетевого элемента можно разделить на следующие виды: - непрерывный контроль, при котором оборудование проверяется не- прерывно;
70 Заявление о повреждении Техническое обслуживание заявления о неудовлетворительной работе телефонной связи Формирование и выдача наряда на устранение повреждения Участковому электромонтеру линейных сооружений ЛТЦ Формирование базы данных согласно классификации характера повреждения Формирование реестра для корректировки начислений за услуги связи Обновление банка базы данных Анализ сроков устранения повреждения Заявление закрыто Классификация заявления по характеру повреждения Техническое обслуживание абонентской линии Формирование и выдача наряда кабельной бригаде Классификация заявления Сообщения обслуживающего персонала Заявление справочного характера Линейно-абонентские, аппаратные Документированная процедура Повреждение не устранено Повреждение устранено Кабельное повреждение Нарушение срока Соблюдение срока Банк базы данных Статистика и анализ абонентского трафика Отсутствует доступ к сети Станционно- абонентские КРОСС Станционный цех Эксплуатация сети связи Изменение данных техучета Статистика Рисунок 5.2 . Алгоритм ключевых технологических процессов.
71 Формирование реестра для корректировки начислений за услуги связи Нарушение срока Статистика и анализ абонентского трафика Выполняется анализ наличия трафика по записи станционного файла При неисправности телефона более 5 дней не по вине абонента, информация передается в рассчетно- сервисный центр для выполнения корректировки начисления суммы за предоставление услуг связи. Сроки устранения повреждения превышают норматив. Фиксируется техническое заключение причины нарушения сроков, предоставленное руководителями технических служб. Заявление закрыто Завершен алгоритм процесса технического обслуживания заявления абонента Банк базы данных Формируется банк базы данных Формирование статистической информации для форм отчетности. Выполнение групповых операций для анализа и статистики производственного процесса. Статистика Процесс обновления предусматривает сохранение сформированного банка базы данных, изменения внесенные в «АСР-СТАРТ» за определенный период. Обновление банка базы данных Рисунок 5.3 . Статистика и анализ трафика.
72 Заявление о повреждении Заявлением о повреждении считается каждое сообщение о неисправном действии телефонной связи, поступившее на ГТС, СТС по телефону или письменно от абонентов или других граждан, пользующихся телефонной связью, имеющим следующий характер: а) телефонная связь полностью или частично б) имеет место плохая слышимость в) телефонный аппарат или его части имеют повреждения; г) длительно отсутствует сигнал «ответа станции»; д) абонент не отвечает на вызов; е) телефон абонента длительно занят. Если бюро ремонта не предупреждалось о ремонтных и плановых работах исполнителями, а от абонентов поступят заявления на эти нарушении связи, то последние должны быть приняты и учтены, как заявления в обычном порядке. Все заявления абонента фиксируются заносятся в контрольный лист (ф.ТФ 2/1) текущего дня и фиксируются в абонентских карточках (ф.ТФ2/2) Кроме того, все заявления, поступившие на ЦБР и обслуженные ЦБР фиксируются счетчиками поступающей и обслуженной нагрузки (схема ЦБР с комплектами ожидания). Показания счетчиков снимаются ежедневно. Справочно-информационного характера и заявления отнесенные к повреждениям К числу заявлений не относятся сообщения обслу- живающего персонала ГТС, СТО о случаях нарушения связи, выявленных при профилактических проверках, ремонтных и других эксплуатационных работах. При временном выключении нормально работающих связей но причинам: ремонта линейных и станционных сооружений, измерений, переключений и др., абоненты предупреждаются работниками ЦБР о продолжительности перерыва связи, данные формируются в абонентскую карточку форма ТФ2/2 с кодом буквой Р. Заявления о повреждении этих телефонов учитываются как справочного характера. Сообщения обслуживающего персонала Документированная процедура Классификация заявления Заявление справочного характера Предоставление справочно-информационной поддержки с элементами технической поддержки. Разъяснения по во- просам, связанным с пользованием телефона. Информирование заявителя об необходимости обращения в другую инстанцию по вопросам не своей компетенции Рисунок 5.4 . Заявления о повреждениях
73 При поступлении заявки па исправление повреждения номера, работающего по ведомственной сети, монтер линейно-абонентского цеха проверяет до границы обслуживаемой территории, о чем делается запись в абонентской карточке. Если повреждение на обслуживаемой телефонным узлом территории, то оно отмечается обычным порядком. Если повреждение находится на территории, обслуживаемой ведомственной сетью или абонентом, об этом ЦБР сообщает им. В абонентской карточке и контрольном листе делается отметка «Вед». При невозможности сообщения карточка откладывается в ДЗ (шифр ДЗвед.) . Карточка возвращается в картотеку после исправления повреждения. Устранение линейно-аппаратных повреждений откла- дывается до вторичного заявления (ДЗ), если в учреждении выходной день, монтѐр не застал абонента дома, закрыт доступ к распределительному шкафу (РШ), распределительной коробке (ГК), кабельному ящику, в помещении идѐт ремонт, имеет место захламлѐнность и антисанитарное состояние помещений. Номер телефона оформляется шифром «ДЗ» и передаѐтся с указанием причины руководителю (инженеру или технику). Инженер «линии» обязан лично проконтролировать правильность отложенных повреждений «ДЗ» и вместе с работником ЦБР принять меры к устранению повреждений в кратчайший срок. При отсутствии доступа к телефону (закрыта квартира, комната),электромонтѐр обязан оставить абоненту извещение (формы ТФ 2/15) с просьбой сообщить, когда абонента можно застать дома и сообщает об этом в ЦБР, а корешок от извещения сдаѐт инженеру (электромеханику) линейно- абонентского цеха. Прежде чем отложить исправление телефона до вторичного заявления, работник монтѐрского стола обязан прозвонить абонента (в случае аппаратного повреждения) или проверить с электромонтером линейно-абонентского цеха исправность линии из распределительной коробки. Если повреждение откладывается до вторичного заявления абонента, то в контрольном листе делается отметка «ДЗ» и в абонентской карточке указывается причина невозможности исправления. Контроль за правильностью записи в абонентской карточке и контрольном листе ведет инженер бюро ремонта. На следующий день эта заявка в контрольный лист вписывается цветными чернилами. Если абонент делает заявку в течение назначенного дня или на следующий рабочий день, то ярлык следует учесть к а к «справка», а с абонентом согласовать время прихода электромонтѐра. Если абонент за эти два дня не обратился в бюро ремонта, в абонентской карточке производится запись «ДЗ», в контрольном листе номер вычѐркивается и карточка кладѐтся в статистику. В том случае, когда абонент заявил в последующие дни, заявка оформляется обычным порядком в зависимости от результатов проверки Отсутствует доступ к сети Рисунок 5.5. Абонентский доступ
74 - периодический контроль, при котором оборудование проверяется через постоянные или через случайные промежутки времени; - комбинированный контроль, при котором оборудование проверяется непрерывным и периодическим контролем. Для характеристики работы системы управления необходимо исполь- зовать следующие показатели: - среднее время проверки сетевого элемента; - среднее или постоянное время между периодическими проверками (тестирование); - интенсивность ошибки периодического контроля I рода; - условная вероятность ошибки периодического контроля I рода, при условии, что контролируемый сетевой элемент работоспособен; - условная вероятность ошибки периодического контроля II рода, при условии, что контролируемый сетевой элемент неработоспособен; - условная вероятность ошибки контроля III рода, при условии, что контролируемый сетевой элемент работоспособен; - вероятность неполного восстановления, при котором неработоспо- собное оборудование после процедуры восстановления включается в рабочую конфигурацию. Для оценки надежности сетевого элемента и качества его работы ис- пользуются следующие показатели: - коэффициент простоя; - наработка на отказ; - средняя продолжительность состояния сетевого элемента с необнару- женным отказом; - среднее время восстановления; - среднее время простоя; - вероятность состояния с необнаруженным отказом сетевого элемента в произвольный момент времени; - вероятность того, что сетевой элемент заблокирован в произвольный момент времени; - средняя вероятность потерь нагрузки. Наиболее важными параметрами для оценки надежности сетевого эле- мента являются интенсивность отказов (ω) и интенсивность восстановления (μ). Система контроля характеризуется ошибками контроля, временем между проверками технического состояния и длительностью проверки. Для определения этих параметров, согласно разработанным в работе моделям надежности необходимо фиксировать следующие события: - общее количество периодических проверок; - количество периодических проверок в результате которых был вы- ключен из эксплуатации работоспособный сетевой элемент; - количество отказавших сетевых элементов, которое было «пропуще- но» непрерывным контролем и зафиксировано периодическим;
75 - число случаев, при которых работоспособный сетевой элемент был выведен из эксплуатации в результате периодической проверки; - число отказов сетевого элемента, выявленных непрерывным контро- лем; - количество восстановленных сетевых элементов; - суммарное время восстановления; - число случаев, при которых сетевой элемент после восстановления оказывался неработоспособным; - число случаев повторного испытания, при котором обнаружены сбои в работе сетевого элемента; - время эксплуатации сетевого элемента, за которое накоплена стати- стика отказов. Следует отметить, что постоянный контроль осуществляется независи- мо от интенсивности нагрузки в сети. Периодический контроль осуществля- ется тестовыми программами, встроенными в систему. Частота запуска тес- тов является внутренним параметром системы, который не всегда можно из- менить директивой. Интенсивность контроля прямо пропорциональна интен- сивности сетевой нагрузке. Эффективность любой системы контроля и диаг- ностики определяется, как измеряемая способность нормально функциони- ровать и справляться с ошибками и сбоями в аппаратных и программных средствах или других событиях, которые могут нарушить нормальное ее функционирование. В основном эти системы базируются на процедурах са- монаблюдения и самодиагностики и предполагают минимальное прерывание нормального трафика, при этом обеспечивается быстрое выявление, анализ, идентификация и локализация неисправностей, аварийная сигнализация, формирование детального рапорта. Рапорт хранится внутри системы в виде записи в базе данных [35]. Применение сервера для сбора статистики облада- ет рядом достоинств: - сокращение время обслуживания пользователя, в момент обращения , за счет увеличения скорости обработки информации; - единая база данных позволит провести анализ показателей различных форм отчета и оптимизировать их состав, что в свою очередь приведет к уп- рощению процедуры статистического анализа; - структурированный доступ к предыдущим отчетам позволит гораздо быстрее составлять новые отчеты и выполнять статистический анализ (не дожидаясь ежемесячного периода закрытия и обновления банка базы дан- ных); - предоставление возможности формирования более конкретных пла- нов по текущему и капитальному ремонту сети, а так же ее обслуживание; - возможность корректировки также значительно ускорит и упростит отчетность, даже после внесения корректировок данные представлены в од- ном экземпляре, что исключает недостоверность данных; - четкий контроль и мониторинг сети на местном и удаленном уровне.
76 Заключение Качество связи во многом зависит от эффективности управления и ка- чества (глубины) контроля, осуществляемого за состоянием сетей связи. Хо- рошо организованное управление сетями связи и качественный контроль над их состоянием позволяет обеспечить устойчивое и бесперебойное функцио- нирование сети. Другими словами, организация управления во многом опре- деляет эффективность управления, то есть, чем правильнее организован про- цесс управления, тем выше эффективность управления и соответственно, выше качество услуг электросвязи, предоставляемых пользователям. С целью обеспечения оптимального функционирования сети связи и совершенствования процесса управления необходимо разрабатывать меро- приятия по повышению эффективности работы системы оперативного управления. Их разработка должна быть основана на рассмотрении реальных инновационных, творческих разработок работников предприятия, результа- тах внедрения новых технологий и программного обеспечения, на осуществ- лении обратной связи с потребителем услуг связи. Применение матричных моделей позволяет находить ряд характеристик моделируемых систем: вероятности нахождения в состояниях и подмножест- вах состояний, предельные вероятности состояний и подмножеств состояний, характеристики нахождения в подмножествах состояний и др. Изложение этого материала имеет прикладную направленность, т.е . материал изложен так, что он может быть использован дипломниками, магистрантами, аспиран- тами и научными работниками для моделирования систем, при решении кон- кретных прикладных задач. Приведенные математические модели относятся к классу аналитиче- ских моделей. С усложнением систем аналитические зависимости между ис- ходными и искомыми характеристиками системы также усложняются и ста- новятся неудобными для практического применения. В этом случае целесо- образно использовать аналитическое моделирование, которое аналогично статистическому моделированию и реализуется в виде машинного алгоритма, когда соответствие между исходными и искомыми характеристиками систе- мы устанавливаются в числовом виде. Применение матричного метода иллюстрируется примерами и задача- ми по моделированию функционирования телекоммуникационного оборудо- вания и систем телекоммуникаций.
77 Приложение А. Таблица 1. Квантили 2  - распределения и коэффициенты для доверительных границ m 2 2 ; 975 , 0 m  2 2; 025 , 0 m  н a В а 1 7,38 0,05 0,27 40 2 11,14 0,48 0,36 8,33 3 14,45 1,24 0,42 4,84 4 17,53 2,18 0,46 3,67 5 20,48 3,25 0,49 3,01 6 23,34 4,4 0,51 2,72 7 26,12 5,63 0,53 2,49 8 28,85 6,91 0,55 2,32 9 31,53 8,23 0,57 2,19 10 34,17 9,59 0,59 2,09 11 36,78 10,98 0,6 2,0 12 39,36 12,4 0,61 1,94 13 41,92 13,84 0,62 1,88 14 44,.46 15,31 0,63 1,83 15 46,98 16,79 0,64 1,79 20 59,34 24,43 0,67 1,64 25 71,42 32,36 0,7 1,55 30 83,3 40,48 0,72 1,48 35 95,08 48,76 0,74 1,44 40 106,6 57,15 0,75 1,4 45 118,1 65,65 0,76 1,37 50 129,6 74,22 0,77 1,35
78 Таблица 2. Точечная оценка средней наработки на отказ По результатам наблюдений за 3 мес. (ч.) m 2 5 10 16 250 500 1 4320 10800 21600 34560 540000 1080000 2 2160 5400 10800 17280 270000 540000 3 1440 3600 7200 11520 180000 360000 4 1080 2700 5400 8640 135000 270000 5 864 2160 4320 6912 108000 216000 6 720 1800 3600 5760 90000 180000 7 617 1543 3086 4947 77142 154286 8 540 1350 2700 4320 67500 135000 9 480 1200 2400 3840 60000 120000 10 432 1080 2160 3456 54000 108000 11 393 982 1964 3142 49091 98182 12 260 900 1800 2880 45000 90000 13 332 831 1663 2659 41538 83077 14 309 771 1543 2469 38571 77143 15 288 720 1440 2304 36000 72000 20 216 540 1080 1728 27000 54000 25 173 432 864 1382 21600 43200 30 144 360 720 1152 18000 36000 35 123 309 617 987 15429 30875 40 108 270 540 864 13500 27000 45 96 240 480 768 12000 24000 50 86 216 432 691 10800 21600
79 Список литературы 1. Аджемов А.С., Кучерявый А.Е . Система сигнализации ОКСNo7 // М.: Ра- дио и связь.2002, - 368с. 2. Гольдштейн Б.С. Сигнализация в сетях связи. // М.: Радио и связь, 2001. Т.1- 448с. 3. ГОСТ 27.002-89. Надежность в технике. Основные понятия. Термины и определения. 4. ГОСТ 24.701—83. Автоматизированные системы управления технологи- ческими процессами. Надежность. Основные положения. 5. ГОСТ 27.503-81. Методы оценки показателей по опытно-статистическим данным. 6. ГОСТ 27.502-83. Надежность в технике. Система сбора и обработки и н- формации. Планирование наблюдений. 7. ГОСТ 27.202-83. Надежность в технике. Технологические системы. Ме- тоды надежности по параметрам качества изготовляемой продукции. 8. ГОСТ Р. 50779.0-95. Статистические методы. Основные положения. 9. ГОСТ 11.005-74. Прикладная статистика. Правила определения оценок и доверительных границ для параметров экспоненциального распределения и распределения Пуассона. 10. ГОСТ 27518-87. Диагностирование изделий. Общие требования. – М.: Изд-во стандартов, 1988. – 6с. 11. ГОСТ 20911-89. Техническая диагностика. Термины и определения. – М.: Изд-во стандартов, 1990. – 13с. 12. ГОСТ Р. 50779.21-96. Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. Ч.1. Нормальное распределение. 13. Денисов В. И ., Лемешко Б. Ю ., Постовалов С. Н . Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим: Методические рекомендации. Часть I. Критерии типа χ 2 . - Новосибирск: Изд-во НГТУ, 1998. - С. 126. 14. Дымарский Я.С., Крутякова Н.П ., Яновский Г.Г. Управление сетями св я- зи: принципы, протоколы, прикладные задачи//Серия изданий «Связь и бизнес», М.:ИТЦ «Мобильные коммуникации», 2003. - 384 с. 15. Захаров Г.П ., Крутякова Н.П ., Горбенко Н.И . Математическое моделиро- вание системы управления сетью связи // Вопросы кибернетики. Прото- колы и методы коммутации в вычислительных сетях. - М.: НСК АН СССР, 1986. – С.80 -100. 16. Зеленцов Б.П . Матричные модели надежности систем: инженерные ме- тоды расчета. - Новосибирск: Наука. Сибирское отделение, 1991. - 112 с. 17. Зеленцов Б.П ., Мелентьев О.Г., Шерстнева О.Г. Моделирование функ- ционирования телекоммуникационных систем Марковскими процессами // Учебное пособие. СибГУТИ, Новосибирск, 2008г. 18. ОСТ 45.149-2001. Система сигнализации No7. Прикладная подсистема подвижной связи. Адресация сообщений. Основные положения. 19. Правила применения автоматизированных систем управления и монит о- ринга сетей электросвязи.Ч.2. [Текст]//Связьинформ. - 2007.- No8-С .23-25.
80 20. Правила применения оборудования автоматизированных систем упра в- ления и мониторинга сетей электросвязи. Ч.3. [Текст]//Связьинформ. - 2009.- No 1/2. - С 6 6-75. 21. Правила применения оборудования для предоставления услуг внутризо- новой, междугородной и международной телефонной связи с помощью телефонистов [Текст]//Связьинформ. - 2009. - No3/4. - С.29-39. 22. Протоколы и методы управления в сетях передачи данных / Под ред. Ф. Ф. Куо. Пер. с англ. — М.: Радио и связь, 1985 – 364 c. 23. Рек.G .602. ITU-T . Надежность. Средняя наработка на отказ. (MTBF- Mean time between failures). 24. Рек. Е .432 МСЭ-Т . Методы испытаний. 25. Рек. Е .421 МСЭ-Т . Наблюдение за качеством службы на статистической основе. 26. Соколов Н.А . Телекоммуникационные сети. Монография в 4-х главах. Часть 2 (глава 2) – М.: Альварес Паблишинг, 2003, – 128 с. 27. Соловьев А.Д . Оценка надежности восстанавливаемых систем. - М.: Зна- ние, 1987.- 123с. 28. Суторихин Н.Б ., Б уров П.Н ., Захарова С.М. Методы определения опти- мальной надежности элементов сетей связи/ Под. ред. Н .Б . Суторихина. - М.: Связь, 1979. - 100с. 29. Услуги связи: правила на каждый день [Текст]: [правила оказания услуг связи] /Мишумин А.//ИнформКурьерСвязь. - 2007.- No9. - С.69 -71. 30. Шерстнева О.Г. Расчет вероятности ошибок контроля в процессе техн и- ческого обслуживания цифровых систем коммутации // «Инфокоммун и- кационные технологии», No2, 2007г. 31. Шерстнева О.Г. Подходы к оценке качества управления связью // «Сети и системы связи», Москва, No11, 2008г. 32. Шерстнева О.Г. Расчет показателей надежности телекоммуникационного элемента сети, охваченного недостоверным контролем //«Инфокоммуникационные технологии», том 6, No4, 2008г. 33. Шерстнева О.Г. Математический метод обработки статистических дан- ных реальной надежности телекоммуникационных систем // «Информа- ционно-измерительные и управляющие системы», Москва, No3, 2010г. 34. Шерстнева А.А ., Шерстнева О.Г. Call-центр. Расчет параметров качества функционирования на основе данных системы мониторинга //«Мобильные телекоммуникации», Москва, No5, 2010г. 35. Шерстнева О.Г., Шерстнева А.А ., Горяева Н.Г. Разработка интерфейса программного продукта для повышения эффективности работы системы управления // «Инфосфера», Новосибирск, No49, 2011г., С.34. 36. Шерстнева О.Г., Шерстнева А.А . Программа имитации функционирова- ния телекоммуникационной сети с учетом реальных показателей наде ж- ности. Свидетельство о регистрации электронного ресурса, No17760, 29.12.2011г.