Текст
                    НАУЧНАЯ СЕРИЯ
НЕЙРОКОМПЬЮТЕРЫ И ИХ ПРИМЕНЕНИЕ
КНИГА 28
А. Л. Татузов
НЕЙРОННЫЕ СЕТИ
В ЗАДАЧАХ
РАДИОЛОКАЦИИ
Издательство «Радиотехника»
Москва, 2009


УДК 681.322 Т23 ББК 32.818 Издание осуществлено при финансовой поддержке И Российского фонда фундаментальных исследований по проекту № 07-08-07023 Научная серия Нейрокомпьютеры и их применение Редактор А. И. Галушкин Кн. 28. Нейронные сети в задачах радиолокации Татузов А.Л. Т23 Нейронные сети в задачах радиолокации. Кн. 28. - М.: Радиотехника, 2009. - 432 с: ил. (Научная серия «Нейрокомпьютеры и их применение»). ISBN 978-5-88070-244-2 Рассмотрены основы построения систем автоматической обработки информации с использованием технологии нейронных сетей для радиолокационных станций. Проведен анализ теоретических моделей различных этапов обработки информации в радиолокаторах: пространственной селекции, временной и спектральной фильтрации сигналов, обнаружения целей, траекторией обработки, распознавания целей, анализа обстановки. Для этих этапов приведены примеры решения задач обработки радиолокационной информации с помощью нейронных сетей. Использованы как известные ней- росетевые модели, так и созданные автором, являющиеся модификациями классических. Отличительной особенностью представленного материала является подробный анализ качества обработки с помощью предложенных методов и их сравнение с традиционными подходами. Рассмотрены перспективы использования нейросетевых методов для решения задач обработки радиолокационной информации. Книга содержит обширную библиографию. Будет полезна научным работникам в области интеллектуальной обработки информации, интересующимися практическими приложениями нейросетевых технологий, а также специалистам в области радиолокации, которые хотят узнать о новых методах синтеза эффективных систем. УДК 681.322 ББК 32.818 ISBN 978-5-88070-244-2 © Автор, 2009 О ЗАО «Издательство «Радиотехника», 2009 О ЗАО «САИНС-ПРЕСС», оригинал-макет, оформление, 2009
Оглавление Введение 7 Часть I Основные идеи автоматической обработки информации в радиолокаторах с помощью нейросетевых технологий Глава 1. Принципы использования нейросетевых технологий при обработке радиолокационной информации 15 1.1. Необходимость полной автоматизации обработки информации в РЛС 15 1.1.1. Предпосылки автоматизации обработки информации в РЛС 15 1.1.2. Сравнительная оценка качества обработки РЛИ в автоматических и неавтоматических системах 19 1.2. Анализ основных этапов обработки информации в радиолокаторах 24 1.2.1. Пространственная селекция 25 1.2.2. Временная и спектральная фильтрация 27 1.2.3. Обнаружение отметок от целей 29 1.2.4. Траекторная обработка целей 31 1.2.5. Распознавание целей 32 1.2.6. Анализ обстановки и адаптация 34 1.3. Анализ недостатков сложившейся методологии синтеза методов обработки радиолокационной информации 34 1.4. Примеры зарубежного опыта использования нейронных сетей для обработки радиолокационной информации 41 Глава 2. Основные модели нейронных сетей для использования при обработке радиолокационной информации 49 2.1. Основные принципы нейросетевых технологий 49 2.1.1. Определение нейронных сетей 49 2.1.2. История развития технологии нейронных сетей 52 2.1.3. Основные нейросетевые модели 55 2.1.4. Место нейронных сетей в задачах радиолокации 64 2.2. Анализ основных нейросетевых парадигм 65 2.2.1. Многослойный персептрон 69 2.2.2. Ассоциативная память Хопфилда 93 2.2.3. Самоорганизующиеся карты признаков Кохонена 98 Глава 3. Оценка качества работы радиолокационной станции и ее подсистем 106 3.1. Иерархическая система показателей качества обработки радиолокационной информации 106 3.2. Принципы оценки качества обработки радиолокационной информации в сложных условиях 118 3.3. Математические модели входных сигналов для различных этапов обработки информации в радиолокаторах 120 3
Нейронные сети в задачах радиолокации 3.3.1. Модели входных сигналов на основе известных распределений 121 3.3.2. Моделирование смешанных распределений случайных величин 128 3.4. Методы ускорения статистических расчетов при оценке эффективности обработки радиолокационной информации 137 3.4.1. Использование методов существенной выборки для ускорения статистических расчетов 137 3.4.2. Процедура ускоренного статистического анализа 142 Часть II Нейронные сети для различных этапов обработки радиолокационной информации Глава 4. Нейросетевые методы пространственной и спектральной фильтрации радиолокационных сигналов 149 4.1. Обработка информации в фазированных антенных решетках 149 4.1.1. Традиционная обработка информации в фазированных антенных решетках 150 4.1.2. Представление функционирования фазированной антенной решетки в нейросетевом базисе 155 4.1.3. Анализ результатов нейросетевой адаптации фазированных антенных решеток 160 4.1.4. Методы нейросетевой адаптации фазированных антенных решеток при ограничениях на весовые коэффициенты 162 4.2. Анализ нейросетевых методов спектральной обработки 165 4.2.1. Традиционные методы спектральной обработки 165 4.2.2. Нейросетевое представление нелинейных методов спектральной обработки 167 4.2.3. Особенности оценки качества спектральной обработки при нелинейном характере алгоритмов 170 4.3. Генетические алгоритмы многопараметрической оптимизации 176 4.3.1. Основы теории генетических алгоритмов 183 4.3.2. Реляционная база данных по многобазовым сигналам 189 4.3.3. Результаты генетического синтеза радиолокационных сигналов 190 Глава 5. Нейросетевые методы обнаружения радиолокационных сигналов 193 5.1. Анализ эффективности традиционных методов автоматического обнаружения 193 5.1.1. Методы автоматического обнаружения с адаптивным порогом 194 5.1.2. Ранговые обнаружители и знаковые корреляторы 211 5.1.3. Автоматические обнаружители на основе анализа характера помех 219 4
Оглавление 5.2. Нейросетевые модели для эффективной реализации модифицированных традиционных автоматических обнаружителей 221 5.2.1. Формальная постановка задачи обнаружения целей в неизвестных помеховых условиях 221 5.2.2. Субоптимальный алгоритм обнаружения радиолокационных импульсов 229 5.2.3. Нейросетевые алгоритмы эффективного ранжирования опорной выборки 234 5.2.4. Нейросетевое представление накопления пачек радиолокационных импульсов 237 5.3. Нейросетевые модели для автоматического обнаружения целей 241 5.3.1. Анализ работы многослойного персептрона с точки зрения статистической теории различения гипотез 245 5.3.2. Обучение нейронной сети с учителем для критерия Неймана-Пирсона 249 5.3.3. Обучение нейронной сети для критерия гарантированного результата в неопределенной обстановке 254 Глава 6. Нейросетевые методы формирования и сопровождения траекторий радиолокационных целей 259 6.1. Анализ традиционных методов формирования траекторий 259 6.1.1. Общая характеристика системы траекторной обработки радиолокационной информации 259 6.1.2. Методы отождествления отметок 263 6.1.3. Экстраполяция координат 269 6.1.4. Качество работы традиционных методов траекторной обработки ....272 6.2. Ассоциативное воспроизведение отметок для эффективного отождествления целей 280 6.2.1. Представление ассоциативной памяти Хопфилда в векторном виде для разреженных образов 280 6.2.2. Обобщение нейросетевой модели для инвариантного относительно сдвигов ассоциативного воспроизведения образов 283 6.2.3. Нейросетевое ассоциативное воспроизведение отметок от целей 288 6.2.4. Анализ эффективности нейросетевого метода ассоциативного отождествления отметок от целей 294 6.2.5. Исследование вероятностей воспроизведения ложных образов 299 6.2.6. Моделирование методов ассоциативного воспроизведения образов групп целей 302 Глава 7. Нейросетевые методы анализа и оценки обстановки 310 7.1. Нейросетевые методы распознавание классов целей 310 7.1.1. Традиционные методы распознавания целей 310 7.1.2. Типовые нейросетевые архитектуры решения задач распознавания образов 314 5
Нейронные сети в задачах радиолокации 7.1.3. Сравнительный анализ традиционных и нейросетевых методов распознавания 318 7.2. Анализ задач комплексирования информации от нескольких источников 322 7.2.1. Повышение вероятности обнаружения целей при объединении информации от нескольких источников 322 7.2.2. Улучшение точности определения координат целей при комплексировании источников информации 329 7.2.3. Нейросетевая модель объединения информации от нескольких источников на основе самоорганизующихся карт Кохонена 340 7.3. Нейросетевые методы анализа и оценки обстановки 345 7.3.1. Задача выбора наиболее опасных целей 346 7.3.2. Система выбора опасных целей на основе традиционных методов принятия решений и нечеткой логики 347 7.3.3. Нейросетевая подстройка параметров системы поддержки принятия решений 349 Часть III Пути реализации нейросетевых технологий и направления дальнейших исследований Глава 8. Перспективы нейросетевой технологии для совершенствования обработки радиолокационной информации 356 8.1. Анализ эффективности систем обработки радиолокационной информации при использовании нейросетевых методов 356 8.2. Требования к специализированным вычислительным средствам поддержки нейросетевых вычислений 378 8.3. Этапы внедрения нейросетевых технологий в системы обработки радиолокационной информации 382 Глава 9. Аппаратные и программные акселераторы вычислений для поддержки нейросетевых методов при решении задач обработки радиолокационной информации 389 9.1. Аппаратные средства поддержки нейросетевых вычислений 389 9.1.1. Специализированные нейросетевые процессоры и платы 389 9.2. Специальная программная реализация нейросетевых парадигм на традиционных процессорах 399 9.3. Сравнительный анализ производительности программных и аппаратных средств поддержки нейросетевых вычислений 403 Заключение 406 Литература 417 6
Введение Современные радиолокаторы должны работать в условиях, для которых характерны высокая скорость изменения внешней обстановки и большой объем подлежащих обнаружению объектов [20]. Обработка столь больших объемов информации в требуемые сжатые сроки не может быть эффективно осуществлена человеком-оператором [41; 99]. Поэтому перед радиолокационными станциями (РЛС), являющимися основным источником информации, еще в конце 70-х годов была поставлена задача проведения законченного цикла ее автоматической обработки [63; 64; 97]. В отличие от применявшихся ранее систем обработки, в которых конечным звеном, принимающим решения, был человек- оператор, в этих образцах решения принимаются автоматом [62; 105; 172; 360]. Для разработки подобных систем потребовалось создание теории автоматической обработки радиолокационной информации (РЛИ). Среди наиболее значимых в этом направлении работ можно выделить труды Бауманской школы П.С. Акимова, И.Б. Власова, Б.А. Розанова [4; 105], работы Б.Р. Левина [69; 70], Я.Д. Ширмана [105; 151], С.З. Кузьмина [62-64], В.И. Тихонова [133], Г.А. Степанова [25], Р.П. Быстрова [19], Ю.Г. Сосулина [114] и др. [4; 105]. В их работах представлены методы, способные осуществлять автоматическую обработку радиолокационной информации. Однако в большинстве этих работ использованы положения классической теории радиолокации, опирающейся на предположения, многие из которых не выполняются на практике. Необходимость использования этих предположений обусловлена трудностью формализации и математического описания всего многообразия воздействующих помех и других факторов, отсутствием единой методологии оценки систем обработки в различных воздушных и помеховых условиях. При создании образцов РЛС с автоматической обработкой информации выяснилось, что классическая теория часто оказывается неприменима [62; 105]. За прошедшие годы, несмотря на значительные усилия, предпринятые для преодоления выявленных трудностей, построить универсальную теорию автоматической обработки радиолокационной информации не удалось. Действительно, оценки показывают, что если в достаточно простых условиях современные радиолокационные средства успешно справляются со своими задачами, то в сложных условиях (интенсивного 7
Введение налета, нестационарных и негауссовых помех) их эффективность может резко снижаться. Так, при работе в сложных условиях рубежи обнаружения целей могут снижаться более чем на 50%, соответственно уменьшая и дальности поражения целей. Снижается достоверность выдаваемой РЛС информации за счет появления большого числа ложных отметок и появления ложных траекторий. Их число может намного превышать число целей в зоне обзора, а использование недостоверной информации ведет к снижению эффективности стрельбовых средств в несколько раз [96]. Непредсказуемость внешней обстановки и высокая динамика ее изменения создают значительные трудности формализации алгоритмов и обеспечения высокого качества их работы. Появляются и новые задачи, такие как распознавание ситуаций, анализ и прогнозирование обстановки, адаптация режимов работы. Возникает необходимость использования априорной информации о характере действия противника, зачастую выраженной в нечеткой форме. Классических методов их решения нет. Одним из многообещающих направлений построения эффективных систем обработки информации, широко применяемым за рубежом, является использование новой информационной технологии - технологии нейронных сетей. Нейронные сети позволяют, с одной стороны, если алгоритмы известны и не хватает вычислительных мощностей, после представления алгоритма в нейросетевом базисе, использовать мощные аппаратные средства с массовым параллелизмом. Там же где алгоритмов не существует или они недостаточно эффективны нейронные сети предлагают многообещающий подход к созданию систем обработки, обладающих столь привлекательными чертами как гибкость, способность адаптироваться к изменениям внешних условий, сохраняя устойчиво высокое качество работы. Это прямое следствие заимствования структуры и свойств у биологических объектов. Главные достоинства нейронных сетей можно разделить на две основные группы: алгоритмические и аппаратные. Нейронные сети предусматривают применение принципиально нового подхода к синтезу методов обработки в алгоритмическом смысле. Данная технология предоставляет компьютерной системе возможность обучаться на примерах, а искусственные нейронные сети - получать решения для проблем, ранее считавшихся неразрешимыми без участия человека. При этом достигается гибкость и адаптивность работы, ро- бастность или сохранение устойчиво высоких показателей работы при отличиях внешних условий, от рассматриваемых на этапе разработки (способность к обобщению), возможность построения эффективных систем без трудоемких, а зачастую и невыполнимых, построений анали- 8
Введение тических описаний, способность оперирования нечеткими (т.е. не пред- ставимыми в виде однозначно заданных величин) понятиями и др. Кроме того, за счет специальных архитектур, использующих множество одинаковых, достаточно простых элементов, появляется возможность применения параллельных вычислительных средств, причем простота элементов позволяет реализовывать массовую параллельность вычислений. Достигаемое с помощью распараллеливания повышение быстродействия может достигать сотен и даже тысяч или более раз. Нейронные сети в последнее время успешно применяются в широком спектре приложений от бытовых приборов, в которых с их помощью осуществляется выбор наиболее благоприятных режимов работы, до крупномасштабных систем финансового анализа и сложнейших вычислительных комплексов управления военными действиями. Все это свидетельствует о необходимости внедрения нейросетевой технологии в перспективные системы обработки информации и, в первую очередь, системы разведки, в которых необходимо с высокой скоростью обрабатывать большие массивы данных для получения достоверных результатов о складывающейся обстановке. Естественно желание разработчиков применить столь успешную технологию и при обработке радиолокационной информации. Однако наряду с положительными эффектами, имеет место некоторая необоснованная эйфория. Некоторые исследователи, впервые применившие нейронные сети и получившие решения, там, где знакомые им методы не приводили к положительным результатам, стали считать, что нейронные сети могут все и являются панацеей от всех возможных проблем. Здесь сыграло определенную роль и сходство (по крайней мере, поверхностное) процесса функционирования нейросетевых алгоритмов с работой биологической нейронной сети или даже мозга. Важно понимать, что нейронные сети заимствовали у живых организмов лишь структуру и способ организации логических элементов, которые образуют многосвязную структуру. Работа формального нейрона, несмотря на название, имеет очень отдаленное отношение к функционированию его биологического аналога. Если учесть, что в настоящее время среди биологов нет единого взгляда даже на общие принципы работы нейронной сети, то следует признать, что ожидать четкого понимания и адекватного моделирования даже простейших нейронных образований можно лишь в отдаленном будущем. В то же время, теория искусственных нейронных сетей и не претендует на объяснение биологических феноменов жизни, сознания и мышления. Она представляет собой скорее алгоритмический аппарат построения систем принятия решений на основе сетей формальных нейронов. Причем в качестве формальных нейронов рассматриваются простые элементы, реализующие элементарные арифметические функции. 9
Введение И именно простота основных элементов составляет одно из главных преимуществ нейросетевой технологии - возможность построения высокопараллельных аппаратных устройств, реализующих нейросетевые парадигмы. В настоящее время теория искусственных нейронных сетей имеет свои научные основания скорее в математической статистике и статистической теории принятия решений, чем к биологии. Поэтому никаких чудес здесь быть не может и нет. Принятие этих тезисов позволяет исследовать нейросетевые методы с помощью традиционного математического аппарата или развивая этот аппарат, но оставаясь в рамках традиционных математических парадигм. Это значит, что получить с помощью нейронных сетей решения лучшие, чем оптимальные, невозможно. Поэтому утверждения некоторых слишком увлекшихся перспективами нового направления исследователей о том, что нейронные сети якобы могут обеспечить качество функционирования лучше, чем оптимальное, что традиционная теория статистических решений устарела, не имеют под собой никаких оснований и должны вызывать законное сомнение со стороны серьезных ученых. Часто можно слышать и такие далекие от истины утверждения, как возможность обеспечения с помощью нейронных сетей единичной вероятности принятия правильных решений даже для функций распределений, не обращающихся в нуль в пространстве входных сигналов. Это утверждение далеко от истины. В целом можно сказать, что нейросетевые технологии позволяют приблизиться сколь угодно близко к истинно оптимальным решениям для сложных и нетривиальных условий принятия решений, не более того, хотя получение такого приближения является очень важным звеном во многих, если не в большинстве, практических приложений. Для успешного применения нейросетевой технологии в процессах обработки радиолокационной информации должны быть тщательно проанализированы условия использования, этапы преобразования входных данных, обоснованы принципы оценки качества обработки, определены места наиболее перспективные места применения. Наибольшую эффективность принесут подробные исследования возможностей повышения качества обработки информации за счет использования нейросетевой технологии в каждом из типов подсистем обработки в зависимости от физической структуры входных и выходных сигналов, места их применения, характера изменения внешних условий. Объем подобных исследований при этом оказывается очень широк, и охватить весь спектр возможных применений нейронных сетей в полном объеме не удается. В этих условиях встает задача вычленения подобных между собой этапов обработки информации в разнородных системах, эффективность которых могла бы быть резко повышена за счет применения нейронных сетей. 10
Введение Предварительный анализ показывает, что возможно создание унифицированных нейросетевых средств (или, по крайней мере, методов и способов) обработки информации, применение которых в перспективных средствах разведки позволит достичь высокой эффективности и гибкости, адаптивности к изменениям внешних условий и решаемых задач, при возможности полного исключения человека-оператора из цикла функционирования. Полученные в ходе исследований результаты позволят обеспечить высокое качество работы систем обработки информации, практически сравнимое с работой человека, при неизмеримо больших объемах информации и скоростях. Общая структура книги содержит три части и девять глав. В части I изложены основные идеи обработки радиолокационной информации с помощью нейронных сетей. В главе 1 рассмотрены основные принципы построения радиолокационных систем, указаны основные задачи обработки радиолокационной информации. Показана необходимость автоматизации процесса обработки. Причем, речь идет не о частичной автоматизации, когда автомат лишь служит дополнительным помощником оператору или командиру, но о полной автоматизации и исключении человека из процесса обработки. Проведен краткий обзор основных этапов всего цикла обработки радиолокационной информации с указанием основных трудностей, возникающих при автоматизации. Дано обоснование необходимости поиска новых подходов к построению систем обработки из- за неспособности классических методов автоматизации справиться с поставленными задачами. Одним из таких методов может стать использование новых нейросетевых технологий. Глава 2 посвящена обзору нейросетевых моделей, рекомендуемых для повышения качества обработки радиолокационной информации в сложных условиях. Среди всего многообразия известных моделей выбрано три основных типа: многослойный персептрон и его самая распространенная модификации и широко используемая модель; ассоциативная память Хопфилда, одна из первых моделей, реализующая характерную для мозга способность воспроизводить образы по ассоциации; самоорганизующиеся карты признаков Кохонена, которые могут выделять внутреннюю структуру данных и упорядочивать их в соответствии с установленной заранее топологией. В разделе приводятся основные сведения об этих моделях и указывается, для каких задач приведенные модели могут оказаться полезными. Даются рекомендации по использованию различных нейросетевых архитектур с учетом особенностей обработки радиолокационной информации. Предложена концепция поэтапного перехода к максимальному использованию нейросетевых методов в задачах радиолокации. 11
Введение Для того чтобы проводить синтез нейросетевых алгоритмов, способных решать трудные задачи обработки радиолокационной информации необходимо корректно оценивать качество решения этих задач в различных условиях, в том числе и сложных, в которых традиционные методы оказываются неэффективными или совсем неработоспособными. Глава 3 посвящена вопросам оценки качества выходной информации для различных систем и устройств радиолокатора. Вводится иерархическая система показателей качества для радиолокационной системы в целом и каждого из этапов обработки радиолокационной информации. Предлагаются методы оценивания показателей качества, в том числе и в сложных, заранее неизвестных условиях. В части II проводится анализ конкретных этапов обработки и предлагаются нейросетевые методы для улучшения их качества в сложных условиях. Для каждого из этапов приводится традиционная схема решения входящих в него задач, анализируются присущие им недостатки и даются предложения по использованию нейросетевых технологий для преодоления этих недостатков. Глава 4 посвящена методам пространственной и частотно-временной селекции радиолокационных сигналов. Здесь нейронные сети оказываются полезными для реализации адаптивности пространственной и частотной избирательности, эффективного поиска оптимизационных решений, повышения быстродействия за счет использования массового параллелизма. В главе 5 рассматривается один из наиболее важных этапов автоматической обработки - обнаружение отметок от целей. Именно на этом этапе начинают проявляться наибольшие трудности автоматизации процессов обработки РЛИ. Классические подходы к построению автоматических обнаружителей предполагают два основных направления. Это синтез параметрических и непараметрических обнаружителей. Синтез параметрических обнаружителей предполагает выбор некоторых семейств распределений, в которых предполагается обеспечивать эффективную работу, и построение оптимальных обнаружителей на основе статистической теории принятия решений. При этом сделать обоснованный выбор распределений обычно не удается, что ведет к снижению качества обнаружения в реальных условиях. Непараметрические обнаружители также опираются на некоторые предположения, такие как независимость процессов обнаружения отсчетов сигнала, что не всегда соответствует действительности. Кроме того, при малых выборках такие обнаружители имеют высокие энергетические потери. Вместо классических подходов при синтезе автоматических обнаружителей оказывается более целесообразным использовать технологии нейронных сетей. Опираясь на способность нейронных сетей обучаться на примерах, 12
Введение удается построить эффективные методы обнаружения целей. Это вовсе не означает, что классическая теория статистических решений оказывается не у дел. Только опираясь на статистические методы можно построить надежную нейросетевую систему. Помимо этого полезными могут оказаться и удачные комбинации традиционных методов с нейронными сетями. Вся совокупность этих вопросов обсуждается в данной главе. Обнаруженные отметки проходят вторичную траекторную обработку, в ходе которой проводится отсеивание основной массы ложных отметок, а также определяются скорости перемещения целей. Основные трудности на этом этапе обусловлены высокой вероятностью неправильной идентификации отметок от целей, получаемых на последовательных периодах обзора локатора. Также не всегда удается правильно построить траекторию маневрирующих целей. Для обеспечения надежной идентификации отметок и для уточнения траекторий их перемещений целесообразно использовать нейросетевые алгоритмы. Этим вопросам посвящена глава 6 книги. Основное предназначение всех предыдущих этапов работы заключается в предоставлении данных для окончательного этапа анализа полученной информации. В главе 7 рассматриваются методы анализа обстановки, включая распознавание целей, комплексирование информации от различных источников, выбор наиболее значимых целей. Проводится исследование традиционных подходов к построению систем распознавания целей и нейросетевых алгоритмов для решения этой задачи. Показывается преимущество нейросетевых алгоритмов для типичной задачи распознавания классов целей. Также рассматриваются оптимальные алгоритмы объединения информации от нескольких источников и предлагается нейросетевая модель идентификации целей на основе самоорганизующихся карт признаков Кохонена. В качестве примера задачи анализа обстановки рассматривается типичная задача - выбор опасных целей. Проводится анализ методов принятия решений и нечеткой логики для построения таких систем и предлагается представление построенной системы в нейросетевом базисе для эффективной подстройки внутренних параметров алгоритма. В заключительной части III подводится итог приведенных исследований по синтезу нейросетевых методов обработки радиолокационной информации, намечаются пути их внедрения в перспективные радиолокаторы, определяются требования к вычислительным средствам, способным реализовывать параллельную обработку данных, оценивается предполагаемая эффективность предлагаемых решений. В главе 8 определяются перспективы применения нейросетевых технологий в радиолокаторах на основе оценки эффективности их при- 13
Введение менения и необходимой для их использования производительности вычислительных средств. Предлагается концепция поэтапного внедрения технологий нейронных сетей в практику обработки радиолокационной информации. Глава 9 посвящена анализу основы построения специализированных средств поддержки нейросетевых вычислений, использующих свойственное нейронным сетям свойство параллельности вычислений. Рассматривается реализация парараллелизации вычислений как с помощью распространенных аппаратных средств, так и на основе использования особенностей архитектуры современных процессоров с внутренней параллельностью команд на основе технологий ММХ, SSE и их модификаций с использованием специализированных библиотек, предназначенных для максимального использования преимуществ этих технологий. 14
ЧАСТЬ I Основные идеи автоматической обработки информации в радиолокаторах с помощью нейросетевых технологий Эта часть посвящена введению в проблематику автоматической обработки радиолокационной информации и в теорию нейронных сетей. Определяются основные принципы оценивания автоматических систем обработки. Глава 1. Принципы использования нейросетевых технологий при обработке радиолокационной информации 1.1. Необходимость полной автоматизации обработки информации в РЛС 1.1.1. Предпосылки автоматизации обработки информации в РЛС. Для перспективных радиолокационных станций (РЛС) одним из главных требований становится автоматизация работы [62; 105], включая обработку радиолокационной информации (РЛИ) и формирование информации для потребителя (обнаружение отметок от целей, формирование по ним траекторий, анализ обстановки и т.д.). Для этого существует целый ряд причин (рис. 1.1): объем информации становится таким значительным, что восприятие его человеком становится невозможным, ни один человек не сможет сопровождать десятки целей в зоне обзора, одновременно учитывая возможные варианты их будущего поведения, особенно учитывая высокую психологическую напряженность действий, требующих повышенного внимания [41; 99]; используемая потребителем информация становится все более разнородной и разнотипной, приходится определять координаты целей, 15
Глава 1 16
Принципы использования нейросетевых технологий при обработке.. включая скорости и ускорения их изменения, спектральные характеристики отраженных сигналов, динамику их изменения во времени [153; 172; 261]; необходимая скорость обработки информации значительно превышает человеческие возможности, так как помеховые и тактические условия могут изменяться с характерным временем несколько миллисекунд [90; 105; 306]; требования по надежности работы не позволяют использовать человека в наиболее важных звеньях обработки информации, вследствие его подверженности стрессам [38; 41; 104]; качественная обработка информации человеком оператором возможна только при условии достаточно длительного и дорогостоящего обучения, в ходе которого должен проходить достаточно жесткий профессиональный отбор [9; 41; 172], что в настоящих условиях весьма затруднительно; немаловажным обстоятельством является стремление исключить человеческие звенья в тех местах, которые в наибольшей степени могут подвергаться поражающему воздействию со стороны противника, а это - сенсорные источники информации, активно воздействующие на окружающую среду и тем существенно демаскирующие свое местоположение. Единственным выходом в этих условиях является максимальная автоматизация информационных систем и практически полное исключение человека из этапов обработки информации [51; 172; 208; 360]. Вместе с тем взрыв информационной революции создал и ряд предпосылок для реализации этих требований по автоматизации информационных систем. К ним можно отнести теоретические, технологические и программные. Теоретические: развитие теоретических вопросов искусственного интеллекта, таких как экспертные системы, нейронные сети, нечеткая логика и др., в настоящее время достигло такой ступени развития, что возможно их успешное применение не только в модельных, но и в ряде практически важных задач [24; 78; 91; 100]; появление ряда работ и теоретических направлений, в которых рассматриваются проблемы автоматической обработки информации, причем, многие из них представляет собой достаточно полные системы, готовые к практическому применению [62; 70; 105; 133]. Технологические: повышение общей производительности вычислительных средств; если ранее возможность использования наиболее эффективных методов могла рассматриваться только в рамках дорогостоящих и значительных по массогабаритным характеристикам устройств и систем, и то не в полной мере, и была доступна только крупнейшим научно-исследова- 17
Глава 1 тельским центрам с использованием суперкомпьютеров, то сейчас многие трудоемкие в вычислительном отношении алгоритмы используются даже в бытовых компьютерах и вполне возможно их использование в мобильных образцах вооружения [152]; все шире развиваются направления создания специализированных процессоров, ориентированных на конкретные методы, при использовании которых общее эквивалентное быстродействие компьютерных систем возрастает на несколько порядков; к ним можно отнести помимо сигнальных процессоров, известных и ранее, нейрочипы и нейроплаты с массовым параллелизмом, процессоры нечеткой логики, лисп-процессоры и др. [144]. Программы ые: в последнее время появился целый ряд удобных и эффективных программных средств, позволяющих качественно решать задачи обработки данных, включая спектральный, пространственно-временной, регрессионный и корреляционный анализ, статистическую обработку, кластеризацию, выделение признаков и классификацию и др. [6; 39; 106]; имеется набор средств программирования для специализированных аппаратных средств, способных обеспечить удобный для пользователя интерфейс при формировании конкретных приложений, ориентированных на решаемые задачи [20; 150]; зародился и интенсивно расширяется новый класс инструментальных средств, способных помогать разработчику создавать средства разработки приложений - это объектно-ориентированное программирование, средства быстрой разработки приложений с визуальным интерфейсом (RAD средства), CASE средства и постепенно появляющиеся системы программирования с ориентацией на естественные языки [32; 176]. Таким образом, на нынешнем этапе развития вооружения можно уверенно утверждать, что современные системы вооружения без высокоразвитых, автоматических, информационных систем невозможны и их применение в боевых операциях не сможет обеспечить необходимую эффективность. Громадный технологический скачок в области информационных и вычислительных средств позволяет утверждать, что существуют реальные возможности создания таких информационных средств, в которых остро нуждаются системы оружия. Чрезвычайно возросшая роль информационных систем в современном вооружении и автоматизация их работы приводят к необходимости отказа от традиционных схем обоснования требований к источникам информации, в том числе к радиолокационным станциям, и заставляют по- новому взглянуть на принципы оценки этих систем. Раньше требования предъявлялись к техническим характеристикам и параметрам локатора, при этом имелось в виду, что хорошо обученный специалист способен по данным, выдаваемым на индикатор, формировать правильную ин- 18
Принципы использования нейросетевых технологий при обработке... формацию для потребителя. Эти задачи выполнялись оператором и командиром. При полностью автоматической обработке радиолокационной информации эти задачи должны выполняться устройствами обработки, а у человека остается возможность контроля и вмешательства в случаях необходимости для предотвращения неправильных действий или очень сложной и непредсказуемой обстановки. Тем не менее, функционирование автоматических систем обработки должно осуществляться таким образом, чтобы обеспечивать приемлемую эффективность даже при существенном изменении внешних условий. Отсюда следует необходимость предъявления требований к устройствам автоматической обработки по сохранению высоких показателей качества при изменении внешних условий. От качества работы этих устройств, адекватности предоставляемой ими информации складывающимся внешним условиям, с одной стороны, и требованиям потребителя информации с другой - во многом зависит успешность применения локатора. 1.1.2. Сравнительная оценка качества обработки РЛИ в автоматических и неавтоматических системах. В старых образцах радиолокационных станций в качестве системы, принимающей решение о наличии целей, выступал человек-оператор. Его способность гибко адаптироваться к изменяющимся условиям работы и обеспечивать качество обнаружения, близкое к оптимальному, позволяло получать требуемое для потребителя качество информации на выходе локатора. В то же время, человек-оператор в качестве главного элемента принятия решений имеет и ряд существенных недостатков, к основным из которых можно отнести [9; 41; 45; 62]: низкую пропускную способность, определяющую возможность обнаружения 5-10 целей в простых и 1-2 целей в сложных условиях; быструю утомляемость, ограничивающую непрерывное время эффективной работы, даже для хороших операторов, на уровне 20-40 минут; необходимость профессионального отбора и достаточно длительного обучения, что приводит к дефициту опытных операторов для комплектования большого числа РЛС; подверженность влиянию стрессов, что особенно сильно проявляется в боевой обстановке. Для количественной оценки способности человека-оператора обеспечивать эффективную работу в напряженных условиях массированных налетов, а также сравнения качества его работы с автоматическими системами был использован комплекс оценки качества (КОК) функционирования информационных систем [12]. Универсальность этого инструментария позволила получить числовые характеристики кор- 19
Глава 1 ректности информации в результате ее обработки для работы человека- оператора и автоматического устройства. При оценке корректности результатов обработки в качестве основного анализируемого документа рассматривается один цикл обзора, в течение которого необходимо обнаружить цели. Здесь речь идет не о факте первого обнаружения, а о регулярном обновлении информации о целях в ходе обзора пространства. Рассматривалось четыре варианта работы системы обработки радиолокационной информации: 1) опытный человек-оператор; 2) средний человек-оператор; 3) система автоматической обработки с потенциально достижимым качеством работы; 4) реальная система автоматической обработки. Для проведения оценок корректности в программном комплексе задавались следующие исходные данные: V. - объем обрабатываемой информации измеряемый в объектах. В зависимости от количества целей в зоне обзора, изменяющийся в пределах от 0,1<К,<20; - часть принципиальной информации, объективно используемой при обработке, определяет долю объектов, наиболее важных для потребителя. В качестве этого параметра бралась вероятность обнаружения, реализуемая рассматриваемой системой при безошибочной работе. Рассматривались два случая систем обнаружения - «хорошая», jut =0,7 и «средняя», jut =0,5. При выборе этих параметров учитывалось, что вероятность обнаружения отметок от объектов определяется выбранным алгоритмом, известной структуры для автоматических систем и неформализованным для человека. Однако даже для идеального обнаружителя получить единичную вероятность невозможно из-за стохастического характера получаемых сигналов. Максимальная величина jut=0,7 характеризует систему обнаружения, построенную оптимальным образом для данных условий, к которой приближается хорошо обученный человек-оператор. Средний оператор обеспечить столь высокое качество работы не может. Реальная автоматическая система также не способна обеспечивать оптимальную обработку из-за неопределенности внешних условий и, следовательно, невозможности построения оптимальных алгоритмов работы; v. - скорость обработки информации, измеряемая в обнаруженных объектах в единицу времени. В этой характеристике различия человека оператора и автоматической системы проявляются наиболее сильно. Для человека эта величина определяется психофизиологическими способностями организма, и для хорошего оператора равна 5 объектам/с, 20
Принципы использования нейросетевых технологий при обработке.. для среднего - 2 объекта/с. Для автомата она ограничивается скоростью вычислений, и для рассматриваемых алгоритмов составляет не менее 1 ООО объектов/с; и,. - частота ошибок анализа, когда в ходе обработки принципиальная информация воспринимаемая аналитиком неверно, является в данном случае частотой ложных тревог, обеспечиваемой системой обработки. Эта величина была выбрана одинаковой для всех систем из расчета не более 0,1 ложного обнаружения за обзор. Гнар. - среднее время наработки на алгоритмическую ошибку. Это время обусловлено интеллектуальными способностями аналитика, полнотой и правильностью использования принятого алгоритма анализа. А на человека влияют факторы накапливающейся физической усталости, в результате чего им может быть непринципиальная информация ошибочно истолкована как принципиальная. Для хорошего оператора эта величина была выбрана равной 10 с, для среднего - 2 с. Автоматические системы имеют намного лучшие характеристики надежности, 1000000 с и 1000 с для идеальной и реальной систем, соответственно; Т t - непрерывное время работы аналитика в данном случае равно 1 обзору или 1 с; Внешние требования к системе обработки (требования заказчика) выбраны следующими: Рдоп. - допустимое время обработки информации, определяемое периодом обзора, который для расчетов был принят 1 с; Рзад . - заданная минимально допустимая вероятность получения корректных результатов обработки информации равна 0,7. В табл. 1.1 приведены исходные данные для одного из вариантов расчетов. В остальных вариантах исходные данные повторялись, за исключением объема обрабатываемой информации V. (интенсивности налетов), который принимал значения 0,1; 1; 5; 10; 20. Таблица 1.1. Пример исходных данных для варианта расчета выходных показателей № V. , объект JUi, объект 1 V., об/с П1 , С ^нар / > С ^непр / ' ^ Р зад / 1 5 0,7 об-1 5 1 10 1 1 0,7 2 5 0,5 об"1 2 1 2 1 1 0,7 3 5 0,7 об-1 103 1 106 1 1 0,7 4 5 0,5 об 1 103 1 103 1 1 0,7 В системе КОК предусмотрен расчет следующих выходных показателей качества обработки информации: 21
Глава 1 Рпосле. - вероятность получения корректных результатов обработки информации (т.е. когда вся принципиальная информация учтена должным образом и не было допущено ошибок 1-го рода); ^послечасты/ ~ вероятность получения корректных результатов обработки части информации, анализируемой за один период непрерывной работы аналитика; Рпосле/ ~ часть принципиальной информации, не учтенная в процессе обработки должным образом; Рпосле часты / ~ не учтенная должным образом часть принципиальной информации, анализируемой за один период непрерывной работы аналитика. 1111 йлшл а) ^ = 0,1 объекта за обзор б) Vj = \ объект за обзор a) Vj = 5 объектов за обзор а) ^. = 10 объектов за обзор Рис. 1.2. Результаты расчетов корректности обработки информации с помощью КОК для систем обработки РЛИ Результаты их расчетов для шести вариантов интенсивностей налетов (0,1; 1; 5; 10) приведены на рис. 1.2. Для интерпретации полученных результатов из полученных оценок были выбраны два основных показателя. Обработки ~~ вероятность получения корректных результатов обработки информации, т.е. вероятность того, что не было допущено пропусков отметок, которые потенциально могли быть обнаружены рассматриваемой системой обработки (рис. 1.3). 22
Принципы использования нейросетевых технологий при обработке.. 11 Идеальный автомат Реальный автомат Хороший оператор Средний оператор Число объектов в зоне Рис. 1.3. Вероятность корректной обработки всех отметок в зоне обзора в зависимости от числа объектов Полученные результаты свидетельствуют, что человек-оператор практически не способен обеспечивать корректную обработку информации при большом числе объектов. Уже при числе объектов в зоне обзора 3...5 корректность обработки информации становится недопустимо низкой. Системы автоматической обработки в тех же условиях работают стабильно и корректно обрабатывают поступающую информацию, практически не ухудшая качества своей работы при более 20 объектов за обзор. Некорректная обработка информации человеком-оператором приводит к ухудшению выходной информации локатора. Это ухудшение описывается дополнительным показателем, который может быть рассчитан на основе результатов, вычисляемых КОК. При оценках использовалась величина junocne; - часть принципиальной информации, не учтенная в процессе обработки должным образом. Эта величина описывает дополнительные потери в вероятности обнаружения, связанные с высокой скоростью изменения обстановки, что ведет к снижению реальной вероятности обнаружения относительно их потенциально допустимых величин. Для удобства анализа рассматривалась величина , дополняющая указанную до потенциальной вероятности обнаружения: Р - Р - и МП обн обн потенц "после / ' V ' / В качестве потенциально достижимой вероятности бралась величина jui. Результаты расчетов приведены на рис. 1.4. Полученные результаты наглядно демонстрируют тот факт, что в условиях интенсивных налетов человек-оператор не способен проводить эффективное обнаружение целей. Даже для хорошего оператора вероятность обнаружения становится ниже 0,5 уже при интенсивностях налета 2...3 цели в зоне обзора, а при 6 и более целей - снижается ниже 0,2. 23
Глава 1 0,8 ■ Идеальный автомат I- 0,6 ~*~ Реальный автомат * Хороший оператор 0,2 Средний оператор 0 5 10 15 Число объектов в зоне Рис. 1.4. Вероятность обнаружения отметки в зависимости от числа объектов Средний оператор имеет еще более низкие характеристики качества работы. Автоматическая система обработки не имеет подобных недостатков, так как способна обрабатывать большое число целей в единицу времени, обеспечивая стабильные характеристики обнаружения целей в интенсивных налетах. Идеальная автоматическая система даже при низких интенсивностях налетов не уступают хорошему оператору. Однако построить идеальную систему автоматической обработки практически невозможно. В случаях, когда человек имеет практический опыт в предметной области и располагает достаточными временными ресурсами в спокойной бесстрессовой обстановке он обычно превосходит любую автоматическую систему. Поэтому реальная система автоматической обработки имеет показатели качества обнаружения хуже, чем хороший оператор в спокойной обстановке при минимальном числе объектов. Однако качество ее работы не хуже, чем для среднего оператора, а в случаях необходимости работы в условиях жестких временных ограничений значительно превосходит как среднего (в 3...10 раз), так и хорошего оператора (в 1,5...3 раза). 1.2. Анализ основных этапов обработки РЛИ Обработка радиолокационной информации представляет собой наиболее важный комплекс задач радиолокационных станций. Назначение обработки подготовить к выдаче в требуемом виде полную, достоверную и своевременную информацию для потребителя о состоянии воздушной обстановки, появлении и местоположении воздушных объектов, параметрах их движения, возможных вариантах развития динамики изменения воздушно-помеховой обстановки. В ходе обработки радиолокационной информации решается целый ряд задач, которые можно сгруппировать по близости объектов и применяемых методов в основные этапы. 24
Принципы использования нейросетевых технологий при обработке.. К основным этапам обработки радиолокационной информации можно отнести [105; 129]: формирование диаграммы направленности антенны для фазированных антенных решеток; первичная (спектральная) обработка; обнаружение радиолокационных объектов; вторичная (траекторная) обработка; распознавание объектов и ситуаций; анализ обстановки и адаптация. Решаемые на этих этапах задачи служат выполнению главной цели, для которой предназначен радиолокатор — выдаче полной, достоверной и своевременной информации потребителю о воздушных целях. 1.2.1. Пространственная селекция. Формирование диаграммы направленности антенны для фазированных антенных решеток (ФАР) служит для пространственной селекции целей и заключается в когерентном суммировании излучения с выбранного направления приемными элементами, составляющими антенну. При этом часто одновременно осуществляется подавление помеховых направлений, формирование нулей на них [83; 129]. Этот этап выделяется среди всех остальных этапов обработки тем, что он является единственным, напрямую, взаимодействующим с внешней средой. Поэтому все остальные методы обработки прямо или опосредованно используют информацию, получаемую в ходе этого этапа. Наиболее простым видом антенной решетки является линейная эквидистантная решетка. Сигнал на ее выходе у представляется в виде суммы сигналов от отдельных ее элементов х : Здесь N - число элементов решетки. Так как каждый канал ФАР выдает комплексный, т.е. с учетом фазы сигнал, суммирование будет проводиться по-разному, в зависимости от направления прихода электромагнитных волн - угол 0. Если считать, что каждый элемент решетки принимает одинаковый по амплитуде А , сдвинутый по фазе сигнал, то вид сигнала на выходе антенны можно представить в виде: N (1.2) 1 = 1 2xd(i-\) sin# J (1.3) Здесь учтен фазовый сдвиг между элементами решетки, зависящий от угла прихода излучения в, равный: 25
Глава 1 Ф 2/г </(*-1) sin# , (1.4) где Л — длина волны излучения, a d — расстояние между элементами решетки. Зависимость выходного сигнала от угла прихода электромагнитных волн называется диаграммой направленности антенны (ДНА). Именно диаграмма направленности определяет качество пространственной селекции и ее оптимизации в РЛС уделяется большое внимание. Главное внимание уделяется уровню боковых лепестков ДНА, характеризующему уровень приема сигналов с направлений, не соответствующих положению антенны. Диаграмма направленности достигает максимума при ф0 = Ink (к = 0, ±1, ±2,...), когда все сигнальные векторы параллельны друг другу. Сумма сигналов от элементов решетки будет равна нулю при ф0 = п + Ink (к = О, ±1, ±2,...), т.е. при углах приема сигналов: где L обозначает длину решетки L = [N-\)d . Поэтому элементы решетки обычно располагают на расстоянии половины длины волны ^, обеспечивающим фазовый сдвиг. Диаграмма направленности такой простейшей фазовой решетки имеет уровень боковых лепестков (максимум первого бокового лепестка), равный «13,6 дБ в результате чего сигналы от целей будут появляться в соседних с исследуемым направлениях, и, самое главное, уровень помеховых воздействий будет весьма большим. Для улучшения формы диаграммы направленности, уменьшения уровня боковых лепестков, подавления воздействующих помех, может применяться дополнительная обработка каналов элементов антенных решеток в виде весового взвешивания сигналов. Выражение для выхода сигнала с антенны после обработки запишется в виде: где wt - весовые множители, специально выбираемые для оптимизации уровня боковых лепестков. Эти множители могут быть как действительными, так и фазовыми или в общем случае комплексными. Для случая действительных весовых коэффициентов, которые реализуются с (1.5) (1.6) 26
Принципы использования нейросетевых технологий при обработке... 27 помощью аттенюаторов, известны классические наборы весовых множителей, называемых окнами взвешивания [83], такие как окно Хэм- минга, Чебышева и др. При комплексных коэффициентах оптимизация проводится в зависимости от выбранного критерия оптимальности. В качестве такового обычно выбираются минимум среднеквадратической ошибки, максимум отношения сигнал/шум, максимум функции правдоподобия, минимум дисперсии ошибки и др. Однако для любого из указанных критериев расчет весовых коэффициентов зависит от матрицы, обратной к матрице ковариаций для вектора принимаемых элементами решетки сигналов. Ее расчет является наиболее трудоемкой в вычислительном отношении операцией. Дополнительные трудности возникают при необходимости осуществления только фазового взвешивания, что обусловлено относительно высокой стоимостью аттенюаторов, по сравнению с фазовращателями, с помощью которых осуществляются фазовые сдвиги. Традиционные методы оптимизации в этом случае неприменимы и поиск оптимальных фазовых множителей представляет собой весьма сложную математическую задачу. Наиболее дешевые фазовращатели способны осуществлять сдвиг фазы лишь на некоторое, обычно небольшое количество фазовых положений, что еще больше усложняет задачу, сводя ее к целочисленному программированию. Для оперативной адаптации необходимо проводить расчет и модификацию весовых коэффициентов в реальном масштабе времени за 100-1000 мкс (время работы в одном угловом направлении) или для оптимальной работы 1-10 мкс (время обработки одного импульса). На существующих вычислительных средствах обеспечить такое время расчета невозможно. Поэтому или применяются упрощенные алгоритмы, типа создания жестко заданных каналов подавления боковых лепестков, что приводит к недостаточному подавлению помех, особенно при их сложной пространственной структуре, или адаптация осуществляется в течение длительного периода, который не позволяет отслеживать быструю динамику изменения внешних условий и не обеспечивает требуемой эффективности. Необходим новый уровень вычислительных средств для проведения полной и своевременной адаптации диаграммы направленности к внешним условиям. 1.2.2. Временная и спектральная фильтрация. Первичная (спектральная) обработка предназначена для фильтрации получаемых РЛС сигналов, образованных отражениями от целей на фоне помеховых воздействий и шумов, для достижения наилучших условий выделения отметок от целей (наибольшего отношения сигнал/помеха). В зависимости от типов применяемых сигналов в РЛС используются различные виды обработки, основным назначением которой является согласованная
Глава 1 фильтрация и реализация селекции движущихся целей (СДЦ) [10; 115]. Существует два основных типа СДЦ - череспериодная компенсация (ЧПК) и фильтровая. Если ранее использовались аналоговые схемы проведения первичной обработки, и, в первую очередь, наиболее простая - ЧПК, то с развитием цифровой техники практически во всех РЛС используется фильтровая СДЦ [10; 76; 103]. Суть ее заключается в определении спектральных составляющих принимаемых сигналов и дальнейшей режек- ции шумов и помех. Если на вход РЛС поступает сигнал, состоящий из N отсчетов \ = (х],х2, ...,%), его Фурье преобразование, также имеющее N составляющих s - {sx, s2,..., sN), имеет вид: В зависимости от типов и размеров используемых сигналов могут применяться различные варианты вычисления спектральных составляющих. Особой популярностью пользуются методы быстрого преобразования Фурье (БПФ), позволяющие для длинных сигналов на несколько порядков сократить объем вычислений. Используемые в РЛС сигналы всегда имеют ограниченную длительность и заданную структуру, что не позволяет получать точные оценки спектральных составляющих излучения. В результате функция неопределенности сигнала, описывающая его возможности по селективной избирательности, всегда имеет конечные боковые лепестки, характеризующие взаимное влияние соседних составляющих спектра и соседних целей. Это накладывает ограничения на возможности подавления помех и выделения отметок от целей на их фоне. Для улучшения получаемых оценок спектральных составляющих, а, следовательно, и подавления помех, широко применяются окна взвешивания (Хэмминга, Хэннинга, Чебышева и др.) которые позволяют значительно уменьшить уровень боковых лепестков [76; 103]. В последнее время широкое применение находят нетрадиционные многобазовые сигналы (база: 103... 105 ) [16; 84], позволяющие с одной стороны добиться наилучшего выделения целей на фоне различных помех, а с другой, затрудняющие противнику разведку параметров излучения и применение различных мер радиопротиводействия за счет использования нерегулярной структуры. Для этих сигналов уровень боковых лепестков еще более важен, так как нерегулярная структура сигналов предполагает одновременное определение местоположений целей по всей дистанции с существенным взаимным влиянием целей в различных дискретах. До настоящего вре- (1.7) 28
Принципы использования нейросетевых технологий при обработке.., мени нет удовлетворительного решения проблемы синтеза сложных сигналов с заданным уровнем боковых лепестков [56; 73]. Поэтому применяется так называемая мультипликативная обработка, реализующая функцию логического умножения, для нескольких сигналов с различным расположением боковых лепестков [259]. В обычных ситуациях это приводит к взаимному уничтожению наибольших боковых лепестков различных парциальных сигналов. Однако при наличии в угловом направлении нескольких целей, боковые лепестки могут смещаться, и их взаимного уничтожения не происходит [366]. Таким образом, в настоящее время существует острая потребность в разработке новых подходов к синтезу сигналов и их обработке для достижения высоких селективных свойств сигналов на фоне помех. 1.2.3. Обнаружение отметок от целей. Обнаружение радиолокационных целей обычно включает в себя два подэтапа: обнаружение импульсов, отраженных от целей, и их последующего пакетирования, в ходе которого объединяются решения, принятые по каждому отдельному импульсу. Обнаружение целей должно проводится автоматически, сохраняя высокие характеристики при работе в различных тактических условиях, при воздействии разнотипных помех, в том числе нестационарных, т.е. в существенно неопределенных условиях. В настоящее время наиболее распространенным методом автоматического обнаружения воздушных целей в РЛС является использование адаптивного порога обнаружения [201; 206]. В реальных условиях возможно, при воздействии на РЛС помех нестационарного типа, а также хотя и стационарных, но негауссовых помех таких, как отражения от ПП и МП, пассивные помехи и т.п., уровень ложных тревог может возрасти на 2...3 порядка, что недопустимо. Кроме того, при наличии в пределах опорной выборки сигналов, отраженных от соседних с обнаруживаемой целей, что характерно для обнаружения целей в группах, энергетические потери могут составлять 10...15 дБ и более [4; 201; 309]. Таким образом, рассмотренный метод имеет крупные недостатки, которые определяют практически полную его непригодность для РЛС, ведущих работу в реальных условиях. В целом ряде работ [221; 309; 351] были предложены модификации данного метода с целью преодоления присущих ему недостатков. Однако во всех этих работах указанные недостатки рассматриваются изолированно, а не в полном комплексе взаимосвязанных проблем. В связи с тем, что они имеют антагонистический характер, устранение одного из них катастрофически обостряет остальные. Наряду с методами автоматического обнаружения, основанными на адаптивном пороге, применяются также обнаружители, использую- 29
Глава 1 щие фазовые соотношения в многобазовых сигналах (знаковые корреляторы) и ранговые методы [4; 70]. Анализ возможностей их применения в РЛС показывает, что им присущи те же недостатки, что и адаптивному порогу [176; 271; 277]. Исключение составляют ранговые методы, обеспечивающие практически полную стабилизацию уровня ложных тревог, но эти методы при малой пачке имеют очень высокие потери даже при обнаружении одиночных целей, а при обнаружении групп целей эти потери катастрофически возрастают. Поэтому, несмотря на обеспечение ими стабильности уровня ложных тревог, они не могут быть рекомендованы для использования в РЛС [172]. Для синтеза эффективных методов автоматического обнаружения необходимо привлечь статистическую теорию различения гипотез. Синтезируемые методы автоматического обнаружения должны эффективно работать в условиях воздействия основных типов помех. При этом необходимо определить совокупность параметров помех, обеспечение устойчивости к которым должно проводиться по минимаксному принципу и совокупность параметров, по которым проводится усреднение полученных оценок. В настоящее время неизвестны методы, способные обеспечивать эффективное автоматическое обнаружение целей в сложных нестационарных внешних условиях. Пакетирование импульсов проводится для формирования отметок от целей на основе полученных нескольких импульсов от цели, расположенных в соседних угловых направлениях. В зависимости от типа РЛС, точнее от количества измеряемых угловых координат, существенно изменяется сложность проблемы, хотя ее суть остается прежней [62; 63]. Проблема аналогична известной задаче кластеризации [2]: необходимо из множества одиночных отметок выбрать несколько центров группирования, которые соответствуют обнаруживаемым целям. Радиолокационная станция излучает и принимает сигналы в достаточно близких между собой угловых направлениях. Поэтому от одной цели могут быть приняты несколько сигналов. Их число зависит от ширины диаграммы направленности, расстояния между соседними угловыми направлениями и мощности отраженного от цели сигнала, который принимается скатами диаграммы направленности или даже ее боковыми лепестками. В настоящее время сложные методы кластеризации в радиолокации практически не применяются из-за высокой вычислительной трудоемкости и не очень высокой эффективности известных методов [2; 3]. Помимо кластеризации в задачу пакетирования входит объединение решений по выбранным импульсам. Задача объединения очень важна, так как с ее помощью удается повысить эффективность обнаружения 30
Принципы использования нейросетевых технологий при обработке... 31 и, одновременно, улучшить подавление импульсных помех. Существует два подхода к объединению решений по отдельным импульсам [113; 115]. Первый подход предполагает суммирование импульсов, чем достигается наилучшие энергетические характеристики. Другой подход предусматривает логическую обработку по критерию «к из т», что позволяет подавить импульсные помехи. Однако каждый из этих подходов имеет недостатки. Так при энергетически выгодном суммировании импульсов воздействие хаотических импульсных помех приводит к недопустимо большому числу ложных обнаружений, а логическое накопление может характеризоваться очень высокими (до 10 дБ) энергетическими потерями [113; 115]. Таким образом, задача пакетирования отметок, как с точки зрения формирования кластеров, так и объединения решений по отдельным импульсам не может быть эффективно решена традиционными методами. Необходимо использование новых подходов. 1.2.4. Траекторная обработка целей. Вторичная (траекторная) обработка выполняет задачи экстраполяции координат целей и дополнительной селекции ложных отметок. Вторичная обработка заключается в формировании траекторий целей путем установления соответствий между отметками на последовательных обзорах и уточнении (сглаживания) полученных координат. В настоящее время традиционными являются алгоритмы вторичной (траекторной обработки), основанные на проведении отождествления отметок отдельно по каждой цели и проведении сглаживания в соответствии с фильтром Калмана, а-р фильтром и др. [9-11]. Алгоритм отождествления отметок разных периодов обзора сводится к следующему [62]. В каждом периоде выбираются отметки, которые не принадлежат ранее сформированным трассам. В последующих одном или нескольких обзорах (в зависимости от установленного критерия завязки траектории) определяются отметки, которые могли бы совместно с запомненными на предыдущих обзорах составить траекторию. Для этого вокруг каждой из отметок выставляется строб и все точки, попавшие в него, образуют новые формуляры трасс. Формуляр трассы включает в себя текущие координаты, составляющие скорости, а также служебную информацию: длину трассы, признак сопровождения, количество пропущенных отметок. В дальнейшем вокруг всех экстраполированных точек текущих траекторий выставляются стробы, и ближайшие из отметок, попавших в них, являются продолжением соответствующих трасс. При появлении отметки производится перевычисление координат и составляющих скорости траектории на основе рекурсивного фильтра Калмана.
Глава 1 Трасса считается сформированной при выполнении заданного критерия завязки, т.е. соотношении между длиной трассы и числом обнаруженных отметок за время, прошедшее с момента образования ее формуляра. При числе пропусков отметок подряд, превышающем критерий сброса, траектория сбрасывается с сопровождения. Размеры стробов завязки и сопровождения определяются, исходя из обеспечения заданной вероятности попадания отметки в строб. Традиционные алгоритмы формирования траекторий синтезированы в предположении выполнения определенных допущений. Основными из них являются прямолинейное равномерное движение целей и их достаточная удаленность друг от друга, т.е. отсутствие пересечений стробов завязки и сопровождения для различных целей. В случае выполнения в реальных условиях допущений, принятых при их синтезе, традиционные алгоритмы обеспечивают близкие к оптимальным точности и вероятности сопровождения целей. При наличии групп целей, их интенсивном маневрировании, нельзя ожидать выполнения указанных допущений. Поэтому в этих условиях данные алгоритмы реализуют эффективность, намного хуже ожидаемой. Наибольшие сложности вызывает сопровождение групп целей. При характерных расстояниях между целями в группах и размерах стробов, стробы траекторий различных целей многократно пересекаются, что во многих случаях приводит к неправильной идентификации отметок и как следствие, к размножению отметок и снижению достоверности выходной информации. Подробное моделирование показывает, что указанные алгоритмы работают по групповым целям неудовлетворительно. Число ложных траекторий в этом случае оказывается таким же или больше числа истинных целей. Ошибки выдаваемых координат хуже требуемых в 2...3 раза. Полнота выдаваемой информации не превышает 0,9 даже при абсолютно достоверном обнаружении отметок, что связано с неправильной идентификацией отметок и уводу истинных траекторий в сторону близлежащих целей. При маневрах целей эти показатели значительно ухудшаются. Поэтому рассмотренным алгоритмом с любыми задаваемыми параметрами сопровождать группы целей невозможно. В связи с вышеизложенным, необходимо разработать принципиально новые алгоритмы траекторного сопровождения групп целей в массированных налетах. 1.2.5. Распознавание целей. Распознавание целей выполняется для лучшего определения потребителем предпочтительных вариантов типовых воздействий и порядка из применения. С этой точки зрения потребитель предъявляет требования к системе распознавания РЛС. Помимо 32
Принципы использования нейросетевых технологий при обработке... 2—5782 33 достаточно общих классов целей, таких как самолет, вертолет, крылатая ракета, ДПЛА и др., может ставиться задача распознавать конкретный тип цели внутри каждого класса. Для проведения распознавания классов (типов) целей разработчик тем или иным методом выбирает наиболее существенные признаки, характеризующие различия между целями [46; 85; 139]. Обычно различают два общих вида признаков: первичные (спектральные), которые получают на этапе первичной обработки (спектральный портрет, наличие пиков на определенных частотах и др.), и вторичные, получаемые в результате вторичной обработки (скорости, траектории движения и др.). Принятие решений о принадлежности цели к тому или иному классу принимается на основе решающего правила, которое описывает некоторую (критическую) область в пространстве признаков. Синтез решающих правил проводится на основе байесовского подхода или его модификаций, позволяющих свернуть многоэлементную матрицу ошибок в один показатель, по которому и ведется оптимизация. Наиболее широко распространено линейное комбинирование признаков [139]. Получаемая при этом линейная область в пространстве признаков не всегда согласуется с оптимальной, и эффективность распознавания оказывается ниже требуемой. Часто применяются также иерархические алгоритмы распознавания, которые предусматривают последовательный выбор от наиболее широких классов к более узким, специфическим, вплоть до требуемых, например, большая - малая цель, затем среди больших (малых) высокоскоростная - низкоскоростная и т.д. Эти алгоритмы также имеют возможность формировать лишь ограниченный набор критических областей в пространстве признаков. При этом вероятностные характеристики реализуемых таким образом алгоритмов распознавания весьма низки, так как в них принципиальное значение имеют ошибки по каждому из отдельных признаков, и компенсировать эти ошибки с помощью других признаков невозможно. Наиболее эффективным было бы использование алгоритмов распознавания, использующих сложные нелинейные функции для решающих правил, зависящие от совместного многомерного распределения значений признаков и, более того, адаптивно модифицируемые при изменениях внешних условий. К сожалению, синтез таких функций, кроме простейших модельных задач, наталкивается на непреодолимые математические трудности. Поэтому в реальных системах, предназначенных для работы в сложных условиях, зачастую используются полуэмпирические методы, обоснованность которых вызывает сомнения, а эффективность недостаточна.
Глава 1 1.2.6. Анализ обстановки и адаптация. Анализ обстановки и адаптация имеют своей целью повысить эффективность работы РЛС при изменениях внешних условий. Практически все созданные и разрабатываемые РЛС имеют различные режимы работы, которые в основном характеризуются методом обзора пространства и типом обработки. Однако выбор конкретного режима для конкретных внешних условий обычно предоставляется человеку, командиру или оператору. Проведение анализа обстановки также обычно поручается человеку, так как формализованных правил такого анализа не существует, обычно они могут быть сформулированы только в вербальной форме, что существенно затрудняет их алгоритмизацию [7; 78; 102]. Под адаптацией обычно понимается способность системы, изменяя свои параметры и/или алгоритмы и методы работы, приспосабливаться к изменениям внешних условий таким образом, чтобы достичь наилучшего качества работы [146; 293]. Отсюда следует, что качество адаптации естественно оценивать по эффективности системы в тех условиях, к которым собственно и проводилась адаптация. Адаптация системы проводится на основе полученной тем или и иным способом информации о внешних условиях, т.е. по результатам распознавания. Однако, как и для любой статистической процедуры, результатом распознавания может быть ошибочное решение, что, к сожалению, упускается из вида многими исследователями. Неучет этих ошибок не позволяет достоверно оценить качество работы системы, использующей информацию распознавания, а, следовательно, и правильно решить вопрос о целесообразности ее использования. Информация, на основе которой проводится адаптация РЛС, должна включать в себя не только обнаруженные цели и их координаты, результаты распознавания классов целей, но и результаты более глубокой, интеллектуальной обработки получаемой информации, которые должны реализовываться в распознавания тактических ситуаций и вообще различных вариантов внешних условий. Все вышеуказанное свидетельствует о значительных трудностях, с которыми приходится сталкиваться разработчику при создании автоматических систем анализа обстановки и адаптации. 1.3. Анализ недостатков сложившейся методологии синтеза методов обработки радиолокационной информации Как показал анализ, методов достаточно эффективной автоматической обработки РЛИ в настоящее время не существует. Имеется богатая и развитая теория, которая ранее успешно применялась при создании 34
Принципы использования нейросетевых технологий при обработке... систем обработки радиолокационной информации. Основные ее положения используются для синтеза структур и технических параметров радиолокационных и радиотехнических устройств и в настоящее время. В основе большинства развиваемых в классической теории методов лежит ряд существенных допущений, явно не выполняющихся на практике. Это стационарность и гауссовость помех, работа по одиночным целям и др. Кроме того, сейчас появляются новые подходы, ломающее стереотипное представление о сигналах. Вместо привычных равномерных посылок импульсов используются существенно нерегулярные импульсные последовательности с размером базы от нескольких до десятков тысяч, к которым неприменимо большинство старых теоретических результатов. Появляются и новые задачи, такие как распознавание ситуаций, анализ и прогнозирование обстановки, адаптация режимов работы. Весь этот комплекс проблем привел к тому, что в настоящее время традиционный теоретический аппарат оказался применим лишь в некоторой очень ограниченной части. Обеспечить с его помощью разработку перспективных радиолокаторов невозможно, особенно для вновь появившихся задач. Вычислительная техника, сделавшая громадный скачок вперед, создает условия для решения этих новых задач. Но это только на первый взгляд. Да, для вариантов традиционного применения вычислительной техники, она позволяет успешно справляться с поставленными задачами. Где раньше не хватало вычислительных мощностей, ныне их с избытком хватает. Но раньше и не ставилась задача полностью автоматического обнаружения целей. Для новых же задач просто не известны алгоритмы эффективного их решения, а те, которые известны, чаще всего требуют недостижимых вычислительных мощностей даже для современной техники. Это приводит к тому, что современные радиолокаторы не способны автоматически проводить обнаружение целей и выдавать информацию потребителю с требуемым качеством в сложных условиях. Рассмотрим подробнее традиционную методологию синтеза систем обработки радиолокационной информации [105; 115; 129], основанную на следующих этапах (рис. 1.5): Этап 1. Формулируется задача - определяется, в какой предметной области предстоит функционировать системе обработки информации, каковы входные значения и что требуется получить на выходе. Анализируются желаемые результаты работы системы. Этап 2. Разрабатывается модель предметной области, в которой описываются условия функционирования, их параметры, характер и законы их изменения. В идеальном случае - это аналитическая модель, в которой в виде математических зависимостей представлены воздействующие на исследуемую систему сигналы, как способствующие, так и препятствующие выполнению ею своей задачи. Наиболее широко рас- 35
Глава 1 пропуск важных факторов неправильное определение критериев упрощение, четкие критерии неверный учет взаимосвязей шшейные показатели приближенные решения неоптимальные оценки упрощение критериев > дискретизация простые методы и алгоритмы > Синтез системы обработки информации [формд; овка разработка модели синтез методов и алгоритмов аппаратная реализация Ухудшение эффективности Использование нейросетевых технологий { гибкость работы, адаптивность высокая скорость ' параллельных средств^ Рис. 1.5. Основные этапы синтеза систем обработки информации пространены вероятностные модели, основанные на принципах математической статистики, задающие плотности распределения вероятностей параметров внешней среды. Помимо этого определяются один или несколько показателей качества системы, формулируется критерий эффективной работы системы. Этап 3. После математической формулировки проводится синтез методов и алгоритмов работы системы (решающее правило), обеспечивающих выполнение заданных критериев или наилучшие значение показателей эффективности. Здесь могут применяться известные методы решения оптимизационных задач, или, при отсутствии таковых, разрабатываться новые, но основанные на известных математических принципах. Этап 4. Далее проводится разработка устройств, реализующих разработанные методы и алгоритмы. Обычно для реализации вычислительных алгоритмов используют известные вычислительные устройства последовательного типа, основанные на принципах фон Неймана. В качестве редкого исключения из этого общего правила можно привести спектральную обработку, для эффективной реализации которой в настоящее время широко используют специализированные процессоры, так называемые сигнальные процессоры, или БПФ-процессоры. Применение этих специализированных вычислительных средств стало возможным лишь вследствие очень широкого распространения задач спек- 36
Принципы использования нейросетевых технологий при обработке.. тральной обработки, что и обусловило проведение дорогостоящих и трудоемких разработок, однако для большинства возникающих задач ожидать появления специально предназначенных для их решения аппаратных средств не приходится. На всем этапе разработки систем обработки информации, в том числе и радиолокационной, могут иметь место неточности или ошибки, использоваться допущения и упрощения, ведущие к неправильному построению системы и, в конечном счете, - к недостаточной эффективности ее работы или полной неработоспособности. Рассмотрим основные источники таких ошибок, связанных в с недостаточной квалификацией разработчиков, и природой самих рассматриваемых явлений, которые не укладываются в узкие рамки привычных схем во всем своем многообразии. На этапе формулировки задачи не всегда удается выделить полный перечень внешних воздействий, влияние которых будет существенным. Более того, по мере развития технологических возможностей, те параметры внешних условий, воздействие которых было незначительным, могут приобретать все более важное значение и их не учет вести к неэффективной или неправильной работе разработанной системы. Определение желаемых характеристик системы также представляет весьма сложную задачу, имеющую неоднозначное решение. Аналогичные трудности возникают на этапе разработки модели. Для большинства реальных приложений построить адекватную точную и достоверную модель исключительно сложно. Обилие воздействующих факторов, их неочевидная взаимосвязь, недоступность ряда параметров внешней среды для измерения и множество подобных причин превращают эту задачу в практически невыполнимую. Если строго сформулировать требования к модели, то ее разработка становится задачей на порядок более сложной, чем разработка информационной системы. Необходимо доказать адекватность, точность и достоверность модели. Поэтому на практике часто идут на целый ряд упрощений. Следует упомянуть, что само понятие модели предполагает такие допущения, абстрагирование от несущественных свойств внешней среды. Сделанные в ходе моделирования допущения могут привести к неправильному пониманию законов ее функционирования. Часто, даже при возможности достаточно корректного описания модели, принимается ряд дополнительных допущений, позволяющих получать более компактные и удобные для использования модели. В качестве примера укажем использование нормального закона распределения случайных величин неверно отражает статистические характеристики используемых величин. Известны и более подходящие законы распределения (ошибки измерений координат, описания спектральных характеристик обратных отражений от подстилающей поверхности и местных предме- 37
Глава 1 тов и др.), однако законы для линейных преобразований распределений нормальных случайных величин намного проще, чем для других распределений. Часто необоснованно принимается допущение о независимости распределений случайных событий и величин, что, конечно, упрощает математические выкладки, но ведет к неправильному пониманию сути явлений. На неточности формирования модели накладываются сложности однозначного выбора показателей качества и критериев эффективности системы. Потребитель информации или заказчик системы часто не в состоянии в численном виде сформулировать, какие конкретно информационные показатели, с каким весом описывают желаемое качество работы системы. Формулировка желаемого качества работы системы осуществляется лишь в вербальной неформальной форме, а для математической записи выбираются известные варианты показателей, не вполне верно отражающие желаемый характер поведения системы. Так абсолютное большинство работ, посвященных теоретическим разработкам устройств обработки информации, основываются на традиционных критериях Байеса, Неймана-Пирсона, идеального наблюдателя, имеющих линейную зависимость от ошибок принятия решений, в то время как истинная зависимость желаемого качества системы от этих ошибок может носить существенно нелинейный характер. Дополнительные трудности возникают при использовании нечетких измерений, особенно для измерений проводимых не приборами, а человеком-оператором или командиром. К таким измерениям можно отнести оценку достоверности каких-либо дополнительных источников информации, оценку опасности целей, восприятие вербальных команд и указаний вышестоящих звеньев управления и др. Хотя уже в течение нескольких лет активно развивается теория нечетких множеств и решений, созданная Заде [43; 364], возможности получения с ее помощью статистических решений ограничены, да и формирование функций принадлежностей нечетких признаков в своей основе сопряжено с погрешностями. Применение нечетких критериев сопряжено с отходом от привычных норм, и ожидать получения оптимальных решений не приходится. Само понятие оптимальности здесь полностью меняет свой смысл и может в корне отличаться от того представления, который ожидал потребитель или даже разработчик. Указанные трудности формирования модели и выбора показателей качества усугубляются на этапе синтеза методов и алгоритмов работы системы обработки информации. На этом этапе с достаточной степенью произвольности делаются дополнительные допущения для получения решения, так проводится линеаризация нелинейных зависимостей для возможности получения оптимальных характеристик. Однако, за редким исключением, обоснования непрерывности зависимостей показате- 38
Принципы использования нейросетевых технологий при обработке... лей качества системы при переходе к линейным аппроксимациям не приводится, а это молчаливо предполагается. Одним из распространенных подходов является рассмотрение вместо конечномерных векторов измерений бесконечномерных, и так как только в этом случае удается получить оптимальные решения, которые носят названия асимптотически оптимальных. Они при увеличении размерности входных измерений обеспечивают близкие к оптимальным решения, но лишь в пределе, а степень близости для многих практически важных задач может оказаться намного меньше допустимой. Конечно, известно большое число работ по обработке радиолокационной информации, в которых тщательно обоснованно и проведено исследование рассматриваемых этапов обработки, получены очень интересные результаты и сделано все возможное на современном этапе развития научной мысли для получения наилучших решений. Но все- таки во всех из них в той или иной степени приняты указанные выше допущения. Без них построить теоретический аппарат не представляется возможным. Окончательная проверка сделанных допущений возможна только на практике при реальной эксплуатации системы. Синтезированные при этих допущениях методы и алгоритмы работы, конечно, после проведения корректировок по результатам испытаний, работоспособны, но вряд ли обеспечивают наилучшие характеристики работы. Более того, с достаточной степенью уверенности гарантировать их работоспособность в сложных условиях при одновременном наличии наиболее существенных мешающих воздействий, нельзя. И это подтверждают даже прики- дочные оценки. Например, при работе по целям в плотных групповых порядках качество обнаружения почти для всех методов обнаружения недопустимо снижается, воздействие нестационарных помех ведет к росту уровня ложных тревог на несколько порядков, траекторная обработка групп целей, особенно на ранних стадиях формирования трасс целей характеризуется высоким уровнем ложных траекторий, обусловленных перепутыванием отметок и т.п. От командиров используемой в войсках техники с автоматической обработкой информации часто можно слышать жалобы на повышенный уровень ложной информации от них. Способностью к адаптации к непредвиденным условиям традиционные системы не обладают, хотя при их синтезе и закладывались принципы адаптации, но лишь к конкретным вариантам изменений внешних условий и не наилучшие алгоритмы из возможных, а только на те, которые укладываются в рамки известных теоретических построений. К сожалению, на этом не исчерпываются источники неоптимальной и неправильной работы систем обработки радиолокационной информации. Даже те методы и алгоритмы, которые были синтезированы в указанных выше предположениях, не могут быть реализованы на при- 39
Глава 1 меняющихся вычислительных средствах. Причем, наибольшую трудоемкость обычно имеют методы и алгоритмы с наивысшими показателями качества работы, обладающие наибольшей гибкостью и адаптивностью. Они и отбрасываются и упрощаются в первую очередь. Осуществляется такая модификация алгоритмов, которая позволяет реализовать их на существующих аппаратных вычислительных средствах. Не говоря уже о дополнительных погрешностях, вносимых дискретностью используемых вычислительных средств, такое упрощение может значительно ухудшить работу системы. Рассмотренные основные этапы синтеза систем обработки информации выявляют основные факторы, ведущие к снижению качества работы системы. Традиционный подход к синтезу таких систем, несмотря на кажущуюся теоретическую обоснованность, при практической реализации по многим параметрам теряет уровень обоснованности и, как показывают практические разработки, ведет к низкой эффективности функционирования автоматических систем обработки радиолокационной информации в реальных сложных условиях. Проведенный анализ показал, что с помощью традиционного подхода проводить синтез эффективных систем обработки радиолокационной информации затруднительно. Для создания систем, способных обеспечивать требуемое качество работы и не снижать его в условиях интенсивных налетов и сложной помеховой обстановки, необходимо изыскать другие методологические пути, направленные на преодоление вышеуказанных недостатков традиционного подхода. Наибольшие сложности доставляет необходимость работы в изменяющейся заранее неизвестной обстановке. Известно, что для снижения влияния неопределенности на качество обработки информации, следует применять адаптацию [145]. Характеристики систем обработки, их структура, должны подстраиваться под изменения параметров внешних условий. Для того, чтобы обеспечить достаточную мощность подстраиваемых характеристик, сама системы должна быть способна с требуемой точностью приближаться к оптимальной. Кроме того, необходимо обеспечить высокую вычислительную производительность при проведении обработки. В такой постановке данная задача является общей для многих других предметных областей, где также приходится за ограниченное время осуществлять обработку данных в условиях неопределенности. Для ее решения с большим успехом применяется новая технология нейросетевой обработки информации [135; 195]. Нейронные сети позволяют, с одной стороны, если алгоритмы известны и не хватает вычислительных мощностей, после представления алгоритма в нейросетевом базисе, использовать мощные аппаратные средства с массовым параллелизмом. Там же, где алгоритмов нет или они недостаточно эффективны, 40
Принципы использования нейросетевых технологий при обработке... 41 предложить многообещающий подход к созданию алгоритмов, обладающих гибкостью, способностью адаптироваться к изменениям внешних условий, сохраняя устойчиво высокое качество работы [24; 140]. 1.4. Примеры зарубежного опыта использования нейронных сетей для обработки радиолокационной информации Нейронные сети находят широкое применение в самых разнообразных областях деятельности, там, где необходимо проводить распознавание сложных объектов или аппроксимацию нелинейных отображений. Среди большого числа приложений нейронных сетей есть и приложения в области радиолокации. Особый интерес представляет использование нейросетевых технологий в США, так как именно в этой стране агентство по перспективным исследованиям DAPRA начало финансирование исследований в этой многообещающей области [195; 241]. В настоящее время американское военное командование финансирует целый ряд научно-исследовательских работ, которые посвящены этой тематике. Ниже приведена краткая характеристика исследований использования нейронных сетей для решения различных задач радиолокации, заказанных в период с 1997 по 2000 г. Адаптивная антенная решетка для измерения эффективной отражающей поверхности целей разрабатывается ARC ON CORP. В ней будут использованы аппаратные улучшения и интеллектуальное адаптивное программное обеспечение для повышения точности измерений при сохранении стоимости и использовании существующей системы отражателей [296]. В BSEI создаются новые методы фильтрации для подчеркивания наиболее важных при обнаружении целей характеристик и подавления мешающих составляющих, основанные на вейвлет-преобразовании и нейросетевых механизмах обработки. Разрабатываемая архитектура предполагает подробное описание целей, шумов и помех на разных уровнях масштаба с помощью обучаемых обобщенных нелинейных моделей, что позволит использовать ее для террагерцовых локаторов сверхвысокого разрешения в системе ПРО [167]. Компания IRVINE SENSORS CORP. создает мультисенсорный адаптивный фильтр, размещаемый в модуле объемом не более двух кубических дюймов. В одном модуле предполагается разместить несколько сенсоров, данные от которых обрабатываются совместно для достижения более высокого качества выходной информации. В качестве фильтра используется нейронная сеть, способная обеспечивать эффективную работу в шумах, при наличии нелинейностей и других неидеальных параметрах приемников [324].
Глава 1 Фирма AETC, INC. разрабатывает алгоритмы подавления помех радиолокаторов, размещаемых на борту самолета. Эти алгоритмы основываются на моделировании помех в виде нелинейной динамической системы, что позволяет описывать их с большей степенью адекватности, позволяя выделять цели на фоне даже очень сложных и мощных помех. Такие нелинейные алгоритмы подавления помех используют методы Марковских цепей и нейронных сетей. При этом используется тот факт, что в отличие от полностью случайного шума, помехи от местных предметов представляют собой хаотический динамический процесс низкого порядка и на достаточно коротких временных промежутках могут быть предсказаны с высокой точностью. Эксперименты показывают, что с помощью этого подхода удается повысить отношение сигнал/шум на 27 дБ [197]. Принципиальной проблемой при анализе тепловых портретов является необходимость обрабатывать большие объемы данных в реальном времени. В традиционной технологии для снижения размерности данных применется метод принципиальных компонент. Однако расчет принципиальных компонент для данных большой размерности представляет собой очень сложную вычислительную задачу. Вычисления осуществляются последовательно для каждой из необходимых компонент при ощутимых временных затратах на каждую из них в ходе итерационного процесса. Компания INTELLIGENT AUTOMATION, INC. решила эту проблему, создав новую технологию получения принципиальных компонент с использованием нейросетевых алгоритмов. При этом все компоненты рассчитываются параллельно с одинаковой скоростью сходимости, и требуемый результат достигается одновременно по всем векторам. Это позволяет выполнять анализ главных компонент в реальном масштабе времени и использовать этот эффективный метод в высокоскоростных системах обработки тепловых изображений [257]. Для задач обнаружения наибольшую опасность представляют помехи, имеющие схожие с целями параметры, так как именно ими обуславливается наибольшее число ложных тревог. Поэтому специалисты фирмы CHARLES RIVER ANALYTICS, INC. заинтересовались возможностями корректного описания таких помех, что позволит существенно снизить объем ложной информации на выходе локатора. Для этого используется двухэтапная процедура. На первом этапе с помощью самоорганизующейся нейронной сети адаптивного резонанса проводится кластеризация известных помеховых воздействий, а затем эти помех используются в качестве отрицательных обучающих примеров для точной подстройки нейросетевой решающей поверхности. Очень важно, что этап кластеризации охватывает все наиболее существенные типы помех и позволяет разрабатывать обучаемые в лабораторных условиях обнаружители [331]. 42
Принципы использования нейросетевых технологий при обработке... 43 Компания Nova Research совместно с учеными из Северно- Западного университета на основе многолетних исследований создает нейроморфный многопроцессорный модуль для обработки сигналов пассивной инфракрасной локации. Создаваемый модуль предназначен для поиска целей и строится на основе принципов функционирования биологических систем, за счет чего, как утверждают специалисты компании, будет способен обеспечить эффективность, недостижимую для традиционных систем обработки. Модуль состоит из набора интегрированных элементов, напрямую связанных с решетками инфракрасных фокальных плоскостей. В устройстве будут интегрированы новый детектор, созданный университетскими исследователями, и построенный по биологическим принципам сопроцессор с массовым параллелизмом [281]. Компания SOFTTHOUGHT, INC. проводит исследования по созданию нейробиологической модели идентификации целей, в которой используется подробный эмулятор церебральных нервных образований, моделирующий зрительный образ как набор слабо организованных контуров. Модель основана на современных представлениях о работе мозга человека. Отдельные признаки изображения преобразуются в редуцированную форму с помощью системы анализа контура на основе разработанного языка описания больших бинарных объектов, и запоминаются в базе данных. Для обработки полученной информации используется нейронная сеть, включающая поведенческие и функциональные компоненты, которые влияют на принятие решений, а также нейронные плоскости для запоминания объектов во внешней обстановке. Доступные для модели действия образуют связи между нейронными плоскостями. Исследователи надеются, что с помощью такой системы при использовании оригинальных алгоритмов обработки изображений, быстрой идентификации и сопровождения объектов, им удастся обнаруживать объекты с любой ориентацией в пространстве, используя небольшую базу данных по ключевым признакам [240]. Известно, что животные могут успешно использовать разнообразную сенсорную информацию при быстром, в течение миллисекунд, поиске важных объектов, для движения к достижению цели или для того, чтобы избегать угроз. Перед автономными образцами военной техники стоят схожие задачи адаптации к окружающей среде и непрерывного поиска целей. Природа в ходе длительного эволюционного отбора сумела реализовать в живых организмах удивительно эффективные механизмы поведения. Специалисты фирмы ORBITAL RESEARCH, INC решили использовать подобные природным механизмы при создании автономных систем. Ими создается набор рефлекторных алгоритмов, копирующих поведение насекомых, BioSeek. Он будет использовать нейронную карту двигательных рефлексов насекомого [343].
Глава 1 Система анализа многоспектральных данных, создаваемая компанией AMERICAN GNC CORP. использует методы эволюционного программирования и нейронных сетей для автоматического решения задач анализа подстилающей поверхности и субпиксельного разрешения. Информация в пиксельном представлении обрабатывается с помощью нового варианта самоорганизующейся нейронной сети, определяющей категории, к которым принадлежат данные сенсоров. С помощью эволюционного программирования в пространстве решений проводится непараметрический поиск, направляемый целевой функцией, построенной с помощью моделирования и позволяющей быстро и адекватно использовать информацию, содержащуюся в изображениях. Конечный продукт, разработанный в рамках этого проекта, будет представлять коммерческий программный пакет для визуализации данных многоспектральной обработки и обнаружения целей, и иметь дружественный пользовательский интерфейс [267]. Фирма INFORMATION SYSTEMS LABORATORIES, INC. и университет штата Калифорния разрабатывают компактную систему для беспилотных летательных аппаратов, позволяющую совместно обрабатывать оптическую, инфракрасную и радиолокационную информацию (миллиметровые волны). Из-за жестких массогабаритных ограничений предпочтение отдано реконфигурируемым вычислительным средствам. Предполагается использовать новые алгоритмы обработки информации, включая нейронные сети для решения задач распознавания. Быстрое развитие реконфигурируемых аппаратных средств позволит реализовать эти алгоритмы на борту в ближайшей перспективе [321]. Решение задач распознавания часто затрудняется из-за невозможности провести правильную сегментацию, т.е. выделить основные текстурно различные элементы изображения. Существующие алгоритмы работают на основе какого-либо формализованного математического критерия, в отличие от человека, который способен просто выявлять различия в отдельных областях изображения. Компания INTELLIGENT OPTICAL SYSTEM, INC. создает динамическую систему, основанную на нейрофизиологических принципах работы мозга, способную поводить высокоуровневый анализ и сегментацию изображений. Результаты низкоуровневой сегментации подаются на ассоциативную память, выход которой корректирует работу алгоритмов первого уровня. Совместная работа двух систем анализа в синхронном режиме позволяет достоверно и точно проводить сегментацию изображений для решения задач распознавания и машинного зрения [187]. Отображение обстановки становится все более важной задачей при информировании лиц, принимающих решения о проведении анализа складывающихся ситуаций. Поэтому необходим интуитивно понятный боевым командирам пользовательский интерфейс. Однако прорисовка 44
Принципы использования нейросетевых технологий при обработке... всех данных в графическом формате без взаимных наложений является очень трудоемкой NP полной задачей. Фирма МАК TECHNOLOGIES предлагает для решения этих задач, а также для трехмерного представления информации собственные технологии, построенные на нейросетевых парадигмах. Помимо этого нейронные сети предполагается использовать для одновременного отображения данных в разных представлениях, чтобы помочь командирам правильно оценивать обстановку [346]. Компания AMERICAN GNC CORP. разрабатывает перспективную систему интеллектуального объединения информации от нескольких сенсоров на основе нейронных сетей и экспертных систем. В рамках ведущихся работ исследуются возможности искусственных нейронных сетей по объединению данных в присутствии шумов и обеспечение ро- бастности принимаемых решений. Для динамического управления решения задач идентификации и сопровождения целей предполагается использовать систему обработки знаний в реальном времени. Создаваемая база знаний сможет использоваться как для собственно обработки информации, так и для обучения операторов или помощи им в сложных ситуациях. Результаты исследований помимо приложений тактической ПВО будут реализованы и в виде коммерческого продукта Intelligent Multisensor Integration and Fusion Systems, который должен заинтересовать аэропорты и другие службы, где требуется получение оперативной информации от сенсорных источников [268]. Разрабатывается высокоэффективный процессор для объединения информации, получаемой при подводной разведке, и для управления огнем. В ходе исследований компания ACCURATE AUTOMATION CORP. предполагает использовать биологические аналогии при создании устройств анализа, обработки и объединения данных от нескольких сенсоров. Результатом работы должна стать архитектура и прототип нейропроцессора, построенного на биологических принципах [156]. Physical Optics Corporation предполагает создать автономную систему сопровождения многих целей, в которой будут использованы алгоритмы нечетких нейронных сетей и методология распределенных вычислений. Предлагаемая нечеткая нейросетевая модель имеет существенные преимущества: возможность автономного сопровождения целей при минимальном участии человека-оператора; использование данных, как от активных, так и от пассивных источников информации; способность работы с разнотипными источниками [245]. Компания ALPHATECH, INC. проводит сравнение и разрабатывает нетрадиционные алгоритмы для многомерного распределенного анализа данных, для составления единой тактической картины при обнаружении наземных целей. Основными решаемыми задачами в рамках этой емкой проблемы являются выбор признаков, по которым следует принимать решения, какими данными можно пренебрегать; вид представ- 45
Глава 1 ления неопределенностей в системе принимающей решения; метод увязки между собой последовательных сцен; критерий выбора наилучших вариантов алгоритмов. Предполагается использовать древовидную структуру алгоритмов объединения информации, допускающей использование различных способов представления информации и различных алгоритмов ее обработки. Одним из наиболее важных элементов этой системы является использование нейросетевой технологии и теории нечетких множеств [ 177]. Современные системы разведки располагают огромными объемами данных и предоставляют возможность знать практически все о контролируемом районе. Однако цели и задачи ВВС с течением времени изменяются, и предсказать заранее запросы пользователя практически невозможно. Поэтому необходимо создать систему обработки данных, способную адаптироваться к запросам пользователя и тем условиям, в которых он работает. Для решения этой задачи ALPHATECH, INC. предполагает использовать методологию нейродинамического программирования, заключающуюся в комбинировании элементов динамического программирования, обучения на примерах и техники статистического вывода. Преимуществом такого подхода является не обязательность, целевая функция выражается аналитически, а система просто следует ей в ходе обучения с подкреплением [189]. Эта же компания создает многоагентную систему для поддержки принятия решений командирами в условиях большого числа целей. Система использует нейродинамические алгоритмы для управления, байесовские сети при обучении на основе данных сенсоров и мобильных программных агентов для координации распределенной обработки. Разрабатываемая технология позволит командирам лучше организовывать управление сенсорными источниками информации и координировать работу огневых средств, что, как утверждают специалисты компании, позволит повысить эффективность управляемой группировки [317]. Компания TEXT WISE, LLC проводит разработку нейрогенетиче- ской системы мобильных автономных объектов, способных совместно принимать решения. Эта система будет состоять из двух слоев, первый из которых является управляющим модулем, а второй - включать решающие элементы автономных агентов. Система будет осуществлять поиск информации, ее оценку, комбинировать различные результаты для выбора рекомендаций и альтернатив при принятии решений и эволюционировать для улучшения совместных решений. Большое внимание уделяется организации взаимодействия между агентами, механизму осуществления генетических операторов селекции и воспроизведения, возможности вмешательства в процесс эволюции для учета предпочтений пользователя [266]. 46
Принципы использования нейросетевых технологий при обработке... 47 Одной из наиболее трудных задач является принятие решений в реальном времени в условиях неопределенности. Возросшее число источников, от которых решающая система может получать информацию, еще больше обостряет проблему, так как каждый из источников может нести ошибки и ложную информацию. Учет рисков принятия неправильных решений является важной составной частью синтеза управляющих систем. Компания LOGOBOTS LLC для этого предполагает использовать собственную технологию Value-at-Risk (VAR) оценки финансовых рисков. Технология основывается на использовании нейронной сети, обучаемой с помощью метода Монте-Карло, и может использоваться для решения проблем учета неопределенности, как при обработке сенсорной информации, так и при обеспечении информационной безопасности [292]. Нейросетевые технологии также широко используются при моделировании боевых действий, в качестве механизма, способного с достаточной степенью адекватности описывать сложные зависимости между многообъектными компонентами модели, учитывать эмоциональную составляющую действий и решений, которые осуществляются людьми [294]. При моделировании боевых действий серьезные трудности доставляет согласование моделей, работающих на различных уровнях подробностей. Фирма NETWORK DYNAMIC, INC., уже в течение многих лет работающая в области имитационного моделирования боевых действий, создала теоретический аппарат и программный инструментарий на основе нейросетевых технологий для передачи информации с одного уровня моделирования на другой [199]. В [256] рассматривается трехуровневая схема, использующая различные нейросетевые парадигмы. Первый уровень осуществляет запоминание динамики управляемого процесса в различных условиях функционирования. Нейросетевые механизмы позволяют адекватно учитывать нелинейную динамику процессов для поддержания устойчивости системы управления. Второй уровень обеспечивает обратную связь для тех случаев, когда нейросетевая аппроксимация оказывается недостаточной и позволяет улучшить качество управления. Третий уровень, реализующий логику переключений, основан на нечетких моделях и позволяет определять в каких случаях следует переходить от первого уровня управления ко второму. Кроме того, третий уровень определяет необходимость дообучения нейросетевых моделей, используемых в первых двух уровнях. Фирма SANTA BARBARA PHOTONICS совместно с лабораторией нелинейной оптики создают оптические вычислители для реализации
Глава 1 импульсных нейронных сетей. Принцип их действия основан на эффекте фоторефракции и оптической бистабильности [350]. Рассмотренные примеры использования нейронных сетей в задачах обработки радиолокационной информации показывают, что эта новая технология может успешно применяться на всех этапах работы РЛС. В то же время, становится очевидным, что одной нейросетевой парадигмой обойтись не удается. Большинство приложений ориентируется на использование нейро- биологических аналогий без серьезного теоретического анализа. Однако применение нейронных сетей во многих задачах радиолокационной информации наталкивается на существенные трудности. Прямое заимствование нейросетевых парадигм из других областей не всегда приводит к успеху. Это связано как с недостаточной теоретической проработкой многих основополагающих вопросов использования нейросетевых технологий, так и с особенностями обработки информации в радиолокаторах. К ним можно отнести [4; 105; 115]: • исключительно большой объем информации и необходимость его обработки в ходе работы РЛС - за несколько миллисекунд, а в некоторых случаях - и микросекунд; • значительные трудности формализации алгоритмов и обеспечения высокого качества их работы, связанные с непредсказуемостью внешней обстановки и высокой динамикой ее изменения; • необходимость решения нетрадиционных задач, таких как распознавание ситуаций, анализ и прогнозирование обстановки; • необходимость использования априорной информации о характере действия противника, зачастую выраженной в нечеткой форме; • использование комплексных чисел при математическом описании задач пространственной, частотной и временной обработки; • требование обеспечения очень малых значений вероятностей ложных тревог (порядка 10~6) при обнаружении целей; • необходимость эффективной работы в разнотипных условиях и др. Поэтому необходимо провести тщательный анализ решаемых на каждом этапе задач обработки, рассмотреть известные методы их решения, выявить возможные способы повышения качества выходной информации для сложных внешних условий на основе рационального применения нейросетевой технологии. 48
Глава 2. Основные модели нейронных сетей для использования при обработке радиолокационной информации 2.1. Основные принципы нейросетевых технологий Для анализа методов нейросетевой технологии определим основные содержательные элементы технологии: информационной и нейросетевой. 2.1.1. Определение нейронных сетей. Технология - это типовой способ целенаправленной деятельности, требующий для своей реализации применения технических средств, представляющий собой систему взаимосвязанных и согласованных по времени и пространству действий (операций, переходов, приемов и т.п.), составляющих структуру технического процесса преобразования исходных объектов в продукт определенного вида и качества - целевой результат деятельности [33; 91]. Информационная технология - приемы, способы и методы применения средств вычислительной техники при выполнении сбора, хранения, обработки, передачи и использования данных [34; 35; 57]. Нейросетевая технология - использование моделей нейронных сетей для выполнения функций информационных технологий [80; 87]. В контексте рассматриваемого в книге материала основное внимание уделяется функции обработки радиолокационных данных. Понятие искусственной нейронной сети до сих пор не имеет однозначного определения. В классических трудах по теории нейронных сетей приводятся различные определения. Агентство перспективных исследований Пентагона DARPA, одно из первых профинансировавшее научно-исследовательские работы прикладного направления этой тематики, определяет нейронную сеть следующим образом [195]: Нейронная сеть - это система, состоящая из множества простых работающих параллельно процессорных элементов, функционирование которой описывается структурой сети, силой связей и обработкой, осуществляемой на каждом вычислительном элементе или узле сети. Автор нескольких классических трудов по теории нейронных сетей С. Хайкин (Haykin S.) [140; 225] дает менее строгое, но более метафоричное определение: Нейронная сеть - это процессор с массово-парачлельной архитектурой, который имеет естественную склонность к записи эмпирических знаний и представления их для последующего ис- 49
Глава 2 пользования. Этот процессор похож на мозг в двух отношениях: 1. Знания получаются сетью посредством процесса обучения. 2. Для запоминания знаний используются межнейронные веса, известные как синаптические связи. Для того чтобы проиллюстрировать ширину спектра восприятия понятия нейронных сетей приведем еще два определения этого термина. Нейронная сеть - это устройство, составленное из очень большого числа простых вычислительных элементов, построенных на основе сходства с нейронами. Каждый элемент функционирует асинхронно, так, что единого общесистемного времени не существует [295]. Искусственные нейронные системы или нейронные сети являются физически клеточными структурами, которые могут получать, запоминать и использовать знания, полученные экспериментальным путем [369]. Российская школа нейрокомпьютерных исследований тоже имеет ряд полезных определений. В фундаментальном труде А.И. Галушкина [24], обобщающем результаты исследований по теории нейронных сетей за несколько десятилетий в России, дается следующее определение нейрокомпьютера: Нейрокомпьютер - это вычислительная система с архитектурой аппаратного и программного обеспечения, адекватной выполнению алгоритмов, представленных в нейросетевом базисе. При этом под логическим базисом нейронных ЭВМ понимается в простейшем случае группа операций (/. , я, х, sign /  Еще один известный специалист в области теории нейронных сетей А.Н. Горбань не дает однозначного определения нейронной сети как целого, но дает описание основных элементов, из которых они состоят: адаптивный сумматор, нелинейный преобразователь, точка ветвления и линейная связь - синапс [29]. В целом уже сложилось достаточно устойчивое представление об области, которая определяется термином нейронные сети, а имеющиеся некоторые, иногда весьма существенные, отличия в определениях, не мешают единому пониманию предмета исследований. В настоящей работе под нейросетевой технологией понимаются приемы, способы и методы обработки информации, основанные на использовании сетей связанных между собой достаточно простых элементов (нейронов), реализующих методы совместной работы, близкие по содержанию к работе биологических нейронных систем. В данном определении нейронных сетей близость к биологическим нейронам понимается лишь в самом широком смысле. Прямого полного моделирования осуществить пока не удается. Нейронные сети появи- 50
Основные модели нейронных сетей для использования при обработке ... информации 51 лись как результат попыток построить, хотя бы упрощенную, модель работы человеческого мозга. Это дало толчок для их развития и совершенствования и до настоящего времени целью многих исследований остается проблема понимания сущности вычислений в биологических нейронных сетях [7; 74; 102]. Появляются различные модели, ориентированные на отражение отдельных аспектов функционирования биологических нейронных сетей [75; 226; 284; 316]. Однако многие не имеющие биологических аналогов нейросетевые модели оказываются полезными в вычислительном отношении и в плане успешности применения в различных приложениях [192; 286; 354]. Основные достижения нейросетевой технологии связа*:** с реальными успешными применениями математических алгоритмов, появившихся как развитие моделей биологических нейронных сетей. Иногда среди неспециалистов можно услышать мнение, что нейронные сети моделируют работу биологических нейронных сетей. Если под этим подразумевать симуляцию функционирования каждого отдельного нейрона, то это не соответствует сути основной массы проводимых исследований. Любой самый простой биологический нейрон функционально бесконечно сложнее тех простейших элементов (узлов), которые в теории нейронных сетей называются нейронами. И именно в простоте основных элементов нейросетевых технологий и заключается их главное преимущество - возможность использования большого количества составляющих сети элементов. Искусственные нейронные сети берут начало именно от биологических структур и моделируют одно из их важнейших свойств - многократную связность. Возможность сетей простых элементов моделировать сложное поведение является наиболее интересным и привлекательным свойством этой технологии. Конкретное воплощение нейросетевых вычислительных элементов может быть осуществлено как аппаратно, на специализированных средствах, реализующих высокую параллельность, так и программно, в виде вычислительных процедур на универсальных процессорах. Приведенное выше определение нейросетевой технологии является достаточно широким и допускает истолкование целого ряда классических алгоритмов как нейросетевых. Так широко распространенные методы фильтрации или любой другой линейной обработки данных могут быть представлены с помощью некоторых связей, вычисляющих требуемое преобразование. Такое положение не является случайным. Нейросетевые алгоритмы являются развитием традиционных методов и обобщают их на случай нейросетевых преобразований. Возникает вопрос, а есть ли необходимость выделения нейросетевых методов в отдельный класс, если они в большой мере сходны с известной методологией. Ответ на этот вопрос, вне всякого сомнения, положительный.
Глава 2 Во-первых, в отличие от традиционных, нейросетевые методы изначально нацелены на параллельную реализацию на специализированных аппаратных средствах, обеспечивая повышение быстродействия на несколько порядков. Во-вторых, нейросетевой подход позволяет рассматривать достаточно разнородные методы обработки с единых позиций теории нейронных сетей, давая возможность совершенствовать качество традиционных методов и использовать приемы, обеспечивающие эффективную обработку информации в различных предметных областях. В-третьих, при использовании нейросетевой технологии изменяется сам подход к созданию методов и алгоритмов обработки информации. Вместо того, чтобы использовать приблизительные модели предметной области и синтезировать для них оптимальные системы обработки, в надежде на то, что полученные алгоритмы, несмотря на весьма существенные отличия моделей от реального мира и на использованные упрощения, необходимые для их реализации на вычислительных средствах, окажутся способными обеспечивать требуемую эффективность, предлагается формировать системы обработки в виде некоторых обобщенных структур, способных самостоятельно настраиваться на решение требуемой задачи. Теория нейронных сетей опирается на предположение о том, что с помощью рассматриваемой в ее рамках методологически простой модели удастся получить достаточно сложное поведение, необходимое, для получения правильных решений в изменяющихся условиях. Строго говоря, это не просто предположение. Фундаментальная теорема Колмогорова о возможности представления функции многих переменных в виде суперпозиции функций одной переменной, доказанная еще в 50-е годы [55; 249], и следствия из нее о возможности аппроксимации любой непрерывной функции с помощью нейронной сети [227], дают теоретическую основу для таких предположений. К сожалению, доказательства этих основополагающих теорем неконструктивны, т.е. в них не приведено построение таких систем, а тем более не известны варианты построения оптимальных систем. Поэтому до настоящего времени выбор типа и рациональной архитектуры нейронной сети для каждой конкретной задачи является очень сложной задачей, которая не всегда находит удовлетворительное решение. 2.1.2. История развития технологии нейронных сетей. Хотя основной пик исследований нейронных сетей приходится на последние годы, начало изучению нейроподобных вычислений было положено уже достаточно давно. Классическая работа нейрофизиолога Уоррена Мак- калоха (Warren S. McCulloch) и молодого математика Уолтера Питтса (Walter A. Pitts) появилась более шестидесяти лет назад [284; 75], в 52
Основные модели нейронных сетей для использования при обработке ... информации 1943 г. Уже тогда были заложены основные принципы, составляющие суть нейросетевой технологии сегодня. Это моделирование нейрона как простейшего процессорного элемента, объединение нейронов в сеть элементов, функционирующих совместно, вывод о способности такой сети обучаться и решать нетривиальные, «интеллектуальные» задачи. Методы обучения нейронных сетей были предложены Дональдом Хэб- бом (Donald О. Hebb) и Франком Розенблаттом (Frank Rosenblatt) [226; 315; 316; 108; 109]. Именно работы этих ученых и заложили основы той области научных исследований, которые относятся к направлению построения систем, способных решать нетривиальные задачи, обычно решаемые человеком, в области, называемой искусственным интеллектом. Уже на начальных стадиях работ по искусственному интеллекту существовало две точки зрения на построение систем искусственного интеллекта. Одни считали, что интеллектуальные системы необходимо создавать на компьютерах, имитирующих работу человеческого мозга [75; 109]. Другие полагали, что интеллект в основе своей - это символьная обработка на компьютерах типа машины фон Неймана (von Neumann J.) [348; 347]. По ряду причин тема символьной обработки информации стала доминирующей в проблематике искусственного интеллекта. Это имело положительные и отрицательные моменты. С одной стороны, цифровой компьютер с записываемой в память программой стал стандартом в компьютерной индустрии. Такие компьютеры было легко разрабатывать и легко программировать. Символьный, основанный на логических правилах, подход к искусственному интеллекту хорошо укладывался в рамки этой архитектуры. С другой стороны, существенно параллельные нейросетевые системы, типа персептрона Розенблатта, не были приспособлены к успешному функционированию на последовательных компьютерах. Кроме того, оказалось, что персептрон имеет несколько больше ограничений, чем ожидалось [278; 79], и это обескуражило как самих ученых, так и финансирующие органы. Хотя исследования продолжались в течение 70-х годов рядом ученых (Amari, Anderson, Arbib, Fukushima, Grossberg, Kohonen, Widrow и другими) и ряд важных результатов был получен в течение этого периода, но направлению нейронных сетей уделялось относительно небольшое внимание. В 80-х годах интерес к нейронным сетям возродился вновь. В [320] указано пять причин для этого возрождения. Три из них - по существу практического характера, а остальные две - теоретические. К практическим причинам можно отнести следующие. 1. Современные компьютеры стали несравнимо быстрее, чем ЭВМ 1950-60-х годов. Поэтому сегодня, в отличие от прошедших десятилетий, можно свободно использовать обычные компьютеры для моделирования и исследования сетей, причем еще более сложных и интересных, чем ранее. Большинство успешно работающих сегодня практиче- 53
Глава 2 ских приложений нейросетевой технологии реализованы как раз на стандартных компьютерах последовательной архитектуры. 2. Основное направление повышения скорости компьютеров лежит в области применения параллельных вычислений, и опыт последних лет свидетельствует о том, что у идеи многопроцессорных систем становится все больше приверженцев. Даже лидер современных процессорных технологий - фирма Intel, видит будущее своих процессоров в создании многоядерной архитектуры, способной выполнять параллельные вычисления. К сожалению, пока не существует общепринятой парадигмы параллельных вычислений. Часто легче сконструировать параллельный компьютер, чем создать эффективные алгоритмы для него. Исследователи надеются, что алгоритмы, которые доказывают свою эффективность и действенность на нейроподобных компьютерах, могут оказаться полезными для теории и практики параллельных вычислений. 3. Расширяется набор эмпирических инструментов в биологии и нейрофизиологии, мы все больше и больше узнаем о том, как функционируют нейроны и как они связаны друг с другом. Но слишком мало известно о том, как перейти от этой информации относительно конкретных нейронов к теоретическому подходу о функционировании реальных больших нейронных сетей. Можно надеяться, что теоретические подходы, разработанные при изучении искусственных нейросетевых вычислительных систем, позволят лучше понять биологические нейронные сети. В дополнение к указанным трем причинам, имеется два хорошо разработанных теоретических результата, которые оказали очень большое влияние на возрождение, а затем и расширение нейросетевых исследований. 1. Первый из этих результатов представлен в работе Джона Хоп- филда (John Hopfield) [231; 141] и обеспечивает математическое обоснование для понимания динамики важного класса сетей. Хопфилд стал рассматривать нейросетевые модели не просто как способ имитации биологических объектов, но как инструмент для создания систем, способных решать практические задачи. В частности, Дж. Хопфилд указал, что рекуррентные сети с симметричными весами имеют свойства, которые позволяют использовать их для решения задач распознавания, а также предложил метод исследования их поведения. Предложенный им подход был расширен и применялся рядом других авторов [218; 157], для того, чтобы изучать математические свойства сетей, определять архитектуры, необходимые для решения важных оптимизационных задач. 2. Второй результат - это дальнейшее развитие работ Ф. Розен- блатта, Б. Уидроу и М. Хоффа [355; 356; 134], направленное на изучение сложных, многослойных сетей, позволившее преодолеть одно из 54
Основные модели нейронных сетей для использования при обработке ... информации наиболее серьезных ограничений традиционного персептрона - невозможность различения линейно не разделимых множеств. Было показано [319], что при выборе дифференцируемых функций активации нейронов для нелинейных многослойных сетей возможно использовать методы градиентного поиска, аналогичные методам Уидроу и Хоффа для линейных сетей. Необходимо отметить, что в целом ряде работ, еще до появления классического труда [319], рассматривалась возможность обучения нейронных сетей с несколькими слоями [145; 146; 23]. Но до появления метода быстрого расчета градиента для внутренних слоев эти работы не могли быть использованы для достаточно больших сетей. Подробнее об этом - в следующем подразделе. Появление эффективной процедуры вычисления градиента относительно весовых коэффициентов, точнее ознакомление с этой процедурой широкой научной общественности, дало в руки исследователям технику обучения многослойных сетей, типа персептрона. Эта процедура, известная как алгоритм обучения с обратным распространением ошибки [319], оказала существенное влияние на область нейрокомпью- тинга и является одной из наиболее часто используемых в большинстве приложений. Все вышеуказанное привело к взрывному росту исследований, посвященных нейросетевой тематике и появлению большого числа успешно работающих приложений в самых разнообразных областях. Количество задач, которые пытаются решать и во многих случаях успешно решают с помощью нейронных сетей с каждым годом растет. Весь этот комплекс разнообразных методов и алгоритмов, объединенных общим понятием нейронные сети, и представляет собой содержание новой нейросетевой технологии обработки информации, предназначенной для решения алгоритмически сложных задач, при решении которых применение традиционных аналитических и статистических методов не приводит к успеху. 2.1.3. Основные нейросетевые модели. В основе нейросетевой технологии лежит концепция распределенных адаптивных нелинейных вычислений. Нейронные сети строятся из большого числа простых элементов, каждый из которых обрабатывает свою часть единой задачи. Принципы вычислений для стандартного элемента достаточно просты. Вся мощь нейронных сетей основывается на множестве взаимосвязей между этими простыми элементами, которые совместно участвуют в решении задачи, и в адаптивной настройке параметров (весов), связывающих элементы между собой. В настоящее время известно очень много различных нейросетевых моделей или парадигм, как их принято называть в литературе, посвя- 55
Глава 2 щенной теории нейронных сетей. Так в упомянутом труде [24] приводится далеко не полный список из более 70 направлений, в которых успешно используются нейронные сети. Каждое из этих направлений требует учета свойственных ему особенностей. В связи с этим появляются все новые нейросетевые парадигмы, наилучшим образом приспособленные к решению тех или иных задач. За несколько десятков лет, в течение которых активно и интенсивно изучаются нейронные сети и возможности их приложения к различным областям, выработано множество вариантов нейросетевых архитектур, и в настоящее время существует такое множество различных типов нейронных сетей, что вряд ли кто- нибудь сможет указать их точное число. Большинство из них рождаются в процессе разрешения конкретных задач. Потом выясняется, что подход, примененный для одной проблемы, может быть успешно использован и для другой предметной области. Часть разработанных архитектур нейронных сетей оказываются настолько удачными, что широко распространяются в самых различных приложениях. Каждой нейросетевой архитектуре присущ собственный метод обучения, ориентированный на конкретную организацию взаимосвязей в ней. Поэтому обычно рассматриваются не просто архитектуры нейронных сетей, а комплекс из организации элементов сети, нейронов, в виде слоев и метода обучения или алгоритма достижения нейронной сетью состояния, обеспечивающего выполнение ею требуемых действий. Такой комплекс получил название нейросетевой парадигмы. В настоящее время известно несколько десятков нейросетевых парадигм. Точное их число может отличаться в разных источниках. Это связано с отсутствием единого подхода в классификации нейросетевых парадигм. Так многие авторы в качестве разных классов рассматривают практически одинаковые архитектуры, отличающиеся лишь видом представления входных сигналов (бинарный или непрерывный), что не всегда оправдано, хотя в случаях необходимости применения различных алгоритмов обучения вполне закономерно. При рассмотрении списка возможных нейросетевых парадигм целесообразно обратиться к авторитетному мнению B.C. Сарле (Sarle W.S), известного специалиста в области нейронных сетей, в течение многих лет ведущего список часто задаваемых вопросов в телеконференции по нейронным сетям [323]. Им составлен перечень наиболее известных типов нейронных сетей. Уже сам факт наличия их в списке свидетельствует о том, что эти нейросетевые парадигмы нашли успешное применение в какой-либо области. В этом списке нейросетевые парадигмы разделены на две большие группы в соответствии с применяемыми методами обучения: обучение с учителем и обучение без учителя. 56
Основные модели нейронных сетей для использования при обработке ... информации 57 При обучении с учителем правильные результаты функционирования сети (желаемые выходы) считаются известными, и одновременно с каждым набором входных значений сети предъявляется информация о том, насколько правильно она функционирует или каким должен быть правильный отклик. Эта информация используется нейронной сетью для подстройки весов, которые изменяются таким образом, чтобы приблизиться к задаваемым целевым значениям. После обучения нейронная сеть тестируется при различных входных значениях и оценивается, насколько ее выход оказывается близко к желаемому отклику. При обучении без учителя нейронной сети не сообщаются правильные выходные значения. Сеть работает автономно: она просто исследует данные, которые ей представляются, находит в них некоторые характерные черты и обучается отображать эти черты в своем отклике. Она сама подстраивает веса синаптических связей, опираясь на внутреннюю структуру данных. Какие именно признаки способна отыскивать и отображать нейронная сеть, зависит от ее конкретной архитектуры и используемого метода обучения. Такие нейронные сети обычно выполняют задачи сжатия информации, снижения размерности или кластеризации. Различие между этими методами не всегда четко просматриваются. Полученные в результате обучения без учителя параметры законов распределения могут быть в дальнейшем использованы для составления прогнозов. Кроме того, среди методов обучения с учителем можно различать автоассоциативное обучение и гетероассоциативное обучение. При автоассоциативном обучении указания учителя совпадают с входными значениями, а при гетероассоциативном, вообще говоря, отличаются от них. Многие методы обучения без учителя эквивалентны автоассоциативным методам. Указанные неоднозначности затрудняют формирование четкой классификации. Нейронные сети также разделяются на сети прямого распространения и сети с обратными связями. В сетях прямого распространения связи между элементами не образуют циклов. Поэтому сети прямого обычно распространения формируют отклик на входной сигнал достаточно быстро. Для большинства таких сетей в дополнение к чисто нейросетевым методам обучения могут использоваться традиционные оптимизационные численные методы (например, метод сопряженных градиентов и др.). В нейронных сетях с обратными связями связи между нейронами могут образовывать циклы. В некоторых нейронных сетях после получения входного сигнала должно пройти несколько, иногда достаточно много итераций, для получения ответа. Обычно сети с обратными связями обучать сложнее, чем сети прямого распространения.
Глава 2 Некоторые виды нейронных сетей, например сеть «победитель получает все», могут быть реализованы и как сети прямого распространения и как сети с обратными связями. Нейронные сети также различаются по типам данных, которые поступают на их вход. Категориальные переменные принимают только ограниченное число значений, и обычно бывает несколько классов, попадающих в одну категорию. Такие переменные могут принимать символьные значения, которые должны быть приведены к некоторому числовому формату перед тем, как подаваться на вход нейронной сети. Если выходом сети являются категориальные переменные, такая сеть выполняет функцию классификации. Числовые переменные представляют собой количественные измерения какой-либо величины. Измерения должны проводиться таким образом, чтобы отражать характерные свойства атрибутов объектов которые должны распознаваться нейронной сетью. Некоторые переменные могут трактоваться и как числовые и как категориальные, как, например любое бинарное значение или количество двигателей у распознаваемого самолета. Большинство категориальных переменных может быть представлено в виде 0/1 бинарных значений. Ниже перечислены основные нейросетевые парадигмы [85]: 1. Обучение без учителя: 1) сети с обратными связями: а) аддитивная модель Гроссберга (Additive Grossberg - AG); б) шунтированная модель Гроссберга (Additive Grossberg - SG); в) бинарная модель адаптивного резонанса (Binary Adaptive Resonance Theory - ART1); г) аналоговая модель адаптивного резонанса (Analog Adaptive Resonance Theory - ART2, ART2a); д) дискретная модель Хопфилда (Discrete Hopfield - DH); е) непрерывная модель Хопфилда (Continuous Hopfield - CH); ж) дискретная двунаправленная ассоциативная память (Discrete Bidirectional Associative Memory - ВАМ); з) временная ассоциативная память (Temporal Associative Memory - ТАМ); и) адаптивная двунаправленная ассоциативная память (Adaptive Bidirectional Associative Memory - ABAM); к) самоорганизующаяся модель соответствий Кохонена (Koho- nen Self-organizing Map/Topology-preserving map - SOM/TPM); л) конкурирующее обучение (Competitive learning); 2) сети без обратных связей: а) обучающая матрица (Learning Matrix - LM); 58
Основные модели нейронных сетей для использования при обработке ... информации б) обучение с усилением ведущих компонент (Driver-Reinforcement Learning - DR); в) линейная ассоциативная память (Linear Associative Memory - LAM); г) оптимальная линейная ассоциативная память (Optimal Linear Associative Memory - OLAM); д) разреженная ассоциативная память (Sparse Distributed Associative Memory - SDM); е) нечеткая ассоциативная память (Fuzzy Associative Memory - FAM); ж) противоподкрепление (Counterpropagation - CPN). 2. Обучение с учителем: 1) сети с обратными связями: а) модель состояний мозга (Brain-State-in-a-Box - BSB); б) модель нечетких когнитивных соответствий (Fuzzy Congitive Map - FCM); в) машина Больцмана (Boltzman Machine - ВМ); г) аннилинг усредненных полей (Mean Field Annealing - MFT); д) модель рекуррентных каскадных корреляций (Recurrent Cascade Correlation - RCC); е) обучаемая кластеризация векторов (Learning Vector Quantization - LVQ); ж) обратное распространение ошибки в течение времени (Back- propagation through time - ВРТТ); з) рекуррентное обучение в реальном времени (Real-time recurrent learning - RTRL); и) рекуррентный обобщенный фильтр Калмана (Recurrent Extended Kalman Filter EKF); 2) сети без обратных связей: а) персептрон (Perceptron); б) адалин, мадалин (Adaline, Madaline); в) обратное распространение ошибки (Backpropagation - BP); г) машина Коши (Cauchy Machine - CM); д) модель адаптивного эвристического критика (Adaptive Heuristic Critic - АНС); е) модель нейронной сети с временной задержкой (Time Delay Neural Network - TDNN); ж) модель ассоциативных поощрений и наказаний (Associative Reward Penalty - ARP); з) avalanche Matched Filter (AMF); и) обратное просачивание ошибки (Backpercolation - Perc); к) artmap; 59
Глава 2 л) адаптивная логическая сеть (Adaptive Logic Network - ALN); м) модель каскадных корреляций (Cascade Correlation - CasCor); н) обобщенный фильтр Калмана (Extended Kalman Filter - EKF). Конечно, даже для краткого обзора всех известных нейросетевых парадигм потребовалась бы целая книга, а может быть, и не одна. Поэтому для знакомства со всем многообразием нейросетевых моделей автор отсылает читателя к списку литературы. Среди наиболее значимых работ можно указать следующие [20; 24; 29; 86; 135; 140; 180; 183; 311]. До недавнего времени ощущался острый недостаток русскоязычной литературы, по основам нейросетевой технологии. Вот почему заинтересованный в этой интересной области исследователь должен был знакомиться с нейросетевой тематикой, в основном, по англоязычной литературе. Единственным источником, достаточно широко охватывающим различные аспекты нейросетевой технологии, была книга [135]. В последнее время положение резко изменилось. Стали появляться книги, освещающие вопросы теории нейронных сетей с различных сторон, и даже квалифицированный в области нейронных сетей специалист может найти несколько источников, которые окажутся для него полезными [20; 24; 27; 29; 49; 60; 80; 81; 87; 89; 116; 140]. Особо следует отметить серию книг, посвященных нейросетевой тематике, в рамках которых уже вышло более десятка книг, и к которой относится и настоящее издание. В то же время, следует с сожалением констатировать, что до сих пор подобрать подходящую по широте охвата и глубине изложения литературу на русском языке достаточно сложно и часто приходится обращаться к зарубежным источникам. В иностранных издательствах более десяти лет ежегодно выходит несколько изданий, посвященных нейронным сетям, и уже вышло много глубоких и интересных книг, написанных признанными авторитетами, в которых продуманно глубоко и с достаточной широтой охвата излагаются основы теории нейронных сетей. Но их переводов на русский язык пока нет ... Для того чтобы не затруднять читателя поиском дополнительной нейросетевой литературы в следующих подразделах приводится описание основных нейросетевых парадигм. Еще раз напомним, что под парарадигмой в теории нейронных сетей подразумевается совокупность архитектуры построения нейронных сетей и алгоритмов их функционирования, включая процессы обучения и выполнения требуемых пользователю операций. Такими операциями, в зависимости от имеющихся задач могут быть: распознавание объектов, прогнозирование, аппроксимация многомерных отображений, кластеризация, сжатие данных, выделение и анализ признаков и другие. 60
Основные модели нейронных сетей для использования при обработке ... информации 61 Среди множества нейросетевых парадигм, указанных выше, а также среди других, встречающихся в литературе, большинство построены в той или иной степени на аналогиях с работой биологических нейронных сетей. Успешность их применения обычно подтверждена применением в какой-либо предметной области. Однако часто достоверного статистического анализа качества их работы не проведено. Тем не менее, эти модели оказываются очень полезными во многих задачах. Наиболее яркими представителями такого подхода являются ког- нитрон и неокогнитрон [211; 212], в которых имитируется гипотетическая модель системы восприятия человека. Данная нейросетевая структура состоит их многих слоев нейронов возбуждающего и тормозящего типа. Каждый последующий слой осуществляет более глубокий уровень обобщения признаков, описывающих свойства распознаваемых объектов. Последний слой нейронов, определяет классы распознаваемых объектов. При этом за счет многократного перекрытия рецептивных полей для слоев нейронов обеспечивается инвариантность к сдвигам, поворотам и небольшим искажениям образов. Когнитрон и неокогнитрон привлекают своей схожестью с биологическими системами зрительного восприятия и по известным данным обеспечивают высокую точность распознавания. В то же время эти модели, особенно неокогнитрон, представляют собой сложные системы, статистический анализ которых исключительно труден. По поводу нетрадиционности и новизны нейросетевых алгоритмов часто возникают вполне обоснованные споры. Действительно многие нейросетевые алгоритмы имеют прямые аналогии в статистике [322]. Большое число типов нейронных сетей схожи со стандартными статистическими методами или полностью им идентичны. Так, следуя нейросетевой терминологии, статистические выводы трактуются как обучение на основе зашумленных данных. Статистическими методами фактически работают большинство нейросетевых моделей, за исключением некоторых, таких как исходная модель персептрона Розенблатта или сети адаптивного резонанса. В этих моделях не предусмотрена возможность зашумления данных, а, следовательно, статистические методы не могут быть применены. Некоторые сети, как например, сети Хопфилда, не проходят процесс обучения, и, поэтому их прямая аналогия со статистическими выводами не просматривается. Однако анализ функционирования этих сетей может проводиться с использованием статистических методов, как это, например, сделано в 5-й главе. В то же время, большинство нейросетевых моделей, в которых предусмотрено обучение на зашумленных входных данных, практиче-
Глава 2 ски адекватны статистическим методам. Так, например, сети прямого распространения без скрытых слоев (включая функциональные сети и сети высших порядков идентичны обобщенным линейным моделям; сети с одним скрытым слоем нейронов очень схожи с методом проекционной регрессии; вероятностные нейронные сети аналогичны ядерному дискриминантному анализу; правило обучения Хэбба имеет много общего с методом принципиальных компонентов, а сети Кохонена для адаптивной векторной квантизации являются прямым развитием статистического метода кластеризации к-средних. Сети прямого распространения фактически являются подмножеством методов нелинейной регрессии и дискриминантного анализа, свойства которых уже давно изучают статистики. Однако конкретно это подмножество ими не изучалось до исследований нейросетевой тематики, и именно нейросетевые исследователи стали инициаторами подобных алгоритмов, оказавшихся весьма успешными. Тем не менее, многие результаты статистической теории напрямую применимы к этим нейро- сетевым моделям и методы уточнения статистических моделей, такие как различные вариации методов сопряженных градиентов и Левенбер- га-Маркварда, с успехом используются для обучения нейронных сетей. Применение статистической теории подробно исследовано в работах [180; 311], а взаимосвязь между статистическими и нейросетевыми моделями освещена в работах [322; 354; 192; 286; 193]. В то время как нейронные сети обычно используют терминологию, характерную для алгоритмов или реализаций, для статистических методов свойственно формализовать получаемый результат. Например, арифметическое среднее может быть рассчитано с помощью очень простой сети, с использованием обычной формулы или другими способами. Несмотря на различия реализации, результат расчетов остается одинаковым для всех методов. Поэтому статистик будет рассматривать все возможные варианты как различные алгоритмы, реализующие одну и ту же статистическую модель. С другой стороны, изменение целевой функции, с точки зрения статистика, переводит модель в принципиально другой класс, с новыми статистическими свойствами, несмотря на сходность реализации. В нейросетевой же практике изменение целевой функции (функции ошибок) обычно не рассматривается как новая парадигма, в то время как изменение способов проведения расчетов (архитектуры сети) может оказаться решающим при выделении нового класса нейросетевых моделей. В литературе, посвященной нейронным сетям можно встретить и некоторые утверждения, с которыми трудно согласиться. Иногда утверждается, что нейронная сеть, в отличие от статистических методов, не нуждается в предположениях о вероятностных распределениях. На 62
Основные модели нейронных сетей для использования при обработке ... информации 63 самом деле многие нейросетевые методы опираются на те же самые предположения, что и аналогичные им статистические методы, но статистики обычно изучают следствия из невыполнения предположений, в то время как многие нейросетевые исследователи - нет. Так метод наименьших квадратов широко распространен и среди статистиков и среди нейросетевых исследователей. Статистики понимают, что это метод опирается на предположение о нормальности распределения шумов при равных дисперсиях и независимости наблюдений, и является оптимальным только при сделанных предположениях. Аналогично, кросс-энтропия обеспечивает максимально правдоподобные решения при шуме с распределением Бернулли. При четком понимании того, какие именно предположения сделаны, исследователь может найти способ скорректировать используемые методы для случаев нарушения этих предположений. Так при нормальном распределении шумов и различных дисперсиях сигналов на разных входах можно использовать взвешенный метод наименьших квадратов. Сотни, если не тысячи исследователей проводили сравнение нейросетевой методологии с традиционной статистикой (вкладывая в этот термин самые различные смысловые понятия). В большинство из этих исследований осуществляется сравнение только для очень узкого диапазона исходных данных (два-три). Наиболее интересный анализ проводится в [286], где не только сравниваются нейросетевые и статистические классификаторы на различных данных, но и проводится подробный анализ результатов. Прекрасный сравнительный анализ сетей Кохонена и метода кластеризации k-средних проведен в [166]. Среди статистиков существует мнение, что нет нейросетевой архитектуры, которая не могла бы быть описана статистическими методами. Необходимо отметить, что существует и противоположная точка зрения, что любой статистический метод может быть переложен на нейросетевой базис. С обеими точками зрения трудно спорить. Конечно, статистика была и останется важнейшим инструментом исследования ней- росетей. Но, по всей вероятности, сейчас можно уже уверенно говорить о новой сформировавшейся области исследований, занимающейся нейронными сетями. И здесь, конечно, уже существует и продолжает расширяться ряд новых интересных методов. Новый нейросетевой подход позволяет рассматривать известные задачи под новым углом зрения, разрабатывать новые варианты их решения, а также применять существенно нетрадиционные подходы. Можно указать следующие преимущества и недостатки нейросетевой технологии.
Глава 2 Таблица 2.1. Преимущества и недостатки нейросетевой технологии Преимущества Недостатки 1. Гибкость и адаптивность результирующих алгоритмов 2. Потенциальная возможность достижения высокого быстродействия за счет использования архитектур с массовым параллелизмом. 3. Возможность быстрого создания работоспособных систем без трудоемкого построения корректных математических моделей и их исследования. 4. Возможность построения систем на основе известных нейросетевых парадигм, доказавших свою работоспособность в конкретных приложениях. 5. Возможность наращивания возможностей после запуска системы в работу. 6. Способность к переобучению для изменения характеристик при модификации 1. Отсутствие формализованной теории выбора необходимых моделей. 2. Нет строгих оценок скорости сходимости, что приводит к необходимости основываться на эмпирических оценках при анализе таких систем. 3. Нехватка квалифицированных кадров в области нейро- компьютинга, что приводит к трудностям восприятия нейросетевой технологии специалистами в предметных областях 2.1.4. Место нейронных сетей в задачах радиолокации. К сожалению, прямое заимствование нейросетевых парадигм из других областей не приводит к успеху. Это связано как с недостаточной теоретической проработкой многих основополагающих вопросов использования нейросетевых технологий, так и с особенностями обработки информации в радиолокаторах. К ним можно отнести [62, 133, 114, 113, 105; 90; 16; 85; 281; 91]: * исключительно большой объем информации и необходимость его обработки в ходе работы РЛС - за несколько миллисекунд, а в некоторых случаях и микросекунд; * значительные трудности формализации алгоритмов и обеспечения высокого качества их работы, связанные с непредсказуемостью внешней обстановки и высокой динамикой ее изменения; * необходимость решения нетрадиционных задач, таких как распознавание ситуаций, анализ и прогнозирование обстановки; * необходимость использования априорной информации о характере действия противника, зачастую выраженной в нечеткой форме; * использование комплексных чисел при математическом описании задач пространственной, частотной и временной обработки; * требование обеспечения очень малых значений вероятностей ложных тревог (порядка 10-6) при обнаружении целей; * необходимость эффективной работы в разнотипных условиях и др. Возникает необходимость разработки теоретических положений нейросетевой обработки радиолокационной информации. 64
Основные модели нейронных сетей для использования при обработке ... информации Входы Выход: у Рис. 2.1. Схема формального нейрона 3—5782 65 Все вышеперечисленное обуславливает актуальность исследований, посвященных предотвращению случаев снижения качества радиолокационной информации в условиях большого числа целей и сложной помеховой обстановки на основе рационального применения нейросетевой технологии. Для достижения поставленной цели необходимо решать научные задачи: 1. Создание и развитие существующих теоретических методов анализа качества традиционных и нейросетевых методов обработки РЛИ. 2. Анализ качества традиционных методов обработки РЛИ и определение мест рационального использования нейросетевой технологии. 3. Исследование известных нейросетевых парадигм и оценка их применимости к различным задачам обработки РЛИ. Определение рациональных архитектур для наиболее важных задач обработки. 4. Разработка и исследование методов обработки РЛИ на различных этапах работы РЛС с использованием нейросетевых парадигм. 5. Анализ аппаратных средств поддержки нейросетевых вычислений и выработка рекомендаций по построению вычислительных средств обработки РЛИ, реализующих нейросетевые архитектуры. 6. Разработка стратегии рационального внедрения нейросетевой технологии в решение задач обработки радиолокационной информации. 2.2. Анализ основных нейросетевых парадигм Нейросетевая вычислительная структура состоит из сети нейронов, сильно связанных друг с другом. Такая сеть представляет собой компьютерное устройство. Задачи и функции, которые оно выполняет, определяются сформированными связями. Конфигурация связей является своеобразным аналогом программы. В нейронных сетях элементы соединены между собой однонаправленными связными каналами («связями»). Каждый нейрон (см. рис. 2.1) проводит действия над величинами, которые он получает по своим связям, в результате чего его уровень активности, описывающий состояние, меняется, влияя на величину выхода.
Глава 2 Каждый из параметров нейронного элемента представлен математически в виде действительного числа. Каждая связь имеет соответствующий ей вес, который определяет влияние входных значений на уровень активности элемента. Веса могут быть положительными (возбуждающими) или отрицательными (тормозящими). Обычно для получения уровня возбуждения нейрона s его входные величины суммируют: net (2.1) Выходное значение нейрона, поступающее на следующий уровень, нелинейным образом зависит от его уровня возбуждения. Эта зависимость определяется так называемой функцией активации: У = /(net). (2.2) В качестве функции активации нейрона обычно выбирается унимодальная функция (дифференцируемая, ограниченная сверху и снизу) от взвешенной суммы входов нейрона, например, логистическая: 1 (2.3) \ + е Эту функцию часто называют «сигмоидой». Параметр t определяет наклон функции. 1 А*) 0,8 0,6 0,4 0,2 -5 0,5 Рис. 2.2. Функция активации «сигмоида» При t, равном нулю, функция вырождается в пороговую функцию, которая принимает значение 1, если уровень активности положителен, и 0 - в противном случае. /Ы1 ^ (2-4) J W |0 s<0 У ' 66
Основные модели нейронных сетей для использования при обработке ... информации Рис. 2.3,а иллюстрирует график функции (2.4), а рис. 2.3,6 - график функции (2.5). As) 0,8 0,6 0,4 0,2 0 а) б) Рис. 2.3. Функция активации а - «жесткий порог»; б - «линейный порог» Часто используется нелинейное преобразование в виде линейного порога: 1 s>UnovoT (2.5) 0 кО. f(s) = \s/UnopOT 0<s<Unopor Указанные типы функций имеют областью определения только положительные значения, что недостаточно удобно для ряда задач, требующих симметрии. Поэтому находят применение аналоги указанных функций, симметричные относительно начала координат. f(s) = tanh(s) /(') е +е 1 s>0 -1 s<0, /(*) = 1 -1 порог ^порог — 3 ^ ^Люрог *<-С/порог. (2.6) (2.7) (2.8) Графики зависимостей, реализуемых этими функциями, полностью аналогичны приведенным на рис. 2.2; 2.3 со сдвигом оси ординат на величину 0,5. Вышеописанная модель нейрона является наиболее часто встречающейся, но далеко не единственной. Главным в нейросетевой архи- 67
Глава 2 тектуре является наличие нейронов (простых вычислительных элементов) и связей между ними. Математическое выражение связей и вычислений может быть различным. Хотя в большинстве нейросетевых парадигм используется именно приведенная модель, она может быть изменена в любом направлении. Так вместо суммы входов можно рассмотреть произвольную другую операцию от нескольких переменных. И архитектуры, использующие разные варианты комбинирования входных значений нейрона, известны. Также можно рассмотреть иную форму нелинейного преобразования, в частности, зависящую не от одного накопленного значения, а от всех сразу. Например, в некоторых нейросетевых архитектурах широко используется выбор максимальной из входных величин. Можно рассматривать другие варианты произвольных функциональных преобразований в нейроне, если они оказываются полезными для решения задач, поставленных перед нейросетевой моделью. Особенности построения модели определяются в первую очередь предметной областью, из которой исходит решаемая задача. При проведении настоящих исследований среди нейросетевых моделей были выбраны те, которые имеют достаточно прочное математическое обоснование и при анализе которых могут быть применены результаты статистической теории. Ниже рассмотрены три самые известные модели нейронных сетей, которые успешно применяются в самых разнообразных предметных областях. Помимо частоты использования и успешности применения в различных областях при выборе нейросетевых парадигм важным фактором было наличие теоретических обоснований используемых моделей. Среди многообразия достижений нейросетевых исследований уже существуют важные теоретические результаты, обосновывающие возможность применения некоторых моделей, оценивающие их свойства и гарантирующие, по крайней мере, в асимптотике, эффективность их использования для решения поставленных задач. Основными нейросетевыми парадигмами являются многослойный персептрон, сети Хопфилда и модели Кохонена, а также их модификации, число которых, особенно для многослойного персептрона весьма значительно. Многослойный персептрон является самой широко применяемой нейросетевой моделью, в которой нейроны сгруппированы в слои и послойно связаны между собой. Он применяется при решении задач регрессии (обычно многомерной) и распознавания образов. Ассоциативная память Хопфилда позволяет воспроизводить запомненные образы при предъявлении части изображения или искаженных примеров и может быть также использована для решения трудных задач дискретной оптимизации. 68
Основные модели нейронных сетей для использования при обработке ... информации Сети Кохонена используются для решения задач кластеризации, сжатия информации, а также оказываются очень полезными при выявлении внутренней структуры данных. 2.2.1. Многослойный персептрон. Многослойный персептрон является наиболее широко применяемой и известной архитектурой нейронной сети. Он состоит из нескольких слоев нейронов: слоя входных элементов, слоя выходных элементов и одного или нескольких внутренних слоев нейронов. Все нейроны каждого из слоев, кроме первого (входного), связаны между собой. Рис. 2.4. Традиционный многослойный персептрон Многослойные персептроны представляют собой нейронные сети прямого распространения, которые обучаются с помощью стандартного алгоритма обратного распространения ошибки. В них используется принцип обучения с учителем, поэтому для обучения необходимо представлять желаемый результат. Этот алгоритм используется для получения соответствия между заданными входами и получаемыми выходами. Такие нейронные сети используются для решения задач распознавания образов, например, распознавание радиолокационных портретов целей, рукописных или печатных символов. Многослойный персептрон является обобщением первой модели нейронной сети - персептрона. В 1943 г. нейрофизиолог Уоррен Маккалох (Warren S. McCulloch) и его аспирант молодой математик Уолтер Питтс (Walter A. Pitts) предложили модель нейрона, в которой взвешенная сумма входов сравнивается с порогом и на выход подается бинарное решение 0 или 1 [284; 75]. Спустя несколько лет нейробиологом Дональдом Хэббом (Donald О. Hebb) была предложена гипотеза, согласно которой в биологических нейронных сетях веса синаптических связей увеличиваются, если соответствующие входы и выходы одновременно активны, и таким образом происходит процесс обучения [26]. 69
Глава 2 На основе этих идей в 1959 г. Франк Розенблатт (Frank Rosenblatt) разработал первую модель нейронной сети - персептрон (Perceptron). Эта простая нейронная сеть состоит из единственного нейрона с подстраиваемыми весовыми коэффициентами и смещения (рис. 2.5). Она может использоваться для разделения на классы линейно сепарабель- ных переменных. Входы Выход: y(t) О хо=1 (смещение) Рис. 2.5. Персептрон Розенблатта В качестве активационной функции используется жесткая пороговая функция, с выходами +1 или -1, в зависимости от знака входной переменной (она, по сути, есть известная математическая функция определения знака sign(v)). x(t) = (-1, Xj(/), х2(0>-> хи(0)Т - расширенный вектор входных значений, в котором для единства записи вводится дополнительный элемент с нулевым индексом элемент, равный -1; w(t) = (w0(t), wx{t), w2 (/),..., wn(t))T - вектор весовых коэффициентов и смещения; net(r) = w(t)Tx(t) - уровень возбуждения нейрона. Разделяющая поверхность между классами есть прямая (гиперплоскость), перпендикулярная весовому вектору. wTx > 0 для класса 1, выход=1 wTx < О для класса 2, выход=0. Ненулевое значение смещения позволяет сместить эту прямую относительно начала координат. Обучение персептрона происходит согласно обобщенному правилу Хэбба. 1. Если образы классифицируются правильно, то весовой вектор не изменяется. 2. В случае если образ классифицирован неверно, веса изменяются в соответствии с соотношениями: х2 Класс 1 XI Класс 2 Рис. 2.6. Линейная разделяющая поверхность wT*x+b=0 70
Основные модели нейронных сетей для использования при обработке ... информации w(t + \) = w(t) + ri(t)x{t) если jc(/) из класса 1, но>> = 0, w(t + \) = w{t)-rj{t)x(t) если x{t) из класса 2, но^ = 1. Пример обучения. Для простоты рассмотрим пример, когда разделяющая поверхность между классами проходит через начало координат, и смещение не требуется. Входы Выход: y{t) Рис. 2.7. Двухвходовый персептрон без смещения Используем следующие пары вход/выход для обучения. "1 2 *(0 = ,/1=1кЬ(2) = ,/2=0Wx(3) = О -1 Для них может быть использована приведенная на рис. 2.8. разделяющая поверхность. Класс 1 Рис. 2.8. Разделяющая поверхность для двух классов Выберем случайный вектор весов: wT=(l, 0,8) Класс 2 Рис. 2.9. Реализуемая персептроном после инициализации разделяющая поверхность 71
Глава 2 Для примера 1 р(\): у = порог(wx) = порог (l, -0,8) 1 v2y = порог(-0,б) = 0. Так как пример классифицирован неверно, используем алгоритм обучения: w(/ + l) = w(/) + 7; (/)*(/) если jc(/) из класса 1, по у = 0 . В качестве шага обучения возьмем 1. Тогда wT=(\, -0,8) + (1, 2) = (2, 1,2)[2 1,2]. Для примера 2 р(2) имеем: " -Г « = nopor(wTp) = порог [2 1,2]^ = порог(0,4) = 1. Так как и этот пример классифицирован неверно, используем вторую часть алгоритма обучения: w(n +1) = w(n) - rj{n)р(п), если р(п) из класса 2, но а = 1» w = [2 1,2]-[-1 2] = [3 -0,8]. Аналогично для примера 3 р(Ъ) получим: а = nopor(wTp) = порог [3 -0,8]* = порог(0,8) = 1. Снова используем алгоритм обучения (результат классификации неверный): w{n +1) = w(n) - п(п)р(п), если р(п) из класса 2, но а = 1 w = [3 -0,8]-[0 -1] = [3 0,2]. Теперь имеем: "Г /?(1): а = nopor(wTp) = порог [3 0,2]< = порог(3,4) = 1. Р(2): а = порог (v//?) = порог [з V 0,2]. "-Г _2_ = порог(-2,6) = 0 , / /*3): а = nopor(wT/?) - порог ( [з 0,2]* "0" -1 \ = порог(-0,2) = 0. Результат классификации правильный для всех примеров, обучение закончено. 72
Основные модели нейронных сетей для использования при обработке ... информации Нейронная сеть содержит несколько выходных нейронов. Мы хотим обучить ее так, чтобы выход каждого нейрона принимал заданные значения. Разница между желаемым t и полученным у значениями образует ошибку для каждого выходного нейрона: e-t-a. Наша цель состоит в минимизации этой ошибки. В качестве общего показателя для всех выходных нейронов выбирается сумма квадратов их ошибок (sum of the squared error - SSE). Изменение весов описывается выражением: dSSE dwk wk(n + \) = wk(n) + T] q=\ wk (л +1) = wk (n) + 77 [t{n) - a(n)] pk (n), где: tj - параметр обучения, k - номер шага (итерации). В матричной записи: Щк +1) = W(£) + пе(к)рТ(к), b(* + l) = b(*) + 7e(*). Если параметр обучения слишком велик, в процессе обучения могут возникнуть нестабильности. Максимальный параметр обучения должен быть меньше величины, обратной к максимальному собственному значению: 1 *!<-—• Общая схема алгоритма показана на рис. 2.10. Первые нейросетевые модели, такие как персептрон Розенблатта и адалин Уидроу способны проводить различение между классами, в том случае, если эти классы линейно разделимы, т.е. поверхность (гиперповерхность) представимая линейным выражением, способна разбить пространство на непересекающиеся классы. Однако многие задачи реального мира не могут быть сведены к такой простой схеме. Это заставило исследователей искать новые подходы. Ограничения, однослойных моделей, таких как персептрон Розенблатта и адалин группы Уидроу, можно преодолеть, используя нейронные сети с большим количеством слоев нейронов. 73
Глава 2 Сигнальный вектор последовательно проходит по этим слоям, начиная с входного, при этом на выходе формируется обработанный сигнал, размерности, в общем случае, отличающейся от входного вектора. Слои нейронов соединены между собой связями, обычно каждый нейрон предыдущего слоя связан с последующими (рис. 2.11). При этом связи также организованы в слои, расположенные между слоями нейронов. входной слои нейронов скрытый слои нейронов выходной слои нейронов первый слой связей второй слой связей Рис. 2.11. Структура двухслойного персептрона Таким образом, многослойный персептрон содержит чередующиеся слои нейронов и связей. Основная часть вычислений проводится на 74
Основные модели нейронных сетей для использования при обработке ... информации слоях связей. Поэтому обычно число слоев персептрона считают по слоям связей. В ранней литературе по теории нейронных сетей число слоев определялось по слоям нейронов. Иногда учитывают только внутренние слои персептрона. Так изображенный на рисунке двухслойный персептрон может также называться трехслойным, если считать число слоев нейронов, или содержащим один скрытый слой. Вычислительные операции, реализуемые нейронной сетью, одинаковы на каждом слое и сводятся к двум этапам. На первом этапе рассчитывается взвешенная сумма выходов нейронов предыдущего слоя. В качестве взвешивающих множителей используются весовые коэффициенты нейронной сети. Полученные значения подаются на вход нейронов следующего слоя. На втором этапе каждый нейрон, получивший входное значение проводит его нелинейное преобразование. Общая формула, связывающая выходы нейронной сети с ее входами выглядит следующим образом. V i=i для каждого из слоев или V ,-(*)=i 1 Л 2 N + w/(2)0 +w/(3)0 л(2) 2 1 i(2)=l n(\) k .+ WjO для описания полного преобразования на всей сети. Для обучения многослойного персептрона применяются те же идеи, что и для адалина Уидроу. Это - метод наименьших квадратов. Фактически процедура и механизм подстройки весов остаются здесь такими же, как и выше. Отличие заключается в том, что в многослойном персептроне имеется несколько слоев весов, и каждый слой представляет собой матрицу, в которой число столбцов соответствует числу нейронов в выходном слое. Общая формула для расчета изменений весов может быть записана в виде: dSSE д н^- Задача расчета частных производных по внутренним весам в принципе не содержит особых сложностей, но при прямом расчете требует весьма трудоемких вычислений. 75
Глава 2 Обратное распространение ошибки основывается на последовательном применении правила суперпозиции при вычислении производных для расчета чувствительности целевой функции по отношению к внутренним состояниям и весам нейронной сети [54, 55]. Другими словами, понятие обратного распространения используется для обозначения процесса распространения ошибок во внутренние узлы сети, при этом полученные значения затем используются для вычисления градиентов весов этих узлов. Обучение происходит за счет попеременного применения прямого распространения возбуждения нейронов сети и последующего обратного распространения текущих ошибок. Это наиболее широко распространенный метод обучения нейронных сетей. Структура его работы проиллюстрирована на рис. 2.12. В общем виде метод обратного распространения ошибки можно представить следующим образом. Задана многослойная сеть, каждый последующий слой которой принимает выход предыдущего в качестве входа, т.е., вектора выходов-входов хп, таковы, что: где Fn - некоторое нелинейное преобразование реализуемое п -м слоем, а % - параметры, от которых это преобразование зависит. При этом начальный вектор х0 является входным для сети, а последний, xN - ее выходом. Вообще говоря, конкретный вид функционального преобразования Fn может быть различным и значительно отличаться от традиционного представления многослойного персептрона. Для каждой пары значений входа и желаемого выхода, подаваемой на вход нейронной сети, рассчитывается ошибка. Критерием качества обученности является средний уровень ошибок по всем парам: Идея метода backpropagation заключается в последовательном применении правила дифференцирования суперпозиции функций и использовании идей динамического программирования при организации вычислений. Если нам известна производная ошибки Ер по одному из векторов хп, то производные по предыдущим векторам запишутся в виде: (2.9) (2.10) дЕр зер д (2.11) dwn дхп dw 76
Основные модели нейронных сетей для использования при обработке ... информации
Глава 2 дЕр _дЕр д дхп_х дхп дх (2.12) д где —F(wn,xn_x) - якобиан векторной функции F по отношению к w дх в точке (w„9*„_i), a -^F(wn,xn_x) - якобиан той же функции по отно- dw шению к х в той же точке. Под якобианом векторной функции понимается матрица, элементами которой являются частные производные каждой компоненты функции по каждой из составляющих вектора входа. Используя указанные соотношения, можно в обратном порядке рассчитать все производные функции ошибок по отношению к весовым коэффициентам. Поэтому данный метод и носит название обратного распространения ошибок. Представленный вариант последовательности расчета производных предоставляет значительные преимущества при организации вычислений. Действительно, если рассчитывать каждую из производных отдельно, независимо от других, число требуемых вычислительных операций при размерности К каждого из векторов хп было бы пропорционально, по крайней мере, (NxK)2, а использование идеи их последовательного расчета снижает эту оценку до NxK , что соответствует числу операций при прямом расчете [262]. В случае традиционных многослойных персептронов функциональное преобразование F сводится к произведению весовых векторов wn, представляемых в виде матриц Wn на входной вектор хп и последующему поточечному применению функции активации /(о) к элементам полученного вектора: В результате вышеприведенные соотношения для вычисления частных производных запишутся в виде: (2.13) x„=f(y„)- (2.14) дЕр дЕр (2.15) дЕр дЕр _ (2.16) 78
Основные модели нейронных сетей для использования при обработке ... информации = w П ТдЕр (2.17) что аналогично выражению для весов выходного слоя, только вместо ошибки выходных нейронов используется ее аналог, который можно назвать ошибкой нейронов скрытого слоя. Эта ошибка рассчитывается как сумма ошибок всех выходных нейронов, взятых с весами, равными синаптическим связям промежуточного слоя с выходным. Ошибка как бы распространяется по синаптическим связям от выхода сети в ее входу с теми же весовыми коэффициентами, которые участвуют в прямом цикле работы сети. Отсюда и появилось название этого метода расчета градиента ошибки - метод обратного распространения ошибки (backpropagation). Красота и эффективность этой идеи позволили стать многослойному персептрону с методом обучения backpropagation самой распространенной нейросетевой моделью. Простейшая процедура обучения (минимизации) в этом случае может быть представлена в виде: В этой записи параметр rj является скалярной константой. В других вариантах реализации может рассматриваться изменяющийся во времени параметр или даже его матричная форма, рассчитываемая в виде оценки обратной матрицы вторых производных, как это делается в ньютоновских или квазиньютоновских методах. Выбор правильных значений этого параметра очень важен с точки зрения скорости сходимости. Метод обратного распространения ошибки был первоначально разработан П. Вербосом (P. Werbos) [352] и затем популяризирован Д.Е. Румельхартом (Rumelhart D.E.) в его широко известной работе [319], где были исследованы вопросы сходимости данного метода для задачи сложения по модулю два (так называемая XOR задача). Этот метод уже давно стал классикой в теории нейронных сетей. Он применяется в 90% практических приложений. Успешность применения во многих предметных областях, концептуальная простота и относительная легкость реализации, вычислительная эффективность, физическая наглядность и аналогии с нашими представлениями о работе биологических нейронных сетей обеспечили ему преимущество перед другими методами и сделали несомненным лидером в нейросетевых технологиях. Однако все исследователи отмечают целый ряд недостатков, присущих данному методу, основными из которых являются весьма низкая скорость сходимости и наличие локальных экстремумов, попадание в которые не позволяет получить оптимальные решения. W(t) = W(t-\)-7] дЕр (2.18) dW 79
Глава 2 Поэтому с самого начала использования этого метода предлагались и успешно применялись разнообразные способы его улучшения. Уже в классической работе [319], которая положила начало всеобщему признанию backpropagation, было предложено использовать так называемые «моменты», позволяющие ускорить преодоление равнинных участков поверхности ошибок. Необходимо отметить, что использование моментов уже давно успешно использовалось математическим сообществом при решении задач оптимизации [26]. Число нововведений росло с каждым годом. Нейросетевая тематика привлекает огромное число исследователей. Часть из них является специалистами очень высокого научного уровня, как в области предметных областей, так и в области математической статистики. Но наряду с ними модное научное направление привлекает некоторую часть исследователей, не очень четко представляющих себе механизм работы нейросетевых технологий. Ими часто делается ряд бездоказательных заключений, которые со временем могут приниматься нейросетевым сообществом на веру. Развенчиванию ложных мифов по поводу методов улучшения backpropagation посвящены усилия многих признанных авторитетов в области нейросетевых технологий, таких как Сарле [322], ЛеКун (Y.LeCun) [262, 263] и др. Классический метод backpropagation относится к градиентным методам обучения. При этом осуществляется последовательная подстройка весовых коэффициентов с целью минимизации функции ошибок. Здесь следует учитывать наличие двух типов ошибок - ошибок, получаемых в ходе сравнения конкретных выходов нейронной сети с желаемыми откликами (эмпирический риск), и ошибок обобщения, описывающих несоответствие подаваемых на вход нейронной сети сигналов генеральной совокупности, как за счет неточностей приборов, так и за счет невозможности формирования всего бесконечного многообразия возможных сигналов. В работе [214] предложены две меры для ошибки обобщения: смещение и дисперсия. Смещение характеризует, насколько выход нейронной сети, усредненный по всем возможным входным данным, отличается от желаемого, а дисперсия описывает различия выходов нейронной сети в зависимости от наборов входных данных. В самом начале обучения смещение велико, так как весовые коэффициенты сети еще близки к начальным, а дисперсия мала, так как обучение еще не успело вызвать больших отличий между примерами входных данных. В конце обучения ситуация меняется на противоположную: смещение мало, так как результат обучения достигнут, но, если процесс обучения длился слишком долго, то наступает переобучение, когда сеть обучается конкретным примерам, и дисперсия значительно возрастает. Можно показать, что общая ошибка будет минимальна, когда минимизируется сумма смещения и дисперсии. Известно несколько технических прие- 80
Основные модели нейронных сетей для использования при обработке ... информации мов для улучшения качества обобщения, например, ранняя остановка, регуляризация и др. Модификация весовых коэффициентов может осуществляться как по каждому обучающему примеру отдельно (асинхронный режим) так и по всей выборке целиком. Для асинхронного обучения характерно наличие случайной составляющей в рассчитываемом градиенте ошибки, связанной со стохастическим характером входных сигналов. При пачечном обучении эти случайные составляющие перед использованием для модификации весов сглаживаются за счет усреднения по всей выборке, но расчет каждого шага занимает значительное время необходимое для обработки всех сигналов. Синхронный и асинхронный методы обучения имеют свои достоинства и недостатки, которые подробно исследованы и описаны в литературе. Кратко результаты этих исследований можно суммировать следующим образом. Асинхронное обучение или обучение на каждом примере имеет следующие преимущества: • более высокая скорость сходимости в большинстве случаев; • получение более точных результатов; • возможность отслеживания изменений во входной выборке. Рассмотрим указанные свойства подробнее. Повышение скорости сходимости асинхронного обучения по сравнению с пачечным или синхронным обучением может быть проиллюстрировано примером. Обычно входные сигналы нейронной сети имеют очень сильную корреляцию друг с другом. Это эквивалентно появлению на входе сети практически идентичных сигналов. В ходе попачечного обучения, когда модификация весов осуществляется только по завершении всего массива исходных данных, большая часть времени расходуется впустую, так как все последующие расчеты градиента ошибки практически совпадают с уже рассчитанными ранее. В случае же асинхронного обучения каждое изменение веса рассчитывается в новой точке и позволяет приближаться к точному решению. Таким образом, несмотря на случайную составляющую каждого шага движения к оптимуму, время, необходимое для его достижения, оказывается меньше. Случайная составляющая каждого шага позволяет также преодолевать локальные минимумы, реализуя некоторый аналог процедуры имитации отжига. Поэтому получаемые в асинхронном режиме решения часто оказываются точнее, чем для пачечного обучения. Стохастическое обучение оказывается полезным и для случаев, когда, входные сигналы изменяются в течение времени. Наличие реакции на каждый входной пример позволяет гибко адаптироваться к изменениям статистических свойств входных сигналов, в то время как пачеч- 81
Глава 2 ное обучение способно лишь в лучшем случае давать правильные решения для усредненных по времени данных. Несмотря на наличие серьезных преимуществ у стохастического обучения, в некоторых случаях оказывается лучше использовать пачечный вариант. Сильные стороны этого варианта обучения таковы: 1. Условия сходимости имеют подробное теоретическое описание. 2. Многие приемы улучшения сходимости (например, метод сопряженных градиентов) применимы только при использовании всего массива исходных данных. 3. Теоретический анализ динамики изменения весов и скорости сходимости оказываются проще. Эти преимущества проистекают из тех же причин, которые определяют предпочтительность стохастического обучения, - наличие шума. Шум, который столь важен для нахождения лучшего решения при стохастическом обучении, оказывается препятствием для получения точных оценок. Вместо сходимости к точному минимуму имеют место флуктуации, уровень которых зависит от случайной составляющей в векторе модификации весов. Дисперсия флуктуации пропорциональна [182, 293] параметру обучения. Поэтому для уменьшения флуктуации следует уменьшать этот параметр. Теоретические результаты [217] показывают, что оптимально уменьшать параметр обучения обратно пропорционально номеру итерации. Другим методом уменьшения влияния шума является использование эпох с небольшим числом примеров в начале обучения и постепенным его увеличением в процессе обучения. Мюллер в [291] обсуждает один из методов организации такого процесса, а Орр рассматривает этот метод для линейных задач [297]. Еще одним преимуществом пачечного обучения является возможность использования вторых производных. Вторые производные позволяют при нахождении экстремума не только следовать градиенту, но и учитывать изогнутость поверхности целевой функции, чтобы оценить его местонахождение. Тем не менее, несмотря на преимущества пачечного использования эпох, стохастическое обучение часто оказывается предпочтительным, особенно при больших объемах обучающей выборки, просто потому, что оно быстрее и требует меньше вычислительных ресурсов. Известно, что сеть обучается быстрее, если ей предъявлять неожиданные примеры. Заметим, что это верно только для стохастического обучения, так как порядок предъявления примеров не важен при пачечном обучении. Конечно, не существует простых методов определения, какие из примеров наиболее информативны, но есть один достаточно простой способ следовать этой идее. Он заключается в том, чтобы про- 82
Основные модели нейронных сетей для использования при обработке ... информации сто последовательно выбирать примеры, принадлежащие различным классам, имея в виду то, что примеры из одного класса, скорее всего, содержат одну и ту же информацию. Другой эвристикой определения информативности различных примеров является изучение отличий между желаемым и реальным откликами сети. Большая ошибка свидетельствует о том, что пример не знаком сети и, следовательно, содержит много новой информации, поэтому его следует предъявлять сети чаще. Конечно, под большими понимаются ошибки относительно всех других примеров. В ходе обучения их соотношение, а следовательно, и частота предъявления примеров могут изменяться. Этот метод носит название подчеркивавшей схемы. Однако следует быть осторожным при изменении частоты появления примеров, так как это влияет на относительную важность, которая им приписывается. Возможность такого изменения определяется предметной областью. Так ошибочные измерения вовсе не следует предъявлять чаще, несмотря на обеспечиваемые ими большие ошибки. Оказывается, на скорость сходимости существенно влияет вид, в котором представляются входные значения. В большинстве работ, посвященных анализу метода обратного распространения ошибки, рекомендуется проводить простейшую предварительную обработку, которая предусматривает 3 шага (рис. 2.13). компенсация смещения нормализация дисперсии -> выбор независимых признаков V Рис. 2.13. Схема трехшаговой предварительной обработки 1. Среднее значение каждого элемента вектора входов должно быть близко к нулю, для чего из всех входных значений следует вычесть их среднее значение. 2. Дисперсия отклонения для всех входных элементов должна быть одинакова и близка к единице, для чего следует провести нормали- 83
Глава 2 зацию входных величин, то есть поделить их среднеквадратичное значение. 3. Все входные величины, по возможности должны быть не коррелированны, для чего достаточно простых методов не существует, а среди вычислительно сложных можно указать ортогонализацию методом Грамма-Шмидта или метод главных компонент. Нейронные сети типа многослойного персептрона оказываются универсальными аппроксиматорами. При использовании одного или двух внутренних слоев они могут с любой степенью приближения описать практически любое преобразование. Для некоторых сложных проблем была показана их способность давать решение, близкое к оптимальному. Наиболее интересным для задач радиолокации является его способность успешно решать задачи распознавания образов, что позволило этой нейросетевой модели завоевать широкую популярность. Рассмотрим подробнее обучение многослойного персептрона для решения задач распознавания. При распознавании объектов нейронной сетью, решение о принадлежности анализируемого сигнала одному из классов принимается на основе выходов многослойного персептрона. На вход нейронной сети подается набор пар, состоящих из вектора входных сигналов х и требуемых выходных значений г = {0; 1}* (К - число распознаваемых классов). Каждому классу отводится отдельный выход, а требуемый выходной вектор представляет собой последовательность вида |о, 0, ..., 0, 1,0, ..., о| со всеми нулевыми элементами, кроме к-ro (к - номер класса), который равен 1. Для входного вектора, рассчитывается выдаваемый сетью вектор g, который является функцией от полученных входных значений и вектора весов w: g = g{x, w). Задачей нейронной сети является установление таких весовых значений iv, чтобы выход сети в наибольшей степени соответствовал желаемым значениям. Для этого рассчитывается ошибка U, зависящая от выходного вектора сети g и требуемого t, и с ее помощью осуществляется подстройка внутренних параметров сети - весовых векторов w. Конкретный вид функционала U определяется требованиями к системе распознавания. Цель обучения состоит в минимизации этой ошибки. Известно много различных вариантов формирования критерия оптимизации на основе рассчитанных значений парциальных ошибок. Наибольшее распространение получила среднеквадратическая ошибка, которую можно записать в виде: 84
Основные модели нейронных сетей для использования при обработке ... информации U = (g-tf. (2.19) Оказывается, что в асимптотике результат работы нейронной сети стремится к апостериорной вероятности наличия цели, т.е., пропорционален функции правдоподобия. Более конкретно, выходы многослойного персептрона gk, обучаемого с квадратичной функцией ошибок ^к=(^к~(к)2' если требуемый выход для А:-го класса задается как О, 0, ..., 0, 1,0, ..., 0 j , после достаточно длительного обучения подчиняются соотношению: Uk = \{gk-PanoCTeP(x)f Pi*) ^ + + JXnocxep (*) йтостер (*)/>(*) & > не зависит от g где р{х) - полная вероятность распределения входных сигналов, а ^тостер (*) и бапостер (*) ~ апостериорные вероятности наличия цели и ее отсутствия, соответственно. В случае если выходы нейронной сети находятся в диапазоне [0, 1], этот факт доказан в [308]. Иногда требуемые значения для выходов нейронной сети задаются не в виде 0 и 1, а некоторыми другими величинами. Во многих работах приводится рекомендация по использованию нелинейной функции активации нейронов последнего (выходного) слоя со значениями в отрицательной области. Наиболее широко известной и применяемой из таких функций является тангенс гиперболический: ^) = 4^-' (2-21) е +е которая является просто смещенной и растянутой сигмоидой с областью значений [-1, +1]. В других материалах дается рекомендация во избежание трудностей обучения сети в области насыщения, использовать в качестве желаемых откликов для распознаваемых классов не крайние возможные значения функции активации, а несколько сдвинутые к центру величины, например для традиционной сигмоиды, значения 0,2 и 0,8 или -0,7 и 0,7 для тангенса гиперболического [282]. В наиболее общем случае можно записать требуемый выход для к -го класса как |я, а, ..., я, Ь, я, ..., я j . 85
Глава 2 При использовании таких выходных значений утверждение об асимптотической эффективности нейронной сети остается в силе в несколько скорректированном виде. Выходы многослойного персептрона gk, обучаемого с квадратичной функцией ошибок Uk =(gk -tkf, если требуемый выход для к -го класса задается как Ь,а, , после достаточно длительного обучения подчиняются соотношению: U~k = l(gk-({b- а) Рапостер (x) + b)fp(x)dx + + {b-af jPanoctep(x)Qmocrep(x)dx , не зависит от g где р(х) - полная вероятность распределения входных сигналов. Действительно, подстройка весов, проводимая нейронной сетью, организована таким образом, чтобы уменьшить среднюю ошибку. j R ^ R К =1 к=\ где R - число обучающих примеров, а К - число выходных нейронов (распознаваемых классов) в сети. Если эта величина достаточно велика, то средняя ошибка по закону больших чисел стремится к ее математическому ожиданию. Главную часть этой суммы можно разбить на слагаемые, соответствующие каждому из предъявляемых классов. E{U} = ^E{Uk}, E{Uk} = E[{gk-tkf). к=\ Вектор входных значений нейронной сети является реализацией случайного вектора с некоторой функцией распределения. При этом, так как рассматривается задача распознавания нескольких классов, вид этой функции распределения будет зависеть от того класса, к которому принадлежит случайный вектор. Обозначим условную плотность вероятности случайного вектора х для класса сок через . Введем также 86
Основные модели нейронных сетей для использования при обработке ... информации априорную вероятность появления каждого класса - P(o)k) Очевидно, что: А:=1 Тогда р(х\сок) = р{х\(ок)Р((ок) будет совместным распределением входного вектора х и наличия класса щ , а величина р{х) = p(x\<ok) + р(х;а>к) будет безусловной плотностью вероятности для входного вектора х. Здесь через сок обозначено событие наличия любого класса, кроме сок . Запишем составляющую ошибки для класса к с учетом плотностей вероятностей: Е{Uk} = Р(щ) j(gk -bf р(х\щ)dx + р(щ) j(gk -af р[х\щ)dx. После раскрытия скобок и группирования слагаемых по степеням gk можно получить: E{Uk}= jgk2p(x\cok)P{a)k)ax+ jgk2p(x\cok)p(^k)ax- -1Ъ jgkp(x\cok)P(a)k)dx-2a jgkp(x\cok)P[o)k)ax + +b2 jp(x\a>k)P(a>k)dx + a2 jp(x\ct)k^p{a>k^dx . Учитывая определение вероятностей совместного наблюдения событий: р(х\сок)Р(сок) = р(х;сок), р(сок\х)р(х) = р(х;сок) можно записать: EiUk} = J^V(^)^-2Jg^(^(x;^) + ^(x;^))ojc + Ъ р(х\0)к) + ар[х\сок) p(x)dx- 87
Глава 2 и с учетом соотношения: р(х;а)к)р(х;щ) Р{^к\х)р(^к\х)р(х) р(х) получим: E{Uk}= \(gk-{{b-a)p{cok\x) + b))2 p{x)dx + + (b-af ^p(a)k\x)p(wk\x}p(x)dx, не зависит от что совпадает с соотношением (2.22). В ходе обучения нейронная сеть стремится уменьшить общую ошибку. Так как второе слагаемое не зависит от весов нейронной сети, наилучшим решением для нее будет такое, при котором Из полученного выражения видно, что в ходе обучения нейронная сеть стремится подстроить весовые вектора таким образом, чтобы выходные значения были близки (в смысле взвешенного среднеквадрати- ческого отклонения) к линейным функциям от апостериорных вероятностей р(о)к\х). В случае а = 0; Ь = \ они становятся просто равными  этим вероятностям. Как известно, оптимальные решающие правила основаны на сравнении апостериорных вероятностей. Поэтому, если нейронной сети удается достичь глобального минимума, т.е. такой ошибки, при которой первое слагаемое обращается в нуль, она реализует оптимальное решающее правило. В общем случае выходы сети стремятся к линейной функции от апостериорных вероятностей, реализуя взвешенное оптимальное решающее правило. Для иллюстрации этого ниже рассмотрен пример обучения нейронной сети для распознавания двух классов объектов. На вход сети по- l(gk-{(b-a)p{®k\*) + b))2 p{x)dx —> mm. (2.23) 88
Основные модели нейронных сетей для использования при обработке ... информации даются двухмерные сигналы, принадлежащие двум различным классам. Оба класса описываются нормальным законом распределения с различными параметрами: 1 2п опоп ехр (xi-Muf {х2-Мп)2Л 2оп (2.24) р(х\о)2) =n(/}2,a2) = 2я ^2\0~22 ехр 2 \ 2ov 2<тг На рис. 2.14 изображены плотности вероятностей для распознаваемых классов сигналов. Здесь же приведена разделяющая поверхность между классами, в данном случае представляющая собой две ветви гиперболы. Апостериорные вероятности для этих классов представляются в виде: _Р(щ)р(х\щ)_ PW) - Р(х) -pi^p^yp^p^y ^ ( 1-Л ^(^M^W Р{С02)р{Х\^2) р[со2\х) =- - р(х) Р(со[)р(х\о)1)^Р(о)2)р(х\о)2) ' 89
Глава 2 На рис. 2.15 представлены апостериорные вероятности для двух классов в случае одинаковых априорных вероятностей Р{со1) = Р(со2) = 0,5 . Рис. 2.15. Апостериорные вероятности для двух распознаваемых классов После обучения нейронная сеть оказывается способна воспроизводить апостериорные вероятности. -5 -5 Рис. 2.16. Выходы нейронной сети, соответствующие апостериорным вероятностям для двух распознаваемых классов При этом средняя ошибка сети равна E{U] = 0,07373, а средние отклонения выходов нейронной сети от апостериорных вероятностей, взвешенные с учетом полной плотности вероятности для сигнального 90
Основные модели нейронных сетей для использования при обработке ... информации вектора оказываются очень малыми: А^=1,69 10 , Ag2=l,62 10~ . При этом постоянная составляющая ошибки, рассчитанная теоретически равна E{U}const = 0,07366 . Таким образом, нейронная сеть способна обеспечить очень высокий уровень соответствия оптимальному устройству распознавания на основе апостериорных вероятностей. Следует отметить, что для этого необходимо выполнение обычно недостижимых условий. Во-первых, заложенная в нейронную сеть архитектура должна позволять сколь угодно точно приближать оптимальное решающее правило. Во-вторых, число примеров, на которых производится обучение должно быть достаточно велико, чтобы обеспечить высокую степень приближения математического ожидания частными суммами. В результате этого выходы нейронной сети пропорциональны оптимальным апостериорным вероятностям с некоторой погрешностью. Так как количество примеров, предоставляемых для обучения, всегда ограничено, качество приближения к оптимальному обнаружителю зависит от того, насколько хорошо выход нейронной сети приближается к апостериорным вероятностям. В настоящее время используется несколько обобщений и модификаций этой традиционной архитектуры. Архитектура обобщенных сетей прямого распространения в основном совпадает с многослойным персептро- ном. Но в них допускается использование не только последовательных связей между нейронами соседних слоев, но и связей между любыми другими слоями, как бы «перескакивая» через некоторые из них. В этом смысле они представляют собой обобщение традиционных Рис. 2.17. Обобщенные сети 0 прямого распространения многослойных персептронов. Законы ^ г г г распространения сигналов для этих сетей остаются прежними, и алгоритмы обучения также не изменяются, отличие состоит в появлении добавочных связей. Теоретически многослойный персептрон способен решить любую задачу, если количество его нейронов достаточно велико. Однако на практике обобщенные сети прямого распространения способны решать задачи намного более эффективно. Это связано с наличием дополнительных прямых связей между разнесенными слоями. В результате этого, процесс обучения слоев, близкорасположенных к входным сигналам, становится более эффективным. 91
Глава 2 101=^ lol 0 0 0 Q P 0 с D С 0 0 □ => Pi 0 0 Q П 0 Q Ю1 lol 0 0 0 Q 0 С 0 Q 3 0 0 Q ==> P 0 0 □ => 0 Q Рис. 2.18. Сети Жордана и Элмана Сети Жордана и Элмана дополняют архитектуру многослойного персептрона контекстными элементами, которые запоминают свои предыдущие состояния. Контекстные элементы необходимы для обучения на событиях, имеющих временную протяженность (т.е. когда предыдущие состояния нейронной сети влияют на ее текущую активность). Контекстные элементы могут быть локально рекуррентными (то есть, иметь обратные связи между собой). При использовании локально рекуррентных связей их значения в ходе обучения уменьшаются на некоторую мультипликативную константу т (константа времени), при передаче возбуждения через обратные связи. Величина этой константы определяет глубину памяти связи (т.е. количество временных циклов, в течение которых переданное в контекстный элемент будет храниться в памяти). Использование контекстных элементов (самовозбуждающихся нейронов) позволяет в ряде случаев существенно повысить адаптивность нейронной сети и, как показывают нейробиологические исследования, характерно для работы мозга. Рекуррентные сети с временной задержкой (Time-Lag recurrent networks - TLRNs) являются обобщением многомерного персептрона за счет введения в него структур с кратковременной памятью, имеющих локальные рекуррентные связи. Областями применения таких сетей являются задачи, параметры которых изменяются во времени, например, прогнозирование временных рядов, идентификация систем, распознавание временных образов. Для обучения таких сетей используется алго- 92
Основные модели нейронных сетей для использования при обработке ... информации ритм обучения с обратным распространением ошибок во времени, являющийся развитием алгоритма обычного обратного распространения ошибки. Рис. 2.19. Рекуррентные сети с временной задержкой Главным преимуществом рекуррентных сетей является меньший размер сети, необходимый для обучения процессам, изменяющимся во времени, по сравнению с обычным многослойным персептроном, который использует дополнительные входные нейроны для представления прошлых состояний. Использование рекуррентных связей позволяет обеспечить адаптивность запоминания прошлых состояний (находить наилучший вариант представления прошлых входных событий во времени). С точки зрения идентификации систем рекуррентные сети реализуют модель нелинейного скользящего среднего. При использовании глобальных связей выходных нейронов с внутренними слоями сети, они могут быть расширены для представления нелинейных моделей авторегрессии со скользящим средним. Такие нелинейные модели могут быть успешно применены для оптимального управления, обеспечивая более высокую эффективность, чем их линейные аналоги. 2.2.2. Ассоциативная память Хопфилда. Помимо многослойного персептрона - наиболее часто используемого представителя семейства нейросетевых парадигм, объединяемых понятием «обучение с учителем», основным признаком которых является предъявление одновременно с входными данными требуемого отклика - существует значительное число нейросетевых архитектур, способных без внешнего вмешательства определять закономерности в потоке входных значений. Методы обучения для этих архитектур называются «обучение без учителя». Первые модели самообучающихся нейронных сетей для подстройки синаптических связей (весов) использовали так называемое правило Хэбба [226], которое заключается в установлении схожести выходов с 93
Глава 2 входными значениями. Чем более вероятно входное значение, тем большим (в среднем) становится выход. Наиболее известной из нейронных сетей указанного типа является модель ассоциативной памяти [231, 141]. Ассоциативная память Хопфилда позволяет воспроизводить запомненные образы при предъявлении части изображения или искаженных примеров. Первые модели ассоциативной памяти были созданы до появления модели Хопфилда (Hopfield) [15; 101; 223]. Заслугой этого ученого является математический анализ функционирования сети ассоциативной памяти и доказательство сходимости процесса самообучения. Ассоциативная память Хопфилда реализует полносвязную нейронную сеть, в которой каждый нейрон связан со всеми остальными. Процесс обучения проходит без учителя на основе принципов правила Хэбба. Нелинейное преобразование межнейронных связей в виде жесткого ограничителя препятствует неограниченному росту весов. Ассоциативность памяти заключается в способности воспроизводить запомненные образы при предъявлении частей запомненных образов. При этом обеспечивается воспроизведение даже при искажении предъявляемого образа по сравнению с запомненным. Во время обучения значения весов сети увеличиваются, если состояния нейронов одинаковы и уменьшаются в противном случае. При воспроизведении осуществляется последовательное распространение возбуждения активных нейронов до достижения сетью состояния равновесия. Существуют модели синхронной и асинхронной работы, при которых изменения состояний нейронов производятся одновременно для всей сети или независимо друг от друга. AWy = a xi х -. (2.26) Рис. 2.20. Модель ассоциативной памяти 94
Основные модели нейронных сетей для использования при обработке ... информации Данная модель представляет собой полносвязную сеть, на нейронные элементы которой последовательно подаются бинарные или непрерывные векторы входных данных. При обучении реализуется известное правило Хебба. В наиболее общем виде ассоциативную память можно описать следующим образом. Сеть состоит из единственного слоя, все элементы которого имеют связи по принципу каждый с каждым. Полная матрица связей модифицируется на этапе обучения при предъявлении каждого образа по правилу Хэбба, заключающегося в усилении связей между одинаково возбужденными нейронами и уменьшении весов между нейронами с различными уровнями возбуждения. Пусть Xj,...,jcm набор эталонных образов, каждый из которых представляет собой вектор размерностью N (xh,...,хн ). Традиционно рассматриваются образы, состоящие из бинарных (+1,-1) элементов. Тогда при предъявлении любого из них в качестве ключевого, даже если он искажен под действием шума, должен воспроизводиться чистый эталонный вектор. В качестве вектора можно рассматривать любые изображения, в том числе многомерные, или наборы значимых параметров, которые следует запоминать. Под искажением понимается любое изменение одной или нескольких координат вектора. Для запоминания формируется матрица межнейронных связей R = г] , размерностью NxN , которая описывается выражением: м Л = 2Х**. (2-27) л=1 В индексной записи это равенство запишется в виде: м г, = 1,у = 1,ЛГ. (2.27) А=1 а) б) Рис. 2.21. Формирование матрицы обучения для: а - обучения; б - воспроизведения образа 95
Глава 2 Полученная в результате такого обучения матрица связей способна обеспечить восстановление искаженных образов. Для этого воспроизводимый образ умножается на матрицу связей с последующей пороговой обработкой. Воспроизведение образа заключается в умножении матрицы на вектор-изображение с последующим поэлементным применением нелинейной пороговой операции: ( N \ ^1*/ rij » Xj -■IN, (2.28) V 1=1 где пороговая функция / от двух параметров определяется соотношением: 1, если > О, f(a, Ь) = < Ь, если = 0, (2.29) -1, если<0. Эта операция синхронно (одновременно для всех элементов образа) повторяется до тех пор, пока элементы не перестанут изменяться. При этом на выходе появляется воспроизводимый образ. Доказано [223], что как в синхронном, так и в несинхронном случае ассоциативная память является стабильной. Это следует из рассмотрения соответствующей ей функции Ляпунова. Максимальное количество образов Мтах , которое может быть запомнено в ассоциативной памяти первого порядка, определяется выражением [285]: Mm» = 21og(A0 + bg(log(A0)' (2'30) Алгоритм работы ассоциативной памяти аналогичен коррелятору. Коррелятор первого порядка разделяет линейным образом пространство проблемной области с помощью гиперплоскости. Однако для многих задач, которые нелинейны по своей природе, такое ограничение в виде использования исключительно линейных функций создает весьма серьезные затруднения. Для преодоления этих затруднений можно использовать корреляторы более высоких порядков, т.е. ассоциативную память высших порядков. Дополнительным преимуществом ассоциативной памяти высоких порядков является увеличение максимального числа образов, которые возможно запомнить, за счет большего числа используемых связей. Традиционную ассоциативную память можно условно представить в виде следующей схемы (рис. 2.22,а). 96
Основные модели нейронных сетей для использования при обработке ... информации Ассоциативная память второго порядка [216] можно изобразить в виде аналогичной схемы (рис. 2.22,6). xi а) г XJ / \ V / б) Рис. 2.22. Схема ассоциативной памяти: а - традиционная; б - второго порядка В индексной записи это равенство запишется в виде: м ty=J\f дг*** i,j9k = l,N9 (2.31) где матрица Л = [^] является матрицей связей второго порядка размерностью NxNxN. Аналогично можно определить ассоциативную память третьего порядка [216]: м rm = J>,* XJ ** xi > J> k,l = l,N, (2.32) где R = [^y*/] является матрицей связей третьего порядка размерностью NxNxNxN. Такое определение допускает прямое обобщение порядка ассоциативной памяти вплоть до (N -1). Воспроизведение образа проводится согласно выражению: ( N N ^ new _ г Хк ~ J i=l j=\ , k = \,N. (2.33) При обобщенном воспроизведении второго порядка объединяются отклики первого и второго порядков: 4—5782 97
Глава 2 , k = \,N. (2.34) Энергетическая функция для ассоциативной памяти высших порядков обобщенного вида определяется в виде [137]: м л=1 где х - начальный образ, a xh - h -й образ, запомненный системой, g - порядок ассоциативной памяти. Показано, что ассоциативные памяти всех порядков устойчивы при асинхронном режиме работы, а при всех нечетных порядках устойчивость обеспечивается и в синхронном режиме. Доказано, что при синхронном функционировании в случае симметричной положительно определенной матрицы весов, процесс воспроизведения устойчив и сходится к функциональному состоянию сети, реализующему минимум некоторой энергетической функции. Помимо ассоциативного воспроизведению запомненных образов сети Хопфилда используются для решения большого числа сложных оптимизационных задач, решение которых стандартными методами исключительно трудоемко [230]. Хопфилдом было доказано, что при асинхронной работе предложенная им модель приходит к устойчивому состоянию, совпадающему с первоначально запомненным образом. Для доказательства этого факта им было введено понятие энергетической функции, которая в ходе функционирования сети не возрастает. Оказалось, что примененный для доказательства устойчивости работы ассоциативной сети математический аппарат позволяет использовать предложенную модель для решения многих сложных задач оптимизации. Особенно интересным оказывается применение сети Хопфилда при решении так называемых NP полных задач, как например, задача коммивояжера и других, требующих для своего решения полного (или почти полного) перебора. При этом функционирование сети осуществляется в соответствии с заданной целевой функцией, подлежащей оптимизации, а достижение оптимального состояния определяется сходимостью энергетической функции сети. Применяется также расширенный вариант сети Хопфилда, в виде взаимосвязанных подсистем, работающих совместно, так называемая двунаправленная ассоциативная память [250]. 2.2.3. Самоорганизующиеся карты признаков Кохонена. Самоорганизующиеся карты признаков (Self-organizing feature maps - SOFM) преобразуют пространство входных признаков произвольной размерно- N N > Х1Ш + ^ ^ Xi Xj rijk у Х°кШ 98
Основные модели нейронных сетей для использования при обработке ... информации сти в одно- или двухмерную карту признаков в соответствии с топологическими (сохраняющими характер соседства, то есть соседние точки остаются соседними и после преобразования) ограничениями. Карты признаков рассчитываются с использованием метода Кохонена обучения без учителя. Выходные значения карты признаков могут быть использованы в качестве входа для обучаемых с учителем классификационных нейронных сетей таких, как многослойный персептрон. Рис. 2.23. Самоорганизующаяся карта признаков Кохонена Ключевым преимуществом таких сетей является составление карты признаков, которая позволяет снизить размерность пространства до наиболее значимых признаков, получаемых путем самоорганизации. Организация одномерного или двухмерного представления признаков позволяет добиться топологического сходства исходного множества признаков, с получаемым при обучении. Близкие по значимости признаки в обучающих примерах отображаются в соседние области формируемой карты. При этом структура параметрического пространства входных значений сохраняется, а его размерность снижается. Модель была предложена известным финским ученым Кохоненом в 1982 г. [247] на основе более ранней работы [248]. Метод обучения Кохонена является развитием метода обучения на основе соревнований. Известным вариантом этого метода является классический метод кластеризации k-средних (k-means), который широко применяется при анализе данных в задачах кластеризации. Суть этого метода заключается в следующем [2]. Пусть задан набор из N точек, каждая из которых представляет собой вектор х2, xk) размерности к. Требуется построить множество М центров кластеров, которые будут являться центрами групп областей сгущения точек исходных данных. Алгоритм сводится к следующему. Первоначально задаются М центров кластеров с произвольным, обычно случайным, расположением. Затем поочередно рас- 99
Глава 2 сматриваются точки из исходного набора, и вычисления проводится в соответствии с алгоритмом. Шаг 1. Подать входной вектор х = (х{9 х2, хк). Шаг 2. Вычислить расстояния dj от входного вектора до всех центров кластеров. Шаг 3. Определить ближайший центр кластеров с минимальным значением dj. Шаг 4. Переместить ближайший центр кластеров по направлению к входной точке: УЛ,+\)=УЛ,) + а [*(<Г^С)]' (236) где а - коэффициент скорости обучения. Шаг 5. Перейти на шаг 2. Доказано, что местоположение центра каждого кластера в асимптотике стремится к среднему от входных точек, расположенных в соответствующей ему области Вороного [247]: EVe{£}= jtp(Z)dt. (2.37) Кластеризация с помощью этого метода широко используется в задачах анализа данных для снижения размерности, выявления наиболее представительных экземпляров классов, избавления от шума. Метод k-средних нашел свою интерпретацию в нейросетевой тематике в виде так называемого соревновательного обучения, простейшей форме нейронной сети Кохонена. При этом функционирование сети происходит следующим образом. Входной вектор, подается на входной слой, который не содержит нейронов, а выполняет коммутационные функции, распространяя каждый входной вектор по всем нейронам второго слоя. Число узлов входного слоя равно размерности входного вектора. Каждый нейрон второго слоя (слой Кохонена) имеет обучаемые весовые коэффициенты своих входов, число входов соответствует числу узлов первого слоя. Слой Кохонена классифицирует входные векторы в группы схожих. Предполагается, что входные векторы фактически группируются в классы в соответствии с их положением в векторном пространстве. Слой Кохонена функционирует в стиле "победитель забирает все". Побеждает в соревновании нейрон, вектор весовых коэффициентов которого окажется наиболее близким к входному вектору. Сеть Кохонена функционирует в двух режимах: обучения и классификации. 100
Основные модели нейронных сетей для использования при обработке ... информации На каждый нейрон второго слоя подается входной вектор x = (jc1, jc2, jc^) . Каждый нейрон второго слоя вычисляет расстояние между входным вектором и вектором его весовых коэффициентов по формуле: где wtj - вес входа / в нейроне j, xt -i -ая компонента входного вектора. Веса всех входов нейрона j формируют весовой вектор В процессе обучения значение а постепенно уменьшается. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы. Согласно рекомендациям Кохонена [248], для получения хорошей статистической точности количество обучающих циклов должно быть, по крайней мере, в 500 раз больше количества выходных нейронов. Рис. 2.24. Схема Кохонена Кохоненом было предложено ввести в эту модель топологические связи, которые позволяют формировать топологическую структуру на кластерах. Все заданные центры кластеров связываются между собой одномерной или двухмерной сетью связей. При движении одного из центров кластеров, все соседние с ним по этой сети перемещаются тоже, но на меньшее расстояние. Степень влияния центров группирования друг на друга уменьшается в зависимости от расстояния и с ростов номера итерации. Зависимость от расстояния может быть линейной, как было первоначально предложено Кохоненом, или нелинейной, например, в виде функции «Mexican Hat», которая наиболее часто используется в настоящее время. В то время как при соревновательном обучении модифицируются веса только нейронов-победителей, в соответствии с методом Кохонена, веса нейронов, соседних с выигравшими, также изменяются. Выбор со- 101
Глава 2 седей для модификации их весов может осуществляться как в одномерном виде (соседние в положении на линии), так и в нескольких вариантов двухмерного вида (соседи на плоскости, торе, произвольной криволинейной поверхности) в зависимости от заданной метрики евклидовых расстояний. Обычно величина, описывающая степень близости соседей, уменьшается в ходе обучения. В этом режиме после выполнения достаточно большого числа итераций весовые вектора нейронов второго слоя примут значения близкие к центрам кластеров входных векторов. В результате описанного обучения вырабатываются таблицы кодирования, являющиеся списком весовых векторов нейронов, соответствующих центрам кластеров входных векторов. Метод обучения Кохонена с сохранением топологии оказывается очень полезным при выявлении внутренней структуры данных. Если модель, лежащая в основе многомерных данных, имеет размерность, намного ниже, чем сами данные, простыми методами выявить структуру такой модели не удается. Известный метод принципиальных компонент [2] позволяет определить только линейное пространство, описывающее наиболее сильные отклонения данных, но никак не может следовать их нелинейной структуре. В качестве примера на рис. 2.25 показана работа сети Кохонена при выявлении топологии сложной поверхности. Рис. 2.25. Сеть Кохонена следует структуре сложной нелинейной модели Поверхность, характер которой требуется определить исследуя экспериментальные точки, представляет собой нелинейную поверхность - элемент плоской ленты скрученной с переменным радиусом, т.е. имеет фактически 2-х мерный характер. Признаковое пространство, в котором 102
Основные модели нейронных сетей для использования при обработке ... информации проводятся измерения, имеет 3 измерения. Экспериментальные точки не точно следуют заданной моделью поверхности, но с некоторыми ошибками, задающими отклонения этих точек. Экспериментальные данные на рисунке изображены черными точками. Двухмерная сеть Кохонена прямоугольной топологии, структура которой отображается светлыми линиями на рисунке, после обучения на этих точках, достаточно точно следует исходной модели и позволяет исследователю оценить характер поведения модели на всем множестве допустимых значений признакового пространства. Исходная модель, изображенная на рисунке зеленой лентой, представляет собой двухмерную поверхность в виде спирали, помещенную в 3-хмерное пространство. Поверхность существенно нелинейна. Помимо этого нейронная сеть Кохонена обладает очень полезным качеством, способностью аппроксимировать многомерную плотность распределения входных данных. Аппроксимация здесь понимается в том смысле, что плотность расположения узлов сети после длительного обучения, в асимптотике, становится близка к плотности распределения исходных точек [278]. Этот факт проиллюстрирован результатами численных экспериментов (рис. 2.26), проведенных со случайными точками, имеющими смешанное нормальное распределение, одна пара центров которого имела единичную дисперсию, а другая - в два раза большую. Рис. 2.26. В 1991г. Т.М. Мартинтцом (Martinetz Т.М.) и К.Д. Шультеном (Schulten K.J.) был разработан алгоритм нейронного газа [279], очень схожий с сетями Кохонена. Его отличие заключается в том, что все нейроны ранжируются по близости к входному вектору и те из них, которые находятся ближе, подстраивают свои коэффициенты. Количество 103
Глава 2 ближайших нейронов и степень их совместных перемещений уменьшается с течением времени. Этот алгоритм оказывается полным аналогом сети Кохонена с изменением топологии близости между нейронами. Вместо вводимой извне двухмерной или одномерной решетки используется собственная топология признакового пространства. Теми же авторами был предложен ряд методов, позволяющих более тщательно отслеживать топологию признакового пространства. Так в работе [278] рассмотрена возможность установления связей между нейроном-победителем и следующим по близости нейроном. Существует несколько вариантов, позволяющих расширить возможности стандартного варианта сети Кохонена. Так Г. Байер (Bauer H.-U.) и Т. Вилман (Villmann Т.) предложили метод [174], который позволяет создавать гиперкубическую решетку, размерность которой определяется автоматически в ходе обучения. Д.С. Родригес (Rodrigues J.S.) и Л.Б. Ал- мейда (Almeida L.B.) [313] повысили скорость работы самоорганизующихся карт признаков с помощью интерполяции, симметрично увеличивая количество узлов сети. Сообщается, что, хотя этот метод действительно позволяет существенно повысить скорость, но использовать его для решеток с разными размерами по длине и ширине нельзя. Другие варианты рассмотрены в работе [243]. Чем более общей является процедура обучения, тем меньше имеется ограничений на пути фактического решения сетью задач и, поэтому, меньше уверенности остается относительно способности сети должным образом делать выводы относительно новых случаев. В литературе это явление известно как проблема «переобучения». Многопараметрические модели могут удовлетворительно описать практически любую функцию различными способами. Проблема состоит в том, чтобы указать такую функцию, которая максимизирует способность обобщения к пока еще не предъявленным наборам данных. В литературе описано две основных стратегии преодоления этой трудности. Первая стратегия представляет собой вариацию принципа «Бритвы Оккама», утверждающего, что следует выбирать самую простую гипотезу, согласующуюся с данными. В мире коннекционистских сетей этот принцип можно интерпретировать как выбор наиболее простой сети, согласующейся с данными. Существует ряд различных возможностей измерения простоты сети: количество весов, количество элементов, наличие симметрии среди весов, число битов на вес и т.п. Можно определить штрафную функцию, которая приводит к сетям с минимальной сложностью, измеряемой любой из этих мер. Вообще говоря, минимальные сети способны лучше осуществлять обобщение, чем более сложные сети [29]. 104
Основные модели нейронных сетей для использования при обработке ... информации 105 Вторая основная схема обучения сети и, фактически, наиболее часто используемая схема это версия перекрестного подтверждения (cross validation). В этой схеме данные разделены на три части. Одна часть используется для обучения; вторая используется для оценивания качества обобщения и не используется до конечных испытаний; третья часть данных используется для перекрестного подтверждения. Процедура состоит в следующем: после каждой эпохи обучения, работа сети оценивается на подтверждающем множестве данных. Пока сеть улучшает свою работу по этому множеству, обучение продолжается. Если происходит переобучение, сеть в некоторой точке начинает ухудшать работу по этому множеству данных. В этот момент обучение заканчивается, и полученные веса дают оптимальное решение для множества подтверждающих данных, в противоположность тестированию на «испытательном множестве», и функционирование на этом множестве рассматривается как мера качества обобщения. Этот метод достаточно мощен и прост и часто приводит к хорошим результатам.
Глава 3. Оценка качества работы радиолокационной станции и ее подсистем Дается описание основных методологических принципов оценки качества автоматической обработки радиолокационной информации: определяются показатели качества и методы их оценки, рассматриваются специальные методы построения достоверных оценок для малых вероятностей, характерных для радиолокации. 3.1. Иерархическая система показателей качества обработки радиолокационной информации Оценка качества применяемых алгоритмов работы различных устройств и систем в радиолокаторах должна проводиться с учетом эффективности работы всей радиолокационной станции. Оценку эффективности радиолокатора необходимо проводить с учетом его предназначения, обеспечения потребителя необходимой ему информацией. Источники информации могут иметь различную физическую природу, однако для большинства из них многие основополагающие принципы являются общими, и, поэтому, оценку их эффективности можно проводить с единых методологических позиций. Ниже рассмотрены эти принципы в приложении к радиолокационным источникам информации, как одним из наиболее распространенных; но многие положения могут быть отнесены и к источникам информации, основанным на других физических принципах. Хорошую информационную систему можно определить в простейшем виде как такую, которая удовлетворяет требованиям потребителя. Эти требования могут быть выражены в различном виде. Мало задать требования на вербальном уровне, чтобы система могла успешно выполнять свои функции. Необходимо иметь возможность измерения показателей качества ее работы, сравнения с критическими значениями и принятия решения об удовлетворении системой поставленных требований или их невыполнения. Измерение возможно лишь на основе некоторых метрик, установленных методов сравнения имеющихся величин с заданными шкалами. Понятно, что самым главным показателем эффективности работы системы является ее способность выполнять те задачи, которые ставит перед ней потребитель и выполнять их корректно. И именно для этого свойства необходимо ввести четкие метрики, числовые единицы измерения. 106
Оценка качества работы радиолокационной станции и ее подсистем Главной задачей РЛС, вытекающей из ее назначения, является выдача информации потребителю. Поэтому качество информационной системы, в первую очередь, характеризуется качеством выдаваемой ею информации. Представляется целесообразным при определении качества информации опираться на функции информационной системы, возлагаемые на нее потребителем. Потребитель информации обычно ставит перед системой задачи определения положения целей противника и выдачи их координат (или, кроме того, дополнительных параметров целей и внешней обстановки) с необходимой точностью и в заданное время. При этом нежелательно присутствие ложной информации. Все это в совокупности можно охарактеризовать известными информационными показателями полнотой и достоверностью выдаваемой информации. Эти понятия определены в ГОСТ РВ 51987 - 2002 [35; 131]. В соответствии с данным там определением полнота выходной информации - свойство выходной информации отражать состояния всех требуемых объектов учета предметной области ИС. Этот показатель отражает наличие в выдаваемой информации данных о присутствующих во внешней обстановке интересующих потребителя объектах. Достоверность информации - свойство информации отражать реальное или оцениваемое состояние объектов и процессов прикладной области ИС со степенью приближения, обеспечивающей эффективное использование этой информации согласно целевому назначению системы. Достоверность выходной информации определяется истинностью исходных данных, безошибочностью входной информации, корректностью обработки, безошибочностью при хранении и передаче информации и сохранением ее актуальности на момент использования. В приложении к информации, получаемой от сенсорных источников, общее понятие достоверности может быть разделено на три отдельные составляющие: безошибочность информации - свойство информации не иметь явных или скрытых ошибок и/или искажений - не содержать описаний объектов, отсутствующих в реальном мире; корректность информации - свойство обеспечивать получение правильных согласованных результатов или эффектов обработки информации; актуальность безошибочной информации - свойство безошибочной информации отражать текущее состояние объектов и процессов прикладной области ИС со степенью приближения, достаточной для получения на ее основе достоверной выходной информации в интересах конечного пользователя. 107
Глава 3 ^обн -^ложн Рис. 3.1. Показатели качества информации, выдаваемой радиолокатором Все эти конечные показатели качества информационной системы тесно взаимосвязаны. Это связь имеет двоякий характер. Во-первых, при изменении технических свойств информационной системы, все они изменяются обычно одновременно, и зачастую это изменение имеет антагонистический характер, т.е. при улучшении одного показателя остальные ухудшаются. Так при увеличении порогов решающих правил в устройствах обнаружения безошибочность информации повышается, а полнота снижается, и наоборот. Однако взаимосвязь показателей качества выдаваемой системой информации этим не исчерпывается. Она носит более глубокий характер. Вообще сама природа источников информации такова, что они не способны мгновенно выдавать абсолютно верную информацию о внешней обстановке: степень ее верности и допустимость временных задержек определяется методами решения собственных задач потребителем на основе этой информации. Одни и те же данные для различных потребителей, или даже для одного и того же потребителя в различных режимах его работы, могут выступать и в роли ложной информации, и в роли истинной информации с низкими точностями измерения параметров (некорректность информации) или с просроченными возможностями использования (неактуальность информации). Так, например, если в качестве потребителя выступает стрельбовое средство с собственными возможностями допоиска в зоне, размером 5 км, то информация по целям с ошибками измерения координат в 2 км является истинной, но имеющей точность 2 км. Та же информация для аналогичного стрельбового средства с зоной допоиска в 1 км является ложной, так как для стрельбового средства все равно, что на самом деле цель присутствует, но в стороне от зоны обзора, оно его искать не будет. В более редких случаях, с низкой вероятностью, но возможны случаи, когда при выдаче потребителю ложной информации, там случайно 108
Оценка качества работы радиолокационной станции и ее подсистем в пределах зоны допоиска оказывается истинный объект, являющийся целью для потребителя. Тогда ошибочная, по сути, информация не может рассматриваться как ложная, так как потребитель успешно выполняет свою задачу по данным, полученным от информационной системы. Актуальность информации также связана с полнотой, точностью и достоверностью. Например, если точность определения координат обнаруженных целей составляет 10 м, а информация о ней поступает потребителю через 10 с, в течение которых цель может переместиться на 2 км, и никакой экстраполяции положения цели не производится, то потребитель будет получать координаты цели с ошибкой 2 км, являющейся, по сути, результатом того, что информация стала неактуальной. Далее, в зависимости от методов использования этой информации, ее следует отнести к некорректной или ошибочной (ложной). Эта взаимосвязь становится еще сильнее при рассмотрении не простейших случаев работы информационной системы, а при ее функционировании в наиболее сложных условиях, при воздействии интенсивных помех различного происхождения и характера, работе по многим целям одновременно. Поэтому содержание показателей качества информационной системы должно уточняться в зависимости от задач системы. В качестве показателя полноты П информационной системы следует рассматривать вероятностную характеристику получения информации об интересующих потребителя объектах: П = lim , (3.1) где П = lim ^обн - число обнаружений объекта, а N - число рассмот- ренных вариантов появления объекта в зоне. Это определение описывает и метод оценки значения данного показателя в ходе испытаний или моделирования. Так как вследствие стохастического характера фактов обнаружений целей величина No6h является случайной, то и текущее значение доли обнаруженных объектов является случайной величиной. Поэтому в качестве показателя рассматривается ее усредненное значение при проведении достаточно большого количества k испытаний при гипотетической возможности сохранения всех внешних условий, существовавших на момент измерения. Полнота, таким образом, определяет среднюю по зоне вероятность обнаружения целей. Действительно, если в зоне обзора присутствует одна цель, то полнота равна вероятности обнаружения этой цели. Этот показатель является наиболее важным для РЛС, так как определяет ее способность выполнять основную функцию, для которой 109
Глава 3 станция предназначена - обнаруживать воздушные цели. Ввиду широты ее использования имеется целый ряд показателей качества РЛС, которые тесно связаны с полнотой информации прямой зависимостью и часто используются вместо нее. В них акцентируется внимание на тот факт, что вероятность обнаружения существенно зависит от дальности до цели. Это зависимость вероятности обнаружения цели (полнота по одиночной цели) от дальности до нее или рассчитанная с заданной вероятностью дальность обнаружения цели. Если задана функциональная зависимость вероятности обнаружения цели от ее координат, то полнота информации для РЛС, может быть рассчитана путем интегрирования вероятности обнаружения по зоне ответственности. Полнота информации может рассматриваться как показатель качества информации как для РЛС в целом, так и для отдельных ее подсистем. Так можно говорить о полноте информации подсистемы первичной обработки, где в качестве функции No6h выступает количество обнаруженных отметок от целей. При рассмотрении подсистемы вторичной обработки информации, осуществляющей формирование траекторий, в качестве No6h следует рассматривать число траекторий цели на данной дальности. Для оценки полноты информации, поступающей потребителю, необходимо также учесть возможность выдачи полезной для пользователя информации с учетом проводящихся процессов ранжирования целей перед их поступлением на аппаратуру передачи данных. Безошибочность Б информации определяется через среднее количество ложных объектов, информация о которых поступает потребителю и равна среднему отношению числа правильно обнаруженных объектов к общему количеству обнаруженных объектов П = lim ^ , (3.2) 1 ООН 1 * ложн где А^ложн - число ложных объектов, обнаруженных системой. Безошибочность информации есть доля обнаруженных РЛС истинных объектов, во всей совокупности обрабатываемой или выдаваемой информации. Иногда полезно рассматривать вместо безошибочности тесно связанную с ней величину количества ложной информации - среднее число ложных объектов, выдаваемых потребителю: ^ложн = Кт#лажн. (3.3) В более ранних работах по качеству радиолокационной информации вводилось понятие достоверности, под которым фактически понималась безошибочность информации. Новый ГОСТ РВ 51987-2002 расширяет понятие достоверности, устраняя существовавшую ранее за- 110
Оценка качества работы радиолокационной станции и ее подсистем труднительность в толковании безошибочной, но некорректной или неактуальной информации как достоверной. Также как и полнота, безошибочность информации может определяться для каждой из подсистем РЛС, описывая качество их работы и позволяя учитывать вклад каждой из этих подсистем в качество функционирования РЛС в целом. Корректность информации описывает получение правильных согласованных результатов или эффектов обработки информации - тех параметров обнаруженных объектов, которые интересуют потребителя. Так как эти параметры определяются с ошибками, показатели корректности информации должны основываться на точностях определения этих параметров. Параметры объектов могут быть двух типов: измеримые и неизмеримые. Для каждого из них понятие точности (корректности) вводится по-своему. При измеримых параметрах объектов основываются на точностях их измерения (точности определения координат целей). При этом в качестве координат могут выступать любые интересующие потребителя параметры обнаруженных объектов, которые поддаются измерению, например, скорость, ускорение перемещения амплитуда принимаемого от него сигнала и др. Рассматриваются среднеквадратические ошибки измерения по каждой из координат <гу, причем, так как знаки ошибок произвольны, берется среднеквадратическое значение. Если бы вместо этого бралась дисперсия, то из рассмотрения были бы исключены систематические ошибки. Имеем: где ау —ошибка измерения по координате у, £>{о} обозначает дисперсию этой ошибки. При одинаковых нормальных законах распределения ошибок измерения координат цели их совместное распределение имеет круговую симметрию, и говорят о круговой ошибке, которая линейно зависит от ошибок по каждой из координат. Некоторые параметры и характеристики обнаруживаемых объектов прямому измерению не поддаются. Однако в этом случае при определении точности оценки параметров обнаруженных объектов следует ввести какую-либо метрику, иначе понятие точности теряет смысл. Рассмотрим, например, распознавание, или определение классов целей радиолокационной станцией. Так как процесс распознавания является стохастическим, естественно в качестве меры корректности информации рассмотреть вероятностные характеристики распознавания. Обычно 111
Глава 3 при оценке качества распознавания довольствуются лишь одной характеристикой - вероятностью распознавания. Однако это не всегда правильно. Дело в том, что при наличии множества (алфавита) интересующих потребителя классов, возникает не одна ошибка распознавания, а матрица ошибок и соответственно матрица вероятностей распознавания, каждый элемент которой описывает отнесение цели одного из имеющихся классов к другому, в том числе и правильному. В большинстве случаев ошибки отнесения целей к различным классам различны. Поэтому точность зависит от матрицы Ррасп вероятностей ошибочных распознаваний: где Ру - вероятность отнесения /-й цели к j-му классу. Понятие распознавания настолько широко и всеобъемлюще, что с его помощью можно описывать практически любые процессы статистического характера. Поэтому использование матрицы вероятностей распознавания в качестве показателя корректности информации может быть расширено на любые параметры и характеристики обнаруженных объектов. Даже точности измерения координат можно описать с помощью матрицы вероятностей того, что принято решение о том, что цель, находящаяся в области /, обнаружена в области j. При достаточно мелких областях можно получить распределение местоположений измеренных координат обнаруженного объекта. Правда в случаях измерения координат, матрица становится избыточной, так как зависимость от / и j вырождается в зависимость от /, но можно указать ряд важных случаев, когда этого не происходит и следует рассматривать всю матрицу вероятностей ошибочных измерений. Выше уже указывалось на связь актуальности информации с корректностью, где было показано ее влияние на точностные характеристики выдаваемой информации. Поэтому в качестве показателя актуальности предлагается рассматривать только временные задержки Гзадержки между первым появлением интересующего потребителя объекта и выдачи информации о нем потребителю. Конечно, тут снова возникает взаимосвязь между показателями эффективности, так как чем больше Задержки > тем выше будет полнота, и достоверность информации, и, наоборот, чем меньше Гзадержки, тем меньше вероятность ее выдачи, хуже точностные характеристики, больше возможностей для появления ложной информации. Рассмотренные показатели качества работы РЛС являются интегральными характеристиками, описывающими работу локатора в сред- 112
Оценка качества работы радиолокационной станции и ее подсистем 113 нем по всей зоне обзора. Такие характеристики, при всей их привлекательности, не всегда позволяют уловить тонкие различия при выборе конкретных видов обработки и не всегда удобны для полноценного анализа новых систем обработки, предоставляя возможность лишь грубых оценок характера поведения исследуемых систем. В дополнение к этим обобщенным характеристикам представляется полезным использовать точечные показатели сходного содержания для каждого элементарного участка зоны обзора в каждый момент времени. Каждый из рассмотренных показателей предлагается истолковывать, как поле величины, характеризующей его в этом месте в зависимости от времени. Причем, берется не конкретное значение показателя, а его потенциальное среднее значение при наличии в нем потенциальной цели или ее отсутствии (в зависимости от показателя), в предположении о многократном повторении случайных экспериментов с повторяющимися условиями. При такой интерпретации в качестве полноты рассматривается показатель зависимости от времени и координат зоны обзора вероятности обнаружения цели заданного типа (например, с ЭПР 1м2): n(x,t)= lim ^обн . (3.6) ^попыток Попыток Здесь No6h - число обнаружений цели, a NnonbnoK - количество попыток обнаружения при условии наличия цели для заданной точки времени и пространства (цель(х,г) присутствует). Эту характеристику в простейшем случае локатора без вторичной обработки можно интерпретировать как зависимость вероятности обнаружения цели от дальности и углов для различных моментов времени. Аналогично определяется зависимость от времени и координат зоны обзора вероятности появления ложных целей, которую можно рассматривать как поле ошибочности: B(x,t)= lim ^ложн , (3.7) ^попыток ^попыток Этот показатель описывает частоту принятия решения о наличии цели при условии отсутствия цели в заданной точке времени и пространства (цель(х,г) отсутствует). В простейшем случае локатора без вторичной обработки поле ошибочности можно трактовать как вероятность ложных тревог (ложных обнаружений) в каждом конкретном участке зоны обзора. Заметим, что такое определение достоверности несколько отличается от введенного выше. Оно скорее ближе к среднему числу ложных
Глава 3 обнаружений, но суть этой величины аналогична введенному ранее понятию. Корректность информации задается в таком же стиле. Под ней понимается усредненная по многократным реализациям величина: сг (*,/) = lim —j- , (3.8) ^попыток ^ПОПЫТОК при условии цель (x9t) присутствует. Необходимо отметить, что понятие точности как величины, зависящей от конкретного местоположения и от времени, как раз ближе всего к тому пониманию, которое используется при обосновании требований к РЛС. Действительно, требования по точности обычно задаются для конкретных местоположений целей. Аналогично вводится и понятие актуальности: Ут / j задержки / ^адержки^'Ь Km ~fZ > (3-9) ^попыток /V попыток при условии цель(х, t) присутствует. Правда здесь возникает небольшая неоднозначность, связанная с тем, что непонятно, к какому моменту времени относить этот показатель, ведь возможный интервал охватывает все время Тзадержш. Будем относить рассчитанное значение к начальному моменту, когда информация о цели выдается потребителю. Рассмотренные выше показатели характеризуют эффективность РЛС как системы в целом, ее способность выдавать потребителю полную и достоверную информацию о воздушном противнике. Достижение высокой эффективности возможно только при условии качественного решения системой всех возлагаемых на нее задач на всех этапах обработки информации. Для построения высокоэффективных систем необходимо провести оптимизацию и составляющих ее подсистем, вносящих вклад в изменение качества выдаваемой информации. Все множество задач обработки радиолокационной информации может быть разделено на ряд этапов, основываясь на общности целей и используемых методов. В ходе каждого этапа обработки РЛИ формируется информационный поток с логически законченной формой представления информации. Выше уже были определены и проанализированы основные этапы обработки РЛИ: формирование диаграммы направленности антенны; первичная (спектральная) обработка; 114
Оценка качества работы радиолокационной станции и ее подсистем обнаружение радиолокационных целей; вторичная (траекторная) обработка; распознавание целей и ситуаций; анализ обстановки и адаптация. Каждый из этих этапов характеризуется собственными показателями, которые вносят вклад в эффективность всей системы в целом. Причем для каждого из этих этапов можно рассмотреть введенные показатели полноты и достоверности (безошибочности, корректности и актуальности), которые характеризуют качество информации на выходе каждого из указанных этапов. Помимо этого для каждого из этапов можно указать частные показатели эффективности, которые более привязаны к содержанию выполняемых задач и являются устоявшимися характеристиками традиционного их рассмотрения. Формирование диаграммы направленности антенны для фазированных антенных решеток служит для пространственной селекции целей. В результате такой фильтрации формируется поле амплитуд сигналов для каждого элемента в зоне обзора РЛС. Значение этого поля при условии наличия цели характеризует полноту информации, при условии отсутствия целей - безошибочность. Аналогично задаются корректность и актуальность информации. Помимо этих информационных показателей для антенных систем задается основной показатель, описывающий качество работы - диаграмма направленности антенны. Этот показатель напрямую связан с информационными показателями. Связь между информационными и частными показателями качества Информационный показатель Частные показатели качества для этапа Полнота информации Отношение амплитуды главного лепестка ДНА к боковым лепесткам Безошибочность информации Уровень боковых лепестков ДНА Корректность информации Отношение амплитуды главного лепестка ДНА к боковым лепесткам Актуальность информации Скорость сканирования антенны для регулярного обзора или закон осмотра для нерегулярного Здесь показана только непосредственная связь между информационными частными показателями качества. Помимо прямой связи между показателями существует и косвенная зависимость, обусловленная взаимным влиянием информационных показателей. Об этом влиянии говорилось выше. Здесь уместно подчеркнуть лишь, например, частные случаи ухудшения актуальности информации при про- 115
Глава 3 пуске сигнала из-за его низкого уровня или большого числа ложных импульсов. Первичная (спектральная) обработка предназначена для фильтрации и пространственной селекции получаемых РЛС сигналов, образованных отражениями от целей на фоне помеховых воздействий и шумов. На этом этапе сформированное с помощью диаграммы направленности антенны поле амплитуд сигналов преобразуется в соответствии с параметрами спектральной обработки для подавления помех и увеличения уровня сигналов, отраженных от целей на фоне помеховых воздействий. Основным показателем качества спектральной обработки является вид автокорреляционной функции излучаемых сигналов, который определяет отношение сигнал / помеха на ее выходе, образующем информационное поле на выходе этого этапа. Связь частных показателей качества работы системы первичной обработки с информационными показателями представлена ниже. Связь частных показателей качества с информационными показателями Информационный показатель Частные показатели качества для этапа Полнота информации Отношение сигнал / помеха. Отношение амплитуды главного лепестка АКФ к боковым лепесткам Безошибочность информации Уровень боковых лепестков АКФ Корректность информации Отношение амплитуды главного лепестка АКФ к боковым лепесткам Актуальность информации Прямая зависимость отсутствует Обнаружение радиолокационных целей составляет процесс принятия решений, преобразующий поле амплитуд сигналов (или отношений сигнал / помеха) в поле решений для каждого участка зоны обзора. Эти решения в основном определяются двумя показателями качества - вероятностью обнаружения и уровнем ложных тревог. Дополнительным показателем является точность определения координат обнаруженных отметок. Вероятность обнаружения и уровень ложных тревог Информационный показатель Частные показатели качества для этапа Полнота информации Вероятность обнаружения целей Безошибочность информации Уровень ложных тревог Корректность информации Точность определения координат обнаруженных отметок Актуальность информации Прямая зависимость отсутствует 116
Оценка качества работы радиолокационной станции и ее подсистем Показатели качества системы и время формирования траектории Информационный показатель Частные показатели качества для этапа Полнота информации Вероятность существования траектории Безошибочность информации Среднее число ложных траекторий Корректность информации Точность определения координат сопровождаемых траекторий Актуальность информации Среднее время формирования траектории Распознавание целей выполняется для лучшего определения потребителем предпочтительных вариантов типовых воздействий и порядка из применения. Распознавание характеризуется вероятностной матрицей ошибок распознавания, которая в зависимости от требований потребителя (или методов использования полученной информации) может преобразовываться в полноту, безошибочность или корректность. Вероятность распознавания и полнота информации Информационный показатель Частные показатели качества для этапа Полнота информации Вероятность правильного распознавания класса (типа) Безошибочность информации Вероятности неправильного распознавания Корректность информации Вероятностная матрица ошибок распознавания Актуальность информации Прямая зависимость отсутствует В ходе анализа обстановки и адаптации выполняются две функциональные задачи: выбор информации для выдачи потребителю и адаптация для повышения собственной эффективности работы при изменениях внешних условий. Качество решения второй задачи лишь косвенно (хотя часто и очень существенно) влияет на информационные показатели через улучшение соответствующих параметров. А показатели качества для задач выдачи информации потребителю практически пол- 117 Вторичная (траекторная) обработка Вторичная обработка заключается в формировании траекторий целей путем установления соответствий между отметками на последовательных обзорах и уточнении (сглаживания) полученных координат и выполняет задачи экстраполяции координат целей для выдачи потребителю и дополнительной селекции ложных отметок. Основные показатели качества ее работы - вероятности формирования траекторий по целям, среднее число ложных отметок, точность определения координат целей и среднее время формирования траектории. Эти показатели имеют достаточно прямые аналогии в общих информационных показателях.
Глава 3 ностью совпадают с конечными показателями, так как это - завершающий этап системы обработки информации в РЛС. Показатели качества для потребителей информации Информационный показатель Частные показатели качества для этапа Полнота информации Вероятность выдачи информации по цели Безошибочность информации Среднее число ложных целеуказаний Корректность информации Точность определения координат выдаваемой информации Актуальность информации Время задержки до принятия решения на выдачу информации 3.2. Принципы оценки качества обработки радиолокационной информации в сложных условиях Анализ приведенных показателей эффективности показывает их явную зависимость от внешних условий. Каждый их этих показателей прямо зависит от конкретного варианта налета и помеховых воздействий, в которых функционирует РЛС. В то же время, при разработке подсистем обработки информации нельзя опираться на такие характеристики, величины которых могут меняться в очень широких пределах в зависимости от исходных данных [107; 77]. При оценке показателей качества информационной системы наибольшую сложность, особенно в идеологическом плане представляет формирование внешних условий, в которых осуществляются оценки. Внешние условия, влияющие на получаемые оценки эффективности информационных систем, определяются теми угрозами, которые могут влиять на работу информационных источников и снижать качество выдаваемой информации. Они задаются параметрами, характеризующими их влияние на источники информации. Именно от того, насколько жестко заданы параметры и характеристики внешних условий (типы и интенсивность помеховых воздействий, количественный и качественный состав объектов противника в зоне обзора и др.), в основном и зависят получаемые оценки и их применимость для доказательства способности системы выполнять требования потребителя. Обычно указать один или конечное число вариантов внешних условий, в которых должна успешно функционировать РЛС, выдавая информацию потребителю, нельзя. Существует бесконечное множество таких ситуаций. Внешние условия можно разбить на различные категории в зависимости от их происхождения и типа воздействия на радиолокатор [90]. По- 118
Оценка качества работы радиолокационной станции и ее подсистем меховые воздействия могут носить преднамеренный характер, т.е. целенаправленно создаваться противником для снижения качества получаемой о нем информации, затруднения работы РЛС или полного прекращения функционирования. Помимо этого для РЛС возникает ряд угроз непреднамеренного характера, связанных с мешающими воздействиями внешнего мира и собственных активных информационных средств. Помехи, воздействующие на РЛС, можно разделить на угрозы активного характера, влияющие на локатор вне зависимости от того, излучает он или нет, и пассивного, реализующие свои возможности лишь в ответ на активное излучение РЛС [19, 105; 115]. Внешние условия могут изменяться в широких пределах. Эти изменения связаны как со случайными факторами, не имеющими целенаправленного относительно РЛС характера, так и с факторами, специально подбираемыми противником с целью максимального затруднения работы информационного источника. Пусть задано множество возможных внешних условий Q, которое характеризуются вектором параметров со (йеО). К таким условиям относятся: постановка преднамеренных активных и пассивных помех (заградительных или прицельных по различным параметрам излучения с различными законами сопровождения параметров), воздействие непреднамеренных помех и др. При наличии тех или иных условий работы информационной системы качество ее функционирования характеризуется показателем качества (полноты, точности, достоверности или своевременности) W(co). Часть параметров внешних условий изменяется случайным образом, и качество информации следует усреднять по всему диапазону их возможных значений: Здесь и обозначает вектор параметров внешних условий описанного типа, U — область их изменения (wet/), а Р(й) — заданная на этой области вероятностная мера. К таким параметрам можно отнести характеристики непреднамеренных помех, а также те характеристики преднамеренных помех, которые противник не способен согласовать с техническими параметрами источников информации. Невозможность согласования может быть связана со сложностью для противника разведки параметров излучения активных сенсорных источников, а также с необходимостью использования своих ресурсов подавления для более приоритетных объектов и с физическими ограничениями. Следует отметить, что даже в режиме постановки заградительных помех противник имеет возможность достаточно широко варьировать (3.10) и 119
Глава 3 параметры своего помехового излучения с целью наибольшего затруднения работы источников информации. Кроме того, противник будет стремиться использовать такую тактику действий своих сил, которая затруднит работу информационных систем. В этих условиях при определении качества информации необходимо в соответствии с теоретико- игровым подходом руководствоваться принципом гарантированного результата [3; 107], т.е. показатели качества информационной системы следует рассчитывать для наихудших из возможных значений параметров внешних условий указанного типа. Если вектор параметров v описывает рассмотренные выше условия, а V - область его изменения, то математическая запись для показателя качества W будет иметь вид: Полный вектор параметров внешних условий со составляется как композиция векторов й и v , а область его изменения Q является прямым произведением областей U и V : Для корректного применения предложенного подхода к оцениванию показателей качества информационной системы следует проанализировать варианты типовых тактических ситуаций, создаваемых противником, вероятные построения его сил, а также тактику применения помех. Затем, на основе проведенного анализа выделить области изменения параметров внешних условий, которыми противник может и будет управлять для максимального затруднения функционирования информационной системы, и по этим параметрам найти наименьшее значение оцениваемого показателя. По остальным параметрам внешних условий значения показателей качества следует усреднять с известными вероятностными мерами распределения этих параметров. В случаях, когда вероятностные меры (плотности распределений) неизвестны или известны с некоторыми погрешностями, следует применять тот же принцип гарантированного результата и рассчитывать на наихудшие возможные распределения из допустимых. 3.3. Математические модели входных сигналов для различных этапов обработки информации в радиолокаторах При изучении статистических характеристик исследуемых систем для практически важных случаев редко удается обойтись аналитическими методами. Наиболее широко распространенным способом при (3.11) Q = UxV . (3.12) 120
Оценка качества работы радиолокационной станции и ее подсистем отсутствии возможности построения формульных зависимостей является применение методов Монте-Карло [40; 112]. Для этого необходимо моделировать на компьютере псевдослучайные числа и использовать эффективные математические модели. Часто исследователи недооценивают важность тщательной организации выбора методов генерации псевдослучайных чисел, останавливаясь на стандартных функциях, встроенных практически во все современные языки высокого уровня. Это может приводить к ошибочным выводам даже при формальной строгости всех последующих построений. Особое значение корректность создания процедур генерации приобретает для задач радиолокации, в которых значимыми являются очень низкие уровни вероятностей, порядка 10~7...Ю-6 [ИЗ; 105]. При этом даже небольшие с обычной точки зрения некорректности могут привести к существенно неправильным выводам. В качестве генератора случайных чисел выберем два варианта, прошедшие тщательную проверку и используемые в серьезных статистических исследованиях [138]. Обычно генераторы случайных чисел формируют случайные числа, равномерно распределенные в диапазоне 0...1. Получение случайных чисел для наперед заданных распределений осуществляется путем преобразования исходных значений по одному из известных правил. Одним из наиболее эффективных методов получения псевдослучайных чисел с заданной функцией распределения F(x) является использование обратного преобразования F~l(x) [40; 112]. В тех случаях, более широко распространенных в практических приложениях, когда такое преобразование построить не удается, приходится обращаться к специальным методам. Ниже приведены методы генерации случайных величин с различными законами распределения, использованные при проведении исследований [40; 112]. 3.3.1. Модели входных сигналов на основе известных распределений. Рассмотрим принципы получения псевдослучайных чисел для наиболее известных распределений. Прямоугольное распределение описывает случайную величину, равномерно распределенную в интервале (а...Ь). Параметр а задает нижнюю границу, а Ь верхнюю границу расположения случайных чисел. Плотность распределения р(х) = —-— . Ь-а . п/ ч (х~а) Функция распределения: Р(х) = -- . (Ь-а) Функция, обратная к функции распределения: х = а + Р(Ь - а). 121
Глава 3 Математическое ожидание и дисперсия: Е{х) = ; Var{x} = (b-af 12 Наилучшим вариантом генерации псевдослучайных чисел является использование метода обратной функции. Треугольное распределение также описывает случайную величину, равномерно распределенную в интервале (а...Ь). Параметры а и Ъ задают нижнюю и верхнюю границы расположения случайных чисел, а параметр с соответствует расположению максимума плотности вероятности. Плотность распределения: 2(х - а) р(х) = (Ь-а)(с-а) (Ь-х) {(b-a)(b-c) Функция распределения (х-а)2 а<х<с, с<х<Ъ. Р(х) = (Ь-аХс-а) (Ь-х)2 а<х<с, с<х<Ь. (Ъ-а)ф-с) Функция, обратная к функции распределения: (с-а) a + yJP(b-a)(c-a) 0<Р< (Ъ-аУ b-J(\-P)(b-a)(b-c) ^-^<Р<\. Математическое ожидание и дисперсия: {а + Ь + с) Е{х} = 1 ; Var{x}: a2 +b2 +с2 -ab-bc- ас U При генерации псевдослучайных чисел можно воспользоваться как методом обратной функции, так и тем фактом, что сумма двух случайных величин, распределенных по равномерному закону в интервалах (а...с) и (O...b-с), соответственно, имеет требуемое треугольное распределение. Учитывая тот факт, что операция извлечения квадратного корня имеет значительную вычислительную трудоемкость, второй способ является предпочтительным. 122
Оценка качества работы радиолокационной станции и ее подсистем Экспоненциальное распределение описывает случайную величину, распределенную на бесконечном полуинтервале (О...оо). Параметр q задает среднее значение. 1 Плотность распределения: р(х) = — ехр Функция распределения: Р(х) = 1 - ехр Ч) Функция, обратная к функции распределения: x = -q 1п(1 - Р). Математическое ожидание и дисперсия: Е{х} = q ; Var{x} = q2. Наиболее удобным способом генерации псевдослучайных чисел является использование метода обратной функции с небольшой модификацией. Если £ распределена равномерно в интервале (0...1), то 1-£ гакже распределена равномерно в том же интервале, формула для генерации случайной величины принимает вид: Экспоненциальное распределение является основой для формирования целого ряда других распределений. Наиболее известным и широко используемых среди них является нормальное или гауссово распределение. Нормальное распределение применяется в самых разнообразных приложениях и описывает случайную величину, распределенную на бесконечном множестве (-00...00). Параметры т и а задают среднее значение и среднеквадратическое отклонение, соответственно. Плотность распределения: р(х)-- 1 ехр (х - т) ~~2? 2 Л Функция распределения: 1 Р(х)= J па г ехр 2а1 dt, которую часто также называют интегралом ошибок. Функция, обратная к функции распределения в замкнутом виде представлена быть не может. Математическое ожидание и дисперсия: Е{х) = т ; Var{jc} = а2. 123
Глава 3 Обычный способ генерации псевдослучайных чисел с использованием метода обратной функции в прямом виде в этом случае неприменим. Возможно использование различных аппроксимаций, позволяющих в принципе добиться высокой точности моделирования. Известно несколько удачных вариантов аппроксимации функции обратной к интегралу ошибок. Каждая из них имеет известные уровни точности. Причем, повышение точности требует использования более громоздких вариантов аппроксимаций. Во многих руководствах рекомендуется метод, основанный на центральной предельной теореме, которая утверждает, что при большом числе испытаний распределение суммы независимых одинаково распределенных случайных величин стремится к нормальному. Обычно при этом используют 6... 10 независимых испытаний. Такого количества оказывается достаточно для большинства традиционных применений, но не для случаев, когда уровни оцениваемых вероятностей близки к нулю. Достаточно неожиданным образом здесь на помощь приходит теория радиолокации, точнее, ее составная часть теория комплекснознач- ных случайных процессов. Оказывается, что наиболее удобным среди корректных методов генерации нормально распределенных случайных величин является метод, основанный на свойстве нормального шума, рассматриваемого в этой теории. Нормальный шум имеет квадрат амплитуды, распределенный по экспоненциальному закону и равномерно распределенную фазу. Верно и обратное утверждение: если квадрат амплитуды комплексной случайной величины распределен по экспоненциальному закону, а фаза — по равномерному, то ее действительная и мнимая составляющие независимы и имеют нормальное распределение. Алгоритм генерации в соответствии с данным методом позволяет одновременно получать две независимые нормально распределенные случайные величины. Если £i и £2 независимо распределены равномерно в интервале^. .. 1), то величины: независимы и имеют нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Соответственно, величины имеют среднее т и дисперсию о2. 124
Оценка качества работы радиолокационной станции и ее подсистем Распределение Вейбулла является обобщением экспоненциального распределения и описывает случайную величину, распределенную на бесконечном полуинтервале (О...оо). Помимо параметра (а...6), который задает среднее значение, используется также параметр формы распределения р. Плотность распределения: р(х) = ( р- -1 \ г \ р\ рхр ехр x — — 1 яр V ) ( / \ /Л x -ехр — — ) Функция распределения: Р(х) = 1 - ехр Функция, обратная к функции распределения: х = #(-1п(1 - Р))1/р. Математическое ожидание и дисперсия: И г м г full 2\ E{x) = qY , Е{х) = q Г - Г К Р) 1 Р) 1 1 Р) ) / Так же как и в случае экспоненциального распределения, генерация вейбулловских случайных величин осуществляется на основе метода обратной функции с заменой равномерно распределенной £ на 1 - £ Формула для генерации случайной величины имеет вид: К сожалению, регулярных методов расчета параметров распределения Вейбулла в зависимости от математического ожидания и дисперсии случайной величины неизвестно, поэтому приходится довольствоваться численными методами. Частным случаем вейбулловского распределения является распределение Рэлея. Распределение Рэлея. В этом распределении параметр q = 2 и для удобства записи вместо q, и связанный с ним параметр а - ^2q . Плотность распределения: р(х) - \ — |ехр 2о1 Функция распределения: Р(х) -1 - ехр ~2 \ 2а1 Функция, обратная к функции распределения: х = сг^-21п(1 - Р). Математическое ожидание и дисперсия: Е{х} = а^/2\ \к{х} = а2(2-у^. 125
Глава 3 Формула для генерации случайной величины имеет вид: т] = (JyJ-2 In % . Распределение Эрланга описывает сумму независимых одинаково распределенных экспоненциальных случайных величин. Помимо q в качестве параметра выступает количество этих величин п. Плотность распределения: р(х) = Функция распределения: Р(х) = ехр 1 х' -Л х ехр х Функция, обратная к функции распределения в замкнутом виде представлена быть не может. Математическое ожидание и дисперсия: Е{х) = nq; Var{x} = nq2. Метод обратной функции для генерации псевдослучайных чисел может быть применен только с использованием аппроксимаций. Более удобным в случае небольших значений п будет использование основного свойства данного распределения, описывающего сумму экспоненциально распределенных величин. Формула для генерации случайной величины при этом принимает вид: п /=о Однако этот метод может успешно применяться лишь при относительно небольших значениях и, в противном случае потребуется слишком много вспомогательных величин. В этом случае могут применяться более общие методы, используемые для гамма-распределения. Гамма распределение является обобщением распределения Эрланга на нецелые значения параметра формы. В этом случае вместо п используется параметр а. Формулы аналогичны предыдущему случаю с заменой буквенных обозначений. х 4j Плотность распределения: р(х) = | —— |ехр Функция распределения: Р(х) = Па) g q J аа ехр dt. После замены переменных y = x/q она может быть сведена к виду: Т(а) У 126
Оценка качества работы радиолокационной станции и ее подсистем которая называется неполной гамма-функцией и обозначается T(z; а). В данном случае z = x/q. Функция, обратная к функции распределения в замкнутом виде представлена быть не может. Известны различные ее аппроксимации. Математическое ожидание и дисперсия: Е{х} = aq\ Var{x} = aq2 . При заданных величинах математического ожидания и дисперсии расчет параметров гамма-распределения проводится достаточно просто: {Е{х})2 Уаг{х} а = - —, а- — . Var{x} Е{х) Если параметр а не целое число, то для применения метода обратных функций приходится пользоваться аппроксимациями. Однако более удобным оказывается геометрический метод. Логарифмически нормальное (логнормальное) распределение часто применяется для моделирования обратных отражений от местных предметов и подстилающей поверхности, особенно в случае водной поверхности. Оно, так же, как и гамма-распределение, описывает случайную величину с более "тяжелыми хвостами", чем экспоненциальное распределение. Фактически это случайная величина, логарифм которой имеет нормальное распределение. Естественно при этом используются такие же параметры, как и у нормального распределения. Помимо этого для более компактной записи часто используют преобразованные величины: /и = \пт и о) = ехр(а2). Плотность распределения: р(х) = —J— ехр Функция распределения: Р(х)= f—i—ехр (In х - In т) У 20^ f (ln/-lnm)2^ А. Функция - обратная к функции распределения - в замкнутом виде представлена быть не может. Математическое ожидание и дисперсия: Е{х} - т ехр ^ a2 j = т4со, Var{x} = т200(00 -1) . Наиболее удобным способом генерации псевдослучайных чисел является использование преобразование нормально N(0,1) распределенных случайных величин £ согласно формуле: 127
Глава 3 rj = m ехр (ст = ехр (т + а . Логистическое распределение описывает случайную величину, распределенную на всем множестве действительных чисел (-00...00). Параметр а задает среднее значение, а Ь — масштаб. Плотность распределения: ехр - р(х) = - ехр Ь\ 1 + ехр Функция распределения: 1 Р(х) = \- 1 + ехр 1 х-а 1 т = — sec Л2 2 4 гъ 1 + ехр х-а 1 + ехр х-а 1 + tanh х-а ь ) \ ь Функция, обратная к функции распределения: Р х = а + Ъ In \-Р Математическое ожидание и дисперсия: Е{х} = а; Var{x} = ;rV/3. Так как обратная функция достаточно просто выражается аналитически, формула для генерации случайной величины принимает вид: Tj = а + Ь In Замечательным свойством последнего распределения является тот факт, что его функция распределения в точности соответствует логистической функции, задаваемой в качестве функции активации нейронов в наиболее широко распространенных моделях нейронных сетей. 3.3.2. Моделирование смешанных распределений случайных величин. При анализе и синтезе систем обработки радиолокационной информации необходимо опираться на вероятностные характеристики исследуемых сигналов. Обычно выбираются некоторые классы распределений и исследования проводятся на основе моделирования характеристик системы при наличии вероятностных распределений с заданными параметрами. Наиболее часто используемыми параметрами в математической статистике и статистической теории принятия решений являются 128
Оценка качества работы радиолокационной станции и ее подсистем первые два момента распределений: математическое ожидание и дисперсия. Знание этих величин позволяет однозначно задать точный вид распределения для многих типичных законов распределения и осуществлять моделирование соответствующих случайных величин. Однако часто распределения вероятностей выражаются в виде смеси нескольких типичных распределений. В этом случае получить однозначного соответствия между первыми двумя моментами и параметрами распределений не удается. Рассмотрим особенности моделирования таких случайных величин. Пусть имеется два распределения с плотностями /] (jc) и f2(x), соответственно. Каждое из них может задаваться с вероятностями /?, и р2. Тогда общая плотность распределения запишется в виде математического ожидания исходных плотностей: /(*) = Pif\{x) +Pzfi(x)- Оценим основные параметры - математическое ожидание и дисперсию - полученного распределения. Математическое ожидание равно: 00 00 Ef{x}= ^xf(x)dx = jx(plfl(x) + p2f2(x))dx . о о Откуда легко получить, что 00 00 Ef W = jWi (х) <** + \xPifi {x)ax = P\Eff W + РгЕ/2 W > о о математическое ожидание является линейной функцией. Расчет дисперсии случайной величины со смешанным распределением несколько сложнее. 00 Df{x} = jx2f(x)dx-(Ef{x}f = о 00 = \х2 {р^(х) + P%f2{x))dx -(рхЕЛ {х} +р2Е/2{х}) = о = pi(d/s{x} +(Efi{x})2]j + p2(df2{x} +{Eh {х))2у -(PlEf№ +P2E/2{X}f = = Pida W + PiD/2{*} +Р\Рг(ЕЛ {*} -Я/Л*})*- 5782 1 29
Глава 3 Здесь учтено, что рх+р2=\, а следовательно, Р\~Р\ -р2-Pi - = Р\Рг • Рассмотрим семейство смешанных распределений с заданным математическим ожиданием т при различных рх. Пусть распределение с плотностью fx (х) представляет собой некоторый общий случай, на который с некоторой вероятностью р2 -1 - рх статистически накладывается отличное от него распределение f2(x) (Случай так называемой € -загрязненного распределения). Обозначим: Щ = Eff {х}, т2 = Ef2 {х}, а,2 = Dff {х}, а22 = Dfi {х} , при этом рассматривается случай т>тх. Тогда т = рхтх+ р2т2. Так как распределение с плотностью fx (х) в этом семействе остается постоянным, то для сохранения заданного математического ожидания т вероятность загрязняющего распределения должна изменяться в зависимости от отношения т2/т при различных величинах тх/т: Pi _ \-тх/п т2/т-тх/т Эти зависимости приведены на рис. 3.2. 1,2 mi/m = 0,1 т\/т - 0,5 mi/m = 0,9 1 10 mil т 100 Рис. 3.2. Зависимость вероятности загрязняющего распределения от уровня его среднего значения Дисперсия а случайной величины, распределенной по смешанному закону распределения, будет изменяться следующим образом: ъ1 = Pi (с*i2 + Щ2) + Р2 (<т22 + т2 )" (Р\т\ + Ргт2 f 130
Оценка качества работы радиолокационной станции и ее подсистем или с учетом того, что р2 = 1 - рх, а2 = рхо2 + р2а22 - рхр2 (т2 - тх f . Подставим соотношения для вероятностей, получим: т2/т-\ т21т-тх1т -аГ+- т2/т-тх1т V т В случае, когда ах^ =тщ , как, например, при экспоненциальном распределении вероятностей, относительное изменение дисперсии по отношению к дисперсии незагрязненного экспоненциального распределения составит: m2/m-l (тх V \-тх/т (т2 л2 т m2jm-mxjm\m) m2jm-mxjm\m или, после преобразований: £l = l + 2f^-l)fl-.'»' т in т т т На рис. 3.3 изображены зависимости относительного изменения дисперсии 8 -загрязненного распределения от относительной мощности загрязняющего распределения. 1000 a7mz 100 10 mi/m = 0,1 mi/m = 0,5 mi/m = 0,9 1 10 тг/т 100 Рис. 3.3. Зависимости относительного изменения дисперсии ^-загрязненного распределения от относительной мощности загрязняющего распределения Интересно отметить, что, если — = 0,5, имеет место равенство т между этими величинами. Действительно, в этом случае, выражение для относительной дисперсии преобразуется к виду: 131
Глава 3 ^ = i + 2f^-ll(l-0,5) = ^ или а2=т2т. т \т ) т Задавать смешанное распределение можно различными способами. Наиболее естественной формой задания является определение двух его парциальных составляющих и одной из вероятностей: р{ или р2. В этом случае первые моменты распределения могут быть рассчитаны по вышеприведенным формулам. Во многих случаях возникает необходимость задавать смешанное распределение на основе известных первых двух моментов, как это делается для классических распределений. Здесь возникает неоднозначность, так как количество свободных параметров больше, чем число задаваемых, даже в простейшем случае экспоненциальных парциальных распределений. Поэтому нужно вводить дополнительные ограничения. Рассмотрим смешанное экспоненциальное распределение из двух составляющих. Пусть заданы математическое ожидание и дисперсия. Отметим, что должно выполняться условие а2 > т2. Удобно ввести дополнительный параметр, характеризующий отклонение смешанного рас- а2 —т2 пределения от экспоненциального а = г—. Возможны три варианта. 2т1 Вариант 1. Распределение fx полагается вырожденным с нулевым параметром, то есть сосредоточенным в точке х = О. Тогда выражения преобразуются к виду: т а2 Щ Л т = р2т2, р2=—, —г = 2-±-\, т2 т т исходя из которых легко получить основные параметры: 2 2 2 2 2 а +т та а -т т2 = = — н -тл = т{\ + а), 2т 2 2т 2т 2т2 1 а2 -т2 а а +т а + l а +т а + 1 Интересно, что при этом отношение вероятностей — будет равно Pi коэффициенту а. Вариант 2. Распределения fx и /2 считаются равноудаленными т1 т от результирующего среднего в смысле — = — при сохранении усло- т тх 132
Оценка качества работы радиолокационной станции и ее подсистем вия: т = Р\Щ + Pim2 - В этом случае выражение для дисперсии результирующего распределения преобразуется к виду: т \т т 2) I т2 1 или а = I — -1 т которое имеет два корня, соответствующие значением тх и т2, большее из которых является величиной т2, а меньшее - тх: я+ 2 + л/я2 + 4я я + 2- тх-т- 4а 2 ' 1 2 Естественно при этом выполняется условие /и^ = w2. Для вероятностей появления составляющих экспоненциальных распределений можно записать: 1 1 Pl 2 2\а + 4 а 1 la Р2=2 + 2^4 Из приведенных соотношений видно, что с ростом дисперсии (при увеличении отклонения смешанного распределения от экспоненциального а) вероятность появления более интенсивных выбросов, описываемых распределением /2 должна уменьшаться с соответствующим увеличением амплитуд этих выбросов. Вариант 3. Одно из распределений fx или /2 фиксировано и требуется найти параметры второго и вероятности появления каждого из них. Пусть фиксировано распределение fx (т.е. тх и о2 = т2 ), а параметр т2 (сг22 = т2 ), а также вероятности появления составляющих экспоненциальных распределений необходимо определить, исходя из математического ожидания и дисперсии смешанного распределения. Из выражения для дисперсии смешанного распределения легко получить, что т0 -\ = V- т т 2 \ 2т1 откуда следует: ■ т + - т-т. Рг \-тх/ т m2l т-тх1 т 1 + (\-тх1т)1 Р\ = (\-тх1ту 1 + (\-mxlmy 133
Глава 3 Можно представить последние соотношения в несколько ином виде. Введем дополнительный параметр: 2 2 ,_ а _ а -т Q ~ (\-mxlmf ~ 2(т-т{)2 ' Тогда получим: 1 d Р2=—Г77> Р\ = а'+ \ а+\ что полностью соответствует выражениям для первого случая с заменой параметра а на а . Таким образом, вариант с фиксированным распределением оказывается эквивалентным варианту с вырожденным парциальным распределением с точностью до указанной замены коэффициентов. Приведенные соотношения однозначно определяют параметры смешанного экспоненциального распределения. Для всех рассмотренных вариантов можно указать границы, в которых могут изменяться первые два момента нового смешанного распределения, которые определяются допустимыми пределами изменения параметра а : 0 < а < со. Для любого значения параметра а в указанных пределах оказывается возможным указать необходимые характеристики парциальных распределений и вероятностей их появления. Важно отметить, что результирующее распределение всегда будет иметь отношение дисперсии к математическому ожиданию больше, чем у исходных распределений. Оказалось возможным добиться сколь угодно большой величины этого параметра, которое характеризует степень неопределенности получаемого распределения. Интересно рассмотреть также другие распределения, отличные от экспоненциального, имеющие большее число внутренних параметров. Однако в этом случае необходимо устранить дополнительно появляющуюся неоднозначность. Удобно ввести в рассмотрение параметр от- я ^ клонения распределения от экспоненциального р = —у и ограничиться т рассмотрением только тех парциальных распределений, в которых эта величина остается постоянной. При /? -1 задача сводится к предыдущей. Если р < 1, то рассматриваемые распределения являются более сосредоточенными в начальной части числовой оси и имеют более быстро спадающие "хвосты". Распределения с р > 1 являются наиболее статистически неопределенными, с тяжелыми "хвостами" и представляют наибольшие трудности для задач обнаружения и распознавания. При фиксации этого параметра для рассматриваемых распределений можно записать: 134
Оценка качества работы радиолокационной станции и ее подсистем (Тщ = Ртх{22 . Можно отметить, что любых распределений, отличающихся друг от друга преобразованием масштаба, данное условие соблюдается. Действительно, если новая случайная величина отличается от старой на коэффициент с, можно записать: ac2=c2a2=c2pm2=pmc2 . В случае выполнения указанного соотношения между двумя первыми моментами распределений соотношение для дисперсии смешанного распределения можно переписать в виде: a m2/m-\ ГщЛ + \-mJm ГщЛ m m2jm -mxjm \m ) m2l m - mj m \m ) \ m Д m или 4=/?+(i+/?)r^-i)fi-a m \ m )\ m Очевидно, что для любого невырожденного смешанного распреде- ления отношение —г- будет больше, чем р . Здесь также удобно ввести m дополнительный параметр, характеризующий отклонение смешанного а2-Рт2 распределения от исходных парциальных распределении а --—- . (1 + Р)т Определение параметров смешанного распределения, так же, как и раньше можно разделить на три случая. 1. Распределение /| полагается вырожденным с нулевым параметром, то есть сосредоточенным в точке jc = 0. Тогда выражения преобразуются к виду: т а2 ,л лЧ т т = р2т2, р2=—, — = (! + /?) —-I, т2 т2 т исходя из которых легко получить основные параметры: cr2+m2 т а2 а2 - Вт2 т7 = + = т + - = т(\ + а), {\ + Р)т (\ + Р) (\ + р)т (\ + р)т т l , а Р2= — = —Pl=l-P2= г. т2 а +1 а +1 135
Глава 3 2. Рассматриваются распределения fx и /2, равноудаленные от результирующего среднего в смысле т Шл при сохранении условия: m = pxmx+p2m2. В этом случае выражение для дисперсии результирующего распределения преобразуется к виду: 171 = /?+(! + /?) m hi m или а - 171 1- n2j которое имеет два корня: я+ 2 + Vtf2 +4а а + 2-yja2 +4а Для вероятностей появления составляющих экспоненциальных распределений можно записать: - I _ 1 > а - 1 1 I а Р2~ 2 2V^ + 4' Р2~ 2 + 2^ + 4 Здесь так же, как и в случае экспоненциальных распределений с ростом дисперсии (при увеличении отклонения смешанного распределения от парциальных а) вероятность появления более интенсивных выбросов, описываемых распределением f2 должна уменьшаться с соответствующим увеличением амплитуд этих выбросов. 3. Одно из распределений fx или /2 фиксировано и требуется найти параметры второго и вероятности появления каждого из них. Пусть фиксировано распределение fx (т.е. тх и of = J3mx ), а параметр т2 (<j2= fim\), а также вероятности появления составляющих экспоненциальных распределений необходимо определить, исходя из математического ожидания и дисперсии смешанного распределения. Из выражения для дисперсии смешанного распределения легко получить, что ■1 = {о2-Рт2^ (1 + Ют2 1- ч2) откуда следует: т>> =т + - т-т< 136
Оценка качества работы радиолокационной станции и ее подсистем а Р2 = 1 - тх I т (\-тх1т)2 m2l т-тх1 т 1 + а 1 + а (\-тх/т)2 (\-тх1т)2 Интересно, что полученные выражения совпадают с приведенными ранее для экспоненциального распределения, с учетом измененного определения параметра а, следовательно, ими можно пользоваться в случае произвольных парциальных распределений. 3.4. Методы ускорения статистических расчетов при оценке эффективности обработки радиолокационной информации При оценке статистических показателей качества радиолокационных источников информации приходится сталкиваться с трудностями их достоверного получения, которые возникают из необходимости обеспечения уровня ложных тревог на очень низком уровне, порядка ИГ5-10Л Если в традиционно рассматриваемых системах распознавания вероятность ошибок порядка 10~2-10~3 рассматривается как очень хорошая, то в радиолокационном обнаружителе такие ошибки совершенно неприемлемы. Это ставит исследователя в очень сложное положение. Обычные аналитические методы расчета часто не могут быть применены из-за отсутствия формульных зависимостей для нетривиальных обнаружителей и нестандартных помех. Поэтому приходится обращаться к статистическому анализу, основанному на методах Монте-Карло, которые имеют тчность порядка \fypN и при расчете малых вероятностей обнаружения требуют проведения очень большого числа реализаций [112]. При статистическом моделировании для анализа вероятности ложных тревог большинство экспериментов проводится напрасно, так как юлько в ничтожной части из них происходит ложное обнаружение, а в остальных попытки оказываются напрасными. Для преодоления этого недостатка используется метод существенной выборки [40; 112]. 3.4.1. Использование метода существенной выборки для ускорения статистических расчетов. Пусть оценивается вероятность попадания входного вектора х = (х,,х2>-в некоторую критическую область Q. Например, задан алгоритм обнаружения целей (решающе правило), который определяет критическую область Q в пространстве сигналов. При попадании сигнала в эту область, принимается решение 137
Глава 3 об обнаружении цели. В противном случае считается, что цели нет. Тогда вероятность ложной тревоги Fm запишется в виде: FnT = jf(x)ax, (3.13) где /(х) - плотность распределения вероятности для случая отсутствия цели (шум или помеха). Метод статистических испытаний для оценки такого вида интегралов заключается в том, что генерируется большое количество случайных векторов xi9 являющихся реализациями многомерной случайной величины £ с плотностью распределения f^(x), а значение FnT оценивается по случайной величине ^т=^Еж). <зл4> где %(х) - характеристическая функция области Q. Известно, что случайная величина FnT сходится по вероятности к истинному значению FnT. При этом дисперсия этой оценки равна: D^»}=i ifd*-p- 4(F-_F-2)- (315) Однако, если область Q мала относительно меры /(х), количество испытаний, необходимое для достоверной оценки, становится недопустимо большим. Действительно, стандартное отклонение <jf оценки составляет ~"I^^/n ' те* для П0ЛУчения разумных оценок необходимо 100 провести, по крайней мере, порядка испытании. Для того чтобы получить более приемлемую точность оценки столь малых вероятностей, являющихся, тем не менее, очень важными для радиолокатора, необходимо применять специальные статистические методы. Одним из наиболее эффективных является метод существенной выборки, заключающийся в том, что интеграл U = Q \Дх)ах9 (3.16) заменяется на 138
Оценка качества работы радиолокационной станции и ее подсистем (3-17) и его оценка осуществляется по формуле где точки xt задаются уже плотностью вероятности р(х). Распределение р(х) можно выбрать таким образом, что случайные точки будут попадать в критическую область Q, намного чаще, чем в исходном распределении. Это иллюстрируется рисунками (рис. 3.4 и рис. 3.5). Рис. 3.4. Иллюстрация традиционного Рис 3.5. Иллюстрация метода метода Монте-Карло существенной выборки На первом приведено обычное расположение критической области и равномерно распределенных случайных точек. Как видно из рисунка лишь небольшая часть из них попадает в область Q. В практических случаях доля значимых точек значительно меньше. На втором рисунке показано как будут располагаться точки при более рациональном выборе их распределения, таком, что примерно половина из них попадет критическую область. Указанные оценки интеграла образуют семейство несмещенных оценок интеграла U . Их дисперсии записываются в виде: (3.19) 139
Глава 3 Таким образом, можно рассматривать задачу о выборе оптимальной плотности р{х), при которой дисперсия минимальна. В [112] доказано, что оптимальная плотность вероятности должна быть пропорциональна ^(х)/(х). Действительно, в этом случае плотность р(х) будет равна: а дисперсия оценки составит: D^Hi[ffi^^^-4- (з-21) N [I Их)1 f(x) ) Из этого результата следует, что оптимальное значение дисперсии оценки интеграла есть нуль, а соответствующая плотность вероятности требует для своего построения знания \f(x)dx , т.е. самого интеграла. Однако знание вида оптимальной плотности показывает, как можно учесть известную информацию о примерном виде области Q. Если выбирать р(х) так, чтобы она хотя бы очень грубо походила на z{x)f{x)> то можно ожидать получить не очень большое значение дисперсии, что очень важно при практических расчетах. Это распределение вероятностей можно подобрать таким образом, чтобы дисперсия оценки уменьшилась на несколько порядков. Одним из возможных вариантов выбора рациональных вспомогательных плотностей распределения является следующий. Построить некоторую область , охватывающую исходную область Q, при этом необходимо, чтобы объем построенной области в смысле метрики /(jc) не сильно отличался от объема исходной области, но допускал аналитическое вычисление. В этом случае достаточно осуществлять генерацию случайных точек в этой области. Действительно, плотность случайных величин будет описываться выражением: Z(x)f(x) (3.20) Q Q ЛГц (*)/(*) (3.22) а дисперсия оценки интеграла составит: 140
Оценка качества работы радиолокационной станции и ее подсистем ( То2(х) /2(*) Ха, (*) /(*) dx-Fm2 J (3.23) N jf{x) dx Fm-Fny2 J Из последнего выражения следует, что оценка с использованием метода существенной выборки будет во столько же раз меньше исходной, во сколько раз объем области Q} меньше объема искомой области, а когда этот объем вплотную приблизится к объему области Q, уменьшение будет еще более значительным из-за вычитания квадратичного члена. Иногда достаточно выбрать распределение, растянутое относи- удачные варианты выбора дополнительного распределения. Еще одним вариантом рационального выбора плотности является использование какой-либо из достаточно распространенных плотностей с набором параметров, которые можно подбирать для получения наилучших оценок. Правда, очень неудобно для каждого варианта параметров пересчитывать оценки интеграла заново. Но оказывается, это необязательно. Вполне допустимо использовать все численные значения, которые были получены для расчета оценок. Пусть имеется некоторая последовательность плотностей вероятностей pt(x) такая, что оценки интеграла становятся все более точными. Рассмотрим сумму: в которой каждое значение случайной точки xt получается с использо- данного распределения может быть осуществлена с помощью функционального преобразования из равномерного: число раз. В других случаях удается угадать (3.24) ванием распределения pi (х). Учтем при этом, что генерация точек за- (3.25) Тогда оценку искомого интеграла можно записать в виде: (3.26) 141
Глава 3 где точки yt распределены одинаково, и к ним можно применять предельные теоремы теории вероятностей. Дисперсия такой оценки составит: DiF \- 1 1 ТГ/Ч*) При этом, если pt{x) —- {/(*) dx (3.27) ^(х)/(х), то дисперсия оценки стремится к: 1 > — N [f^dx F 2 = 0. (3.28) Таким образом, задача оценки интеграла, описывающего искомую вероятность, превращается в оптимизационную задачу по поиску значений параметров распределения. Конкретная реализация такого рода оптимизации зависит от конкретных видов распределений. 3.4.2. Процедура ускоренного статистического анализа. При моделировании одним из основных инструментов является метод статистических испытаний. При этом возможно два типа задач: оценка вероятностей некоторых сложных событий, аналитическое получение которых невозможно; оценка параметров и характеристик случайных величин. Как указывалось выше, при использовании метода Монте-Карло формирование наборов входных данных осуществляется с помощью датчика случайных чисел. Если датчик случайных чисел удовлетворяет требованиям случайности, точность оценок определяется числом испытаний в соответствии с известными предельными теоремами. В наиболее общей постановке, вероятность представляется в виде многомерного интеграла по области Q от заданной функции по плотности вероятности р(х1,х2,...,хт) [112]: Р= jp(xl,x2,...,xm)dxldx2...dxm , или, если проводится оценка вероятности: Р= \dyxdy2...dym. (3.29) (3.30) Очевидно, что соотношение (3.30) является частным случаем общей постановки задачи (3.29). 142
Оценка качества работы радиолокационной станции и ее подсистем В дальнейшем, не нарушая общности, будем полагать всю область, в которой распределены переменные хих29...,хт, w-мерным гиперкубом /ш(Ос/и). В противном случае можно указать преобразование, которое переводит гиперкуб в исследуемую область или наоборот. При использовании метода Монте-Карло [40; 112] интеграл (3.29) заменяется суммой: Р= \^р(АЛ---Л)¥а(АЛ---^т). (3.31) Здесь п - количество используемых точек; ^n(*j,*2> •••»JC) ~ ха~ рактеристическая функция области Q. Точки (x(,jc2, -"^m) получаются с помощью известных методов генерации псевдослучайных чисел с заданной вероятностью. Точность вычисления интеграла Р с помощью суммы (3.31) определяется числом испытаний п. Известно [40; 112], что для метода Монте-Карло асимптотическая точность 8 при больших п имеет вид: S= -4 • (3-32) п1 Здесь А зависит от подынтегральной функции р(хх,х2, ...,хт) и области интегрирования Q и не зависит от числа испытаний п. Такая асимптотика точности суммирования объясняется стохастичностью узлов суммирования в формуле (3.31), которые обеспечивают равномерное заполнение исследуемой области лишь при п —> оо . Вообще говоря, выражение (3.31) описывает квадратурную формулу для оценки интеграла (3.30). Простейшим численным методом расчета этой формулы было бы использование точек равномерной решетки на гиперкубе. Однако точность оценок при этом была бы порядка 5 = 4 j что очень плохо при большой размерности решаемой задачи. пт Действительно, если необходимо увеличить точность в 10 раз, потребуется в «10ш большее число точек. Если в одномерном случае такое увеличение вполне допустимо, то в случаях размерностей более 3...4 становится совершенно неприемлемым. Желательно получить квадратурные формулы для размерностей т>2, имеющие характеристики точности, лучше, чем в случае случайных точек и равномерных решеток. В работе [111] построены последовательности точек (ЛПт-после- довательности), имеющие оценку асимптотической точности: 143
Глава 3 S=-. (3.33) п Их использование обеспечивает наилучшую (или близкую к наилучшей) сходимость сумм (3.31). Действительно, сравнение соотношений (3.32) и (3.33) показывает, что для повышения точности вычисления интеграла (3.30) с помощью сумм (3.31) в 10 раз метод с использованием ЛПт-последовательностей требует в 10 раз большего числа испытаний, в то время как в классическом методе статистических испытаний необходимо было бы увеличить число испытаний в 100 раз. При этом допустимо дополнительное применение известных методов повышения точности вычислений (вычисление главной части интеграла, аналитическое интегрирование по части переменных, использование существенной выборки и т.п.). На рис. 3.6-3.8 представлены варианты расположения 256 точек интегрирования для двухмерного случая при использовании равномерной решетки, случайных точек и ЛПт-последовательностей, соответственно. Рис. 3.6. Равномерная Рис. 3.7. Случайное Рис. 3.8. 2-х мерная решетка равномерное ЛПт-последовательности распределение Эти рисунки наглядно иллюстрируют тот факт, что ЛПт-последовательности распределены более равномерно на плоскости (аналогичное утверждение верно и для пространств высших размерностей), чем случайные и тем более чем узлы равномерной решетки. Это интуитивно и визуально понятное свойство равномерности было строго математически определено и было показано, что равномерно распределенные последовательности, частным случаем которых являются ЛПт-последовательности, взятые в качестве узловых точек квадратурных формул, позволяют получать асимптотическую точность оценок, приближающуюся к (5). В [111; 112] описан алгоритм генерации ЛПт-последовательностей. За основу берутся числители координат так называемых "направляющих точек" V* = IV[, V2'9У*т\. Знаменатели всех координат точки V* 144
Оценка качества работы радиолокационной станции и ее подсистем равны 2'. Очередная точка ЛПт-последовательности Ql = [q[, Ql2,Q'm j вычисляется следующим образом. Пусть в двоичной системе исчисления ее номер / записывается в виде: i = ekek_x...ex, (3.34) i = ех + 2е2 + ... + 2k~xek , (3.35) ffj = exVJ 0 e2VJ 0 ... 0 ekV) , (3.36) где знак 0 обозначает поразрядное сложение по модулю 2 в двоичной системе исчисления. Как правило, в ЭВМ предусматривается специальная команда, выполняющая эту операцию. Последовательность координат направляющих точек Vj при каждом фиксированном j может быть вычислена по рекуррентным формулам путем решения уравнения [111]: Lkv; = rkv;. (3.37) Здесь Lk представляет собой моноциклический оператор порядка к, в котором суммирование заменено поразрядным сложением по модулю 2. Каждой строке "направляющих" точек соответствует свой оператор. Для первой строки это вырожденный оператор (к = 0). Для последующих строк значения к нетривиальны и не убывают с ростом j. Количество возможных операторов, соответствующих к, определяется выражением: »(2'-1) , (3.38) к где (р(х) есть теоретико-числовая функция Эйлера [88]. Начальные значения направляющих точек выбраны таким образом, чтобы обеспечить приемлемую равномерность распределения точек уже при небольших значениях п. Таким образом, указанный алгоритм не имеет ограничений ни по общему количеству генерируемых точек, ни по размерности интеграла. Однако на практике обычно бывает достаточно 210...220 точек, так как большее их число практически не встречается в реальных задачах статистического моделирования. Число размерностей следует ограничивать 50... 100, так как далее преимущества ЛПт-последовательностей из- за высоких значений констант в соотношении (5) теряются. Во многих практических задачах максимальное значение размерностей не превосходит 50. В [111] приведена полная таблица числителей направляющих 145
Глава 3 точек, позволяющая генерировать ЛПт-последовательности с размерностями до 51 и п до 220 -1 = 106. Следует отметить, что описанный алгоритм получения ЛПт- последовательностей предполагает использование достаточно трудоемкой операции поразрядного разложения номера точки в двоичной системе исчисления, а также многократное выполнение операции 0, что обусловливает громоздкую и относительно медленную его реализацию на ЭВМ. Однако имеется возможность упрощения и ускорения процесса генерации ЛПт-последовательностей. Основной предпосылкой при этом является тот факт, что точки Q- при вычислении интегралов требуется получать последовательно. То есть сначала необходимо рассчитать координаты первой точки , затем второй Q2 и т.д. Это позволяет существенно упростить вышеописанную процедуру. Утверждение. Пусть дана матрица направляющих точек V* ~ •••» Vm) • Тогда алгоритм рекуррентного получения точек ЛПХ - последовательности Q1 = (Ql,Q2,Qlm): &f = ffj-l®Wj, (3.39) Wf = V) 0 V) 0 ... 0 Vf , (3.40) где er = 0 первый справа отличный от единицы разряд в двоичном разложении номера итерации i = ekek_x...ex (i = ех + 2е2 + ... + 2к~хек ). эквивалентен алгоритму Соболя (3.36). При этом направляющие точки рассчитываются по формуле: Wj+m+l = Wsj 0 axWj+l 0 ... 0 amWj+m 0 2~mWSj 0 С , (3.41) где коэффициенты совпадают с аналогичными величинами в алгоритме Соболя, а дополнительный член С может быть рассчитан на основе начальных точек W}9 Wf,Wf+l: С = W) 0 Wj 0 ... 0 Wf 0 W™+x. (3.42) Данная теорема определяет простой рекуррентный алгоритм вычисления ЛПт-последовательностей. При этом должна быть использована таблица координат "направляющих" точек, получаемая из исход- 146
Оценка качества работы радиолокационной станции и ее подсистем ной поразрядным суммированием по модулю 2 всех предыдущих столбцов. Простота предложенной процедуры генерирования ЛПт-последо- вательностей позволяет осуществить ее эффективную реализацию на ЭВМ. Причем размер программы без учета таблицы направляющих точек не превышает размеров стандартных процедур генерирования псевдослучайных чисел, а скорость вычислений в 2...3 раза выше. Работоспособность и эффективность разработанного алгоритма можно подтвердить сравнительным анализом с классическим методом статистических испытаний. Количество испытаний 1 ООО 2000 ШГш ЛПх — псевдослучайный датчик Рис. 3.9. Ошибки оценки вероятности в зависимости от числа испытаний для классического метода Монте-Карло и при использовании ЛПт-последовательностей Такое сравнение было проведено на примере расчета одной из обсуждаемых в следующих разделах задач. В рассмотренном примере известно аналитическое значение для вероятности обнаружения, что позволяет провести точную оценку ошибок расчетов, проведенных по методу Монте-Карло. Полученные результаты представлены на рис. 3.9, где можно увидеть динамику изменения ошибок, рассчитанных на математической модели для этого случая. Здесь красным цветом изображена кривая, описывающая ошибки при использовании ЛПт- последовательностей по сравнению с точным аналитическим решением, а зеленым, соответственно, кривая изменения ошибок традиционной процедуры Монте-Карло, в зависимости от числа испытаний (реализаций случайного процесса). Для большей наглядности использован логарифмический масштаб. 147
Глава 3 Анализ результатов численного эксперимента показывает, что данный метод требует в 10... 160 раз меньшего числа реализаций, чем при использовании псевдослучайных чисел, причем выигрыш тем выше, чем более высокую точность оценок требуется получить. Таким образом, использование равномерно распределенных последовательностей может быть успешно использовано при проведении статистических испытаний в процессе моделирования. Использование разработанной эффективной машинной процедуры генерации равномерно распределенных последовательностей (ЛПт-последовательностей) позволяет проводить статистический анализ с быстродействием, на 1...2 порядка превышающим достигнутое при применении традиционных методов статистического анализа, причем выигрыш тем выше, чем более высокую точность оценок требуется получить. 148
ЧАСТЬ II Нейронные сети для различных этапов обработки радиолокационной информации Рассмотрены основные этапы обработки радиолокационной информации, проведен анализ их эффективности в различных внешних условиях и предложены нейросетевые архитектуры, способные исключить или существенно уменьшить снижение качества обработки в сложных условиях. Глава 4. Нейросетевые методы пространственной и спектральной фильтрации радиолокационных сигналов Глава посвящена методам селекции радиолокационной информации в пространственной, временной и спектральной областях. Предлагаются методы нейросетевого представления известных методов фильтрации и полученные на основе применения теории нейронных сетей алгоритмы адаптации линейных и нелинейных фильтров. 4.1. Обработка информации в фазированных антенных решетках Для успешной работы радиолокационных станций большое значение имеет формирование диаграммы направленности антенны (ДНА). Диаграмма направленности служит для направленного излучения и приема радиосигналов [115]. С ее помощью происходит пространственная селекция принимаемых и излучаемых сигналов. От качества ее формирования во многом зависит помехозащищенность станции, ее точностные характеристики. Если для зеркальных антенн вид ДНА определяется геометрическими параметрами антенного полотна, то для фазированных антенных решеток (ФАР) ДНА во многом зависит и от применяемой обработки. 149
Глава 4 В качестве наиболее важных характеристик ДНА обычно рассматривают уровень боковых лепестков, от которого зависит помехозащищенность РЛС, так как воздействие помех часто происходит со стороны боковых лепестков. Поэтому подавлению боковых лепестков в теории антенных решеток уделяется большое внимание. Особенности ФАР позволяют применять дополнительные методы, ведущие к дополнительному снижению боковых лепестков. Обычно выход каждого парциального канала ФАР домножается на некоторый коэффициент (в общем случае комплексный). С помощью надлежащего выбора вектора коэффициентов стараются добиться снижения уровня боковых лепестков [113]. 4.1.1. Традиционная обработка информации в фазированных антенных решетках. Формирование диаграммы направленности для фазированных антенных решеток заключается в когерентном суммировании излучения с выбранного направления приемными элементами, составляющими антенну. При этом часто одновременно осуществляется подавление помеховых направлений, формирование нулей на них [105]. Наиболее простым видом антенной решетки является линейная эквидистантная решетка. Сигнал на ее выходе y(t} представляется в виде суммы сигналов от отдельных ее элементов xt (/): Здесь N - число элементов решетки, а (р - фазовый сдвиг между элементами решетки, зависящий от угла прихода излучения в: где Я - длина волны, a d - расстояние между элементами решетки. Диаграмма направленности А(в) в плоскости, содержащей решетку, определяется выражением: N Она достигает максимума при в0 = 2 пк, когда все сигнальные векторы параллельны друг другу. Сумма сигналов от элементов решетки будет равна нулю при N (4.1) (4.2) (4.3) = arcsin (4.4) где L обозначает длину решетки L = (N -1)d . 150
Нейросетевые методы пространственной и спектральной фильтрации. Для плоской решетки ДНА представляется в виде произведения составляющих ее парциальных диаграмм по каждой из осей: Nx "у ^(^^) = ЕЕехР(Л^1)^)ехр(у(^-1)^)= = Ах(в, ф)Ау(9,ф). Как и в линейных решетках, в плоской антенной решетке можно управлять диаграммами направленности по каждой из осей, создавая соответствующие фазовые сдвиги сигналов для элементов в столбцах и строках. При практическом применении плоской антенной решетки обычно требуется, чтобы главные лучи пересекались. Для улучшения формы диаграммы направленности, уменьшения уровня боковых лепестков, подавления воздействующих помех, вместо тривиальных фазовых сдвигов может применяться весовое взвешивание сигналов от элементов решетки. В достаточно общем виде работы адаптивной антенной решетки можно описать следующей моделью: *х КУ /=1 k=\ где wik - комплексный множитель, который включает в себя фазовый сдвиг и весовой коэффициент. Оптимизация матрицы коэффициентов [wik] проводится в зависимости от выбранного критерия оптимальности. В качестве такового обычно выбираются минимум среднеквадратической ошибки, максимум отношения сигнал/шум, максимум функции правдоподобия, минимум дисперсии ошибки и др. Получаемые без взвешивания уровни боковых лепестков составляют около -14дБ, что никак не может устроить потребителей радиолокационной информации. Диаграмму направленности в одномерном случае можно записать в виде: Л(0) = |^ехр(./(/-1)р). (4.7) /=1 На рис. 4.1, 4.2 приведены диаграммы направленности эквидистантных решеток при использовании в качестве взвешивающих векторов функций Хэмминга и Хеннинга. Рассмотрена антенная решетка из 32 элементов. Из полученных графиков видно, что с помощью дополнительного взвешивания можно добиться резкого снижения уровня боковых лепестков при некотором увеличении ширины главного луча. 151
Глава 4 Рис. 4.1. Диаграмма направленности эквидистантных решеток для взвешивающих векторов функции Хэмминга Zi безе Рис. 4.2. Диаграмма направленности эквидистантных решеток для взвешивающих векторов функции Хеннинга Конкретный вид взвешивающей функции зависит от выбранного критерия оптимизации - минимума среднего квадрата боковых лепестков, минимума их максимального значения, скорости спадания их отно- 152
Нейросетевые методы пространственной и спектральной фильтрации.. сительных значений, ширины главного максимума. Однако все известные функции взвешивания синтезированы в расчете на эквидистантные решетки. При неравномерном расположении излучающих или приемных элементов антенны эффективность этих функций резко снижается (рис. 4.3). foimt ЩЩЩ 20- Ip" Вез» в окне V г К V Р^ммйнга 0- -20- -80 -60 -40 -20 0 20 40 €0 80 Угол, грзд ршсштаб ; : —1 [3 ±1^ ИбО □ J i | Рис. 4.3. Диаграмма направленности эквидистантных решеток для взвешивающих векторов при неравномерном расположении излучающих и приемных элементов Для получения оптимальных взвешивающих функций для каждого конкретного расположения элементов антенн можно, конечно, использовать традиционный статистический аппарат [83], но он слишком трудоемок и при больших размерностях решаемых задач дает неустойчивые решения из-за плохой обусловленности. Поэтому для многих практически важных задач разработаны специальные методы синтеза весовых векторов, которые позволяют достичь требуемых уровней боковых лепестков. Но в некоторых практически важных случаях этого оказывается недостаточно. Часто необходимо обеспечить выполнение дополнительных ограничений на весовой вектор, использовать нестандартные критерии оптимальности. В принципе возможно построение теоретического аппарата для каждого из указанных случаев и рассмотрение оптимальных решений этих задач. Однако практическое воплощение этого подхода часто наталкивается на непреодолимые математические трудности. Да и полученное решение может оказаться излишне громоздким. В качестве альтернативы традиционной парадигме представляется полезным рассмотреть методы оптимизации антенных решеток с помо- 153
Глава 4 щью нейронных сетей [120; 125]. Известно много примеров решения с их помощью сложных вычислительных задач. Работа ФАР может быть описана следующим образом. Имеется п излучателей, каждый из которых одновременно является приемником (рис. 4.4). В режиме приема поступающая под углом ср плоская волна принимается каждым каналом с относительной фазовой задержкой Аср, которая рассчитывается согласно соотношению: А(р = 2лх1ьт(0) (4.8) Рис. 4.4. Структурная схема работы ФАР Поэтому уровень иш сигнала в / -м канале при приеме с направления под углом в будет иметь вид: ию = А ехр l7td(i-\) Л sm(0) (4.9) где А - комплексная амплитуда принимаемого сигнала, a j = V-L. Принятые каждым каналом комплексные сигналы складываются и поступают на выход ФАР. Для снижения уровня боковых лепестков сигналы с каждого канала умножаются на компоненты весового вектора 154
Нейросетевые методы пространственной и спектральной фильтрации.. Wj. Выходной сигнал ФАР для угла приема в в этом случае можно записать в следующем виде: j \ Цт{в) i=l /=1 (4.10) Так как при анализе ФАР обычно интересуются относительными значениями амплитуд сигналов, принимаемых с различных угловых направлений, константа А может быть принята за единицу. Выбор весового вектора и>-, z = l,w проводится таким образом, чтобы обеспечить удовлетворение заданного критерия качества по сформированной ДНА. Обычно интересуются относительным уровнем боковых лепестков в некоторой области 0 . ив ЙаЛ > min> (411) U0 = const. В качестве функции качества рассматривается некоторая функция от множества значений Uв (обычно средний квадрат, но может быть и любая другая). 4.1.2. Представление функционирования фазированной антенной решетки в нейросетевом базисе. Анализ работы ФАР показывает ее структурную близость с нейронными сетями [125; 123], т.е. можно построить нейросетевую архитектуру, работа которой полностью совпадает с функционированием антенной решетки. Рассмотрим нейронную сеть, состоящую из трех слоев с линейными функциями активации (рис. 4.5). Выходной слой Промежуточный слой Первый (входной)слой Рис. 4.5. Структурная схема нейронной сети, имитирующей работу ФАР Первый, входной, слой состоит из п (число элементов ФАР) элементов, на вход которых поступают одинаковые сигналы величины А . Так как функционирование ФАР не зависит от абсолютной величины 155
Глава 4 поступающих сигналов, в качестве входных можно взять единичные сигналы (А = \). В этом слое, так же как и в остальных, нейроны, формирующие смещение, отсутствуют. Промежуточный слой состоит из такого же число нейронов. В отличие от традиционных архитектур, в которых предусматривается полный набор связей входного слоя с промежуточным, в рассматриваемом варианте реализуются только взаимосвязи между соответствующими элементами слоев. Величина каждой связи равна значению весового вектора, от которого зависит сформированная ДНА. Выходной слой, как и в традиционной архитектуре, связан с промежуточным полным набором связей. При этом число нейронов в выходном слое равно числу интересующих значений угловых отклонений. Численные значения весов w]j равны фазовым множителям, зависящим от расположения элементов ФАР, и определяются аналогично (4.9): wlik=Aexp J—т-1^) (4.12) Здесь верхний индекс 1 показывает, что веса относятся к первому слою, а 9к являются выбранными для анализа угловыми направлениями. Таким образом, на промежуточном слое возбуждение нейронов равно и\ =u(j>wi = Awi . (4.13) Функция активации нейронов предполагается линейной. Поэтому сигналы промежуточного слоя поступают на третий слой. При этом осуществляется преобразование в соответствии с весами (4.12). Результат для каждого углового направления примет вид: Л Л ( 2nd{i-\) /ЛЧ Ue=2jUiOWi=2jAQXP J 2 Sm\0) (4.14) Полученный результат полностью совпадает с выражением (4.10), описывающим работу ФАР. Построенная нейронная сеть, хотя и отличается от традиционной архитектуры, но вполне укладывается в известную парадигму многослойного персептрона. Следует отметить, что обычно не рассматривают многослойные персептроны с линейной функцией активации. Это связано с тем, что в случае линейных преобразований такая архитектура является избыточной, т.е. всегда можно указать сеть, состоящую из двух слоев, полностью эквивалентную исходной [323]. Однако рассмотренная архитектура не является результатом синтеза для решения опреде- 156
Нейросетевые методы пространственной и спектральной фильтрации.. ленной задачи. Она описывает физическую природу рассматриваемых явлений - процессов приема электромагнитных волн ФАР. Поэтому эта архитектура правомерна, тем более что переход от промежуточного слоя к выходному реализуется не аппаратно или программно, а физически, в виде пространственного сложения волн, и веса связей при этом изменены быть не могут. После представления работы ФАР в виде нейронной сети можно применить весь богатый арсенал методов обучения нейронных сетей для получения оптимальных значений весового вектора [24; 140; 141]. При этом могут быть использованы любые показатели качества и учитываться дополнительные ограничения. Наибольшей известностью среди методов обучения нейронных сетей пользуется метод «обратного распространения ошибки» (backpropagation) [319]. Суть его сводится к последовательному применению принципа суперпозиции для всех слоев сети, начиная с последнего, для расчета градиента целевой функции. Изменения весов в стандартном методе рассчитываются согласно формуле: А*%=аиГбГ1, (4.15) где S™+1 - значение ошибки на к -м нейроне т +1 слоя, а а - коэффициент пропорциональности, от которого зависит скорость сходимости и устойчивость работы сети. Значения ошибок для последнего слоя рассчитывается на основе производной целевой функции. В случае фазированной антенной решетки используются не действительные, как в традиционном многослойном персептроне, а комплексные переменные. Напомним, что комплексные переменные представляются в виде действительной и мнимой части и могут быть представлены в виде: a = aRe + i-aIm i = V-f. Комплексные числа обладают следующими свойствами: a±b = (aRe±bRe) + \'(aIm±bIm), axb = (aRe-bRe-aIm-bIm) + i-(aRe-bIm+bRe'aIm). Для использования комплексных чисел при прямом функционировании сети этого достаточно, так как в рассмотренной нейросетевой модели используются лишь операции сложения и умножения. Для расчета градиента необходимо, помимо операций сложения и умножения, уметь рассчитывать частные производные по комплексным переменным. Для этого достаточно рассмотреть отдельно производные 157
Глава 4 по действительной и мнимой части аргумента. Общей частью встречающихся выражений является произведения. Имеем: д(°»ь)яе _<?(aRe bRe-alm blm) Я" Re d{axb)Re _ d{aRe ■ bRe - alm blm) _d{aRe blm+alm ■bRe) #аЯе da Re _ d(aRe ■bIm+aIm ■ЬКе) да1т = bRe> = -blm > = bIm ' -bRe. Теперь можно повторить проведенные выше рассуждения для стандартного метода обратного распространения ошибки с учетом того, что используемые величины - комплексные. Отметим, что, так как квадрат ошибки для комплексных чисел рассчитывается как квадрат модуля комплексного числа, то dSSE _ dSSE * ~ eRe 0 ~ е1т ' daRe да1т В случае среднеквадратической функции потерь: gSSE _ ^желаемый _ ^полученный ^ 16) Для стандартных архитектур используется также производная функции активации, но в рассматриваемом случае преобразования сигналов в нейронах линейны, и дополнительные множители можно опустить. Для остальных слоев ошибки рассчитываются в виде: ^=2>ГЧ+1- (4Л?) J Оптимизация предложенной нейросетевой модели ФАР может быть реализована в соответствии с указанными выражениями. При этом расчеты сильно упрощаются за счет того, что большинство весов не подлежат изменению, и свободных параметров остается только п. Однако следует учитывать, что выражения (4.15)—(4.17) описывают операции над полем действительных чисел, в то время как в модели (4.10) и (4.12) применяются комплексные переменные. Поэтому выражения для расчета градиента следует уточнить для этого случая. При прямом распространении затруднений не возникает. Просто при умножении используются стандартные методы умножения ком- 158
Нейросетевые методы пространственной и спектральной фильтрации.. плексных чисел [282]. В то же время расчет градиента должен проводиться несколько иначе. Выражение (4.16) заменяется на: где под w понимается комплексное сопряжение. Так как желаемым выходом ФАР для боковых лепестков являются дественно равная нулю. Реализация указанного алгоритма позволяет достичь желаемого уровня боковых лепестков ДНА ФАР в исследуемой области. Однако скорость сходимости существенно зависит от используемого параметра а. Правильным его выбором можно добиться улучшения скорости сходимости на 1-2 порядка [262; 263]. Это особенно важно для случаев работы в реальном масштабе времени. В большинстве известных случаев полезным является изменение параметра оптимизации в ходе обучения. Известно много способов выбора этого параметра. Наиболее удачными являются два из них. Первый - это RPROP [310], в котором вместо выбора шага изменения веса, пропорциональным значению градиента, рассчитывается только направление, а величина шага устанавливается постоянной и в случае успеха увеличивается по геометрической прогрессии, а в случае ухудшения целевой функции уменьшается. В модели использован упрощенный вариант данного метода, заключающийся в постоянном уменьшении величины шага в ходе обучения на коэффициент, близкий к единице. Многочисленные пробы показали удовлетворительную скорость сходимости такого подхода. Интересным вариантом является оптимизация величины изменения веса на каждом шаге. При этом для каждого рассчитанного направления оптимизации строится квадратичная аппроксимация целевой функции. На основе этой аппроксимации рассчитывается значение, на котором обеспечивается минимум. Несмотря на некоторое увеличение объема расчетов на каждом шаге, связанное с необходимостью построения квадратичной функции, при использовании данного метода процесс обучения значительно ускоряется, особенно на начальных стадиях. В некоторых случаях, особенно при внутренней оптимизации на каждом шаге, полезным является метод, близкий по используемым идеям к методу сопряженных направлений. Так как на каждом шаге достигается близкое к наилучшему значение весового вектора в исследуемом направлении, дальнейшее движение в ту же сторону нецелесообразно. Поэтому следует рассматривать на следующем шаге только проекцию в направлении, ортогональном к уже использованному. (4.18) j нулевые значения, в качестве ик желаемый рассматривается константа, тож- 159
Глава 4 Все эти методы ускорения сходимости реализованы в разработанной модели нейросетевой оптимизации боковых лепестков ДНА ФАР. Учитывая тот факт, что даже самые лучшие методы автоматического выбора весов не всегда приводят к достаточно быстрому достижению успеха, предусмотрена возможность интерактивного изменения параметров оптимизации по желанию исследователя, включения или отключения режимов внутренней оптимизации и ортогонализации изменений весов в ходе обучения. Модель позволяет отображать текущую ДНА на графике в обычном и логарифмическом масштабе, записывать текущие значения весов в текстовый файл, считывать ранее рассчитанные значения. Выбор местоположения интересующих пользователя областей углов ДНА осуществляется с помощью «мыши» и также отображается цветом на графике. На каждом шаге проводится вывод значений целевой функции, максимального значения боковых лепестков и конкретного углового направления, в котором этот максимум достигается. Помимо широко распространенной квадратичной целевой функции (функции потерь) возможно использование других вариантов, например полиномиальной функции, которая при увеличении степени полинома стремится к функции максимума. При относительно небольших значениях степени получается промежуточный вариант между этими двумя широко используемыми показателями качества. 4.1.3. Анализ результатов нейросетевой адаптации фазированных антенных решеток. Наибольший интерес представляет возможность оптимизации весового вектора в нестандартных условиях. Рассмотрим возможность работы ФАР с весовым вектором, который реализует только фазовый сдвиг. Необходимость этого вытекает из того факта, что техническая реализация такой обработки наиболее проста. Все вышеприведенные выкладки в этом случае остаются справедливыми. Только добавляется ограничение на весовые коэффициенты: (w,)2=^w, =1. (4.19) Процесс обучения нейронной сети при этом использует вышеуказанные методы. Только добавляется дополнительная операция. На каждом шаге проводится нормировка весового вектора с целью удовлетворения им ограничению (4.19). Проведенные численные эксперименты показали, что, несмотря на весьма сильное сужение области изменения весовых коэффициентов, путем обучения нейронной сети удается построить весьма эффективную обработку для ФАР. Был проведен цикл расчетов для 32-элементной решетки, с расстоянием между приемными каналами А/2 . На рис. 4.6. изображен вариант результата работы модели в логарифмическом масштабе при оптимизации уровня боковых лепестков в 160
Нейросетевые методы пространственной и спектральной фильтрации.. диапазоне углов по абсолютной величине от 11 до 22 , что составляет 3 боковых лепестка, начиная с третьего, невзвешенной ДНА, по обе стороны от главного луча. Максимальный уровень боковых лепестков в этом случае составляет -23 дБ по абсолютной величине или относительно главного луча около -50 дБ. При рассмотрении боковых лепестков только с одной стороны от главного луча удается достичь еще более высокого качества подавления боковых лепестков -40 дБ по абсолютной величине или относительно главного луча -75 дБ (рис. 4.7). В то же время при оптимизации боковых лепестков во всей области вне главного луча ДНА столь впечатляющих результатов достигнуть не удалось. Наилучшими полученными значениями были -10 дБ по абсолютной величине или относительно главного луча -35 дБ (рис. 4.8). Новая решетка | Расчет | Длина волны Размер решетки Ш^:^^гм^гТ^^,^^. -gig " .1 Рис. 4.6. Работа модели при оптимизации уровня боковых лепестков Рис. 4.7. Более высокое качество подавления боковых лепестков 6—5782 161
Глава 4 it расчет дна ff? без взвешивания р 1 ахэмминга а 5.12е-2 9.82е-2 21.9 гт и Г - г|0001 |ооооа|о.99 и105 -й цигуЛ j jft Масштаб Г" Обычный Логарифм г расчет | длина волны ПЛ. Рис. 4.8. Наилучшие значения подавления Тем не менее, даже в этом случае уровень боковых лепестков примерно соответствует уровню, достигаемому с помощью традиционного окна взвешивания Хэмминга при использовании действительных множителей. Анализ работы двухмерных решеток [123; 128] показал, что с использованием нейросетевых методов удается получить примерно такой же выигрыш. 4.1.4. Методы нейросетевой адаптации фазированных антенных решеток при ограничениях на весовые коэффициенты. В качестве дополнительных ограничений на весовой вектор часто выступает его дискретность. В связи с необходимостью максимально простой технической реализации в качестве фазового сдвига могут рассматриваться только дискретные значения ^к/^, где N = 2... 4. Поиск оптимальных фазовых сдвигов в этих условиях является исключительно сложной и трудоемкой задачей целочисленного программирования. Для получения субоптимальных значений весов предлагается в качестве начального приближения использовать синтезированный с помощью нейронной сети вектор недискретных фазовых множителей. На следующем этапе для каждого значения веса устанавливается область «притяжения», составляющая 3...5% от необходимого уровня дискретизации (рис. 4.9). Обучение нейронной сети продолжается и при попадании какого-нибудь весового значения в заданную область «притяжения» ему принудительно приписывается ближайшее дискретное значение и в дальнейшем не изменяется [128; 336]. В процессе обучения все большее число весовых векторов принимают заданные дискретные значения. Обучение заканчивается, когда ни 162
Нейросетевые методы пространственной и спектральной фильтрации.. один из весов больше не приближается к заданным дискретным уровням. Почти всегда при этом не дискретными остаются не более _^ =10... 12 . Рис. 4.9. Величины областей «притяжения» для каждого значения веса вектора нейронной сети Далее можно было бы по этим оставшимся весам провести округление до ближайших к ним дискретных значений. Однако более эффективным в большинстве случаев оказывается полный перебор бинарных решений по округлению этих весов вверх или вниз. Объем этого перебора невелик (2N"~*) и время, затрачиваемое на него намного меньше времени обучения нейросети. Полученные с помощью предложенного метода оптимизации дискретные фазовые сдвиги позволяют получить относительный уровень боковых лепестков -35...-40 дБ, что на 10... 15 дБ лучше значений полученных другими методами. На рис. 4.10 приведен вариант диаграммы, полученной в результате расчетов. Рис. 4.10. Вариант диаграммы оптимизации 163
Глава 4 Следует отметить, что, так как отобразить трехмерный вид сложно, в данной модели принято отображать проекцию диаграммы на картинную плоскость. Причем, в качестве отображаемых значений выбираются максимальные величины на прямой перпендикулярной плоскости проецирования. Для того, чтобы получить представление рассчитанных результатов, удобное для наглядного изучения и последующего анализа создан инструментарий для экспорта результатов расчетов в электронную таблицу Excel. На рис. 4.11 изображен один из вариантов двухмерного графика, построенного с помощью электронной таблицы после экспорта с использованием разработанного инструментария. Рис. 4.11. Двухмерный график фазы Интересно отметить, что часто предложенный процесс оптимизации часто приводит к решению, в котором из 32-х значений фазовых множителей только 2...3 остаются недискретными при сохранении практически такого же низкого уровня боковых лепестков, как и в полностью непрерывном случае. Это позволяет предложить использование в дополнение к дешевым дискретным фазовращателям небольшого числа (2-3) элементов повышенной разрядности и точности, что обеспечит значительно более низкие уровни боковых лепестков. На рис. 4.12 показана типичная динамика изменения числа дискретизированных весов в ходе итераций одновременно с уровнем достигаемых при этом боковых лепестков. Таким образом, проведенные исследования показали перспективность использования нейросетевой технологии для синтеза обработки сигналов в ФАР. Предложенные нейросетевые методов оптимизации диаграммы направленности совместно с традиционными методами по- 164
Нейросетевые методы пространственной и спектральной фильтрации.. зволят значительно (до 10.. 15 дБ) снизить уровней боковых лепестков, а, следовательно, повысить помехозащищенность локаторов. -25 0 5 10 15 20 25 30 Количество дискретизированных весов Рис. 4.12. Динамика дискретизированных весов В качестве направлений дальнейших исследований можно указать следующие: разработка методов улучшения сходимости процессов обучения нейронной сети; реконфигурация системы объединения приемных и передающих каналов при выходе из строя части элементов ФАР; рассмотрение нелинейных вариантов обработки сигналов в ФАР, в наиболее полной мере реализующие нейросетевые принципы. 4.2. Анализ нейросетевых методов спектральной обработки Спектральная обработка радиолокационной информации предназначена для согласованного приема радиолокационных импульсов, отраженных от воздушных целей, подавления активных и пассивных помех, улучшения отношения сигнал/шум [69; 114; 132]. Она содержит в себе очень широкий комплекс проблем [62; 70; 105; 115; 151]. Столь же широкими могут быть возможности использования нейронных сетей в этом виде обработки. Прежде всего, следует указать, что методы синтеза антенных решеток напрямую применимы для спектральной обработки, так как здесь также используются функции взвешивания (в том числе и комплексные) и их адаптация к переменным внешним условиям. 4.2.1. Традиционные методы спектральной обработки. Рассмотрим регулярные импульсные сигналы с фиксированной частотой повторения. 165
Глава 4 Пусть задана временная последовательность импульсов х,,дс2, (вектор х, хеС^). Каждый элемент вектора х является комплексным числом и описывается двухмерным нормальным распределением N^,cr2j с математическими ожиданиями sk slk для действительных и мнимых компонент соответственно, образующими вектор s е CN , и дисперсией <т2. Необходимо построить отображение Ах => у , у е R у = Ах , (4.20) такое, что для заданного множества Z векторов с (ZcC#), компоненты которого описываются соотношением: ck=sexp(jftk)9 (4.21) где j = уРа , s > s0 амплитуда принимаемого сигнала, tk - заданный временной промежуток между последовательными импульсами, fx< f < f2 доплеровский сдвиг несущей частоты сигнала в заданном диапазоне, определяемом заданными скоростями движения обнаруживаемых целей, достигается максимум у = Ас —> шах . Одновременно должны обеспечиваться ограничения для множества U векторов u (UcC^ ), описываемого соотношением: uk=sexp(jftk), (4.22) где / < /рог; у < У'. Традиционно эта задача решается с помощью фильтров, основанных чаще всего на быстром преобразовании Фурье (БПФ), т.е. проводится БПФ входной последовательности с получением спектрального образа у . Затем из полученного вектора спектральных составляющих исключаются низшие гармоники с / < /рог, после чего из составляющих вектора у выбирается максимальный по абсолютной величине. Для улучшения выходного отношения сигнал/помеха применяется различного рода взвешивание (окна Хемминга, Хеннинга, Чебышева и др.) [65; 76; 103; 134]. При работе в шумах с неизвестными статистическими свойствами широко применяется адаптивная фильтрация [107; 134]. Использование процедур адаптации к внешним условиям позволяет добиться более высокого качества фильтрации. Задача расчета адаптивных фильтров является исключительно сложной в вычислительном отношении, так как необходимо в реальном времени осуществлять и обращать корреляционные матрицы значительной размерности. Да и сам процесс фильтрации 166
Нейросетевые методы пространственной и спектральной фильтрации. для достаточно длинных сигналов требует большого объема расчетов. Поэтому реализация современных методов первичной обработки может оказаться невыполнимой для традиционных вычислительных средств [44; 152]. 4.2.2. Нейросетевое представление нелинейных методов спектральной обработки. Для повышения вычислительной производительности можно использовать способность нейронных сетей параллельно обрабатывать информацию. Стандартные методы фильтрации без излишней сложности представляются в виде нейросетевых моделей [53; 142; 147; 204], и для них могут использоваться аппаратные средства поддержки нейросетевых вычислений [20; 50]. Так стандартный фильтр есть просто однослойная нейронная сеть с линейной функцией активации и фиксированными коэффициентами [366] или иерархическая нейронная сеть на ПЛИС [147], преобразование Фурье или более редко встречающиеся преобразования Хаара и Уолша [44] также представляются в виде сети прямого распространения [53], а адаптивные фильтры, предложенные группой Уидроу [134; 355; 356], традиционно считаются одними из первых нейросетевых моделей [357]. При реализации цифровых фильтров могут быть использованы и другие нейросетевые модели, например, клеточные сети [142] или сети Кохонена [204]. Поэтому нейроускорители могут широко применяться в технике цифровой обработки сигналов [50; ПО]. Более того, часто специализированные нейросетевые аппаратные средства разрабатывают в расчете на возможность проведения с их помощью процедур спектральной обработки [148] и демонстрируют их производительность на задачах фильтрации [137]. Помимо этого нейронные сети могут быть использованы для более быстрого проведения матричных вычислений при обращении ковариационных матриц шумов. Так в [25] рассмотрена нейросетевая модель вычисления обратной матрицы, а в [31] приведен алгоритм расчета собственных векторов и собственных чисел матриц с помощью нейронных сетей. Известны и другие варианты организации вычислений обратной матрицы с помощью нейронных сетей, которые позволяют обеспечить проведение расчетов в реальном масштабе времени. Вычисление обратной матрицы можно рассматривать как задачу оптимизации. В работе [238] сконструирована электронная полносвязная сеть, основанная на принципах работы сети Хопфилда, предназначенная для обращения матриц и способная также решать системы линейных уравнений. Отличительной особенностью такого метода вычислений является связанная с параллельностью обработки высокая скорость вычислений и робастность к изменениям параметров устройства. 167
Глава 4 Для обращения матриц, особенно высоких размерностей, оказывается более эффективно использовать нетрадиционные методы, построенные на методах Монте-Карло [209], в которых решение системы линейных уравнений ищется как вероятности состояний соответствующим образом подобранной Марковской цепи. В [171] предложено использовать нейросетевую модель обучения с подкреплением на основе динамического программирования для реализации этих методов. Несмотря на то, что методы обучения с подкреплением обычно считаются медленными, их асимптотическая эффективность выше, чем у традиционных методов. Поэтому их использование для матриц больших размерностей является предпочтительным. При цифровой обработке сигналов одной из наиболее часто используемых вычислительно сложных задач является операция свертки. Причем зачастую не так важна точность вычислений, как их скорость, так как результаты расчетов должны быть получены в реальном масштабе времени. Предложено [328] аппроксимировать обрабатываемые сигналы с помощью полиномов малых степеней и использовать полученные приближения в нейросетевых вычислениях [264]. Для факторизации матриц, необходимой при разделении разнородных данных могут быть также использованы нейронные сети [265], в которых при адаптации весов используется изменяемый параметр обучения. В [254; 275] предложен алгоритм, позволяющий за полиномиальное время находить коэффициенты Фурье, выше заданного порога. Таким образом, возможности использования нейросетевой технологии для ускорения трудоемких вычислений оказываются очень широкими. Но этим не исчерпываются все ее преимущества. Линейная фильтрация, традиционно используемая при первичной обработке, не всегда способна обеспечить требуемый уровень подавления мешающих сигналов. Ее возможностей часто не хватает. В случаях, когда существуют ограничения на параметры обработки, при воздействии помех нестационарного характера и с негауссовским распределением, линейная фильтрация оказывается недостаточной. Необходимо переходить к нелинейным методам, которые могут быть описаны с помощью нейросетевых моделей [68]. Известно, что в случаях присутствия импульсных или существенно негауссовых шумов перед согласованной фильтрацией необходимо провести нелинейную предобработку. В работах [300; 333] предложено использовать многослойный пер- септрон для обучения требуемым нелинейным преобразованиям. Более подробно, при финансовой поддержке DARPA, этот вопрос был исследован одним из пионеров теории нейронных сетей, американским ученым Липманом [270]. Проведенные эксперименты показали, 168
Нейросетевые методы пространственной и спектральной фильтрации... что нейронная сеть типа многослойного персептрона с одним входом и выходом, содержащая два скрытых слоя с 20-ю и 5-ю нейронами, соответственно, способна обучиться требуемому преобразованию менее чем на 5000 примерах. После обучения нейронная сеть формирует нелинейность в виде ограничения, что похоже на ранее использовавшиеся эвристические методы борьбы с импульсными помехами. Однако при рассмотренном подходе такой вид обработки появляется не как результат произвольного выбора разработчика, а вследствие адаптации к воздействующим помехам. В [236] предложен алгоритм подавления шума, основанный на представлении данных в виде разреженных векторов. Показано, каким образом следует выбирать нелинейное представление данных для наилучшего подавления шумов. Алгоритм имеет сходство с проведением вейвлет-преобразования, но в отличие от последнего, способен автоматически рассчитывать параметры представления и сжатия сигналов на основе исходных данных. При этом, в отличие от традиционной фильтрации, обеспечивается подавление шума без краевых эффектов на границе между изменениями интенсивности сигнала. Традиционная техника спектральной обработки ориентирована на оценку первых двух моментов статистических случайных величин, которые полностью описывают гауссовские случайные процессы. Для работы с этими параметрами достаточно использовать только линейные преобразования, как это делается в традиционных статистических методах. В то же время, известно, что нестационарные и негауссовские процессы должны для полного описания использовать и моменты высших порядков, для чего необходимы нелинейные методы обработки [302]. Известны и сложные нейросетевые архитектуры первичной обработки, основанные на более полной имитации нервных систем животных. В [339] предложена система подавления шума, построенная на основе аналогий с нейрофизиологическими данными о восприятии акустических сигналов. Сначала проводится построение амплитудных спектрограмм, на которых отображаются временные и частотные характеристики сигналов в виде локальных оценок отношения сигнал/шум в различных частотных каналах. Эти спектрограммы имитируют представление акустической информации в нервной системе животных. Для анализа типовых образов используется нейронная сеть, которая объединяет информацию с разных каналов в соответствии с их отношением сигнал/шум. Проведенное сравнение с традиционными методами выделения спектральных составляющих показало, что биологическая модель способна значительно лучше подавлять шумы без ухудшения сигнальных характеристик и обеспечивать лучшее распознавание типовых звуков. Ниже рассмотрен более простой вариант реализации нелинейности с помощью нейронных сетей, обеспечивающий повышение эффектив- 169
Глава 4 ности подавления помех там, где традиционные подходы не справляются с этой задачей. 4.2.3. Особенности оценки качества спектральной обработки при нелинейном характере алгоритмов. Известно, что стандартные методы фильтрации работают достаточно успешно при удачных соотношениях между временными и частотными характеристиками сигналов и обнаруживаемых целей, т.е., когда с одной стороны, диапазон допле- ровских частот [/j,/2] находится внутри интервала (0, 1//) для исключения «слепых» скоростей, а с другой, граница нижних исключаемых / частот, по крайней мере, в 2...3 раза больше предельной частоты Найквиста l/NT (NT - общая длительность сигнала). Если же эти условия не выполняются, обычными методами добиться эффективной фильтрации не удается. Если выбрать частоту повторения достаточной для однозначного определения дальности, то разрешение по доплеровской скорости будет недостаточным для подавления пассивных помех. Вид функции неопределенности для таких сигналов показан на рис. 4.13. При выборе сигналов с высокими частотами повторения, наоборот, имеет место хорошее разрешение по доплеровской скорости и, следовательно, уверенное подавление пассивных помех, но нет однозначного разрешения по дальности (рис. 4.14). ООООООООООООООООООО СОООООооооооооооООО о о о о о о оооооооо дальность Рис. 4.13. Вид функции неопределенности для сигналов с однозначным определением дальности дальность Рис. 4.14. Вид функции неопределенности для сигналов с однозначным определением скорости (доплеровской частоты) Предлагается объединить преимущества этих двух видов сигналов. РЛС использует оба типа сигнала, а на выходе применяется мультипликативная обработка. Выходы фильтров обоих каналов обработки по каждому из сигналов поступают на схему «И». Результат такой обработки приведен на рис. 4.15. 170
Нейросетевые методы пространственной и спектральной фильтрации.. А ° <^ ° *А < о о о о X. ° X, ° \^ о >Д о 000#0оооофооооо»000* ооо ооо o00«00000«00000»000i -J ! dx !_ дальность Рис. 4.15. Вид функции неопределенности после логической обработки Оказывается такую обработку можно описать с помощью формализма нейронных сетей. Сеть имеет два раздельных входных канала по каждому из вариантов сигнала. Число входов каналов совпадает с количеством импульсов пачке соответствующего сигнала. Первый слой сети состоит из двух нейронов. Первый нейрон осуществляет фильтрацию импульсного сигнала, а второй - обрабатывает квазинепрерывный сигнал. Функция активации для обоих сигналов - пороговая. Выходы обоих нейронов поступают на выходной нейрон, который активируется, только если возбуждение поступило от обоих каналов. При относительно небольшом числе некомпенсированных остатков от пассивных помех для импульсного сигнала и небольшом количестве целей этот метод позволяет успешно фильтровать помехи без пропуска целей. Однако в сложных условиях этого оказывается недостаточно. Необходимо исключить случаи взаимного наложения эхо- сигналов от целей и помех в различных дальностных стробах. Для этого можно применять не два типа сигналов, а несколько с различными частотами повторения. Правда, при нескольких сигналах возникает задача такого выбора частот, чтобы число ложных совпадений было минимальным или эти совпадения вообще отсутствовали. Параметры, по которым следует осуществлять поиск, являются целочисленными, число их велико и они изменяются в достаточно широких пределах. Большинство методов дискретной оптимизации требуют проведения в той или иной степени полного перебора всего пространства возможных решений, в результате чего необходимые компьютерные ресурсы растут экспоненциально с размерностью задачи. Поэтому для достаточно больших задач, а в области дискретной оптимизации задача 171
Глава 4 становится невычислимой уже при размерностях 10...30, применяют различные эвристические приемы. Нейронные сети как раз и являются некоторой эвристикой. Вместо проведения полного перебора сеть на основе проводимой ею интерполяции направляет изменение параметров к приемлемому хорошему решению. Для проведения численной оптимизации дискретных функций Хопфилдом было предложено использовать введенный им математический формализм описания ассоциативной памяти [230]. Построим целевую функцию для использования этого метода. Обозначим сигнальный вектор в i -м канале, состоящий из нулей и единиц с частотой vt, через vi. Будем его рассматривать в следующем виде. Длина вектора для всех частот одинакова и равна длине импульсного сигнала с однозначной частотой повторения. Так как сигнал периодический с частотой v,, единицы будут находиться на местах, соответствующих периоду повторения vt. Принятые в этом канале эхо- сигналы будут также периодически повторяться с возможным взаимным наложением друг на друга. Необходимо выбрать такой набор частот vi, чтобы число ложных совпадений импульсов различных каналов было наименьшим. Помимо ложных присутствуют и истинные совпадения, которые описывают положение целей, их число остается неизменным, независимо от выбора частот квазинепрерывных каналов. Поэтому можно минимизировать общее число совпадений между каналами. В случае двух сигналов общее количество совпадающих единиц в них есть расстояние Хемминга между векторами. При большем числе векторов можно вести обобщенное расстояние Хэмминга d(sil9 si2, sn) 9 равное числу количеству ненулевых элементов в пересечении d(sn, si2, sn). где zl, /2, ik множество отраженных сигналов от целей и помех. Следуя методу целочисленной оптимизации на сетях Хопфилда, новое значение частоты повторения vit0 принимается, если оно обеспечивает улучшение целевой функции: После нескольких итераций решение должно сойтись к минимуму. Однако в данном случае, как и во многих других практических задачах целочисленной оптимизации, минимум может оказаться локальным. 172 (4.23) d(vn,vi29...9vu09...9 )<d(vi]9vi29...9vit9...9
Нейросетевые методы пространственной и спектральной фильтрации... где к - масштабный коэффициент. Таким образом, в ход оптимизации включается элемент хаотической случайности, позволяющей избегать локальных экстремумов. На каждом шаге рассчитывается величина энергии Et. Если изменение параметров модели привело к ее уменьшению, новые параметры выбираются безусловно, если же энергия увеличилась, с вероятностью 1 - р происходит возврат к старым значениям. Зависимость вероятности от различий в энергии (целевой функции) определяется параметром Т - «температурой», уменьшающейся с ростом номера итераций. Процесс напоминает явление отжига стали, при котором температура металла постепенно уменьшается, его атомы двигаются все менее хаотически и принимают наиболее энергетически выгодное положение. Процесс имитации отжига широко используется в нейросетевых приложениях для получения глобальных оптимумов и решения задач дискретной оптимизации. Он позволяет избегать локальных экстремумов в многомодовых целевых функциях. Численные эксперименты, показали, что с помощью этого метода удается практически во всех случаях добиться полного исключения ложных совпадений. На рис. 4.16 показан результат работы РЛС, использующей 4 квазинепрерывных сигнала со случайными частотами повторения. На рисунке видно значительное число ложных совпадений. После проведения вышеописанной оптимизации ложные совпадения исчезли (рис. 4.17), что свидетельствует об эффективности рассмотренной процедуры. (4.24) 173 При изменении частот квазинепрерывных сигналов на каждом цикле может случиться, что улучшения не происходит. Вряд ли можно ожидать, что оптимальные значения параметров возможно получить путем непрерывной последовательности шагов, строго улучшающих целевую функцию. Для того чтобы достичь оптимума, или, по крайней мере, хороших решений используют метод «отжига». Он заключается в том, что изменения параметров могут быть приняты даже в том случае, если они не улучшают целевую функцию. Отклонение неудовлетворительных решений происходит с вероятностью, зависящей от отклонения целевой функции от уже достигнутой величины, и уменьшающейся в ходе итераций. Если достигнутое на данный момент времени наилучшее значение целевой функции равно Е0, а полученное на текущем шаге - , то вероятность р выбора нового набора параметров определяется выражением:
Глава 4 Рис. 4.16. Ложные совпадения при случайном выборе частот повторения Рис. 4.17. Нейросетевая оптимизация частот повторения Некоторый аналог подобной системы предложен в 1997 г. известным итальянским специалистом в области радиолокации Фариной [205]. Им рассмотрен вариант приемника одновременно формирующего несколько приемных спектральных фильтров, выходы которых поступают на схему «И». Такая совместная обработка несколькими фильтрами позволяет добиться значительного снижения уровня боковых лепестков автокорреляционной функции. Выбор приемных фильтров осуществляется на основе общих соображений и предпочтений исследователя, что не всегда позволяет добиться наилучших результатов. Работа с несколькими типами сигналов часто применяется при первичной обработке. Одним из распространенных является разбиение 174
Нейросетевые методы пространственной и спектральной фильтрации... Число нейронов второго слоя равно N - А^искл, где NHCKJl - число нижних спектральных составляющих, вырезаемых для подавления обратных отражений от подстилающей поверхности и местных предметов. Нейроны второго слоя реализуют пороговую функцию активации. Выходом является один нейрон, связи которого со вторым слоем единичны. Второй случай, с критерийной обработкой, также легко представляется в нейросетевом базисе в виде т трехслойных сетей описанного выше типа, чьи выходные элементы после пороговой обработки подаются на выход общей сети. Таким образом, традиционные варианты доплеровской фильтрации являются частными случаями обработки информации в одной из наиболее известных и успешно используемых нейросетевых парадигм - многослойном нелинейном персептроне. Основное отличие заключается в жесткой фиксации весовых коэффициентов, получаемых исходя из теоретических, а иногда и эвристических посылок. Целесообразно, используя традиционные структуры, с помощью известных методов (backpropagation, RPROP и др.) [310; 319; 323] провести обучение для получения наилучших значений весовых коэффициентов с целью улучшения качества работы системы первичной обработки, а также получения вариантов оптимальных систем для конкретных сложных условий работы: наличия интенсивных обратных отражений от подстилающей поверхности и местных предметов, присутствия многих целей. Процесс обучения в данном случае можно проводить на примерах, формируемых с помощью моделей сигналов для различных условий. При этом основная трудность обучения, заключающаяся в получении достаточного числа обучающих примеров, просто исключается. (4.25) 175 исходной временной последовательности (вектора наблюдений х) на подпоследовательности с последующей критерийной обработкой получаемых для каждой из последовательностей результатов по критерию типа "/ из т" [63; 105], что эквивалентно выбору максимума или минимума получаемых результатов или их комбинации. Данная система обработки легко может быть представлена эквивалентной структурой в нейросетевом базисе в виде многослойного пер- септрона с фиксированными коэффициентами. Первый случай описывается трехслойной сетью, входной слой которой представляет вектор х. Переход на следующий слой реализует спектральное преобразование с весовыми коэффициентами, равными матрице Фурье-преобразования:
Глава 4 4.3. Генетические алгоритмы многопараметрической оптимизации В настоящее время в РЛС для снижения импульсной мощности излучения, преодоления необходимости излишне быстрого переключения передатчика из режима излучения в режим молчания, затруднения противнику разведки параметров излучения, широкое применение находят сложные сигналы. В радиолокации все большее применение находят сигналы со сложной структурой, база которых может составлять десятки тысяч и более (многобазовые сигналы). Здесь рассматриваются сигналы с амлитудно-фазокодовой манипуляцией, т.е. нерегулярные достаточно длинные, 104...106, последовательности излучаемых импульсов, для которых проводится одновременно фильтровая и корреляционная обработка. Для упрощения технической реализации при манипуляции фазы используется только два положения ±п . Сигналы с фазокодовой манипуляцией в радиолокации используются достаточно давно [16, 65]. Обычно излучаемый сигнал представляется в виде последовательности из +1,-1. Традиционная обработка представляет собой коррелятор, на выходе которого формируется отклик у: y = ^Xixf , (4.26) 1=1 где х° = (xf, х2 > • • • 9 ) (х° е RN) - вектор, описывающий излученный сигнал, a x = [xl9x29...,xN) - временная последовательность на выходе приемника. Задача коррелятора - селектировать сигналы, отраженные от целей и не давать существенных откликов в другие моменты времени, поэтому его важной характеристикой является автокорреляционная функция по дальности (АКФД), описывающая отклик коррелятора при сдвигах исходного сигнала во времени: max(jv, N+k) Ук= X *'■*'■+*• (4,27) i=min(0, к) k=^-(N-l)9-(N-2)9...,-\90,l,...,(7V-2),(N-l). Идеальный вид сигнала соответствует единственному ненулевому значению АКФД при к = 0. К сожалению, сигналов с идеальной АКФД при указанном виде сигналов не бывает. Самыми лучшими в смысле минимума относительного уровня боковых лепестков из известных сигналов такого типа являются последовательности импульсов, располо- 176
Нейросетевые методы пространственной и спектральной фильтрации... женных в соответствии с кодами Баркера [65]. Уровень максимального бокового лепестка для них имеет значение 1/N . Но такие коды известны только для очень ограниченных значений N , максимальное из которых равно 13. Код сигнала для этого случая записывается в виде +1,-1,-1,+1,+1,-1,+1,+1,-1,+1,-1,+1,-1. Другим вариантом фазокодома- нипулированных последовательностей являются так называемые М- последовательности, генерируемы с помощью сдвиговых регистров и арифметики по модулю два. Для этих сигналов максимальный уровень боковых лепестков может достигать а/V7V , где А - некоторая постоянная. Приближения АКФД к идеальной можно добиться, если расширить пространство возможных реализаций сигнала за счет введения дополнительного, нулевого состояния. В этом случае излучаемый сигнал будет представляться в виде последовательностей, состоящих не только из +1, -1, а из 0,+ 1,-1. Известны методы получения таких сигналов с идеальной АКФД в рабочей области, то есть в области k -N0,..., -1,0,1,..., N0 для некоторых значений N0<N-l, интересующих пользователя. Однако линейность применяемых алгоритмов не всегда позволяет добиться требуемой эффективности. Нейронные сети как раз и являются развитием традиционного адаптивного подхода на случай нелинейных преобразований. Однако к нелинейности обработки следует относиться с большой осторожностью, так как в этом случае перестает выполняться принцип суперпозиции, и рассмотрение совместного наличия нескольких воздействий на систему нельзя проводить изолированно. Так в работах [258, 259] приводится пример использования многослойного персептрона для сжатия сложных сигналов в виде импульсных последовательностей. Для сравнения с традиционным подходом рассмотрена кодовая последовательность с 13-ти позиционным кодом Баркера, обеспечивающая минимальный уровень боковых лепестков. Нейронная сеть после обучения оказалась способной обеспечивать уровень боковых лепестков на 15 дБ ниже, чем известные методы линейной обработки. Эти работы привлекли внимание широкого круга исследователей и на них часто ссылаются в обзорной литературе, подчеркивая преимущества нейронных сетей [21]. Однако оторванный от предмета исследований подход оказался не вполне адекватным. Более тщательный анализ, проведенный в [366] показал, что полученные преимущества оказываются мнимыми. На самом деле уровень боковых лепестков является вспомогательной величиной, описывающий уровень взаимного влияния накладывающихся сигналов при линейной обработке. Для не- 177
Глава 4 линейной обработки этот уровень уже не может адекватно описывать взаимное влияние сигналов. Оказалось, что при нелинейной обработке сигналы взаимно подавляют друг друга существенно сильнее, чем это описывается уровнем боковых лепестков. На самом деле, характер нелинейностей, реализуемых нейронной сетью для максимального выполнения принципа суперпозиции должен иметь вид порогового ограничителя, как это было получено в результате подробного исследования в [270]. Однако важным недостатком всех указанных типов последовательностей является наличие существенных боковиков у АКФ в частотной плоскости. Дело в том, что при работе по движущимся целям каждая составляющая сигнала имеет доплеровский сдвиг, что особенно заметно при значительных длительностях сигнала. Обработка включает в себя отдельные корреляторы для каждого из возможных доплеровских сдвигов. Выходом обработки является набор выходов yf фильтров: ^=£,^exp(-y^J, (4.28) / = 0,1, где F - число заданных сдвигов доплеровских частот (F<N). Вектор принятого сигнала здесь уже не действительный, а имеет составляющие из множества комплексных чисел. Если принимаемый сигнал имеет доплеровский сдвиг относитель- ( Ля if Л но излученного на величину expl j I, данное выражение в точности совпадает с выражением для отклика обычного фильтра, приведенным выше х° eCN. Качество сигнала теперь уже определяется его автокорреляционной функцией не только по дальности, но и по частоте, то есть двухмерной функцией : max(N,N+k) , ехр -у /=гшп(0д) ^ N k = -N09...,-1,0,1,. ..,iV0, (4.29) f = 0,\,...,F. Здесь не указаны отрицательные частоты, так как вектор, описывающий излучаемый сигнал не имеет мнимых составляющих и, следовательно yk(_f} = Ук/ • 178
Нейросетевые методы пространственной и спектральной фильтрации.. Стоит задача [16; 65; 84] синтеза такого сигнала, состоящего из последовательности импульсов 0, +1, -1, у которого двухмерная автокорреляционная функция ykf имеет «кнопочный» вид (рис. 4.18) [264-265], при минимальном уровне боковых лепестков в рабочей области -N0 <k<N0, 0<f<F. Рис. 4.18. Кнопочная функция неопределенности Во многих методах синтеза наилучших по тому или иному критерию сигналов основным методом является последовательное постепенное улучшение сигнала. Многократное повторение этого процесса, в конце концов, приводит к наилучшей или к близкой к наилучшей структуре сигнала. Различные алгоритмы рассматривают различные методы выбора направления модификации сигналов. Но основное свойство подобной модификации остается неизменным практически для всех методов. Суть его в малом изменении сигналов от итерации к итерации. Можно даже утверждать, что основным элементом модификации является изменение одного из составляющих его импульсов, так как сигналы рассматриваемой структуры состоят из дискретных импульсов, значение сигнала в которых равно 0 или +1. Рассмотрим сигнал х = (х,, х2, xN) длиной N . Его спектр, представляемый вектором s=(s0, s,, sN_,) длины N , определяется с помощью выражения: , ехр(-у^) * = 0, 1, N-1. (4.30) Пусть новый сигнал z=(zx, z2, zN) полностью совпадает с исходным за исключением единственного импульса под номером т, в котором они различаются: 179
Глава 4 x, = 2: 1ФГП 1 1 . (4.31) xt Ф zi i = m Спектр 1 = (t0, tl9 /дг_,) нового вектора также несильно отличается от спектра исходного вектора. 2л ik4 ■=ХZ/ ехрг7 л/ ' (4-32) Zf . 2л ik \ / ч ( .2л тк т.е. ^=^+(2,.-*,) expj^-y^^j. (4.33) Полученное выражение показывает, что при изменении в сигнале единственного импульса каждая из составляющих его спектра изменяется на величину (z,- -xt) ехр^-у• Таким образом, спектр нового сигнала может быть рассчитан на основе предыдущего за N операций комплексного сложения. При этом числовые коэффициенты могут быть рассчитаны заранее. Операция умножения, необходима в записи лишь для общности, так как, исходя из структуры сигнала, z, - jt, = ±1. Меньшего числа операций по всей вероятности нельзя достичь, так как каждый из элементов спектрального вектора должен быть подвергнут модификации, а их число равно N . Этот метод модификации может быть использован при модификации автокорреляционной функции измененного в единственном импульсе сигнала. Двухмерную автокорреляционную функцию в плоскости координат дальность - доплеровская скорость вычисляют согласно выражению: max(N,N+k) , 2Л if Л Ук/= X х*+*ехр ~j ' (434) i=min(0,*) ^ " ' Это выражение может быть рассчитано двумя способами в зависимости от выбранного порядка вычислений. Первый способ предполагает проведение расчета взаимной корреляционной функции сигнала с другим, сдвинутым относительно исходного на заданный доплеровский сдвиг. Для этого с помощью БПФ вычисляется спектр сигнала. Проводится его сдвиг и поточечное перемножение полученных спектров, по- 180
Нейросетевые методы пространственной и спектральной фильтрации.. еле чего осуществляется обратное преобразование Фурье. В соответствии с теоремой о свертке указанный процесс эквивалентен приведенному соотношению. Другой способ основывается на вычислении поточечного произведения самого сигнала со сдвинутой на k элементов его копией. После этого проводится Фурье преобразование с использованием алгоритма БПФ. Второй способ выгоднее в вычислительном отношении, так как требует проведения единственного Фурье преобразования в отличие от первого, для которого необходимо проведение двух преобразований - прямого и обратного. Помимо этого, так как теорема о свертке рассматривает циклическую свертку, ее использование возможно лишь при искусственном увеличении длины сигнальной последовательности и заполнении ее нулями, что дополнительно увеличивает вычислительную сложность алгоритма. Поэтому для проведения расчетов выбрана вторая схема вычислений. Для нее также более удобным является применение вышеприведенного алгоритма модификации спектра при единичном изменении сигнала. Пусть, как и выше, даны сигналы x = (jcl5 х2, xN) и z=(zj, z2, zN), которые отличаются друг от друга единственным импульсом под номером т, причем zi-xi = ±1. Рассмотрим поточечное произведение каждого из сигналов с его копией, сдвинутой на к элементов: к \х: xi+lc i = 0, 1, N-1-к х,=Г' i+k (4.35) ' [о i = N-k9 N-k + 1, N-1 к z, zi+k i = 0, 1, N-l-k г,=Г i+k , (4.36) ' [0 i = N-k, N-k + l N-1 В отличие от исходных сигналов, они могут различаться между собой в двух элементах (i = m и i + k = m). Однако это отличие имеет место только в тех случаях, когда хотя бы одна из величин т или т - к принимает значение в диапазоне от 0 до N-1-к включительно. Возможно два случая. Первый, если т + к < N -1 и, одновременно, zm+k Ф 0; второй, если т - к < N -1 и, одновременно, zm_k ф 0. В обоих случаях происходит изменение нового значения автокорреляционной функции. Таким образом, проводя расчеты для различных сдвигов по к, можно выделить четыре области с различными возможностями изменения автокорреляционной функции. Для к = 0 изменение имеет место всегда в 181
Глава 4 одном элементе выходной функции при i = т (исключением мог бы являться случай изменения импульса с +1 на -1 и наоборот, но такой случай не рассматриваются). Для О < к < min (т, N-1-т) возможно изменение АКФ в двух местах, если zm+k и zm_k не равны нулю. Для min(w, N -\-т)<к <max(w, N-\-m) изменение может произойти, если соответствующее значение новой последовательности zm+k и zm_k не равно нулю. Для max(m, N -\-т)<к новое поточечное произведение не отличается от предыдущего. Наиболее удобно проводить модификацию автокорреляционной функции в два этапа. Сначала проводится цикл по значениям к от 1 дот по возможным изменениям последовательности поточечных произведений за счет zm_k, а затем цикл повторяется от 1 до N-\-т для изменений за счет zm+k. Случай к = О рассматривается отдельно. Общее число модификаций при этом не превышает N или удвоенной длины рассматриваемого диапазона по дальности. Снижение времени расчета, даже с учетом использования БПФ может составлять один - два порядка при длинах сигналов 103... 104. Тем не менее, задача синтеза сложных фазокодоманипулирован- ных сигналов является очень сложной и требует применения нетривиальных математических методов. Это задача оптимизации, характеризующаяся чрезвычайной сложностью из-за очень высокой размерности и ввиду того, что значения переменных целочисленны. Аналитические методы решения такой задачи неизвестны. Обычно в задачах целочисленной оптимизации используют методы перебора или сокращенного перебора (типа метода ветвей и границ) [26]. Однако размерность данной задачи настолько высока, что ни сейчас, ни даже в отдаленном будущем нельзя надеяться на получение полного решения (если только действительно не появятся квантовые компьютеры). Действительно, если заданы база сигнала (число импульсов N), средняя скважность (Q) или связанное с ней значение числа ненулевых импульсов (число положительных и отрицательных импульсов полагается одинаковым, равным М), то общее число вариантов перебора равно: N1 ^перебор = Ml (N-2M)\ Ml ' (4'37) Если использовать формулу Стерлинга с точностью до множителей полиномиального порядка: 182
Нейросетевые методы пространственной и спектральной фильтрации.. Х\ = Ххех = (4.38) получим: К, перебор ~ М2М (N-2MJ (N-2M) » (4.39) При не очень больших для многобазовых сигналов величинах N = 10000 , М = 1000 получим ^перебор » Ю2000 , что намного превышает любые представимые возможности. Даже если использовать методы сокращенного перебора, число вариантов не удастся сократить на заметную по порядку величину. 4.3.1. Основы теории генетических алгоритмов. Для решения таких задач единственно возможным методом является метод случайного поиска, который при очень большом числе возможных вариантов, конечно, не гарантирует оптимальности решения, но зато находит решение, значительно лучшее, чем просто случайное. Суть метода случайного поиска [111], в его наиболее прямолинейной реализации заключается в следующем. В области определения оптимизируемого вектора параметров, каждый из которых задает некоторую точку в п -мерном пространстве, генерируется некоторое, обычно достаточно большое (100... 1000), число случайных точек. Все эти точки равномерно в стохастическом смысле покрывают заданную изначально область определения. Затем из всех этих точек выбирается некоторая доля наилучших решений, т.е. тех точек, в которых значение целевой функции максимально (минимально) при решении задачи максимизации (минимизации). По выбранным наилучшим точкам строится наименьшая область определения параметров, содержащая все эти точки. Размер этой области будет хотя бы немного меньше размера исходной области. Процесс повторяется многократно, при этом каждый раз размер области наилучших решений сужается. В конце концов, этот размер становится настолько мал, что достаточно хорошо описывает искомое решение. На самом деле процесс оптимизации в виде непосредственного случайного поиска работает приемлемо только в случае, если оптимизируемая функция не имеет двух или более оптимумов с близкими значениями и размерность пространства параметров не очень велика. В противном случае, сужение области описка будет незначительным в течение длительного времени, пока все наилучшие решения не окажутся в непосредственной близости от главного оптимума. Поэтому для поиска оптимума в практически интересных случаях, когда целевая функция имеет несколько максимумов, необходимо привлекать более мощные методы оптимизации. 183
Глава 4 В этих случаях целесообразно использовать нетрадиционные методы. Одним из таких многообещающих методов является генетический алгоритм (ГА) оптимизации, точнее целое семейство таких методов, или эволюционное программирование [14; 136]. Методы генетической оптимизации стали применяться в широком масштабе для оптимизации весовых связей в нейронных сетях и до сих пор в этой области остаются одними из самых широко применяемых методов обучения. Толчком или научной метафорой для этих методов послужила эволюционная теория Дарвина и открытие генетических механизмов эволюции. Генетические алгоритмы (ГА) реализуют процедуры поиска, основанные на естественном отборе и генетике. В наиболее общем виде ГА работают с конечным набором бинарных строк фиксированной длины. Отбор или селекция имитируют выживание пригодных элементов в пределах популяции, обеспечивая предпочтение лучшим элементам. Конечно, для отбора необходим некоторый критерий качества. Он естественно вводится заданной целевой функцией. Таким образом, над элементами вводится частичное упорядочивание. Здесь прослеживается явная аналогия с известными стохастическими методами оптимизации, упрощенной реализацией которых является случайный поиск. Единственное отличие заключается в том, что одновременно рассматривается множество вариантов, что эквивалентно процедуре случайного поиска, которая проводится из нескольких точек при допустимости произвольных переходов между точками. Первичным оператором получения новых структур для исследования в большинстве генетических алгоритмов является оператор перекреста генотипов. Простейший оператор перекреста состоит из трех последовательных шагов. Сначала, используя заданный селективный оператор, выбираются два элемента из общей популяции для воспроизводства потомства, и затем случайным образом с равномерной плотностью выбирается точка перекреста, в ходе которого генные последовательности выбранных родителей обмениваются между собой участками генома. Процесс продолжается, пока новая популяция не будет создана полностью, заполнившись потомками, которые построены из частей генов хороших (отселектированных) родителей. Существует значительное число других вариантов алгоритма перекреста генотипов, но общий смысл их остается одинаковым. Для дополнительного улучшения сходимости применяют оператор мутаций. В двоично-кодированном генетическом алгоритме, мутация - это случайное изменение (с низкой вероятностью) положения единицы, и при других основаниях кодов могут применяться разнообразные методы возмущений исходных последовательностей. Мутации описывают хаотические случайные блуждания в пространстве, образованном последовательностями. Используемые совме- 184
Нейросетевые методы пространственной и спектральной фильтрации.. стно с отбором, они как бы формируют параллельный, шумонезависи- мый алгоритм восхождения на холм [363]. При использовании одновременно с отбором и перекрестом, мутации дают дополнительные гарантии против потери необходимого разнообразия. Генетические алгоритмы могут решать трудные проблемы быстро и с требуемой точностью, легко расширяются, связываются с уже существующими моделями, объединяются с другими методами для повышения эффективности. Помимо всего прочего, физическая наглядность позволяет достаточно просто модифицировать алгоритм для наилучшей работы при заданной проблеме. Например, часто в сложных многомерных задачах, возникают многомодальные целевые функции. В этих условиях целесообразно вести одновременный поиск по всем перспективным направлениям. Реализация этого даже в самых простых генетических алгоритмах не вызывает трудностей и происходит автоматически. Когда интуитивный подход не приводит к должному успеху, возможно использование специальных проблемно-ориентированных приемов. Например, часто помимо мутаций и отбора используют и другие эвристики, например объединение глобального генетического поиска оптимума с локальной проблемно-ориентированной техникой. Информация по решаемой задаче может быть использована и в операциях кодирования и других. Задача синтеза сложных многобазовых радиолокационных сигналов совершенно естественно проецируется на базис генетических алгоритмов. Действительно, если для других задач одной из наиболее трудно формализуемых проблем является выбор варианта кодирования параметров системы генной последовательностью, для сигналов саму их структуру и можно рассматривать как генотип и именно к последовательности импульсов из нулей и ±1 применять вышеописанные операторы генетических алгоритмов. Популяция в такой формулировке представляет собой множество сигналов с различной структурой. Ее объем целесообразно выбирать не менее 100. В работе использовался наиболее распространенный вариант ГА (рис. 4.19), который состоит из трех операторов: отбора, перекреста хромосом (crossover), и мутаций. Для синтеза сигналов используется три оператора мутаций: добавление отдельного импульса, исключение импульса или сдвиг. Рис. 4.19. Операторы мутаций 1 Добавление^> Исключение Сдвиг 185
Глава 4 Оператор мутации сводится к замене единственного импульса в сигнале, а, следовательно, и одного элемента в сигнальной последовательности на один из двух других возможных или сдвигу такого импульса. При этом с большим успехом может использоваться вышеописанный метод уточнения автокорреляционной функции для ускорения проведения расчетов. Кроме того, так как наихудшая часть популяции в дальнейшем будет отсеяна, можно на каждом шаге указать пороговое значение, при достижении которого целевой функцией, вычисления могут быть прекращены ввиду очевидной непригодности рассматриваемого экземпляра. Такой сокращенный вариант вычислений может уменьшить время на один-два порядка, особенно при приближении к оптимуму, когда улучшение достигается редко. Последовательность вычисления автокорреляционной функции при этом очень важна. Поэтому при расчетах необходимо сначала оценивать значения целевой функции по главным осям, где наиболее часто появляются наихудшие значения. Оператор перекреста генотипов может быть реализован в двух вариантах. Первый практически полностью совпадает с описанным выше (рис. 4.20). точка перекреста потомок t^'i1 Ли i**ia iMh Рис. 4.20. Операция перекреста (crossover) Второй опирается на тот факт, что отдельные импульсы в сигнале между собой не связаны и перенос в сигналы потомки достаточно связных кусков родительских сигналов не должен иметь существенного значения. Наоборот, это может привести к потере перспективных направлений поиска в параметрическом пространстве. Поэтому обмен элементами родительских сигналов при воспроизводстве сигнала потомка для каждого отдельного импульса осуществляется случайным образом с заданной вероятностью. Причем, процесс происходит независимо для всех импульсов. В воспроизведенной популяции присутствуют потомки, полученные обоими способами и с учетом мутаций. 186
Нейросетевые методы пространственной и спектральной фильтрации... 187 Эффективность генетических алгоритмов по сравнению с другими методами случайного поиска достаточно очевидна из-за целевой направленной обусловленности процесса поиска. Для полноценного использования преимуществ целесообразно использовать гибридную технику «генетический алгоритм / восхождение на холм». Так как генетические алгоритмы весьма медленны при получении точных результатов, данный метод способен быстро определить сосредотачивается ли алгоритм на наиболее многообещающих областях. При синтезе радиолокационных сигналов целевая функция и параметры оптимизации не являются непрерывными величинами, что затрудняет использование обычной техники восхождения на холм. Для ее применения можно использовать «локальный» генетический алгоритм тонкой настройки структуры организма. Используя небольшую популяцию организмов, подобных последнему полученному результату и локализуя операторы мутации и наследственности таким образом, чтобы отдавать предпочтение небольшим изменениям, этот локальный генетический алгоритм аналогичен алгоритму динамического восхождения на холм [363]. На рис 4.21. изображена общая схема процесса проведения генетического синтеза многобазовых радиолокационных сигналов. Задача оптимизации радиолокационных сигналов включает ряд ограничений (примерный уровень скважности для возможности приема сигналов в просветах между импульсами, отсутствие какой бы то ни было регулярности для повышения скрытности излучении и т.п.). На первый взгляд может показаться, что в генетических алгоритмах нужно просто не рассматривать решения, в которых не выполняются заданные ограничения. Такие «жесткие» ограничения полезны в традиционной технике оптимизации, но в генетических алгоритмах разнообразие составляет суть процесса оптимизации. Если организм исключается из рассмотрения только потому, что он не удовлетворяет некоторым ограничениям, можно потерять важную информацию, которая, в конечном счете, могла бы привести к оптимальному решению. Кроме того, при «жестких» ограничениях исключаются решения, в которых лишь немного нарушается единственное ограничение и одновременно достигается очень хорошее значение целевой функции. Поэтому считается общепринятым, что замена «жестких» ограничений на хорошо подобранные «мягкие» ограничения позволяет улучшить работу генетических алгоритмов. Мягкие ограничения не исключают из исследования решения, не удовлетворяющие ограничениям; они вводят систему штрафов, чтобы затруднить жизнеспособность организмов в этой области.
Глава 4
Нейросетевые методы пространственной и спектральной фильтрации.. В большинство генетических алгоритмов используется лишь небольшое число изменяемых параметров: размер популяции, уровень перекреста генотипов родителей и уровень мутаций. Путем точной настройки значений этих параметров в некоторых случаях можно удвоить скорость оптимизации. Автоматическую настройку параметров можно проводить путем отображения наилучших организмов на графике после каждой попытки. С помощью полученной кривой определяется уровень улучшения, и уточняются параметры перекреста генотипов и мутаций соответственно. Размер популяций также должен меняться в течение эволюционного процесса для того, чтобы сбалансировать скорость развития с разнообразием генов. Адаптивный генетический алгоритм автоматически наращивает популяцию (и увеличивает разнообразие генов), когда процесс оптимизации замедляется и, наоборот, сокращает гетерогенные популяции. 4.3.2. Реляционная база данных по многобазовым сигналам и результатам их оценки. Для управления процессом оптимизации сигналов при использовании генетических алгоритмов, сохранения и анализа промежуточных результатов целесообразно использовать базу данных по сигналам и их корреляционным функциям. Удобно представить эту базу в виде реляционной. База данных (БД) радиолокационных сигналов представляет собой организованный набор данных по структуре, параметрам и свойствам изученных сигналов. Она предназначена для учета всех полученных в ходе синтеза сигналов, обеспечивающих достаточно высокую эффективность для тех или иных условий работы РЛС. При этом учитывается информация о конкретных числовых значениях различных показателей эффективности, для каких условий она получена и какой тип обработки предпочтителен для каждого сигнала. Помимо исследовательских функций база данных может выполнять функции прототипа серийной базы данных по выбору рациональных сигналов в зависимости от внешних условий. База данных содержит: сигналы: название, длительность, скважность, собственно последовательность кодов фазокодоманипулированной последовательности (0.+1-1); тип обработки: ДПФ, БПФ, предварительное взвешивание в окне, весовая функция окна, необходимость введения различных весовых функций для различных дискретов по дальности, проведение нелинейной обработки внутри сигнала (мультипликативная обработка, обучаемая нейронная сеть, др.); тип совместной обработки: используется ли сигнал один или совместно с другими, если с другими, то какие именно сигналы должны с 189
Глава 4 ним вместе обрабатываться и каким образом (суммирование, мультипликативная обработка, робастное накопление, др.); класс РЛС, в которых используется сигнал: рабочая зона по дальности и доплеровской частоте. класс внешних условий: возможные уровни и местоположения обратных отражений от подстилающей поверхности и местных предметов, наличие групп целей, их количественный состав и возможное местоположение; численные значения эффективности: максимальный уровень боковых лепестков и их местоположение на плоскости дальность - допле- ровская скорость, среднеквадратический уровень боковых лепестков, энергетические потери в рабочей области; метод, с помощью которого получен сигнал: название метода, его исходные данные и параметры, в случае генетического программирования ссылки на сигналы, потомком которого является данный. База данных обеспечивает выполнение следующих требований: возможность работать со списком кодов сигналов', отслеживание сигналов по заданной длине и количеству ненулевых импульсов; выбор сигналов, имеющих наилучшие значения уровней боковых лепестков (как для максимального, так и для среднеквадратического значения) для заданных типов РЛС и вариантов внешних условий; предоставляет средства анализа перспективности применяемых методов синтеза для различных условий. Для работы со списком сигналов, включая их коды, необходимо иметь таблицы, содержащие, в том числе, и собственно сигналы. Помимо этого таблица, как это и указано ранее, должна содержать длины сигналов, а число ненулевых импульсов взаимно однозначно связано со скважностью при заданной длительности. Так как численные значения эффективности (максимальный уровень боковых лепестков и их местоположение на плоскости дальность - доплеровская скорость, среднеквадратический уровень боковых лепестков, энергетические потери в рабочей области) хранятся в базе данных, осуществлять выбор сигналов, имеющих наилучшие значения уровней боковых лепестков для заданных типов РЛС, и вариантов внешних условий, которые тоже хранятся в базе, можно по ключам. Для анализа перспективности применяемых методов синтеза для различных условий можно исследовать число и уровень эффективности синтезированных с их помощью сигналов и выбрать те методы, которые позволяют достичь наилучших результатов. 4.3.3. Результаты генетического синтеза радиолокационных сигналов. С помощью разработанного инструментария был проведен 190
Нейросетевые методы пространственной и спектральной фильтрации.. цикл численных экспериментов по синтезу сложных сигналов. При этом задавались различные пределы для рабочей области сигналов. Эти пределы устанавливались в безразмерном виде по числу анализируемых дискретов. Были рассмотрены два случая с размерами рабочей области 32x32 дискрета и 32x150 дискретов, соответственно, при необходимости исключения 10 дискретов канале с нулевым сдвигом по дальности. На рис. 4.22 показано изменения уровня боковых лепестков в ходе процесса эволюционного синтеза сигналов. 30 40 50 60 70 Номер итерации 80 100 Рис. 4.22. Иллюстрация хода эволюционного процесса при синтезе сложных сигналов с фазокодоимпульсной манипуляцией Значительного улучшения уровней боковых лепестков удается добиться уже на первых шагах эволюции сигналов. Это связано с тем, что на каждой итерации проводится многократный процесс дополнительной оптимизации за счет мутаций, при котором выбираются наилучшие коды, получаемые из потомка путем изменения состояния одного из импульсов. Причем, проводится почти полный перебор возможных однократных перестановок импульсов. На следующих этапах из популяции сигналов исключаются неудачные варианты, которые не могут привести к значительным улучшениям, и дополнительно включаются сигналы, имеющие потенциальные возможности к значительным улучшениям свойств автокорреляционной функции. Из графика видно, что ощутимое снижение уровня боковых лепестков наблюдается даже после 100 итераций, хотя скорость этого снижения заметно снижается. Проведенные численные эксперименты показали, что с помощью метода генетического синтеза удается получить уровень боковых лепестков на 10... 15 дБ ниже, чем при случайном выборе кодов импульсных последовательностей (рис. 4.23). Так при рабочей области 32x32 дискрета уровень максимальных боковых лепестков снижается с -18...22 дБ до -32...34 дБ. В случае увеличения рабочей области до 32x150 дискре- 191
Глава 4 тов выигрыш несколько меньше, но весьма существенен, с -18...20 дБ до -25...28 дБ. 0,1 0,01 0,001- случайные сигналы генетический синтез ' л * *> » ♦ » » » Рис. 4.23. Сравнение уровней боковых лепестков сигналов, полученных с помощью случайного выбора импульсов и с помощью эволюционного моделирования 192
Глава 5. Нейросетевые методы обнаружения радиолокационных сигналов В данной главе излагаются результаты теоретических исследований традиционных методов автоматического обнаружения отметок от целей в реальных условиях, показывается их неэффективность при работе по группам целей и в условиях нестационарных помех. Синтезируются нейросетевые методы, способные улучшить качество обнаружения в сложных условиях. 5.1. Анализ эффективности традиционных методов автоматического обнаружения радиолокационных целей При необходимости обеспечения работы обнаружителя в заранее неизвестных условиях следует предусмотреть специальные меры по стабилизации уровня ложных тревог на его выходе. Действительно, если будет использован традиционный обнаружитель с жестким порогом, проводящий сравнение амплитуды принятых импульсов с установленным пороговым значением, то даже незначительное увеличение мощности помех приведет к катастрофическому увеличению уровня ложных тревог. Если на вход приемника воздействуют обычные гауссовы помехи с отношением помеха / шум у/ , то плотность распределения вероятности р (х) для сигнала на выходе квадратичного детектора будет описываться экспоненциальным распределением: р(х)-. 1 у/ + \ ехр Уровень ложных тревог ^лт для обнаружителя с фиксированным порогом соответствует вероятности того, что случайная амплитуда сигнала на выходе детектора превзойдет заданный порог Л : ^■т =Р{х>Л}= jp(x)dx= J—-j- ехр 1 1 У г x ^ у/ + 1 dx = ехр f л л у/ + \ (5.1) 7—5782 193
Глава 5 Пусть пороговое значение А обнаружителя установлено так, чтобы обеспечивать вероятность ложных тревог Fm в беспомеховой обстановке на уровне 10"6 . Тогда A = -\n(F) и выражение (5.1) может быть переписано в виде: ^лт = ехр А 1 Отсюда следует, что очень незначительное изменение помехового фона на 20% приведет к 10-ти кратному увеличению вероятности ложных тревог, а при отношении помех шум, равном единице уровень ложных тревог становится недопустимо большим - 10~3. Для стабилизации уровня ложных тревог обычно применяют методы типа адаптивного порога. В этом случае осуществляется анализ уровня помех в дискретах, соседних с испытуемым, и на основе оценки мощности помех изменяется величина порога. 5.1.1. Методы автоматического обнаружения с адаптивным порогом. В этом случае осуществляется анализ уровня помех в дискретах, соседних с испытуемым, и на основе оценки мощности помех проводится формирование порога обнаружения [105; 206]. В наиболее ранних вариантах реализации этого метода уровень мощности помех измерялся на участке дальностей, превышающих индикаторную, и затем предполагался одинаковым для всей дистанции. По измеренной мощности помех определялся порог обнаружения. Преимуществом такого метода обнаружения является практически полное отсутствие влияния отраженных от целей сигналов на оценку мощности помех, что обеспечивает приемлемые характеристики при стационарном гауссовом шуме. Однако развитие технологии постановки помех в последние десятилетия привело к тому, что активные шумовые помехи, воздействующие на РЛС, могут за время, соответствующее одному периоду повторения импульсов, поменять свою интенсивность несколько раз. В результате этого, сигналы, получаемые в интервале времени, в котором производится оценка мощности помех, обеспечивают нерепрезентативную выборку для оценки мощности помех на всем диапазоне дальностей. Если противник сосредоточит всю мощность помех на этом интервале, то порог обнаружения на всей дистанции будет неоправданно завышен, что приводит к значительному снижению вероятности обнаружения. В случае же, когда время излучения помехи не пересекается со временем измерения уровня помех в РЛС, порог обнаружения остается на ис- 194
Нейросетевые методы обнаружения радиолокационных сигналов ходном уровне, в результате чего возрастание количества ложной информации на выходе РЛС существенно превышает допустимое. В настоящее время применяется более гибкий вариант данного метода, впервые предложенный в [201]. В этом варианте интервал усреднения (элементы опорной выборки) «окаймляет» дискрет, в котором принимается решение о наличии или отсутствии цели и «скользит» вслед за этим дискретом. Такой вариант иногда называют также «скользящим окном». Его структурная схема приведена на рис. 5.1. Регистр сдвига 1 V ПУ Умножитель Сумматор Рис. 5.1. Структурная схема обнаружителя с адаптивным порогом Если обозначить сигналы в испытуемом дискрете и в опорной выборке, составляющей «скользящее окно», через jc0 и jc, (/ = 1, п ) соответственно, то решающее правило запишется в следующем виде: (5.2) где Л - так называемое пороговое число, которое выбирается исходя из требуемого уровня ложной тревоги. Решение о наличии цели в испытуемом дискрете принимается в случае превосходства сигналом в нем сформированного порога п Л • ^ xi. Вероятность ложной тревоги такого обнаружителя определя- ется выражением: а вероятность обнаружения цели с ЭПР, флюктуирующей по первой модели Сверлинга [113], создающей на входе приемника отношение сигнал/помеха s ^обн _ 5 + 1 5 + 1 + Я 195
Глава 5 Анализ указанных соотношений показывает, что энергетические потери при обнаружении целей данным методом зависят от размера опорной выборки п и требуемого уровня ложной тревоги и не превышают 1...3 дБ для принятых в РЛС значений п и Fm . Однако, в реальных условиях возможно воздействие на РЛС помех нестационарного типа. Кроме того, следует учитывать и воздействие хотя и стационарных, но негауссовых помех, таких как отражения от ПП и МП, пассивные помехи и т.п., а также возможность наличия в пределах опорной выборки сигналов, отраженных от соседних с обнаруживаемой целей. Характеристики обнаружения РЛС при этом резко ухудшаются. Недостатки данной схемы при работе по группе целей отмечались в работах [309; 351]. Однако там рассматривался случай наличия только одной цели в пределах опорной выборки, и не было обращено внимание на наличие отрицательной корреляции в фактах обнаружения рядом расположенных целей. Как следует из результатов проведенного выше анализа, характерным будет попадание в состав опорной выборки 2-х и более самолетов. Рассмотрим случай нахождения в составе опорной выборки отраженных сигналов от к целей. Будем полагать все самолеты в группе однотипными (с равными ЭПР, флюктуирующими по первой модели Сверлинга [113]), отраженные сигналы от них имеют отношение сигнал/помеха s. Тогда плотность распределения отраженного сигнала, нормированного на мощность помехи, в испытуемом дискрете запишется в виде: Сумма в выражении (5.2) может быть разбита на две части: часть с чисто шумовыми сигналами и - с сигналами, отраженными от целей. Причем, не нарушая общности, мы можем считать, что «испорченные» целями дискреты занимают первые к дискретов опорной выборки, так как решающая статистика инварианта к нумерации дискретов. Плотности вероятностей для первой и второй сумм запишутся в виде: п к п i=\ ;'=1 i=k+\ P(2,) = 196
Нейросетевые методы обнаружения радиолокационных сигналов P(£2) = („J_1)! eXp(-Z')- Применив интеграл Стильтьеса, получим выражение для вероятности обнаружения Ро6н (к) в условиях работы по к +1 цели: . к-\ 0 v ,у ' (5.3) Проведя последовательное интегрирование в (5.3), получим: 1 ч/7-А: Л 5 + 1 1 1 Сравним это выражение с указанными в [309] выражением для обнаружения одиночных целей: '-«Ч^Г- <55) Сравнение показывает, что при к>0 Робн(к) всегда ниже, чем ^об„(0): < 1. (5.6) ^обн(О) (5 + 1 + Я5) ^ (Л + 1) (Я + 1) Причем это отношение с ростом 5 уменьшается, что приводит к тому, что вероятность обнаружения цели в разрешаемой группе не может превзойти некоторого заданного значения: к limPo6H(t)=(A + l)-*=FJir-. (5.7) 5->оо На рис. 5.2 приведены зависимости вероятности обнаружения от дальности, нормированной к дальности обнаружения одиночной цели с вероятностью 0,5 при уровне ложной тревоги Fm = 10~6, для случаев отсутствия в составе опорной выборки целей, а также наличия 1,2 и 3 целей, т.е. работы по одиночной цели и по группам в составе 2, 3 и 4-х единиц. 197
Глава 5 Роб» 1,0 т 0,9- 0,8- 0,7- 0,6- 0,5- 0,4-- 0,3- 0,2^ 2 цели 0,1 -•• 0._ !4 цели! 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 £>/D0,5 Рис. 5.2. Зависимость вероятности обнаружения одиночных и групп целей от нормативной дальности при использовании адаптивного порога Данный метод может применяться совместно с последующей критерийной обработкой по пачке импульсов. При этом требования к уровню ложной тревоги одноимпульсного обнаружения снижаются с Ю-5...Ю-6 до Ю-1 ...10-2, что позволяет снизить пороговое число Я и улучшить характеристики обнаружения групп целей. Однако и в этом случае, как показывают расчеты по выражению (5.4), эффективность обнаружения групп целей недопустимо низка. Следует подчеркнуть, что, как указывалось выше, факты обнаружения соседних целей имеют отрицательный уровень корреляции, т.е. при обнаружении одной цели из группы вероятность обнаружения другой заметно снижается. В результате этого вероятность одновременного обнаружения всех целей в группе значительно ниже, чем произведение вероятностей обнаружения каждой цели из группы. Вероятность одновременного обнаружения двух одинаковых целей в группе из двух Робн(2,2) при выполнении вышеуказанных предположений при полном перекрытии опорных выборок составит: что меньше, чем квадрат выражения (5.4) для к = 1, а предельная вероятность записывается в виде: (5.8) lim/>o6H(2,2) = 1-Я (5.9) Я + 1 198
Нейросетевые методы обнаружения радиолокационных сигналов Таблица 5.1. Формулы предельных вероятностей Характеристики Количество целей в опорной выборке 1 2 3 Формулы для предельных вероятностей 1-Я Я + 1 (1-2Я)2 (Я + 1)2 (1-ЗЯ)3 (Я + 1)3 Критическое значение Л 1 0,5 0,33 F лт 3-Ю"5 (2...3).10~3 (1...2)-10~2 Проведенный анализ показывает, что обнаружение групп целей рассмотренным методом является неэффективным. В основном, в каждом периоде обзора будет обнаруживаться лишь часть из них, причем в последовательных циклах обзора будет происходить обнаружение разных целей, что приведет к дополнительному снижению рубежей формирования трасс. С помощью Марковской модели, описанной выше, был проведен расчет вероятностей существования трасс для гипотетической РЛС с D = 60 км и периодом обзора Т = 4 с по группе из 2-х самолетов, имеющих скорости 500 м/с. При этом полагалось, что в РЛС осуществляется критерийная обработка принятых по каждому импульсу решений по критерию «4 из 5-ти». На рис. 5.3 представлены зависимости вероятности существования трассы по одной из целей и одновременно двух целей от дальности. Для сравнения приведена зависимость для случая работы по одиночным целям. Приведенные графики иллюстрируют недопустимо низкую эффективность работы метода с адаптивным порогом в «скользящем окне» дальности при работе по групповым целям, характерным для реальных боевых условий. Помимо низких значений вероятностей обнаружения для групп целей рассматриваемый метод обнаружения имеет существенные недостатки по качеству стабилизации уровня ложной тревоги. При обна- 199 Как видно из выражения (5.9), одновременное обнаружение пары целей возможно лишь при пороговых величинах Я < 1. Отсюда следует, что при требуемом уровне ложных тревог Fm = 2~" провести одновременное обнаружение пары целей невозможно. В случае наличия в опорной выборке двух и более целей, вероятности их одновременного обнаружения определяются громоздкими выражениями. Предельные же их значения записываются относительно просто. В табл. 5.1 приведены формулы для предельных вероятностей, а также критические значения порогового числа Я и уровня ложной тревоги Fm при « = 16.
Глава 5 ружении целей на фоне мешающих отражений от ПП и МП вероятность ложной тревоги возрастает. В работах [62; 105; 115] показано, что это возрастание может составить 2...3 порядка, что является недопустимым. Для компенсации этого ухудшения следует увеличивать величину порогового числа Л, что приводит к возрастанию энергетических потерь на 1...2 дБ и еще большему ухудшению обнаружения групп целей. Рис. 5.3. Границы формирования траекторий по парам целей при использовании адаптивного порога Кроме того, при воздействии нестационарных помех характеристики обнаружения также ухудшаются. Нестационарная помеха - это помеха, которая имеет непостоянную во времени мощность. Рассмотрим расчет вероятности ложной тревоги для этого случая. При этом все составляющие вектора наблюдений будем считать независимыми случайными величинами с одинаковым типом плотности распределения вероятностей: / \ 1 ( xt PtAxi) = 7ехР л где y/t определяет мощность помех в каждом дискрете. Если воздействующие помехи стационарны, все y/i равны между собой и работа схемы с адаптивным порогом в помехах полностью идентична работе в собственных шумах приемника, так как решающая статистика инвариантна относительно преобразования масштаба. Однако в случае нестационарных помех y/t будут различными. 200
Нейросетевые методы обнаружения радиолокационных сигналов Удобно вместо y/i рассматривать связанную с ней величину s. = y/i +1, описывающую суммарную мощность помехи и шума на выходе каждого дискрета вектора наблюдений. Тогда плотность распределения вероятностей для каждой составляющей вектора наблюдений запишется в виде: Р$ ixi) = - ехР / = 0,л. Определим распределение суммы сигналов в опорной выборке. Сначала докажем следующие леммы Лемма 1: Для любых s(, / = 1,и , s, * О и st* Sj , имеет место тождество. я°п= ! + ! +...+ (*1 -S2XS1 - j3)...(5, -S„) (S2 -S{)(S2 -53)...(52 -S„) 1 z- - = 0. 7=1 Докажем это с помощью метода математической индукции. Рассмотрим случай п = 2 . Имеем: 1 = о. (s,-s2) (52-^) Пусть теперь R® = 0 , я > 2. Докажем, что = 0 . Действительно, каждый член суммы (/ - произвольный номер, кроме 1 и 2) можно записать в виде: " 1 1 1 (^-^Х^-^з)...^-^) (5,--$!)($,.-^...(s,.-^,) C?,-s2) 1 Тогда сумма может быть представлена в виде: *° - 1 1 (51-52)(5,-53) ... (5,-5я+1) (^-5,)(^-5з) ... (s,-^) tt(Sl-Sl) 1 201
Глава 5 Очевидно, что эту сумму можно представить в виде разности двух сумм меньшего порядка: {sYS2) (*2-*l) каждая из которых по предположению индукции равна 0. Лемма доказана. Лемма 2: Для любого st, i = 1, п , si ф 0 и st* s-, имеет место тождество. j к к _*1 _,_ *2 ^ К = Ol -*2Х*1 -*з)-(*1 "О <>2 -^l)(^2 -^з)-(^2 "О +...+ * . (sn-sl)(sn-s2)...(sn-sn_l) Для & = 0 это следует из предыдущей леммы. Проведем доказательство для к>0. Рассмотрим случай п = 2. Имеем: (s,-52) (s2-S]) ' (*,-52) (*2-*l) Пусть теперь Д° = R\ =... = R"„~2 = 0, R"~l = 1, n > 2 . Докажем, что RL =K+i=- = K:\ = 0. Км =1 • Действительно ftk _ fl + + sk - + ...+ (*,-*i)0,-*2) ••• 0,-vn) (vi-*i)(*»+i-*2) ••• K+i-O Каждый у" -й член суммы кроме г -го (i - произвольный номер) запишем в виде: 202
Нейросетевые методы обнаружения радиолокационных сигналов (sj-s2)(sj-s3) ... (sj-s„+l) (sj-s2)(sj-s3) ... {sj-s„+iy a i -й - в виде: {Si-S2)(si-S3) ... (5г5я+1) {siS2)(siS3) ... Тогда =^n 1 {s\» • • •' ' ^i+l' • • •' )+ -Vl^+l • Проведя последовательное понижение степени и воспользовавшись предыдущей леммой (R%+1 = 0), получим требуемое тождество. Утверждение I Пусть имеется п независимо распределенных случайных величин каждая из которых распределена по экспоненциальному закону с плотностью вероятности, равной: (*/) = - ехР х, St*0 И 5у Ф Sj Тогда случайная величина rj, равная сумме п случайных величин ^ : имеет распределение: + ...+ Доказательство. Рассмотрим случай п = 2 . Имеем: 1-е = 1- V _JL _i_ _Л dt = \-e 52 - д' e * + 5| g 52 = {Si-S2) (*2~*l) 203
Глава 5 Пусть теперь п>2 и для всех предыдущих п доказываемое утверждение справедливо. Тогда: F.W-J- [sx-s2) ... (sx-sn) y-t y-t + ...+ (sn-sx) ... (s„-sn_x) Учитывая, что \—e s"+l J s..., y-t dt = _y_y L (_ e Sl jV' Sn+4t- о dt. получим (SX-S2) ... (5,-5и+1) (Sn-S}) ... (5г5и+1) 6? 1 + ...+ _y_ e *л+1 -6?+...+- У ,(5,-52) ... {Sn-S{) ...(S„-Sn+X) Откуда, учитывая Лемму 2, получим доказываемое утверждение. Утверждение II Если амплитуды импульсов в векторе наблюдений распределены независимо по экспоненциальному закону с плотностью вероятности, равной: 1 х, Р$ (*/ ) = ~ ехР —L / = О, И S; Ф О и st Ф Sj , Si V Si J то вероятность ложных тревог для обнаружителя с адаптивным порогом равна: 204
Нейросетевые методы обнаружения радиолокационных сигналов yS0 + As{ j ys0 + Xs2j Доказательство. В соответствии с утверждением /, случайная величина rj, равная сумме п случайных величин ^ : имеет распределение: -е "1 + (s]-s2) ... {sx-s„) (s2sx) ... {s2s„) е "z + + ...+ Вероятность ложных тревог определяется вероятностью события, р состоящего в том, что случайная величина щ=— превзойдет величину Л л = + £2 +... + £и. Как известно, такая вероятность определяется интегралом Стилтьеса: 00 СЮ А ^ FnT=\FndFm = \F-e°° Л. о о Заметим, что f s-l _ _ _. *(s,-s2)... {s,-s„) s0 {s,-s2)... (s,-sH) s0 -e s' —e s°dt = (s,-s2) ...(,,-,„)| ,,+* Проведя последовательное интегрирование по каждому члену суммы, составляющей Fn (у), получим: 205
Глава 5 (Sl-S2)...(sl-Sn)\ (*2-*1)"-0*2-О(*2+у - + ... (sn-sl)...(sn-sn_l)^sn+^ Обратим внимание на то, что выражение в скобках является R^+l для расширенного набора значений si9 i = 1, п , в которое дополнительно вательно, F =1- 1- *п+1 (Sn+l-Sl)'--{Sn+\-Sn). Более компактно можно записать: * v ( 50+Я ^)...( 50+/1^) или: 5о у 1 + 50 У 1 + Vo+U 1 + Я ^0+1 Что w требовалось доказать. Заметим, что величина уровня ложных тревог не зависит от мощности воздействующих помех, что понятно, так как решающая статистика инвариантна к преобразованию масштаба. Необходимо отметить, что полученное выражение при одинаково распределенных амплитудах сигналов вектора наблюдений существенно упрощается: Fm=(l + Ay". Это формула совпадает с приведенным выше выражением для вероятности ложной тревоги в стационарных помехах. Эта формула была 206
Нейросетевые методы обнаружения радиолокационных сигналов получена в [206]. Однако при неодинаковых уровнях помех в различных дискретах вектора наблюдений использовать ее невозможно. Принцип получения этой формулы не предполагает обобщения на исследованный случай, что и определило необходимость проведенных выкладок. Пусть на входе к дискретов вектора наблюдений, не включая испытуемый дискрет, присутствует некоторая помеха средней интенсивности у/ , одинаковой для каждого из них, а для остальных п-к помеха на входе отсутствует, т.е. случайной составляющей является только шум. Тогда sx = s2 =... = sk = у/ +1 и s0= sk+l = sk+2 =... = sn=l. Поэтому, в соответствии с утверждением II, вероятность ложной тревоги составит: -к t Fm{k,0) = {\ + A{¥ + \))-k(\ + X)k-n Пусть теперь помеха присутствует и в испытуемом дискрете. Тогда s0 = s{ = s2 =... = sk = у/ + 1, sk+l = sk+2 = ... = sn=\ и вероятность ложной тревоги увеличится: F„(*,l) = (l + * )'к 1 + Я 1 \к-п Рассмотрим теперь функционирование обнаружителя с адаптивным порогом в импульсных помехах. Пусть факт появления помехи носит случайный характер, т.е. с некоторой вероятностью р на вход приемника воздействует некоторая помеха интенсивности у/ , а с вероятностью 1-р помеха на входе отсутствует. Тогда вероятность того, что помеха воздействует на ровно к дискретов вектора наблюдений, равна: р(к) = ск„Рк(\-Ру-к. Вероятность ложных тревог в случае отсутствия помех в испытуемом дискрете равна сумме парциальных вероятностей, соответствующих каждому из возможных значений к Fm (0) = £С„У (1 - РТк (1 + Я (r +1) Г* ( 1 + Л Г" = к=0 к=0 1 + Я(^ + 1) 1-/» 1 + Я 1 + Я(^ + 1) 1 + Я Аналогично, для случая наличия помех в испытуемом дискрете имеем: 207
Глава 5 *=о V ¥ + А У \к-п \п-к \-р 1 + ил 1+ а ^ + 1 Окончательно, вероятность ложной тревоги должна учитывать возможность как наличия помеховых импульсов в испытуемом дискрете, так и их отсутствия: Подставив полученные выше формулы, получим выражение для полной вероятности ложной тревоги в импульсных помехах, при которых с вероятностью р воздействуют помеховые импульсы с отношением помеха / шум у/ : Р , 1~Р 1 + Я 1+ я у/ + \ Р , 1~Р 1 + Я(^ + 1) 1 + Я 4,7 Очевидно, что при достаточно больших значениях у/ можно рассматривать только второе слагаемое в первой скобке. При этом можно записать: Fm = P 1-р 1 + - V (5.10) Устойчивость решающего правила (5.2) к помехам прерывистого типа следует оценивать по наихудшим (т.е. обеспечивающим наибольшую величину Fm) значениям р. В выражении (5.10) максимум дости- 1 гается при р = , а максимальное значение составляет: п + 1 г max п + \ ¥ и + 1 у/ + А = —е п <и+1) у/ + А (5.11) 208
Нейросетевые методы обнаружения радиолокационных сигналов и при Я, у/ и п, характерных для РЛС, может принимать значения 10-2... 10-3. Следовательно, если в РЛС на этапе обнаружения в одном импульсе установлен уровень ложной тревоги такого же порядка, то обнаружение в помехах с комбинированным экспоненциальным распределением следует считать устойчивым. В противном случае недопустимо возрастает количество ложной информации на выходе РЛС. Расчет вероятности обнаружения может проводиться по аналогичной схеме. Если цель флуктуирует с Рэлеевскими флуктуациями, т.е. рассматривается модель «Сверлинг-1» или «Сверлинг-2» (это наиболее часто используемое предположение), то закон распределения вероятности амплитуды импульса в испытуемом дискрете после квадратичного детектора будет также экспоненциальным. Поэтому вероятность обнаружения будет равна вероятности ложной тревоги, рассчитанной для случая, когда в испытуемом дискрете присутствует дополнительное воздействие q, где q - это отношение сигнал / шум. При этом, если помеха средней интенсивности у/ присутствует на входе к дискретов вектора наблюдений, а для остальных п-к помеха на входе отсутствует, получим sx = s2 =... = sk = у/ +1, sk+l = sk+2 = ... = $„= 1, s0=q + l и вероятность обнаружения составит: 1 + Я v у/ + \ ^77 1 + Я- 1 V я+1 \к-п если помеха отсутствует в испытуемом дискрете и \~к ( 1 \к-п 1 + Я- у/ + \ q + y/ + \ 1 + Я- 1 V q + y/ + \) при наличии помехи в испытуемом дискрете. Соответственно для случайного воздействия помех будем иметь: ^„(o)=Zc„V(i-^r к=0 1 + Я у/ + \ \к-п 1+- q + l к=0 1 + Я у/ + \ 7+г \п-к 1-р ч 4+1 1 + Я у/ + 1 4+Т 1-р я <7 + 1 у 209
Глава 5 ^„0)=Zc„v(i-^r *=0 к if # + ^ + 1 1 + \П-к 1-р 1 + V ^ + 1 q + y/ + \ 1-р \к-п q + y/ + \ q + y/ + \ Выражение для полной вероятности обнаружения примет вид: Робп=Р 1-/7 1 + А — 1 + # + ^ + 1 g + y/' + l 1 + Я у/ + \ 7+Т 1 + Я- 9 + 1 Еще одной моделью помех прерывистого характера, воздействующих на PJIC, является ступенчатая помеха, представляющая собой скачкообразное увеличение мощности на определенном интервале дальностей. Эффект возрастания ложной тревоги в подобных помехах исследован в работе [221; 351], где показано, что возрастание количества ложных выбросов может составить 1...2 порядка, что также недопустимо. Таким образом, рассмотренный метод имеет крупные недостатки, которые определяют практически полную его непригодность для РЛС, ведущих работу в условиях реальных действий. В целом ряде работ были предложены модификации данного метода с целью преодоления присущих ему недостатков. Однако во всех этих работах указанные недостатки рассматриваются изолированно, а не в полном комплексе взаимосвязанных проблем. В связи с тем, что они имеют антагонистический характер, устранение одного из них катастрофически обостряет остальные. Так в работе [221] для борьбы с помехами ступенчатого типа предлагается в решающую статистику (5.2) п подставлять вместо максимальную из сумм, взятых справа и сле- /=1 ва от испытуемого дискрета. При этом обнаружение групп целей сильно ухудшается даже по сравнению с неприемлемыми показателями исходного метода. В работе [309] рассмотрен вариант с цензурированием 210
Нейросетевые методы обнаружения радиолокационных сигналов опорной выборки с точки зрения выбрасывания максимальных ее элементов. В результате его применения сигналы от целей, имеющие статистически большие значения, будут исключены из опорной выборки. Однако при этом увеличивается неустойчивость стабилизации уровня ложной тревоги при импульсных и ступенчатых помехах. Подробнее этот вариант рассмотрен ниже. Возможен также вариант модификации рассмотренного метода, основанный на исключении из состава опорной выборки ранее обнаруженных сигналов от целей. Однако, вследствие того, что обнаружение всех целей производится тем же методом, при работе по группам целей, вероятность их исключения из опорной выборки весьма низка и указанная модификация не позволяет существенным образом повысить эффективность обнаружения групп целей. Кроме того, использование этого варианта приводит к возрастанию уровня ложных тревог в нестационарных шумовых помехах, что объясняется заниженной оценкой мощности помех из-за исключения из опорной выборки помеховых импульсов, которые не отличаются от сигналов от целей. Так, например, ступенчатая помеха будет для такой модификации адаптивного порога совершенно непреодолимой из-за того, что на рубеже изменения интенсивности помех уровень ложных тревог возрастет до значений, сравнимых с вероятностью обнаружения целей. Таким образом, можно заключить, что рассмотренный метод автоматического обнаружения, также как и его модификации, не удовлетворяет предъявленным требованиям ни по качеству обнаружения групп целей, ни по стабилизации уровня ложных тревог в нестационарных помехах, что определяет недопустимость его применения в РЛС. 5.1.2. Ранговые обнаружители и знаковые корреляторы. Наряду с методами автоматического обнаружения, основанными на адаптивном пороге, применяются также обнаружители, использующие фазовые соотношения в многобазовых сигналах (знаковые корреляторы) и ранговые методы. В знаковых корреляторах, которые применяются при использовании многобазовых сигналов, реализуется жесткое, на уровне собственных шумов приемника, ограничение с последующей корреляционной обработкой [4; 105]. Обычно жесткое ограничение заменяется выделением знака сигнала. Наиболее последовательно такой вид обработки реализуется при обработке фазокодоманипулированных (ФКМ) сигналов [105]. Принимаемый сигнал разделяется на отдельные короткие участки, равные длительности сжатого сигнала, в которых при излучении проводится манипуляция фазы на углы 0 или р. Затем определяются знаки сигнала на каждом участке и эти знаки складываются на корреляторе в соответствии с выбранной для излучения кодовой последова- 211
Глава 5 тельностью. При неизвестной начальной фазе сигнал раскладывается на две квадратурные составляющие, которые после коррелятора суммируются. Решение о наличии цели принимается в том случае, если полученное значение превзойдет пороговый уровень. Формальная запись решающей статистики U имеет вид: ( N и = V /=1 ( N ^(ijsignfo) + ^I(i)sign(^.) V /=1 (5.12) Здесь xt и у{ - квадратурные составляющие принятого сигнала, N - его база, а коэффициенты L(i) определяют заданную кодовую последовательность (обычно М- последовательность). Если принятый сигнал содержит только шум, каждая из сумм описывается смещенным биномиальным распределением, которое при достаточно больших N может быть аппроксимировано нормальным законом с нулевым математическим ожиданием и дисперсией N . При этом решающая статистика (5.12) описывается экспоненциальным распределением: р{и)=ехр{'ш]' (513) С помощью выражения (5.13) легко рассчитывается величина порогового числа С , с которым сравнивается решающая статистика, в зависимости от заданного уровня ложной тревоги Fm : С = - 2 N \n{Fnm). (5.14) Для не слишком малых значений Fm аппроксимация (5.13) достаточно точно описывает решающую статистику (5.12). Однако при Fm =10~5...10~6 ошибка становится значительной и пользоваться выражениями (5.13) и (5.14) нельзя. Для точного расчета значений порогового числа С следует воспользоваться формулами для биномиального распределения. Возникающие при этом трудности связаны, в основном, с невозможностью точной записи биномиальных коэффициентов высокого порядка в машинной арифметике, использующей 16; 32 и даже 64 разряда. В связи с этим была создана специальная программа, оперирующая числами с 512 двоичными разрядами, для точного расчета пороговых чисел С . Разница между рассчитанными с помощью выражения (5.14) и точными значениями С для величины базы N = 121 становится ощутимой при FnT < 10~4 . 212
Нейросетевые методы обнаружения радиолокационных сигналов Для определения вероятности обнаружения сигнала с заданными фазой и амплитудой можно с полным основанием воспользоваться аппроксимацией нормальным законом каждой из квадратурных составляющих решающей статистики, так как в этом случае наиболее важна центральная часть распределения. Введем обозначения: Рх - вероятность того, что величина L(/)sign(jc/) примет значение 1, и Р - то же для другой квадратурной составляющей. Тогда каждая из сумм будет описываться нормальным распределением с параметрами: E{Za} = N (2Р-1); D{Za} = 4N Р (5.15) Здесь вместо подстрочного индекса а следует подставить обозначения х или у. Для расчета вероятности обнаружения при такой схеме обработки была составлена статистическая модель, в которой для флуктуирующей по первой модели Сверлинга цели рассчитывались вероятности Рх и Р . Затем в соответствии с параметрами (5.15) задавались нормально распределенные случайные числа, по которым и определялся факт обнаружения цели. Такой алгоритм позволяет на порядок сократить требуемое для расчетов машинное время. Для повышения точности расчетов применялись ЛПт-последовательности. Проведенные расчеты показали, что рассматриваемый метод имеет значительные (3...4 дБ) энергетические потери по сравнению с классическим. Следует отметить, что этот метод, также как и адаптивный обнаружитель (5.2), снижает свою эффективность при работе по группе целей. Это связано с нелинейностью обработки. Кодовые последовательности (М-последовательности) обычно выбираются таким образом, чтобы обеспечить минимальный уровень боковых лепестков сигнала по дальности. Поэтому даже при сильном перекрытии несжатых импульсов, отраженных от близкорасположенных целей, в линейном корреляторе сигналы разделяются. В знаковом корреляторе этого не происходит из-за неаддитивности функции sign(jt), входящей в решающую статистику. При малых отношениях сигнал/шум S аддитивность сохраняется в виде линейной зависимости вероятностей Рх и Р входящих в формулы (5.15), от S . Однако, при больших S линейность нарушается, так как функция нормального распределения нелинейна. При этом наблюдается «поглощение» одной цели другой. Особенно сильно это заметно при обнаружении слабой цели 213
Глава 5 на фоне более сильной. Вследствие того, что даже одинаковые цели флуктуируют, причем независимо, резко ухудшается обнаружение групп целей, несжатые отраженные сигналы от которых перекрываются. При использовании многобазовых сигналов с 7V>100, происходит перекрытие импульсов, отраженных даже от достаточно далеко удаленных целей. Например, в «зоне влияния» каждой цели при N = 121 вполне может оказаться 2...3 группы целей из 4 самолетов каждая. На основе вышеописанной модели для определения вероятностных характеристик обнаружения одиночной цели была составлена программа для расчета вероятностей обнаружения цели в группе. В этой модели расчет вероятностей Рх и Р производится с учетом величин и знаков сигналов, отраженных от соседних целей. На рис. 5.4 представлены зависимости вероятностей обнаружения от отношения сигнал/шум при отсутствии мешающих целей, а также при наличии 2, 5 и 10 одинаковых целей. Рис. 5.4. Зависимость вероятности обнаружения одиночных и групп целей от отношения сигнал/шум при использовании знакового коррелятора Анализ приведенных кривых показывает, что для случая обнаружения групп целей знаковым коррелятором, также как и для адаптивного порога, характерно недопустимое снижение вероятностей обнаружения. Очевидно, что при работе такого обнаружителя, так же как и для адаптивного порога, имеет место отрицательный уровень корреляции фактов обнаружения соседних целей в группах. Обнаружение одной из целей в группе повышает апостериорную вероятность того, что обнаруженная цель имеет высокое мгновенное отношение сигнал/помеха, а ос- 214
Нейросетевые методы обнаружения радиолокационных сигналов тальные цели, влияющие на процесс ее обнаружения, - малые. При этом апостериорная вероятность обнаружения соседних целей снижается. Поэтому, одновременное обнаружение всех целей в группе имеет вероятность значительно меньше, чем произведение парциальных вероятностей обнаружения каждой из отдельных целей. Это еще более снижает возможности применения рассмотренного метода обнаружения. Рассмотрим работу ранговых обнаружителей [4; 105]. При каждом j -м измерении (посылке одного импульса) из /V соседних с испытуемым независимых информационных каналов извлекается опорная выборка jc,y, x2j9 xNjотносительно которой вычисляется смещенный на единицу ранг г. отсчета х0- согласно выражению: гу=£*(*оу-*у)> Н*-У) = \1 Х~У (516> [0 х<у Здесь h(x-y)) - функция индикации превышения х над у. Затем, по результатам определения рангового вектора г =(г1? г2, гм) определяется решающая статистика U. Например, статистика Вилкоксона имеет вид: М М N y=i y=i /=1 Здесь М - число импульсов в пачке. Решение о наличии цели принимается путем сравнения статистик U с порогом П . Ц>П. (5.18) Данный ранговый обнаружитель подробно исследован в работах [4; 13], где показано, что при значениях М = 10...20 он имеет энергетические потери 3...5 дБ по сравнению с классическим обнаружителем по сумме отсчетов после квадратичного детектора с жестким порогом. Показано, что он сохраняет стабильный уровень ложной тревоги при воздействии негауссовых помех. В [4] отмечено снижение качества обнаружения при работе по разрешаемой группе целей, но делается вывод, что ухудшение будет незначительным. Для полного анализа его работы было проведено статисти- 215
Глава 5 ческое моделирование, в котором определялись вероятности обнаружения каждой цели в группе из 2-х, 3-х и 4-х одинаковых единиц, а также вероятности одновременного обнаружения 2-х, 3-х и 4-х целей. При расчетах рассматривались флуктуации ЭПР целей по модели Сверлинг-1 [113]. Порог П определялся на основе зависимости [4]: П 1 [U/N+1] FjlT=jL/*T i\m CMCM+U-kN-k-\ > (5-19) где Скм - биномиальные коэффициенты, а [о] означает целую часть числа. Так как при расчетах следует вычислять биномиальные коэффициенты больших порядков, то накопленные ошибки округления машинного представления чисел могут превзойти требуемую точность вычисления или даже саму величину FnT. Поэтому целесообразно воспользоваться симметрией функции Fnr[lJ): P{U>n}=P{U<MN-n} . (5.20) При этом выражение (5.19) с учетом (5.20) будет иметь вид: MN-П j [U/N+l] F™ = X л\М X CMCM+U-kN-k-l> (5-21) В случае достаточно больших значений П (П > М (N-l)), характерных для малых значений уровня ложной тревоги, выражение (5.21) упрощается: MN-П j I F™ = 2j /w л\М Cm+u-\~ . чл/ Cm+u- (5-22) (/=0 (tf + l) (# + 1) Вероятности обнаружения целей определялись после проведения большого числа реализаций попыток обнаружения сигналов на фоне гауссовых помех. Рассматривались ранговые обнаружители с различными значениями количества используемых импульсов. Результаты расчетов представлены на рис. 5.5 для М = 5 , 7V = 16 ; рис. 5.6 - М = 10 , N = 16 . Анализ результатов расчетов показывает, что для ранговых обнаружителей, так как и для других рассмотренных методов автоматического обнаружения, характерно недопустимое снижение вероятностей обнаружения целей в группах. 216
Нейросетевые методы обнаружения радиолокационных сигналов На рис. 5.1,а и б изображены кривые, описывающие совместное обнаружение пары и четверки целей для вышерассмотренных условий. Пунктиром обозначены те же вероятности для случая независимого обнаружения целей. Сравнение полученных результатов показывает, что уровень отрицательной корреляции фактов обнаружений весьма высок. Вследствие этого, на этапе вторичной обработки будет иметь место существенное снижение рубежей формирования трасс целей. 217
Глава 5 Особенно сильное влияние соседних целей в группе проявляется при малых величинах уровня ложных тревог и числа импульсов в пачке. В то же время, использование системы СДЦ в РЛС обычно предполагает разбиение всей пачки импульсов на группы (обычно по 8 импульсов), которые независимо обрабатываются в фильтрах СДЦ и на схемы первичного обнаружения поступают по одному импульсу из каждой группы. Это приводит к значительному сокращению количества используемых импульсов. Для РЛС характерны значения М порядка 5... 10. В работах [4; 13] рассмотрены модификации ранговых обнаружителей с целью преодоления описанных недостатков. Однако эти методы аналогичны рассмотренным выше вариантам улучшения метода с адап- 218
Нейросетевые методы обнаружения радиолокационных сигналов тивным порогом и не позволяют обеспечить выполнение требований, предъявляемых к автоматическому обнаружению. Таким образом, знаковые корреляторы и ранговые обнаружители имеют недопустимо низкие характеристики обнаружения целей в группах. Поэтому, несмотря на обеспечение ими стабильности уровня ложных тревог, они не могут быть рекомендованы для использования в РЛС. 5.1.3. Автоматические обнаружители на основе анализа характера помех. В связи с отсутствием эффективного аппарата для синтеза методов автоматического обнаружения, в практической разработке зачастую руководствуются эмпирическими или полуэмпирическими методами, основанными на соображениях интуитивного или самого общего характера. При этом широко распространено использование анализаторов помех [105]. Схема обнаружителя, работающего на основе анализа воздействующих помех в самом общем виде, представлена на рис. 5.8. Вход Анализатор помех 1 К1 Обнаружитель 1 К2 Обнаружитель 2 — KN Обнаружитель N Выход Рис. 5.8. Схема обнаружителя на основе анализа воздействующих помех Входной сигнал поступает на анализатор помех, в котором определяется к какому типу относится помеха в момент принятия решения. Затем на основе выявленного анализатором типа помех выбирается одна из конкретных схем обнаружителя (или решающее правило, «зашитое» в вычислительной системе РЛС), заданная на этапе проектирования для выделения сигналов на фоне помех этого типа. Достоинством такого построения системы первичного обнаружения является присущая ей физическая наглядность. Определение типа помех и дальнейшее применение алгоритма обнаружения для точно известных помех должно определять оптимальную обработку. Но только при условии абсолютной достоверности выводов анализатора помех. В то же время статистический характер вектора наблюдений, по которому принимает решение анализатор помех, не позволяет достичь такой достоверности. С точки зрения статистической теории принятия решений, 219
Глава 5 анализ помех представляет собой многоальтернативную задачу различения гипотез, решение которой само по себе является сложной математической проблемой, не имеющей однозначного решения. Основные трудности при этом заключаются в выработке правильных требований к матрице ошибок, описывающих возможные варианты неправильного определения типов помех. Традиционным подходом к этой проблеме является оптимизация вероятностей различения типов помех на основе общих соображений. Таким образом, задачи анализа помех и дальнейшего обнаружения целей на основе проведенного анализа искусственно разделяются и их оптимизация проводится изолированно, т.е. отдельно решаются задачи различения помех на основе каких-либо критериев математической статистики, например, максимума функции правдоподобия, максимума апостериорной вероятности или других, и собственно задачи обнаружения, решаемой на основе подхода Неймана-Пирсона для каждого отдельно взятого типа помех из рассмотренного набора в предположении абсолютно полной уверенности в воздействии помех именно выбранного типа. Подобное разделение задач не позволяет корректно учесть тот факт, что на вход каждого из имеющегося набора обнаружителей с определенной, отличной от нулевой, вероятностью могут воздействовать помехи любого типа. Естественно, вся схема изображенная на рис. 5.8, при этом теряет свойства оптимальности и, более того, может в некоторых случаях оказаться неработоспособной. Например, если анализатор помех решает задачу распознавания пассивных помех, для выделения целей, на фоне которых используется система СДЦ, то даже при вероятности распознавания такой помехи 0,9...0,99 (что является очень высоким, практически недостижимым, уровнем качества систем распознавания), вероятность необнаружения такой помехи, т.е. вероятность того, что обнаружитель будет работать без системы СДЦ составит 0,01...0,1 и, следовательно, вероятность ложных тревог будет при этом близка к той же величине: 0,01...0,1, так как отсутствие системы СДЦ обуславливает практически единичную вероятность ложных обнаружения сигналов от пассивных помех. Это приведет к недопустимо большому количеству ложных отметок не выходе системы первичной обработки. Кроме того, анализ помех в схеме, изображенной на рис. 5.8, осуществляется в предположении отсутствия цели в анализируемой области. При этом не учитывается тот факт, что наличие цели в векторе наблюдений приведет к искажению решающей статистики, т.е. к неправильному определению типа воздействующих помех, а, следовательно, к ухудшению процесса обнаружения. В то же время анализ помех, в первую очередь, необходим для эффективного обнаружения целей. Поэтому тип помех будет неверно определен там, где особенно важно оптимальное обнаружение - в областях. Где присутствуют цели. 220
Нейросетевые методы обнаружения радиолокационных сигналов Таким образом, традиционные методы автоматического обнаружения, основанные на использовании анализаторов помех, несмотря на присущую им физическую наглядность, имеют ряд существенных недостатков. Указанные недостатки связаны с отсутствием четкого обоснования положений, на которых основаны рассмотренные методы. Это определяет необходимость совершенствования рассмотренных методов на основе математической формализации используемых в них принципов. 5.2. Нейросетевые модели для эффективной реализации модифицированных традиционных автоматических обнаружителей Проведенный выше анализ свидетельствует о значительных трудностях, связанных с разработкой эффективных автоматических обнаружителей радиолокационных сигналов. Предлагается для повышения качества их работы в сложных условиях использовать нейросетевые методы. В соответствии с изложенной концепцией необходимо в первую очередь рассмотреть возможность решения частных подзадач, критичных для эффективности всего этапа в целом. Одновременно следует рассмотреть возможность использования параллелизации вычислений, реализуемых нейросетевой технологией, для обеспечения требуемого быстродействия. В качестве завершающего шага необходимо разработать полностью нейросетевую архитектуру для решения задач обнаружения радиолокационных целей. В соответствии с этим в первую очередь рассмотрены методы автоматического обнаружения, имеющие преимущества перед известными по качеству работы, и специальные нейросетевые методы для их программной реализации. 5.2.1. Формальная постановка задачи обнаружения целей в неизвестных помеховых условиях. Рассмотрим работу обнаружителя, который проводит разделение входных данных на два класса. Пусть распределение вектора входных сигналов х для нейронной сети в случае наличия интересующих пользователя объектов задано плотностью вероятности р(х), а в случае их отсутствия - f(x). Любое нерандомизированное решающее правило можно описать как некоторую критическую область в пространстве векторов входных сигналов. При попадании входного сигнала в эту область принимается решение о наличии искомого объекта. В противном случае принимается решение о его отсутствии. На рис. 5.9 изображен пример такой критической области Q для случая двухмерного пространства входных сигналов. Верхняя часть соответствует критической области присутствия 221
Глава 5 сигнала от цели, а нижняя - наличия только помех. Граница между этими областями называется разделяющей поверхностью. В общем случае она нелинейна и может иметь весьма сложный вид. Качество распознающего устройства в случае двух классов однозначно определяется парой вероятностей ошибок 1-го и И-го рода: вероятностью обнаружения цели Робн и вероятностью ложной тревоги Fm . Существует несколько подходов к выбору оптимальных решающих правил (критических областей) для систем распознавания. Наиболее широко известным и часто применяемым является Байесовский критерий максимума апостериорной вероятности. В этом случае предполагается, что пользователю известны априорные вероятности появления объекта Робъект и его отсутствия (?объект = 1 - Объект • С помощью известной теоремы Байеса, используя их и вероятности обнаружения и ложной тревоги, рассчитываются апостериорные вероятности наличия искомого объекта и его отсутствия: Рис. 5.9. Критическая область Q для двухмерного пространства входных параметров р объект р(*) 1 апостер ^объект № ^объект Р{х) + Оы>ъж/{х)' (5.23) Решение принимается в пользу гипотезы, для которой значение апостериорной вероятности достигает максимума [71; 72], т.е. объект считается обнаруженным, если выполняется соотношение Pmociq> > бапостер или /(*) объект (5.24) Последнее соотношение как раз и задает решающее правило или критическую область, при попадании в которую входного вектора, принимается решение о наличии объекта. Отношение отношения правдоподобия. 222 Р(х) № носит название
Нейросетевые методы обнаружения радиолокационных сигналов Если пользователь не обладает достоверной информацией о вероятностях появления искомого объекта или его отсутствия, то принцип индифферентности предпочтений требует, чтобы априорные вероятности наличия объекта и его отсутствия были равными между собой. Такое назначение априорных вероятностей может наталкиваться на ряд противоречий, например, в случае, если какое-нибудь из рассматриваемых событий является само по себе сложным. В этом случае правомерно рассмотреть группу элементарных событий, включающую в себя все частные события, которые в случае отсутствия информации также должны рассматриваться как равновероятные. Но в этом случае назначаемые априорные вероятности, естественно будут отличаться от первоначальных. Несмотря на это явное противоречие, а также ряд возражений общеметодологического характера, рассмотрение равновероятных априорных вероятностей при отсутствии какой-либо информации стало сложившейся практикой и широко используется во многих приложениях. В этом случае решающее правило редуцируется к: то есть к правилу максимума функции правдоподобия. Таким образом, критерий максимума апостериорной вероятности может рассматриваться как обобщение критерия максимума функции правдоподобия. Критерий максимума апостериорной вероятности опирается только на априорные вероятности событий, приписывая собственно ошибкам одинаковую важность. На практике ошибки пропуска объекта и ложной тревоги имеют неодинаковый уровень значимости. Для правильного выбора системы распознавания необходимо корректно учитывать важности этих ошибок. Такой учет проводится в критерии среднего риска. В этом случае предполагаются известными потери (риск) потребителя при принятии ошибочных решений: ЬР в случае пропуска объекта и LQ в случае ложного обнаружения, когда объекта на самом деле нет. Распознающее устройство считается оптимальным, если с его помощью достигается минимум функции среднего риска или потерь пользователя. Средний риск L пользователя может быть рассчитан как математическое ожидание потерь, т.е.: Можно показать [71; 72], что оптимальное с точки зрения критерия минимума среднего риска решающее правило реализует сравнение отношения правдоподобия с некоторым порогом, значение которого выбирается исходя из конкретных значений априорных вероятностей ^объект > бобъект и потерь пользователя Lp , LQ . Если эти величины при- Р(х)>/(х), (5.25) (5.26) 223
Глава 5 нимают равные значения для случаев наличия и отсутствия искомого объекта, критерий среднего риска редуцируется к критерию идеального наблюдателя, в качестве которого рассматривается пользователь, стремящийся минимизировать среднюю вероятность ошибки: А:редн= (0-^o6„) + ^T)/2- (5.27) Часто пользователь системы распознавания не может заранее задать величины своих потерь в случае ошибок, кроме того, как это часто бывает на практике, определить хотя бы приблизительные значения априорных вероятностей очень затруднительно или вообще невозможно. В этом случае использовать формализм байесовских решений в прямом виде не удается и используется критерий Неймана-Пирсона. При этом пользователь фиксирует допустимый для него уровень ложных тревог, выше которого вероятность ложного обнаружения объекта подниматься не должна, и требует достижения минимума ошибки пропуска объекта или, что то же самое, максимума вероятности обнаружения объекта в случае его наличия. Именно этот критерий наиболее широко используется в радиолокации. Лемма Пирсона, описывающая этот случай утверждает, что и в этом случае оптимальным решающим правилом будет сравнение отношения правдоподобия с некоторым порогом Рог, значение которого зависит от выбранного уровня ложной тревоги /глткрит и плотности распределения входного вектора при отсутствии объекта f(x): ^гЧЯГ= J f{x)ax. (5.28) Щ>Рог Вероятность обнаружения для такого распознающего устройства будет определяться интегрированием по той же области > Рог /(*) плотности распределения входного вектора при отсутствии объекта р(х): Робн= J p(x)dx. (5.29) Интересно, что все рассмотренные критерии приводят к математически эквивалентным решающим правилам, которые состоят в сравнении отношения функций правдоподобия с некоторым порогом, выбор которого зависит от конкретных численных значений характеристик, описывающих предпочтения пользователя. Так как функции правдопо- 224
Нейросетевые методы обнаружения радиолокационных сигналов добия обычно являются резко изменяющимися функциями с экспоненциальным характером поведения, часто вместо функций правдоподобия рассматриваются их логарифмы. Вследствие монотонности такого преобразования, полученные решающие правила эквивалентны исходным, при этом вместо отношения функций правдоподобия рассматривается разность их логарифмов, т.е. решающее правило: Р(*) № >Рог преобразуется к виду \n(p(x))-\n(f(x))>Porx (5.30) (5.31) Если функции р(х) и f{x) известны и достаточно просто вычисляются, то принятие решения об отнесении входного вектора х к тому или иному классу становится тривиальной задачей, однако, в конкретных приложениях такая задача практически никогда не встречается. Часто оказывается, что функции распределения для сигналов х известны с большими погрешностями или известны достаточно точно, но выражаются сложными функциями, трудно реализуемые в цифровых устройствах обработки. Даже если считается, что функции р(х) и f(x) достаточно хорошо аппроксимируются известными законами, небольшие погрешности аппроксимации могут вести к необходимости существенного изменения решающих правил. Если же таких уточнений не делать, ошибки распознавания (обнаружения объекта) могут стать недопустимо большими. Рассмотрим простой пример. Пусть функции плотностей распределений p(xt) и /(*,) задаются экспоненциальными с различными параметрами: р(х)-- 1 -ехр 2> /(х) = ехр ~^xi (5.32) В этом случае оптимальное решающее правило состоит в сравнении с порогом. Если используется критерий Неймана-Пирсона с i заданной вероятностью ложной тревоги, например, FnT° = 10-6, то рассчитанное пороговое значение составит Por = -ln(l0~6)«13,8. Если за- 8—5782 225
Глава 5 данные при синтезе распознающего устройства плотности вероятностей не совсем точны, например, плотности вероятности /(*,•) являются на самом деле s - загрязненными экспоненциальными распределениями: /(х,) = (1-*)1ехр(-^) + Д«р(-^) (5.33) с очень малым параметром £ - 0,01, но значительным Л (Л = 10). При этом для сохранения того же среднего значения, что и в исходном случае, величина а равна а = ——^-«0,91. Отличие истинного значения 1-0,01 плотности распределения от его аппроксимации очень мало и составляет не более нескольких процентов, что практически по всем обычно применяющимся тестам согласия позволяет считать аппроксимацию допустимой. Однако анализ приведенного выражения свидетельствует, что, если оставить прежнее пороговое значение, уровень вероятности ложной тревоги возрастет на несколько порядков. Для обеспечения заданного уровня FnT° = 106 пороговое значение должно быть увеличено до величины, которую можно аналитически оценить приблизительным выражением: Рогх « Л In С у^крит \ : Л In [FT) - Я In (е) * Л Рог10, (5.34) где PorlQ - порог для стационарных помех, т.е. уровень порогового значения должен быть увеличен почти в десять раз. Поэтому для корректного решения задач обнаружения объектов аппроксимацию функций распределения следует проводить не отдельно для каждой гипотезы, а с учетом обеспечения минимальных ошибок приближения отношения функций правдоподобия или их логарифмов. Может случиться так, что плотности распределения случайных векторов известны достаточно точно, но выражаются сложными функциями, трудно реализуемыми в цифровых устройствах обработки. В этом случае также прибегают к аппроксимациям, пытаясь приблизить сложно вычислимые функции наборами простых функций, реализуемых цифровыми или аналоговыми устройствами. Эта задача аналогична предыдущей, поэтому при ее решении должны быть использованы те же подходы. Таким образом, даже в тех случаях, когда считается, что разработчик распознающего устройства знает распределения входных векторов, полагаться на эти знания нельзя. Необходима оценка точности этих распределений и выбор адекватных аппроксимаций, которые в общем слу- 226
Нейросетевые методы обнаружения радиолокационных сигналов чае имеют весьма нетривиальный характер. Да и сам процесс выбора не может основываться на традиционных статистических процедурах, он должен быть ориентирован на конечное качество процесса обнаружения, что превращает синтез алгоритмов в сложную оптимизационную задачу. Однако для многих задач вид плотностей распределений для случаев наличия искомого объекта и его отсутствия заранее неизвестен. В этих случаях тем более необходимо построение решающих статистик осуществлять на основе некоторого оптимизационного процесса, который позволит обеспечить требуемую для потребителя эффективность. При автоматической обработке радиолокационной информации наиболее трудоемкой в вычислительном отношении является задача обнаружения импульсов, отраженных от радиолокационных целей на фоне разнотипных помех. Эта задача сложна как в теоретическом отношении, так как требуется найти приемлемое решение, работоспособное в сильно различающихся внешних условиях, так и в практической реализации из-за необходимого большого объема вычислений. Преимущества нейросетевой технологии как раз и позволяют преодолевать такие трудности. В настоящем разделе реализована методология использования нейронных сетей при обработке радиолокационной информации, в задачах обнаружения радиолокационных импульсов. Для построения одноимпульсной процедуры обнаружения, которая сохраняет (или изменяет в допустимых пределах) свои характеристики при изменении внешних условий, необходимо определить область возможных изменений параметров воздушной и помеховых обстановок [58; 107; 127] и при синтезе алгоритмов ориентироваться на наиболее неблагоприятные условия. В статистической теории принятия решений показано, что оптимальный с точки зрения принципа гарантированного результата алгоритм обеспечивает минимальный байесовский риск для наихудших условий при значениях функции потерь, выбираемых в зависимости от заданного уровня ложной тревоги [71; 72; 107]. Согласно результатам [172; 261] необходимо обеспечить обнаружение целей как одиночных, так и групп в составе четырех, сохраняя при этом постоянный уровень ложных тревог в помехах, имеющих нестационарный характер. Для этого необходимо определить плотности распределений вектора наблюдений для всех возможных ситуаций, определяемых воздушной и помеховой обстановками. Для сохранения свойств алгоритма при изменении мощности помех будем пользоваться плотностями распределения максимального инварианта для преобразования масштаба, т.е. вместо вектора наблюдений 227
Глава 5 x = (xQ9xl,...,xN) будем использовать вектор z =(z0,z1,...,zAr), элементы которого записываются в следующем виде: 14 Z*< '=0 (5.35) Этот вектор в дальнейшем для удобства также будем называть вектором наблюдений. В случае, когда присутствует только непрерывная шумовая помеха, плотность распределения при отсутствии цели /(z), имеет вид: /(£) = const, (5.36) а в предположении наличия цели с отношением сигнал/помеха J, 1 p(z) = - 1- s zo 541 n * (5.37) При наличии в составе вектора наблюдений отражений от нескольких одинаковых целей плотности распределения равны: -N / . . \-N /00 = — лг—1 - к-1 7=1 (5.38) Здесь к - общее количество целей в группе (& = 1,Z,), а номера элементов опорной выборки, в которых находятся цели, могут принимать любые значения j = l,N. Наличие прерывистых помех в векторе наблюдений приводит к дальнейшему усложнению выражений для плотностей вероятностей: /(*) = 1 k-lf L Г Zh-^Z2* 7=1 V Y /=1 /у (5.39) - аг-1 L \\ Здесь /7 обозначают номера дискретов, в которых присутствуют помеховые импульсы. В частном случае «ступенчатых» помех номера 228
Нейросетевые методы обнаружения радиолокационных сигналов И следуют последовательно. L - общее количество помеховых выбросов в векторе наблюдений, a j - отношение помеха / шум. Необходимо выбрать из выражений (5.36)-(5.39) наиболее правдоподобные f(z) и p(z) по L и К и по ним провести различение гипотез, т.е. следует определить максимум по L и К от функций Рмл /(Ю и' ам,к p(z) определяемых соотношением (5.39), и вычислить порог обнаружения для испытуемого дискрета по сумме сигналов опорной выборки с исключением элементов, искажающих оценку средней мощности помех. Это следует из предположения S»1, Я»1. Полученную решающую статистику можно записать в виде: *0>Л X Я> '=Ктя* +1 N-Nm 2>>4- Z *> <5-4°) *'=1 '=^тах+1 N N-Nmin ''=^-JVmin+l ' = #тах+1 Здесь у представляет собой упорядоченный по координатам в порядке убывания исходный вектор х, а величины Nmin и Nmax определяют количество минимальных и максимальных отбрасываемых элементов опорной выборки. Константы и выбираются таким образом, чтобы обеспечить решение минимаксной задачи оптимизации характеристик обнаружения, а пороговое число X определяет уровень ложных тревог. 5.2.2. Субоптимальный алгоритм обнаружения радиолокационных импульсов. Процедура (5.40) весьма сложна как в процессе ее синтеза, так и при реализации вычислений в РЛС. Поэтому целесообразно использовать аппроксимацию с однозначно заданными числами #min И Nmax . Представляет интерес тот факт, что полученная процедура является своего рода объединением метода обнаружения с адаптивным порогом и рангового обнаружителя. В результате такого совпадения должны быть обеспечены небольшие энергетические потери обнаружения при сохранении устойчивости в импульсных шумовых помехах и при обнаружении групп целей. 229
Глава 5 Решающая статистика полученной процедуры записывается в виде: х0>Л £ yi9 . (5.41) '■=#тах+1 где х0 - величина сигнала в испытуемом дискрете, yt[i = \,N^ - значения элементов упорядоченной опорной выборки, N - размер опорной выборки, Л - пороговое число. Выбор чисел 7Vmin и Nmax должен осуществляться таким образом, чтобы обеспечить удовлетворение двум противоречивым условиям: 1) обеспечения требуемых характеристик обнаружения в случае наличия в опорной выборке отражений от нескольких целей и 2) сохранения требуемого уровня ложных тревог при воздействии на РЛС обнаружения нестационарных помех. Рассмотрим работу этого метода обнаружения подробнее, сначала в условиях стационарного гауссова шума, а затем при воздействии прерывистых помех. В стационарных помехах ее эффективность описывается следующим утверждением. Утверждение. Пусть адаптивный обнаружитель реализует ре- шающее правило х0> Л ^ xt, а входные сигналы описываются экс- поненциальным распределением для помех и моделью Сверлинг 1 для целей. Тогда справедливы следующие соотношения, описывающие вероятностные характеристики обнаружителя: 1. Уровень ложных тревог описывается выражением: N-N, п ( (i-N W X i=N-N, (5.42) N П 2. Вероятность обнаружения для целей в составе группы из двух одинаковых самолетов при полном перекрытии опорных выборок составляет: 230
Нейросетевые методы обнаружения радиолокационных сигналов (5.43) /=/v-^max+iv //(0 = 2я. Вероятности обнаружения для целей в составе группы из k +1 одинаковых самолетов при полном перекрытии опорных выборок описываются выражением: ^об„=(^-К + 1)! {S+if-** N-K+2 N-K + 2 N-K+2 Nm i=l A(/-#max)V' '1=1 '2=1 /*-1=а'-1 /=1 /v-/vm '=*max+1 N S + l /=tf-/vmax+lV У=1 U j*h л;>/2л...лу^^_1 (5.44) где 5 - отношение сигнал/помеха, одинаковое для всех целей в группе. Аналогичные результаты были получены позже в работах [176; 229; 280]. Проведенные в соответствии с полученными выражениями расчеты вероятностей обнаружения одиночных и групповых целей показали, что наихудшие значения получаются при обнаружении групп в составе четырех целей. На рис. 5.10 для этого случая представлены зависимости вероятностей обнаружения целей от отношения сигнал/помеха при :0, 2, 4; ;Vmin=0, 5, 10; # = 16. 231
Глава 5 1,0 0 #min=5 О 10 20 30 40 С/Ш,дБ Рис. 5.10. Зависимость вероятности обнаружения четверок целей от отношения сигнал/шум при использовании устойчивой одноимпульсной процедуры с различным числом исключаемых максимальных и минимальных сигналов Для сравнения на рис. 5.10 пунктиром изображена кривая для классического обнаружителя Неймана-Пирсона. Анализ полученных результатов показывает, что зависимость энергетических потерь от выбора числа N незначительна. Наименьшие потери обеспечиваются при N = 4. Расчеты вероятностей одновременного обнаружения целей в группе данной процедуры показали, что с точностью до 5% обнаружение целей осуществляется независимо, коэффициент корреляции близок к нулю. Анализ соотношения (5.44) показывает, что явление «насыщения» вероятности обнаружения при бесконечно больших величинах S , которое характерно для классических методов автоматического обнаружения, в данном случае не имеет места при К < NmAX +1. При К > NmaK +1 максимально допустимой вероятностью является значение: которое, очевидно, значительно выше, чем описываемое выражением для традиционного метода обнаружения с адаптивным порогом. Анализ количества ложных обнаружений необходимо проводить по наихудшему для данного метода распределению помех. Следует учитывать при этом, что разработанная процедура описывает первый этап м-к. чпах к. (5.45) 232
Нейросетевые методы обнаружения радиолокационных сигналов 10 2. А пом/шум = 100 пом/шум = 50 Рис. 5.11. Зависимость уровня ложных тревог, обеспечиваемого устойчивой одноимпульсной процедурой в нестационарных помехах, от числа исключаемых минимальных сигналов Полученные результаты показывают, что при 7Vmin=8...10 обеспечивается достаточно высокая устойчивость уровня ложных тревог. Однако полной стабилизации при этом алгоритме не достигается, что свидетельствует о необходимости дополнительных усилий по устранению этого недостатка на этапе пачечной обработки. В [105] рассмотрен процесс обнаружения пачки импульсов при отсутствии опорной выборки. Исходя из анализа отношений правдоподобия, синтезирован следующий алгоритм. В полученном векторе наблюдений X производится t обнаружения по одиночному импульсу. Поэтому требуемый уровень ложных тревог на этом этапе может составлять Ю-1... 10~2. Теоретически возможно провести анализ вероятности ложных тревог, основываясь на выражении (5.44). Однако объем расчетов при этом будет больше, чем для статистического моделирования. Поэтому расчеты проводились методом Монте-Карло с использованием ЛТт- последовательностей. На рис. 5.11 представлены результаты расчетов вероятности ложных тревог от количества отбрасываемых минимальных дискретов Nmin при значении скважностей помех Q = 2,5 и при отношениях помеха/шум у/ = 5,20 для Fj?n =10"2 . 233
Глава 5 покоординатное ранжирование сигналов в порядке возрастания, а решающая статистика записывается в виде отношения порядковых статистик отранжированного вектора Y: 7//Гт>С, 1<т. (5.46) Для полученного метода обнаружения наличие помех прерывистого типа может только снизить вероятность ложной тревоги по сравнению с непрерывными шумовыми помехами вследствие усиления различий между распределениями помех и сигналов, отраженных от целей. Из этого следует, что наиболее неблагоприятным распределением при наличии помех является стационарный гауссов шум. Для сигнальных отсчетов существует наиболее неблагоприятное распределение помех, представляющее собой их импульсную модуляцию с некоторой вероятностью. При этом при достаточно больших отношениях помеха/шум получаемые распределения максимальных инвариантов получаются из исходных выбрасыванием определенного числа максимальных и минимальных дискретов из вектора наблюдений. Таким образом, структура метода обнаружения не меняется. Отсутствие опорной выборки обуславливает значительные потери (до 10... 15 дБ) по сравнению с классическим обнаружителем, работающим по шумам известной интенсивности [9]. Однако данный метод может быть использован как дополнительный, улучшая качество статистик по импульсам, а также для исключения из опорной выборки одноимпульсной процедуры сигналов от целей. Следует отметить, что предложенный метод обнаружения не снижает своих характеристик при работе по группам целей, так как полностью не зависим от соседних элементов дальности. Кроме того, при воздействии нестационарных помех уровень ложных тревог не увеличивается, как это происходит в традиционных методах, а уменьшается. Это связано с тем, что гауссов шум является наиболее неблагоприятным распределением помех для предложенного метода. Таким образом, разработанная процедура может способствовать дополнительному улучшению характеристик автоматического обнаружения при ее комплексировании с другими методами. 5.2.3. Нейросетевые алгоритмы эффективного ранжирования опорной выборки. Анализ вычислительной сложности предложенных алгоритмов показывает, что наибольшие сложности вызывает процедура сортировки. Рассмотренные выше процедуры обнаружения радиолокационных импульсов большую часть времени расчетов затрачивают на упорядочивание элементов вектора наблюдений (испытуемого дискрета совместно с опорной выборкой или пачки импульсов от цели). 234
Нейросетевые методы обнаружения радиолокационных сигналов Действительно, известно, что для проведения сортировки, требуется провести, по крайней мере, [log2 N] сравнений, где уУ - размерность вектора наблюдений, а [•] обозначает целую часть числа. Наиболее простая процедура упорядочивания требует o(/V2) операций, а наилучшие из известных к настоящему времени алгоритмы способны осуществлять упорядочивание за 0(N \og2N) операций. При внедрении нейросетевой технологии в процессы обработки радиолокационной информации следует в первую очередь рассмотреть возможность выделения нейросетевых аппаратных и алгоритмических решений для поддержки традиционных методов обработки радиолокационной информации. Нейронные сети могут успешно применяться для ранжирования векторов с высокой вычислительной эффективностью [22]. Так ИЗ- Выход вестна реализация многослойного персептрона с жестко заданными связями, позволяющая за один такт работы получать отсортированный вектор [271]. Такая сеть состоит из каскадированных элементов, фрагмент которой приведен на рис. 5.12. Другим вариантом использования *° Вход нейронной сети для проведения сортировки является сеть MAXNET [271; 361] с Рис. 5.12. Фрагмент сети латеральными связями, которая за для С0РТИР0ВКИ вектора, конечное число шагов осуществляет осуществляющий выбор максимального элемента выделение максимального элемента за счет из пары входов подавления всех меньших входов. Указанные варианты нейросетевой сортировки для достижения выигрыша в скорости при сортировке требуют использования специализированных параллельных аппаратных средств. В то же время, выигрыш во времени расчетов можно получить и алгоритмическим путем. Известно, что стандартный алгоритм Кохонена способен очень быстро осуществлять операцию сортировки. При этом величины, которые подлежат сортировке, образуют вектор входных значений для самоорганизующейся нейросети. Нейроны сети, начав со случайных значений весов, адаптируются к распределению входных величин в ходе обучения. После обучения каждый элемент входного вектора соотносится с одним из выходных нейронов, которые, собственно, и образуют вектор отсортированных входных величин. Анализ работы самоорганизующейся сети Кохонена показывает, что сортировка происходит очень быстро и частично даже улучшает известное ограничение по [log2 N] сравнений, затрачивая O(N) операций. 235
Глава 5 Рассмотрим работу собственно сортировки в самоорганизующейся сети Кохонена. Анализ показывает, что она может быть представлена следующим алгоритмом [185; 186]. Основная идея заключается в представлении N чисел в виде гистограммы с N интервалами. Если в заданный интервал попадает только одно из чисел сортируемой выборки, то положение интервала однозначно определяет место этого числа в отсортированной выборке. Если в интервал одновременно попало К чисел, процедура применяется рекурсивно. Данный алгоритм может быть формализован в следующем виде: Шаг 1. Найти минимальное т и максимальное М значения N чисел. Шаг 2. Расположить N -2 оставшихся чисел в N интервалов, равномерно распределенных на отрезке [т, М]. Шаг 3. Последовательно просмотреть полученную диаграмму, предпринимая следующие действия в зависимости от количества (К) чисел, попавших в интервал: если К = О, пропустить интервал; если, К = 1 дополнить выходной массив отсортированных значений данным числом; если К > 1, рекурсивно повторить ту же процедуру для К чисел. Время сортировки на каждое число для данного алгоритма не зависит от N, в то время как для наилучшего из известных алгоритмов Heapsort, имеет место рост числа операций пропорционально [log2 N]. Шаги 1, 2 и 3 данного алгоритма требуют проведения aN операций {а - константа), после которых могут остаться неотсортированными pN чисел (0 < р < ——— < 1). В наихудшем случае, когда все N Л (N-2) _ N-2 числа попадают в один интервал, р = . Общее число опе- N раций для сортировки N чисел - S(N) равно: S(N) = aN + S(pN) = aN + apN + S(P'pN) , (5.47) где 0<1'<^~4?</?<1. (N-2) (5.48) Учитывая, что функция = при х<1, получим следующее выражение: 236
Нейросетевые методы обнаружения радиолокационных сигналов S(N) = aN(\ + р + р2 + рг +...) = Подставив верхнюю границу aN (N-2)) N (5.49) в это выражение, получим, что для наихудших распределений количество операций при сортировке имеет ровно S(N) ~~N2 операций, т.е. имеет порядок о(/V2). Если же параметр р для рассматриваемого распределения чисел равен константе, то порядок числа операций равен 0(/V) . Известно, что доля распределений, в которых имеется интервал, содержащий К или более чисел, экспоненциально уменьшается с ростом К . Проведенный анализ позволяет объяснить высокое быстродействие сортировки в нейросетевом алгоритме самоорганизующихся сетей. 5.2.4. Нейросетевое представление накопления пачек радиолокационных импульсов. При обнаружении радиолокационных целей обычно используется несколько импульсов, которые накапливаются для улучшения характеристик обнаружения. При работе в стандартных гауссовых шумах по цели с независимыми флуктуациями совместная плотность распределения для пачки импульсов х равна: />(*)=ехр 5 + 1 м , 5 + 1 (5.50) Здесь М - это длина пачки, a s - среднее отношение сигнал/помеха. При отсутствии цели чисто шумовая пачка имеет распределение: Г М \ /(х)=ехр -2> Логарифм отношения правдоподобий равен: In 5 + 1 4-f (5.51) (5.52) Отсюда следует, что оптимальный накопитель для гауссовых помех должен сравнивать сумму импульсов с порогом. Однако при нестационарных помехах, таких как, например, хаотическая импульсная помеха, традиционный сумматор перестает быть оптимальным алгоритмом. Действительно, плотность распределения для помеховых сигналов записывается в виде: 237
Глава 5 м | Р - (5.53) где Р1тр - вероятность появления импульса. При наличии цели плотность распределения принимает вид: и*)=П imp s + q + \ S + ^ + l \-Р imp S + \ (5.54) Очевидно, что выразить отношение правдоподобия в этом случае так же просто, как и для стационарных помех, не удастся. Поверхности постоянного уровня для отношения правдоподобия становятся сложными нелинейными поверхностями, не представимыми в виде простых функций. На рис. 5.13 изображены линии уровня этой функции в зависимости от амплитуд сигналов в двух импульсах. Фактически каждая линия уровня представляет собой проекцию разделяющей поверхности на плоскость, порождаемую двумя выбранными импульсами. Интересно отметить, что при малых значениях отношения правдоподобия, что соответствует достаточно высоким вероятностям ложной тревоги ~10_1...1(Г2, разделяющая поверхность близка к гиперплоскости, которая оптимальна для стационарных помех [113; 115]. В то же время, при низких вероятностях ложных тревог, т.е. больших отношениях правдоподобия, отклонение от плоского вида становится все сильнее.
Нейросетевые методы обнаружения радиолокационных сигналов Рис. 5.14. Представление линейного и критерийного накопителя в виде однослойной нейронной сети Критерийный накопитель, в отличие от сумматора, способен обеспечить достаточно высокую стабилизацию уровня ложных тревог в импульсных помехах. Действительно, если для сумматора уровень ложных тревог при воздействии импульсных помех возрастает на несколько порядков, достигая совершенно неприемлемых значений порядка 10~2 и даже выше, то для критерийного накопителя увеличение ложных тревог значительно меньше и не превышает нескольких раз, что вполне допустимо (см. рис. 5.15.) Рис. 5.15. Зависимость уровней ложных тревог от относительной мощности импульсных помех для линейного и критерийного накопителей Известно, что для борьбы с импульсными помехами широко используется критерийное накопление сигналов. Схематично работу крите- рийного накопителя можно представить как жесткое пороговое устройство, за которым следует обычный сумматор. Таким образом, оба накопителя, линейный и критерийный можно представить в виде простой однослойной нейронной сети, в которой реализуются функции активации нейронов линейная или пороговая, соответственно (см. рис. 5.14). 239
Глава 5 В то же время критерийный накопитель, особенно при высоких требованиях для относительного числа значимых импульсах имеет значительные энергетические потери, достигающие 5...7 дБ (см. рис. 5.16). Р(х) 0,8 0,6 0,4 1 1 1 / Критерийный - - / накопитель - Сумматор / / - -JL. 1 о 10 15 20 25 Рис. 5.16. Зависимость вероятностей обнаружения цели от отношения сигнал/шум для линейного и критерийного накопителей Реализуемые с линейным и критерийным накопителем разделяющие поверхности в пространстве сигналов, точнее проекции этих поверхностей на плоскость образованную произвольной парой сигналов, приведены на рис. 5.17 и 5.18, соответственно. *2 Х2 Ч *1 Рис. 5.17. Решающая область, реализуемая линейным накопителем Рис. 5.18. Решающая область, реализуемая критерийным накопителем Представление накопителя радиолокационных сигналов в виде нейронной сети позволяет подобрать разделяющую поверхность рациональным образом для того, чтобы обеспечить удовлетворение противоречивым требованиям обеспечения малых энергетических потерь и приемлемого уровня ложных тревог в импульсных помехах. 240
Нейросетевые методы обнаружения радиолокационных сигналов 241 5.3. Нейросетевые модели для автоматического обнаружения целей Естественным способом улучшения качества обнаружения в сложных условиях является использование нейронных сетей. Одним из первых вариантов воплощения этого подхода являются работы Амузегара [159; 160]. Им предложено в решающий критерий, на основе которого принимается решение о наличии цели, ввести дополнительные параметры, описывающие статистические особенности помеховых условий в опорной выборке, такие как среднеквадратическое значение оценок помех до испытуемого дискрета и после него, уровень корреляции между ними, медианное значение и др. Численные эксперименты показали, что уровень стабилизации ложных тревог в сложных помехах для предложенного алгоритма значительно лучше, чем у традиционной схемы, особенно при малых размерах опорной выборки. Причем качество его работы остается приемлемым даже при небольших (<30) объемах опорной выборки. Стабилизируется и вероятность обнаружения целей в группах. Однако предложенный метод является в большой мере эвристическим, так как признаки, на основе которых нейронная сеть принимает решения, выбираются экспертом. Более естественным будет в качестве входов нейронной сети использовать весь вектор опорной выборки. Это было проделано в [307], где было показано, что такой нейросетевой обнаружитель значительно превосходит традиционный локально оптимальный, если распределение воздействующих помех существенно отличается от нормального. Все это свидетельствует о способности нейросетевых алгоритмов успешно преодолевать трудности, связанные с неопределенностью внешних условий. Наиболее последовательным следует считать прямое применение нейронной сети для обнаружения радиолокационных целей. Ведь задача обнаружения является частным случаем задачи распознавания и, поэтому нейронные сети должны обеспечивать ее эффективное решение. Одной из первых работ посвященных решению задачи обнаружения с помощью нейронных сетей была [325], в которой предложен нейросетевой обнаружитель для бортовой тепловизионной станции самолета F/A-18. Многослойный персептрон с 13 входами и 20 нейронами в промежуточном слое оказался способен обеспечить в сложных помехах вероятность обнаружения 88% при отсутствии ложных тревог. На этой работе можно видеть недостатки некоторых поспешных выводов о нейросетевом решении задачи обнаружения. Очевидно, что уровень ложных тревог не может быть нулевым, а отсутствие его оценок не позволяет судить о действительном качестве полученного обнаружителя.
Глава 5 Большинство исследователей, которые ранее занимались задачами распознавания, не вполне понимают важность даже очень малых значений уровня ложной тревоги. По этим причинам, а также в связи с метафоричностью идеи нейросетевых вычислений, некоторые разработчики не считают необходимым проводить подробные исследования. Обилие работ по нейросетевой тематике, в которых не вполне подробно освещаются необходимые подробности исследований, послужило причиной выхода резко критической статьи [303], в которой утверждается, что необходимо существенно улучшить качество проведения исследований в области обучения нейронных сетей и их использования в практических приложениях. В противном случае по результатам исследований можно прийти к сомнительным выводам. Так часто можно слышать о том, что нейронные сети способны превзойти оптимальный обнаружитель даже в тех условиях, для которых оптимальное устройство синтезировано. Например, в [47; 48] рассматривается задача обнаружения целей в зоне обзора бортовой РЛС летательного аппарата. Предлагается нейро- сетевая реализация решения на базе сети Кохонена. Приводятся результаты экспериментов, которые показывают, что нейросетевой обнаружитель обеспечивает в гауссовских помехах вероятность обнаружения выше, чем оптимальный приемник. При этом проигнорирован факт увеличения уровня ложных тревог с 10"6 до 10~3, что соответствует потерям, большим, чем полученный выигрыш. На недостаточное внимание к правильной оценке качества нейросетевых систем обнаружения в этой и ряде других работ совершенно справедливо обращено внимание в [95]. Однако там же делается вывод о том, что нейронные сети не могут обеспечить получения требуемого качества обнаружения и улучшить традиционные статистические методы построения обнаружителей. В то же время известно большое число исследований, в которых показана возможность создания эффективных обнаружителей, построенных на основе нейросетевой технологии. Так итальянскими учеными, для того, чтобы улучшить характеристики обнаружения, была обучена нейронная сеть с комплексными входами, после чего было проведено сравнение качества ее работы с оптимальным обнаружителем для гауссовых помех. Полученные результаты свидетельствуют, что при различных отношениях сигнал/помеха нейронная сеть очень близко приближается к оптимальному алгоритму для гауссовых помех [184]. Аналогичные результаты были получены и в [95], где рассматривалась линейная нейронная сеть при работе в гауссовых шумах. Проведенный теоретический анализ подтвердил сходимость нейронной сети к оптимальной схеме. 242
Нейросетевые методы обнаружения радиолокационных сигналов Известно много работ посвященных использованию нейронных сетей при обнаружении целей. Уже в [270] Липманом показано, что нейронные сети могут быть использованы для обнаружения целей в сложных условиях. В [309] проведено сравнение нейросетевого обнаружителя с традиционным, построенным на основе согласованного фильтра. В то время как характеристики согласованного фильтра очень чувствительны к воздействию сложных помех, нейросетевой обнаружитель сохраняет устойчивость, обеспечивая близкое к оптимальному качество работы. В [173] рассмотрена задача обнаружения положительных сигналов на фоне шумов, которые имеют распределение Лапласа. Проведено сравнение многослойного персептрона, оптимального обнаружителя Неймана-Пирсона и линейного обнаружителя. Нейросетевой обнаружитель во всех случаях превосходит линейный обнаружитель и является почти оптимальным. Сделан вывод о том, что для построения оптимального обнаружителя необходимо знание параметров сигнала и помех, а для нейросетевого обнаружителя такой необходимости нет. Обнаружение целей в доплеровских радарах с помощью нейронной сети, обучаемой методом обратного распространения ошибки, исследовано в [349]. Показано, что в дополнение к улучшению качества обнаружения целей, нейронная сеть обеспечивает и выигрыш по скорости вычислений. Во многих работах обсуждаются особенности использования нейронных сетей для решения задач обнаружения целей, такие как выбор формы представления желаемого отклика [305], критериев обучения [161; 162], стабилизация уровня ложной тревоги [253], последовательное обнаружение [219], работа в существенно нестационарных условиях [179], обнаружение слабых сигналов на фоне интенсивных шумов [194], демонстрируются их преимущества перед традиционными обнаружителями. Несмотря на успешность применения нейросетевой технологии в задачах обнаружения сигналов, разработчик конкретных устройств и алгоритмов сталкивается с рядом трудностей, основными из которых являются следующие. Принятые в нейросетевой технологии алгоритмы обучения не позволяют получать малые значения вероятностей ложных тревог. Обычно, для демонстрации способности нейронных сетей эффективно решать задачи обнаружения целей, используются вероятности \0Гъ...\Ь~А или даже 10~2 [161; 162; 305]. Обучение сетей способных обеспечивать высокое качество обнаружения при используемых в радиолокации уровнях ложной тревоги 10 ... 10-7 не всегда приводит к успеху. Обученная нейронная сеть обеспечивает близкое к оптимальному решающее правило с точки зрения байесовского подхода, в то время как в радиолокации используется критерий Неймана-Пирсона [4; 113; 115]. 243
Глава 5 Отсутствуют обоснованные правила выбора обучающих примеров для того, чтобы сеть после обучения была способна обеспечить эффективную работу в разнотипных условиях. Для преодоления вышеуказанных трудностей необходимо провести более подробный теоретический анализ процессов обнаружения целей и механизмов обучения нейронных сетей. В самом общем виде обнаружитель, или классификатор с двумя решениями, может быть охарактеризован своей решающей областью. Типичный случай расположения решающей области в признаковом пространстве проиллюстрирован на рис. 5.19. У неидеального обнаружителя решающая область отличается от оптимальной и необходима ее корректировка для улучшения качества обнаружения или классификации. Рис. 5.19. Пример решающей области классификатора и ее корректировки нейросетевой классификатор Такая корректировка обычно проводится путем изменения внутренних параметров классификатора на основе получаемых с его помощью результатов классификации на обучающих примерах. При этом основная сложность заключается в выборе адекватного механизма такой модификации внутренних параметров классификатора. Оказывается, что один из наиболее эффективных механизмов подстройки параметров классификатора реализуется в нейронных сетях, использующих распространенную парадигму многослойного пер- септрона. Действительно, алгоритм обучения многослойного персеп- трона в точности совпадает с изложенным выше механизмом адаптации системы обнаружения целей. Обучение нейросетевого обнаружителя целей можно представить с помощью схемы, представленной на рис. 5.20. модификация весов оптимальное решающее правило Рис. 5.20. Общая схема работы нейросетевого обнаружителя 244
Нейросетевые методы обнаружения радиолокационных сигналов 5.3.1. Анализ работы многослойного персептрона с точки зрения статистической теории различения гипотез. Рассмотрим подробнее обучение многослойного персептрона для решения задач обнаружения целей. Решение о распознавании принимается на основе выходов многослойного персептрона. При этом для каждого из классов отводится отдельный выход. Тогда требуемый выходной вектор представляет собой единичный вектор вида |о, 0, О, 1, 0, о| со всеми нулевыми элементами, кроме к -го, который равен 1. На вход нейронной сети подается набор пар, состоящих из вектора входных сигналов х и требуемых выходных значений t = {0; 1}. Каждому классу отводится отдельный выход, а требуемый выходной вектор представляет собой единичный вектор вида |о, 0,О, 1, 0, о| со всеми нулевыми элементами, кроме к-то (к - номер класса), который равен 1. Для входного вектора, рассчитывается выдаваемый сетью вектор g , который является функцией от полученных входных значений и вектора весов w: g = g(x,w). Задачей нейронной сети является установление таких весовых значений w, чтобы выход сети в наибольшей степени соответствовал желаемым значениям. Для этого рассчитывается ошибка U, зависящая от выходного вектора сети g и требуемого /, и с ее помощью осуществляется подстройка внутренних параметров сети - весовых векторов w. Конкретный вид функционала U определяется требованиями к системе распознавания. Цель обучения состоит в минимизации этой ошибки. Известно много различных вариантов формирования критерия оптимизации на основе рассчитанных значений парциальных ошибок. Наибольшее распространение получила среднеквадратическая ошибка, которую можно записать в виде: U = {g-tf. (5.55) Оказывается, что в асимптотике выход нейронной сети стремится к апостериорной вероятности наличия цели, т.е. пропорционален функции правдоподобия. В случае если выходы нейронной сети находятся в диапазоне [0, 1], этот факт доказан в [308]. Выходы многослойного персептрона gk после достаточно длительного обучения подчиняются соотношению: 245
Глава 5 Uk = j(gk-Pm0CTtp{x)f р{х)<К+ ^постерСЮйшостерС*)'5 . (556) не зависит от g где р(х) - полная вероятность распределения входных сигналов. Из этого выражения видно, что в ходе обучения нейронная сеть стремится подстроить весовые вектора таким образом, чтобы выходные значения были близки (в смысле взвешенного среднеквадратического отклонения) к апостериорным вероятностям. Поэтому, если нейронной сети удается достичь такой ошибки, при которой первое слагаемое обращается в нуль, она реализует оптимальное решающее правило. Следует отметить, что для этого необходимо выполнение обычно недостижимых условий. Во-первых, заложенная в нейронную сеть архитектура должна позволять сколь угодно точно приближать оптимальное решающее правило. Во-вторых, число примеров, на которых производится обучение должно быть достаточно велико, чтобы обеспечить высокую степень приближения математического ожидания частными суммами. Поэтому в действительности выходы нейронной сети пропорциональны оптимальным апостериорным вероятностям с некоторой погрешностью. Так как количество примеров, предоставляемых для обучения, всегда ограничено, качество приближения к оптимальному обнаружителю зависит от того, насколько хорошо выход нейронной сети приближается к апостериорным вероятностям. Интегрирование погрешности [8 к ^апостер (*)) (5.57) в выражении (5.56) осуществляется с весом р(х), и нейронная сеть будет стремиться уменьшить погрешность своих выходов там, где значения общей плотности вероятности наиболее велики, т.е. для тех входных сигналов, которые встречаются наиболее часто. Качество приближения неравномерно в области определения сигнальных векторов. Наилучшее приближение будет достигаться там, где полная плотность распределения векторов будет принимать максимальные значения. В областях же, где плотность распределения мала, степень приближения, а следовательно, и качество обнаружения, будет значительно хуже оптимального. При этом, даже если результат усредненного приближения будет составлять пренебрежимо малые величины, качество приближения в областях с малыми вероятностями появления сигналов может оказаться в относительных единицах больше 100%. В то же время интересная для разработки систем обнаружения область сигналов лежит в областях с плотностями появления 10~5 и менее. 246
Нейросетевые методы обнаружения радиолокационных сигналов В этих случаях нейронная сеть будет главным образом настраиваться на наиболее часто появляющиеся входные сигналы и практически игнорировать сигналы со столь низкими частотами появления. Для редко встречающихся входных сигналов отличия выходов от оптимальных могут быть очень велики, что не позволит нейронной сети обеспечить эффективное различение гипотез. На этот факт обращалось внимание во многих работах, и даже предлагалось изменять априорные плотности появления классов с последующим пересчетом выходов нейронной сети для их приведения к истинным апостериорным вероятностям [180; 311; 323]. С помощью изменения значимости ошибок вышеуказанным способом можно воспрепятствовать игнорированию нейронной сетью маловероятных событий. Однако основной недостаток качества аппроксимации, заключающийся в том, что приближение к оптимальному обнаружителю обеспечивается в среднем по большой области признакового пространства, не удается. Именно с этим обстоятельством связано то, что нейронную сеть оказывается трудно обучить для решения задач обнаружения при малых уровнях ложных тревог. Многие исследователи пытались преодолеть эту трудность, изменяя критерий обучения. В работе [163] проведен анализ различных видов функционалов ошибок, используемых для обучения нейронных сетей задачами обнаружения целей. Показано, что традиционный вариант ошибки в виде среднего квадрата различий между желаемым и истинным откликами сети неудачен. Другие варианты функции ошибок предложены для улучшения качества обучения, характеристик обнаружения обученной нейронной сети. Одним из наиболее удачных является выбор в качестве функционала ошибок так называемого критерия качества, фактически являющегося эмпирической оценкой вероятности правильного распознавания при заданном уровне ложных тревог. Этот функционал был первоначально предложен в [220], а затем в [203], более подробный его анализ приведен в [190]. Так как основной целью обучения для обнаружения целей является реализация принципа Неймана-Пирсона, в [340; 341] предлагается ввести в функционал ошибок дополнительное слагаемое, описывающее штраф за нарушение этого критерия. Аналогичный метод обучения описан еще в [145; 146]. В работе [304] было обращено внимание на тот факт, что ошибки для задач обнаружения имеют различную значимость и не должны давать одинаковый вклад в результирующую ошибку. Предложено вместо квадратичной функции от ошибки рассматривать другие значения сте- 247
Глава 5 пеней, обеспечивающие большее влияние на результат ложных тревог. Проведенные исследования показали более высокий уровень устойчивости вероятностей ложных тревог при таком методе обучения. Указанный метод с успехом применялся при синтезе нейросетевых методов обнаружения радиолокационных сигналов [224]. Тем не менее, обеспечить на выходе обученной нейронной сети заданный уровень ложных тревог не удается. Более рациональным представляется [127; 130] включить в функцию ошибок, а следовательно, и в алгоритм обучения, дополнительный множитель, z{x) зависящий от входов х : U = {g-tfZ{x). (5.58) Так как наиболее важной для аппроксимации является граница решающей области, целесообразно в качестве функции z{*) выбрать индикаторную функцию окрестности, непосредственно примыкающей к разделяющей поверхности. На рис. 5.21 приводится иллюстрация метода. Рассматривается некоторая е окрестность границы решающей области, т.е., множество точек, отстоящих от этой границы не более чем на некоторое малое расстояние. Именно эта область и является наиболее важной при обучении нейронной сети, и для нее следует учитывать значимость ошибок обучения в наибольшей степени. При выполнении обучения оказывается, что большинство обучающих примеров не участвуют в процессе настройки весовых коэффициентов, так вероятность попадания случайного сигнала в эту область очень мала. Для смещения распределения сигналов в область малых вероятностей появления сигналов предлагается использовать метод, аналогичный используемому в статистике для оценки маловероятных событий методу существенной выборки [40; 112]. В этом методе при оценке интеграла, представляющего собой вероятность маловероятного события, распределение моделируемой случайной величины /(х) изменяется на другое г(х), специально подобранное так, что вероятность исследуемого события становится значительно выше, чем у исходного. Предлагается использовать тот же метод и для обучения нейронной сети. В этом случае при генерации входных значений для случаев 248 Рис. 5.21. Схема преимущественного обучения в окрестности границы решающей области классификатора
Нейросетевые методы обнаружения радиолокационных сигналов отсутствия цели используется измененная плотность вероятности, обеспечивающая концентрацию сигнальных векторов в интересующей пользователя области, а при вычислении ошибки это изменение компенсируется. Получаемое при этом математическое ожидание ошибки полностью совпадает с приведенным выше, а вес отличий откликов нейронной сети от значений апостериорной вероятности в интересующей пользователя области значительно возрастает. С помощью удачного выбора соответствующих функций х(х) удается снизить требуемое для качественного обучения количество примеров на несколько порядков. Важно отметить, что полученный метод противоречит часто приводимым рекомендациям о предпочтительности выбора в качестве обучающих примеров таких, которые дают наибольшую ошибку [282], вместо этого следует выбирать примеры с минимальным откликом сети. Интересно, что полученный алгоритм очень близок по структуре к известному методу опорных векторов (support vector machines-SVM) [345], предложенных Вапником. 5.3.2. Обучение нейронной сети с учителем для критерия Неймана-Пирсона. Тем не менее, нейронная сеть после обучения не может обеспечить на выходе заданный уровень ложных тревог. Поэтому для задач обнаружения решение принимается путем сравнения выхода сети с некоторым порогом, величина которого подбирается с помощью отдельной процедуры для обеспечения требуемого уровня ложных тревог. В результате этой дополнительной настройки решающая поверхность еще больше смещается из области приемлемой аппроксимации к оценкам, далеким от истинных значений, что часто ведет к снижению качества обнаружения. Поэтому желательно обеспечить такой механизм обучения нейронной сети, при котором непосредственно по окончании этапа обучения без последующей настройки порога сеть сохраняла заданный уровень ложной тревоги и уже в ходе обучения обеспечивала постоянство уровня ложных тревог. Для этого предлагается следующий алгоритм. В качестве функционала ошибки используется взвешенная сумма ошибок для случаев наличия цели и ее отсутствия вариант Uk=/3r4gk-hf+Pr(gk-hf, (5.59) где коэффициент /?£lgnal при наличии цели равен 1, a /?™lse, учитывающий влияние помех, изменяется в ходе обучения таким образом, чтобы обеспечить заданный уровень ложных тревог. При этом используется метод стохастической аппроксимации Робинса-Монро [5; 312]. Если 249
Глава 5 выход сети больше 0, т.е. принимается ошибочное решение о наличии цели (ложная тревога), он увеличивается PtT=Pre+cck(\-F0), (5.60) а в противном случае - уменьшается: /?noise /?noise ^ г? А+1 =Рк ~akFo- (5-61) При этом коэффициенты ак должны в пределе стремиться к 0, но в то же время обеспечивать любой требуемый сдвиг коэффициентов значимости ошибок при достаточно длительном обучении. Можно сформулировать следующее утверждение о сходимости метода обучения нейронной сети к критерию Неймана-Пирсона. Утверждение. Пусть нейронная сеть в ходе обучения использует смешанную функцию ошибок: uk=flTl(gt-tk)2+flre(gk-tk)2, fifJ1 н™е™' (5.62) [0 на входе шум, ^noise ГА на входе шум, к \ 0 на входе сигнал, где коэффициенты относительной важности ошибок первого и второго рода рк адаптивно изменяются в соответствии с алгоритмом: .noise J/C^+Ml-^o) gk>0, М j Pr°-akF0 gk<0, ак - последовательность коэффициентов, удовлетворяющая условиям: Ха«=о0' Za«2<o°- (5-64) 1<Я«Х> 1<И<00 Тогда реализуемая ею вероятность ложной тревоги будет стремиться по вероятности к установленному уровню F0. Доказательство утверждения опирается на метод стохастической аппроксимации Роббинса-Монро [5, 312]. Этот метод предназначен для решения стохастических уравнений, то есть уравнений, в которых функция является не числовой, а представляет собой реализацию случайного процесса с заданными законами распределения. В наиболее общем виде решаемое уравнение можно записать в форме: F(x) = C. 250
Нейросетевые методы обнаружения радиолокационных сигналов Для решения этого уравнения применяется итерационный метод, в котором начальное приближение х0 на каждом шаге пересчитывается согласно выражению: xn+\=xn+<*„-(F(x)-C). Доказано, что при выборе параметров итерационного процесса таким образом, чтобы удовлетворялись указанные в утверждении условия, последовательность хп сходится по вероятности к искомому решению. Параметры итераций, с одной стороны, при увеличении п стремятся к нулю, а с другой стороны, их сумма может превзойти любое наперед заданное число, чтобы первоначальная невязка могла быть уменьшена до нуля независимо от начального приближения. Дополнительным свойством указанного выбора параметров ап, является то, что отношение двух последовательных элементов этой последовательности стремится к единице. Действительно, если бы это было не так, то ряд ххп2 можно 1<О<00 было бы промажорировать геометрической прогрессией, и он был бы ограничен, что противоречит условиям выбора ап. В условиях как раз и рассматривается случайный процесс, в котором случайными являются входные сигналы нейронной сети. При поступлении помеховых сигналов выход сети может давать ошибочный отклик, соответствующий сигналу от цели, с вероятностью Flt и правильный ответ об отсутствии цели с вероятностью \-Flt. Вероятность ошибочных решений (уровень ложных тревог) регулируется относительной важностью ошибок первого и второго рода. Необходимо найти такие значения относительной важности, чтобы обеспечивался заданный уровень ложных тревог, т.е. рассматривается стохастическое уравнение относительно параметра J3n0ise; F„(rise) = F0. Таким образом, в условиях утверждения можно применить результат Роббинса-Монро, который и доказывает сделанное утверждение. Предложенный алгоритм обучения многослойного персептрона способен обеспечить заданный уровень ложных тревог после завершения процесса обучения. Это следует из доказанного утверждения. При малых требуемых уровнях вероятности ложной тревоги время, требуемое для обучения нейронной сети, может оказаться очень большим. Для его уменьшения целесообразно применять метод существенной выборки для шумовых сигналов. Распределение генерируемых 251
Глава 5 примеров изменяется с истинного / на другое /ess, для которого вероятность попадания в критическую область обнаружителя значительно выше. Тогда адаптация коэффициентов относительной важности ошибок производится по измененным выражениям: gk>o (5.65) После обучения по указанному правилу нейронная сеть может использоваться как обнаружитель радиолокационных сигналов по критерию Неймана-Пирсона. Представление накопителя радиолокационных сигналов в виде нейронной сети позволяет применить методы обучения, разработанные в предыдущем подразделе. При этом становятся более прозрачными присущие стандартным методам обучения недостатки. Если нейронная сеть обучается по функционалу ошибки в виде суммы квадратов, как это принято в обычно применяемом методе backpropagation, то изображение формируемой ею разделяющей поверхности аналогично изображению разделяющей поверхности линейного сумматора. И это несмотря на то, что на входе с относительно высокой вероятностью появляются сигналы помех высокой мощности. Тем не менее, при аппроксимации апостериорных вероятностей нейронная сеть их игнорирует, уделяя основное внимание значительно более вероятным шумовым сигналам и формируя оптимальный обнаружитель для стационарных шумов. Получаемая при этом решающая область изображена на рис. 5.22, где область принятия решения о наличии цели показана светлым цветом, а область отсутствия цели - темным. Граница решающей области (разделяющая поверхность) является линейной, т.е. оптимальна для шумов постоянной интенсивности. Использование предложенного алгоритма обучения полностью изменяет характер разделяющей поверхности, принимаемых обнаружителем решений. Разделяющая поверхность становится существенно нелинейной, что исключает включение в решающую область относительно больших, но одиночных импульсов, предотвращая принятие неправильных решений в импульсных помехах (рис. 5.23). Полученный накопитель очень близок к оптимальному, форму которого можно увидеть на линиях уровня рис. 5.24. Одновременно, такой накопитель фактически реализует решающую статистику близкую к ро- бастному накопителю [127], полученному на основе идей Хьюбера [143]. 1-/7 Pk~akFQ о № № /ем 00 252
Нейросетевые методы обнаружения радиолокационных сигналов Рис. 5.22. Идеальная решающая Рис. 5.23. Идеальная решающая область для стационарных шумов область для случая импульсных помех Рис. 5.24. Нейросетевое представление нелинейного накопителя радиолокационных сигналов Результаты проведенных расчетов вероятностей обнаружения (рис. 5.25) и вероятностей ложных тревог (рис. 5.26) для трех накопителей показывают преимущество нейросетевого накопителя по энергетическим потерям при весьма устойчивом уровне ложных тревог. 0,8 ! 1 Нейронная / Критерийный сеть / накопитель 0,6 / 0,4 - 0,2 Сумматор / - °0 5 10 15 20 25 Рис. 5.25. Вероятность обнаружения цели для нейросетевого обнаружителя относительно линейного и критерийного накопителей 253
Глава 5 О 5 10 Критерийный накопитель 15 Сумматор 20 25 30 35 Рис. 5.26. Уровни ложных тревог для нейросетевого обнаружителя относительно линейного и критерийного накопителей 5.3.3. Обучение нейронной сети для критерия гарантированного результата в неопределенной обстановке. Радиолокационный обнаружитель должен обеспечивать высокие характеристики при воздействии помех различных типов. Часто можно слышать суждения о том, что нейронные сети за счет своей близости к механизмам работы мозга способны обеспечивать высокое качество обнаружения для всех помех, предъявленных при обучении. Так в очень интересном труде [272], в котором содержится большой объем полезных и достоверных сведений, тем не менее, утверждается, что для того чтобы нейронная сеть была способна обнаруживать радиолокационные сигналы в различных помехах достаточно при ее обучении предъявить все возможные типы помех. На самом деле это не так. Нейронная сеть после обучения будет реали- зовывать оптимальное решающее правило для смеси помех с априорными вероятностями, которые были использованы при ее обучении. Качество ее работы в конкретном каждом виде помех может оказаться далеко не оптимальным и даже явно неприемлемым. Для обеспечения робастности сети, ее способности сохранять устойчиво высокое качество работы при изменении распределений помех, необходимо учесть это требование в процессе обучения. Когда на вход обнаружителя поступают помехи различных типов С, с априорными заранее неизвестными вероятностями Pt, он должен обеспечить стабильный уровень ложных тревог с точки зрения принципа гарантированного результата. Это означает, что должен быть стабилизирован максимальный по возможным помеховым воздействиям уровень ложных обнаружений, т.е.: Наиболее неблагоприятный тип помех будет зависеть от конкретных параметров обнаружителя в текущем цикле обучения. Поэтому предложено (5.66) 254
Нейросетевые методы обнаружения радиолокационных сигналов его выбирать динамически, в ходе обучения, обеспечивая наихудший уровень воздействия в зависимости от текущей конфигурации сети. Для этого сначала неизвестным априорным вероятностям появления различных помех приписываются произвольные, например, равные, значения. Затем при каждом случае выдачи нейронной сетью неправильного решения в помехах, относительная частота этого типа помех увеличивается (рис. 5.27). В результате помехи того типа, который ведет к большей вероятности ложной тревоги, будут иметь более высокую частоту появления. Рис. 5.27. Схема работы нейросетевого обнаружителя, адаптирующегося к наиболее неблагоприятным распределениям помех Сходимость предложенного метода динамического выбора наиболее неблагоприятных помех следует из следующего утверждения. Утверждение. Пусть на вход нейронной сети, обучаемой по критерию Неймана-Пирсона, подаются сигналы со смешанным распределением помех: f{x) = P/2{x)+P2f2{x). (5.67) Тогда, при настройке априорных вероятностей на каждом к -м шаге обучения, в ходе которого зафиксирована ложная тревога, согласно выражениям: Р^ = Рк +ак/(ак +Цк), />2<*+1)=1-^+1>, (5.68) если на входе присутствовала помеха первого типа, и 255
Глава 5 Р2^=Р2к+ак/(ак+Р2к), /f+,>=l-/>2<*+1>, (5.69) если на входе присутствовала помеха второго типа, где ак - последовательность коэффициентов, удовлетворяющая условиям ^ ап = со , 1<Л«Ю ап2 < со, после достаточно длительного обучения вероятность лож- 1<и«х> ных тревог нейронной сети не будет превышать заданного уровня для обоих типов помех. Доказательство. Действительно, пусть это не так, и для одного из типов помех (например, первого) вероятность ложных тревог больше, чем установленный уровень ложных тревог F0 . В конце обучения априорные вероятности примут некоторые установившиеся значения Р{° и Р™. Так как нейронная сеть обучилась в соответствии с критерием Неймана-Пирсона, вероятность ложной тревоги для полученного смешанного распределения помех будет равна заданному уровню F0. Обозначим уровни ложных тревог для помех первого и второго типа через Fx и F2, соответственно. Тогда можно записать: FQ=P™FX+P*F2. Это значит, что условные вероятности выдачи ложной тревоги по помехам первого F([(false)) и второго F{2( false)) класса, при условии наличия ложного обнаружения, равны: F(\(false)) = 3-D , F(2(false)) = ^-^ . yJ } P™FX+P2™F2 V } P™Fl+P2™F2 Поэтому средняя величина поправки к априорным вероятностям появления помех на k -м шаге будет равна: АРк= Af = ДР/ =F(l(false)) ак/(а0 +Pxk)-F(2( false)) ак/(сс, + Р2к) или " (PkFi+P2kF2)(ak+Pk) (pkFx+P2kF2)(ak+P2k)_ 256 АРк=ак
Нейросетевые методы обнаружения радиолокационных сигналов При устойчивом состоянии должно выполняться условие АР* =0. Откуда следует, что: PkF, PkF r2 Г2 ИЛИ (ak+Pk) (ak+P2k) akPkFx + PkP2kF, = akPkF2 + PkPkF2; «. (tfl " PfFi) + PxPi (*i - Fi) = 0 • Если ввести обозначение AF = Fj -F0, то F _F =F0-(l-P2)Fl _F0-FX+P2FX 2 0 p 0 p fi-JF2=(^i-F0)-(F2-F0) = i-AF, -F0 = AF- -AF, P]F]-P2F2=Pl(F0 + AF)-P2 = F0(P,-P2) + AF F,, + AF—-AF 4) PiFi-P2F2=F0{\-2P2)-AF^- и полученное соотношение сводится к виду: F0(l-2P2«)-AF1-^- +(l-P2°°)AF = 0 r2 J Если Fx > F0, то уже на первых шагах обучения будет выполняться условие Р2 < 0,5 , а следовательно, вышеприведенное равенство может выполняться только при условии: Р2"<а„. Это означает, что Р{° = 1, Р2°° = 0, откуда и следует справедливость доказываемого утверждения. 9—5782 257
Глава 5 Использование указанного подхода позволяет синтезировать роба- стные обнаружители для различных типов помех, приближающиеся по качеству работы к человеку оператору [127; 130]. Для подтверждения этого с помощью предложенного метода был проведен синтез обнаружителя работающего при воздействии обычных гауссовских и вейбул- ловских помех. Результаты расчетов приведены на рис. 5.28. Рис. 5.28. Зависимости вероятностей обнаружения целей от отношения сигнал/помеха в помехах вейбулловского типа для традиционного (Classic) и нейросетевого обнаружителей (Real) Проведенные численные эксперименты показывают, что энергетические потери нейросетевого обнаружителя снижаются на ~4 дБ, по сравнению с традиционным. 258
Глава 6. Нейросетевые методы формирования и сопровождения траекторий радиолокационных целей Обнаруженные отметки от целей используются для анализа радиолокационной информации. Анализ проходит в несколько этапов, начальной стадией которого является вторичная (траекторная) обработка. В процессе этой обработки осуществляется формирование и сопровождение траекторий обнаруженных целей. Традиционные алгоритмы формирования траекторий синтезированы в предположении выполнения определенных допущений. Основными из них являются прямолинейное равномерное движение целей и их достаточная удаленность друг от друга, т.е. отсутствие пересечений стробов завязки и сопровождения для различных целей. В случае выполнения в реальных условиях допущений, принятых при их синтезе, традиционные алгоритмы обеспечивают близкие к оптимальным точности и вероятности сопровождения целей. При наличии групп целей, их интенсивном маневрировании, нельзя ожидать выполнения указанных допущений. Поэтому традиционные алгоритмы реализуют в этих условиях эффективность, намного хуже ожидаемой. Наибольшие сложности вызывает сопровождение групп целей. При характерных расстояниях между целями в группах и размерах стробов, стробы траекторий различных целей многократно пересекаются, что во многих случаях приводит к неправильной идентификации отметок и как следствие, к размножению отметок и снижению достоверности выходной информации. 6.1. Анализ традиционных методов формирования траекторий 6.1.1. Общая характеристика системы траекторной обработки радиолокационной информации. В настоящее время традиционными являются алгоритмы вторичной (траекторной обработки), основанные на проведении отождествления отметок отдельно по каждой цели и сглаживания в соответствии с фильтром Калмана [63]. Алгоритм отождествления отметок разных периодов обзора сводится к следующему [37; 62; 131]. Полученные в каждом периоде обзора отметки последовательно проходят через процедуры выбора продолжений существующих траекторий, выбора продолжений еще не сформированных траекторий и за- 259
Глава 6 поминания новой траектории. Эти процедуры проводятся в следующем порядке. Первоначально каждая из полученных отметок проверяется на возможность пролонгации уже завязанных траекторий. Среди всего множества отметок выбираются те, которые наилучшим образом подходят для продолжения имеющихся траекторий. Эти отметки исключаются из дальнейшей обработки. Для оставшихся отметок рассматривается возможность формирования продолжения с их помощью еще не завязанных траекторий, т.е. тех траекторий, по которым имеются формуляры, но решение о сопровождении еще не принято. Те отметки, по которым принято решение о включении в предполагаемые траектории, также исключаются из дальнейшего рассмотрения. Все оставшиеся отметки рассматриваются как вновь появившиеся цели и запоминаются для использования на последующих обзорах в качестве начала соответствующих траекторий. Указанная последовательность справедлива для всего массива полученных на текущем обзоре отметок. Если рассмотреть отдельную цель, то последовательность обработки получаемых от нее на последовательных периодах отметок будет следующей. На одном из обзоров локатора обнаруживается впервые появившаяся от этой цели отметка. Создается формуляр новой траектории, в котором запоминаются начальные координаты. В следующем обзоре определяется отметка(и), которая могла бы совместно с запомненной на предыдущем обзоре составить траекторию. Для этого вокруг запомненных начальных координат выставляется строб 5зав. Все точки, попавшие в этот строб, образуют новые формуляры трасс, которые включают в себя текущие координаты (х, у), составляющие скорости (Vx, V ), а также служебную информацию: длину трассы, признак сопровождения, количество пропущенных отметок. В дальнейшем вокруг всех экстраполированных точек текущих траекторий выставляются стробы £сопр, ближайшие из отметок, попавших в них, являются продолжением соответствующих трасс. При появлении отметки производится перевычисление координат и составляющих скорости траектории на основе рекурсивного фильтра Калмана. Трасса считается сформированной при выполнении заданного критерия завязки, т.е. соотношения между длиной трассы и числом обнаруженных отметок за время, прошедшее с момента образования ее формуляра. Обычно используется критерий 3 из 4-х при первых двух обязательных, хотя могут применяться более мягкие, или более жесткие 260
Нейросетевые методы формирования и сопровождения траекторий ... целей критерии. При количестве пропусков отметок подряд, превышающем критерий сброса, траектория сбрасывается с сопровождения. Типичным критерием сброса является 3 пропуска подряд. т \ # Рис. 6.1. Формирование траектории цели на последовательных обзорах локатора Размеры стробов завязки определяются исходя из наибольшего возможного перемещения цели за период обзора. Обычно в РЛС период обзора может составлять от 1 до 10... 12 с с наиболее типичными значениями 5...6 с. Максимальные скорости целей для самолетов обычно принимаются 500...700 м/с. Поэтому размер строба завязки составляет 500... 10000 м с наиболее типичными значениями 2500...4000 м и сопровождения определяются, исходя из обеспечения заданной вероятности попадания отметки в строб, и составляют: d(^зав ) = ^inax ' ' + ^стр " °х(у) > (6- О г2 d(^сопр ) = amax ~ + ^стр " °х(у) > (6-2) где d (о) - размер соответствующего строба по одной из координат, Fmax , amax - максимально возможные скорость и ускорение целей соответственно, / - время, прошедшее с момента наблюдения предыдущей отметки по траектории, сгх^ - ошибки определения координаты х(у) на момент измерения и экстраполяции соответственно, Ксгр - коэффициент, учитывающий расширение стробов за счет ошибок измерения координат. Форма стробов в случае нормальности ошибок определения координат целей описывается эллипсом, повернутым на угол, соответствующий азимуту цели. Ошибки измерения координат целей могут изменяться от десятков метров до километра и более, наиболее распространенными являются значения 150...200 м. Ошибки экстраполяции примерно в 1,5 раза больше ошибок измерения и составляют 250...300 м. Коэффициент расширения стробов, исходя из обеспечения вероятности попадания от- 261
Глава 6 метки в строб 0,9...0,95, должен составлять Ксгр «2...2,5, что определяет величину слагаемого, обусловленного неточностью измерения координат 300...500 м для стробов завязки и 500..750 м для стробов сопровождения [37; 62; 170]. Обычно в РЛС период обзора может составлять от 1 до 10... 12 с с наиболее типичными значениями 4...6 с. Максимальные скорости целей для самолетов обычно принимаются 500...700 м/с. Поэтому размер строба завязки составляет 500... 10000 м с наиболее типичными значениями 2500.. .4500 м [37; 62; 170]. Известно, что максимальные ускорения, которые может развивать самолет в течение нескольких секунд, не превышают 5...6 g. Поэтому размеры стробов сопровождения составляют 1000...2000 м. Таким образом, стробы завязки и сопровождения траекторий оказываются значительными, и в них может попадать не одна, а несколько отметок. Это приводит к ощутимой вероятности выбора неправильных отметок для продолжения траекторий, быстро возрастающей с увеличением числа отметок внутри строба. Отметки, являющиеся ложными для формируемой траектории, могут быть обусловлены как ложной информацией за счет ложных тревог обнаружителя, срабатывающего по обратным отражениям от местных предметов, или активным помехам, так и близкорасположенными целями. В случаях, когда близкорасположенные цели возникают эпизодически, т.е. при перемещениях одиночных целях на пересекающихся курсах возникающие перепутывания могут быть достаточно быстро компенсированы при взаимном удалении целей. Особенно затруднительным оказывается формирование траекторий по группам целей двигающихся параллельными курсами. Типичные расстояния между целями в группе составляют 200.. .300 м. При этом на всех обзорах наблюдаются сильные пересечения стробов, в каждый из которых попадает несколько отметок. Провести достоверное отождествление отметок обычными методами не удается, что ведет к снижению вероятностей сопровождения траекторий, ухудшению точностей определения координат целей, увеличению ложной информации. Еще более трудная ситуация складывается при завязке траекто- 262 Рис. 6.2. Многократное пересечение стробов сопровождения при формировании траекторий по группе целей из 4-х самолетов
Нейросетевые методы формирования и сопровождения траекторий ... целей рий по группам целей. В этом случае размеры стробов оказываются больше, а выбор правильного варианта отождествления менее вероятным. 6.1.2. Методы отождествления отметок. Проблема идентификации радиолокационных отметок, полученных на последовательных обзорах РЛС, может быть решена посредством использования формализма статистической теории принятия решений. Рассмотрим вариант идентификации на этапе сопровождения траекторий, когда формуляры траекторий целей уже сформированы и при отождествлении используются координаты экстраполированных точек. Для этого необходимо выписать выражения для совместной плотности вероятности координат п обнаруженных отметок (Зс,,3с2, ...,*и) и т экстраполированных точек [хх\хэ2, ...,x^j, а затем выбрать вариант идентификации, обеспечивающий максимизацию функции правдоподобия. В предположении о независимости измерений координат отметок, их совместная плотность распределения р[хх,х29 ...,хп,хх,х2, ...,х*) описывается многомерным нормальным распределением: р(хх, ...,^) = Лехр min(«,/w) J ^ '=1 j=\ (6.3) где A - нормировочная константа, J - число измеряемых координат, kt - набор номеров, описывающих идентификационный выбор, a atj2 - дисперсия отклонений j -й координаты / -й обнаруженной отметки от экстраполированной точки. Очевидно, что максимум функции правдоподобия достигается на таком наборе номеров ki, который обеспечивает минимум суммы квадратов отклонений отметок. Задача нахождения оптимального решения, обеспечивающего максимум указанной функции правдоподобия, является труднорешаемой задачей дискретного программирования. В реальных системах используют эмпирические подходы для ее решения. Наиболее распространен следующий алгоритм. В множествах (хх,х2, ...,хп) и [хэх,х2, •••>*m) выбирают такую пару точек Xj е [хх, х2, ..., хп) и хэу е [хэх, хэ2, ..., хэт ), расстояние между 263
Глава 6 которыми минимально. Эти точки считают соответствующими друг другу и исключают из дальнейшего рассмотрения. В множестве оставшихся точек снова выбирают пару ближайших, которые также считают принадлежащими одной траектории. Процесс продолжается пока одно из множеств не будет исчерпано или на одном из шагов расстояние между точками не станет больше некоторого установленного порога, зависящего от ошибок измерения координат и выбранной вероятности непропуска отметок. Такой алгоритм, хотя и не является оптимальным, с большой вероятностью позволяет находить правильное решение, особенно в случаях, когда расстояния между отметками велики по сравнению с ошибками измерения координат. Для нахождения наилучшего решения следует построить двудольный граф, каждому ребру которого ставится в соответствие вес, равный квадрату отклонения координат каждой из п отметок от каждой из т экстраполированных точек. Возможность идентификации всех отметок равносильна существованию в графе совершенного паросочетания, а идентификация, обеспечивающая минимум суммы квадратов отклонений координат отметок от экстраполированных точек, соответствует наибольшему паросочетанию с минимальным суммарным весом. Эта задача является традиционным вариантом классической задачи линейного программирования и носит название транспортной задачи, еще более точно - это задача о назначениях. Для ее решения может быть использован алгоритм, предложенный классиком теории программирования Дейкстрой, и требующий объема вычислений « N4, где N - размерность задачи. Необходимо отметить, что в реальных условиях работы возможно как отсутствие отметок от некоторых целей и формуляров траекторий (пропуски при обнаружении и появление новых траекторий), так и появление ложных отметок и ложных траекторий. В этом случае для идентификации необходимо выбрать наиболее подходящее число отметок и экстраполированных точек. Оба указанных алгоритма, последовательного выбора минимально удаленных пар и алгоритм Дейкстры способны находить не только окончательное решение, но и подрешения, соответствующие идентификации части рассматриваемых отметок с подмножеством заданных формуляров. Это обеспечивается автоматически, посредством итерационного получения подрешений, соответствующих наилучшей идентификации одной пары отметок, двух и так далее до максимально возможного. Выбор подходящего числа идентифицированных отметок осуществляется путем сравнения текущей суммы квадратов отклонений отметок с порогом. Однако гарантировать оптимальность выбора соответствующего варианта подмножества идентифицированных пар нель- 264
Нейросетевые методы формирования и сопровождения траекторий ... целей зя, что приводит к неправильным отождествлениям и, в результате, к ухудшению выходной информации локатора. Рассмотренные алгоритмы построены для идентификации отметок от уже сформированных траекторий. В то же время следует отметить, что наибольшее число ложной информации образуется на этапе формирования траекторий. Поэтому наиболее важной идентификация отметок является на этапе формирования новых траекторий. Для синтеза оптимального алгоритма отождествления воспользуемся аналогичным формализмом теории принятия решений. Как и выше, в предположении о независимости измерений координат отметок, их совместная плотность распределения Р(х,,х2, описывается многомерным нормальным распределением: Р(х1,х2, ...,хп) = Аехр LIb-4)2/V V '=1 7=1 (6.4) где А - нормировочная константа, я:?. - точные значения координат обнаруживаемых целей, а - дисперсия ошибок их измерения. Аналогичные выражения можно выписать для координат целей на втором обзоре. Их совместная плотность распределения P(yi,y2, . - -, jp„) (предполагается одинаковое количество отметок на обоих обзорах) описывается также многомерным нормальным распределением: (6.5) где yf- - точные значения координат обнаруживаемых целей, a kt набор номеров, описывающий правильную нумерацию отметок. Предположим, что все цели в группе движутся прямолинейно и равномерно. В этом случае координаты отметок от различных целей связаны одинаковыми соотношениями: yl=4+vj> (6-6> где v • - координатные составляющие скорость движения группы. Решение, минимизирующее значение совместной функции правдоподобия Ь(хх,х2, ...,хп,уиу2, с учетом ограничения на одновременное изменение координат, можно найти, используя матричное исчисление. Предполагая ошибки одинаковыми по всем координатам и всем 265
Глава 6 измерениям a(J = oi = 1, п\ j = 1, J, с точностью до аддитивной константы запишем: hiL(xl,x2, ...,xn9yl9y2, ...,jp„) = Х(^-^)г(^-^)+1(л,-^)г(д.-^) (6.7) /=1 Для построения наилучших оценок искомых параметров необходимо найти максимум функции правдоподобия, что в данном случае соответствует поиску минимума выражения: X(^-x°f(x,.-xf)+X(A-5>0r(A.-J>0^min <68> относительно х~ и у® при ограничении у% = х? + v i=i i=i i=i —> mm. (6.9) V /=1 /=1 /=1 После отбрасывания не зависящих от оценок истинных координат целей слагаемых и подстановки у%. из ограничения выражение преобразуется к виду: /=1 1=1 1=1 +±(xt+v)T(Xf + v) 1=1 (6.10) Продифференцировав это выражение по искомым параметрам местоположения каждой цели и их общей скорости, получим: xf-Xi+xf+v-y, = 0, Отсюда решение будет иметь вид: (6.П) 266 (6.12)
Нейросетевые методы формирования и сопровождения траекторий ... целей v = i=i ;=i (6.13) (6.14) (6.15) Полученное решение зависит от идентификационного набора ki9 который должен выбираться так, чтобы обеспечить оптимум исходной задачи. Подставив найденное решение в выражение для логарифма функции правдоподобия, получим: (6.16) 1=1 Наилучший выбор варианта идентификации обеспечивает минимум приведенного выражения. Причем вектор оценки скорости группы v не зависит от выбранного набора номеров идентификации отметок ki9 а только от неупорядоченного множества измеренных координат отметок, точенее их суммы. Более того, оказывается и решение, обеспечивающее минимум полученного выражения, не зависит от скорости перемещения отметок. Действительно, его можно переписать в виде: 1=1 п п п +^vTv + 2vT^xi + 2vTJ^yki —> min , (6.17) в котором первое слагаемое определяет наилучший выбор номеров идентификации ki, но не зависит от скорости, а остальные не зависят от выбора kt. Следовательно, его решение можно искать теми же методами, которыми осуществлялся поиск наилучших ассоциаций при сопровождении траекторий. В случае достоверного обнаружения всех отметок от целей и отсутствия ложной информации на входе вторичной обработки приведенная система алгоритмов вполне достаточна. Однако реальные условия работы локатора приводят к тому, что процесс обнаружения отметок является статистическим, некоторые из них на текущем обзоре могут быть не обнаружены, появляются и ложные 267
Глава 6 отметки. При этом вид функции правдоподобия усложняется, а поиск наилучших вариантов идентификации становится очень трудоемким. Рассмотрим, как и ранее два набора отметок, но с различающимся количеством (хх,х2, и (ух,у2, ---^„г)- При этом «из них являются отметками от одних и тех же целей, остальные пх-п для первого обзора и п2-п для второго соответствуют отметкам, обнаруженным только на одном обзоре, а также ложным обнаружениям. В этом случае совместная функция правдоподобия будет состоять из трех сомножителей L(xx,...,xnX,yu...,yn2) = = /,(*„ ...9x„,yl9 ...,yn)L(x„+l, ...9xnl)L(yn+], ...,уп2), где L(xX9 ...,xn,yl9 ...9у„) - совпадает с вышеприведенным выражением для случая идеального обнаружения. L(xn+l, - описывает расположение тех отметок первого обзора, которые не получили подтверждения на следующем обзоре. К ним относятся ложные обнаружения и цели, не обнаруженные на втором обзоре. При отсутствии информации о местоположениях и количестве этих отметок их распределение можно считать равномерным, т.е.: L(x„+l, ...,*и1) = const. (6.19) Аналогично L[yn+X9 ...,у„2) есть функция правдоподобия для отметок второго обзора, которые не имеют соответствующих им отметок на предыдущем обзоре. Их распределение также можно считать равномерным и, следовательно: L(yn+\> ...,^2) = const- (6-2°) Вследствие постоянства остаточных членов общей функции правдоподобия, выбор наилучших вариантов отождествления следует проводить только исходя из изменения первого члена. Таким образом, в общем случае отождествления при наличии пропусков отметок и ложных целей оптимальным будет вариант, при котором проводится отождествление всех вариантов подмножеств полученных отметок для каждого из обзоров и из наилучших вариантов отождествления выбирается тот, при котором общая функция правдоподобия будет минимальной. Однако при необходимости выбора подмножества отождествляемых отметок из всех сгруппированных, предложить какой-либо эффективный алгоритм, за исключением тривиального перебора, не представ- 268
Нейросетевые методы формирования и сопровождения траекторий ... целей ляется возможным. Аналогичные сложности характерны и для этапа сопровождения сформированных траекторий целей, хотя в этом случае задача несколько проще из-за возможности использования оценок скорости перемещения группы, полученных на предыдущих обзорах. 6.1.3. Экстраполяция координат. При появлении отметки производится перевычисление координат и составляющих скорости траектории. Для сглаживания и экстраполяции координат следует применить фильтрацию измеренных координат целей. Оптимальным фильтром для случая известных моделей движения целей является фильтр Калмана. Однако такой фильтр имеет весьма высокую вычислительную сложность и для непредсказуемых маневров целей может оказаться неустойчивым. Поэтому в РЛС обычно применяют его упрощенные реализации. Наибольшее применение получили так называемые а- р фильтры, которые фактически являются представлением фильтра Калмана для случая конечного (двух) числа измерений. В ходе сопровождения проводится сглаживание траектории с помощью а- р фильтра. При этом составляющие координат и скорости пересчитываются согласно выражениям: *new ~ *old + а ' (У ~ *old ) ' ^new^^old+^'^-^old)- Здесь xnew , xold - вектора старых и новых значений координат местоположения цели; vnew , vold - вектора уточненных и старых значений координат скорости; у - вектор последнего измерения координат цели; а и р - параметры фильтра сглаживания; период обзора полагается равным 1. Параметры фильтра выбираются из условия удовлетворения противоречивым требованиям наилучшего сглаживания измеренных координат целей и достаточно быстрой реакции на внезапные маневры целей. В качестве наиболее типичных значений можно указать а=~^> Р = . В модели по умолчанию использованы эти значения. Представленные выражения для а-р фильтра можно переписать в виде: *new=0-tf)4ld^new^li-^^old+^-l^old+^-^old)- При программировании используется библиотека векторных вычислений, для использования которой необходимо все расчеты предста- 269
Глава 6 вить в виде последовательных унарных операций. Поэтому вышеприведенные выражения удобно переписать в виде: - а '0-«).8 ,,1 .-, +Гх ) Р vold+VXnew xoldj а I а В случае, когда а = р = данные выражения примут вид: *new ~ ~ * (*old +У) ' 4iew = ^old + *new ~ *old • Для оценки качества отождествления стандартными методами и предложенным алгоритмом ассоциативного воспроизведения отметок была разработана математическая модель, позволяющая получать статистические характеристики полноты и достоверности выдаваемой потребителю информации, на основе множества реализаций. Другим направлением совершенствования вторичной обработки является улучшение качества сопровождения маневрирующих целей. Сложности в этом виде обработки связаны с непредсказуемостью их траекторий и появлением ошибки Калмановской фильтрации из-за запаздывания следящего за целью фильтра. Было много попыток описания маневров с помощью традиционных методов статистического анализа. При этом использовались Марковские цепи, многоцелевые параллельные модели и другие [181; 298]. Но они не привели к успеху. В [365] показано, что при определенных маневрах цель сбрасывается с сопровождения. В известных подходах делается попытка описать кинематику движения цели и соответствующие ограничения с помощью только линейных моделей, что и обуславливает их недостаточную успешность. В то же время известно, что нейронные сети способны реализовы- вать нелинейную фильтрацию, что позволяет рассматривать эти модели в качестве альтернативы традиционным методам сглаживания и экстраполяции координат. В [329] было показано, что обучение нейронной сети может рассматриваться как идентификация нелинейной динамической системы. Предложенный подход можно сравнить с группой независимых калмановских фильтров, организованных в виде параллельной структуры. Поэтому многослойный персептрон является одним из наиболее перспективных вариантов для улучшения сопровождения маневрирующих целей. И хотя агентство DARPA [195] уделяло недостаточно внимания исследованиям, посвященным применению нейронных сетей для траекторной обработки, это направление развивалось. Так в [314] было показано, что с помощью алгоритма обратного распространения ошибки можно эффективно сопровождать цели. 270
Нейросетевые методы формирования и сопровождения траекторий ... целей Основная идея использования многослойного персептрона в качестве фильтра [239] для сглаживания и экстраполяции координат основывается на известной способности нейронных сетей проводить экстраполяцию временного ряда. Поступающие на вход вторичной обработки координаты обнаруженных отметок как раз и представляют собой временной ряд, только имеющий векторный вид. Простейший вариант организации функционирования нейросетевого сопровождения траектории заключается в формировании входного вектора, состоящего из нескольких отметок, которые получены на последовательных обзорах. Выходом является пролонгированные на один шаг вперед координаты цели. После обучения нейронная сеть должна обеспечить экстраполяцию. Однако часто такой подход оказывается недостаточно успешным. Оказывается полезным [290] обучать сеть экстраполировать не единственное значение, а несколько подряд идущих оценок (рис. 6.3). При такой организации обучения нейронная сеть дает более точные прогнозы [153]. N ^ Нейронная сеть Ui Vi U2 v2 L L Um vN M *V|* Г "4 Xi v2 x2 vN vN h h /3 /n-i /n *n+i ?nh+m * Вход Выход Рис. 6.3. Схема обучения нейронной сети при экстраполяции траекторий Ui" Xn+1 u2 = Xn+2 uM Vn+M Для подтверждения возможности нейронной сети экстраполировать координаты целей были проведены численные эксперименты по сопровождению линейно перемещающейся цели и цели, двигающейся по дуге окружности. Была взята нейронная сеть в виде трехслойного персептрона. Для обеспечения возможности формирования точных линейных преобразований в сети были введены дополнительные связи входных нейронов с выходными (обобщенный персептрон). Такая сеть оказалась способна эффективно обучаться сопровождать линейно движущиеся цели (рис. 6.4,я), обеспечивая точности экстраполяции коор- 271
Глава 6 а) б) Рис. 6.4. Сопровождение нейросетевым экстраполятором движущейся цели по прямолинейной (а) и нелинейной (б) траекториям Фаридом Амузегаром (Farid Amoozegar) [158] был разработан гибридный подход, позволяющий использовать нейронную сеть совместно с фильтром Калмана. В реальных системах вторичной обработки используется арифметика с конечным числом знаков, из-за чего появляются ошибки квантования, роль которых очень велика в калмановской фильтрации. В [232] использован метод backpropagation, чтобы снизить уровень этих ошибок. Другая интересная модель была предложена Эдвардом Фиксом (Edward Fix) [208], который с помощью нейронной сети моделировал человека, управляющего самолетом. В последнее время даже появились работы, в которых исследователи пытаются имитировать низкоуровневые нейрофизиологические механизмы для сопровождения объектов [288]. 6.1.4. Качество работы традиционных методов траекторной обработки. Общепринятым показателем достоверности выдаваемой потребителю информации является число ложных траекторий. Однако при перепутывании отметок от целей, имеющих близкорасположенные траектории, понятие ложной траектории становится весьма неопределенным. Так, если траектория сформирована по отметкам от различных целей, т.е. в результате перепутывания, но ее формуляр близок к параметрам движения истинной цели, которая не сопровождается, то нет никаких причин считать такую траекторию ложной. Поэтому в первую очередь следует определиться с методическими вопросами оценки эффективности сопровождения траекторий групп целей [58; 77; 131]. Наиболее представительными показателями оценки качества вторичной (траекторной) обработки отметок являются вероятность существования траектории по каждому из находящихся в зоне обзора целей, 272 динат не хуже калмановского фильтра (упрощенная реализация в виде а-(3 фильтра). Если же цель двигается по окружности (рис. 6.4,6), нейронная сеть обеспечивает в несколько раз лучшие оценки, чем линейный фильтр, обеспечивая точности, сравнимые с линейным случаем.
Нейросетевые методы формирования и сопровождения траекторий ... целей усредненная по всей зоне; среднее количество ложных траекторий, выдаваемых потребителю; а также среднеквадратические ошибки сопровождения траектории по координатам и скорости. Как отмечено выше, вопрос определения ложных траекторий имеет неоднозначное решение. Наиболее простым и физически ясным является способ определения числа ложных траекторий Л^лт в виде разницы общего числа сопровождаемых траекторий Nw и числа правильно сопровождаемых целей Nnconp: Nm=NTp-Nluonp. (6.21) При этом остается открытым вопрос о том, какие цели считать правильно сопровождаемыми. Кроме того, возможность применения этой формулы при групповом сопровождении траекторий весьма проблематична из-за сложности определения, что считать NTp и Nnconp. Наиболее целесообразным представляется следующий подход. Каждая цель, для которой имеется сформированная траектория, достаточно близкая по параметрам движения, считается сопровождаемой. Каждая траектория, достаточно близкая к какой-либо цели, считается истинной, а все остальные - ложными. Определение среднеквадратиче- ских ошибок выдаваемых координат и скоростей целей осуществляется только по истинным траекториям. Для адекватного сравнения различных алгоритмов необходимо определить унифицированные исходные данные и критерии оценки. Выбранные показатели существенным образом зависят от меры близости по параметрам движения между сопровождаемыми траекториями и истинными целями. Очевидно, что их изменение определяет как число траекторий, считаемых ложными, так и точностные характеристики выдаваемой информации. Так при увеличении этой меры количество ложных траекторий сокращается, но одновременно растут ошибки, за счет траекторий, параметры движения которых весьма далеки от параметров движения истинных целей и которые ранее считались ложными. В настоящих исследованиях истинными считаются траектории, координаты которых отличаются от истинных не более чем на 1000 м, а скорости не более чем на 200 м/с. В качестве тестового варианта при исследовании алгоритмов использовался следующий. В зоне обзора находится 6 групп целей по 4 единицы в каждой. Расстояния между целями в группе меняются от 300 м до 1000 м. Скорость перемещения группы выбирается случайным образом в пределах от 50 м/с до 700 м/с в произвольном направлении. В момент появления группа находится в случайно выбранном месте зоны. При выходе цели из зоны обзора генерируется новая. 273
Глава 6 Оценка качества работы данного традиционного алгоритма по группам целей проводилась для вариантов с различными вероятностями сопровождения отметок (Р = 0,5; 0,7; 0,9; 1,0). Получаемые результаты зависят от размеров стробов, которые обычно выбираются на этапе испытаний. Поэтому результаты расчетов показателей эффективности представлены в виде зависимостей от размеров стробов, точнее, от коэффициентов расширения стробов относительно ошибок измерения координат. На рис. 6.5 приведены результаты статистических оценок количества ложных траекторий, определенных по критериям близости по параметрам движения. Там же представлены результаты оценок средних круговых ошибок определения координат целей и ошибок определения скоростей. Результаты оценок средних круговых ошибок определения координат целей и их скоростей представлены на рис. 6.5. в) 1,90 2,40 2,90 Коэффицент расширения стробов -Робн = 0 9 -Робн=0 7 -Робн = 0 5 Робн=1 0 Рис. 6.5. Зависимость количества ложных трасс (а), ошибок определения координта целей (б), ошибок определения скоростей (в) от коэффициента расширения стробов 274
Нейросетевые методы формирования и сопровождения траекторий ... целей На рис. 6.6 изображены результаты расчетов средней вероятности существования траекторий по истинным целям. я us g 0,80 о Он к 0,60 X g0,40 s Qi -е. 0,20 о ^ 0,00 1/ + - 4 - - - - • *~~ — -=.-_: Г«??.г.гг..-..—. . + - - е Р ■ • Ю 1,60 1,80 2,00 2Д0 2,40 2,60 2,80 3,00 3,20 Коэффицент расширения стробов Рис. 6.6. Зависимость коэффициента проводки от коэффициента расширения стробов Полученные зависимости свидетельствуют об ухудшении достоверности и точности информации с ростом размеров стробов и вероятности обнаружения отметок. Это естественно, так как при увеличении в среднем числа отметок, попавших в каждый строб, затрудняется правильная идентификация отметок. Однако одновременно с этим повышается количество правильно сопровождаемых целей (полнота выдаваемой информации). Анализ приведенных результатов показывает, что традиционные алгоритмы работают по групповым целям неудовлетворительно. Число ложных траекторий, отличающихся от истинных по параметрам движения, составляет в среднем 2...5, а оценка числа целей в зоне отличается от истинной в 2...4 раза. Ошибки выдаваемых координат хуже требуемых в 2...3 раза. Полнота выдаваемой информации не превышает 0,9 даже при абсолютно достоверном обнаружении отметок, что связано с неправильной идентификацией отметок и уводом истинных траекторий в сторону близлежащих целей. Следует учитывать, что данные результаты получены по неманев- рирующим целям, и при маневрах целей могут значительно ухудшиться. Поэтому рассмотренным алгоритмом с любыми задаваемыми параметрами сопровождать группы целей невозможно. Одним из вариантов улучшения сопровождения траекторий групп целей является проведение группирования отметок в кластеры [94]. Наиболее распространенным из алгоритмов кластерного анализа является следующий [2]. Начиная с любой отметки, формируется очередной кластер, к которому добавляются все отметки, расстояния до которых от 275
Глава 6 центра кластера меньше заданного. Из отметок, не попавших в очередной кластер, формируется новые. Процесс продолжается до тех пор, пока все отметки не будут исчерпаны. Таким образом, кластеризация основывается лишь на расстояниях между отметками и никоим образом не учитывает логику расположения целей в налете и их построения в группах, объектах, реально отражающих кластеры. Существенным при этом является принятый размер дистанции, в пределах которого отметки входят в один кластер (порог кластеризации). Он определяет правильность группирования отметок. Если он слишком мал, группирования практически не происходит и вторичная обработка не улучшается. При излишне больших порогах в один кластер может попадать несколько групп, что ухудшает качество сопровождения траекторий. Для определения его допустимых величин были проведены статистические расчеты числа образуемых кластеров при наличии в зоне обзора двух четверок целей с расстояниями между целями 300 м и дистанцией между группами 1500 м. Анализ полученных результатов показывает, что наиболее предпочтительные величины порога кластеризации лежат в пределах 1000...2000 м. С выбранным порогом кластеризации тесно связан вопрос об ошибках определения центра кластера. В результате изменений взаимного расположения целей в течение времени возможно формирование различного числа кластеров, состав каждого из которых будет изменяться. Кроме того, в связи со статическим характером обнаружения отметок от целей определить центр кластера с достаточной степенью точности практически невозможно. Очевидно, что ошибка определения центра кластера будет существенным образом зависеть от количества и расположения целей в обрабатываемой группе, а также от местоположения обнаруженных отметок. Поэтому описать аналитически в общем случае дисперсию ошибки определения центра кластера не представляется возможным. Имеет смысл определить ошибки лишь для некоторых частных случаев. Если предположить случайное расположение целей с дисперсией <тц при наличии Nn в группе и обнаружении No6li отметок от них среднеквадратическое отклонение (сгцентр) положения центра группы без учета ошибок измерения координат отметок будет определяться выражением: (6.22) 276
Нейросетевые методы формирования и сопровождения траекторий ... целей В том случае, если в кластер могли бы входить и отметки, каждая из которых обнаруживается с вероятностью Р, а их расположение случайно на отрезке длиной г, среднеквадратическая ошибка определения центра группы составит: 4нтр = У Cj Р1 (1 -РГ' — • (6.23) центр ^ „ V / u . г_^_ру В случае работы по четверке целей (п = 4) Р = 0,5; <тцешр*0,3 г. (6.24) Таким образом, ошибка определения местоположения центра кластера сравнима по величине с его размером. Поэтому формируемые стробы захвата и сопровождения траекторий должны быть (К = 2... 3 ) порядка размера кластера. В результате значительного расширения стробы для различных кластеров будут частично пересекаться, что приведет к появлению ложных траекторий кластеров. При этом алгоритм сопровождения полностью соответствует варианту сопровождения одиночных отметок, описанному выше, только вместо координат отметок на вход системы вторичной обработки подаются координаты центров кластеров. Естественно, что в этом случае при определении размеров стробов необходимо учитывать возможные ошибки определения центров кластеров. Их величины можно оценить с помощью приведенных соотношений. Для тех же условий, что и при сопровождении одиночных отметок были проведены расчеты показателей качества вторичной обработки: среднего количества ложных траекторий. Результаты расчетов для дистанции группирования 1000 м приведены на рис. 6.7,а, а для дистанции группирования 2000 м на рис. 6.7,6. Их сравнение с вариантом сопровождения одиночных отметок показывает, что группирование позволяет примерно на порядок сократить количество ложных траекторий. Однако следует учитывать, что в данном случае ложной является группа целей и ошибка оценки общего количества целей в зоне также весьма значительна. Кроме того, при регулярном построении всех целей в зоне и их маневрировании можно ожидать ухудшения характеристик. Остальные показатели при рассмотренном варианте вторичной обработки не только не улучшаются, но и даже несколько ухудшаются и не удовлетворяют поставленным требованиям. Существует несколько модификаций алгоритма группового сопровождения траекторий, которые разработаны для улучшения качества вторичной обработки. Один из них предполагает сопровождение групп отметок внутри группы и выдачей потребителю каждой отметки со ско- 277
Глава 6 ростью, вычисленной для содержащей ее группы. Такой вариант в смысле алгоритмов формирования и сопровождения траекторий ничем не отличается от рассмотренного выше. Отличие заключается в форме предоставления информации потребителю. 1,50 1,00 А Робн=0 7 ■ Робн^О 5 - Ш- Робн=1 0 1,90 2.40 Коэффицент расширения стробов а) 0.50 0.45 0.40 0,45 0Л0 0,25 0,20 -*-Робн 0 9 -•- Робн 0 7 -»-Робн = 0 5 —■—Робн- I О Рис. 6.7. Зависимость количества ложных трасс коэффициента расширения стробов при дистанции группирования а- 1000 м; б-2000 с Другой вариант имеет более глубокие отличия. При первичном формировании траекторий он повторяет предыдущие. Однако в дальнейшем для каждой отметки формируется собственный строб сопровождения с учетом скорости перемещения всей группы в целом. Отметки, стробы которых пересекаются, считаются группой, и по ним формируется кластер. По местоположению этого кластера и экстраполированной точке уточняется скорость его движения. Этот алгоритм, по всей вероятности, имел бы близкие к требуемым показатели качества, если бы размеры стробов, выставляемых вокруг каждой из отметок, соответствовали стробам сопровождения одиночных отметок. Однако величина стробов определяется ошибками определения скорости перемещения кластера, т.е. определения его центра в двух последовательных периодах, а, следовательно, должна соответствовать размерам стробов при групповом сопровождении траекторий. Все отметки группы имеют одинаковые стробы. Поэтому критерий группирования по пересечению стробов эквивалентен критерию группирования, описанному выше с пороговой дистанцией, равной диаметру 278
Нейросетевые методы формирования и сопровождения траекторий ... целей 279 строба. Поэтому без использования какой-либо дополнительной информации этот метод также практически не отличается от предыдущих. Из проведенного анализа можно сделать вывод о том, что традиционные алгоритмы траекторной обработки целей без группирования отметок совершенно непригодны для работы по массированным налетам целей в плотных групповых порядках. Среднее число ложных траекторий составляет в среднем 2...5, а оценка числа целей в зоне отличается от истинной на несколько десятков, что намного хуже требований, предъявляемых потребителем радиолокационной информации. Ошибки выдаваемых координат хуже требуемых в 2...3 раза. Использование известных методов кластеризации (группирования) отметок не позволяет достичь требуемой эффективности вторичной обработки. Ошибки выдаваемых координат могут превышать 600 м, а оценка числа групп в налете значительно превышает их истинное число. Относительно недавно появились более мощные методы одновременного сопровождения многих целей [168; 170]. Они используют описание апостериорных вероятностей одновременно для всех целей в группе и выбирают максимально правдоподобный вариант, аналогично рассмотренным выше подходам. При относительно небольшом числе целей в группах удается построить эффективные методы отождествления и сопровождения целей [169], которые могут быть использованы при синтезе систем вторичной обработки РЛС [37; 94]. Однако при увеличении числа целей возможности его работы даже на перспективной вычислительной базе ограничены. Поэтому рядом автором предложены варианты упрощения этого метода. Так в [165] рассматривается матрица правдоподобия, которая при определенных предположениях принимает упрощенный вид, что позволяет снизить вычислительную сложность алгоритма. В [207] предложен другой вариант аппроксимации получаемых с помощью общего алгоритма решений, также ведущий к упрощению вычислений. Однако все известные методы, опираясь на статистические предположения, обеспечивают низкое качество отождествления целей [332]. Для преодоления вычислительных трудностей в [327] было предложено использовать способность сетей Хопфилда находить решение трудных оптимизационных задач, к которым относится поиск максимально правдоподобных соответствий. Однако полностью решить задачу отождествления целей не удалось. Для создания системы вторичной обработки, эффективно работающей по групповым целям необходимо при группировании и сопровождении отметок учитывать структуру расположения целей в группах. Только таким путем можно обеспечить требуемое высокое качество вторичной обработки. Обработка групп целей может быть описана следующим образом [119; 337].
Глава 6 Первоначально проводится кластеризация (группирование) всех отметок, полученных на текущем обзоре. Дальнейшая обработка проводится только по сформированным кластерам. Причем, одиночные отметки считаются кластерами, состоящими из одного элемента. В качестве координат при формировании и сопровождении кластера рассматривается его центр. Одновременно внутри каждого кластера неединичного состава формируются псевдотраектории входящих в него целей в связанной с центром кластера системе координат. При этом представляется возможным допущение о постоянстве координат каждой цели в местной системе координат. Для идентификации отметок внутри группы применяется одна из процедур совместной идентификации отметок (транспортная задача). С целью обеспечения максимальной вероятности идентификации в случаях наличия временного ресурса используется анализ группы нейросетевым алгоритмом установления ассоциаций. 6.2. Ассоциативное воспроизведение отметок для эффективного отождествления целей Наиболее интересным для дальнейших исследований представляется вариант определения и запоминания структуры группы отметок, сравнения его с эталонными образцами и дальнейшего сопровождения группы уже предполагаемой структуры с последующим ее уточнением. Использование для этих целей логических алгоритмов весьма затруднительно из-за невозможности строгого единого описания всех возможных построений целей в группах. Наиболее подходящим представляется использование нейросетевых алгоритмов ассоциативного запоминания. Преимуществом этих алгоритмов является возможность самонастройки на предъявляемые при обучении образцы. Наиболее адекватной нейросетевой моделью для запоминания и воспроизведения структуры группы на последующих обзорах является ассоциативная память Хопфилда. Эта модель реализует полносвязную нейронную сеть, в которой каждый нейрон связан со всеми остальными. 6.2.1. Представление ассоциативной памяти Хопфилда в векторном виде для разреженных образов. В общем случае ассоциатив- использование при значительных размерностях анализируемых образов оказывается проблематичным. В задаче ассоциативного воспроизведения отметок анализируемый участок пространства может быть весьма большого размера (50x50). В элементов памяти, поэтому ее 280
Нейросетевые методы формирования и сопровождения траекторий . целей этом случае N = 2500 , а объем требуемой памяти даже для обычной ассоциативной памяти составляет Omem = (2500 х2500)/2 «3000000. Однако информативных точек, т.е. элементов, содержащих предполагаемые отметки от целей намного меньше. В типичном случае имеется 10...20 отметок. Поэтому весь массив памяти расходуется недостаточно эффективно. Целесообразно использовать разреженную структуру запоминаемого образа для того, чтобы уменьшить требуемые размеры памяти. Рассмотрим организацию массива межнейронных связей в случае запоминания разреженных областей. Большинство элементов массива межнейронных связей будет соответствовать нулевым элементам запоминаемого образа, и запоминать их не имеет смысла. Подлежат запоминанию только те связи, которые соответствуют обнаруженным отметкам. При этом следует хранить их характеристики, т.е. от каких именно элементов изображения эти связи образованы. Ниже мы будем рассматривать запоминаемый образ не в виде вектора, а в более соответствующем реальной задаче воспроизведения изображений представлении, в виде матрицы. ч -> ytJ (6.25) Для каждой пары непустых ячеек (элементов изображения, в которых присутствуют обнаруженные отметки от целей) запоминаются их координаты ((/jJi), (hJif) • Более удобно использовать несколько отличающуюся форму представления, хотя она и менее экономна. В ней составляется список всех непустых ячеек изображения и для каждой из них формируется внутренний список связей с другими ячейками. Такая форма представления допускает наглядную интерпретацию в виде пучка векторов, выходящих из каждой ячейки, содержащей отметку (рис. 6.8). При такой организации представления межнейронных связей для запоминания образа, содержащего 20 отметок, потребуется ^rnem = 2 х (20 х (20 -1)) * 800 , что на несколько порядков меньше, чем при обычной организации памяти. Соответственно уменьшится и объем требуемых вычислений. Для воспроизведения запомненные векторы с противоположным направлением, прикладываются к соответствующим ячейкам представленного для воспроизведения изображения (рис. 6.9), т.е. среди всех запомненных векторов воспроизводятся только -I ШЩ Рис. 6.8. Пучок векторов запомненных связей для одной из непустых ячеек 281
Глава 6 ■ / / те, которые имеют в месте своего начала ненулевую ячейку. Ячейки, на которые указывают полученные вектора, принимают единичное значение. При этом возможно применение пороговой обработки, обычно используемой в ассоциативной памяти. Такой вариант организации вычислений функционально полностью аналогичен традиционному, но за счет использования разреженной структуры запоминаемого и воспроизводимого образа позволяет более эффективно использовать вычислительные мощности. На рис. 6.10 приведены результаты работы традиционной сети Хопфилда при анализе структур групп радиолокационных целей. Показано воспроизведение зашумленного образа при наличии одновременно двух групп целей различных структур с различными местоположениями. При этом в левой части рисунка представлены образы, доступные в данный момент пользователю. Те образы, которые изображены черными точками на зеленом фоне, запомнены системой. Рис. 6.9. Воспроизведение элемента изображения при векторной форме запоминания межнейронных связей Рис. 6.10. Воспроизведение структуры группы целей ассоциативной памятью Изображенные черным цветом слева в маленьких окошках образы составляют банк запомненных, а также представляемых для воспроизведения образов. Образ в верхней правой части изображения, показанный светлым цветом на сером фоне, активен в настоящий момент, то есть находится в окне редактирования, а в нижней левой части приводится отклик ассоциативной памяти на выбранный образ. Как видно из этого рисунка воспроизведение структуры группы вполне достоверно и точно даже при пропадании части отметок от целей и появлении ложных отметок. 282
Нейросетевые методы формирования и сопровождения траекторий . целей 6.2.2. Обобщение нейросетевой модели для инвариантного относительно сдвигов ассоциативного воспроизведения образов. В случае даже небольшого сдвига распознаваемого образа относительно положения, при котором запомнен эталон, воспроизведение становится невозможным. Это иллюстрируется рис. 6.11. !ввшвв Ш 1 т ШИПИ т { НИН жш Be Рис. 6.11. Отсутствие воспроизведения при сдвиге запомненного образа традиционной ассоциативной памятью Естественно такое воспроизведение структуры группы совершенно неприемлемо для использования в системах вторичной обработки радиолокационной информации. Рассмотрим вопросы обеспечения инвариантности подробнее. Обеспечение инвариантности к заданной группе преобразований является одним из наиболее важных вопросов при запоминании изображений, в том числе и с помощью нейросетевых систем. Среди преобразований, для которых необходимо добиться инвариантности, наиболее важными являются аффинные преобразования. Простейший случай таких преобразований (подмножество аффинных преобразований) - это перемещение изображения. Для большинства образов необходимо обеспечить распознавание независимо от его местоположения. Более сложными являются преобразования поворота и растяжения (сжатия). Со времени появления теории нейросетевых систем развито большое количество различных подходов к обеспечению инвариантности. Среди них можно выделить две основные группы [29]. Во многих случаях предлагается использовать нормирование изображений. Такое нормирование предполагается осуществлять по- разному. Например, для достижения инвариантности к перемещениям следует переместить распознаваемые образы таким образом, чтобы характерная точка, например геометрический центр точек изображения (крайняя верхняя левая, крайняя правая нижняя или др.), совпал с заранее заданным положением. Для обеспечения инвариантности к поворотам и растяжениям (сжатиям) необходимо перед обработкой провести 283
Глава 6 соответствующие компенсирующие повороты или сжатия (растяжения). В общем случае предполагается, что для любого преобразования, по отношению к которому стремятся достичь инвариантности, и для любого изображения существует компенсирующее преобразование, переводящее запоминаемый или распознаваемый образ в некоторый эталонный. В таком случае действительно обеспечивается независимость распознавания от случайных преобразований образов. Данный подход опирается на допущение о независимости компенсирующего преобразования от возможного зашумления изображения и, следовательно, хорошо работает только для безоговорочно соответствующих друг другу образов. В то же время для большинства практических применений, в том числе и для вторичной обработки радиолокационной информации это допущение не выполняется. Даже в простейшем случае инвариантности к перемещениям очевидна неприменимость компенсационных преобразований. Действительно, чаще всего предлагается нормировать изображение относительно геометрического центра. Однако при отсутствии части точек образа, что является стандартной ситуацией, положение геометрического центра относительно образа изменяется и не позволяет достичь совмещения образов. Особенно сильно это проявляется, когда количество точек мало (2... 10) и смещение центра может быть весьма значительным и сравнимым с размерами самого образа. При этом работа нейросетевых систем становится весьма затруднительной или даже невозможной. Аналогичные замечания справедливы для всех вариантов указанного подхода. Более математически обоснованным следует считать подход, который предполагает поиск инвариантов для преобразований, относительно которых следует добиться инвариантности. Например, для достижения инвариантности к перемещениям могут к изображениям применяться преобразования типа Фурье (амплитудный спектр), результат действия которых остается практически неизменным для смещенных изображений. Существенно более сложной задачей является поиск соответствующих преобразований для более сложных вариантов инвариантности. Хотя известно большое число работ, обсуждающих этот подход, в общем случае достаточно эффективно работающих преобразований не известно. Рассмотрим подход, имеющий более общий характер применения и, одновременно, более близкий по идеологии к нейронным сетям [119; 337]. Пусть имеется группа G преобразований, относительно которых необходимо обеспечить инвариантность запоминания образов. Работу нейронной сети в большинстве случаев можно описать применением некоторого оператора А: RNxRNx...xRN (6.26) 284
Нейросетевые методы формирования и сопровождения траекторий ... целей действующего из пространства RN xRN x...xRN групп точек изображения размерностью N в пространство нейронных связей размерностью М . Любое преобразование порождает соответствующее ему разбиение множества групп точек изображения на взаимно непересекающиеся подмножества, которые для него эквивалентны. Х,.^,...,^: gy{g{xi)) = g(xJ)}9 (6.26) g,giJsG gu(xl) = xJ. (6.27) Представляется целесообразным использовать указанное разбиение при формировании (перевычислении) связей между нейронами. Для этого имеется два способа. Во-первых, можно одновременно с вычислением связей по какой-либо группе точек jx^,...,jc^| задавать то же перевычисление для всех групп, которые представляются в виде |g(х- • Очевидно, что при этом обеспечивается требуемая инвариантность. Но, одновременно, резко возрастают вычислительные затраты на каждый шаг обучения, так как приходится вместо одного вычисления связи проводить их значительное число, зависящее от вида преобразования инвариантности. Полностью аналогично можно поступать и для воспроизведения образов, имея в виду подобное запоминанию увеличение количества вычислений. Вторым и, как представляется, более удачным методом реализации указанного подхода является преобразование матрицы связей из стандартного вида к виду, учитывающему введенное преобразование. Рассмотрим двумерный запоминаемый образ jx^.j. Простейший вариант нейросети для его запоминания - модель Хопфилда или ассоциативная память первого порядка предполагает вычисление матрицы связей R, пространство которой является прямой суммой исходной матрицы самой с собой (в рассматриваемом случае это четырехмерное пространство), т.е.: г0Г/=ХуХу (6-28) Воспроизведение образа yi} на основе матрицы связей и исходной матрицы xtj проводится путем вычисления суммы: yiJ=Y,xi'j'ryi'f- (6-29) i'f В приведенной упрощенной интерпретации опущены нелинейные преобразования связей для запоминания нескольких образов и нелиней- 285
Глава 6 ные преобразования выходных образов, реализующие собственно пороговые функции нейронов. При инвариантном относительно сдвигов запоминании предлагается рассчитывать связи согласно выражению: О" Воспроизведение в этом случае определяется формулами: Уу=^хш'М'П? • (6-31) О" Очевидно, что при этом размерность пространства связей снижается в соответствии с пространством групп разбиения, порождаемых инвариантными преобразованиями. В более общем случае ассоциативной памяти к -го порядка связи описываются выражением: г к .к = хихг ••• х-к .к • (6.32) iji'j'..iKf U lJ if v 7 Для воспроизведения справедливо соотношение: ,y..,V При обеспечении инвариантности к сдвигам аналогично вышеприведенным выражениям получаем для запоминания и воспроизведения: ri'f.Jjk = У^1ХЧ Xi+i'J+f '"Хмк j+fk ' U Уи- 7 хи....х к кг,, кк. (6.34) 'У 1+1 J+J i+r j+j ij .ij i'f ikjk Полученный метод весьма удобен для реализации и позволяет успешно реализовывать любые виды инвариантности, что сводится к выбору соответствующей функции преобразования индексов. Допустимо даже использование таблично заданных функций. Единственным ограничением является требование, по обеспечению полноты введенных преобразований, что вытекает из общей теории инвариантности. Так нельзя обеспечить инвариантность к сдвигам на ограниченное число элементов, так как из этого с необходимостью вытекает инвариантность к любому количеству таких сдвигов, проведенных последовательно. Возможен другой вариант, требующий большей размерности матрицы межнейронных связей, но, одновременно, обеспечивающий 286
Нейросетевые методы формирования и сопровождения траекторий ... целей более высокую точность воспроизведения. Для этого варианта предлагается связи и воспроизведение образа рассчитывать согласно выражениям: У У ^,Xi+i'J+j"ri'fy (6.35) Очевидно, что при этом размерность пространства связей будет такой же, как и для традиционной сети Хопфилда, т.е. в данном случае четырехмерным. Воспроизведение изображения по заданному, возможно искаженному, изображению задается выражением: Уу=Т< (6.36) * j где i\J\J[J[, как и выше, такие наборы индексов, для которых одновременно xi+v+J{ и гшя не равны нулю. Предлагаемый алгоритм инвариантной ассоциативной памяти также может быть представлен с помощью векторной организации структур данных в случае разреженных образов. Запоминание образа осуществляется аналогично неинвариантному случаю, т.е. запоминаются все вектора, соединяющие ненулевые элементы изображения. При воспроизведении к каждому ненулевому элементу искаженного образа прикладывается вектор, обратный запомненному. Отличие от неинвариантного - версии, при котором запомненный вектор прикладывается к единственной соответствующей ему точке изображения, заключается именно в том, что в качестве точек приложения векторов рассматриваются все возможные варианты. 1 m / / / / у 1 и 4Г ■ Z т г pp. ш т ш S У у S — / J / Рис. 6.12. Запоминание образа точки изображения для инвариантного воспроизведения Рис. 6.13. Воспроизведение образа при ассоциативном инвариантном воспроизведении 287
Глава 6 Таким образом, для каждого ненулевого элемента изображения, предоставляемого для воспроизведения, воспроизводятся векторы из сформированного при запоминании набора, начало которых находится в ненулевом элементе воспроизводимого изображения, и которые соответствуют выбранной точке изображения для всех имеющихся сдвигов. Там, где эти векторы оканчиваются, в воспроизводимом изображении формируется значение, равное общему количеству заканчивающихся в этом элементе векторов. Из всех полученных ненулевых элементов воспроизведенного образа выбирается максимальный, который и принимается за соответствующий рассматриваемой точке исходного изображения. На рис. 6.14 приведены результаты работы инвариантного обобщения сети Хопфилда при анализе структур групп радиолокационных целей. Показано воспроизведение одновременно двух зашумленных групп целей различных структур с различными местоположениями, каждая из которых сдвинута относительно эталона. шжш BSB in Рис. 6.14. Воспроизведение групп целей предложенной моделью ассоциативной памяти при сдвигах и зашумлении эталонных образов 6.2.3. Нейросетевое ассоциативное воспроизведение отметок от целей. Данный метод, является основой для решения задачи воспроизведения образа, местоположения точек которого, как это часто бывает в реальных условиях, известны неточно и имеют некоторые ошибки, описываемые нормальным законом с некоторой дисперсией. Так при идентификации отметок при траекторной обработке целей, гарантировать точное измерение положения ненулевых элементов (целей) невозможно. Для расширения данного метода инвариантного запоминания на случай неточного измерения положений ненулевых элементов следует провести операцию, эквивалентную многократному запоминанию искаженных изображений с соответствующей нормировкой матрицы межнейронных связей. При чем при каждом запоминании ненулевые 288
Нейросетевые методы формирования и сопровождения траекторий ... целей элементы имеют положение, описываемое их плотностью распределения. Предположим, что процесс указанного запоминания проведен. Тогда полученный в результате набор векторов, в сжатом виде описывающий межнейронные связи, будет представлять собой «размытые» вектора, т.е. концы векторов будут иметь не четко фиксированное положение, а некоторое множество возможных положений со значимой вероятностью, которая зависит от плотности распределения ошибок измерения положений ненулевых элементов. В частности, если распределение ошибок нормальное, то векторы имеют множество возможных положений, описываемое функцией Гаусса. При этом формирование и запоминание матрицы синаптических связей проводится так же, как и указано выше, в виде набора векторов, связывающих ненулевые элементы. Отличие заключается только в процессе воспроизведения. Рассмотрим два последовательных обзора РЛС. Пусть на первом обзоре получено компактное множество отметок (xl9yl)9(x2,y2)9 ...9(xN9yN) , а на следующем - множество (х[9у[)9 (х'29у2)9 ...,(х'М9у'м) . Тогда при запоминании структуры относительно одной из множества точек первого обзора (например, первой) рассчитываются вектора (ai9 ty), равные: Рис. 6.15. Воспроизведение образа со смещенными отметками (ai9 bt) = (xl9 yi)-{xl9y]); i = 29N. (6.37) Для воспроизведения образа этой точки рассматриваются точки (Ру'Яу) > местоположение которых определяется выражениями: (p^qu) = (x:9y:)-(ai9bi)9 i = 29N9 j = \9M. (6.38) Размер этого множества составляет M(N-\). Из них часть, равная пересечению точек из обоих множеств, соответствует истинному местоположению точки из множества которая эквивалентна точке (jc,, >>j). Подход, описанный выше, предполагает поиск из множе- 10—5782 2 89
Глава 6 ства (p,q) точки (р°,<7°), на которой обеспечивается достижение максимума выражения: \2 / лч2" N М ZZexp 1=2 у=1 (р,-р°) (я,-я°) -> max. (6.39) Решение этой оптимизационной задаче не может быть выражено в замкнутом виде. Поэтому следует применить методы математического программирования. Наиболее удобным представляется градиентный метод. Он предусматривает последовательные перемещения из некоторой начальной точки, в качестве каковой можно выбрать, например, центр тяжести всех точек, по направлению, противоположному градиенту целевой функции. В рассматриваемом случае вектор перемещения [Ар, Aq), противоположный градиенту, описывается выражениями: Ap = SS(^"^°) ехр i=2 У=1 N М ^=XZfc"*°)ехр /=2 У=1 (p*-p°f fe-*0)2 (6.40) Полученное значение в соответствии с изложенным выше подходом соответствует образу первой точки из множества отметок первого обзора. Указанный процесс поиска оптимальной точки зачастую может оказаться слишком трудоемким. В то же время, получение высокой точности решения вовсе не обязательно. Можно предложить несколько способов сокращения вычислительной трудоемкости. Во-первых, использование оптимизационного подхода с заданным очень небольшим числом итераций. Так обычно для получения необходимой точности обычно достаточно двух-трех итераций. Во-вторых, формирование сетки, соответствующей требуемой точности, например с шагом, равным ошибкам измерения координат отметок, и последующий прямой перебор всех значений для выбора наибольшего. При этом возможна аппроксимация трудновычислимых величин экспоненциальной функции табличными значениями. Этот способ более подробно рассмотрен ниже. Однако необходимо отметить, 290
Нейросетевые методы формирования и сопровождения траекторий ... целей что прямой перебор в большинстве случаев не является рациональным с точки зрения быстродействия. В-третьих, возможно рассмотрение областей, в которых значения экспоненциальной функции значимы. Вследствие высокой скорости спадания «хвостов» этой функции, указанные области будут небольшими. Далее можно рассматривать только области, где количество пересечений областей вокруг каждой из точек выше порогового числа ж.»р . В качестве образа рассматривается точка внутри области пересечения. Причем ее координаты можно определять как среднее от координат центров образующих ее пересекающихся областей. Это эквивалентно многомерной ассоциативной памяти порядка, соответствующего количеству выбранных истинных точек. Действительно, при многомерной ассоциативной памяти в качестве целевой функции для поиска максимума вместо суммирования функций правдоподобия для каждой из точек, следует максимизировать сумму логарифмов функций правдоподобия. Так в случае ассоциативной памяти второго порядка следует искать максимум от суммы по всем возможным парным произведениям функций правдоподобия: Z Z ехр ¥г=2 J\J2=l х ехр > max . (6.41) Для ассоциативной памяти третьего порядка следует искать максимум от суммы по всем возможным тройным произведениям функций правдоподобия и так далее. Очевидно, что решающий вклад в целевую функцию дает единственный член суммирования, состоящий из ряда произведений, число которых зависит от выбранного порядка ассоциативной памяти Мс. При этом целевая функция приобретает вид: _ с Пехр -» max, (6.42) или, что эквивалентно: (р,-р0)2 М0)2 -» max. (6.43) 291
Глава 6 Таким образом, ищется максимум суммы логарифмов функций правдоподобия, что, кстати, хорошо согласуется с традиционным статистическим подходом. Полученная целевая функция может быть переписана в виде: Это типичный пример задачи наименьших квадратов, решением которого является среднее значение координат от участвующих отметок. Таким образом, наиболее целесообразно для всех точек (p,q), для которых значение функции правдоподобия относительно заданного порог, в качестве воспроизведенной точки выбирается центр тяжести этих точек, который принимается за истинный. Это эквивалентно многомерной ассоциативной памяти порядка, соответствующего количеству выбранных истинных точек. Описанный процесс проводится для каждой точки, и для каждой из тех из них, для которых определена воспроизведенная точка, т.е. значение целевой функции в точке решения превосходит установленный порог, считается, что существует виртуальная отметка, продолжающая траекторию. Для выбора отметок, которые подтверждают предыдущие траектории и не будут являться началом новых траекторий, процесс проводится в обратном порядке. Использование данного метода при вторичной обработке групп целей позволяет добиться достоверного отождествления отметок и, следовательно, эффективного формирования траекторий целей. Причем, формирование траекторий возможно уже на втором обзоре, не дожидаясь подтверждения на последующих обзорах. Это особенно важно при работе по внезапно появляющимся целям. Окончательный алгоритм использования предложенной модификации ассоциативной памяти для отождествления отметок на последовательных обзорах будет следующим. На первом обзоре для каждой отметки определяются все вектора, ведущие из нее к другим отметкам, и составляется список этих векторов (рис. 6.16). На втором обзоре осуществляется воспроизведение каждой из отметок первого обзора. С этой целью для очередной воспроизводимой отметки первого обзора список векторов, полученных на предыдущем шаге, прикладывается к каждой вновь полученной отметке. (6.44) числа точек является значимым, т.е. превосходит некоторый 292
Нейросетевые методы формирования и сопровождения траекторий ... целей Рис. 6.16. Схема алгоритма ассоциативного запоминания и воспроизведения образов для отождествления отметок на последовательных периодах обзора Предполагается, что в точке, в которую указывает каждый вектор, построена целевая функция, описываемая гауссовым законом с центром в этой точке и дисперсией, равной дисперсии разности двух отметок на последовательных обзорах (рис. 6.17). Рис 6.17. Схема учета ошибок определения координат целей с гауссовым распределением Полученные целевые функции для всех полученных векторов складываются, образую суммарную целевую функцию, для которой ищется максимум. Поиск максимума может быть, осуществлен градиентными методами или путем перебора на сетке с более мелким шагом, чем дискрет изображения. Если решение имеет значение целевой функции выше некоторого порога, то воспроизведение отметки с первого обзора считается успешным. Для уточнения координат рассматриваются все концы векторов, которые находятся от нее не дальше некоторого предельного расстояния, зависящего от точностей определения координат целей локатором. 293
Глава 6 Координаты полученных точек усредняются, формируя уточненный образ воспроизводимой отметки. Если стоит задача воспроизведения только тех целей, от которых в текущем обзоре получена отметка, то проводится проверка на наличие в заданной окрестности от точки воспроизведенного образа истинной отметки. В случае ее отсутствия, полученный на данном шаге образ не учитывается в ходе последующих процедур траекторной обработки. 6.2.4. Анализ эффективности нейросетевого метода ассоциативного отождествления отметок от целей. Предложенный метод вторичной обработки радиолокационной информации по групповым целям с воспроизведением виртуальных отметок по их образам помимо удобства идентификации отметок имеет ряд весьма ценных положительных качеств [119; 337]. Во-первых, за счет того, что координаты виртуальных отметок определяются одновременно по местоположениям всех обнаруженных целей в группах, точности их определения повышаются. Во-вторых, виртуальная отметка может воспроизводиться даже в тех случаях, когда реальная отметка от цели подавлена шумами или помехами. Теоретические исследования этих свойств нейросетевого воспроизведения отметок сформулированы в виде следующего утверждения. Утверждение. Пусть в анализируемой области пространства присутствует группа из К целей и рассматриваются два последовательных обзора, причем на первом обзоре получено множество отметок (*!,>>,), (*2,^2), •••> (-^у-Улг) > а на следующем - множество (х[,у[), (х2,уг2), (x'N,y'N). Оба множества описываются нормальным законом распределения с одинаковым множеством математических ожиданий (Xj°, уi°), (*2, .У?)» •••> \х^Ум) и круговой дис- где Кпор пороговый уровень числа правильно наложенных на новую группу отметок векторов, К - число целей в зоне обзора. к-\ (6.45) пор 294
Нейросетевые методы формирования и сопровождения траекторий ... целей Координаты виртуальной отметки ухх , ух j описываются нормальным распределением со средним д^0) и круговой дисперсией <у\, равной: (6.46) Использование виртуальной отметки совместно с истинной позволяет повысить точность определения координат: а2=рст2у+(\-р)ст2в, (6.47) где о2в и а\ - дисперсии при отсутствии и наличии истинной отметки: N=2 / 8 ^=0,5^^/(1-^1^ . (6.48) N=2 / В Из выражения для точности определения координат видно, что при увеличении числа целей в группе N дисперсия оценки уменьшается и в пределе стремится к половине исходной дисперсии. На рис. 6.18 представлены результаты расчетов, проведенных согласно предложенным выражениям для групп в составе 8, 10 и 12 целей, соответственно. Полученные результаты свидетельствуют, что для большинства практически интересных случаев дисперсия ошибок измерения координат целей при наличии истинной отметки от цели уменьшается почти в 2 раза. Даже при отсутствии истинной отметки от цели получается весьма высокая точность определения координат. Дисперсия ошибок в этом случае всего в 1,5...2 раза больше исходной. Таким образом, можно утверждать, что предложенный метод позволяет улучшать точности определения координат для обнаруженных целей и с близкой к исходной точностью измерять координаты необнаруженных отметок, если соседние с ней отметки обнаружены. Использование ассоциативной памяти дает возможность воспроизведения образа отметки из группы даже при отсутствии истинной отметки. За счет этого эффекта повышается конечная вероятность обнаружения отметки, которая поступит на дальнейшую обработку. В результате полнота информации, выдаваемой РЛС, повысится. 295
Глава 6 Группа из 8-ми отметок я X о 0,5 0,7 0,9 Группа из 10-ти отметок I 0,5 0,7 0,9 Группа из 12-ти отметок 0,5 есть отметка 0,7 0,9 Вероятность обнаружения отметки —о— нет отметки —°— суммарно Рис. 6.18. Точность определения координат для восстановленной отметки относительно исходной дисперсии, для случаев: обнаружения отметки от цели в текущем обзоре, ее отсутствия и усредненная, с учетом вероятности обнаружения цели На рис. 6.19-6.21 приведены зависимости вероятности формирования образа от вероятности обнаружения одиночной отметки от цели р для групп в составе 4; 8 и 12. вероятность обнаружения отметки - 3 совпадения из 4-х - -А - 4 совпадения из 4-х 296 Рис. 6.19. Вероятность построения образа в группе из 4-х целей
Нейросетевые методы формирования и сопровождения траекторий ... целей Рис. 6.20. Вероятность построения образа в группе из 8-ми целей Рис. 6.21. Вероятность построения образа в группе из 12-и целей Анализ полученных результатов показывает, что при величинах порога КП0р немного больших, чем половина числа целей в группе: к + \ + 1...2. (6.49) обеспечивается достаточно уверенное формирование образа группы для вероятностей обнаружения одиночных отметок, с которыми обычно работают в радиолокации: 0,7...0,9. При больших значениях порога вероятность воспроизведения образа становится малой, и предложенный метод может применяться только при больших вероятностях обнаружения одиночных отметок от целей р > 0,9. 297
Глава 6 Полученный образ отметки может быть использован как для улучшения точностей определения координат целей, так и для повышения вероятностей формирования и сопровождения траекторий. При отсутствии истинной отметки и наличии сформированного ее образа, полученная виртуальная отметка может рассматриваться как истинная и подаваться на вход вторичной обработки. Это эквивалентно повышению вероятности обнаружения одиночных отметок или энергетическому выигрышу. В этом случае вместо традиционной вероятности обнаружения одиночных отметок необходимо рассматривать вероятность поступления отметки на вход системы вторичной обработки или полную вероятность обнаружения отметки. Вследствие независимости процессов обнаружения различных целей в группе и обнаружения на последовательных обзорах, события обнаружения отметки от рассматриваемой цели на текущем обзоре и формирования ее образа (независящего от текущей отметки от цели) можно утверждать, что полная вероятность обнаружения отметки от цели, Рполн, описывается выражением: Вероятность существования образа рассчитывается согласно приведенным выше выражениям. На рис. 6.22-6.24 приведены зависимости полной вероятности обнаружения цели Рполн от вероятности обнаружения одиночной отметки от цели р для групп в составе 4, 8 и 12 целей при различных пороговых значениях Кппп. ПОЛИ Ро+{1~Ро)^образа = Р + 0 " Р)Образа • (6.50) пор 5 0,8 о I 0,6 0,5 0,7 0,9 вероятность обнаружения отметки —■— 3 совпадения из 4-х 4 совпадения из 4-х Рис. 6.22. Полная вероятность обнаружения в группе из 4-х целей 298
Нейросетевые методы формирования и сопровождения траекторий ... целей Рис. 6.23. Полная вероятность обнаружения в группе из 8-и целей о 0,5 0,7 0,9 вероятность обнаружения отметки —♦—6 совпадений из 12-ти —▲—8 совпадений из 12-ти —■— 10 совпадений из 12-ти — -А— 12 совпадений из 12-ти Рис. 6.24. Полная вероятность обнаружения в группе из 12-й целей Полученные результаты свидетельствуют, что применение предложенного алгоритма позволяет существенно повысить вероятности поступления отметок на систему вторичной обработки. Это повышение может быть оценено энергетическим выигрышем, т.е. эквивалентным увеличением энергетики РЛС, с помощью которого можно было бы добиться такого же увеличения вероятностей обнаружения отметок. В зависимости от состава группы энергетический выигрыш составляет от 2 до 6 дБ при рабочих вероятностях 0,7...0,9. 6.2.5. Исследование вероятностей воспроизведения ложных образов. Для строгого и всестороннего анализа возможности применения предложенного нейросетевого алгоритма траекторной обработки групп целей необходимо помимо преимуществ рассмотреть и возможные отрицательные качества его работы. 299
Глава 6 Как и любой статистический процесс, воспроизведение отметок от целей в группах характеризуется ошибками первого и второго рода. Ошибки первого рода, соответствующие вероятностям формирования образов отметок, рассмотрены выше. Ошибки второго рода соответствуют возможному недостатку предложенного алгоритма - появлению ложных образов, не соответствующих истинным местоположениям целей. Появление ложных образов происходит при случайном наложении векторов от различных соседних целей. Количество образованных векторов равно Nq-\ (N0- число отметок от целей на предыдущем обзоре). При их наложении на Nx отметок на текущем обзоре, возникает (N0-i)N{ областей, каждая из которых могла бы служить образом рассматриваемой отметки. Очевидно, что в качестве порогового нельзя выбрать тривиальное значение КПор = 1, так как в этом случае все кроме одной области будут ложными. Истинной будет область, соответствующая истинной отметке, в которой одновременно пересекутся вектора от правильно отождествленных отметок. Наличие ложных образов зависит от топологии взаимного расположения целей в группе, взаимных расстояний между целями и размерами областей значимости функций правдоподобия, а также порогового числа Ктр. Получить аналитические оценки числа ложных образов весьма сложно. Поэтому был использован статистический метод. Для заданных величин расстояний между целями в группе v и размеров областей задавались случайные расположения целей, и проводился расчет количеств пересечений при различных пороговых числах ЛГпор. Расположение целей задавалось следующим образом. Первая отметка имела нулевые координаты. Вектора всех последующих di относительно предыдущих <iM рассчитывались по формулам: d^d^+vu l^.-^l^v у = 1,/ —2, (6.51) где и единичный вектор, имеющий случайное с равномерным распределением направление. Для каждого из возможных значений рассчитывалось число имеющих место пересечений областей заданного размера. Результаты расчетов по 10 ООО реализациям для каждого из случаев приведены на рис. 6.25-6.27 для групп в составе 4, 8 и 12 целей, соответственно. При этом использован факт масштабной инвариантности, заключающийся в том, что процесс образования образа зависит не от отдельных величин размера области (области группирования) и харак- 300
Нейросетевые методы формирования и сопровождения траекторий ... целей терного расстояния между целями, а только от их отношения, называемого на графиках относительной дистанцией группирования. относительная дистанция группирования 2 совпадения из 4-х —* — 3 совпадения из 4-х —А— 4 совпадения из 4-х Рис. 6.25. Среднее число ложных образов при ассоциативном отождествлении отметок в группе из 4-х целей j —■— 4 совпадения из 8-ми —А — 6 совпадений из 8-ми j —А— 8 совпадений из 8-ми Рис. 6.26. Среднее число ложных образов при ассоциативном отождествлении отметок в группе из 8-и целей Рис 6.27. Среднее число ложных образов при ассоциативном отождествлении отметок в группе из 12-й целей 301
Глава 6 Анализ полученных результатов показывает, что для пороговых величин, немного больших, чем половина число целей в группе *пор> к+\ + 1...2, (6.52) число ложных образов мало (менее 0,1). Заметим, что критическая величина для порогового числа та же, что и при анализе вероятностей появления истинных образов, только там это была область наибольших допустимых значений, а здесь - наименьших. Следовательно, при выборе пороговых чисел в указанном диапазоне достигается одновременное удовлетворение противоречивым требованиям высокой вероятности формирования истинного образа отметки и низкой вероятности появления ложных образов. Кроме того, интересно отметить, что при больших группах (8-12 целей) даже при относительной дистанции группирования более 0,5, что соответствует сравнимости ошибок измерения координат целей и взаимных расстояний между целями, количество ложных образов пренебрежимо мало. Таким образом, предложенный метод вторичной обработки радиолокационной информации по групповым целям с воспроизведением виртуальных отметок по их образам позволяет осуществить надежную идентификацию отметок с пренебрежимо малой вероятностью ложной идентификации. Кроме того, удается улучшить точности определения координат для обнаруженных целей до 2 раз и удовлетворительно (с близкой к исходной точностью) измерять координаты необнаруженных отметок, если соседние с ней отметки обнаружены, а также повысить вероятности формирования и сопровождения траекторий за счет поступления виртуальных отметок вместо истинных на вход вторичной обработки. 6.2.6. Моделирование методов ассоциативного воспроизведения образов групп целей. Полученные аналитические зависимости и численные оценки справедливы только в предположениях о том, что на входе локатора отсутствует ложная информация и ошибки измерения координат не настолько велики, чтобы области соседних образов сильно пересекались. Для того чтобы проверить качество работы предложенного алгоритма в реальных условиях, была разработана модель для оценки качества отождествления целей в группе для традиционных методов и предложенного. В модели имитируется случайное расположение целей в группе с заданными расстояниями между целями, формируются ошибки измерения координат, задается появление лож отметок и пропадание истинных. Общий вид модели приведен на рис. 6.28. 302
Нейросетевые методы формирования и сопровождения траекторий ... целей Данные | Кохонен, установки Соответствия j Дейкстра соогвотствуут | DUbetSum Стандарт соответствует I SLabelSum Вид сверху j Многоразовая проверка | ~1п| х| Хопфилд соответствует В|30 /10 MRALJ100 ^] /10 Potog |24 ^] /10 ЯПерерисоват Цвета Points] ^ jon | [7 Рисовать Центрироеа ТипХопфи/ 1-й Г 2-й Рез^мьтать! Cycles [l0 "И Остановить} 23 0:00:04 Вероятность соответствий 0 372516 0.352070 0.371170 0064536 Вероятность обнаружения Щель ^Траектория) 8 895Б52 0.913043 0.908696 0943478 Доля ложняка [1 - Траектория -> Цель] 0.331304 1.130435 2.304348 2 217391 Точность {Цель -> Траектория) 2 439323 2.433235 cjose Рис. 6.28. Общий вид модели для проверки качества отождествления целей На рис. 6.29, 6.30 и 6.31 показаны варианты сопровождения группы целей с помощью стандартного алгоритма отождествления информации, алгоритма Дейкстры и на основе предложенного метода ассоциативного воспроизведения отметок. ддн*« |л|рлмпрмтрасс) сдепмпгстс*] '■ШЯШШШШ 1ШЙ 1MJO цели к-ас дйэсрд ofri H^^g, лик. i9 — p ЗГ Реедльтжы гкш 0ет<ишН *иш *Ltbti *sLab<$ (Цдоь траектория! ctcabd p*tabd psLafari ■ леда лймняк! И * трмктадо * UfMiJ r*bei . *Ltt<$ 1Ш fcs&afcd тпчмосчъ |i**te-> траектория] **** *uuj 4Ш Рис. 6.29. Вид модели сопровождения группы целей с помощью стандартного алгоритма отождествления информации 303
Глава 6 {пцммгтфыГркс! Сдетмггелм») K-BcuMrt Рпд*т>»айл**ив | |тоХ |»" $ Qm*t* I Сирость Ouafc* mt«e» трюлиДО |вчЮИр«э| Мн»Ч)рИИИ*громр*.» 1 Цьет <Раи 1 lit"* Kpiyp HBegi*1 ~3 &4РОЧТНКТЬ (AM1 Wt'lfr*^ *l-k* #icbd >*■•*>« ttLabcf оТр»ектор»е# pdLdbei рвЫмн [1«Трмюгария *э L)tun| fatal*. Тр*ЮЮрмв] Рис. 6.30. Вид модели сопровождения группы целей с помощью алгоритма Дейкстры, используемого для отождествления информации А**»** | П«ммгг$мТраос{ Сослитопмя\ "а Вврть овн Мжс, лак, ]aV |ГТ§[ Рештак cjKfcLabd С ■т.анге»пъ| Вероятность ClUUMtlUltf fUftflb OlpMKTQptttt odLabai (1«Трактата о Цель! Kabd HL-jbtf Щф* о TptMNpt*) tfcUM Рис. 6.31. Вид модели сопровождения группы целей на основе предложенного метода ассоциативного воспроизведения отметок при отождествлении информации 304
Нейросетевые методы формирования и сопровождения траекторий ... целей При изменениях исследуемых параметров остальные величины, используемые при моделировании, принимают следующие значения: количество целей в группе - 6; количество ложных отметок, попавших в анализируемую область пространства - 1; скорость перемещения целей - 3; расстояния между целями - 1; вероятность обнаружения одиночной отметки - 0,9. * Dijkstre + Hopfield алгоритм Дейкстры; ассоциативное воспроизведение 305 В модели одновременно рассчитываются показатели качества отождествления для трех алгоритмов: эвристического алгоритма последовательного установления попарных соответствий, являющегося почти оптимальным решением задачи поиска максимума функции правдоподобия; алгоритма Дейкстры поиска совершенного паросочетания, обеспечивающего оптимальное решение в случае достоверного обнаружения всех целей и отсутствия ложной информации; ассоциативного воспроизведения структуры группы с помощью обобщенной нейросетевой модели Хопфилда. В качестве показателей качества рассмотрены: вероятность установления соответствий; вероятность формирования траектории; среднее количество ложных траекторий; средняя ошибка определения экстраполированных координат. Для проведения анализа проведены расчеты указанных показателей качества отождествления целей от: расстояний между целями; количества целей в группе; числа ложных отметок, попадающих в состав анализируемой группы; вероятности обнаружения одиночной отметки от цели. Все метрические величины: расстояния между целями, перемещения целей, пороговые величины для ассоциативного воспроизведения отметок приведены к единому масштабу и рассматриваются в безразмерных единицах относительно ошибки измерения координат целей локатором. Полученные результаты приведены на рис. 6.31-6.47. Использованы следующие обозначения: <* Standart стандартный алгоритм;
Глава 6 Рис. 6.32. Зависимость вероятности установления правильных соответствий от расстояний между целями в группе Рис. 6.33. Зависимость вероятности формирования траектории от расстояний между целями целей в группе Рис. 6.34. Зависимость числа ложных траекторий от расстояний между целями в группе 2.849 2867 2.785 2.703 2.621 2.54 2.45В 2.376 2394 2.212 10 12 14 18 18 20 Рис. 6.35. Зависимость ошибки определения экстраполированных координат от расстояний между целями в группе 306
Нейросетевые методы формирования и сопровождения траекторий ... целей 4 S 6 7 8 9 10 Рис. 6.36. Зависимость вероятности установления правильных соответствий от количества целей в группе Рис. 6.37. Зависимость вероятности формирования траектории от числа целей в группе 5 6 7 8 9 Рис. 6.38. Зависимость числа ложных траекторий от количества целей в группе 10 2785- 2703-*" 2£21 254 2*458- 2376 к ~4 Рис. 6.39. Зависимость ошибки определения экстраполированных координат от количества целей в группе 307
Глава 6 0 1 2 3 4 5 Рис. 6.40. Зависимость вероятности установления правильных соответствий от количества ложных отметок
Нейросетевые методы формирования и сопровождения траекторий ... целей 0J532 0S73 0Л14 OJW йШ 0.737 077» 0119 0.86 0.901 0.943 0.99Э Рис. 6.44. Зависимость вероятности установления правильных соответствий от вероятности обнаружения цели 0.492 0.41 0.532 0.573 0,814 0.655 0Л9В 0.737 0.776 0J615 0JB9 0.901 0.942 0.993 Рис. 6.45. Зависимость вероятности формирования траектории от вероятности обнаружения цели 2 • 1- 0J32 0573 0JB14 0JS5 0.696 0737 0.778 0Ш 0*9 0.901 0.942 0.993 Рис 6.46. Зависимость числа ложных траекторий от вероятности обнаружения цели 0492 0,532 0573 0J514 0В55 0J96 0.737 0 776 0.019 ОДв 0.901 0942 0.983 Рис. 6.47. Зависимость ошибки определения экстраполированных координат от вероятности обнаружения цели 309
Глава 7. Нейросетевые методы анализа и оценки обстановки В данной главе рассматриваются методы анализа обстановки, включая распознавание целей, комплексирование информации от различных источников, выбор наиболее значимых целей. 7.1. Нейросетевые методы распознавание классов целей Первой стадией собственно анализа обстановки является распознавание классов целей. При распознавании используются спектральные и траекторные признаки целей. Возможно также использование признаков, задаваемых в нечеткой форме. Ниже проводится анализ традиционных подходов к построению систем распознавания целей и нейросетевые алгоритмы для решения этой задачи. Показывается преимущество нейросетевых алгоритмов для типичной задачи распознавания классов целей. 7.1.1. Традиционные методы распознавания целей. Задача распознавания классов является обобщением задачи обнаружения, в которой число распознаваемых классов ограничено двумя. Постановка этой задачи и подходы к ее решению были подробно рассмотрены в гл. 5, где были построены оптимальные решающие стратегии для точно известных законов распределений признаков классов, а также указаны методы, в том числе, и построенные на основе нейросетевых технологий, для приближения к оптимальным решениям, когда распределения признаков не известны или известны не точно. Если число классов для распознающего устройства больше двух, то задача более усложняется. Действительно, количество гипотез, которые должен поддерживать распознаватель, увеличивается, и, соответственно, увеличивается сложность задачи, причем более чем линейно. Рассмотрим случай распознавания трех классов целей. Как и в случае распознавания двух классов целей, решающее правило удобно представлять в виде критических областей в пространстве входных сигналов. При попадании вектора наблюдений в одну из них, принимается решение о принадлежности входного вектора классу, соответствующему этой критической области. Количество областей должно соответствовать числу распознаваемых классов, то есть в рассматриваемом случае равняется трем. На рис. 7.1. изображен один из возможных вариантов расположения критических областей для двухмерного входного вектора. 310
Нейросетевые методы анализа и оценки обстановки Рассмотрим распознавание, или определение классов целей радиолокационной станцией, которое выполняется для лучшего определения потребителем предпочтительных вариантов типовых воздействий и порядка их применения. Так как процесс распознавания является стохастическим, естественно в качестве меры корректности информации рассмотреть вероятностные характеристики распознавания. Обычно при оценке качества распознавания довольствуются лишь одной характеристикой - вероятностью распознавания. Однако это не всегда правильно. Дело в том, что при наличии множества интересующих потребителя классов, возникает не одна ошибка распознавания, а матрица ошибок (вероятностей распознавания), каждый элемент которой описывает отнесение цели одного из имеющихся классов к другому, в том числе и правильному. В большинстве случаев ошибки отнесения целей к различным классам отличаются. Поэтому точность зависит от матрицы (Ррасп) вероятностей ошибочных распознаваний [85; 139]: Оптимизация критических областей становится в этом случае сложнее, чем при различении двух гипотез. Качество работы распознающего устройства характеризуется уже не двумя вероятностями, а матрицей ошибок ||Р||: Рис. 7.1. Критические области для двухмерного признакового пространства при наличии трех классов образов 1Р\\ Р\2 АзЛ Р2\ Р22 Р2Ъ РЪ\ Р32 РЪЪ (7.1) в которой каждый элемент ptj описывает вероятность принятия решения о наличия класса j в случае, когда в действительности классифицируемый объект относится к классу /. При этом сумма значений в каждой строке представляет собой сумму вероятностей полной группы событий, описывающих вероятности отнесения цели к какому-либо классу, и, следовательно, равна 1, так как эти вероятности описывают полную группу событий.. У>у=1- (7-2) /=1 311
Глава 7 Случай, когда систем распознавания способна принимать решение об отказе от распознавания, также может быть учтено путем введения дополнительного класса - нераспознанная цель. Так же как и в случае двухальтернативной проверки гипотез, здесь потребитель может сформулировать свои предпочтения в виде различных критериев, соответственно должны изменяться решающие правила. Наиболее часто применяемым является критерий максимума апостериорной вероятности. Апостериорная вероятность р^апостер того, что классифицируемый объект относится к классу к, в многоальтернативном случае описывается соотношением: р апостер Гк рГи0рирЛ*) /=1 (7.3) При неточном знании функций распределений признаков критические области, описывающие возможные решения распознающей системы будут отличаться от оптимальных, что приведет к ухудшению качества распознавания (см. рис. 7.2.) (сравн. рис. 5.19). Утверждать, что одна система распознавания с матрицей ошибок ^сп =[/?,•_/] превосходит другую £?расп =[<?,7], можно лишь в том случае, когда все значения, стоящие на главной диагонали одной матрицы (за исключением класса, соответствующего нераспознанным целям), не меньше, чем соответствующие им элементы второй матрицы: Hi \ П3 / — ► Рис. 7.2. Неоптимальные критические области при распознавании трех классов образов i Ф1 нерасп и, помимо этого, все недиагональные элементы первой матрицы (а также диагональные для класса нераспознанных целей) не больше соответствующих элементов второй матрицы: Pij^4i/> **Л Рн^Яш '= Нерасп- При этом хотя бы для одной пары значений должно выполняться строгое неравенство. Если монотонность неравенств не соблюдается, то говорить о преимуществах той или иной системы распознавания не имеет смысла. 312
Нейросетевые методы анализа и оценки обстановки В общем случае, когда не установлено дополнительных правил предпочтения, выбрать из двух таких систем распознавания наилучшую невозможно. Поэтому необходимо исходить из каких-либо других свойств принимаемых решений. В том случае, если хотя бы одна из систем распознавания имеет пороги, изменением которых можно добиться выполнения монотонности в смысле указанных выше неравенств, то сравнение эффективности систем возможно после выставления таких порогов. Тогда лучшей будет та система, для которой после выставления порогов монотонно выполняются указанные выше неравенства. Если же указанной монотонности добиться не удается, необходимо использовать свертку элементов матрицы ошибок с задаваемыми пользователем коэффициентами. Для каждого типа ошибок с точки зрения пользователей можно указать уровень связанных с такими ошибками потерь Ltj. Аналогично, при выборе системой правильного решения можно указать выигрыш Ut пользователя от использования этой информации. При наличии указанных коэффициентов эффективность системы распознавания с матрицей ошибок Ррасп = [лу] будет равна:  Тогда сравнение двух систем распознавания осуществляется по определяемым им функциям эффективности. В некоторых случаях подобной линейной функциональной зависимости указать не удается, функция, определяющая связь верных и ошибочных решений распознавания с выигрышем и проигрышем пользователя оказывается более сложной. Но для большинства решаемых задач обычно оказывается возможным указать такую функцию с точностью, достаточной для проведения сравнения и выбора наилучшей системы распознавания. Во многих случаях принятие окончательного решения о принадлежности объекта к тому или иному классу с достаточной степенью достоверности невозможно. В этом случае часто оказывается целесообразным отказаться от принятия окончательного решения и выдать соответствующее решение потребителю. Формально это можно представить как введение еще одного класса, описывающего случай отказа от распознавания. При этом критические области, характеризующие каждый из распознаваемых классов не должны иметь совпадающие границы, т.е. не обязательно должно выполняться соотношение MQ/ = Q, где через (7.4) п 313
Глава 7 Q обозначено все пространство входных сигналов. Разность q0=q\I)q, и будет представлять собой класс нераспознанных сигналов. На рис. 7.3. изображен пример, иллюстрирующий этот случай. И в этом случае возможно использование неоптимальных решающих (критических) областей (рис. 7.3,6), что приводит к ухудшению качества распознавания, т.е. увеличению ошибок неправильного определения классов. 7.1.2. Типовые нейросетевые архитектуры решения задач распознавания образов. Среди огромного разнообразия приложений, в которых используются нейронные сети, центральное место занимают задачи распознавания образов. Можно даже утверждать, что практически любую решаемую с помощью нейронных сетей проблему можно переформулировать, как задачу распознавания. Это естественно, так как технология искусственных нейронных сетей родилась из попыток решения этих задач. С точки зрения теории распознавания образов, нейронные сети могут рассматриваться как расширение и обобщение многих традиционных методов, разработанных в течение нескольких десятилетий. Недостаточное понимание основных принципов статистической теории распознавания образов является причиной большинства заблуждений и трудностей при использовании нейронных сетей. Нейронные сети могут рассматриваться как общая схема для представления нелинейного отображения между многомерными пространствами, при котором вид отображения зависит от подстраиваемых параметров. Простые методы представления многомерных нелинейных отображений в одном или двух измерениях основаны на линейных ком- п Рис. 7.3. Расположение критических областей при допущении возможности отказа от распознавания: а - оптимальный; б - неоптимальный выбор областей 314
Нейросетевые методы анализа и оценки обстановки 315 бинациях заданных базовых функций. Эти методы становятся практически неприменимы при переходе к большим размерностям из-за экспоненциального роста количества параметров. Это явление известно как проклятие больших размерностей. Наиболее важным отличием нейронных сетей является то, что в них используются базовые функции, которые сами адаптируются к данным, позволяя эффективно решать многомерные задачи. Выходы обученной нейронной сети имеют четкую интерпретацию. В задачах классификации они аппроксимируют апостериорные вероятности принадлежности к классам. Поэтому-то нейронные сети оказываются способны успешно решать эти задачи. Часто рассматриваются нейронные сети сложной структуры, однако теоретически, нейронная сеть с двумя слоями весов при достаточном количестве нейронов способна аппроксимировать произвольное функциональное отображение с любой наперед заданной точностью. Для проведения распознавания классов (типов) целей разработчик тем или иным методом выбирает наиболее существенные признаки, характеризующие различия между целями [85; 139]. Обычно различают два общих вида признаков: первичные (спектральные), которые получают на этапе первичной обработки (спектральный портрет, наличие пиков на определенных частотах и др.), и вторичные, получаемые в результате вторичной обработки (скорости, траектории движения и др.). Принятие решений о принадлежности цели к тому или иному классу принимается на основе решающего правила, которое описывает некоторую (критическую) область в пространстве признаков. Синтез решающих правил проводится на основе байесовского подхода или его модификаций, позволяющих свернуть многоэлементную матрицу ошибок в один показатель, по которому и ведется оптимизация. Наиболее широко распространено линейное комбинирование признаков [85]. Получаемая при этом линейная область в пространстве признаков не всегда согласуется с оптимальной, и эффективность распознавания оказывается ниже требуемой. Часто применяются также иерархические алгоритмы распознавания, которые предусматривают последовательный выбор от наиболее широких классов к более узким, специфическим, вплоть до требуемых, например, большая - малая цель, затем среди больших (малых) высокоскоростная - низкоскоростная и т.д. Эти алгоритмы также имеют возможность формировать лишь ограниченный набор критических областей в пространстве признаков. При этом вероятностные характеристики реализуемых таким образом алгоритмов распознавания весьма низки, так как в них принципиальное значение имеют ошибки по каждому из отдельных признаков, и компенсировать эти ошибки с помощью других признаков невозможно.
Глава 7 Наиболее эффективным было бы использование алгоритмов распознавания, использующих сложные нелинейные функции для решающих правил, зависящие от совместного многомерного распределения значений признаков и, более того, адаптивно модифицируемые при изменениях внешних условий. К сожалению, синтез таких функций, кроме простейших модельных задач, наталкивается на непреодолимые математические трудности. Поэтому в реальных системах, предназначенных для работы в сложных условиях, зачастую используются полуэмпирические методы, обоснованность которых вызывает сомнения, а эффективность недостаточна. При распознавании радиолокационных целей могут применяться самые разные нейросетевые парадигмы. Наибольшее распространение получила нейросетевая архитектура многослойного персептрона, она наилучшим образом подходит для решения этой задачи [180; 237; 295; 311; 362]. Наряду с ней применяются сети Хопфилда, радиальные базисные функции [234; 367], самоорганизующиеся карты признаков Кохонена с обучаемой векторной квантизацией [237]. С их помощью удается добиться существенно повышения вероятностей распознавания до 0,9...0,95. Одной из наиболее трудных проблем является выбор подходящего варианта предварительной обработки данных перед подачей их на вход нейронной сети. До сих пор это является в большой степени искусством, но в то же время во многом определяет успешность применения нейросетевого (равно как и любого другого) классификатора. Среди известных методов общего характера можно указать описанный выше вариант нормализации данных. Но часто этого недостаточно. Полезно использовать методы снижения размерности, как, например, метод главных компонент [233]. Однако для многих задач оказывается более успешным применение нелинейного аналога этого метода - сетей Кохонена. Дополнительного улучшения характеристик распознавания удается добиться с помощью специальных методов предварительной обработки, а также при использовании теории нечетких множеств. Нечеткая логика берет начало от работ Заде [42; 61; 364], который предложил вместо традиционных четко обозначенных множеств и двухзначной логики использовать систему «мягких» лингвистических переменных и многозначную логику с областью значений в непрерывном интервале [0, 1]. Нечеткая логика широко и с успехом используется в системах, которые описать точно затруднительно, где присутствует неопределенность, неточность информации, при участии человека-оператора. Обычно нечеткая система включает базу продукционных правил с нечеткими переменными, функцией принадлежности этих переменных и процедуру вывода [78]. Нейронные сети оказываются адекватны задачам нечеткой логики [61; 191]. Причем, механизмы использования нечетких понятий могут 316
Нейросетевые методы анализа и оценки обстановки 317 быть различными. Во-первых, входы сети могут быть нечеткими. Это означает, что рассматриваются не бинарные входные сигналы, как это было в первых нейросетевых моделях, а многозначные или даже непрерывные. Получаемая при этом система очень сильно напоминает систему обработки нечеткой информации, хотя некоторые исследователи считают, что называть такую сеть нечеткой не совсем корректно. Тем не менее, обеспечиваемая ею функциональность сходна с работой нечетких систем. Так, например, нейронная сеть, предложенная Карпентером и Гроссбергом Fuzzy ART [188] имеет в своей структуре именно такой механизм «мягких» вычислений. Аналогичные доводы остаются справедливыми при нечетких выходах сети, что позволяет использовать на выходе не бинарные, а непрерывные решения, добавляя гибкости сети. Кроме того, для многих типов сетей такое отличие от традиционной семы является весьма существенным, как, например, при соревновательном обучении. Например, метод нечеткой кластеризации с-средних [178] существенно отличается от своего четкого аналога ^-средних. Нейронная сеть может интерпретироваться как адаптивная нечеткая система. Пример такой сети, обучающейся принимать правильные решения у эксперта, приведен в следующем подразделе. Аналогичные механизмы для адаптации гауссовых сетей и регрессионных моделей с В-сплайнами приведены в [200; 344]. Они также могут совершенно закономерно интерпретироваться как нечеткие системы. Помимо этого традиционная нейросетевая архитектура может использоваться для оперирования нечеткими числами вместо обычных [269]. Следует также отметить, что нечеткие ограничения могут приводить к выводу новых знаний, как это показано в [260]. В ранних работах по объединению нейронных сетей и теории нечетких множеств использовались соревновательные сети для получения правил нечетких систем [251]. Это подход по существу эквивалентен двунаправленной сети противораспространения [228] и ему присущи те же недостатки, которые свойственны этой сети. Более поздние работы [183] основываются на том, что нечеткая система - это нелинейное отображение входного пространства в выходное, которое может быть параметризовано различным образом и, следовательно, может быть адаптировано к данным с использованием нейросетевых методов. В [318] показано, что использование нейронной сети оказывается полезным для распознавания целей по их дальностным портретам. При этом вычислительные требования могут быть существенно снижены по сравнению с обычным классификатором, использующем метод ^-средних. Предложен вариант расширения традиционной модели ARTMAP с нечеткими входами на случай распознавания по последовательностям образов, что дает дополнительный выигрыш в точностях распознавания.
Глава 7 7.1.3. Сравнительный анализ традиционных и нейросетевых методов распознавания. Анализ эффективности нейросетевого подхода к решению задач распознавания был проведен на тестовом примере, описанном выше. Конечно, выбранные в этом примере признаки не могут обеспечить достоверное распознавание, однако, даже этой весьма скудной информации оказывается достаточно для того, чтобы получить полезные результаты. Правда осуществить распознавание выбранных классов не удается, зато можно эффективно использовать имеющиеся данные полезно после их укрупнения. Так самолеты, имеющие весьма сходные летательные характеристики и размеры, отнесены к одному классу с обобщенным названием «самолеты». Цели меньшего размера, обычно применяемые на более низких высотах, беспилотные летательные аппараты, крылатые ракеты, ПРР и управляемые бомбы (УАБ) отнесены к классу с обобщенным названием «малоразмерная цель». Оставшийся класс целей вертолеты - представляет собой единственный экземпляр третьего обобщенного класса. Если использовать традиционные подходы к распознаванию целей, то необходимо выделить наиболее вероятные области изменения признаков по каждому из классов и принимать предварительное решение о принадлежности цели к какому-либо из выбранных классов в зависимости от того, какое значение принимает измерение, описываемое рассматриваемым признаком. Затем полученные предварительные решения следует объединить с помощью той или иной схемы решений, в качестве которых могут выступать взвешенные линейные комбинации, схемы голосования и другие. Рассмотрим работу этих схем подробнее. Каждый из признаков, используемых при распознавании, можно изобразить в виде диаграммы, описывающей диапазон изменения значений признака для каждого из классов. На рис. 7.4 изображена такая диаграмма для признака скорость цели. ; г * 4. JL I О 100 200 300 , 400 500 600 700 mis Рис. 7.4. Диаграмма, описывающая диапазон изменения значений признака «скорость цели» для каждого из классов 318
Нейросетевые методы анализа и оценки обстановки Используемые признаки можно разделить на две группы значений, принимающих достаточно большие или относительно малые значения. В соответствии с этим непрерывные значения измерений признаков дискретизируются в бинарные значения. Решение о принадлежности цели тому или иному классу принимается, исходя из полученной тройки бинарных значений. Исходя из наиболее вероятных значений, можно определить следующие области принадлежности распознаваемых признаков для выбранных классов (табл. 7.1). Расчеты показывают, что в зависимости от установки пороговых значений вероятности распознавания будут меняться в пределах 0,3...0,4. Таблица 7.1. Области принадлежности распознаваемых признаков класс о v h самолет 1 1 x вертолет 1 0 0 мал. цель 0 x 0 Полученные результаты показывают, что даже при таком весьма сильном укрупнении классов традиционными методами не удается построить достаточно адекватные разделяющие поверхности между классами, чтобы обеспечить приемлемый уровень распознавания. Возможно проведение более подробной дискретизации, при разделении каждого признака уже на три области с малыми, средними и большими значениями. Следует отметить, что при увеличении уровня подробности все более значимым становится вопрос о выборе порогов дискретизации. Простейшим вариантом такого выбора являются разделение всего диапазона изменения признака на равные области. При этом удается повысить вероятности распознавания до 0,4...0,5. Однако это оказывается неэффективным. Желательно иметь некий алгоритм адаптации порогов для выбора их оптимальных значений. Как раз такой инструмент адаптации и предоставляют нейронные сети. Следует также отметить, что отличительной чертой рассмотренного алгоритма, так же как и большинства известных методов объединения решений является реализация ими линейных разделяющих областей в признаковом пространстве и относительно небольшое число параметров, которыми можно управлять для достижения наилучшего результата. Поэтому обеспечиваемое с их помощью качество распознавания оказывается невысоким и не может обеспечить выполнение заданных требований к вероятностям распознавания. Помимо этого традиционные методы предполагают выбор параметров на основе предварительной ин- 319
Глава 7 формации, состоящей в априорных вероятностях появления целей, областей изменения измеряемых признаков и других. В отличие от них нейронные сети осуществляют распознавание целей на основе информации, полученной в ходе обучения на конкретных примерах и, помимо этого, способны реализовывать нелинейные разделяющие поверхности, с помощью которых удается описывать достаточно сложные топологические области признакового пространства. Число управляющих параметров нейронной сети оказывается достаточным для того, чтобы с необходимой точностью аппроксимировать произвольные оптимальные решающие области. Конечно, нейронная сеть на небольшом числе примеров способна обучиться правильно реализовывать распознавание всех предъявленных ей примеров. Но эта способность не является определяющей при выборе системы наилучшей системы распознавания. Наибольший интерес представляет возможность нейронной сети обеспечивать обобщение, т.е. распознавать такие примеры, которые не подавались на вход сети во время обучения. Для проверки способности сети к обобщению вся выборка из 10 примеров каждого класса была разбита на 2 части. Первая часть использовалась при обучении сети. Вторая часть сети во время обучения не предъявлялась, а использовалась только для проверки эффективности распознавания. Вероятности распознавания классов представлены в табл. 7.2. Таблица 7.2. Вероятности распознавания нейросетевого классификатора Обучающая выборка Выборка, не участвовавшая в обучении 80 0 20 60 0 40 100 0 0 100 0 0 80 20 0 60 40 0 0 100 0 0 60 40 0 0 100 0 • 20 80 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 Полученные результаты свидетельствуют, что с помощью нейросетевой системы распознавания удается обеспечить вероятности распознавания 0,7... 0,8. Для визуализации получаемых результатов были построены функции отображения разделяющих поверхностей и экземпляров классов. Это по- 320
Нейросетевые методы анализа и оценки обстановки зволяет наглядно продемонстрировать преимущества нейронных сетей по формированию нелинейных характеристических областей каждого класса. На рис. 7.5 приведены отображения разделяющих поверхностей, реализуемых нейронной сетью, с двух различных углов наблюдения. Более подробный анализ характера исходных данных показывает, что качество распознавания можно дополнительно улучшить. Так как все признаки изменяются как в относительно малых, так и в больших пределах, целесообразно провести их логарифмирование перед нормировкой. Результаты работы модифицированной распознающей системы приведены в табл. 7.3. Рис. 7.5. Разделяющие поверхности, реализуемые нейронной сетью, с двух различных углов наблюдения Таблица 7.3. Вероятности распознавания для доработанной нейронной сети Обучающая выборка Выборка, не участвовавшая в обучении 100 0 0 80 0 20 100 0 0 100 0 0 100 0 0 80 20 0 0 100 0 20 80 0 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 0 0 100 11—5782 321
Глава 7 Вероятности распознавания по сравнению с предыдущим вариантом повысились. При этом на обучающей выборке достигнуто 100% распознавание, а на второй части выборки вероятности распознавания достигают 0,8... 1. На рис. 7.6 в разных ракурсах представлено изображение разделяющих поверхностей, реализуемых сетью в этом случае. Рис. 7.6. Разделяющие поверхности, реализуемые модифицированной нейронной сетью, с двух различных углов наблюдения Сравнение этих рисунков с предыдущими изображениями показывает, что степень нелинейности формируемых сетью областей существенно возросла, что и позволило добиться более высокой эффективности. 7.2. Анализ задач комплексирования информации от нескольких источников При получении информации от нескольких источников ее качество может быть повышено за счет объединения наблюдений [19; 62; 105]. Естественно, это справедливо только в случае правильной идентификации информации. В настоящем разделе рассмотрены алгоритмы объединения, позволяющие повысить точности определения координат и вероятности обнаружения целей при идеальной идентификации. 7.2.1. Повышение вероятности обнаружения целей при объединении информации от нескольких источников. При наличии двух и более независимых источников информации естественно ставится задача повышения вероятностей обнаружения целей за счет объединения 322
Нейросетевые методы анализа и оценки обстановки информации. Вследствие неточностей измерения координат, ошибок топопривязки и др. соотнесение информации различных источников между собой представляет весьма сложную задачу. При этом возникает проблема идентификации отметок от целей. В данном подразделе рассмотрено объединение информации при идеальной идентификации. Несмотря на то, что такая задача кажется слишком частной, ее решение можно рассматривать как основной элемент систем объединения информации общего вида. В такой постановке проблема объединения информации может быть сформулирована как задача различения гипотез о наличии или отсутствии цели в рассматриваемом дискрете [246]. Для каждого бинарного события we{0,1} (есть цель или нет) необходимо выбрать решение а е {0,1} из дихотомного множества, когда неопределенность описывается вектором s =(sl9s29 —9s„) наблюдений п источников информации. Обычно вектор измерений можно заменить вектором вероятностей для каждого источника информации х = (хх,х2, xi =p{w = l] . Каждой паре событие-решение сопоставляется значение d(a,w), описывающее потери для ошибочных решений. Целью эффективного комплексирования информации является выбор решения, минимизирующего эти потери, которые в общем виде можно описать оптимальной системы объединения источников информации в этом случае является синтез таких решений а, на которых обеспечивается минимум средних потерь R : Общая структура систем объединения информации от нескольких источников может быть различной. Три наиболее общие схемы изображены на рис. 7.7. Схема 1. Объединение наблюдений. Каждый источник / выдает вектор наблюдений St на центральное вычислительное устройство F, которое рассчитывает вероятность: на основе которой в решающем устройстве Л принимается решение условным математическим ожиданием потерь (7.5) x = P{w = l(SuS2,...,S„}=P(Sl,S2,...,S„), (7.6) а = А(х). 323
Глава 7 Центральный детектор Оценивающее устройство Решающее устройство Схема 2 Локальный детектор Pi Оценивающее Решающее Объединение устройство Xi устройство ■ at решений Схема 3 Оценивающее устройство Центральный детектор Р А Объединение вероятностей Решающее устройство Рис. 7.7. Схема объединения информации от нескольких источников Схема 2. Объединение решений. На каждом источнике / рассчитывается на основе вектора наблюдений St вероятность обнаружения: xi=P{w = \{Si\ = Pi{Si), (7.7) на основе которой решающее устройство Д принимает решение = АМ- Вектор (аиа2, ...,#„) бинарных решений является входом конечного решающего автомата, принимающего конечное решение: a = D(ax,a2,...,a„). Здесь можно рассматривать различные направления исследований: оптимизация решающих правил Д(/ = 1, 2, ...,п) для фиксированного правила объединения D; оптимизация правила объединения D при заданных решающих правилах Д (/ = 1, 2,...,«); объединенная оптимизация D{,D2,Д,. Очевидно, что третий подход, по крайней мере, не хуже, чем первые два. Но при этом встает вопрос о цене: совместная оптимизация очень сложна, особенно для больших п . Схема 3. Объединение вероятностей. Каждый источник объединен с собственным вычислителем, рассчитывающим на основе вектора 324
Нейросетевые методы анализа и оценки обстановки 325 наблюдений St вероятности xi, = Р{w = 1 (St} = Pt (St). Результирующий вектор (x1?x2, ...,xw) вероятностей обнаружения является входом для устройства Я, рассчитывающего апостериорную вероятность обнаружения Р^Р^^^х^х^.-.^^^Р^^О,^!^)--^!^)). которая является основой для принятия решения а - А(Р). Предположим, что в каждой из рассмотренных схем вычисления организованы оптимальным образом, чтобы обеспечить минимальный байесовский риск. Тогда схема 3 оказывается не хуже, чем схема 2. Действительно, в схеме 2 бинарные решения (а1,а2, ...9ап) представляют собой бинарные оценки (да/нет) переменной w. Понятно, что для вероятностных оценок байесовский риск всегда не больше, чем для бинарных. Байесовский риск в схеме 3 не может быть, конечно, меньше, чем для схемы 7. Они совпадают, если для каждого / вероятность =///(5/) является достаточной статистикой наблюдения St по отно- шению к F, т.е. #(#,(SY)9...9Нп(Sn)) = F(Sl9 ....Sn). Схема 3 занимает промежуточное положение между схемами 7 и 2 не только по байесовскому риску, но и по сложности информации, которая должна передаваться от источников центральному процессору. Она предполагает передачу только действительных чисел х/? что намного лучше, чем передавать вектор наблюдений Si (схема 7) и близко к схеме 2, в которой передаются бинарные решения. Схема 3 имеет дополнительно преимущества. Во-первых, любое изменение конфигурации системы - добавление, перемещение или удаление какого-либо источника, потребует в схеме 3 лишь переустановки оценочного правила Р на центральном процессоре, чтобы обеспечить оптимальную работу реконфигурируемой системы, в то время как в схеме 2 для этого пришлось бы определять новые правила как на центральном процессоре, так и на каждом из источников, что крайне не удобно. Во-вторых, источники в схеме 3 могут быть любых типов и не обязаны быть структурно изоморфными, например можно использовать даже субъективные оценки вероятностей операторами. Суммируя все вышеуказанное можно утверждать, что наиболее эффективной для объединения информации от нескольких источников является схема 3. Рассмотрим систему, состоящую из п источников. Обозначим через p[xl9...9xn(w) совместную плотность для вероятностей обнаруже-
Глава 7 ния (jc1? при фиксированном событии w. При априорной вероятности появления сигнала g = P[w = \) общая совместная плотность дается выражением р (хх,..., хп): р(х]9 ...9хп) = p(xl9 ...9xn(\)g + p(xl9 ...9хп(0)(\-g). (7.8) Соответственно апостериорная вероятность р9 в соответствии с теоремой Байеса, запишется в виде: Я*1>-> Хп) = p(xl9...9xn) 1-g (7.9) Г/ \ Р(Х\"~>Хп(1) г, где L(xl9 ...,хЛ-—j -4- ~ отношение правдоподобия. p(xl9...9x„(0) Критерий в результате принимает форму байесовской решающей функции: в.[0 если^Х», (710) [1 еслихеХ1, где Xх ={х:р(х)> р*} = {x:L(x)> я}, Х° = [О,1]" -Xх; а значение порога п (или пороговой вероятности) для обнаружения определяется требованиями потребителя. Рассмотрим применение рассмотренных методов к объединению информации от двух трехкоординатных источников (например, РЛС). Будем считать, что РЛС имеют различное местоположение и работают в различных диапазонах. Поэтому процессы обнаружения целей можно считать независимыми. Это значит, что совместная плотность распределения вектора наблюдений равна произведению плотностей распределения вектора наблюдений для каждого источника. Причем это утверждение имеет место как при наличии цели, так и при ее отсутствии. В соответствии с вышеприведенным анализом, существует три схемы объединения решений от двух источников информации. Наиболее распространенной из-за простоты реализации является вторая схема, при которой производится объединение решений, полученных каждым из источников. Решения представляют собой выборку из дихотомного множества {0,1}, и для их объединения существует только два варианта: логическое умножение (схема «И») и логическое сложение (схема «ИЛИ»). 326
Нейросетевые методы анализа и оценки обстановки Пусть вероятности обнаружения рх(х) и р2(х) для каждого источника описываются экспоненциальным распределением: р1=е'Т^, р2=е~^, (7.11) где Ux и U2 - отношения сигнал/помеха, а щ и п2 - установленные пороги обнаружения, для первого и второго источников, соответственно. Вероятности ложных тревог для первого и второго источников рассчитываются по аналогичным формулам: У1=е-\ f2=e->. (7.12) Рассмотрим объединение решений по схеме "И". В этом случае вероятность ложных тревог и вероятность обнаружения целей равны произведению соответствующих вероятностей. Р = Мг=ё™Г*~™Гг, f = M=e-"^. (7.13) При заданных требованиях к уровню ложных тревог на выходе системы объединения информации вероятность обнаружения при варьировании порогов монотонно изменяется в пределах от рх до р2, никогда не превосходя наилучшей из этих величин, т.е. объединение по такой схеме бессмысленно. При использовании объединения решений по схеме "ИЛИ" небольшой выигрыш имеет место. Соответствующие вероятности при этом имеют вид. р=1-(1-л)0-л)=1- / = l-(l-/i)(l-/2) = l-(l-e^)(l-e^). (7.14) Однако проведенный выше анализ показывает, что лучшим вариантом является объединение функций правдоподобия. Из независимости источников следует, что отношение функций правдоподобия совместного наблюдения равно произведению функций отношений функций правдоподобия для каждого из источников. Для принятия решения необходимо на решающее устройство подавать соответствующие отношения правдоподобий от каждого источника Lj и L2. ( 1 ( "2 \ 1-е 1-е ^2 v ) v / 327
Глава 7 Решающее устройство вычисляет их произведение и сравнение с порогом, который в соответствии с критерием Неймана-Пирсона выбирается, исходя из заданного конечного уровня ложной тревоги. Вместо функций правдоподобия Ц и L2 целесообразно от каждого источника выдавать решающие статистики jc, и х2, которые в соответствии с вышеуказанными условиями являются достаточными. Если источники имеют одинаковую надежность, т.е. их функции правдоподобия подчиняются одинаковым распределениям, то в рамках сделанных предположений, решающее устройство должно вычислять сумму решающих статистик хх и х2 и сравнивать ее с порогом. В предположении экспоненциального закона распределения каждой из статистик, распределение их суммы есть гамма-распределение, которое при отсутствии цели имеет вид: dF[xx +х2) = (х1 + х2)е~{Х{ +Х2]d(jc, + х2), (7.15) а при наличии цели с отношением сигнал/помеха U (7.15) принимает вид: dP(xx +х2) = [Х{ V e~T+U~~d(xx +х2). (7.16) V 2) ^1 + ^2 V 2) Однако в большинстве практически интересных случаев надежность источников неодинакова и простое суммирование их решающих статистик не является оптимальным. Если ожидаемые отношения сигнал/помеха для источников разные Ux и U2, соответственно, оптимальное объединение решающих статистик заключается в суммировании их взвешенных значений, т.е. решающее правило принимает вид: х+ Ul х2осп. (7.17) \ + Ux \ + U2 2 Коэффициенты при xx и x2 можно рассматривать, как коэффициенты надежности источников информации. Для единообразного представления данных в решающем алгоритме можно потребовать нормировки входных значений. Тогда решающее правило запишется в виде: axx+fix2ccn a + fl = \. (7.18) При этом их(\ + и2) uJi+иЛ а = ^ У—9 р = 2V U.—. (7.19) UX+U2+2UXU2 UX+U2+2UXU2 328
Нейросетевые методы анализа и оценки обстановки Вероятность ложной тревоги в этом случае будет равна: Я -- F(n): а а-р а-р (7.20) Вероятность обнаружения определится путем подстановки в это же выражение вместо а и р, значений поделенных на соответствующие отношения сигнал/помеха (реально существующие, а не те, которые учитывались при расчете порога). Для оценки качества работы предложенных алгоритмов была разработана математическая модель расчета вероятностей обнаружения целей одновременно двумя РЛС. На рис. 7.8 представлены результаты расчетов, проведенных с ее помощью. При этом предполагалось, что РЛС расположены в точках с координатами (0; 0 км) и (0; 20 км). Цель имела начальное положение (200; 20 км). 15 20 Дальность, км mm 1 источник «•» 2 источник **■»после объединения Рис. 7.8. Вероятности обнаружения цели каждым источником и после объединения информации Анализ полученных с ее помощью результатов показывает, что рассмотренный алгоритм объединения решений является весьма эффективным и позволяет существенно увеличить вероятности обнаружения целей. Выигрыш в вероятности обнаружения можно оценивать значением увеличения потенциала, с помощью которого можно было бы добиться аналогичных величин вероятностей обнаружения. В данном случае энергетический выигрыш можно оценить в 2...3 раза. 7.2.2. Улучшение точности определения координат целей при комплексировании источников информации. При работе источников информации в различных диапазонах, измерения, проводимые каждым из них можно считать независимыми. Следовательно, дисперсии оценок координат при совместном оценивании должны уменьшаться. 329
Глава 7 В качестве исходных посылок рассмотрим следующие. Пусть имеется М наборов оценок координат цели, полученных независимыми источниками информации. Под координатами будем понимать вектор, соответствующей декартовой системе. Размерность вектора п определяется числом измеряемых координат и может меняться от двух до трех, хотя можно рассматривать как одномерные случаи, так и случаи, когда в качестве координат рассматриваются скорости, ускорения и другие характеристики целей (например, ЭПР). При этом размерность вектора координат может быть большой и превышать 10. Истинное положение цели, обозначим через вектор х0, а его оценки, полученные первым и вторым источниками, через хк9 к = \,М. Будем считать, что систематические ошибки полностью скомпенсированы, а случайные составляющие описываются многомерным нормальным распределением с нулевым средним и дисперсией, определяемой характеристиками источника информации. В общем случае ошибки по различным координатам для каждого источника нельзя считать независимыми, и они описываются недиагональной (их«) матрицей кова- риаций Ак для к -го источника. Матрицы Ак являются симметричными и положительно определенными. Плотность распределения вектора в этих условиях описывается выражением: (2тг)ЦАкр Здесь через Ак1 обозначена матрица, обратная к Ак, которая для положительно определенных матриц всегда существует. В дальнейшем удобно для обратной матрицы ввести обозначение Тк = А~к . При объединении информации от нескольких источников, необходимо на основе векторов хк построить оценку, обладающую лучшими в некотором смысле характеристиками. Естественно в качестве показателя качества повышения точности координат выбрать дисперсию получаемой оценки и потребовать, чтобы она была минимальной. Задача объединения информации решается относительно просто в одномерном случае. Так, например, оценки координат для двух источников являются скалярными величинам х, и х2, имеющими дисперсии о2 и а2, соответственно. Линейная комбинация xt этих величин, xt - ахх + рх2, также подчиняется нормальному распределению с 330
Нейросетевые методы анализа и оценки обстановки математическим ожиданием (сг + /?)х0 и дисперсией <т2, равной а2=а2о?+/32а2. г 1 ^ 2 Для построения наилучшей оценки необходимо найти минимум величины <у2 при условии а + /3 = 1. Очевидно, что минимум достигается при «=-^-Т, Р = -^- (7-22) сг, + ОТ2 <т, + 0*2 Дисперсия полученной оценки равна Gl и меньше любой из at+aZ2 дисперсий Оц2). Этот же результат мог быть получен на основе рассмотрения функций правдоподобия. Действительно, так как измерения двух источников предполагаются независимыми, функция правдоподобия для совместных двух измерений записывается в виде: L(x) = —l-—е ^ . (7.23) 271GX<72 Оценка максимального правдоподобия, как известно, есть такая оценка, на которой достигается максимальное значение L(jc). Следовательно, оценка максимального правдоподобия для одиночной координаты, измеренной двумя источниками равна: ±ф£*£ (7.24) что точно совпадает с оценкой, полученной выше, т.е. оценка максимального правдоподобия одновременно является оценкой, на которой достигается минимум дисперсии. В случае многомерных координат задача существенно усложняется. Дисперсия полученной оценки уже не является скалярной величиной, а описывается матрицей А размерностью (пхп). Оказывается, что наилучшие оценки для одномерного случая можно обобщить и на многомерный случай. Справедливо следующее утверждение. Утверждение. Пусть на вход системы объединения информации от М источников поступают вектора измерений xjm j -й цели 331
Глава 7 (j = \,N) т -м источником (т = 1, М), по N целям, истинные координаты которых задаются векторами xJ0. Ошибки измерений каждого из векторов х описываются нормальным законом распределения с математическим ожиданием xJ0 и матрицей ковариаций Ajm. (TJm= AJlm). Тогда оценка м f м xj = Tj ^4Tjmxjm, Tj= ^jAjn m=\ f M \ -1 f M \ 1 = U=i J U=i J (7.25) является оценкой для истинных координат с минимальной дисперсией круговой ошибки измерения, записываемой в виде: ( м \т=\ (7.26) и оценкой максимального правдоподобия, обеспечивающей достижение логарифмом функции правдоподобия значения: 1 N М ( М \ T ( м \ I I Xjm *jmXjm I т j m Xj m z T j m Xj m У=1 т=\ ) ) . (7.27) Доказательство. Будем полагать источники информации и данные по различным целям от одного источника независимыми. Тогда, если точно известно к какой именно цели относится каждая отметка, оценивание уточненных по всем измерениям координат целей можно разделить на независимые процессы отдельно по каждой цели. Далее в целях упрощения индексной записи будем рассматривать единственную цель, по которой получено М измерений хт с математическим ожиданием х0 и ковариационными матрицами Ат . Учитывая нормальное распределение ошибок измерения координат, плотность распределения вектора хт т = \,М в этих условиях описывается выражением: Р{Хт) = - 1 {^)ЦАт\2 Здесь \Ат\ - определитель матрицы Ат, а через Ат обозначена матрица, обратная к Ат , которая для положительно определенных мат- 332
Нейросетевые методы анализа и оценки обстановки риц всегда существует. В дальнейшем удобно для обратной матрицы ввести обозначение 71 = А~1. При объединении информации от нескольких источников, необходимо на основе векторов хт построить оценку х, обладающую наилучшими в некотором смысле характеристиками. Так как рассматривается задача повышения точности определения координат, естественно в качестве показателя качества повышения точности координат выбрать дисперсию полученной оценки и потребовать, чтобы она была минимальной. В случае многомерных координат, получаемая оценка уже не являются скалярной величиной, поэтому ее дисперсия тоже будет не скаляром, а некоторой матрицей А размерности (п*п). Для выбора наилучшей оценки, отвечающей объединению информации, на множестве этих матриц необходимо ввести отношение порядка, удовлетворяющее требованиям потребителей информации. В качестве показателя, задающего это отношение порядка, выбран минимум среднего квадрата ошибки, определенной как длина отклонения полученного значения вектора координат х от истинного вектора координат х0. То есть, в качестве критерия рассматривается математическое ожидание величины l~ I2 х-х0 .В качестве нормы вектора рассматривается его скалярное произведение самого на себя. Рассмотрим средний квадрат ошибки Он равен сумме диагональных элементов ковариационной матрицы А, т.е. ее следу. Эта величина не зависит от аффинных преобразований (поворотов и сдвигов) системы координат, в которой записываются Рассмотрим линейное преобразование полученных оценок координат. ^{(х-х0)Г(х-х0)} = £|^(х/2-2 вектора, и часто рассматривается как норма матрицы: \А\ = tr(A). Математическое ожидание и дисперсия оценки х, равны: ( м \ О 9 \т=\ ) 333
Глава 7 м м D(xLi„) = Y,D((Bmxm)T Д„ (Втхт)) = Y,BJAA • Учитывая требование несмещенности оценки координат, из первого м равенства получим ^ Вт = I, где I - единичная матрица. Теперь требо- т=\ вание минимальной среднеквадратической ошибки перепишется в виде: ( м \ м tr YjB™AmBm ^min ПРИ УСЛОВИИ ^Вт = I . \т=[ Продифференцируем целевую функцию по матрицам Вт с учетом ограничений. При этом используем свойства матричного дифференциального исчисления. Получим систему линейных относительно Вт уравнений: АтВт = <т=\ из которых следует, что минимальное значение дисперсии получится при матрицах преобразований, равных: ( м Я = V /=1 ) А~1хт=Т-1Ттхт. mm mm ( м ) -1 ( м \ Здесь введено обозначение Т = = к /=1 ) \ /=1 ) и учтено, что Тт =Т . Полученная наилучшая с точки зрения минимума дисперсии линейная оценка записывается в виде: ( м V1 м м * - ^ А ^ Am хт=Т ^ Tmxm . V /=1 / т=\ т=\ Дисперсия полученной оценки будет равна: -1 (м \ -1 ( М \ = \m=\ J \m=\ J 334
Нейросетевые методы анализа и оценки обстановки Оказывается, что полученная оценка помимо минимума дисперсии обеспечивает и максимум функции правдоподобия. Действительно в многомерном случае функцию правдоподобия для М источников при независимости их измерений можно записать в виде произведения соответствующих функций правдоподобия по каждому из источников: м 1(х1?х2, ...,хЛ/) = ]^[ 1 (хт-х0)ТAml(xm-x0)^ ( м ехр - ^(xm-x0)T A^l(xm-x0) 2 \ m=l I J Если, как это принято в статистике, рассмотреть логарифм функции правдоподобия, получим: м -2Лп(Ь(х{,х2, ...,хЛ/)) = Л(хт-х0)7,^1(хш-х0) + ^доп, ет=1 где через АД0П обозначена матрица, не зависящая ни от х0 , ни от xk , а определяющаяся только точностями измерения координат. Максимум функции правдоподобия достигается при минимуме этой величины. Для поиска минимума следует продифференцировать полученную величину по х0 . Откуда получим, что m=l m=\ ( М \ 1 М IX' V /=1 ) т=\ Таким образом, точка минимума будет совпадать с полученной выше оценкой xmin = хш, что следует из положительной определенности матрицы ковариаций. Значение логарифма функции правдоподобия в этом случае с точностью до матрицы АД0П равно: м -2 • In (L (xLi„ )) = ]Г (xw - xLin f Tm(xm- xLin ) = m=\ M M M M ~ \ xm Tmxm — \ xLin Tmxm — ^* xm TmxLin + 1 xLin TmxLin — m=\ M Vx TT ( M ~ T Y у mm Lin m=\ \ ( M ^1 Tmxm Tm \m=\ J \m=\ - - T XLin + XLin f M \ U=i / Xj :„ 335
Глава 7 т=\ М -2Лп(1(хи„)) = ^*тТТтхт-хшТТхш. Таким образом, получены оптимальная оценка х координат цели, рассчитываемых по информации от нескольких источников информации, и ее дисперсия: м к=\ имеющая дисперсию: (м У1 *>(*,) = г-'= Sr* ' \k=l J которая меньше чем дисперсия каждого из источников. Понятие меньше определяется указанной выше среднеквадратической абсолютной ошибкой измерения координат, которая рассчитывается по следу (сумме диагональных элементов) матрицы дисперсии. Одновременно, полученная оценка является оценкой, в которой логарифм функции правдоподобия достигает своего максимума: _\_ 2 При работе по нескольким целям, обнаружение которых происходит независимо друг от друга, плотности их вероятностей перемножаются, а логарифмы функций правдоподобия складываются. Поэтому максимум общей функции правдоподобия определяется простой суммой максимумов по каждой отдельной цели: м ( М \ Т ( М \ Хт ТтХт — X TmXm \т=\ ) \m=\ ) max {b (Xj, x2,..., xN ) j = 1 iv -4l M ( M \ T f M \ E T x j m j m X TjmXjm Vm=l ) 7=1 Утверждение доказано. Таким образом, получена оптимальная оценка xt координат цели, рассчитываемых по информации от нескольких источников информа- 336
Нейросетевые методы анализа и оценки обстановки ции, которая меньше чем дисперсия каждого из источников. Понятие меньше определяется среднеквадратической абсолютной ошибкой измерения координат, которая рассчитывается по следу (сумме диагональных элементов) матрицы дисперсии. Одновременно полученная оценка является оценкой максимального правдоподобия и может использоваться для расчета меры близости векторов xk между собой. В качестве примера рассмотрим задачу объединения информации от двух 3-х координатных источников, расположенных на некотором удалении, характеризуемом вектором d , друг от друга. Трехкоординатными источниками являются радиолокационные станции (РЛС), которые измеряют местоположение целей в сферической системе координат (г - наклонная дальность, ср - азимут, е - угол места). Эти координаты затем пересчитываются в прямоугольную систему относительно заданной реперной точки (xp,>>p,zp). Каждая из координат в собственной системе координат РЛС имеет нормальные ошибки, описываемые дисперсиями о2Л, а2х, а\х и <г22, а22, о2е2 соответственно для первой и второй станции. В прямоугольной системе координат, связанной с РЛС, и имеющей ось ОХ , направленной на цель, и ось OZ, лежащей в плоскости, проходящей через вертикаль и направление на цель, дисперсии ошибок описываются выражениями: 2 2 2 22 2 22 ах\(1) = ^1(2) i ^1(2) = ад>Ц2)гН2) \ Gz\{2) = а£\(2)ГЧ2) ' (7.28) Измерения в этих системах координат являются независимыми. Поэтому все перекрестные члены в матрицах ковариаций в указанных системах координат являются нулевыми. Для получения ковариационной матрицы в единой системе координат для каждого из измерений необходимо провести соответствующее преобразование, заключающееся в последовательных поворотах на углы £ и <р . Первый поворот проводится вокруг оси OY системы координат, связанной с РЛС, на угол (-е ), второй вокруг вновь полученной оси OZ на угол (-<р). Полное преобразование Р определяется произведением Р на Р£ и может быть записано в виде: 'cos (<р)cos(&)-sin(<р)-cos (^?)sin(^)N Р - sin (<р)cos(z) cos(<р)~sin (<р)sin(^) . (7.29) sin (^) 0 cos (е) у После поворота Р матрица ковариаций А = РА$РТ будет равна: 337
Глава 7 Га\\а\2а\Ъ Л «21«22«23 V«31«32«33 7 (7.30) аи=а2 cos2 ((р) cos2 (z) + сг2г2 sin2 (<р) + cr2Er2 cos2 sin2 (f), я12 = <x2 sin cos (cp) cos2 (e)-cr2r2 sin(^)cos(#?) + +cr2r2 sin cos (#>) sin2 (f), «13 =<Tr cos(^>)sin(6-)cos(6:)-cr2r2 cos (<p) sin (б*) cos (s), «22 ~ °"r sm2 (^)cos2 [б) + <т2г2 cos2 + cr2r2 sin2 (^)sin2 (e), «23 ~ ar Sm (#0 Sm (£) C0S ) ~ ^2 Sm (Ф) Sm I6*) C0S (f ) ' «33 ~ ar {€) + а1г2 COs2 (f ) • Исходя из вышеизложенного, можно утверждать, что наилучшим алгоритмом повышения точности измерения координат целей при объединении информации от двух 3-х координатных РЛС будет следующий. Полученные векторы координат х, и х2 от первой второй РЛС соответственно пересчитываются в соответствии с выражением: х( = А2(А]+ А2) 1 jc, + Ах + А2) 1 х2 (7.31) «111«112«113 «121«122«123 V«131«132«133 7 ; А2 «211«212«213 «221«222«223 «231«232«233 У где выражения a\tj и я 2fy рассчитываются аналогично с заменой г, ср, £ на ^, ^, я, и г2, (р2 и £2, соответственно. На рис. 7.9 приведены рассчитанные на основе приведенных выражений зависимости ошибок определения координат от перемещения цели по координате х , для тех же условий, что и на рис. 7.8. Для сравнения на этом же графике приведены ошибки измерения координат отдельно для каждой из станций. Полученные данные свидетельствуют о весьма значительном улучшении точностей определения местоположения цели (до 2-х раз). Данный алгоритм уточнения координат целей по информации от двух источников является достаточно общим и может быть также использован при объединении информации от 3-х координатного и 2-х координатного источников. 338
Нейросетевые методы анализа и оценки обстановки о 50 100 150 200 Дальность, км «-•-• 1 источник 2 источник после объединена. 250 Рис. 7.9. Ошибки определения координат цели каждым источником и после объединения информации Рассмотрим два источника: трехкоординатную РЛС и двухкоорди- натный источник (например, канал радиотехнической разведки - РТР). Физические принципы работы источников несущественны, важными являются лишь обеспечиваемые ими точности определения координат обнаруживаемых целей. В этом случае полностью применимы выкладки, проведенные для первого источника. Канал РТР не способен определять дальность до цели. Формально это можно рассматривать как измерение дальности до цели с бесконечной дисперсией. Оперирование выражениями для матриц, содержащих бесконечно большие значения, является некорректным. Можно рассматривать проведенные ранее выкладки при стремлении дисперсии определения одной из координат одним из источников к бесконечности. Рассмотрим более удобную для этого форму записи выведенных в предыдущих подразделах выражений. Вместо содержащей бесконечно большие члены матрицы ковариаций будем использовать матрицу точностей, обратную к матрице ковариаций: Если вторым источником является канал РТР и бесконечно большие значения относятся к нему, после проведения указанных преобразований, получим, что оценка координат целей определяется выражением: 71=4 г1. (7.32) *, = (а~2хах 1-1 (7.33) Выражение для дисперсии оценки преобразуется к виду: 339
Глава 7 D(x,) = (Ti+T2)'\ (7.34) После проведения преобразования Р матрица ковариаций А имеет вид А' = РАРТ. Для матрицы точностей аналогично получаем Т - РТРТ. Работоспособность рассмотренных алгоритмов уточнения координат целей была проверена на разработанной модели. Полученные данные свидетельствуют о весьма значительном улучшении точностей определения местоположения цели, что позволяет рекомендовать разработанные методы для реализации в вычислительных алгоритмах комплексирования информации. На рис. 7.10 приведены рассчитанные на основе приведенных выражений зависимости ошибок определения координат от расстояния до цели. При этом РЛС и 2-х координатный (станция РТР) источник были совмещены. Рис. 7.10. Ошибки определения координат цели 3-х координатным источником информации (РЛС) и после объединения информации с 2-х координатным источником (станция РТР) Следует отметить, что, хотя было рассмотрено объединение информации от двух источников, алгоритм применим к произвольному количеству источников информации. 7.2.3. Нейросетевая модель объединения информации от нескольких источников на основе самоорганизующихся карт Кохонена. Повышение качества информации, получаемой после объединения наблюдений различных источников, может быть достигнуто только в случае достоверного отождествления всех отметок от целей (или большинства их них), выдаваемых этими источниками. Задача отождествления целей осложняется ошибками измерения координат обнаруженных целей, возможным пропуском отметок от целей некоторыми источниками информации, наличием ложных целей. 00 „ 150 200 Дальность, км *- РЛС после объедин© РЛС после объединения 340
Нейросетевые методы анализа и оценки обстановки Математически задачу объединения информации от нескольких источников можно сформулировать следующим образом. Пусть система обнаружения осуществляет наблюдение за некоторой зоной с помощью М источников информации. В зоне наблюдения находятся N целей с координатами (zl9z29 •••>zN). Каждый j -й источник проводит процесс обнаружения измерения координат обнаруженных объектов. При этом цель может быть обнаружена с некоторой вероятностью р или не обнаружена. В случае обнаружения цели ее координаты измеряются с аддитивной ошибкой подчиняющейся нормальному закону распределения. Требуется по полученным измерениям от М источников информации построить оценку возможного количества целей и их координат. В указанной постановке данная задача формально может быть решена методом максимального правдоподобия. Для этого строится совместная плотность распределения полученных измерений для всех возможных гипотез о наборах векторов координат объектов, находящихся в зоне обзора. Гипотезы можно разбить на группы, различающиеся вариантами отождествления отметок от различных источников. В каждой группе можно найти наиболее правдоподобную оценку координат целей. Затем следует среди всех гипотез выбрать ту, которая для наилучших оценок координат обеспечивает максимум правдоподобия. Таким образом, оптимальное с точки зрения максимума правдоподобия правило сводится к нахождению такого отождествления отметок, которое обеспечивает минимум суммы по всем целям взвешенного средне- квадратического отклонения между отметками различных источников: * ( м ^ j У /' т ^jm ^jm ^jm ^ 1^/ т ^jm *j т ^ ^^^УJт ^j т ^Jm —> mm ( м i \m=l J \т=\ f 1 j-я цель обнаружена w-м источником у.-\ . (7.35) J [О в противном случае. Здесь через Тк . = А^- обозначена матрица, обратная к ковариационной матрице Ак . ошибок измерения координат цели к j -м источником. Эта формула является следствием из доказанного выше утверждения. Заметим, что рассмотренный алгоритм и полученное выражение для оценки максимального правдоподобия являются обобщением рассмотренного для траекторной обработки случая отождествления информации от двух источников, в качестве каковых там выступали последовательные периоды обзора. 341
Глава 7 Так же как и в случае траекторной обработки, минимизация указанного функционала является весьма сложной задачей целочисленного программирования, представляющей собой обобщение задачи о назначениях на многомерный (по числу источников информации) случай. К сожалению, для многомерного случая полиномиального алгоритма, аналогичного алгоритму Дейкстры для задачи о назначениях, не известно. Поэтому приходится использовать или алгоритм прямого перебора, очень быстро выходящий за рамки возможностей вычислительной техники с ростом размерности, или руководствоваться упрощенными алгоритмами, результаты объединения информации для которых часто оказываются неудовлетворительными. Рассматриваемая задача по своим целям аналогична известной задачи кластеризации, для которой во многих приложениях используются сети Кохонена. Уже простейший вариант сети Кохонена без сохранения топологии оказывается вполне адекватным данной задаче [122]. После выполнения достаточно большого числа итераций весовые вектора нейронов примут значения, близкие к центрам кластеров входных векторов, соответствующих координатам исходных целей: к Полученное решение является требуемым, если все координаты целей для всех источников информации измерены с одинаковыми ошибками. В случае неравноточных измерений необходимо получить несколько отличающуюся оценку: м т=\ Для этого следует изменить алгоритм обучения сети Кохонена таким образом, чтобы каждая координата векторов измерений учитывалась с весом, пропорциональным точности ее измерения, т.е. веса нейронов победителей должны подстраиваться в соответствии со следующим выражением: ynew=yold+^.7;.^_yold^ (7>38) Сходимость этого алгоритма следует из следующего утверждения. Утверждение. Пусть задан набор векторов \к . к = 1, М и имеется случайная величина £, принимающая значения 1, 2, ..., М с равными вероятностями. Тогда, если функция а{п), определенная на множестве натуральных чисел, удовлетворяет соотношениям: 342
Нейросетевые методы анализа и оценки обстановки £а(и) = оо, £а2(«) = С, (7.39) и=1 и=1 то последовательность уп, заданная рекуррентным алгоритмом: УП+1=У„+«(«)7ИХ#-У")> (7-4°) (7.41) стремится в среднеквадратическом к оптимальной оценке: ( V1 Уоо = Кту„= Утк Уткхк V * У А: при любых начальных значениях у0 . Если рассмотреть вспомогательные вектора zk, к = 1, М , связанные с заданными с помощью соотношений: ъп ~ Ткхк , z0 - ГдУда, Т0 - то последовательность векторов в соответствии с [5; 312] будет сходиться к арифметическому среднему от векторов гк. Отсюда путем проведения преобразований можно получить указанное утверждение. Результаты отождествления отметок от 6 целей, получаемых от 5 источников для стандартного метода последовательного выбора ближайших отметок и для метода нейросетевой кластеризации, приведены на рис. 7.11. Результаты расчетов, проведенных на указанной модели, показали, что он превосходит упрощенные методы объединения решений от различных источников информации при работе по нескольким целям (5... 10), обеспечивая повышение вероятности правильного отождествления с 0,2...0,3 до 0,4...0,5. Стандартный метод Нейросетевая кластеризация Рис. 7.11. Графическое представление результата объединения информации 343
Глава 7 Достоинство сетей Кохонена заключается в использовании дополнительного механизма, направленного на сохранение топологии пространства кластеризуемых объектов. Для обеспечения сохранности топологической близости в алгоритме обучения сетей Кохонена предлагается при изменении весов нейрона победителя одновременно подстраивать веса его ближайших соседей. Мера близости, на которой основывается сохранение топологии, может выбираться в зависимости от решаемой задачи. В решаемой задаче поиска объектов в трехмерном пространстве естественно использовать трехмерную топологию сети, в которой ячейки являются кубами. Использование совместного обучения нейронов соседей позволило дополнительно увеличить вероятность правильного отождествления до 0,5.. .0,7. Способность нейронной сети Кохонена выявлять топологию многомерного признакового пространства и следовать его структуре является очень ценным свойством этой модели. Данное свойство позволяет приблизиться к оптимальному решению задачи отождествления. В качестве метрики, сохраняемой нейронами при обучении, предлагается выбрать взаимное расположение целей. Для этого проводится многоступенчатое обучение, на каждом цикле которого веса нейронов инициализируются последовательно отметками от каждого из источников. При этом вместе с нейроном победителем свои веса изменяют и все остальные нейроны. Проведенное моделирование показало, что вероятности отождествления целей при использовании предложенного метода для случаев, при которых анализировалось качество работы рассмотренных выше алгоритмов, составляют 0,7...0,9. На рис. 7.12 и 7.13 приведены зависимости вероятностей правильного отождествления отметок от ошибок измерения координат и количества источников информации, соответственно. Расчеты проводились для различных алгоритмов объединения наблюдений: традиционного, Кохонена без топологии (^-средних) и с различными вариантами топологических связей. Рис. 7.12. Зависимости вероятностей Рис. 7.13. Зависимости вероятностей правильного отождествления отметок правильного отождествления отметок от ошибок измерения координат от числа источников информации 344
Нейросетевые методы анализа и оценки обстановки 345 Полученные результаты подтверждают эффективность предложенных алгоритмов. 7.3. Нейросетевые методы анализа и оценки обстановки При обработке информации одним из наиболее важных является заключительный этап принятия решений. Все предыдущие этапы имеют служебный характер, подчиненный предоставлению информации системе, принимающей решение. Для данного этапа наиболее затруднено проведение формализации и автоматизация. Большинство задач анализа обстановки решается командиром или оператором [41; 105]. Это связано, во-первых, с высокой степенью ответственности принимаемых на этапе решений, а, во-вторых, с отсутствием математического аппарата достаточно корректно и адекватно описывающего механизмы принятия решений человеком. К решению этих исключительно сложных задач анализа обстановки и принятия решений можно применять два подхода. Можно использовать упрощенные модели принятия решений, позволяющие формализовать задачу и получить работоспособную систему. С другой стороны, можно построить сложную нейронную сеть, посредством длительного обучения которой при достаточном числе обучающих примеров, принципиально возможно достижение требуемой эффективности функционирования. Если первый подход применим к реальным системам, хотя, возможно, и не всегда обеспечивает максимально возможную эффективность работы, то второй подход для реальных систем не может быть до конца реализован, так как для обучения достаточно сложной нейронной сети может потребоваться слишком большое число примеров. Такого количества примеров реальных боевых условий найти не удастся. Поэтому прямолинейное применение нейросетевых парадигм не позволит получить решение задачи анализа внешних условий и принятия решений. Одним из вариантов решения этой задачи может служить объединение двух подходов. При этом построенная по упрощенной модели принятия решений человеком система рассматривается как исходная. Затем она дообучается с использованием нейросетевых парадигм на небольшом числе конкретных примеров. При этом, даже если число обучающих примеров весьма ограничено, как это часто бывает на практике, дообученная система все равно остается работоспособной, в отличие от случая обычной для нейросетевых методов случайной начальной установки весов, когда нейросеть, не получив минимально необходимого
Глава 7 (обычно очень большого числа) обучающих примеров, остается неработоспособной. В то же время полученная в результате система будет работать лучше исходной, так как прошла дообучение, и в случаях, наиболее близких к предъявленным ей примерам, покажет результаты выше исходной системы. 7.3.1. Задача выбора наиболее опасных целей. При выборе воздушных целей для обстрела учитываются их характер, важность и условия стрельбы. Характер определяется: составом (одиночная, групповая); типом (самолет, вертолет, КР, ДПЛА и т.д.); координатами и параметрами движения (приближающиеся, удаляющиеся, маневрирующие, низколетящие, зависающие, дозвуковые, сверхзвуковые); способом противодействия стрельбе (постановка помех, применение противоракетного маневра, применение бортового оружия и т.п.); местом и значимостью в ударе (разведчик, ударные, отвлекающие, ложные и другие цели). Важность (степень опасности) воздушной цели определяется возможностями по нанесению ущерба прикрываемым войскам (объектам) и противодействию стрельбе. Наиболее важными являются следующие воздушные цели: носители ядерного оружия; воздушные ударные средства ВТО; групповые; постановщики помех; летящие под прикрытием помех; курс которых проходит через боевые порядки прикрываемых войск и объектов; летящие с минимальным курсовым параметром и имеющие наименьшее подлетное время. Цель, назначенная для уничтожения с КП старшего начальника, обстреливается в первую очередь. Реализованные в настоящее время алгоритмы ранжирования целей по опасности по критерию минимального подлетного времени не учитывают в полной мере этих требований. В частности значительный прирост эффективности ЗРК связан с учетом при выборе целей результатов их распознавания. Рассмотрим пути и методы формализации описанных знаний и формирования алгоритма принятия решения о выборе целей для обстрела. 346
Нейросетевые методы анализа и оценки обстановки 7.3.2. Система выбора опасных целей на основе традиционных методов принятия решений и нечеткой логики. В базе данных системы хранится априорная информация о признаках типов СВН и частости применения СВН в зоне ответственности ПВО. Кроме того, в базу данных перед работой вносят априорные вероятности появления каждого типа СВН в конкретных условиях, исходя из представлений о предстоящей работе. Дальнейшая обработка информации заключается в вычислении апостериорных вероятностей отнесения цели к определенному типу по формуле Байеса. При поступлении к независимых признаков в пользу события Н апостериорная вероятность события определяется выражением: Р(н,).Пр(е,/Н,.) Р(н,./е„е2,...,%) = - ^ , (7.42) 2>(н,)-Пр(в*/н') где к = \,К - номер признака; ij = \9J - номер события; Р(Ну) априорная вероятность появления события Н;; Р^/Ну) априорная вероятность появления признака ек при наличии события Ну. Окончательного решения о принадлежности цели к тому или иному типу СВН не принимается и на дальнейшую обработку подается информация о вероятностной оценке принадлежности цели ко всем целям с Р(Н^■ /ех,е2, > 0. По признанию специалистов по боевой работе подобный способ оценки принадлежности цели характерен для членов расчетов, формулирующих такой факт в виде, например: «Скорее всего, штурмовик, но может быть и истребитель». Исходя из конкретной ожидаемой ситуации и боевой задачи, полученной командиром с вышестоящего КП, относительная важность соответствующих типов СВН может быть изменена. Полученные (или оставленные без изменения) числовые оценки относительной опасности (важности) целей приводятся в соответствие с результатами распознавания типов СВН. Для определения важности конкретной цели по боевому потенциалу предлагается произвести усреднение по всем возможным типам СВН, к которым может принадлежать цель: VMt = y£v(HJ/el9e29...9eK)VJ9 (7.43) 7=1 347
Глава 7 где Uy относительная важность у-готипаСВН; Р(Н/1ех,е2, •••,%) апостериорная вероятность Ну - события (появления j -го типа цели) при наличии К признаков целей. Следующий этап пополнения описания ситуации за счет признаков боевого применения СВН. В табл. 7.4 приведены результаты экспертной оценки массива признаков боевого применения и характеризующие эти признаки веса, свидетельствующие о значимости признака по переменной «ОПАСНОСТЬ», пересчитанные на значения из интервала [0,1]: Таблица 7.4. Результаты экспертной оценки функции принадлежности для массива признаков целей Nn/n Наименование признака Значимость признака 1. Цель в составе группы 0,7 2. Помехопостановщик 0,9 3. Летящая под прикрытием помех 0,8 4. Маневрирующая 0,5 5. Низколетящая 0,6 6. Высокоскоростная 0,6 7. Внезапная (обнаруж. в зоне пуска) 0,95 8. Относительный курсовой параметр 0,4 9. Относительное подлетное время 0,9 Пополнение описания ситуации за счет признаков расположения целей относительно нулевого курсового параметра и взаимного подлетного времени, а также скорости полета производится на основании экспертных знаний. Эксперты считают, что без ущерба для точности принятия решения функции принадлежности этих признаков могут быть представлены в форме интервалов. 200 300 400 500 600 700 м/с а) б) в) Рис. 7.14. Функции принадлежности для нечетких признаков: а - «подлетное время относительно ближайшей цели»; б - «курсовой параметр»; в - «высокоскоростная цель» 348
Нейросетевые методы анализа и оценки обстановки Наличие или отсутствие признака боевого применения СВН фиксируется и передается системе принятия решения в виде четкого указания (функция принадлежности 0 или 1). По критериям (признакам) имеющим нечеткую функцию принадлежности формируются нечеткие множества: С/подл. ~ {^подлХ^)/^'/^/подлХ6^) ^а2> •••'///подл.(60 /ат> }' Спар.= {/^(«l)/«l,/^p(«2)/a2> ->MwpX<Zm)'<Xm} > Св.с. = {M*Aal)/al>MB.c.(a2)/a2> •■•>МвЛат)/ат} > где С, подл - нечеткое множество относительного подлетного времени; Спар - нечеткое множество относительных курсовых параметров; Свс - нечеткое множество признака «высокоскоростная цель»; а19а2,...,ат - т альтернатив (целей). Итоговая оценка каждой альтернативы по совокупности критериев ( N критериев) осуществляется на основании аддитивной свертки в соответствии с формулой: N а=им!Ц , j = l,N9 (7.44) 7=1 где rtj - оценка / -ой альтернативы по j -му критерию, определяемая функцией принадлежности Wj - относительная важность (значимость) j -го критерия. Итоговая величина опасности цели рассчитывается по формуле Q,=U„r^- (7-45) Результатом работы алгоритма является приоритетный ряд цели с числовой оценкой опасности. 7.3.3. Нейросетевая подстройка параметров системы поддержки принятия решений. Известно, что для полноценного обучения число примеров должно, по крайней мере, в несколько раз превышать число коэффициентов. Поэтому количество модифицируемых в ходе дообучения коэффициентов должно быть значительно уменьшено. В качестве модифи- 349
Глава 7 цируемых коэффициентов выберем относительные важности (значимости) критериев. При формировании численных значений данных параметров наблюдается наибольшее влияние субъективных факторов, и их величины наименее достоверны. Таким образом, формульная зависимость для получения значения опасности целей через модифицируемые параметры представляется в виде: N &=итГЦ , J = W- (7-46) 7=1 N Вследствие того, что в данном выражении сумма ^ Wj постоянна 7=1 для всех целей, представляется целесообразным отнормировать коэффициенты на единицу и использовать нормированные значения: N a=t/„r к м n—• j=*>n- (7-47) Сложностью рассматриваемого случая обучения на примерах, получаемых по решениям, принятым оператором при выборе наиболее опасных целей заключается в том, что числовые значения опасностей целей, на которые ориентируется оператор при своем выборе, неизвестны. Известны лишь уровни предпочтения, причем только относительно одной наиболее опасной цели. Поэтому прямое применение алгоритмов обучения нейронных сетей невозможно. Выходом из данной ситуации может служить следующий подход. В случае несовпадения решений оператора и автоматической решающей системы в качестве желаемого выхода нейронной сети выбирается минимальное значение, которое обеспечило бы получение выбранной оператором целью максимального приоритета, т.е. ошибка в этом случае равна разности текущих оценок опасности выбранной оператором и автоматической системой целей. Ej = Qj - max [Qk) i ф выбор оператора . (7.48) к В случае если выводы оператора и автоматической системы совпадают, принимается во внимание тот факт, что выбранные первоначаль- 350
Нейросетевые методы анализа и оценки обстановки но в качестве коэффициентов величины не случайны, а получены путем опроса специалистов и имеют определенный уровень достоверности. Поэтому в качестве ошибки в этом случае рассматривается отклонение вектора коэффициентов от исходного. При этом вектор коэффициентов стремится к своему исходному положению в фазовом пространстве. Далее используется алгоритм модификации весов. Таким образом, алгоритм дообучения после определенного числа операций находит такие значения весовых коэффициентов, которые имели бы наименьшее среднеквадратическое отклонение от исходных, обеспечивая в то же время выбор опасных целей так же, как оператор, на примерах работы которого проводилось дообучение. Система формирования фрагментов налета опирается на принципы объектно-ориентированного программирования и построения дружественных систем. На этой основе исследователю предоставляется возможность графического формирования исходных данных в структурированном виде. Фрагмент налета представляется в виде иерархического дерева (рис. 7.15), каждый последующий уровень которого описывает налет с возрастающей степенью обобщения. На самом нижнем уровне каждый элемент описывает конкретную цель и ее координаты (включая скорость) относительно узла. На следующем уровне описываются группы целей, состоящие из отдельных целей. И так далее до самого верхнего уровня, задающего собственно фрагмент налета. Степень вложенности может быть произвольной и ограничивается только структурой формируемого налета. Исследователь может задавать координаты и скорости целей в удобном для него виде с помощью «мыши». Координаты задаваемых элементов фрагментов налета представляются и в числовом виде, как в абсолютных единицах, так и в относительном виде для четкого задания взаимных расстояний между целями. Взаимные расстояния между целями изображаются в виде таблицы для всех доступных на данном уровне иерархии элементов. При этом для единообразных элементов имеется возможность совместного группового задания координат и скоростей. Одновременно отображается структура налета в виде наглядного иерархического дерева. Имеется возможность вывода на экран всей текущей базы фрагментов налета и навигации по ней для подтверждения правильности формирования записей. Для удобства хранения информации об имеющихся фрагментах налетов используется база данных, в которой записаны типы, координа- оператора. (7.49) j 351
Глава 7 ты, скорости целей, варианты тактического применения (цель в помехах, помехопостановщик, маневр и т.п.) и их иерархическая структура. Часто одни и те же элементы иерархической структуры в виде групп целей или групповых образований могут использоваться в различных фрагментах. Для хранения и использования типовых построений целей в группах и типовых тактических ситуаций создана база стандартных налетов, из которой оператор с помощью разработанных процедур группового копирования логически связанных между собой записей может осуществлять формирование фрагментов налета целыми группами или даже более укрупненными элементами. Форма представления базы стандартных налетов практически в основном совпадает с формой формирования фрагментов налета для удобства работы исследователя. налете {Celsva И 1>Н| ?\\ ч у | V» N«w с.1 (Mmi DFj N*w c.l (АЯ-64) •#» New «1CA-10) : K«w e*l (M*rv_-i Q_| HW eel i «uvk-fi Nevr c«l (undti) Q| Kevrcel(uni3ef) £_| N«rcel(undef) !]J WtvrctKwdtf) Масштаб Kl С] и 2t t\ м/с P -17855 _____ : P* Поме ; P" Цепь холостом в помеха* эвщик Рис. 7.15. Фрагменты налетов (иерархическое дерево) По заданным фрагментам налета проводится анализ опасности присутствующих в нем целей в соответствии с описанной выше методикой (рис. 7.16). Для этого используются специализированные базы данных по типам целей, их важности и априорной вероятности появления, а также по функциям принадлежности скоростных и высотных характеристик целей. Создан специальный программный механизм обработки нечеткой информации в базах данных. Нечеткий признак задается несколькими последовательными полями базы, количество которых определяется 352
Нейросетевые методы анализа и оценки обстановки числом интервалов постоянства функции принадлежности. При предъявлении некоторого числового значения скоростной и высотной характеристики цели проводится поиск по интервалу, к которому относится данное значение и выдается соответствующая ему записанная в базе данных величина функции принадлежности. Рис. 7.16. Анализ опасности целей Для каждой из целей рассматриваемого фрагмента производится расчет апостериорной вероятности отнесения цели к определенному типу по формуле Байеса в виде рассчитываемого поля базы данных. Окончательного решения о принадлежности цели к тому или иному типу не принимается и на дальнейшую обработку подается информация о вероятностной оценке принадлежности цели ко всем целям. Для определения важности конкретной цели проводится усреднение по всем возможным типам, к которым может принадлежать цель с весами, равными рассчитанным величинам апостериорной информации. В работе системы анализа опасности целей участвуют также признаки боевого применения, имеющие вес, свидетельствующий о значимости признака по переменной «ОПАСНОСТЬ», и пересчитанные на значения из интервала [0,1]. Значимые признаки (имеющие величину функции принадлежности выше 0,1). Рассчитанная оценка важности и коэффициента, учитывающего признаки боевого применения, а также результат оценивания опасности выводятся на экран. При выборе в стиле «записной книжки» произвольной цели из фрагмента проводится пересчет и отображаются результаты 12—5782 3 53
Глава 7 расчета. Для извлечения у операторов знаний об опасности целей предлагается проводить анализ решений операторов по выбору наиболее опасных целей в различных тактических ситуациях. Оператору предоставляется имитатор индикатора кругового обзора (рис. 7.17), на котором отображаются все цели рассматриваемого фрагмента налета. Робота оператора (CELSVAS1 ОН . N17| шшшшшшшшшштш Р Сета I М3770т jK2459m Ворилы Цель Выбрана цельЮ - 23 Щ Пересчет Тип цели [Дополнительные условия п гхогтет *тхт щ ик, 1 Г Цгп,.впо»пгпх ID цели 23 Г Нл Y Н 1 13000м | 2206 m 90m -388 m/t | 31 тЛ Рис 7,17. Извлечение знаний у оператора Для максимального приближения к привычным для оператора условиям работы изображение целей на имитаторе очень похоже на реальный индикатор, даже с имитацией постепенного затухания отметок, отметки предыдущих обзоров также высвечиваются с пониженной яркостью. Одновременно отображается информация за пять последовательных обзоров. Функционирование имитатора индикатора кругового обзора обеспечивает созданная для этой цели визуальная компонента. Перед началом работы оператор находит свое кодовое имя в базе операторов или, при отсутствии такового, вводит его. После этого все принятые им решения записываются под его именем. Для каждого из выбранных в базе налетов фрагмента оператор проводит выбор наиболее опасной, по его мнению, цели, что отображается на экране индикатора специальной круговой меткой. Также помечается цель, выбранная автоматической системой с заданными числовыми параметрами, что позволяет оператору более точно сориентироваться в тактической ситуации. Кроме того, он имеет возможность в любой момент перейти к системе анализа обстановки, чтобы внимательно и подробно изучить характеристики, находящихся в зоне целей, 354
Нейросетевые методы анализа и оценки обстановки 355 а также параметры их движения. После подтверждения сделанного выбора, результат фиксируется. Варианты выбора для всех операторов и всех заданных вариантов налетов записываются в базу данных для дальнейшего использования при дообучении системы анализа внешней обстановки. Причем, предоставлена возможность каждому оператору провести анализ одного и того же фрагмента налета несколько раз. При этом на экране могут отображаться предыдущие результаты. Это сделано для получения надежных верифицированных результатов. Проведенные эксперименты показали, что, необученная автоматическая система с жестко заданными параметрами априорных вероятностей появления целей, функциями принадлежности нечетких множеств признаков опасностей ошибается по сравнению с экспертом в 25...30% случаев. После обучения на небольшом (один-два десятка) числе примеров, количество ее ошибок снизилось до 10... 15%, т.е. примерно в два раза. Это подтверждает полезность предложенных методов. Таким образом, рассмотренный вариант создания автоматической системы поддержки принятия решений включает: создание упрощенной модели принятия решений человеком и последующее дообучение модели с использованием нейросетевых парадигм на небольшом числе конкретных примеров. Это позволяет обеспечить лучшее качество решений, чем при использовании автоматических систем с параметрами, задаваемыми экспертами и устраняет необходимость слишком большого числа обучающих примеров, которые на практике получить затруднительно.
ЧАСТЬ III Пути реализации нейросетевых технологий и направления дальнейших исследований В заключительной части подводится итог приведенных исследований по синтезу нейросетевых методов обработки радиолокационной информации, намечаются пути их внедрения в перспективные радиолокаторы, определяются требования к вычислительным средствам, способным реализовывать параллельную обработку данных, оценивается предполагаемая эффективность предлагаемых решений. Глава 8. Перспективы нейросетевой технологии для совершенствования обработки радиолокационной информации В настоящей главе определяются перспективы применения нейросетевых технологий в радиолокаторах на основе результатов исследований, изложенных в предыдущих главах. Проводятся оценки потенциальной эффективности их применения и необходимой для их использования производительности вычислительных средств. Рассматриваются требования к вычислительной производительности необходимых для реализации предложенных методов аппаратных средств, обеспечивающих поддержку нейросетевых вычислений за счет использования параллельности обработки. Предлагается концепция поэтапного внедрения технологий нейронных сетей в практику обработки радиолокационной информации, предусматривающая постепенное наращивание уровня нейросетевых методов в системах обработки. 8.1. Анализ эффективности систем обработки радиолокационной информации при использовании нейросетевых методов Проведенные исследования показали, что использование нейросетевых технологий позволяет реально повысить качество обработки радиолокационной информации в наиболее сложных условиях, требую- 356
Перспективы нейросетевой технологии для совершенствования обработки.,. щих высокой вычислительной мощности, когда динамика изменения внешних условий очень высока и традиционные подходы к созданию систем обработки не способны обеспечить требуемый уровень эффективности. Для каждого из рассмотренных этапов обработки РЛИ предложены конкретные методы нейросетевой реализации сложных, критических задач обработки. Проведенный анализ предложенных нейросетевых методов позволяет оценить ожидаемый эффект в приросте эффективности от применения этих методов, а также определить требования к производительности вычислительных средств, с помощью которых они должны быть реализованы. Это позволит определить методы нейросетевой обработки РЛИ, использование которых возможно уже в ближайшей перспективе, а также определить отдаленные перспективы использования нейросетевых технологий в радиолокации [117; 124; 334]. Рассмотрим основные этапы обработки РЛИ. Формирование диаграммы направленности антенны для ФАРа. Предложенная аналогия между функционированием фазированной антенной решетки и работой трехслойной нейронной сети с линейными функциями активации нейронов позволила использовать мощный аппарат нейросетевой оптимизации для адаптации антенн ФАР. Показано, что с помощью метода backpropagation можно значительно снизить уровень боковых лепестков диаграммы направленности антенны. Особенно сильно это проявляется, когда технические ограничения не позволяют использовать комплексные весовые множители и приходится ограничиваться фазовым или даже дискретным фазовым взвешиванием. Дополнительным преимуществом метода является возможность его применения и для неэквидистантных решеток. Результаты расчетов свидетельствуют, что при использовании фазового взвешивания и дискретного фазового взвешивания с помощью предложенного метода можно добиться снижения уровня боковых лепестков на 3-7 дБ по сравнению с традиционными методами при размерности двухмерной ФАР 4x8. Это позволит увеличить дальность обнаружения радиолокационных целей при воздействии помех на 20-50%. Реализация указанного метода для стационарных ФАР не вызывает трудностей. Расчет весовых векторов может быть осуществлен заранее в зависимости от требуемых направлений подавления помех. Требования к временам при этом можно охарактеризовать как «разумные», т.е. несколько часов. Для их реализации вполне достаточно современных персональных ЭВМ, особенно с учетом использования технологии ММХ. Реализация данных методов в конкретной аппаратуре также не вызывает сложностей. Используются традиционные методы взвешивания получаемых каждым элементом ФАР сигналов. Возможно также рассмот- 357
Глава 8 рение цифровой организации процесса приема сигналов ФАР, при которой взвешивание и последующее суммирование сигналов осуществляется в цифровом виде. При этом характерный временной интервал операции обработки сигналов составляет «\juc. За это время должно быть проведено 102...103 операций, требуемое быстродействие составит 107...108 оп/с для указанной выше размерности ФАР, что вполне достижимо для современных вычислительных средств. Использование нейросетевых методов для синтеза обработки в ФАР позволяет в отличие от традиционных методов осуществлять поиск близких к оптимальным векторов взвешивания при произвольной конфигурации ФАР, что имеет неоспоримое преимущество при выходе из строя части элементов ФАР. Возможность оперативной подстройки за время 100...1000 с потребует быстродействия 108...109 оп/с. Реализуемое при этом снижение уровня боковых лепестков может достигать 15...20 дБ, что эквивалентно увеличению дальности в помехах на 100- 200% при выходе из строя части элементов ФАР. Задача существенно усложняется при необходимости динамической подстройки диаграммы направленности антенны в ходе работы. В этом случае необходимо осуществлять обучение нейросетевой модели при каждом существенном изменении внешних условий, приводящем к новым требованиям на расположение зон подавления мешающих излучений. Характерный интервал, в течение которого допустимо проведение вычислений, зависит от скорости изменения внешних условий и может принимать значения 0,1... 1 с . Количество операций определяется числом циклов обучения, необходимых для достижения требуемого уровня боковых лепестков. Следует отметить, что время обучения может варьироваться в очень широких пределах в зависимости от начального приближения и используемой модификации алгоритма обучения. При моделировании было получено, что достаточного уровня подавления можно достичь после 104... 106 итераций. В то же время, известен ряд методов ускорения сходимости, применение которых может уменьшить необходимое число итераций на 1-2 порядка. Поэтому оптимистичная оценка требуемого быстродействия составляет 109...10п оп/с. Достаточность такого быстродействия требует дополнительного исследования, но оценку можно считать достаточно обоснованной. Обеспечение изменения требуемых зон подавления мешающих сигналов для ФАР в динамике изменения внешних условий позволит на 10-20 дБ снизить уровень воздействия этих сигналов и, соответственно повысить на 70-200% дальности обнаружения целей в сложной воздуш- но-помеховой обстановке. 358
Перспективы нейросетевой технологии для совершенствования обработки.. Помимо этого, следует указать еще одно направление использования нейронных сетей. В самых современных системах традиционной архитектуры используют подстройку функций взвешивания в динамике работы антенны, для выставления "нулей" в направлениях на постановщики помех. При этом расчет весовых коэффициентов зависит от матрицы, обратной к матрице ковариаций для вектора принимаемых элементами решетки сигналов. Ее расчет является наиболее трудоемкой в вычислительном отношении операцией. На существующих вычислительных средствах обеспечить требуемое время расчета весьма затруднительно. Поэтому или применяются упрощенные алгоритмы создания жестко заданных каналов подавления, или адаптация не позволяет отслеживать быструю динамику изменения внешних условий и не обеспечивает требуемой эффективности. Известны методы нейросетевые методы обращения матрицы, которые позволяют на 1...2 порядка повысить скорость расчетов. Их использование позволит добиться снижения уровня боковых лепестков в направлении на помехопостановщик на 10-20 дБ, что соответствует увеличению дальности на 70-200%. Необходимый для этого уровень производительности вычислительных средств можно оценить в 108... 1010 . 150 - Z 100 + iJE-M>9 \ 1.Е+11 Требуемое быстродействие on Jc синтез функций динамическая адаптация реконфшурация ФАР формирование нулей диаграммы Рис. 8.1. Адаптация антенн ФАР Первичная (спектральная) обработка. Следует отметить, что методы синтеза антенных решеток впрямую применимы для спектральной 359
Глава 8 обработки, так как здесь также используются функции взвешивания (в том числе и комплексные) и их адаптация к переменным внешним условиям. Приведенные выше оценки для использования нейронных сетей при пространственной фильтрации справедливы и в этом случае. Требуемое быстродействие существенным образом зависит от базы используемых сигналов. В современных РЛС используются сигналы с различными базами, от 10 до нескольких тысяч. Так как требования по быстродействию в основном определяются размерностью решаемой задачи, требования к нейросетевым аппаратным средствам в этом случае составят от 106... 107 до 108... 109 для статических функций взвешивания и от 108... 1010 до 1010... 1012 для динамически изменяемых весовых векторов в зависимости от внешних условий. Помимо этих методов перспективным является использование метода генетического синтеза многобазовых сигналов. Синтез нетрадиционных многобазовых сигналов с нерегулярной структурой является очень важным направлением для современных радиолокаторов. Классические методы оптимизации не применимы для синтеза этих сигналов по причине очень высокой размерности задачи. Разработанные методы генетического синтеза многобазовых сигналов позволяют находить субоптимальные решения за приемлемое время. Моделирование генетических методов синтеза нерегулярных многобазовых сигналов свидетельствует о том, что с их помощью можно обеспечить уровень боковых лепестков в рабочей области 10... 150 дискретов по доплеровской частоте и 1...300 по дальности на уровне -30...-35 дБ, что на 5...10 дБ лучше, чем при применении других методов. Это эквивалентно увеличению дальности на 30-70% при работе в помехах. При оценке требуемого быстродействия следует учитывать, что в расчетах функций неопределенности сигналов возможно использование специальных методов акселерации. Совместное их использование позволяет осуществлять расчет автокорреляционной функции размерностью 150x300 дискретов при длительности сигнала 1024 за «105 элементарных операций. В проведенных численных экспериментах было показано, что устойчиво высокие показатели качества синтезируемых сигналов достигаются за «103... 105 циклов. Так же, как и ранее, следует разделить варианты использования генетического программирования при предварительном синтезе сигналов с заранее заданными свойствами с целью их последующего использования в примерно известных условиях и вариант динамического синтеза сигналов в зависимости от складывающихся внешних условий. В первом случае время расчетов жестко не ограничивается и единственным требованием является «разумность». При этом быстродейст- 360
Перспективы нейросетевой технологии для совершенствования обработки.. вия современных вычислительных средств 106...107 оказывается вполне достаточно. В случае динамического синтеза сигналов, характерное время расчетов зависит от интервала стационарности внешних условий и может варьироваться в пределах « 0,1... 1 с . В этом случае требования к быстродействию намного ужесточаются (109..ЛО10) и могут быть достигнуты только при применении специализированных аппаратных решений. 1.Е-НМ» 1.Е+11 Требуемое быстродействие on ./с оптимизация функции взвешивания межсигнальная логическая обработка генетический синтез сигналов динамическая адаптация функций взвешивания адаптация межсигнальной обработки синтез сигналов в ходе работы Рис. 8.2. Первичная обработка Для дополнительного подавления боковых лепестков может быть использована логическая обработка внутри сложных сигналов. Такая обработка может быть адекватно представлена в нейросетевом базисе как многослойный персептрон с линейно-пороговой функцией активации. Соответственно может быть применен обширный инструментарий обучения таких сетей с целью адаптации свойств обработки к требованиям потребителя в зависимости от внешней обстановки. Временные характеристики работы алгоритмов остаются приблизительно такими же, как и при работе линейного персептрона. Эффективность подавления боковых лепестков при этом удается улучшить на 5..Л 0 дБ. Рассмотренные варианты нейросетевой реализации позволят обеспечить гибкую адаптивную структуру системы спектральной обработки радиолокационных сигналов и повысить эффективность ее работы в сложных условиях. 361
Глава 8 Обнаружение целей. Традиционные методы первичного обнаружения радиолокационных импульсов не способны обеспечивать эффективной работы в сложных условиях, при наличии групп целей, нестационарных негауссовых помех. При этом вероятность обнаружения резко снижается, увеличивается количество ложной информации. Показано, что наиболее перспективные методы автоматического обнаружения радиолокационных отметок должны осуществлять ранжирование принятых импульсов по амплитуде. Предложено для сортировки использовать нейросетевой алгоритм Кохонена, который способен для большинства случаев это делать быстрее, чем традиционные алгоритмы. Проведенный анализ позволил убедиться в преимуществах реализуемого сетью Кохонена метода сортировки, одновременно выявив его природу, что позволяет реализовывать его даже на последовательных процессорах. При этом даже при сортировке достаточно большого массива из 100 импульсов за время «1 мкс достаточно быстродействия «108 оп/с. Помимо этого, предложено использовать известную нейросетевую парадигму многослойного персептрона для обнаружения радиолокационных целей. Это позволит получить систему обнаружения, превосходящую по эффективности функционирования традиционные, и способную настраиваться на специфические условия работы. При этом его структура не зависит от конкретных требований к условиям функционирования и качеству обнаружения. Посредством обучения эта нейросе- тевая модель может быть настроена (обучена) практически на любые условия. Можно ожидать, что подобная система обнаружения будет способна показывать результаты не намного хуже работы человека- оператора. Проведенные исследования показывают, что в сложных условиях (при работе по группам целей, воздействии нестационарных, негауссовых помех и т.п.) ухудшение работы автоматических обнаружителей традиционного типа по сравнению с человеком оператором может быть оценено энергетическими потерями 5... 10 дБ, что эквивалентно снижению дальности на 30-70%. Проведенные расчеты свидетельствуют, что при применении нейросетевых механизмов обнаружения целей, для наиболее сложных условий воздействия существенно нестационарных помех и для работы по группам целей, эти потери будут сведены к минимуму (1...2 дБ). Выигрыш в дальности обнаружения в этих условиях составит 20-60%. Для проведения одного такта распространения в многослойном персептроне необходимо N%o>..JbN.p.,..Ibc-\-N.p....Ibc элементарных действий типа сложение с накоплением. При аппаратной реализации временем, необходимым для проведения нелинейных преобразований, можно пренебречь, так как количество этих операций на порядок меньше, чем 362
Перспективы нейросетевой технологии для совершенствования обработки.. элементарных действий. Типичное для РЛС число импульсов, участвующих в формировании решения о наличии цели, составляет 10... 100. Поэтому для проведения каждого цикла расчетов потребуется 102...103 операций и, при необходимости обеспечивать проведение расчетов за «1 мкс, требуемое быстродействие составит 108 109 оп/с. Приведенные оценки справедливы для случая функционирования уже обученной нейронной сети в реальном масштабе времени. Несмотря на возможность обеспечения достаточно высоких характеристик с ее помощью, полностью решить проблему устойчиво высокого качества обнаружения вряд ли удастся. Для наиболее сложных вариантов внешних условий необходимо обеспечить возможность дообучения нейронной сети с учетом реально складывающейся обстановки. В этом случае, в связи с необходимостью проведения, по крайней мере, 10... 100 циклов обучения на каждое решение, требования к быстродействию возрастут до 109... 1011 оп/с. В то же время такое решение позволит дополнительно повысить качество обнаружения, которое можно оценить энергетическим выигрышем 5... 10 дБ, что эквивалентно дополнительному увеличению дальности на 30-70%. В настоящее время пакетирование осуществляется с помощью полуэмпирических методов, эффективность которых невысока. Это приводит, с одной стороны, к пропуску части отметок и снижению энергетики при принятии решений о наличии целей, а также к размножению отметок от крупных целей и появлению ложных целей. С другой стороны, при завышенном пороге группирования возможно объединение отражений от разных близкорасположенных целей в один пакет, что приводит к пропуску целей и ухудшению точностных характеристик определения их координат. Проведение кластеризации, адекватной складывающейся воздушной обстановке, позволит, по оценочным расчетам, повысить вероятности обнаружения целей, что эквивалентно энергетическому выигрышу «1...2 дБ или 5-10% по дальности, и снизить количество ложных отметок в несколько раз. Эта задача является типичной задачей кластеризации, для решения которой успешно применяются нейросетевые парадигмы ассоциативной памяти Хопфилда и самоорганизующейся модели Кохонена. Вычислительная сложность этих алгоритмов зависит от размерности поступающих сигналов 100... 1000 • Ny... • NъНз .въ, где N^.. - количество обнаруженных импульсов, Мл1Ь.въ - количество обнаруженных целей, и составляет 107 109 для характерных для РЛС условий. Для их решения достаточно 107... 108 оп/с при темпе обновления информации «1...10 с. Помимо рассмотренных вариантов, возможно использование нейронных сетей при объединении решений, принятых по отдельным им- 363
Глава 8 пульсам. Известные варианты накопителей проводят арифметическое или логическое суммирование решающих статистик по каждому импульсу. Арифметическое суммирование реализует оптимальное накопление, но эта оптимальность соответствует только одной модели целей с независимыми флуктуациями отраженных импульсов, для других моделей наблюдается снижение вероятностей обнаружения целей. Кроме того, при наличии импульсных помех, возможно недопустимое повышение ложных тревог. Логический накопитель, снижая влияние импульсных помех, имеет излишне высокие энергетические потери. Робастный накопитель на основе трехслойного персептрона позволит, с одной стороны, добиться подавления импульсных помех, а с другой, обеспечить близкие к оптимальным характеристики общего решающего правила для известных моделей флуктуации целей. Одним из важных достоинств такого накопителя является его линейность с использованием в качестве функции активации порогового ограничения, что позволяет снизить требования к вычислительной производительности до 107... 108 оп/с. ч Тр*Оу •Mot* быстром* йстшй* onVc пакетирование импульсов обеспечение СУЛТ адаптация алгоритма обнаружения робастное объединение решении ранжирование сигнальных выборок адаптация СУЛТ Рис. 8.3. Обнаружение целей Проведенные расчеты показали, что с помощью робастного накопителя можно добиться энергетического выигрыша 2...3 дБ (10-20% по дальности) по сравнению с логическим накопителем или снизить в 10... 100 раз количество ложных тревог при воздействии нестационарных помех по сравнению с арифметическим накопителем. 364
Перспективы нейросетевой технологии для совершенствования обработки... 365 Представляет интерес рассмотрение процесса обнаружения радиолокационных целей на единой нейросетевой архитектуре, реализующей весь комплекс составляющих его задач. В качестве нейросетевых парадигм, которые могут быть при этом использованы, следует указать многослойный персептрон и самоорганизующуюся сеть Кохонена. Для обеспечения свойств стабильности-пластичности при обучении в реальном масштабе времени в зависимости от изменений внешних условий возможно использовать модели адаптивного резонанса (ART1, ART2, ART3). Размерность нейронной сети, решающей задачу обнаружения радиолокационных целей в целом, повышается до 102...103, в случае использования заранее обученной нейронной сети требуемый уровень быстродействия составит 109...10п оп/с. При необходимости динамического обучения в ходе работы требования возрастут до 1010... 1014 оп/с. Можно ожидать, что использование нейросетевой архитектуры решения задач обнаружения в комплексе позволит реализовать энергетический выигрыш в 10-15 дБ (увеличение дальности на 70- 100%) для заранее обученной, и 15-20 дБ (увеличение дальности на 100-200%) для динамически переобучаемой в ходе работы сети. Вторичная (траекторная) обработка. Вторичная (траекторная) обработка РЛИ, проводимая традиционными методами, не способна обеспечить эффективной работы в случае наличия в зоне обзора большого числа целей, в том числе и в составе групп. Это связано с тем, что традиционные методы вторичной обработки синтезированы в предположении работы по одиночным целям и механический перенос этих методов на случай работы в сложных массированных налетах не всегда приводит к успеху. Для осуществления эффективной вторичной обработки необходимо провести структуризацию поступающих на ее вход отметок от целей, адекватно отражающую реальное построение целей в составе налета и учитывающую возможность выполнения ими различных задач. Выделение объектов с общими признаками является кластеризацией и может быть эффективно проведено с помощью нейросетевых парадигм ассоциативной памяти Хопфилда и самоорганизующихся сетей Кохонена. Размерность этой задачи составляет 102 103 и для ее решения, даже с учетом необходимости адаптации к изменениям внешних условий, достаточно быстродействия существующих вычислительных средств. Осуществление эффективной кластеризации отметок позволит в дальнейшем адекватно формировать траектории групп целей, что приведет к эквивалентному энергетическому выигрышу на 2-3 дБ (10-20% по дальности) и снижению числа ложных трасс на порядок.
Глава 8 При проведении отождествления отметок от целей в предположении независимости их перемещения следует провести такую идентификацию, которая минимизирует сумму средних отклонений отметок от их пролонгированных значений. Это типичный вариант классической транспортной задачи, точнее ее варианта - задачи о назначениях. Известен ряд последовательных методов ее решения, имеющих сложность  , где N - ее размерность, однако, наиболее эффективным будет использование ассоциативной модели Хопфилда, которая помимо высокого быстродействия, основанного на параллельности, позволит при недостатке времени получать близкие к оптимальным решения. Отождествление отметок от групп целей на последовательных обзорах может быть значительно улучшено при использовании информации о структурах групп. Использование ассоциативной модели памяти Хопфилда позволит обеспечивать воспроизведение структур групп целей на последующих обзорах и провести уверенную идентификацию целей. Использование обобщения модели ассоциативной памяти Хопфилда для инвариантного запоминания образов при вторичной обработке групп целей позволяет добиться достоверного отождествления отметок и, следовательно, эффективного формирования траекторий целей. Причем, формирование траекторий возможно уже на втором обзоре, не дожидаясь подтверждения на последующих обзорах. Это особенно важно при работе по внезапно появляющимся целям. Полученные результаты свидетельствуют, что применение предложенного алгоритма позволяет существенно повысить вероятности поступления отметок на систему вторичной обработки. Это повышение может быть оценено энергетическим выигрышем, т.е. эквивалентным увеличением энергетики РЛС, с помощью которого можно было бы добиться такого же увеличения вероятностей обнаружения отметок. В зависимости от состава группы энергетический выигрыш составляет от 2 до 6 дБ при рабочих вероятностях 0,7...0,9 (10-40% по дальности). Одновременно улучшается точность определения координат целей (до 2 раз) и резко снижается количество ложных траекторий (на порядок). Реализация указанного алгоритма может быть осуществлена в двух вариантах. Во-первых, в виде стандартной ассоциативной сети Хопфилда с несколько модифицированными алгоритмами функционирования. Требуемая при этом производительность составит 108... 109оп/с. Во- вторых, возможно использование специальной редуцированной формы представления алгоритма, имеющей наглядную интерпретацию, и позволяющей эффективно выполнять вычисления на традиционных вычислительных средствах. Требования к производительности при этом снижаются на порядок. 366
Перспективы нейросетевой технологии для совершенствования обработки.. Одной из главных задач вторичной обработки является уточнение, сглаживание и экстраполяция координат обнаруженных целей. Применяемые для этого алгоритмы типа Калмановской фильтрации и ее упрощенных вариаций не всегда позволяют адекватно описывать нестационарное поведение целей. Это приводит к резкому ухудшению точностных характеристик выдаваемой информации в случаях маневров целей. Решение задачи сопровождения маневрирующих целей может быть существенно улучшено с помощью нейросетевых моделей типа рекуррентного обобщенного фильтра Калмана и нелинейной фильтрации. Одновременно может быть использована косвенная информация о тактических задачах, выполняемых целями, сформулированная в нечеткой форме. Для их применения целесообразно использовать многослойный персептрон. Применение указанных нейросетевых методов предположительно позволит повысить точности выдаваемых координат в 1,5...2 раза при требуемом быстродействии 107 108 оп/с. ■е- -9- » 100 \ —i ^ 1 ^ 1 L.E+09 х l.E+11 \ 1JE+13 Требуемое быстродействие оп./с \ кластеризация отметок решение задачи о назначениях нейросетевая вторичная обработка сглаживание координат ассоциативное отождествление целей Рис. 8.4. Вторичная (траекторная) обработка Основными координатами, которые определяются и уточняются при обработке радиолокационной информации, являются дальность, азимут, угол места (высота) и доплеровская скорость. В то же время существует ряд РЛС, в которых измерение высоты не может быть произведено из-за недостаточной селективности ДНА в угломестной плоскости. Для этих станций осуществляется формирование сведений о но- 367
Глава 8 мере луча, в котором произведено измерение (эшелона высоты). Такая информация является весьма неопределенной. В то же время, существует возможность улучшить определение угла места (высоты) целей за счет учета вероятностных характеристик появления целей в различных угломестных парциалах. Применение нейронной сети в виде многослойного персептрона позволит повысить точность определения высот целей в 2...3 раза при требуемых вычислительных затратах «107 оп/с. В перспективе следует рассмотреть варианты реализации вторичной обработки РЛИ полностью на базе нейросетевой технологии. Здесь можно предложить использование моделей многослойного персептрона, самоорганизующихся сетей Кохонена, рекуррентного обобщенного фильтра Калмана. Это позволит добиться устойчивого формирования траекторий и по маневрирующим целям, обеспечив требуемые уровни полноты, точности и достоверности информации в наиболее сложных условиях. Для ориентировочной оценки требуемой производительности вычислительных средств следует рассмотреть полномасштабное представление данных на входе нейронной сети. Размерность входного потока данных за 10... 100 обзоров составляет 104... 105. Для обучения такой нейронной сети даже в не реальном масштабе времени за разумное время необходимо быстродействие 108...1010 оп/с, обеспечить которое можно только при использовании специализированных вычислительных средств. Для дообучения подобной сети в реальном масштабе времени следует повысить требования к быстродействию на 2...3 порядка. Распознавание целей и ситуаций. Задача распознавания является одной из самых распространенных для нейросетевой технологии. Именно в задачах распознавания впервые были применены нейронные сети и в этих же задачах они находят наиболее широкое применение в практических приложениях. В этом направлении ведутся интенсивные работы по самым различным направлениям. Полученные результаты свидетельствуют о высокой эффективности систем распознавания, реализованных на нейросетевых принципах. В отличие от традиционных систем, жестко реализующих в признаковом пространстве решающую статистику заданного вида, нейросетевой подход допускает произвольное изменение решающего правила в зависимости от возложенных задач и предполагаемых условий функционирования. При этом достигается гибкость работы системы распознавания и обеспечивается устойчивость при изменениях внешней обстановки. В качестве признаков, на основе которых обычно проводится распознавание, используются сигнальные портреты, получаемые на этапе первичной обработки, и траекторные признаки. 368
Перспективы нейросетевой технологии для совершенствования обработки.. Наиболее прямолинейным направлением использованием нейросетевой технологии является замена традиционных жестких алгоритмов нейросетевыми. Для этой цели наиболее подходит нейронная сеть типа многослойного персептрона. Проведенные расчеты показывают, что с их помощью можно обеспечить увеличение вероятностей распознавания сложных классов целей приблизительно в 1,5 раза. При использовании сигнальных признаков, размерность признакового пространства обычно не превосходит 102 ...103, поэтому для распознавания 100...200 целей будет достаточно быстродействия 107...108 оп/с. Размерность траекторных признаков значительно ниже и, соответственно, требования к производительности вычислительных средств значительно снижаются. -6- 1.Е-НМ» 1.Е+11 1.Е+13 Тр*6у»мо« быстродействие on./с траекторные признаки совместное распознавание- сопровождение целей сигнальные портреты распознавание тактических ситуаций Рис. 8.5. Распознвание целей и ситуаций В настоящее время среди систем распознавания на первый план выдвигаются системы способные работать на более высоком уровне, чем определение классов или типов целей. Помимо традиционных задач распознавания классов целей, может рассматриваться задача распознавания ситуаций. В отличие от традиционной системы распознавания, при этом в качестве распознаваемых категорий выступают не классы целей, а типовые ситуации. Это позволяет с одной стороны полнее удовлетворить требования потребителей РЛИ, которых в первую оче- 369
Глава 8 редь интересуют ситуационные варианты внешней обстановки, а с другой - повысить вероятности распознавания за счет более полного учета взаимоувязанных факторов. Размерность признакового пространства в этом случае возрастает до 103 ...104, и требования к быстродействию составляют не менее 108... 109 оп/с. Часть признаков, которые могут быть использованы при распознавании, носят нечеткий характер. Реализация их обработки в традиционных системах распознавания затруднена. При этом нечеткие признаки или принудительно преобразуются в четкие со значительной потерей информативности, или вообще не используются. Нейронные сети способны свободно оперировать нечеткой информацией, используя при этом задаваемую потребителем алгебру операций. Реализация таких систем для распознавания классов целей позволяет значительно повысить качество распознавания. Качественного улучшения распознавания можно достичь, создав комплексную систему распознавания-сопровождения целей, в которой формирование траекторий формулируется как задача сопровождения целей в многомерном факторном пространстве, включающем помимо обычных координат, характеристики принадлежности целей к классам, в том числе и нечеткие. Необходимое для этого быстродействие можно оценить как 109...1010 оп/с. Анализ и прогнозирование обстановки. Для данного этапа наиболее затруднено проведение формализации и автоматизация. Большинство задач анализа обстановки решается командиром или оператором. Это связано, во-первых, с высокой степенью ответственности принимаемых на этапе решений, а, во-вторых, с отсутствием математического аппарата корректно и адекватно описывающего механизмы принятия решений человеком. Применяемые методы автоматизации носят эвристический характер, качество их работы весьма невелико. Важным направлением повышения эффективности применяемых методов является формирование информативного представления внешней обстановки, позволяющего описывать ее развитие небольшим числом параметров, при сохранении наиболее важных для потребителя и собственно РЛС характеристик ее описания. Эту задачу можно переформулировать как задачу кластеризации - выбор иерархической структуры описания параметров обстановки. Наиболее адекватными этой задаче являются нейросетевая парадигма самоорганизующейся сети Кохонена. Вектором входных значений для нее являются координаты обнаруженных целей, помеховые направления с учетом типов помех и динамики их изменения во времени. Число формируемых классов не 370
Перспективы нейросетевой технологии для совершенствования обработки.. должно превышать нескольких десятков. Для работы такой сети в масштабе времени 1...2 с необходимо быстродействие 109... 1010 оп/с. По результатам анализа обстановки можно осуществлять выбор режимов работы, предпочтительных направлений излучения радиолокационных сигналов и их типов. Известно, что оптимальная организация просмотра зоны обзора позволит обеспечить энергетический выигрыш 5-10 дБ (30-70% по дальности). Для реализации нейросетевой модели выбора режимов работы РЛС в виде многослойного персептрона требуемое быстродействие составит 107...108 оп/с. Одним из вариантов решения задачи по анализу обстановки может служить создание упрощенной модели принятия решений человеком. Затем она дообучается с использованием нейросетевых парадигм на небольшом числе конкретных примеров. При этом, даже если число обучающих примеров весьма ограничено, как это часто бывает на практике, дообученная система все равно остается работоспособной, в отличие от случая обычной для нейросетевых методов случайной начальной установки весов, когда традиционная нейронная сеть, не получив минимально необходимого (обычно очень большого числа) обучающих примеров, не просто не может эффективно выполнять свои функции, но и может оказаться полностью неработоспособной. В то же время полученная в результате система будет работать, по крайней мере, не хуже исходной, так как прошла дообучение, и на каждом шаге итераций только улучшала свою работу. -в- -9- с ч 1 2 * * Ч, Требуемо* быстродействие млн оп./с управление режимами обзора расстановка приоритетов информативное представление внешней обстановки Рис. 8.6. Анализ и прогнозирование обстановки 371
Глава 8 Проведенные исследования прототипа системы выбора наиболее опасной цели показали, что ее использование позволяет в 2...3 раза уменьшить число ошибочных решений системы по сравнению с работой оператора. Требуемое при этом быстродействие составляет 107... 108 оп/с. Однако при усложнении системы и использовании дополнительных признаков, также как и дополнительных нейросетевых методов, требования к производительности возрастут. Можно ожидать, что полномасштабная нейросетевая система анализа и прогнозирования обстановки потребует производительности 109...1012 оп/с, в зависимости от размерности решаемых задач. Основные результаты анализа методов решения критичных задач обработки радиолокационной информации сведены в табл. 8.1 и изображены на рис. 8.7. Проведенный анализ возможных направлений повышения качества обработки радиолокационной информации не может претендовать на полный охват всей многоплановой области подобных исследований. В основном рассмотрены лишь наиболее универсальные и широко распространенные нейросетевые парадигмы и проанализирована лишь часть возможных областей их применения. Однако предложенные варианты показывают, что использование нейросетевых технологий в критических задачах позволит реально повысить эффективность обработки радиолокационной информации для сложных быстро изменяющихся внешних условий. Причем, использование принципов самообучения и развитого аппарата синтеза нейросетевых методов позволит достичь этого достаточно быстро без длительных и трудоемких теоретических исследований, проведение которых является необходимой и обязательной частью традиционного подхода. В ходе дальнейших исследований часть из предложенных методов может быть уточнена. Возможно появление новых методов, позволяющих более полно использовать преимущества нейросетевой технологии. Однако можно уверенно утверждать, что проведение работ в указанных направлениях даст мощный стимулирующий толчок для создания в будущем высокоэффективных методов обработки радиолокационной информации, которые могут быть реализованы на доступной элементной базе. 372
Перспективы нейросетевой технологии для совершенствования обработки. 373
Глава 8 об Повышение эффективности (показатель) 3-7 дБ (боковые лепестки) 20-50% (дальность) 15-20 дБ (боковые лепестки) 100-200% (дальность) при выходе из строя элементов ФАР 10-20 дБ (боковые лепестки) 70-200% (дальность) 10-20 дБ (боковые лепестки) 70-200% (дальность) 3-7 дБ (боковые лепестки) 20-50% (дальность) 10-20 дБ (боковые лепестки) 70-200% (дальность) 5-15 дБ (боковые лепестки) 30-100% (дальность) Требуемое быстродействие млн оп./сек 10-100 100-1000 1000-100000 100-10000 от 1-10 до 100-1000 о о О о Я- о п от 1-10 до 100-1000 Нейросетевые парадигмы линейньш персептрон линейньш персептрон линейньш персептрон нейросетевые методы обращения матриц линейньш персептрон линейньш персептрон многослойный персептрон Критичные задачи обработки РЛИ <N использование специальных функций взвешивания элементов ФАР для достижения требуемых уровней боковых лепестков, динамического изменения ширины луча и др. реконфигурация системы объединения приемных и передающих каналов при выходе из строя части элементов ФАР динамическая адаптация векторов взвешивания приемных каналов ФАР в ходе работы при изменении обстановки адаптация к помеховой обстановке - формирование нулей диаграммы в направлении на помехопостановщик оптимизация функции взвешивания по временным дискретам для обеспечения минимума боковых лепестков как по дальности, та и по частоте (доплеровской скорости) динамическое изменение функции взвешивания для обеспечения минимума боковых лепестков в ходе работы при измене- ш внешних условий использование межсигнальной логической обработки для подавления мощных импульсных помеховых воздействий Этапы обработки РЛИ ЛФ мщр 1ЧИНЗШИЮ пгиэоннтг smhant ттпкЬппр эптмктшёоф у vmuogvdgo (mmmrvdui -нэиэ) тнътйэц ц
Перспективы нейросетевой технологии для совершенствования обработки.. об 15-25 дБ (боковые лепестки) 100-300% (дальность) 5-10 дБ (боковые лепестки) 30-70% (дальность) 15-25 дБ (боковые лепестки) 100-300% (дальность) 2-3 дБ (энергетика) 10-20% (дальность) 5-10 дБ (энергетика) 30-70% (дальность) по группам целей 10-20 дБ (энергетика) 70-200% (дальность) по группам целей 1-2 дБ (энергетика) 5-10% (дальность) 2-3 дБ (энергетика) 10-20% (дальность) 10-15 дБ (энергетика) 70-100% (дальность) о о о о о ч 10-100 Id m О о о 100-1000 1000-10000 10-100 10-100 "о о m многослойный персептрон генетические алгоритмы оптимизации генетические алгоритмы оптимизации сеть Кохонена многослойньш персептрон сеть Кохонена многослойный персептрон сеть Кохонена сеть Хопфилда сеть Кохонена многослойньш персептрон вероятностная нейронная сеть многослойньш персептрон сеть Кохонена адаптация межсигнальной логической обработки к внешним условиям в ходе работы использование генетических алгоритмов оптимизации для синтеза сложных многобазовых сигналов генетаческий синтез сложных многобазовых сигналов лепестков в ходе работы при изменении внешних условий ранжирование сигнальных векторов опорной и исследуемой выборок обнаружение импульсов на фоне помех различных типов и интенсивности при обеспечении стабильно низкого уровня ложной тревоги адаптация алгоритма обнаружения в ходе работы при изменении внешних условий пакетирование импульсов, отраженных от одной цели при пере- крьгоаюшихся положениях луча диаграмм направленности антенны робастное объединение решений, принятых по отдельным импульсам, реализующее низкие энергетические потери и стабильность при наличии интенсивных неоднородных помех комплексное нейросетевое обнаружение целей на фоне помех различных типов и интенсивности при обеспечении стабильно низкого уровня ложной тревоги пэь-эп эпнэжбсЬшдо •/// 375
Глава 8 д п й* 2 2 Т Л - I О I О £-! Ю g 8 11 I Ю О В « Я д •О* о д х о о X « д о X о 8 Ю О X О I Is к S D Д VHiuogvdgo (KVHdouiXBvdui) UDHnndowg уц 376
Перспективы нейросетевой технологии для совершенствования обработки.. об 1,5 раза (вероятность распознавания) 1,5 раза (вероятность распознавания) 1,5-2 раза (вероятность распознавания) 1,5-2 раза (вероятность распознавания) до 2-х раз (точность) 5-10 дБ (боковые лепестки) 30-70% (дальность) 2-3 раза (соответствие работе оператора) 10-100 0,1-10 100-1000 "о О О О 10-100 10-1000 со многослойный персептрон адаптивный резонанс многослойньш персептрон адаптивный резонанс многослойньш персептрон сеть Кохонена многослойньш персептрон сеть Кохонена сеть Кохонена многослойньш персептрон многослойньш персептрон распознавание целей по сигнальным портретам с привлечением дополнительной информации распознавание целей по траекторным признакам с использованием информации о сигнальном распознавании распознавание тактических ситуаций совместное распознавание-сопровождение целей в многопараметрическом факторном пространстве формирование информативного представления внешней обстановки, позволяющего описьшать ее развитие небольшим числом параметров управление режимами обзора, выбор наиболее информативных направлений для излучения радиолокационных сигналов расстановка приоритетов для уточнения информации и выдачи ее потребителю ппЬюбшпэ п птгэ*п 3tiHV9Dmouavj \ [ пнэоитиэдо dtiw)9odnioH2odu п иптну li 377
Глава 8 8.2. Требования к специализированным вычислительным средствам поддержки нейросетевых вычислений Проведенный предварительный анализ и приблизительные оценки потребной производительности вычислительных средств позволяют выделить основные нейросетевые парадигмы, применение которых даст ощутимый прирост эффективности обработки радиолокационной информации. К ним можно отнести многослойный персептрон, ассоциативную память Хопфилда и самоорганизующуюся сеть Кохонена. Кроме того, можно примерно проранжировать предложенные методы в соответствии с требуемой производительностью. Часть из этих методов весьма нетребовательна к вычислительным мощностям и может быть реализована на существующих или перспективных вычислительных средствах при программной реализации нейросетевых парадигм. Для других - вычислительной мощности традиционных последовательных вычислительных средств недостаточно и должны быть использованы специализированные нейросетевые аппаратные средства. Причем, хотя и имеется ряд методов, для которых требуется производительность, далеко превосходящая доступные в настоящее время и обозримой перспективе возможности, большая часть предложенных вариантов, может быть реализована на специализированных аппаратных средствах. При разработке таких средств будут учтены преимущества нейронных сетей по параллелизации вычислений, которые смогут обеспечить уровень быстродействия на 1...2 порядка более высокий, чем у существующих вычислительных средств. Многослойный персептрон с методом обучения типа backpropagation (или его модификациями) - наиболее перспективная архитектура для нейросетевых аппаратных средств. Применение этой нейросетевой парадигмы целесообразно для решения следующих задач. Формирование диаграммы направченности антенны для ФАР использование специальных функций взвешивания элементов ФАР для достижения требуемых уровней боковых лепестков, динамического изменения ширины луча и др.; реконфигурация системы объединения приемных и передающих каналов при выходе из строя части элементов ФАР; динамическая адаптация векторов взвешивания приемных каналов ФАР в ходе работы при изменении обстановки в масштабе времени 10...100 с; первичная (спектральная) обработка оптимизация функции взвешивания по временным дискретам для обеспечения минимума боковых лепестков как по дальности, так и по частоте (доплеровской скорости); 378
Перспективы нейросетевой технологии для совершенствования обработки... 379 динамическое изменение функции взвешивания для обеспечения минимума боковых лепестков в ходе работы при изменении внешних условий в масштабе времени 10... 100 с; использование межсигнальной логической обработки для подавления мощных импульсных помеховых воздействий; обнаружение целей обнаружение импульсов на фоне помех различных типов и интенсивности при обеспечении стабильно низкого уровня ложной тревоги; адаптация алгоритма обнаружения в ходе работы при небольших изменениях внешних условий; робастное объединение решений, принятых по отдельным импульсам, реализующее низкие энергетические потери и стабильность при наличии интенсивных неоднородных помех; вторичная (траекторная) обработка уточнение и сглаживание координат целей, в том числе и при пропадании части отметок и наличии косвенной информации; распознавание целей и ситуаций распознавание целей по сигнальным портретам с привлечением дополнительной информации; распознавание целей по траекторным признакам с использованием информации о сигнальном распознавании; упрощенное распознавание тактических ситуаций; совместное распознавание-сопровождение целей в сокращенном параметрическом факторном пространстве; анализ и прогнозирование обстановки управление режимами обзора, выбор наиболее информативных направлений для излучения радиолокационных сигналов; выбор наиболее опасных целей, расстановка приоритетов для уточнения информации и выдачи ее потребителю. Таким образом, многослойный персептрон может использоваться практически на всех этапах обработки радиолокационной информации для повышения адаптационных возможностей и устойчивости в сложных условиях. И именно ориентированные на эту парадигму аппаратные средства поддержки нейросетевых вычислений следует разрабатывать в первую очередь. Отличительной чертой нейросетевых решений является возможность их применения в широком спектре приложений. Архитектура вычислителя для многих задач остается единой. Отличительные особенности решаемых задач определяются входными и выходными сигналами, которые в каждом приложении свои. Единая структура выполняемых операций позволяет использовать практически единое аппаратное решение для всех рассмотренных методов.
Глава 8 Так как работа нейронной сети в виде многослойного персептрона осуществляется в два этапа целесообразно рассмотреть их раздельно. Этап 1 прямого функционирования наиболее важен и жестко определен во временных рамках, связанных с временными параметрами решаемых задач. На этом этапе проводится только однократное распространение входных сигналов и их преобразование в выходные значения, на основе которых осуществляется решение рассматриваемой задачи. Основными параметрами, существенными для работы устройства, являются дискретность представления входных значений, их размерность и функция активации нейронов. Размерности рассмотренных задач существенно варьируются от 10 до 104... 105. Однако, используя преимущества нейронных сетей, можно использовать высокопараллельную архитектуру для повышения размерности. В качестве единой структуры можно предложить элементы с 10-100 входами, которая легко наращивается в случае необходимости. Дискретность входных значений и весов нейронной сети для большинства задач составляет 8-32. В качестве функций активации должны быть рассмотрены три варианта: линейная, линейно-пороговая и стандартная для классического нелинейного персептрона сигмоидная. Тактовая частота нейросетевого элемента должна составлять 50- 100 МГц. Этап 2 обучения с одной стороны требует значительно большего количества проходов для подстройки весовых значений, и, соответственно, большего времени работы, а с другой стороны, необходимости получения новых весов в каждом из тактов работы системы требовать необязательно, так как изменения внешних условий охватывают значительно больший промежуток времени и происходят не скачкообразно, а постепенно. Большое значение при этом играет и тип выбранной процедуры обучения. При удачном выборе процедуры модификации весов можно добиться на 1...2 порядка меньшего числа итераций, чем при стандартном методе. Хотя известно много разнообразных вариантов улучшения сходимости, большая часть известных модификаций основывается на стандартном методе обратного распространения ошибки backpropagation. Отличия заключаются в конкретном преобразовании ошибки в изменения весов. Архитектура вычислительного устройства остается постоянной, изменяются лишь заключительные стадии расчета. Окончательный выбор конкретной модификации процедуры обучения может быть проведен на заключительной стадии разработки аппаратных средств. Более того, возможно, окажется целесообразным включение нескольких близких по структуре преобразований процедур обучения в каждое устрой- 380
Перспективы нейросетевой технологии для совершенствования обработки.. ство с последующим ручным или автоматическим выбором из них наиболее подходящих для каждой конкретной ситуации. Таким образом, необходимо реализовать единую структуру метода обучения нейронной сети типа backpropagation, т.е. расчет градиентов для каждого из весовых значений. Конкретный вариант модификации весов должен быть доступен для изменения разработчиком или даже в ходе работы устройства в зависимости от решаемой задачи и требований потребителя. Следующими по приоритету для создания специализированных аппаратных средств поддержки нейросетевых вычислений являются ассоциативная память Хопфилда и самоорганизующаяся сеть Кохонена. Их реализация позволит эффективно решать следующие задачи: формирование диаграммы направленности антенны для ФАР адаптация в помеховой обстановке - формирование нулей диаграммы в направлении на помехопостановщик; первичная (спектральная) обработка использование генетических алгоритмов оптимизации для синтеза сложных многобазовых сигналов; обнаружение целей ранжирование сигнальных векторов опорной и исследуемой выборок; обнаружение импульсов на фоне помех различных типов и интенсивности при обеспечении стабильно низкого уровня ложной тревоги; пакетирование импульсов, отраженных от одной цели при перекрывающихся положениях луча диаграмм направленности антенны вторичная (траекторная) обработка кластеризация - группирование и выбор радиолокационных отметок для последующей совместной обработки; отождествление целей на последовательных периодах обзора с использованием нейросетевого решения задачи о назначениях; отождествление целей на последовательных периодах обзора, в том числе и при их построении в плотных групповых порядках с использованием информации о структурах групп; распознавание целей и ситуаций распознавание тактических ситуаций; анализ и прогнозирование обстановки формирование упрощенного информативного представления внешней обстановки, позволяющего описывать ее развитие небольшим числом параметров. Тактовая частота для этих нейросетевых средств 50-100 МГц. Последующее увеличение на один-два порядка тактовой частоты или соответствующее повышение параллельности позволит осуществить: 381
Глава 8 динамическую адаптацию векторов взвешивания приемных каналов ФАР в ходе работы при изменении обстановки в реальном масштабе времени; динамическое изменение функции взвешивания сигналов для обеспечения минимума боковых лепестков в ходе работы при изменении внешних условий; адаптацию межсигнальной логической обработки к внешним условиям в реальном масштабе времени; генетический синтез сложных многобазовых сигналов лепестков в ходе работы при изменении внешних условий; адаптацию алгоритма обнаружения в ходе работы при изменении внешних условий в сложной обстановке; комплексное нейросетевое обнаружение целей на фоне помех различных типов и интенсивности при обеспечении стабильно низкого уровня ложной тревоги; полномасштабная нейросетевая модель вторичной обработки; совместное распознавание-сопровождение целей в многопараметрическом факторном пространстве; формирование информативного представления внешней обстановки, позволяющего описывать ее развитие небольшим числом параметров. Необходимо отметить, что разработанные аппаратные средства, а также применяемые в них методы могут успешно использоваться в других образцах техники, так как многие методы обработки информации в оптических, тепловизионных и других системах используют сходные принципы. Более того, полученные результаты могут найти применение в смежных областях, таких как гражданская авиация, метеоразведка, нефтеразведка, локация морского дна и многих других. 8.3. Этапы внедрения нейросетевых технологий в системы обработки радиолокационной информации При решении основных задач обработки радиолокационной информации для предотвращения резкого снижения эффективности в сложных условиях следует использовать нейронные сети. Прямолинейное применение нейросетевой технологии для обработки радиолокационной информации наталкивается на существенные трудности. Возможно, было бы практически любую задачу представить в нейросетевом базисе, определив пространство входных сигналов и требования по желаемым откликам. Однако в этом случае размерность входного вектора и общее количество вариантов, в которых требуется проводить обучение, оказалось бы настолько, большим, что ни в каком обозримом будущем ожидать появления вычислительных средств, спо- 382
Перспективы нейросетевой технологии для совершенствования обработки... 383 собных решить эти задачи, не приходится. Попытка непосредственного заимствования нейросетевых методов из других областей также не приводит к успеху. Поэтому единственным способом успешного применения нейросетевой технологии для обработки радиолокационной информации является поиск и исследование эффективных нейросетевых методов для всех задач обработки. Разнородность структурного представления задач и требований к выходным параметрам систем обработки обуславливает невозможность использования единой нейросетевой парадигмы для всего комплекса задач. Приходится применять разные нейросетевые. подходы и во многих случаях изменять и корректировать известные нейросетевые парадигмы. Методология построения нейросетевых систем обработки радиолокационной информации иллюстрирует это. В наиболее важных и трудных задачах обработки радиолокационной информации выделяются подзадачи, для успешного решения которых известны нейросетевые парадигмы. Их использование позволит в значительной степени приблизиться к эффективному решению этих задач. Затем при недостатке вычислительных мощностей рассматриваются варианты их параллельной аппаратной реализации. Одновременно может оказаться возможным реализации традиционных методов решения некоторых подзадач на нейросетевых аппаратных средствах. И только потом, после того, как будет убедительно показано высокое качество работы систем, а заодно в ходе их применения часть алгоритмов будет уточнена и разработаны эффективные по показателю производительность/стоимость аппаратные средства, ориентированные на конкретные предметные области, можно переходить на нейросетевые комплексы, которые в большей части задач вытеснят традиционные. Таким образом, процесс внедрения реализация нейросетевых методов в обработку радиолокационной информации должен быть не одномоментным скачкообразным переходом, а последовательно проходить в несколько этапов (рис. 8.8). Этап 1. Нетрадиционные нейросетевые методы решения вспомогательных задач, ведущих к повышению эффективности традиционных методов. На первом этапе вряд ли можно рассчитывать на достаточно полное использование нейросетевых методов при обработке радиолокационной информации. Это связано с возможной недостаточной эффективностью их применения из-за отсутствия полностью адекватных нейросетевых парадигм. Важным обстоятельством является также достаточно высокая стоимость нейросетевых аппаратных средств, особенно с действительно массовым параллелизмом, которые необходимо использовать для полноценного проявления всех преимуществ нейросетевой технологии.
Глава 8 Нетрадиционные методы решения вспомогательных задач, ведущих к повышению эффективности традиционных методов Параллельные нейросетевые аппаратные средства, реализующие как традиционные, так и новые алгоритмы при обработке РЛИ Нетрадиционные нейросетевые методы решения задач обработки РЛИ Компенсирование нейросетевых систем обработки РЛИ, использующих лучшие варианты нейросетевых алгоритмов и аппаратных средств 1 этап 2 этап 3 этап 4 этап Рис. 8.8. Основные этапы внедрения нейросетевой технологии в системы обработки радиолокационной информации Поэтому на первом этапе целесообразно ограничиться использованием нейросетевых методов для решения вспомогательных задач, которые должны, в свою очередь, привести к повышению эффективности обработки РЛИ в рамках какой-либо из общих задач. Именно к этому этапу относится большинство предложенных методов. Причем для возможности использования нейросетевых методов в рамках уже предусмотренных вычислительных средств, необходима возможность достаточно скоростной реализации предложенных методов на последовательных компьютерах. При формировании диаграммы направленности антенны можно использовать наиболее распространенную нейросетевую парадигму - многослойный персептрон. С его помощью можно обеспечить наиболее оптимальный выбор функции взвешивания. Наиболее существенный недостаток этой архитектуры - длительное время обучения - при этом не так важен, так как обучение можно проводить заранее, а в реальных образцах использовать лишь конечный результат. В первичной обработке доказали свою эффективность методы, основанные на использовании архитектур "Адалин" и "Мадалин", которые являлись предшественниками методов обучения с обратным распространением ошибки. Последние можно использовать для получения оптимальных систем логической обработки многобазовых сигналов. При обнаружении отметок можно также использовать многослойный персептрон с предварительным обучением по ожидаемым входным сигналам и применением в реальной обстановке только в режиме прямого распространения с заранее обученными весами. Помимо этого можно использовать известное свойство самоорганизующихся сетей Кохонена по высокоскоростному ранжированию входных векторов для использования в ранговых обнаружителях и их модификациях. 384
Перспективы нейросетевой технологии для совершенствования обработки.. Многослойный персептрон, как наиболее успешно применяющаяся нейросетевая архитектура, может эффективно использоваться и в таких задачах, как вторичная (траекторная) обработка и распознавание целей. Кроме того, при вторичной обработке может быть использована ассоциативная память для группового отождествления отметок на последовательных периодах обзора с запоминанием и ассоциативным воспроизведением структуры группы. Следует еще раз подчеркнуть, что перечисленные методы легко реализуются на последовательных компьютерах и других использующихся в существующих образцах вычислительных средствах и при их применении необходима лишь доработка программного обеспечения. Этап 2. Параллельные нейросетевые аппаратные средства, реализующие как традиционные, так и новые алгоритмы при обработке РЛИ. Одним из наиболее важных преимуществ нейросетевой технологии является использование аппаратных средств с высокой степенью параллельности (так называемой массовой параллельностью). Поэтому использование высокопараллельных нейросетевых аппаратных средств должно стать одним из основных моментов внедрения нейросетевой технологии в процессы обработки радиолокационной информации. В связи с отсутствием на данном этапе нейросетевых методов полного решения каких-либо задач обработки РЛИ, аппаратные средства следует использовать для решения тех вспомогательных задач, для которых на предыдущем этапе разработаны нейросетевые методы, одновременно расширяя возможности этих методов и разрабатывая новые, которые ранее не могли применяться из-за высокой вычислительной трудоемкости. Помимо этого, нейросетевые высокопараллельные средства могут использоваться для ускорения вычислений при традиционном решении задач обработки РЛИ. Выбор функций взвешивания для формирования диаграмм направленности антенны в реальном масштабе времени с формированием нулей в направлениях на постановщики помех наталкивается на очень серьезные трудности. При необходимости достижения времени отработки изменений внешних условий менее 1 мкс, существующие средства позволяют добиться лишь 100 мкс. Использование нейросетевых аппаратных средств должно позволить преодолеть это ограничение. Как известно нейросетевые аппаратные средства в первую очередь используют параллелизм при проведении операций типа скалярного произведения векторов. Эта же операция является одной из наиболее важных и трудоемких при спектральной обработке. Хотя в настоящее время существует целый ряд сигнальных процессоров, работа в реальном масштабе времени (характерный период 1 мкс) со сложными многобазовыми сигналами в цифровом виде, особенно при необходимости дополнительной логической обработки, в настоящее время невозможна. 13—5782 385
Глава 8 Наиболее перспективные методы спектральной обработки предполагают логическую обработку для объединения преимуществ различных типов сигналов. Это эквивалентно предложенным группой Widrow вариантам нейросетевых методов Adaline, Madaline, а также ориентированных на них аппаратных средств. Еще одним традиционным методом обработки РЛИ, в котором возможно использование нейросетевых аппаратных средств, является обнаружение радиолокационных импульсов. Наиболее эффективные методы обнаружения предусматривают отбор из опорной выборки максимальных и минимальных элементов, или полное ее ранжирование. Эти операции весьма трудоемки в вычислительном отношении. Использование сетей типа «MaxNet» или специализированных средств поддержки сетей Кохонена позволит значительно повысить скорость сортировки, а, следовательно, и позволит обрабатывать входные сигналы большей размерности, повышая гибкость и адаптивность систем обнаружения. Этап 3. Нетрадиционные нейросетевые методы решения задач обработки РЛИ. Все без исключения задачи обработки радиолокационной информации могут решаться с использованием нейросетевых методов. Причем, если традиционные методы их решения обычно ориентированы на некоторые предположения о видах внешних условий или характере их изменения, для нейросетевых методов такие предположения не являются обязательными. Как следствие, если на какую-либо систему обработки поступают данные, отличные от предполагаемых, нейросетевые методы, в противоположность традиционным, позволяют получать достаточно успешные решения. Конечно, нельзя ожидать, что типовые нейросетевые методы и алгоритмы могут без изменения применяться для обработки РЛИ. Наилучших результатов можно ожидать лишь от разработки специальных методов для каждой из задач, и даже нескольких вариантов методов для различных типов РЛС и мест их применения. Однако представляется возможным указать наиболее перспективные методы для каждой из задач обработки, на основе которых могут синтезироваться нетрадиционные нейросетевые методы решения задач. При формировании диаграммы направленности антенны выбор функции взвешивания в реальном масштабе времени осуществляется в настоящее время исходя из критерия минимума среднего квадрата боковых лепестков и предположения о нормальном распределении поступающих на парциальные приемники сигналов. Использование многослойного персептрона позволит устранить эти ограничения и обеспечить оптимизацию по критериям, задаваемым следующими этапами обработки. Одновременно можно повысить надежность фазированных 386
Перспективы нейросетевой технологии для совершенствования обработки.. антенных решеток, реализуя реконфигурацию при выходе из строя части активных или приемных элементов, обеспечивая выполнение принципа постепенной деградации. Вследствие существенной алгоритмической схожести задачи первичной (спектральной) обработки могут решаться аналогичными методами. При этом можно добиться оптимизации функции взвешивания, использования межсигнальной логической обработки с адаптацией к быстропеременным условиям. Помимо этого при синтезе сложных сигналов можно использовать методологию генетических алгоритмов, в настоящее время часто относимую к теории нейронных сетей. При обнаружении целей можно использовать уже упоминавшийся многослойный персептрон. Причем на этом этапе следует рассмотреть возможность использования обучения в ходе практической работы системы обнаружения, подстройки коэффициентов для наилучшего функционирования при изменении внешних условий, выбора режима обнаружения в зависимости от типа помех. При обнаружении импульсов и их пакетировании, объединении решений, принятых по отдельным импульсам; могут успешно использоваться сети Кохонена, реализующие векторную квантизацию. Дополнительный выигрыш должно принести использование вероятностной нейронной сети и радиальных базисных функций. При вторичной (траекторной) обработке может также использоваться широкий спектр нейросетевых архитектур. Это многослойный персептрон, прямолинейное использование которого позволит реализовать хотя и трудоемкое, но наиболее эффективное решение задач определение экстраполированных координат. В этой задаче дополнительных успехов можно добиться при использовании нейронной сети, реализующей обобщенный фильтр Калмана. Вопросы кластеризации, столь трудно решаемые традиционными методами, поддаются эффективному решению с помощью машины Больцмана на сети Хопфилда. Задачи распознавание целей традиционны для нейронных сетей, их решению на нейронных сетях посвящены целые труды. В отличие от традиционных статистических методов нейронные сети предоставляют возможность использовать нечеткие признаки и критерии, что позволяет перейти от распознавания целей к распознаванию ситуаций, описание которых может содержать, в том числе и привычные для человека лингвистические термины. Возможно использование гибких методов объединения решений и дообучения. Особенно интересно использование с этой целью пластичных сетей адаптивного резонанса. Анализ и прогнозирование обстановки является комплексов новых и весьма сложных задач, ранее решаемых только человеком. К ним можно отнести формирование информативного представления внешней обстановки, прогнозирование динамики развития внешних условий, 387
Глава 8 управление режимами обзора, выбор наиболее опасных целей, расстановку приоритетов целей и решаемых системой задач. Использование нейросетевой технологии позволяет решать и эти задачи. Особенно перспективными для этих целей следует признать самоорганизующиеся сети Кохонена и модель адаптивного резонанса. Построение новых нейросетевых методов на основе выбранных парадигм, их использование в качестве базовых и последующее развитие должны обеспечить высокую эффективность обработки РЛИ, давая в руки разработчика мощный аппарат для достижения адаптивности и робастности — способности сохранения высоких результатов при отличии входных данных от тех, которые были заложены при синтезе. Этап 4. Комплексные нейросетевые системы обработки РЛИ, использующие лучшие варианты нейросетевых алгоритмов и аппаратных средств. Дальнейшее развитие нейросетевых методов решения задач обработки РЛИ должно идти в направлении комплексирования различных нейросетевых архитектур и алгоритмов. Решение задач обработки при этом должно осуществляться не изолированно, а совместно. Такое решение должно позволить улучшить качество работы как системы обработки в целом, так и каждой из подсистем по отдельности. Кроме того, именно таким путем решаются задачи обработки человеком-оператором. Известно, что большинство успешных применений нейросетевой технологии в сложных системах предполагает одновременное применение различных типов нейросетей с последующим объединением их решений, часто тоже с использованием нейронных сетей. Естественным обобщением этого подхода является дальнейшее наращивание структурных элементов системы, создание многоуровневых иерархических нейросетевых архитектур, каждый уровень которых представляет собой отдельную сеть или группу сетей. Такое построение позволит выбирать наиболее эффективные из нейросетевых методов для каждой из задач обработки РЛИ в зависимости от внешних условий, и оптимизировать работу всей системы в целом, а не только ее подсистем по отдельности. 388
Глава 9. Аппаратные и программные акселераторы вычислений для поддержки нейросетевых методов при решении задач обработки радиолокационной информации При практической реализации нейросетевых устройств встает вопрос о конкретных вычислительных системах, на которых будут выполняться нейросетевые алгоритмы. Здесь может быть два подхода. Первое, использование специализированных аппаратных средств, в которых заложены возможности по параллелизации вычислений [20; 54; 150]. Второе, как это ни парадоксально звучит, использование универсальных процессоров типа Pentium, основываясь на заложенных в них технологиях ММХ, SSE и их развитии, позволяющим достигать параллельности в 8 или даже 16 раз. В данной главе излагаются основы построения специализированных средств поддержки нейросетевых вычислений, использующие свойственное нейронным сетям свойство параллельности вычислений. Рассматриваются также возможности реализации параллельных вычислений на традиционных процессорах с использованием технологий суперконвейерной обработки. 9.1. Аппаратные средства поддержки нейросетевых вычислений Ниже рассматриваются основы построения наиболее широко известных аппаратных средств, используемых для нейросетевых вычислений. Оценивается максимальный уровень их вычислительной производительности. Можно указать три основных направления построения аппаратных средств, ориентированных на параллельную обработку: использование специализированных сигнальных процессоров, в последних модификациях которых заложены некоторые возможности по параллелизации вычислений; разработка специализированных нейрочипов и построенных на их основах нейросетевых платах-ускорителях; создание специализированных вычислительных систем на базе программируемых логически матриц (ПЛИС). 9.1.1. Специализированные нейросетевые процессоры и платы. Появившийся в последние годы всплеск интереса к использованию ней- 389
Глава 9 росетевой технологии привел к появлению большого числа нейросетевых аппаратных средств, как правило, имеющих высокую степень параллелизма. Ниже приводится краткий список основных компаний, производящих аппаратные средства поддержки нейросетевых вычислений и их основные продукты [323]: 1.Фирм: HNC, INC. Основные продукты HNC: Терминал для ввода видеодокументов (Image Document Entry Processing Terminal) распознает рукописные документы и преобразует их в текстовые файлы в коде ASCII; 'ExploreNet 3000' - нейросетевой демонстратор; fAnza/DP Plus' - нейросетевая плата, обеспечивающая 25Мфлоп или пиковую производительность в 12,5 млн связей. Balboa 860 - Нейрокомпьютерная сопроцессорная плата, ISA (16-бит) совместимая на базе микропроцессор i860 с тактовой частотой 40 МГц, встроенной системной памятью 16 МБ, 1 последовательным портом и 3 параллельными. 2. Фирма SAIC (Science Application International Corporation). 3. Фирма Micro Devices. MicroDevices производит MD1220 - 'Neural Bit Slice', а также множество других продуктов различного назначения. Хотя их назначение схоже с продуктами фирмы Intel, используемая архитектура отличается. 4. Фирма Intel Corp. Intel разрабатывает экспериментальный чип: 80170NW - обучаемая электрическая аналоговая нейронная сеть (Electrically trainable Analog Neural Network - ETANN). Он имеет 64 нейрона - с практически полным набором связей. Чипы могут составляться в иерархическую структуру и обеспечить до 2 млрд связей/с. Имеется программное обеспечение для его поддержки, разработанное фирмой California Scientific Software. Название продукта 'BrainMaker'. 5. Фирма NeuralWare, Inc. Продает только программные и моделирующие средства, но для различных платформ. 6. Фирма Tubb Research Limited. 7. Фирма Adaptive Solutions Inc. Его процессор CNAPS/64 имеет в составе 64 процессора и разработан для задач интенсивных вычислений, таких как распознавание изображений и речи, обработка сигналов и обучение нейронных сетей. 390
Аппаратные и программные акселераторы вычислений.. Базовый модуль, начальная цена которого составляет 34,950 долларов при 8МБт памяти, может быть расширен до 512 процессорных узлов и 32МБт памяти. 8. Фирма NeuroDynamX, Inc. NDX продает разнообразные нейросетевые аппаратные средства: NDX нейронные акселераторы (Neural Accelerators): набор карт, основанных на процессоре i860 для компьютеров типа PC. Они обеспечивают до 45 млн/с связей и используются совместно с программным обеспечением DynaMind neural network. iNNTS: нейросетевая система обучения 80170NX (ETANN) фирмы Intel. Президент фирмы NDX был одним из соразработчиков этого чипа. 9. Фирма 1С Tech. Нейрокомпьютерные аппаратные средства: DANN050L (дендро-дендритная нейронная сеть) - 50 полносвязных нейронов на входе; - встроенные в чип возможности обучения; - пиковая производительность 6 млрд/с связей; - обучает образ размером 7x7 менее, чем за 50 не, воспроизведение recalls менее, чем за 400 не; - низкая потребляемая мощность (менее 100 милливатт); - 64-контактный корпус; * NCA717D (нейрокорреляционный массив): - аналоговое установление соответствий менее, чем за 500 не; -аналоговый вход/цифровой вывод для вычислений в реальном времени; - приложения в стереовидео и вычислениях движений; - 40-контактный корпус; Нейрокомпьютерные платы: * ICT1050 - совместима с IBM PC; - со встроенным процессором DANN050L; - цифровой интерфейс; - возможно изменение конфигурации; Наиболее интересные и многообещающие варианты аппаратных средств представляет компания Adaptive Solutions Inc. Ею предложены системы BuildNet и программный инструментарий CNAPS-C, составляющие вместе единый пакет для разработки приложений распознавания образов [154; 283]. В BuildNet включены предопределенные нейросетевые алгоритмы и графический интерфейс пользователя, который позволяет даже пользователям, не имеющим опыта программирования, использовать алгоритмы. CNAPS-C - представляет собой расширение языка С, дающее возможность пользователю работать на знакомом языке высокого уровня 391
Глава 9 для создания новых алгоритмов и приложений, работающих на CNAPS компьютере. CNAPS компьютер разработан для применения при таких как распознавание речи, распознавание оптических символов, финансового прогнозирования, обработки сигналов. Архитектура CNAPS позволяет разработчикам решать важные проблемы при распознавании образов - извлечение признаков, предварительная обработка и классификация на единой системе. BuildNet и CNAPS-C работают на хост-системе CNAPS компьютера, который обычно представляет собой рабочую станцию с системой UNIX. Фирма Adaptive Solutions Inc. представила систему распознавания образов на основе CNAPS/VME, дешевой процессорной платы VME с массовым параллелизмом. Она обеспечивает более чем 5 млрд/с операций умножения с накоплением в секунду, используя CNAPS архитектуру. Такое быстродействие делает плату CNAPS/VME идеальным устройством для решения трудоемких в вычислительном отношении задач распознавания образов типа распознавания изображений и речи, прогнозирования, обработки сигналов с использованием нейронных сетей. Фирмой Adaptive Solutions также предоставляются системы разработки и программный инструментарий для облегчения решения прикладных задач. Плата CNAPS/VME разработана таким образом, чтобы работать совместно с обычными компьютерными ресурсами и значительно ускорять решение задач распознавания образов. На плате CNAPS/VME находится от 64 до 256 процессоров, работающих на частоте 20 МГц. Она имеет 16 МБ встроенной памяти данных и 4 МБ памяти программ. CNAPS/VME оптимизирована для быстродействующей обработки изображений, речи и распознавания символов, прогнозирования и обучения нейронных сетей, оставляя основному процессору задачи управления системой и другие задачи интерфейса. Имеется библиотека функций на С для управления платой CNAPS/VME. Возможно использование дополнительных систем ввода - вывода через прямой быстродействующий порт. Фирма Adaptive Solutions предоставляет полный набор программного обеспечения для системы UNIX, включая CNAPS-C, язык, подобный ANSI С с отладчиком и расширениями, которые обеспечивают доступ к параллельным возможностям обработки CNAPS архитектуры. Нейросетевые процессоры NeuroMatrix фирмы Модуль. В 1998 г. был выпущен очень перспективный процессор российского разработчика фирмы Модуль [148]. Он получил название NeuroMatrix. Векторная архитектура и направленность на высокую па- 392
Аппаратные и программные акселераторы вычислений... 393 раллельность сделали его весьма интересным архитектурным решением для аппаратной реализации нейросетевых парадигм. Микропроцессор NM6403 представляет собой высокопроизводительный «dual-соге» микропроцессор с суперскалярной архитектурой. В его состав входят два основных блока: 32-разрядное RISC-ядро и 64- разрядное VECTOR-сопроцессор для поддержки операций над векторами с элементами переменной разрядности (Патент No.2131145 РФ). Имеются два идентичных программируемых интерфейса для работы с внешней памятью различного типа и два коммуникационных порта, ап- паратно совместимых с портами ЦПС TMS320C4x, для возможности построения многопроцессорных систем. Эта весьма удачная разработка, уже получившая признание, в том числе и у зарубежных фирм имеет следующие особенности архитектуры: тактовая частота - 40 МГц (25 не - время выполнения любой инструкции); технология КМОП 0,5 мкм; корпус BGA256; напряжение питания от 3,0 до 3,6 В; потребляемая мощность @40МГц около 1,3 Вт; условия эксплуатации: -60...+85 С. Процессор имеет два внутренних ядра, способных работать независимо. Основное RISC-ядро имеет следующие характеристики: 5-ти ступенчатый 32-разрядный конвейер; 32- и 64-разрядные команды (обычно выполняется две операции в одной команде); два адресных генератора, адресное пространство - 16 Гбайт; два 64-разрядных программируемых интерфейса с SRAM/DRAM- разделяемой памятью; формат данных - 32-разрядные целые; регистры: 8 32-разрядных регистров общего назначения; 8 32-разрядных адресных регистров; специальные регистры управления и состояния; два высокоскоростных коммуникационных порта ввода/вывода, аппаратно совместимых с портами TMS320C4x. Дополнительный VECTOR-сопроцессор для поддержки параллельных вычислений имеет такие параметры: переменная 1-64-разрядная длина векторных операндов и результатов; формат данных - целые числа, упакованные в 64-разрядные блоки, в форме слов переменной длины от 1 до 64 разрядов каждое; поддержка векторно-матричных и матрично-матричных операций; два типа функций насыщения на кристалле;
Глава 9 три внутренних 32х64-разрядных RAM-блока. Новый процессор по заявлениям разработчика может успешно применяться в самых разнообразных приложениях, в том числе: акселераторы для PC и рабочих станций для: эмуляции нейронных сетей; систем цифровой обработки сигналов; обработки видеоизображений; векторно-матричных вычислений; телекоммуникации; встраиваемые системы; элементная база для построения мультипроцессорных супер-ЭВМ. Пиковая, заявляемая разработчиком производительность оценивается следующими показателями: скалярные операции: 40 MIPS; 120 MOPS для 32-разрядных данных; векторные операции: от 40 до 11,500+ ММАС (миллионов умножений с накоплением в секунду); I/O и интерфейсы с памятью: пропускная способность двух 64-разрядных интерфейсов - до 640 Мбайт/сек; I/O коммуникационные порты - до 20 Мбайт/сек каждый. Фирмой разработчиком проведен сравнительный анализ производительности процессора NeuroMatrix с процессорами известных производителей на типичных задачах, по которым можно судить о возможности применения этого процессора в реальных приложениях, в том числе и для поддержки нейросетевых вычислений [148]. Результаты анализа приведены в табл. 9.1 и 9.2. Таблица 9.1. Возможности процессоров Тип процессора Фильтр Собеля (Размер кадра: 384x288 байт) Быстрое преобразование Фурье (256 точек, 32 разряда) Intel, Pentium II, 300 MHz N/A 200 мкс Intel, Pentium, 200 MHz 21 кадр/с N/A Texas Instruments, TMS320C40, 50 MHz 6,80 кадров/с 464 мкс (11588 тактов) НТЦ "Модуль", NM6403, 40 MHz 68 кадров/с 102 мкс (4070 тактов) 394
Аппаратные и программные акселераторы вычислений.. Таблица 9.2. Тип процессора Преобразование Уолша-Адамара (21 шаг, Входные данные: 5 бит) Сеть прямого распространения (1024 слоя, 1024 нейронов/слой) Intel, Pentium II, 300 MHz 2,58 с N/A Intel, Pentium, 200 MHz 2,80 с N/A Texas Instruments, TMS320C40, 50 MHz N/A N/A НТЦ "Модуль", NM6403, 40 MHz 0,45 с 1,54 с Судя по приведенным характеристикам, эта новая разработка является весьма перспективной для аппаратной реализации нейросетевых парадигм. Однако настораживают явно заниженные характеристики процессоров фирмы Intel. Приведенные фирмой характеристики производительности процессоров Pentium хуже, чем реально достижимые для указанных задач в несколько (5-6) раз, а в некоторых случаях и на порядок. Поэтому результаты этого анализа могут быть приняты только в части собственных аппаратных средств разработчика. Для корректного сравнения с универсальными процессорами необходимо использовать другие материалы. Программируемые логические интегральные схемы Программируемые логические интегральные схемы, в дальнейшем ПЛИС, фирмы Xilinx типа FPGA (Field Programmable Gate Array) представляют собой матричные логические структуры, хорошо адаптированные для построения распараллеленных систем обработки информации [82; 98]. ПЛИС современных высокопроизводительных серий характеризуются следующими основными особенностями: Высокие системные частоты обработки - до 200МГц. Высокие скорости обмена chip-to-chip - до 200МГц. Степень интеграции до 1 млн. эквивалентных логических вентилей на кристалле. Технологический процесс - до 0,22 мкм на пяти слоях металла. Наличие корпусов с большим количеством внешних пользовательских выводов. Наличие на кристалле двух типов высокоскоростного ОЗУ (время выборки до 5 не). Возможность частичной реконфигурации в процессе работы. Внутреннее тестирование и отладка через JTAG 1149.1. 395
Глава 9 , Блсжи ввода-вывода,, ООО ООО CIN Рис. 9.1. Упрощенная структура ПЛИС Xilinx и отдельного конфигурируемого логического блока (КЛБ) 396
Аппаратные и программные акселераторы вычислений... 397 Развитые средства проектирования. Наличие кристаллов индустриального применения и с военной приёмкой. Относительно низкая стоимость кристаллов. ПЛИС представляет собой массив конфигурируемых логических блоков с полностью конфигурируемыми высокоскоростными межсоединениями. Ввиду матричной структуры ПЛИС, состоящей из КЛБ, как элементарных ячеек, на кристалле возможно построение иерархических блоков более высокого уровня организации. Большое количество внешних выводов ПЛИС, быстродействующие межсоединения позволяют построить на основе ПЛИС законченный фрагмент нейронной сети, а затем, осуществляя каскадирование ПЛИС соединением указанных для аппаратного каскадирования выводов, создавать нейронные сети произвольной конфигурации и сложности. За счёт гибкой реконфигурации ПЛИС, в одни и те же кристаллы, установленные в конструктиве возможна загрузка разных конфигураций нейронных сетей, что позволяет на одной программно-аппаратной платформе решать разнообразные задачи. Таким образом, на одном кристалле ПЛИС возможно создание полностью интегрированной нейронной системы функционирующей как единое целое или фрагмента нейронной сети, имеющего широкие возможности каскадирования. При этом вполне достижима реализация нейронной сети, функционирующей со временами вычисления одного нейрона, а, следовательно, и всего вектора, до 6 не (восемь 8-разрядных входов). Ведущим российским дистрибьютором ПЛИС ХШпх, фирмой Scan Engineering Telecom проведен анализ производительности при аппаратной реализации нейронных сетей для специализированных нейро- СБИС, заказных СБИС под конкретное приложение, стандартных процессорах типа Pentium - II, Alfa, PA-RISC 8500 и специализированных процессорах ЦОС (TMS320C6201) [52]. Результаты этого анализа в виде сравнения производительности основных подходов реализации фрагментов нейронной сети на примере подсчета быстродействия выполнения операции умножения данных (операций MAC - Multimply - Accumulate в секунду) приведены на рис. 9.2. Приведенные результаты свидетельствуют о несомненном преимуществе ПЛИС, которые в данном случае позволяют реализовать на кристалле большое количество жёстко скоммутированных умножителей (до 20-ти 180МГц 8-разрядных умножителей на XCV100). Однако, наряду со справедливыми утверждениями о достаточно высокой производительности специализированных нейропроцессоров при их высокой стоимости и преимуществах технологии ПЛИС, в этих материалах содержатся спорные утверждения об ограничениях применения универсальных процессоров [66].
Глава 9 Pentium-II TMS320C62 PA-RISC8500 XCS40XL - 4 XCV100-4 (исп. 90%) (исп. 90%) Рис. 9.2. Сравнительные характеристики различных подходов по производительности на примере подсчета числа MAC в секунду В частности, утверждается, что реализация нейронных сетей на стандартных процессорах в основном предпочтительна для эмуляции сети и при работе не в реальном масштабе времени. При этом совершенно не учитывается применение в современных процессорах Intel технологий ММХ, SSE, SSE2 параллельной обработки данных для целочисленной и вещественной арифметики. Еще одним вариантом построения аппаратных нейросетевых решений, особенно широко применяемым в нашей стране, являются платы - ускорители на базе сигнальных процессоров. Давно сложилось и уже прочно укоренилось мнение, что для операций обработки сигналов, изображений, а также других задач, где используются сходные вычислительные операции, например, при реализации нейросетевых парадигм, целесообразно применять сигнальные процессоры. При этом декларируется существенное (на один-два порядка) превосходство сигнальных процессоров в скорости обработки информации по сравнению с универсальными процессорами. Следует отметить, что выбор плат расширения компьютера на основе сигнальных процессоров для параллельной организации нейросетевых вычислений является также весьма дорогим решением, по общей стоимости приближающимся к первому варианту нейросетевых плат. Кроме того, утверждение о необходимости дополнительной квалификации пользователя для полноценного использования преимуществ этих плат в полной мере относится и к этому случаю, как и к любому другому, где предполагается использование специализированных аппаратных решений Возникает вопрос, действительно ли сигнальные процессоры смогут на порядки увеличить производительность для нейросетевых вычислений? Обычно их преимущество объясняется двумя причинами. 398
Аппаратные и программные акселераторы вычислений.. Во-первых, использованием архитектуры, специально ориентированной на выполнение отдельных команд, характерных для обработки сигналов и изображений, в результате чего большинство важных операций выполняются за 1 такт работы процессора. Более того, последние модели сигнальных процессоров способны выполнять несколько операций параллельно. При этом предполагается, что универсальные процессоры к таким организациям вычислений не способны. Такое мнение было действительно справедливым несколько лет назад, когда в универсальных процессорах на стандартные для обработки сигналов и изображений операции умножения и умножения с накоплением требовалось один-два десятка тактов и не бы,А? возможности параллельного выполнения инструкций. Появление в последние время высокоскоростных процессоров Pentium фирмы Intel, позволяет в выборе аппаратных средств для проведения специфичных для нейронных сетей расчетов опираться не только на специализированные аппаратные средства, но и в значительной степени рассчитывать на получение высокоскоростных методов расчетов с использованием универсальных процессоров [66]. 9.2. Специальная программная реализация нейросетевых парадигм на традиционных процессорах Несмотря на привлекательность получения значительного выигрыша в производительности при использовании специализированных аппаратных решений, ориентированных на нейросетевую парадигму, часто разработчику приходится останавливаться на том или ином процессоре традиционной архитектуры из-за весьма высокой стоимости нейросетевых аппаратных средств. В этом случае возникает вопрос, какой же процессор выбрать. При выборе рационального варианта программно-аппаратных средств следует принимать во внимание три основные фактора: быстродействие, стоимость и удобство использования и перепрограммирования. Причем, последний фактор становится в последнее время одним из определяющих, так как алгоритмы обработки информации развиваются очень быстро, и практически ежегодно появляются новые методы, способные обеспечивать намного более высокое качество выходной информации, чем ранее известные. Если до появления универсальных процессоров типа Pentium, (то есть при проведении расчетов на процессорах i3 86/387 или даже i486) сигнальные процессоры имели определяющее преимущество по быстродействию, то в настоящее время, столь однозначно ориентироваться 399
Глава 9 на сигнальные процессоры нет необходимости. Действительно в последнее время даже в некоторых системах реального времени широко используются универсальные процессоры. Однако для успешного применения процессора Pentium важно в максимальной степени использовать особенности его архитектуры [89]. При этом недостаточно использования компиляторов традиционных систем программирования, которые не могут в полной мере использовать его преимущества, необходимо разрабатывать процедуры на ассемблере, ориентированном на используемый процессор или использовать оптимизированные библиотеки таких процедур. Важной особенностью процессора Pentium является его суперскалярная архитектура. При этом сам процессор можно как бы представить в виде двух процессоров, которые при определенных условиях могут функционировать параллельно. Выполнение двух инструкций одновременно обычно называется спаренным выполнением инструкций. Pentium имеет внутреннюю RISC-подобную структуру, следствием которой является деление инструкций на простые типа RISC, которые выполняются в основном за один такт, и на сложные, выполняющиеся за несколько тактов [66]. Pentium является суперскалярным процессором, а это означает, что простые инструкции, такие как чтение и запись в память, работа со стеком, арифметические и логические действия на регистрах, ветвления и вызовы процедур, теперь могут выполняться одновременно с другой инструкцией из этой группы. Время выполнения на Pentium распространенных операций с вещественными операндами радикально уменьшилось. Впервые время выполнения операций с плавающей точкой почти сравнялось со скоростью целочисленных операций, а, например, для операции умножения, даже уменьшилось. Это проиллюстрировано табл. 9.3, в которой перечислены наиболее употребительные вещественные инструкции и их целочисленные аналоги [89]. Таблица 9.3. Время выполнения инструкций для вещественных и целых чисел Вещественная 80486 Pentium Целочисленная 80486 Pentium инструкция инструкция FLD 3 1 MOV eax,memp 1 1 FSUB/FADD 10 3/1 SUB/ADD eax,memp 2 2 FMUL 11 3/1 IMUL eax,memp 42 10 FDIV 73 39 IDIV mem 44 46 FST 7 2 MOV mem,eaxp 1 1 400
Аппаратные и программные акселераторы вычислений,. Исполнительный блок вещественной арифметики процессора Pentium организован, как и его предшественники, по принципу стека, и любая вещественная инструкция использует в качестве одного из операндов вершину стека. Несмотря на такую организацию вещественных регистров, процессор Pentium позволяет осуществить значительную оптимизацию за счет параллельного выполнения инструкций. Одним из принципов оптимизации, кстати, применимым и для процессора 80487, заключается в максимальном использовании инструкций с выталкиванием стека, а также таких операций с двумя операндами из стека, которые записывают результат не в вершину стека. В этом случае следующая инструкция может начать выполнение, не дожидаясь окончания предыдущей. В процессоре Pentium это позволяет достичь очень высокой степени оптимизации. В табл. 9.3 в столбце времени выполнения вещественных операций для процессора Pentium после дробной черты указано время выполнения инструкции при обеспечении независимости от предыдущей команды. В этом случае время выполнения таких наиболее употребительных команд, как сложение, вычитание и умножение, становится равным 1 такту, сравнявшись с их целочисленными аналогами (в случае умножения обогнав в 10 раз). Кроме того, инструкция FXCH, осуществляющая обмен содержимого двух регистров стека, получила особый статус, позволяющий проводить дополнительную оптимизацию. Если FXCH следует непосредственно за одной из большинства инструкций с вещественными операндами, то она выполняется параллельно с этой инструкцией. Теперь содержимое вершины стека не зависит от результата выполнения операции, стоящей перед FXCH, а значит, следующая инструкция может начать работу, не дожидаясь завершения предыдущей пары. Появление процессоров Pentium с технологией ММХ дало новый импульс использованию этой архитектуры при аппаратной реализации нейросетевых парадигм. Сейчас быстродействие последней модификации процессора Pentium ММХ сравнимо с сигнальными процессорами, хотя еще несколько лет назад процессоры фирмы Intel уступали сигнальным процессорам на 1...2 порядка. А уже последние разработки на базе процессоров Pentium с расширением системы команд SSE превосходят сигнальные процессоры по быстродействию при выполнении некоторых задач. Если учесть скорое появление 64-разрядноог процессора фирмы Intel, использование этой архитектуры становится весьма привлекательным. В табл. 9.4, 9.5 приведены временные характеристики процессора Pentium ММХ [89]. 14—5782 401
Глава 9 Таблица 9.4. Выборочные данные по производительности процессора Pentium Функция Время/скорость выполнения процессор Pentium®; данные типа single с плавающей запятой Время/скорость выполнения Pentium® с ММХ™; данные типа integer Единицы Вещественное БПФ, 512 точек 175 75,1 (Fast Mode) мкс Скалярное произв. векторов (64 элем.) 3,973 1,436 тактов/ элемент Квадрат евклидова расстояния, 49 элем. 106 34,2 мкс Умножение на финитную функцию, 512 точек 32,7 9,81 мкс 10 кепстральных коэффициентов, 512 входных точек 923 654 мкс Гауссовы смеси 20эл. х 4 457К 827К гауссиан/с Нейронная сеть с многоуровневым распознающим элементом 155 х 184 х 165 х 16 14,2М 43,ЗМ соединен ./с Таблица 9.5. Выборочные данные по производительности Функция Время/скорость для Pentium® данные типа single Время/скорость для Pentium ММХ данные типа integer Единицы Сложение, 1024 элем. 3,9 0,6 тактов/ элемент Умножение, 1024 элем. 3,9 0,6 тактов/ элемент Минимум из 1024 элем. зд 0,7 тактов/ элемент Кв. корень, 1024 элем. 47,3 9,0 тактов/ элемент Комплексное БПФ, 256 точек 137,8 294,5; 120,2* мкс Окно Хэмминга, 256 эл. 87,3 9,8 мкс Скалярное произв. 1024 элем. 41,0 6,0 мкс Свертка, 32 коэф. х 1024 элем. 1648,0 536,0 мкс * Входной сигнал в диапазоне [+512], максимальная ошибка < 0,1% для БПФ с 256 точками. 402
Аппаратные и программные акселераторы вычислений.. 9.3. Сравнительный анализ производительности программных и аппаратных средств поддержки нейросетевых вычислений Приведенные данные по производительности процессоров Intel позволяют несколько скорректировать (рис 9.3) приведенные выше результаты сравнения производительности различных аппаратных решений, на основе которых могут строиться нейросетевые модели [118; 126]. 4000 3600 Pentium TMS320C62 PA-RISC8500 XCS40XL - 4 XCV100-4 (исп. 90%) (исп. 90%) Рис. 9.3. Сравнительные характеристики различных подходов по производительности (уточнение для процессоров Intel) Преимуществом сигнальных процессоров обычно было наличие специальных библиотек, имеющих высокую степень оптимизации, позволяющих реализовать производительность, близкую к пиковой. Интересно, что наборы библиотек для сигнальных процессоров весьма дороги, часто их стоимость в несколько раз превосходит стоимость самого сигнального процессора или даже комплексного аппаратного решения в виде платы, вставляемой в компьютер. Это понятно, ведь программное обеспечение в этом случае является инструментом разработки технических приложений, но пользователю от этого не легче. Примерно одновременно с выпуском новых 32 разрядных процессоров фирма Intel начала разрабатывать библиотеки обработки данных. Уже выпущено несколько версий следующих библиотек: примитивов распознавания - Recognition Primitives Library (RPL), Natural Signal Processing (NSP), Image Processing Library (IPL), Math Kernel Library (MKL). Каждая из них включает ряд модулей, оптимизированных под каждый из конкретных типов процессоров (Pentium, Pentium II, Pentium III, Pentium IV, IA-64) на уровне ассемблерного кода. Все приведенные утверждения, носят общий характер. Они не учитывают тонких архитектурных особенностей процессоров и полученные на их основе оценки могут в несколько раз отличаться от реаль- 403
Глава 9 ных. Выбор пользователя должен строиться на достоверном сравнении временных характеристик выполнения какой-либо типовой задачи на каждом из процессоров. При этом, однако, следует обеспечить объективность. В литературе существует много противоречивых данных о производительности сигнальных процессоров на конкретных задачах, что связано с различными вариантами их программной реализации. Необходимо проверку быстродействия каждого процессора осуществлять на оптимальном для него программном обеспечении. Наибольшим опытом в оптимизации расчетов на процессорах, несомненно, обладает производитель. Поэтому оценки скорости выполнения вычислений для каждого из процессоров следует брать у их производителя. В качестве характерных задач для сравнения выбраны операции скалярного произведения, широко используемого в нейросетевой технологии, и преобразования Фурье, которое является характерным для сигнальной обработки и сложно для параллелизации. В табл. 9.6 приведены данные производителей о времени выполнения этих задач. Таблица 9.6. Выборочные данные по производительности сигнальных процессоров 1024 Процессоры Тактовая частота, МГц Время такта, не point Dot product 256 point FFT 1024 point FFT Время мкс Кол-во тактов Время мкс Кол-во тактов Время мкс TMS320C30 20 50 60800 3040 TMS320C40 40 25 38945 970 TMS320C6701 167 6 3,2 3696 22 18055 108 TMS320C6201 200 5 2,6 2763 14 13228 66 ADSP-21065L 60 16,7 18221 310 ADSP-21160 100 10 9111 90 Pentium II 233 4,3 3,1 78 390 Pentium III 500 2 1,3 13 70 Неполнота таблицы связана с тем, что производители часто ограничиваются представлением быстродействия только для некоторых задач. Даже при отсутствии части данных сравнение имеющихся показывает, что универсальные процессоры не только не уступают сигнальным процессорам в производительности, но и во многих случаях выигрывают у них. Представляется, что столь часто декларируемое преимущество сигнальных процессоров при аппаратной реализации параллельных вычислений для нейросетевых парадигм во многих случаях оказывается 404
Аппаратные и программные акселераторы вычислений... 405 мнимым, и наиболее рациональным выбором являются универсальные процессоры Intel Pentium II и Pentium III с набором соответствующих библиотек. Появление процессора Intel с 64-разрядной архитектурой и тот факт, что библиотеки обработки данных постоянно расширяются и, скорее всего, достаточно скоро будут способны работать с новыми процессорами, добавляют уверенности в правильности такого выбора. Поэтому предлагается выделить три группы аппаратных средств поддержки нейросетевых вычислений. Специализированные нейросетевые процессоры, обеспечивающие параллельность в несколько сотен раз и выше. Они обеспечивают самый высокий уровень быстродействия, но и являются самыми дорогими. Их использование требует высокой квалификации разработчика в области знания их архитектуры. Программное обеспечение дорого, а возможность расширения используемых нейросетевых парадигм обычно не предусмотрена или сильно ограничена. Универсальные процессоры Intel, AMD, Cyrix, с расширенным набором команд ММХ, 3DNow, SSE, SSE2, SSE3 и др. Эти процессоры обеспечивают пиковый уровень быстродействия (несколько миллиардов оп./с), относительно дешевы (Pentium IV), очень удобны в применении (пользователь работает с привычной системой команд) и имеют удобные библиотеки с богатым набором процедур, позволяющие достаточно быстро и просто разрабатывать разнообразные приложения или применять новые нейросетевые парадигмы. Специализированные сигнальные процессоры, наиболее широко известными производителями которых являются фирмы Texas Instruments, Analog Devices, и др. Эти процессоры имеют примерно такой же, как и в предыдущей группе, уровень быстродействия, но в несколько раз дороже, если рассматривать законченные решения. Так же как и в первой группе, программное обеспечение дороже аппаратной части, и возможность расширения используемых нейросетевых парадигм обычно не предусмотрена или сильно ограничена. При выборе аппаратной реализации нейросетевых архитектур наиболее привлекательной для разработчика является группа универсальных процессоров с использованием специализированных библиотек. Так как среди современных производителей процессоров только Intel имеет столь развитую систему библиотек, естественным выбором исследователя являются процессоры именно этой фирмы. При этом удается обеспечить уровень производительности не хуже, а иногда и лучше, чем у специализированных сигнальных процессоров. Одновременно выбор такого решения исключает необходимость иметь узкого специалиста по аппаратной и программной части продукта выбранной фирмы, который необходим при работе со специализированными процессорами.
Заключение В последние десятилетия стало очевидно, что большинство операций в системах обработки информации должно быть автоматизировано и технологические прорывы предоставляют для этого все условия. Технологическая область задач радиолокации находится на передовом рубеже этих направлений, и разработчики делают попытки применить самые перспективные технологии. Однако алгоритмические возможности отстают от современных требований. Классические методы и алгоритмы основываются на аналитических моделях, использование которых на практике вызывает серьезные сомнения. Там же, где путем приложения больших усилий удается построить модели, адекватные реальным условиям, соответствующие им алгоритмы требуют вычислительных ресурсов, значительно превосходящих возможности аппаратных средств, как современных, так и перспективных на несколько лет вперед. Осуществлять автоматическую обработку информации для сигналов и данных, которые описывают реальные жизненные ситуации, с помощью традиционных подходов весьма трудно. В некоторых системах, работающих на временных шкалах десятков минут и более, возможно с этим бороться, привлекая человека к разрешению сложных ситуаций, что позволяет в некоторой степени скомпенсировать недостатки традиционных систем автоматической обработки данных. Но при уменьшении масштабов времени, до минут и секунд, человек уже не может справляться с большими потоками данных и принимать разумные решения. В этих случаях полная автоматизация и максимальное исключение человека из процессов обработки данных становится просто необходимым. Такое положение складывается в области радиолокации, в первую очередь, при работе по воздушным целям, когда характерные времена обработки составляют секунды, а количество обрабатываемых целей - несколько десятков или даже сотен. С подобными трудностями разработчики сталкиваются там, где ключевой проблемой является обработка информации: в авиации, энергетике, телекоммуникации, медицине, военных приложений, распознаваниях печатных и рукописных символов и многих других. В большинстве из них работу человека стараются свести к минимуму. При этом из-за мощного развития технологий в последнее время ощущается явная нехватка именно человека, особенно квалифицированного. Поэтому все больше приложений разработчики стараются сделать интеллектуальными. 406
Заключение Понятие интеллектуальности имеет глубокие философские корни и весьма неоднозначное толкование среди специалистов. Разногласия в этом вопросе имеются не только между исследователями различного профиля, но и внутри отдельно взятых дисциплин. Однако для многих разработчиков, а также с точки зрения здравого смысла, наиболее приемлемым представляется определение интеллектуальности автоматических устройств как их способности выполнять действия или принимать решения, которые обычно относятся исключительно к человеческой компетенции. В несколько расширительном смысле это определение можно толковать как способность автоматической системы обеспечивать достаточно качественную работу в быстро изменяющихся внешних условиях. Конечно, это очень далеко от философских размышлений о категориях сознания, познания, мышления и других понятий, а также целей биологических наук, направленных на понимание работы нейронных механизмов работы мозга. Ближе всего такой поход к теории адаптации. И не случайно, что классики адаптивных систем, советский академик ЯЗ. Цыпкин и японский ученый Ш. Амари, считающиеся родоначальниками теории адаптации, стояли у истоков теории нейронных сетей. Сейчас, практически во всех приложениях, где заявляется «интеллектуальность», используются нейронные сети, их вариации или алгоритмы, возникшие как развитие нейросетевых (такие, например, как машина опорных векторов SVM). В радиолокации, и других областях, где необходимо обрабатывать данные для того, чтобы обнаруживать появление интересующих пользователя объектов, определять их координаты, анализировать складывающуюся ситуацию, существует много задач, удовлетворительного решения которых пока нет. Для повышения качества решения этих задач могут быть с успехом применены нейросетевые технологии. Основное преимущество нейросетевого подхода заключается в обеспечении адаптивности, способности подстраиваться под широкий диапазон изменения внешних условий, которые не всегда можно описать простыми математическими соотношениями. Именно в способности обеспечить адаптацию к условиям, которые не записаны предварительно в удобной математической форме, а также в существенном использовании нелинейных преобразований, и заключается основное отличие нейронных сетей от классической теории адаптации. В этом источник их преимуществ. Вариантов использования нейросетевых методов в задачах обработки информации существует очень много, и приложенный список литературы охватывает лишь малую часть проводимых исследований. Автор, высказывая свои взгляды на эту проблему, сделал попытку систематизировать разнородные направления исследований, предложить новые методы для решения некоторых наиболее важных задач. 407
Заключение Результаты обработки информации в сложных условиях работы радиолокатора показывают, что добиться существенного улучшения качества удается практически на всех этапах. Рассмотрены этапы: пространственной селекции, первичной (спектральной) обработки, обнаружения радиолокационных целей, вторичной (траекторной) обработки, распознавания целей и ситуаций, анализа обстановки и адаптации. Задачи обработки информации на всех этих этапах требуют безусловной автоматизации. Реальная автоматическая система, уступающая хорошо обученному специалисту, работает на уровне среднего оператора, а при работе в жестких временных ограничениях значительно превосходит как среднего (в 3...10 раз), так и хорошего оператора (в 1,5...3 раза). Однако при работе в сложных условиях (наличие многих целей, воздействие интенсивных и сложных, нестационарных помех) качество выходной информации может резко снижаться, обуславливая энергетические потери 10...20 дБ при увеличении объема ложной информации на 1...2 порядка, что намного хуже требований потребителей информации. Низкое качество обработки объясняется недостаточной производительностью вычислительных средств, а также отсутствием адекватных механизмов описания сложных внешних условий. Это связано с тем, что традиционный подход опирается на целый ряд предположений и упрощений, не выполняющихся на практике, что и ведет к низкой эффективности автоматических систем обработки РЛИ. Для создания систем, способных обеспечивать требуемое качество работы и не снижать его в сложных условиях, целесообразно использовать технологию нейронных сетей. Нейронные сети позволяют строить системы обработки способные обучаться на реальных примерах, адаптируясь к внешним условиям, используя мощные аппаратные средства с массовым параллелизмом. Из всего многообразия применяющихся нейросетевых моделей выбрано три общих направления, каждое из которых включает исходную архитектуру с алгоритмом обучения, а также разнообразные модификации и дополнения этих моделей для обеспечения их эффективного использования в задачах радиолокации. Это многослойные персептроны, ассоциативные сети Хопфилда и самоорганизующиеся карты признаков Кохонена. Проведенный анализ подтвердил возможность и целесообразность использования этих моделей во многих задачах радиолокации. Подробный анализ качества функционирования нейросетевых алгоритмов, так же как и любых других методов, должен строиться на основе единых методологических принципов оценки качества автоматической обработки радиолокационной информации. Поэтому проведен выбор и обоснование системы показателей качества для каждого этапа обработки радиолокационной информации. Эти показатели вытекают из требований, которые предъявляют потребители. 408
Заключение Качество на всех этапах обработки радиолокационной информации: пространственная селекция, первичная (спектральная) обработка, обнаружение радиолокационных целей, вторичная (траекторная) обработка, распознавание целей и ситуаций, анализ обстановки и адаптация, может оцениваться информационными показателями полноты и достоверности. Понятие достоверности включает в себя безошибочность, корректность и актуальность информации. Проведенный анализ задач, решаемых на этих этапах, показал, что, в условиях множественных целей, воздействия интенсивных и сложных, нестационарных помех, резко снижается качество работы, обуславливая энергетические потери 10...20 дБ при увеличении объема ложной информации на 1...2 порядка. Для снижения этих потерь в обстановке, характерной для современных радиолокаторов, предложены нейросетевые архитектуры. Рассмотрены методы селекции радиолокационной информации в пространственной, временной и спектральной областях. Показана возможность нейросетевого представления известных методов фильтрации и получения на основе применения теории нейронных сетей алгоритмов адаптации линейных и нелинейных фильтров, которые имеют ряд преимуществ по сравнению с традиционными. Для успешной работы радиолокационных станций большое значение имеет формирование диаграммы направленности антенны. С ее помощью происходит пространственная селекция принимаемых и излучаемых сигналов. От качества ее формирования во многом зависит помехозащищенность станции, ее точностные характеристики. Для обеспечения эффективной пространственной селекции целей и снижения влияния помех на последующие этапы обработки РЛИ необходимо снижать уровень боковых лепестков. Традиционные методы весового взвешивания в антенных решетках используют жестко заданные весовые окна, рассчитанные на эквидистантные решетки и предполагают амплитудное изменение сигнала, что ограничивает их применение. Использование нейросетевого представления фазированной антенной решетки в виде двухслойного персептрона позволяет использовать богатый арсенал методов обучения нейронных сетей для адаптации весовых векторов и снижения уровня боковых лепестков. Проведенные расчеты на созданной автором модели показали, что на нейросетевой основе удается добиться уровня боковых лепестков на 10... 15 дБ ниже, чем в других методах: неэквидистантных решеток, фазовом взвешивании, дискретном фазовом взвешивании - а, следовательно, повысить помехозащищенность локаторов. Спектральная обработка радиолокационной информации предназначена для согласованного приема радиолокационных импульсов, от- 409
Заключение раженных от воздушных целей, подавления активных и пассивных помех, улучшения отношения сигнал/шум. Она содержит в очень широкий комплекс проблем. Столь же широкими могут быть возможности использования нейронных сетей в этом виде обработки. Методы синтеза антенных решеток напрямую применимы для спектральной обработки, так как здесь используются функции взвешивания (в том числе и комплексные) и их адаптация к переменным внешним условиям. Традиционная спектральная обработка предполагает проведение вычислительных операций, сходных по своей структуре с нейросетевы- ми алгоритмами. Реализация их на нейросетевых аппаратных средствах позволит на 1...2 порядка повысить быстродействие за счет использования параллельной обработки. Нейросетевые методы используются для решения в реальном масштабе времени трудных вычислительных задач для традиционной спектральной обработки, например обращение ковариационной матрицы. В сложных непредсказуемых условиях, при воздействии нестационарных и негауссовых помех использование нелинейной нейросетевой обработки с пороговыми и линейно-пороговыми функциями активации позволяет осуществлять подавление интенсивных помех, сохраняя требуемый уровень сигнала. Качество спектральной обработки обычно оценивается уровнем боковых лепестков двухмерной автокорреляционной функции по дальности и по доплеровской частоте (скорости). Снижения уровня боковых лепестков неоднозначного измерения скорости и дальности можно добиться путем использования сигналов разных типов, импульсного и квазинепрерывных с пороговой обработкой, которая фактически является нейросетевым алгоритмом. Улучшить свойства автокорреляционной функции можно перейдя к длинным многобазовым сигналам с фазо-кодовой импульсной модуляцией, имеющим базу 103...104. Синтез таких сигналов, представляющий собой задачу дискретного программирования высокой размерности проводится с помощью генетических алгоритмов. Сама структура сигналов рассматривается как генотип, а в качестве операторов мутаций используются добавление одного импульса, исключение или его сдвиг. С помощью генетического программирования синтезируют многобазовые сигналы с максимальным уровнем боковых лепестков двухмерной автокорреляционной функции от -25 до -35 дБ в зависимости от базы сигнала и размера рабочей области, что на 10... 15 дБ меньше, чем при использовании случайных кодов. Одной из наиболее важных среди задач радиолокации является задача собственно обнаружения целей, в которой на основе принятых локатором сигналом после их фильтрации принимается решение о наличии цели. Именно на этом этапе начинают проявляться наибольшие 410
Заключение трудности автоматизации процессов обработки РЛИ. Сложности возникают и при проведении теоретического анализа используемых алгоритмов автоматического обнаружения целей. Для оценки качества алгоритмов необходимо оценивать уровни ложных тревог КГ6 и менее, что требует привлечения специальных методов построения достоверных оценок малых вероятностей статистическими процедурами. Традиционные методы обнаружения радиолокационных целей с адаптивным порогом не способны обеспечить требуемого качества работы. При наличии целей в группах вероятности их обнаружения снижаются, обуславливая энергетические потери 10...20 дБ. Уровень ложных тревог в нестационарных помехах возрастает на несколько порядков. Другие известные традиционные методы автоматического обнаружения: ранговые алгоритмы, знаковые корреляторы, алгоритмы с проведением анализа помех, также как и различные модификации адаптивного порога, не способны в полной мере преодолеть все недостатки, присущие традиционному автоматическому обнаружению. Они имеют недопустимо высокие энергетические потери при обнаружении целей в группах или недопустимо высокий уровень ложных тревог в нестационарных помехах. Для обеспечения минимально приемлемого качества автоматического обнаружения необходимо объединить преимущества ранговых алгоритмов и адаптивного порога в виде процедуры, которая является приближением оптимального алгоритма. Обеспечиваемые этой процедурой энергетические потери при обнаружении четырех целей составляют 5...6 дБ, а уровень ложных тревог в хаотических импульсных помехах увеличивается по сравнению с установленным не более чем на порядок. При аппаратной реализации предложенной процедуры для проведения сортировки, наиболее трудоемкой вычислительной операции, целесообразно использовать нейросетевые алгоритмы и методы: многослойный персептрон с жестко заданными весами, сеть MaxNet с латеральными связями, сеть Кохонена. Для осуществления полностью нейросетевого механизма автоматического обнаружения необходимо изменить алгоритмы обучения с целью обеспечения заданного уровня ложных тревог, сохранения оптимальности выходов сети в области малых плотностей появления сигнала, выбора наиболее неблагоприятных помеховых условий. Предложенный алгоритм обучения многослойного персептрона на основе метода существенной выборки позволяет обеспечить высокий уровень аппроксимации в требуемых областях признакового пространства с малыми вероятностями попадания сигналов, что подтверждается доказанной теоремой, а вариант обучения нейронной сети с автоматической подстройкой значимости ошибок первого и второго рода, позволяет обеспечить выполнение критерия Неймана-Пирсона. 411
Заключение Для успешной работы в условиях разнотипных помех необходимо выбрать наиболее неблагоприятные и для них оптимизировать работу обнаружителя. Конкретный выбор наиболее неблагоприятных распределений зависит от характера решающей области и осуществляется динамически в ходе процесса обучения. Разработанный метод выбора наиболее неблагоприятных распределений в ходе обучения нейронной сети позволяет обеспечить оптимальность свойств получаемого обнаружителя для помех с наибольшим уровнем ложных тревог и, следовательно, может гарантировать эффективную работу во всем множестве помеховых условий, заданных при обучении. Обнаруженные отметки от целей используются для анализа радиолокационной информации. Анализ проходит в несколько этапов, первым из которых является вторичная (траекторная) обработка. В процессе этой обработки осуществляется формирование и сопровождение траекторий обнаруженных целей. Традиционные алгоритмы формирования траекторий синтезированы в предположении выполнения определенных допущений. Основными из них являются прямолинейное равномерное движение целей и их достаточная удаленность друг от друга, т.е. отсутствие пересечений стробов завязки и сопровождения для различных целей. В случае выполнения в реальных условиях допущений, принятых при их синтезе, традиционные алгоритмы обеспечивают близкие к оптимальным точности и вероятности сопровождения целей. При наличии групп целей, их интенсивном маневрировании, нельзя ожидать выполнения указанных допущений. Поэтому традиционные алгоритмы реализуют в этих условиях эффективность, намного хуже ожидаемой. Наибольшие сложности вызывает сопровождение групп целей. При характерных расстояниях между целями в группах и размерах стробов, стробы траекторий различных целей многократно пересекаются, что во многих случаях приводит к неправильной идентификации отметок и как следствие, к размножению отметок и снижению достоверности выходной информации. Число ложных траекторий, отличающихся от истинных по параметрам движения, составляет в среднем 2...5, а оценка числа целей в зоне отличается от истинной в 2...4 раза. Основная трудность траекторной обработки, неоднозначность отождествления отметок на последовательных обзорах, может быть успешно преодолена с помощью предложенного варианта ассоциативной памяти, который позволяет воспроизводить запомненный образ группы при ее произвольном перемещении, требуя при этом на несколько порядков меньшей мощности вычислительных средств, чем традиционная модель Хопфилда. Воспроизведение на последующих обзорах отметок, запомненных на предыдущем обзоре с помощью сети Хопфилда, позво- 412
Заключение ляет провести достоверное отождествление и сформировать траектории целей уже на первых обзорах после их появления. Ассоциативное воспроизведение отметок позволяет использовать виртуальные отметки при формировании и сопровождении траекторий, обеспечивая повышение точностей определения координат в 1,5...2 раза и вероятностей поступления данных о целях на систему траекторной обработки, что можно оценить энергетическим выигрышем в 2...3 дБ. По показателям вероятности установления правильных соответствий, вероятности формирования траекторий групп целей, среднему количеству ложных траекторий, ошибкам определения координат предложенный алгоритм превосходит традиционные алгоритмы. Заключительными этапами обработки радиолокационной информации являются этапы анализа обстановки, включая распознавание целей, комплексирование информации от различных источников, выбор наиболее значимых целей. Первой стадией собственно анализа обстановки является распознавание классов целей. При распознавании используются спектральные и траекторные признаки целей. Возможно также использование признаков, задаваемых в нечеткой форме. Нейронные сети позволяют успешно решать задачи распознавания за счет способности обучаться и аппроксимировать оптимальные разделяющие поверхности, а также эффективного представления в признаковом пространстве нечетких признаков. Успешность применения нейронных сетей в задачах распознавания целей подтверждается многочисленными примерами, описанными в литературе, где показано, что в трудных случаях распознавания, когда вероятности правильного распознавания обычными методами опускаются ниже 0,4...0,6, использование нейронных сетей позволяет повысить вероятности до 0,8...0,9. Дополнительного повышения качества выдаваемой потребителю информации можно добиться за счет комплексирования наблюдений от нескольких источников. При объединении информации от нескольких источников точности определения координат целей могут быть повышены в два и более раз, повышая вероятность обнаружения целей, обеспечивая энергетический выигрыш в несколько раз. Реализовать улучшение качества выдаваемой информации от нескольких источников можно только в случае правильной идентификации отметок, получаемых различными локаторами. Отождествление информации от нескольких источников осуществляется с использованием кластеризации на основе сетей Кохонена.. При обработке информации одним из наиболее важных является заключительный этап принятия решений, когда наиболее затруднена формализация и автоматизация. Высокая степень ответственности принимаемых решений и отсутствие математического аппарата корректно и 413
Заключение адекватно описывающего механизмы приводит к необходимости принятия решений человеком. Предложено для автоматических систем поддержки принятия решений использовать комбинированный подход. Сначала создается упрощенная модель принятия решений человеком. Затем модель обучается на относительно небольшом количестве примеров, модифицируя свои параметры, на основе нейросетевых алгоритмов. Проведенные тесты показали, что число ошибочных решений системы после обучения снижается в два раза. Таким образом, использование нейросетевых технологий позволяет реально повышает качество обработки радиолокационной информации в наиболее сложных условиях, требующих новых нелинейных методов или высокой вычислительной мощности. Проведенный анализ предложенных нейросетевых методов позволил оценить ожидаемый прирост эффективности от применения этих методов. Это позволило наметить перспективы использования нейросетевой обработки РЛИ. Концепция поэтапного внедрения технологий нейронных сетей в практику обработки радиолокационной информации, предусматривает постепенное наращивание уровня нейросетевых методов в системах обработки. Процесс внедрения нейросетевых методов в обработку РЛИ будет последовательно проходить в несколько этапов. 1. Применение нетрадиционных нейросетевых методов решения вспомогательных задач, ведущих к повышению эффективности традиционных методов. 2. Использование параллельных нейросетевых аппаратных средств, для традиционных и новых алгоритмов обработки РЛИ. 3. Создание нейросетевых методов полного решения задач обработки РЛИ. 4. Разработка комплексных нейросетевых систем обработки РЛИ, использующих лучшие нейросетевые алгоритмы и аппаратные средства. При практической реализации нейросетевых устройств встает вопрос о конкретных вычислительных системах, на которых будут выполняться нейросетевые алгоритмы. Здесь может быть два подхода: использование специализированных аппаратных средств, в которых заложены возможности параллелизации вычислений и использование универсальных процессоров типа Pentium, технологиями ММХ, SSE, позволяющими достигать параллельности в 8, 16 раз. При выборе аппаратной реализации нейросетевых архитектур наиболее привлекательной для разработчика являются универсальные процессоры. За счет использования в них технологий внутренней параллельности удается обеспечить уровень производительности не хуже, чем у специализированных средств. При возможности проведении ос- 414
Заключение новной части вычислений в лабораторных условиях, такой выбор является предпочтительным. Среди специализированных аппаратных средств, необходимых при выполнении скоростных вычислений на борту, наиболее привлекательными являются средства на основе ПЛИС и нейропроцессора NeuroMatrix фирмы Модуль, быстродействие которых на один-два порядка выше, чем у доступных вычислителей. Использование нейросетевых технологий способно повысить качество обработки радиолокационной информации в наиболее сложных условиях, требующих высокой вычислительной мощности, когда динамика изменения внешних условий очень высока и традиционные подходы к созданию систем обработки не способны обеспечить требуемый уровень эффективности. Для каждого из рассмотренных этапов обработки РЛИ предложены конкретные методы нейросетевой реализации сложных, критических задач обработки. Конечно, большая часть описанных методов является не законченным решением, а, скорее, прототипом, описывающим направление, по которому можно осуществлять построение рационального решения. Однако ожидаемый эффект весьма существенен и стоит затраченных для его получения усилий. Следует, однако, иметь в виду, что нейросетевые технологии не «волшебная палочка», способная без проблем решить любые задачи только за счет того, что заявляется аналогия функционирования нейросетевых алгоритмов с работой человеческого мозга, тем более, что эта аналогия - совсем не близкая. В совсем новых областях, где еще нет математической теории, с помощью нейронных сетей удается создать весьма работоспособное решение, что является, само по себе очень впечатляющим результатам. Так же обстоят дела и в областях, где решения существуют, но не устраивают пользователя по причине низкой эффективности, вычислительной сложности, дороговизны. Там тоже часто первые очевидные шаги в применении нейросетевых технологий могут предложить успешные решения. Но последующие продвижение вперед становится все труднее, требует глубокого анализа особенностей применения различных нейросетевых архитектур, тонкостей, вытекающих из характера рассматриваемой предметной области. В общем, как и в других сферах разработки, для нейронных сетей справедливо известное правило: каждый следующий шаг к улучшению качества системы дается ценой намного больших усилий, чем предыдущий. Правда, здесь эти шаги имеют целый ряд общих черт для различных предметных областей, что позволяет надеяться на более эффективное продвижение в качестве обработки информации, чем, работа в каждой из областей изолированно. 415
Заключение Важно отметить следующий аспект, имеющий ключевое значение для последующих исследований. Практически все известные в настоящее время нейросетевые подходы во всех приложениях, в том числе и в радиолокации, хотя и позволяют добиться некоторого минимально необходимого уровня качества обработки, но не способны обеспечить максимальную гибкость адаптации и устойчивость к изменениям внешних условий в широких пределах, так, как это умеет делать человек. Существует необходимость совершения следующего шага, аналогичного тому, который был сделан при переходе от традиционной теории адаптации линейных систем к нейронным сетям - системам существенно нелинейным. Содержание этого шага пока не совсем понятно. Одним из возможных подходов может быть более глубокое изучение работы биологических нейронных сетей, возможны и другие подходы. Основной целью развития адаптивных систем является обеспечение способности успешно функционировать и решать поставленные задачи в неизвестных условиях с высокой степенью неопределенности. При этом уровень неопределенности может быть очень высоким и часто не может быть сформулирован в простом параметрическом виде, - в реальных приложениях очень мало. Неизвестными оказываются сами законы изменения существенных факторов, способы поведения исследуемых систем, характер их реагирования на изменяющиеся внешние условия. Особенно существенным правильный учет уровней неопределенности и выбор адекватных механизмов адаптации оказываются для систем, работающих при противодействии противника или злоумышленника. В ближайшем будущем можно ожидать появления методов интеллектуальной обработки информации, в том числе радиолокационной, которые будут основаны на более глубоких аналогиях с работой биологических нейронных сетей, использовать в своей работе новые принципы и окажутся способны в большей степени реализовывать адаптивность к самым широким диапазонам изменения внешних условий. 416
Литература 1. Абанин В.В., Панкратов Ю.Г. Цифровая обработка радиолокационной информации на фоне негауссовских помех // DSPA-1998 т. III. с. 25-28. 2. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мегиалкин Л Д. Прикладная статистика: Классификация и снижение размерностей / Справочное издание под ред. С.А. Айвазяна. М.: Финансы и статистика, 1989. 607 с. 3. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998. 1022 с. 4. Акимов П.С, Розанов Б.А., Власов КБ. и др. Теория обнаружения сигналов / Под ред. П.А. Бакута. М.: Радио и связь, 1984. 440 с. 5. Альсведе Р., Вегенер И. Задачи поиска / Пер. с нем. В.А. Душского. М.: Мир, 1982. 6. Анохин В.В., Ланнэ A.A. MATLAB для DSP. ChipNews, 2000-2001. 7. Арбиб М. Метафорический мозг. Пер. с англ. Серия "Науки об искусственном". М.: Едиториал УРСС, 2004. 304 с. 8. Аряшев СИ., Бобков С.Г., Сидоров Е.А. Параллельный перепрограммируемый вычислитель для систем обработки информации и сигналов // Нейроинформатика-99. Сб. трудов. М. МИФИ, 1999, ч.2, с. 25-33. 9. Аткинсон Р. Человеческая память и процесс обучения. М. Мир, 1980. 528 с. 10. Бакулев П.А., Степин В.М. Методы и устройства селекции движущихся целей. М.: Радио и связь, 1986. 288 с. 11. Башкиров Л.Г., Саблин В.Н., Чапурский В.В., Шейко А.П. Радиолокационное распознавание воздушных объектов по радиоакустическим спектральным портретам с использованием обучаемых нейронных сетей // Полет. №8. 2002. 12. Безкоровайный М.М., Костогрызов А.И., Львов В.М. Инструментально- моделирующий комплекс для оценки качества функционирования информационных систем "КОК"©: Руководство системного аналитика. М.: Вооружение. Политика. Конверсия, 2001. 303 с. 13. Беркович Г.М. Двухэтапная процедура моделирования алгоритмов обнаружения с постоянной частотой ложных тревог // 6-я Межд. науч.-техн. конф. "Радиолокация, навигация, связь", Воронеж. 25-27 апр., 2000. Т. 1, с. 73-79. 14. Букатова И.Д. Эволюционное моделирование: идеи, основы теории, приложения. М.: Знание, 1981.64 с. 15. Вайнцвайг М.Н., Диментман A.M. Ассоциативное запоминающее устройство с расширенными функциональными возможностями // Вопросы кибернетики. М. Сов. радио, 1979, Вып. 49. с. 120-126. 16. Вакман Д.Е. Вопросы синтеза радиолокационных сигналов. М.: Сов. Радио, 1973. 328 с. 17. Варакин Л.Е. Теория систем сигналов. М.: Сов. радио, 1978. 304 с. 18. Васин В.И., Якушев ДЖ. Применение нейронных сетей для решения задач управления ФАР // IV Всероссийская конференция "Нейрокомпьютеры и их применение". Сб. докладов. М.: Радио и связь, 1998. 19. Вопросы перспективной радиолокации (учебное пособие) / Под ред. А.В.Соколова. ИПРЖР, 2002. 20. Галушкин А.И. Нейрокомпьютеры (Нейрокомпьютеры и их применение. Кн. 3). М.: ИПРЖР, 2000. 528 с. 21. Галушкин А.И. Нейрокомпьютеры в разработках военной техники США (обзор по материалам открытой печати) // Зарубежная радиоэлектроника. М.: Радиоэлектроника, 1995, №5. 22. Галушкин А.И. О решении задач сортировки с использованием нейронных сетей // Нейрокомпьютер. 1994. № 3,4 23. Галушкин А.И. Синтез многослойных нейронных сетей распознавания образов. М.: Энергия, 1974. 417
Литература 24. Галушкин A.M. Теория нейронных сетей (Нейрокомпьютеры и их применение. Кн. 1). М.:ИПРЖР, 2000.416 с. 25. Галушкин А.И., Кудрявцев A.M. Обращение матрицы с помощью многослойной системы из пороговых элементов // Кибернетика и вычислительная техника. Киев: Наукова думка, 1976, вып. 33. 26. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М.: Мир, 1985. 509 с. 27. Головко В. А. Нейронные сети: обучение, организация и применение. М.: ИПРЖР, 2001.256 с. 28. Горбань А.Н. Обучение нейронных сетей. М.: СП Параграф, 1990. 29. Горбань А.Н., Дунин-Барковский В.Л., Кирдин А.Н. и др. Нейроинформатика. Новосибирск: Наука. Сибирское предприятие РАН, 1998. 296 с. 30. Горбань А Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996. 276 с. 31. Горбаченко В.И. Нейросетевые алгоритмы определения собственных векторов и чисел матриц // Нейрокомпьютеры: Разработка и Применение, 2001. № 3. 32. Горин СВ. Тандоев А.Ю. Применение CASE-средства Erwin 2.0 для информационного моделирования в системах обработки данных. СУБД, 1995, №3. 33. ГОСТ Р ИСО 9000 - 2001. Системы менеджмента качества. Основные положения и словарь. 34. ГОСТ Р ИСО/МЭК 15288-2005 - Информационная технология. Системная инженерия. Процессы жизненного цикла систем, 57 с. 35. ГОСТ РВ 51987 - 2002. Информационная технология. Комплекс стандартов на автоматизированные системы. Типовые требования и показатели качества функционирования информационных систем. Общие положения. 2002. 36. Дантеман Д., МишелД, ТэйлорД. Программирование в среде DELPHI (DELPHI explorer). Киев: Диасофт, 1995. 586 с. 37. Дрогалин В.В., Ильчук А.Р., Канащенков А.К, Меркулов В.И., Ощепков А.А., Резник В.И., Родзивилов В.А., Самарин О.Ф., Слукин Г.П., Федоров И.Б., Францев В.В., Чернов B.C., Шабашура Ю.М., Шуклин A.M. Помехоустойчивые алгоритмы вторичной обработки информации в бортовых РЛС при автоматическом сопровождении целей в режиме обзора // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники, 2002, № п. 38. Душков Б.А. и др. Основы инженерной психологии. М.: Высшая школа, 1986. 448 с; 39. Дьяконов В.. MATLAB 6/6.1/6.5 + Simulink 4/5. Основы применения. Полное руководство пользователя. Солон-Пресс, 2002. 40. Ермаков СМ., Михайлов Г.А. Статистическое моделирование. М.: Наука, 1982. 296 с. 41. Забродин Ю.М., Фриишан Е.З., Шляхтин Г. С. Решение сенсорных задач человеком. М., 1982. 42. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. 165 с. 43. Заде Л.А. Размытые множества и их применение в распознавании образов и кластер- анализе. В кн.: Классификация и кластер / Под ред. Дж.Вэн Райзина. М.: Мир, 1980. С.208-247. 44. Залмазон Л.А. Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях. М.: Наука, 1989. 496 с. 45. Интеллектуальные процессы и их моделирование. М.: Наука, 1987. 398 с. 46. Искусственный интеллект. В 3-х кн. Кн.2. Модели и методы: справочник / Под ред. Д.А. Поспелова. М.: Радио и связь, 1990. 304 с. 47. Мстратов А.Ю., Мельник А.В., Глебачев Ю.М., Грибков В.Ф. Нейросетевая система анализа данных бортового радиолокатора // Изв. вузов. Приборостр. 1997. 48. Мстратов А.Ю., Мельник А.В., Грибков В.Ф. Эмпирический нейроалгоритм обработки радиолокационной информации // V Всерос. конф. "Нейрокомпьютеры и их применение". Сб. докладов. М.: Радио и связь, 1999. 418
Литература 49. Каллан Р. Основные концепции нейронных сетей = The Essence of Neural Networks First Edition. 1-е. «Вильяме», 2001, 288 с. 50. Каляев A.B., Чернухин Ю.В. Цифровые нейропроцессоры и нейропроцессорные сети // Нейрокомпьютеры: Разработка и Применение, 2001. № 7-8. 51. Канащенков А.И. Защита радиолокационных систем от помех (состояние и тенденция развития). М.: Радиотехника, 2003. 416 с. 52. Капитанов В.Д., Мистюков ВТ. Построение на ПЛИС фирмы ХШпх высокопроизводительных нейронных сетей. Scan Engineering Telecom, 1999. 53. Карелов И.Н. Реализация алгоритмов цифровой обработки сигналов на основе ней- роподобной сети // Нейрокомпьютеры: Разработка и Применение. 2000. № 1. С. 54- 59. 54. Кирсанов Э.Ю. Цифровые нейрокомпьютеры: Архитектура и схемотехника / Под ред. А.И.Галушкина. Казань: Казанский Гос. У-т, 1995. 131 с. 55. Колмогоров А.Н. О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения // Докл. АН СССР, 1957, т.114, N5, с. 953-956. 56. Конопелъко В.К, Юрцевич Д.М., Юрцевич М.М. М-подобные нелинейные последовательности с идеальными автокорреляционными свойствами // DSPA-98, т.П. М.: ИПРЖР, с. 35-41. 57. Костогрызов А.И. Моделирование информационных систем - для обеспечения эффективности современного вооружения // Вооружение. Политика. Конверсия, 2002, №2. С. 31-35. 58. Костогрызов А.И, Петухов А.В., Щербина A.M. Основы оценки, обеспечения и повышения качества выходной информации в АСУ организационного типа. М.: Вооружение. Политика. Конверсия, 1994. 278 с. 59. Кохонен Т. Ассоциативная память. М.: Мир, 1980. 239 с. 60. Круглое В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2001. 382 с. 61. Круглое В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и искусственные нейронные сети. М., 2001.-224 с. 62. Кузьмин С.З. Основы проектирования систем цифровой обработки радиолокационной информации. М.: Сов. радио, 1986. 346 с. 63. Кузьмин С.З. Основы цифровой обработки радиолокационной информации. М.: Сов. радио, 1974. 432 с. 64. Кузьмин С.З. Цифровая обработка радиолокационной информации. М.: Сов. радио, 1967. 400 с. 65. Кук Ч, Бернфельд М. Радиолокационные сигналы / Пер. с англ. под ред. В.С.Кельзона. М.: Сов. радио, 1971. 568 с. 66. Куприянов М.С., Петров Г.А., Пузанков Д.В. Процессор Pentium: Архитектура и программирование. СПб., 1995. 67. Куссулъ Э.М. Ассоциативные нейроподобные структуры. Киев, Наукова думка, 1990. 68. Ланнэ А.А. Нейронные цепи и синтез нелинейных операторов обработки сигналов // DSPA-2002.T. 1. 69. Левин Б.Р. Теоретические основы статистической радиотехники в 3-х кн. Кн.З. М.: Сов. радио, 1976. 285 с. 70. Левин Б.Р. Теоретические основы статистической радиотехники. 3-е изд. перераб. и доп. М.: Радио и связь, 1989. 656 с. 71. Леман Э. Проверка статистических гипотез / Пер. с англ. Ю.В. Прохорова. М.: Наука, 1964. 512 с. 72. Леман Э. Проверка статистических гипотез / Пер. с англ. Ю.В. Прохорова. М.: Наука, 1979. 408 с. 73. Леухин А.Н., Роженцов А.А. Метод синтеза сложных сигналов по функции неопределенности // DSPA-98 т. III. М.: ИПРЖР, с. 90-97. 419
Литература 74. Линдсей П., Норман Д. Переработка информации у человека. - Пер с англ. М.: Мир, 1974. 550 с. 75. Маккалох Дж., Питтс У. Логические исчисления идей, относящихся к нервной деятельности // Автоматы. М.: ИЛ, 1956. 76. Марпл-мл. СЛ. Цифровой спектральный анализ и его приложения. М.: Мир, 1990. 584 с. 77. Мартыщенко Л.А., Панов В.В., Фшюстин А Е. Методы военно-научных исследований в задачах разработки и испытаний вооружений. МО СССР, 1985. 78. Мелихов А.Н., Бернштейн Л.С, Коровин СЯ. Ситуационные советующие системы с нечеткой логикой. М.: Наука, 1990. 79. Минский М., Пейперт С. Персептроны. М.: Мир, 1971. 80. Миркес Е.М. Нейрокомпьютер. Проект стандарта. Новосибирск: Наука, 1998. 188 с. 81. Миркес Е.М. Учебное пособие по курсу Нейроинформатика. Красноярск, 2002. 82. Мистюков В.Г. Проектирование высокопроизводительных параллельных устройств на базе ПЛИС XILINX большой интеграции // V Всероссийская конференция "Нейрокомпьютеры и их применение". Сб. докладов. М.: Радио и связь. 1999. 83. Мозинго Р.А., Миллер Т.У. Адаптивные антенные решетки: введение в теорию: Пер. с англ. М.: Радио и связь, 1986. 448 с. 84. Морская радиолокация / Под ред. Винокурова В.И. Л.: Судостроение, 1986. 85. Небабин В.Г., Сергеев В.В. Методы и техника радиолокационного распознавания. М.: Радио и связь, 1985. 82 с. 86. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, Е.М. Миркес и др. Новосибирск: Наука, Сибирское предприятие РАН, 1998. 296 с. 87. Нейроматематика. Книга 6: Учебное пособие для вузов / Агеев А.Д., Балухто А.Н., Бычков А.В. и др.; Общая редакция А.И. Галушкина. М.: ИПРЖР, 2002. 448 с. 88. Никифоров А.Ф., Уваров В.Б. Специальные функции математической физики. М.: Наука, 1978. 320 с. 89. Округ А. Как программировать для Pentium: советы программиста // Технологии программирования, 1995, № 1, с. 129-138. 90. Палей А.И. Радиоэлектронная борьба. М.: Воениздат, 1981. 320 с. 91. Панов В.В. Некоторые проблемы геополитики и строительства Вооруженных Сил и их влияние на развитие вооружения и военной техники // Актуальные проблемы развития вооружения-2000. Вооружение. Политика. Конверсия, 2000, с. 18-26. 92. Панов В.В. О методических подходах к комплексному обоснованию и оценке вооружения и военной техники // Вооружение. Политика. Конверсия, 2002, №1, с. 3-5. 93. Пахолков Г.А., Кашинов В.В. Вариационный метод синтеза сигналов и фильтров, М. Радио и связь, 1981. 94. Перов А.И. Оптимальный алгоритм дискретного сопровождения многих целей с идентификацией измерений // Радиотехника, №1, 2003. 95. Перов А.И., Соколов Г.Г. Сравнительный анализ нейросетевых и статистических алгоритмов в задачах обнаружения сигналов // DSPA-2002 т. 2. М.: ИПРЖР. 96. Петухов СИ., Степанов А.Н. Эффективность ракетных средств ПВО. М.: Воениздат, 1976. 104 с. 97. Петухов СМ., Шестов И.В. История создания и развития вооружения и военной техники ПВО сухопутных войск России. ВПК. 1999. 98. ПЛИС фирмы Xilinx: семейство SpartanTM-II // "Компоненты и технологии" № 3 2001. 99. Попов Г.П. Инженерная психология в радиолокации. М.: Сов. радио, 1971. 143 с. 100. Попов Э.В. Экспертные системы. М.: Наука, 1987. 101. Прангишвили И.В., Попова Г.М., Смородинова ОТ., Чудин А.А. Однородные микроэлектронные ассоциативные процессоры. М.: Сов. радио, 1973. 102. Прибрам К. Языки мозга: Пер с англ. М.: Прогресс, 1975. 463 с. 103. Применение цифровой обработки сигналов / Под ред. Э. Оппенгейма. М.: Мир, 1980. 552 с. 420
Литература 104. Психические состояния и эффективность деятельности / Под ред. Ю.М. Забродина. М., 1983. 105. Радиолокационные системы: Основы построения и теория. Справочник / Под ред. Я.Д. Ширмана. М.: ЗАО "МАКВИС", 1998. 828 с. 106. Разевиг В.Д., Лаврентьев Г. В., Златин И. Л. System View - средство системного проектирования радиоэлектронных устройств. Горячая Линия - Телеком, 2002. 352 с. 107. Репин ВТ., Тартаковский Г.П. Статистический синтез при априорной неопределенности и адаптации информационных систем. М.: Сов. радио, 1977. 432 с. 108. Розенблат Ф. Аналитические методы изучения нейронных сетей // Зарубежная радиоэлектроника. 1965, № 5, с. 40-50. 109. Розенблат Ф. Принципы нейродинамики. М.: Мир, 1965. ПО. Ручкин В.Н., Григоренко Д.В. Мультипроцессорные системы цифровой обработки сигналов // DSPA-2000 т. 3. 111. Соболь ИМ. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с. 112. Соболь ИМ. Численные методы Монте-Карло. М.: Наука, 1973.312 с. 113. Современная радиолокация / Под ред. Ю.Б. Кобзарева М.: Сов. радио, 1969. 114. Сосулин ЮТ. Теория обнаружения и оценивания стохастических сигналов. М.: Сов. радио, 1963. 115. Справочник по радиолокации в 4-х т. / Под ред. М.Сколника; Пер. с англ. под ред. К.М.Трофимова. М.: Сов. радио, 1976. Т.1. 456 с. 116. Тарков М.С. Нейрокомпьютерные системы БИНОМ. Лаборатория знаний, Интернет-университет информационных технологий - ИНТУИТ.ру, 2006 117. Татузов А.Л. Анализ возможностей использования нейронных сетей для решения задач обработки радиолокационной информации // V Всероссийская конференция "Нейрокомпьютеры и их применение". Сб. докладов. М.: Радио и связь, 1999. с. 17- 21. 118. Татузов А.Л. Выбор аппаратной реализации параллельных вычислений для нейросетевых парадигм // VI Всероссийская конференция "Нейрокомпьютеры и их применение". Сборник докладов. М.: ИПРЖР, 2000. с. 24-29. 119. Татузов А.Л. Использование ассоциативной памяти для идентификации отметок при траекторной обработке многих целей / Нейрокомпьютер, 1998, № 1-2, с. 35-46. 120. Татузов А.Л. Использование нейросетевых методов для оптимизации антенн ФАР // Всероссийская научно-техническая конференция "Нейроинформатика-99". Сборник научных трудов. Ч. 3. МИФИ. 1999. с. 268-272. 121. Татузов А.Л. Моделирование смешанных распределений случайных величин // Вооружение. Политика. Конверсия. №1. Приложение. 2002. с. 118-127. 122. Татузов А.Л. Нейросетевой метод объединения информации, получаемой от различных сенсорных источников // VIII Всероссийская конференция "Нейрокомпьютеры и их применение". Сборник докладов. М.: ИПРЖР, 2002. с. 67-71. 123. Татузов А.Л. Нейросетевые методы снижения уровня боковых лепестков в фазированных антенных решетках // Известия Академии наук. Теория и системы управления, МАИК "Наука / Интерпериодика", т. 38, № 5. с. 828-833. 124. Татузов АЛ. Нейросетевые модели обработки радиолокационной информации // Вооружение. Политика. Конверсия. №1. 2002. с. 22-29. 125. Татузов А.Л. Оптимизация диаграммы направленности антенны с помощью нейронных сетей // Нейрокомпьютер. 1998. № 3,4 С. 32-39. 126. Татузов А.Л. Представление нейросетевых парадигм в базисе процедур обработки изображений // VI Всероссийская конференция "Нейрокомпьютеры и их применение". Сборник докладов. М.: ИПРЖР, 2000. с. 59-63. 127. Татузов АЛ. Синтез нейросетевого обнаружителя радиолокационных сигналов // VIII Всероссийская конференция "Нейрокомпьютеры и их применение". Сборник докладов. М. ИПРЖР. 2002. с. 120-124. 421
Литература 128. Татузов А.Л. Совместное использование традиционных и нейросетевых методов для оптимизации диаграммы направленности антенны ФАР // V Всероссийская конференция "Нейрокомпьютеры и их применение". Сб. докладов. М.: Радио и связь. 1999, с. 224-227. 129. Татузов АЛ., Чухлеб Ф. С. Использование нейросетевой технологии при обработке радиолокационной информации // Информационные Технологии. 1999, № 1, С. 25-33. 130. Татузов А Л. Нейросетевая обработка радиолокационной информации. // 4-я Международная конференция "Цифровая обработка сигналов и ее применение". Докла- ды-2. ИПРЖР. 2002. с. 474-478. 131. Татузов АЛ. Нейросетевые модели обработки радиолокационной информации // Методическое руководство по применению стандарта ГОСТ РВ 51987 - 2002. Информационная технология. Комплекс стандартов на автоматизированные системы. Типовые требования и показатели качества функционирования информационных систем. Общие положения. 2003. 132. Теоретические основы радиолокации / Под ред. Я.Д. Ширмана. М.: Сов. радио, 1970. 560 с. 133. Тихонов В.И., Харисов ВН. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991. 608 с. 134. Уидроу Б., Стирнз С Адаптивная обработка сигналов. М.: Радио и Связь, 1989.440с. 135. Уоссерман Ф. Нейрокомпьютерная техника. Теория и практика / Пер. с англ. под ред. А.И.Галушкина. М.: Мир, 1992. 238 с. 136. Фогель Л., Оуенс А., Уолш М. Искусственный интеллект и эволюционное моделирование. М.: Мир, 1969. 230 с. 137. Фомин Д.В., Черников В.М., Виксне П.Е., Яфраков М., Шевченко П. DSP и RISC объединились // Открытые системы, 1999, № 05-06. 138. Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений / Пер. с англ. Х.Д. Икрамова. М.: Мир, 1980. 139. Фукунага К. Введение в статистическую теорию распознавания образов. М.: Наука, 178. 140. Хайкин С. Нейронные сети: полный курс - Neural Networks: A Comprehensive Foundation. 2-е. М.: «Вильяме», 2006. 1104 с. 141. Хопфилд Д. Нейронные сети и физические системы, проявляющие свойства коллективных вычислений // Под ред. А.И. Галушкина Нейрокомпьютерные сети: История развития теории. М.: ИПРЖР, 2001. 142. Хрящёв В.В. Линейная цифровая фильтрация на клеточных нейронных сетях // DSPA-2002 т. 2. М.: ИПРЖР. 143. Хьюбер П. Робастность в статистике / Пер. с англ. под ред. И.Г. Журбенко. М.: Мир, 1984.304 с. 144. Хювенен Э., Сеппянен Й. Мир Лиспа. В 2-х томах. М.: Мир, 1990. 145. Цыпкин ЯЗ. Адаптация и обучение в автоматических системах. М.: Наука, 1968.400 с. 146. Цыпкин ЯЗ. Основы теории обучающихся систем. М.: Наука, 1970. 252 с. 147. Червяков Н.И., Сахнюк П.А., Шапошников А.В. Пути эффективного использования иерархических структур фрагментов нейронных сетей на ПЛИС Xilinx при аппаратной реализации цифровых фильтров с параллельной обработкой данных // Нейрокомпьютеры: Разработка и Применение, 2001 № 10. 148. Черников В.М., Виксне П.Е., Фомин Д.В., Шевченко П.А. Архитектурные особенности нейропроцессора NM6403 // Нейроинформатика-99, ч. 2, МИФИ, 1999. 149. Чуев Ю В., Мельников П.М., Петухов СИ. и др. Основы исследования операций в военной технике / Под ред. Ю.В. Чуева. М.: Сов. радио, 1965. 592 с. 150. Шахнов В.А., Власов А.И, Кузнецов А.С, Поляков Ю.А. Нейрокомпьютеры: архитектура и схемотехника. М.: Машиностроение, 2000. 64 с. 151. Ширман ЯД., Манжос В.Н. Теория и техника обработки радиолокационной информации на фоне помех. М.: Радио и связь, 1981. 416 с. 152. Шнитман В. Современные высокопроизводительные компьютеры. Инф.- аналитические материалы Центра Информационных Технологий, 1996. 422
Литература 153. Якушев Д.Ж. Нейронные сети для обработки временных рядов: Дис... канд. физ.- мат. наук / Московский физико-технический институт (МФТИ). 1998. 154. Adaptive Solutions, CNAPS Product Information, 1995. 155. Ahlander A., Taveniku M, Svensson B. A multiple SIMD approach to radar signal processing // Proc. of IEEE Region 10 Conference, Perth, WA, Australia, 1996, pp. 852-857. 156. Akita R. Alianna M. Biologically Inspired Processor For All-Source Data Association And Fusion, DoD SBIR Solicitation Selections, NAVY 97-121, DoD, USA, 1997. 157. Aleksander I. and Morton H. Neural Computing. Chapman hall. 1990. 158. Amoozegar F. and Syndareshan M. Target Tracking by Neural Network Maneuver Modeling // Proceedings of International Conference on Neural Networks, 1994 (June). 159. Amoozegar F., Notash A., Sadati S.H. Neural Network Scheme for Adaptive Radar Detection Based on Nonparametric Statistics // Proc. of the SPIE (Radar/Ladar Processing and Applications), Orlando, Florida, 1995 (August), v. 2562, pp. 212-225. 160. Amoozegar F., Sundareshan M.K. Constant False Alarm Rate Target Detection in Clutter: A Neural Processing Algorithm // Proc. of the SPIE (Applications of Artificial Neural Networks), Orlando, Florida, 1994 (April), v. 2243, pp. 219-230. 161. Andina D. and Sanz-Gonzdlez J.L. Application of a Neural Network to Radar Detection // Proc. of European Conf. on Circuit Theory and Design, ECCTD'95, Instambul, Turkey, 1995 (August), pp. 573-576. 162. Andina D. and Sanz-Gonzdlez J.L. Comparison of a Neural Network Detector vs Neyman- Pearson Optimal Detector // Proc. of IEEE Int. Conf. on Acoustics, Speech & Signal Processing, ICASSP'96, 1996 (May), Atlanta, USA, pp. 3574-3577. 163. Andina D., Sanz-Gonzdlez J.L. , Jimenez-Pajares A. A Comparison of Criterion Functions for a Neural Network Applied to Binary Detection // Proc. of IEEE Int. Conf. On Neural Networks, ICNN'95, Perth, Australia, 1995 (November), pp. 329-333. 164. Annual Report to the President and the Congress. Cohen W.S. Secretary of Defense, DoD, USA, April 1997. 165. Bakhtiar В., Alavi H., Amoozegar F. Efficient Algorithm for Computing Data Association Probabilities for Multi-Target Tracking // Proc-of-SPIE; 1996, v. 2756; pp. 130-140. 166. Balakrishnan P. V., Cooper M.C Jacob V.S., and Lewis P.A. A study of the classification capabilities of neural networks using unsupervised learning: A comparison with k-means clustering // Psychometrika, 1994, v.59, pp.509-525. 167. Barrett T. W. Wavelet Pattern Detection ATR (WPD-ATR), DoD SBIR Solicitation Selections, BMDO 99-003, DoD, USA, 1999. 168. Bar-Shalom Y. and Fortmann T. Tracking and Data Association // Mathematics in Science and Engineering. Academic Press, 1988, v. 179. 169. Bar-Shalom Y. and Tse E. Tracking in cluttered environment with probabilistic data association // Automatica, 1975, v. 11, pp. 451-460. 170. Bar-Shalom Y. ed., Multitarget-Multisensor Tracking, Artech House, 1990. 171. Barto A. and Duff M. Monte Carlo Matrix Inversion and Reinforcement Learning // NIPS'1993, v.6, pp.687-694. 172. Barton D.K. Radar system analysis and modeling. - Artech House, Boston, MA, 2005. 173. Bas C.F., Marks IIRJ. The Layered Perceptron Versus Neyman-Pearson Optimal Detection // Proceedings of the International Joint Conference on Neural Networks, Singapore, 1991 (18-20 Nov), IEEE Press, pp. 1486-1489. 174. Bauer H.-U. and Villmann T. Growing a hypercubical output space in a selforganizing feature map. Tr-95-030, International Computer Science Institute, Berkeley, 1995. 175. Becker S., LeCun Y. Improving the Convergence of Back-Propagation Learning with Second Order Methods // Proc. Connectionist Models Summer School, Pittsburgh, 1988. 176. Behar V.P., Kabakchiev C.A., and Doukovska L.A. Adaptive CFAR PI Processor for Radar Target Detection in Pulse Jamming // Journal of VLSI Signal Processing. 2000, v. 26, pp. 383-396. 177. Bennett W.H. Multi-Discriminant Sensing From High Altitude Or Space, DoD STTR Program, AF 99-017, DoD, USA, 1999. 423
Литература 178. Bezdek J.C. Pattern Recognition with Fuzzy Objective Function Algorithms, New York: Plenum Press, 1981. 179. Bhattacarya Т.К. Modular Learning Startegy for Signal Detection in a Nonstationary Environment // IEEE Trans. Signal Process. (USA), 1997 (June), v.45, no.6, pp. 1619-1637. 180. Bishop CM. Neural Networks for Pattern Recognition, Oxford: Oxford University Press. 1995. 181. Blackman S.S. Multiple Target Tracking with Radar Applications. Norwood, MA: Artech House, 1986. 182. Bottou L. Online algorithms and stochastic approximations // David Saad, editor, Online Learning in Neural Networks (1997 Workshop at the Newton Institute), Cambridge, 1998. 183. Brown M., Harris С Neurofuzzy Adaptive Modelling and Control, NY: Prentice Hall, 1994. 184. Bucciarelli Т., Fedele G., Parisi R. Neural Networks Based Signal Detection // NAECON 93, Daytona, 1993. 185. Budinich M. and Taylor J.G. On the Ordering Conditions for Self-Organising Maps // Neural Computation. 1995 (November), v.7, no.2, pp. 284-289. 186. Budinich M. Sorting with Self-Organising Maps // Neural Computation. 1995 (November), v.7, no.6, pp. 1188-1190. 187. Cambell S. Neurobiologically-based System for Object Segmentation and Recognition, DoD SBIR Solicitation Selections, NIMA 98-001, DoD, USA, 1998. 188. Carpenter G.A. and Grossberg S. Learning, Categorization, Rule Formation, and Prediction by Fuzzy Neural Networks / Chen, C.H. (1996), pp. 1.3-1.45. 189. Chaney R. Adaptive Data Fusion Technology, DoD SBIR Solicitation Selections, AF 98- 131, DoD, USA, 1998. 190. Chang E.I., Lippmann R.P. Figure of Merit Training for Detection and Spotting // NIPS'1993, v. 6, pp. 1019-1027. 191. Chen C.H., ed. Fuzzy Logic and Neural Network Handbook, NY: McGraw-Hill, 1996. 192. Cheng B. and Titterington, D.M. Neural Networks: A Review from a Statistical Perspective // Statistical Science, 1994, v.9, pp. 2-54. 193. Cherkassky, V., Friedman, J.H., and Wechsler, H., eds. From Statistics to Neural Networks: Theory and Pattern Recognition Applications, Berlin: Springer-Verlag, 1994. 194. Chilingarian A. Detection of weak signals against background (noise) using network classifiers // Pattern Recognition Letters. 1995, v. 16, no.4. 195. DARPA Neural Network Study, AFCEA International Press, 1988. 196. Deans S.R. Hough Transform From the Radon Transform // IEEE PAMI, 1981, v.3, no.2, pp.185-188. 197. Delaney K.J. Novel Signal Processing Algorithms to Exploit and Classify Active Sono- buoy Returns, DoD SBIR Solicitation Selections, NAVY 99-188, DoD, USA, 1999. 198. Denker J.S., LeCun Y. Transforming Neural-Net Output Levels to Probability Distributions. NIPS 1990, pp. 853-859. 199. Diehl G W. W. Stochastic Fidelity Preservation in Mixed Resolution Simulation Modeling, DoD SBIR Solicitation Selections, AF 99-116, DoD, USA, 1999. 200. Dierckx P. Curve and Surface Fitting with Splines, Oxford: Clarendon Press, 1995. 201. Dillard G.M. Mean-level detection of nonfluctuating signals // IEEE Trans., 1974, v. AES-10, no.6 (Nov. 1974), pp.795-799. 202. Duda R.O., Hart P.E. Use of the Hough Transformation to Detect Lines and Curves in Pictures // Com. of the Association for Computing Machinery, 1972, v. 15, no.l, pp. 11-15. 203. El-Jaroudi, Amro and Makhoul J.. A new error criterion for posterior probability estimation with neural networks // Proc. of the 1990 Int. J. Conf. on Neural Networks, 1990, pp. 185-192. 204. Ersoy O.K., Hong D. Hierarchical Neural Networks Involving Nonlinear Spectral Processing // Proc. Int. Joint Conference on Neural Networks, Washington DC, 1989 (18- 22 June), v. 2, p. 264. 205. Farina A. Linear and non-linear filters for Clutter Cancellation in Radar Systems // Signal Processing, 1997, v. 59, pp. 101-112. 424
Литература 206. Finn KM. and Johnson R.S. Adaptive Detection Mode with Threshold Control as a Function of Spatially Sampled Clutter Estimation // RCA Review. 1968, v. 29, no.3, pp. 414-464. 207. Fitzgerald R.J. Development of Practical PDA Logic for Multitarget Tracking by Microprocessor // Y. Bar-Shalom, ed. Multitarget-Multisensor Tracking: Advanced Applications. Chapter 1. Artech House, 1990. 208. Fix E. Neural network based human performance modeling // Proceedings of the IEEE 1990 Nation-al Aerospace and Electronics Conference, 1990. 209. Forsythe S. and Leibler K. Matrix Inversion by a Monte Carlo Method // Math. Tables Other Aids Cornput, 1950, v.4, pp. 127-129. 210. Foss C.F. Air defense stays in step with mobility // Jane's Def. Weekly. 1997, v. 28, no. 6, pp. 20-25. 211. Fukushima K. Cognitron: A self-organinizing multilayered neural network // Biological Cybernetics, 1975, v. 20, pp. 121-36. 212. Fukushima K. Neocognitron: A self-organinizing neural network model for a mechanism of pattern recognition unafeected by shift in position and orientation // Biological Cybernetics, 1980, v. 36, no.4, pp. 193-202. 213. Gandhi P.P., Kassam S.A., Analysis of CFAR Processors in Non-Homogeneous Background // IEEE Trans., 1988, v. AES-24, no.4, pp. 443-454. 214. Geman S., Bienenstock E., and Doursat R. Neural networks and the bias/variance dilemma. Neural Computation, 1992, v.4 no.l, pp. 1-58. 215. Gezeltar J.D., Freeman R.F. Use of neural networks to design shared radiofrequency pulses // Journal of Magnetic Resonance. 1990. pp.397^04. 216. Ghosh J. and Shin Y. Efficient higher-order neural networks for classification and function approximation // Int. Journal of Neural Systems, 1992, v.3, no.4, pp. 323-350. 217. Goldstein L. Mean square optimality in the continuous time Robbins Monro procedure. Technical Report DRB-306, Dept. of Mathematics, University of Southern California, LA, 1987. 218. GrafK, Hubbard W., JackelL., and deVegvar P.G.N. A CMOS Associative Memory Chip // First Int. Conference Neural Nets, 1987, San Diego. 219. Guo C, Kuh A. Temporal Difference Learning Applied to Sequential Detection // IEEE Trans. Neural Netw. (USA), 1997 (March), v.8, no.2, pp. 278-287. 220. Hampshire II J.B. and Waibel A.H. A Novel Objective Function for Improved Phoneme Recognition Using Time-Delay Neural Networks // IEEE Trans. Neural Networks, 1990 (June), v. 1, no. 2 pp. 216-228. 221. Hansen V.G. Constant false alarm rate processing in search radars // Proc. of IEE 1973 Intl. Radar Conf, London, 1973, pp. 325-332. 222. Hansen V.G., Sawyers J.H. Detectability Loss due to Greatest of Selection in a Cell Averaging CFAR // IEEE Trans. 1980, v. AES-16, no 1, pp. 115-118. 223. Hassoun M.H. Associative Neural Memories: Theory and Implementation, Oxford Press, 1993. 224. Haykin S. and Thomson D.J. Signal Detection in a Nonstationary Environment Reformulated as an Adaptive Pattern Classification Problem // Proc. IEEE, 1998, v.86, pp. 2325-2344. 225. Haykin S, Neural Networks: A Comprehensive Foundation, NY: Macmillan, 1994. 226. Hebb D. O. The Organization of Behavior. Wiley, New York, 1949. 227. Hecht-Nielsen R. Kolmogorov's Mapping Neural Networks Existence Theorem // IEEE First Annual Int. Conf. on Neural Networks, San Diego, 1987, v. 3, pp. 11-13. 228. Hecht-Nielsen R. Neurocomputing, Reading, MA: Addison-Wesley, 1990. 229. Himonas S.D. Barkat M. Automatic censored CFAR Detection for Non-Homogeneous Environments // IEEE Trans., 1992, v. AES-28, no. 1, pp. 286-304. 230. Hopfield J J., Tank D. W. Neural computation of decisions in optimization problems //. Biological Cybernetics, 1985, v.52, pp. 141-52. 231. Hopfield, J. Neural networks and physical systems with emergent collective computational properties // Proceedings of the National Academy of Sciences of the USA, 1982, v.79, pp. 2554. 425
Литература 232. Ниа G., Ни Y, Shen Z.-K., Sun Z.-K. Tracking Point-Source Targets in IR Noise with Neural Network-Aided Kalman Filter // Proc. of the SPIE (Signal and Data Processing of Small Targets), San Diego, CA, USA, 1995 (July), v. 2561, pp. 589-597. 233. Huang S. A novel forward-backward smoothing-based learning subspace method for recognition of radar targets // Int. J. Pattern Recognit. Artif. Intell. (Singapore), Feb. 1996, vol. 13, no. l,pp. 65-83. 234. Huang S. Application of generalized radial basis networks to recognition of radar targets // Int. J. Pattern Recognit. Artif. Intell. (Singapore), Sept. 1996, vol. 13, no. 6, pp. 945-962. 235. Hussaini E.K. and Mas hade M.B. Performance of cell-averaging and order-statistic CFAR detectors processing correlated sweeps for multiple interfering targets // Signal Processing. 1996, v.49 no.2, pp. 111-118. 236. Hyvarinen A., Hoyer P., and Oja E. Sparse Code Shrinkage: Denoising by Nonlinear Maximum Likelihood Estimation // NIPS* 1998, v.l 1, pp. 473^79. 237. Inggs M.R., Robinson A.D. Ship target recognition using low resolution radar and neural network // IEEE Trans, on AES, 1999, v. 35, no. 2, pp. 386-393. 238. JangJ.-S., Lee S-Y., and S.-Y. Shin S.-Y. An Optimization Network for Matrix Inversion // NIPST987, v.O, pp. 397-401. 239. Jing Z.-L., Zhang G.-W., Zhou H-R. A Fast Adaptive Neural Network Scheme for Multi- Maneuvering Target Tracking // Proc. of 32nd IEEE Conference on Decision and Control, USA, 1993, v.4, pp. 3253-3258. 240. Johnson J.K. A Neurologically-Inspired Model For Combat Target Identification, DoD SBIR Solicitation Selections, AF 98-158, DoD, USA, 1998. • 241. Johnson, Colin R. DARPA Continues Neural Funding // Electrical Engineering Times, August 5, 1991. 242. Kabakchiev Chr. and Behar V., Techniques for CFAR Radar Image Detection in Pulse Jamming, in the 26-th EuMC'96, Prague, 1996, pp. 347-352. 243. Kangas J.A , Kohonen T and Laaksonen T. Variants of Self-Organizing Maps // IEEE Trans, on Neural Networks, 1990, v.l, no. 1, pp. 93-99. 244. Karakoulas G., Taylor JS. Optimizing Classifers for Imbalanced Training Sets // NIPS' 1998, v. 11, pp. 253-259. 245. Kim D.H. Autonomous Neurofuzzy System for Tracking Multisensor Data, DoD SBIR Solicitation Selections, NAVY 00-010, DoD, USA, 2000. 246. Klein L.A. Sensor and Data Fusion Concepts and Applications // SPIE, Bellingham, WA, 1993. 247. Kohonen T Self-organized formation of topologically correct feature maps // Biological Cybernetics, 1982, v. 43 pp. 59-69. 248. Kohonen T Self-Organizing Maps. Springer, Berlin, 1995. 249. Kolmogorov A.N. On the representation of continuous functions of many variables by superposition of continuous functions of one variable and addition // American Math. Soc. Transl. 1963. v. 28. p. 55-63. 250. Kosko B. Bidirectional Associative Memories // IEEE Transactions on Systems, Man, and Cybernetics, January/February 1988, v. 18, no.l, pp. 49-60. 251. Kosko B. Neural Networks and Fuzzy Systems, Englewood Cliffs, N.J.: Prentice-Hall, 1992. 252. Kosko B. Neural Networks for Signal Processing. Prentice-Hall, 1992. 253. Ktick, M. Constant False Alarm Rate Detection of Radar Signals with Artificial Neural Networks, MSc Thesis, Dept. of Computer Science, University of Skode, Sweden, 1996. 254. Kushilevitz E., Mansour Y. Learning decision trees using the fourier spectrum // SIAM Journal on Computing, 1993, v.22, no.6. pp. 1331-1348. 255. Kuttikkad S., Chellappa R. Non-Gaussian CFAR Techniques for Target Detection in High Resolution SAR Images // IEEE Intl. Conf. in Image Processing, Austin, TX, 1995 (November), pp. 910-914. 256. Kwan С Neural Network Control of Nonlinear Systems Using Multiple Models, DoD STTR Program, NAVY 98-005, DoD, USA, 1998. 426
Литература 257. Kwan С. Real Time Infrared Thermal Signature Detection Using Neural Networks, DoD SBIR Solicitation Selections, NAVY 97-119, DoD, USA, 1997. 258. Kwan H.K, Lee C.K. A Neural Network Approach to Pulse Radar Detection. // IEEE Trans, on AES v. 29. 1993. pp. 9-21. 259. Kwan H.K, Lee C.K. Pulse Radar Detection Using a Multilayer Neural network // JFCNN-89, 1989, v. 2, pp. 75-80. 260. Lampinen J, Selonen A. Using Background Knowledge for Regularization of Multilayer Perceptron Learning / ICANN'96, Bochum, Germany, 1996. 261. Laur T.M., Llanso S.L., Boyne ^.J.(Editor) Encyclopedia of Modern U.S. Military Weapons: The Army Times Navy Times Air Force Times, Berkley Pub Group, August 1995. 262. LeCun Y. A Theoretical Framework for Back-Propagation //Proc. of the Connectionist Models Summer School, (D. Touretzky, G. Hinton, and T. Sejnowski, eds.), CMU, Pittsburgh, Pa, 1988, pp. 21-28. 263. LeCun Y. Bottou L., Orr G., and Muller K. Efficient BackProp, in Orr, G. and Muller K. (Eds), Neural Networks: Tricks of the trade, Springer, 1998. 264. LeCun Y., BengioY. Convolutional networks for images, speech, and time-series // Handbook of Brain Theory and Neural Networks, M. A. Arbib, Ed. 1995, MIT Press. 265. Lee D.D., Seung HS. Algorithms for Non-negative Matrix Factorization // NIPS'2000, v. 13. 266. Liddy E.D. EMMA: Evolving and Messaging Decision Making Agents, DoD SBIR Solicitation Selections, AF 98-128, DoD, USA, 1998. 267. Lin CF. Advanced Multispectral/Hyperspectral Imagery Exploitation for Global Awareness, DoD SBIR Solicitation Selections, AF 99-107, DoD, USA, 1999. 268. Lin CF. Intelligent Multisensor Integration and Fusion, DoD SBIR Solicitation Selections, ARMY 97-120, DoD, USA, 1997. 269. Lippe W.-M., Feuring Th., and Mischke L. Supervised learning in fuzzy neural networks / Institutsbericht Angewandte Mathematik und Informatik, WWU Muenster, 1995,1-12. 270. Lippmann R.P. and Beckman P. Adaptive Neural Net Preprocessing for Signal Detection in Non-Gaussian Noise // NIPS' 1988, v. 1, pp. 124-132. 271. Lippmann R.P. An introduction to computing with neural nets // IEEE Acoustics, Speech and Signal Processing Magazine, April 1987, pp. 4-22. 272. Luo F.A., Unbehauen R., Applied Neural Networks for Signal Processing, Cambridge Univ. Press, 1998. 273. MacKay D. J С Information Theory, Inference, and Learning Algorithms, Cambridge University Press. 2003, 640 c. 274. MacQueen J. Some methods for classification and analysis of multivariate observations // Proc. 5th Berkeley Symposium on Mathematical statistics and probability. California Univ., Berkeley, 1967, v. 1 pp. 281-297. 275. Mansour Y., Sahar S. Implementation Issues in the Fourier Transform Algorithm // NIPS'1995, v.8, pp. 260-266. 276. Martin J. Rapid Application Development, Macmillan Publishing, Indianapolis, IN, 1991. 277. Martin T. Acoustic Recognition of a Limited Vocabulary in Continuous Speech, Ph. D. Thesis, Dept. Elect. Eng. Univ. Pennsylvania, 1970. 278. Martinetz Т. M. and Schulten K. J. Topology representing networks // Neural Networks, 1994, v.7no.3pp. 507-522. 279. Martinetz T.M., Schulten K.J. A "neural-gas" network learns topologies // T. Kohonen, K. Muakisara, O. Simula, and J. Kangas, eds, Artificial Neural Networks, North-Holland, Amsterdam, 1991, pp. 397-402. 280. Mashade M.B. and Hussaini E.K. Performance of CFAR detectors for M-sweeps in the presence of interfering targets // Signal Processing. 1994, v.38 no.2, pp. 211-222. 281. Massie M.A. Adaptable Sensor Processing for Passive Targets Using Neuromorphic Multi-Chip Module Techniques, DoD STTR Program, NAVY 98-003, DoD, USA, 1998. 282. Masters T. Signal and Image Processing with Neural Networks: A С++ Sourcebook. John Wiley, 1994. 427
Литература 283. McCartor Н. Back Propagation Implementation on the Adaptive Solutions CNAPS Neu- rocomputer // Advances in Neural Information Processing Systems, 3, 1991. 284. McCulloch W.S. and Pitts W.A. A Logical Calculus of the Ideas Immanent in Nervous Activity. Bull. Math. Biophys, 1943, v. 5, pp. 115-133. 285. McEliece R., Posner E., Rodemich E., and Venkatesh S. The capacity of the hopfield associative memory // IEEE Transactions on Information Theory, 1987, v. IT-33, pp. 461-482. 286. Michie D., Spiegelhalter D.J., and Taylor C.C. Machine Learning, Neural and Statistical Classification, Ellis Horwood, 1994. 287. Minsky M.L., Papert S.S. Perceptrons: An Introduction to Computational Geometry, MIT Press, Cambridge, MA, 1969. 288. Missler J. and Kamangar F. A Neural Network For Pursuit Tracking Inspired By the Fly Visual System // Neural Networks, 1995, v. 8, no. 3, pp. 463-480. 289. Monroe D.J, Ersoy O.K., Bell M. R., Sadowsky J.S. Neural Network Learning of Low Probability Events // IEEE Trans., 1996 (July), v.AES-32, pp. 898-909. 290. Mozer M.C. Neural Net Architectures for Temporal Sequence Processing," in Weigend, A.S. and Gershenfeld, N.A., eds. Time Series Prediction: Forecasting the Future and Understanding the Past, Reading, MA, Addison-Wesley, 1994, pp. 243-264. 291. Muller M. Supervised learning on large redundant training sets. International Journal of Neural Systems, 1993, v.4, no.l, pp. 15-25. 292. Murarka N.P. An Interactive Risk-Based Decision Aid, DoD SBIR Solicitation Selections, ARMY 98-108, DoD, USA, 1998. 293. Murata N, Muller K.-R., Ziehe A., and Amari S. Adaptive on-line learning in changing environments // Michael C. Mozer, Michael I. Jordan, and T. Petsche, editors, Advances in Neural Information Processing Systems, The MIT Press, 1997, v. 9, pp. 599. 294. Nielsen P.E. Emotional Congnitive Synthetic Forces, DoD STTR Program, ARMY 98- 004, DoD, USA, 1998. 295. Nigrin A., Neural Networks for Pattern Recognition, Cambridge, MA: The MIT Press, 1993 296. O'Donnell Т.Н. Adaptive Antenna Array for Radar Cross Section (RCS) Measurement, DoD SBIR Solicitation Selections, AF 98-279, DoD, USA, 1998. 297. Orr G.B.. Removing noise in on-line search using adaptive batch sizes. In Michael C. Mozer, Michael I. Jordan, and Thomas Petsche, editors, Advances in Neural Information Processing Systems, The MIT Press, 1997, v.9, page 232. 298. O'Sullivan J., Jacobs S.P., Miller M.I., Snyder D.L. A Likelihood-Based Approach to Joint Target Tracking and Identification // 27th Asilomar Conf. on Signals, Systems & Computers, 1993, v. 1, pp. 290-294. 299. Pacheco X., Teixeira S. Delphi Developer's Guide, Borland Press, 870 p. 300. Palmer D. and DeSieno D. Removing Random Noise from EKG Signals Using Back Propagation Network, HNC Inc., San Diego, CA, 1987. 301. Paris B.P., Orsak G., Varanasi M., and Aazhang B. Neural Net Receivers in Multiple- Access Communications // NIPS'1988, v.l, pp. 272-280. 302. Parra L., Spence C, Sajda P. Higher-Order Statistical Properties Arising from the Non- Stationarity of Natural Signals // NIPS'2000, v. 13. 303. Prechelt L. A Quantitative Study of Experimental Evaluations of Neural Network Learning Algorithms: Current Research Practice // Neural Networks, 1996, v.9, no.3, pp. 457^162. 304. Principe J.C., Kim M., and Fisher III J. W. Target discrimination in synthetic aperture radar (SAR) using artificial neural networks // IEEE Transactions on Image Processing, 1998. 305. Principe J.C., Zahalka A. Transient Signal Detection with Neural Networks: The Search for the Desired Signal // NIPS'1992, v.5, pp. 688-695. 306. Quadrennial Defense Review. DoD, USA, 2001 (09/30/2001). 307. Ramamurti V., Rao S.S., Gandhi P.P. Neural Networks for Signal Detection in Non-Gaussian Noise // IEEE 1993 International Conference on Acoustic, Speech and Signal Processing(ICASSP r93), Minneapolis, MN, 1993. 428
Литература 308. Richard M.D., Lippmann R.P. Neural network classifiers estimate bayesian a-posteriori probabilities //Neural Computation, 1991, v. 3, no. 4, pp. 461-483. 309. Richard J.T. and Dillard G.M. Adaptive Detection Algorithms for Multiple Target Situations // IEEE Trans. 1977, v.AES-13, no.4, pp. 338-343. 310. Riedmiller M. and Braun H. A Direct Adaptive Method for Faster Backpropagation Learning: The RPROP Algorithm // Proceedings of the IEEE Int. Conf. on Neural Networks 1993, San Francisco: IEEE, 1993. 311. Ripley B.D. Pattern Recognition and Neural Networks. Cambridge: Cambridge University Press. 1996. 312. Robbins, Я., and S. Monroe, "A stochastic approximation method," Annals of Mathematical Statistics 22, 1951. 313. Rodrigues J. S. and Almeida L. B. Improving the learning Speed in Topological Maps of Patterns // Proc. of INNC, Paris, 1990, pp. 813-816. 314. Rogers S.K., Priddy K.L., Ruck D. W., Tarr G.L. Neural networks for segmentation, tracking, and identification // SPIE Proc. (Applications of Artificial Neural Networks III), Orlando, FL, USA, 1992 (April), v. 1709, pp. 2-8. 315. Rosenblatt F. Principles of Neurodynamics. Spartan, New York, 1962. 316. Rosenblatt F. The perceptron: a probabilistic model for information storage and organization in the brain // Psychol. Rev. 1958, v. 65, p. 386. 317. Ross K. Intelligent Multi-Agent Hybrid Systems Control Technology, DoD SBIR Solicitation Selections, ARMY 98-008, DoD, USA, 1998. 318. Rubin M.A. Application of fuzzy ARTMAP and ART-EMAP to automatic target recognition using radar range profiles // Neural network, 1995 v.8 no. 7-8, pp. 1109-1116. 319. Rumelhart D.E., Hinton G.E., and Williams R.J. Learning internal representations by error propagation // In Parallel Distributed Processing: Explorations in the Microstructure of Cognition, v. 1 Foundations, D.E. Rumelhart, J.L. McClelland, and PDP Res. Grp. MIT Press/Bradford Books, Cambridge, Mass., 1986. 320. Rumelhart D.E., Widrow В., and Lehr M.A. The basic ideas in neural networks // Communications of the ACM, 1994 (March), v. 37, no. 3, pp. 87-92. 321. Sarajedini A. Sensor Processing and Image Fusion for Passive Target Recognition on a Reconfigurable Processor, DoD STTR Program, NAVY 98-003, DoD, USA, 1998. 322. Sarle W.S. Neural Networks and Statistical Models," In Proc. 19th Annual SAS Users Group International Conference, SAS Institute, 1994, pp. 1538-1550. 323. SAS Neural Network FAQ. ftp://ftp.sas.com/pub/neural/FAQ.html. 324. Saunders C. A Micro Tactical Grade INS using MEMS Technology and a Multiple Sensors Adaptive Filter (MSAF), DoD SBIR Solicitation Selections, NAVY DARPA 97-081, DoD, USA, 1997. 325. Scherf A.V., Scott P.A. Target detection using multilayer feedforward neural networks // SPIE Proc. Orlando, FL, USA, 1991 (April), v. 1469. 326. Sejnowski T.J. The Computational Brain, MIT Press, Cambridge, MA, 1994, 544 p. 327. Sengupta D., litis R.A. Neural Solution to the Multitarget Tracking Data Association Problem // IEEE Trans., 1989, v. AES-25, no.l, pp. 96-108. 328. SimardP.Y., Bottou L., Hqffner P., LeCun Y. Boxlets: A Fast Convolution Algorithm for Signal Processing and Neural Networks // NIPS'1998, v.l 1, pp. 571-579. 329. Singhal S., Wu L. Training Multilayer Perceptron with the Extended Kalman Algorithm// Proceedings of Advances in Neural Information Processing Systems v. 1, Denver, Colorado, 1988. 330. Skubiszewski M. A hardware emulator for binary neural networks // International Neural Network Conference, Paris, 1990, v. 2, pp. 555-558. 331. Snorrason M. Precomputed Clutter Characterization for Automatic Target Recognition, DoD SBIR Solicitation Selections, NAVY 99-195, DoD, USA, 1999. 332. Streit R.L. Track initialization sensitivity in clutter // Proc. of SPIE (Signal and Data Processing of Small Targets), San Diego, CA, USA, v. 2561, pp. 460-471. 429
Литература 333. Tamura S. and Wailbel A. Noise reduction using connectionist models // Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Processing, 1988 (April), v.l: Speech Processing, pp. 553-556. 334. Tatuzov A.L. Neural Network Methods for Radar Processing. // ICONIP'02. IEEE. 2002, v.4. pp. 1718-1723. 335. Tatuzov A.L. Neural Network Methods for Reduction of Level of Side Lobes in Phased Antenna Arrays // Journal of Computer and Systems Sciences International ISSN 1064- 2307, IAPC "Nauka/ Interperiodica", v. 38, no. 5, 1999, pp. 815-818. 336. Tatuzov A.L. The Antenna Polar Pattern Optimization with the Help of Neural Networks. //Neurocomputers: Design and Applications. Begellhouse. 2001. v. 2,. no. 1. pp. 15-22. 337. Tatuzov A.L. Use of Associative Memory for Data Association in Multi-Target Tracking. //Neurocomputers: Design and Applications. Begellhouse. 2000, v. 1, no. 1. pp. 45-52. 338. Taveniku M. SIMD architectures for radar signal processing and artificial neural networks. Ph.D. Thesis no.321, Dep. of Сотр. Eng., Chalmers Univ. of Technology, 1997. 339. Tchorz J., Kleinschmidt M., Kollmeier B. Noise Suppression Based on Neurophysiologi- cally-motivated SNR Estimation for Robust Speech Recognition // NIPS'2000, v. 13. 340. Telfer B.A. and Szu H.H. Energy Functions for Minimizing Misclassification Error with Minimum-Complexity Networks // Neural Networks, 1994, v. 7, no. 5, pp. 809-817. 341. Telfer B.A. and Szu H.H. Implementing the Minimum-Misclassification-Error Energy Function for Target Recognition // Int. J. Conf. Neural Networks, Baltimore, June, 1992, v. IV, pp. 214-219. 342. Trunk G. V. Range Resolution of Targets Using Automatic Detectors // IEEE Trans. 1978, v. AES-14, pp. 750-755. 343. Vaidyanathan R. Biologically Inspired Target Seeking Reflex for Autonomous Munitions, DoD SBIR Solicitation Selections, AF 99-188, DoD, USA, 1999. 344. van Rijckevorsal J.L.A. Fuzzy coding and B-splines / van Rijckevorsal J.L.A., de Leeuw J., eds., Component and Correspondence Analysis, Chichester: John Wiley & Sons, 1988, pp. 33-54. 345. Vapnik V. The Nature of Statistical Learning Theory. Springer-Verlag, New York, 1995. 346. Vijaykumar R. A Software Toolkit to Automate Display Management for Command and Control Applications, DoD SBIR Solicitation Selections, ARMY 99-040, DoD, USA, 1999. 347. von Neumann J. 1946. The Principles of Large-Scale Computing Machines, reprinted in Ann. Hist. Comp, v. 3, no. 3, pp. 263-273. 348. von Neumann J. 30 June 1945. First Draft of a Report on the EDVAC, Contract No. W- 670-ORD-492, Moore School of Electrical Engineering, Univ. of Penn., Philadelphia. Reprinted (in part) in Randell, Brian. 1982. Origins of Digital Computers: Selected Papers, Springer-Verlag, Berlin Heidelberg, pp. 383-392. 349. Wang Chia-Jiu, Wu Chwan-Hwa. Neural network for target detection // IEEE Int. Symp. Circuits and Syst., New Orleans, LA, 1990 (May 1-3), v. 3, pp. 1863-1866. 350. Wang R. Pulse Generator for All-Optical Neurons, DoD STTR Program, DARPA 98-001, DoD, USA, 1998. 351. Weiss M. Analysis of some modified cell averaging CFAR processors in multiple-target situations // IEEE Trans. 1982, v. AES-18, no.l, pp. 102-114. 352. Werbos P. Beyond Regression; New Tool for Prediction and Analysis in the behavioral sciences. Ph.D. thesis. Harvard University, Boston, MA, 1974. 353. Werbos P.J. Backpropagation Through Time: What It Does and How to Do It //Artificial Neural Networks: Concepts and Theory, IEEE Computer Society Press, 1992, pp. 309-319. 354. White H. Learning in Artificial Neural Networks: A Statistical Perspective // Neural Computation, 1989, v.l, pp. 425-464. 355. Widrow B. and HoffM.E. Adaptive switching circuits // IRE WESCON, New-York, 1960, pp. 96-104. 356. Widrow B. and Stearns S.D. Adaptive Signal Processing. Englewood Cliffs, NJ: Prentice- Hall, 1985. 430
Литература 357. Widrow В., Lehr М.А. 30 years of adaptive neural networks: Perceptron, Madaline and Back- Propagation. Proc. of the IEEE, v. 78, no. 9, Sept. 1990. 358. Wills haw D. J. and von der Mais burg C. How patterned neural connections can be set up by self-organization // Proc. Royal Society London, 1976, v. В194, pp. 431-445. 359. Xie F. and Campernolle D. V. A family of 'MLP' based nonlinear spectral estimators for noise reduction // ICASSP'94, 1994, pp. 53-56. 360. Xixong Z. The future of military radar: a perspective, Aerospace and Electronic Systems Magazine, IEEE, V.14, Is.2, 1999, pp. 11-18. 361. Yadid-Pecht O. Modified MaxNet with Fast Convergence Rate // Proc. of the SPIE (Applications of Artificial Neural Networks), Orlando, Florida, 1994 (April), v. 2243, pp. 111-118. 362. Yan W., Zhu Z, Ни R. A hybrid genetic/BP algorithm and its application for radar target classification // IEEE NAECON 1997, Dayton, OH, USA, 1997 (14-17 July), v.2, pp. 981-984. 363. Yuret D., de la Maza M. Dynamic Hill Climbing: Overcoming the limitations of optimization techniques // Proc. 2nd Turkish Symposium of AI and ANN, 1993, pp. 254-260. 364. Zadeh, L. A., Fuzzy sets. Information and Control, Vol. 8, 1965, pp. 338-353. 365. Zarchan P. When Bad Things Happen To Good Missiles // Proceedings of AIAA Guidance and Control Conference, AIAA, Washington, DC, August, 1993. 366. Zejak A.J., Dukic M.L., Kovacevic B.D., and Simic D. Fair Play Comparison of Neural Networks and Digital Filter Realization // Int. Conf. on Signal Processing Applications and Technology, ICSPAT'96, Boston, USA, Okt. 1996. 367. Zhao Q., Bao Z. Radar target recognition using a radial basis function neural network / Neural network, 1996, v.9 no.4, pp. 709-720. 368. Zhong S. and Ghosh J. Decision Boundary Focussed Neural Network Classifier // Intelligent Engineering Systems Through Artificial Neural Networks, v. 10, ASME Press, (Proc ANNIE '00), Nov 2000. 369. Zurada J.M., Introduction To Artificial Neural Systems, Boston: PWS Publishing Company, 1992, p. xv. 431
Научная серия Нейрокомпьютеры и их применение Редактор Александр Иванович Галушкин Книга 28 НЕЙРОННЫЕ СЕТИ В ЗАДАЧАХ РАДИОЛОКАЦИИ Автор: Александр Леонидович Татузов Зав. редакцией: В. И. Рождественская Редактор-оператор: С. Н. Яковлева Изд. № 18. Сдано в набор 26.01.2009. Подписано в печать 28.09.2009. Формат 60x90 1/16. Бумага газетная. Гарнитура Тайме. Печать офсетная Печ. л. 27. Тираж 400 экз. Зак. № 5782. Издательство «Радиотехника». 107031, Москва, К-31, Кузнецкий мост, д. 20/6. Тел./факс: (495)621-48-37; 625-78-72,625-92-41. E-mail: info@radiotec.ru www, radiotec.ru Отпечатано в ООО ПФ «Полиграфист», 160001, г. Вологда, ул. Челюскинцев, 3. Тел.: 8(817-2) 72-61-75; 8(817-2) 72-60-63.