Автор: Мясников В.В. Попов С.Б. Сергеев В.В. Сойфер В.А.
Теги: компьютерные технологии обработка сигналов математическое моделирование учебное пособие цифровая обработка изображений
ISBN: 5-7883-0109-2
Год: 2000
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ РОССИЙСКАЯ АКАДЕМИЯ НАУК
САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АЭРОКОСМИЧЕСКИЙ
УНИВЕРСИТЕТ имени академика С.И. КОРОЛЕВА
ИНСТИТУТ СИСТЕМ ОБРАБОТКИ ИЗОБРАЖЕНИЙ РАН
В.А. Сойфер, В.В. Сергеев, С.Б. Попов, В.В. Мясников
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
Учебное пособие
САМАРА 2000
УДК 681.3, 621.372.542
Теоретические основы цифровой обработки изображений: Учебное пособие/
В.А.Сойфер, В.В.Сергеев, С.Б .Попов, В.В. Мясников, Самарский государственный аэрокосмический университет имени академика С.ПКоролева. Самара, 2000,256 с.
ISBN 5-7883-0109-2
В учебном пособии даются основы цифровой обработки изображений, описывают» наиболее известные методы и алгоритмы линейной и нелинейной фильтрации, препарирования, восстановления сигналов и изображений, даются методы описания и анализа линейных систем, основы методов распознавания изображений.
Учебное пособие составлено в соответствии с действующими учебными программами по дисциплинам «Математические методы обработки изображений», «Теория сигналов», «Цифровая обработка сигналов», «Методы распознавания образов». Предназначено для студентов специальности 01.02 “Прикладная математика”, обучающихся по специализации 01.02.01 «Математическое и программное обеспечение обработки изображении».
Учебное пособие подготовлено при поддержке Федеральной целевой программы “Государственная поддержка интеграции высшего образования и фундаментальной науки на 1997-2000 гг ” (Постановление Правительства РФ №1062 от 09.09.96)
Табл. 4. Ил. 140. Библиогр: 17 назв.
Печатается по решению редакционно-издательского совета Самарского государственного аэрокосмического университета имени академика С.П. Королева
Рецензенты: д-р техн, наук, доцент д-р физ.-мат. наук
А.Н. Коварцев, В.М. Чернов
ISBN 5-7883-0109-2
© Институт систем обработки изображении РАН, 2000
© Самарский государственный аэрокосмический университет, 2000
© ВА.Сойфер, В.В.Сергеев, С.Б.Попов, В.В. Мясников
3
ОГЛАВЛЕНИЕ
Введение......................................................,....... 6
1. Модели непрерывных изображений.......................................8
1.1. Функция яркости..................................................8
1.2. Оптический сигнал.............................................. 9
1.3. Двумерные линейные системы......................................12
2. Спектры сигналов. Преобразование Фурье. Линейные системы........ 16
2.1. Спектр периодического сигнала...................................16
2.2. Спектр непериодического сигнала............................... 19
2.3. Спектры импульсов............................................. 22
2.4. Спектры обобщенных функций.................................... 28
2.5. Двумерное преобразование Фурье................................ 30
2.6. Оптические линейные системы в частотной области.............. .. 33
3. Представление изображении в компьютере............................. 34
3.1. Средства ввода изображения.................................... 34
3.2. Дискретизация изображений..................................... 34
4. Последовательности и линейные системы с постоянными параметрами............................................ 37
4.1. Последовательности.......................................... 37
4.2. Дискретные ЛПП-системы........................................ 40
4.3. Физическая реализуемость и устойчивость ЛПП-снстем............ 42
4.4. Разностные уравнения.......................................... 43
4.5. Двумерные последовательности................................ 46
4.6. Двумерные дискретные ЛПП-системы............................ ..50
4.7. Физическая реализуемость двумерных систем.................... 52
4.8. Двумерные разностные уравнения................................ 55
5. Описание дискретных сигналов и систем в частотной области......... 58
5.1. Частотная характеристика Л1Ш-систем н спектры дискретных сигналов.58
5.2. Основные свойства спектров последовательности................. 51
5.3. Соотношение между спектрами непрерывных н дискретных сигналов.....65
5.4. Описание двумерных дискретных сигналов и систем в частотной области...... 68
6. Описание дискретных сигналов и систем с помощью z-преобразования......74
6.1. Прямое z-преобразование.........................................74
6.2. Основные свойства z-преобразования................................80
6.3. Обратное z-преобразование.........................................84
4
6.4. Анализ и синтез ЛШ1-систем с использованием z-преобразования.......89
6.5. Двумерное z-преобразование.........................................94
6.6. Основные свойства двумерного z-преобразования.....................103
6.7. Анализ и синтез двумерных J11111-систем с использованием z-преобразования.....................................................105
7. Спектральный анализ дискретных сигналов..............................113
7.1. Дискретное преобразование Фурье..................................113
7.2. Связь ДПФ с 2-преобразованием и непрерывным спектром последовательности...................................... 116
7.3. Использование ДПФ для вычисления отсчетов непрерывного спектра....118
7.4. Использование ДПФ для вычисления последовательности по ее спектру.119
7.5. Основные свойства ДПФ.............................................121
7.6. Вычисление линейной свертки при помощи ДПФ........................124
7.7. Быстрое преобразование Фурье......................................126
8. Вероятностные модели изображений......................................132
8.1. Случайные процессы................................................132
8.2. Случайные последовательности и их характеристики..................136
8.3. Преобразование случайных последовательностей в ЛПП-системах......139
8.4. Факторизация энергетического спектра..............................141
9. Критерии качества изображений.........................................146
9.1. Субъективный критерий (критерий визуального восприятия)...........146
9.2. Среднеквадратичный критерий.......................................147
9.3. Критерий максимальной ошибки (равномерного приближения)...........148
9.4. Вероятностно-зональный критерий...................................148
10. Погрешности дискретного представления изображений...................150
10.1. Соответствие между непрерывными и цифровыми изображениями........150
10.2. Квантование параметра по уровню..................................150
10.3. Дискретизация и восстановление непрерывных изображений...........153
10.4. Оценка среднеквадратичной погрешности дискретизации..............156
10.5. Оценка максимальной погрешности дискретизации....................161
10.6. Общая погрешность цифрового представления изображений............165
11. Преобразования яркости изображений...................................167
11.1. Коррекция амплитудных характеристик..............................167
11.2. Линейное повышение контраста.....................................168
11.3. Преобразование гистограмм........................................170
5
11.4. Пороговая обработка......................................... 172
11.5. Препарирование.............................................. 174
11.6. Адаптивные преобразования яркости.............................177
11.7. Адаптивное повышение контраста................................178
11.8. Адаптивное преобразование гистограмм..........................178
11.9. Адаптивная пороговая обработка................................178
12. Повышение резкости изображений....................................180
12.1. Повышение резкости локальными методами........................180
12.2. Спектральные методы повышения резкости...................... 186
13. Выделение контуров................................................. 188
13.1. Определение контура.............................................. 188
13.2. Дифференциальные методы................................... 192
13.3. Методы с согласованием........................................196
14. Линейная фильтрация и восстановление изображений..................200
14.1. Восстановление дискретного сигнала JНИ 1-системой.............200
14.2. Оптимальное линейное восстановление сигнала..................... 204
14.3. Реализация оптимального фильтра обработкой в прямом и обратном времени....................................................209
14.4. Реализация оптимального фильтра при помощи ДПФ.................. 213
14.5. Восстановление сигнала физически реализуемым БИХ-фильтром..... 215
14.6. Восстановление сигнала КИХ-фильтром......................... 221
15. Нелинейная фильтрация................................... ;......... 224
15.1. Медианная фильтрация............ .............................. 224
15.2. Адаптивные фильтры............................................. 226
15.3. Ранговая обработка изображении.................................. 228
16. Измерение геометрических характеристик объектов...................235
17. Распознавание изображений............................. ......241
17.1. Постановка задачи классификации...............................242
17.2. Качество классификатора..................................... 244
17.3. Оптимальные стратегии классификации...........................245
17.4. Байесовский классификатор для нормально распределенных векторов признаков................................................ 249
17.5. Вычисление вероятностей ошибочной классификации...............253
18. Библиографический список........................................ 255
6
ВВЕДЕНИЕ
Зрительные образы являются для человека основой восприятия окружающего мира. Изображение несет в себе информацию об объекте и в этом смысле может рассматриваться как многомерный сигнал, описываемый функцией двух или большего числа переменных.
Обработка изображений означает выполнение над ними различных операций с заданной целью. Классическая цель и задача обработки изображений - улучшение их качества - впервые возникла в оптике и традиционно решалась путем создания более совершенных оптических систем, то есть с помощью оптической обработки изображений. С момента появления компьютеров в оптике произошла настоящая революция, связанная с проникновением в нее цифровых методов.
Первые публикации по цифровой обработке изображений появились в 60-х годах применительно к задачам астрономии, ядерной физики, биофизики, радиофизики и в практической части опирались на созданные в то время устройства ввода-вывода изображений. В 1965 году Кули и Тьюки опубликовали реализованный ими на компьютере алгоритм быстрого преобразования Фурье (БПФ), ранее известный только узкому кругу математиков, и это стало мощным импульсом в продвижении идей и методов обработки изображений.
Необходимо отметить, что преобразование Фурье играет особую роль в задачах обработки изображений, так как оно физично. К БПФ примыкает целый ряд других дискретных ортогональных преобразований.
В данном учебном пособии рассматриваются оптические изображения, хотя в силу общности математических моделей предлагаемые методы обработки изображений являются достаточно универсальными и могут применяться для обработки широкого класса многомерных сигналов различной физической природы.
7
Несмотря на большое многообразие целей и задач обработки изображений, они допускают следующую классификацию:
- измерения на изображениях;
- улучшение качества изображений;
- спектральный анализ многомерных сигналов;
- распознавание изображения;
- сжатие данных;
- синтез оптических волновых полей.
В данном учебном пособии рассмотрены теоретические основы обработки изображений, включающие в себя математические модели и методы их обработки, соответствующие первым четырем пунктам приведенной классификации.
8
1. МОДЕЛИ НЕПРЕРЫВНЫХ ИЗОБРАЖЕНИЙ
1,1, Функция яркости
Необходимость построения математической модели возникает сразу же при необходимости использовать компьютер для обработки изображений. Оценивая “на глаз” расстояние между двумя предметами, мы не задумываемся о том, как это делается. Поручив эти задачи компьютеру, мы обязаны научить его выполнять подобные действия, то есть заложить в него соответствующие данные н алгоритмы. Хорошо известно, что компьютер в качестве данных имеет дело с массивами чисел. Таким образом, первой задачей компьютерной обработки изображений является перевод изображений в числовую форму. Это требует конкретизации самого понятия “изображение”.
Рассмотрим объект, освещенный источником света, как показано на рис. 1.1. На некотором расстоянии от объекта распределение энергии источника светового излучения, отраженного объектом, по пространственным координатам и по Длинам волн Л
описывается функцией с(хх>х2,Л)- Эта величина является неотрицательной. Ее максимальное значение в изображающих системах ограничено предельной величиной светочувствительности регистрирующих сред.
(1.1) где Сшах - максимальная яркость изображения.
Геометрические размеры ограничены характеристиками формирующей системы и размерами фоторегистрирующей среды. Будем полагать, что все изображения отличны от нуля в прямоугольной области
-Lj<x^<Lj (1.2)
-L2<X2<L?.
Человеческое зрение и видеодатчики обладают спектральной чувствительностью, описываемой функцией 5(Л). Как известно, человеческий глаз обладает чувствительностью к свету в диапазоне волн от Лт1гг=0 35мкм до Лтаг=0.78мкм При этом функция спектральной чувствительности достигает своего максимума приблизительно в середине этого диапазона и спадает к его краям.
Каждый видео датчик обладает индивидуальной характеристикой спектральной чувствительности, обусловленной физикой прибора. Имеются видеодатчики ультрафиолетового и инфракрасного диапазонов, которые широко используются, например, при проведении спектрозональных съемок Земли из космоса.
9
Как в случае наблюдения объекта человеком, так и в случае использования видеодатчика, наблюдаемое изображение является результатом усреднения функции п0 диапазону длин волн с весовой функцией s(z) и описывается выражением
Алах
/(х1.хг)= \c(x{,x2,a)s(A)M. (1.3)
Anin
Функцию в дальнейшем будем называть изображением Таким образом
изображение - это ограниченная функция двух пространственных переменных, заданная на ограниченной прямоугольной области.
Рис.1.1. Формирование изображения объекта, освещенного источником света
1.2. Оптический сигпал
В целом ряде ситуаций необходимо рассматривать не только интенсивность, но и фазу световой волны. Положим для простоты, что свет линейно поляризован. Электрическое поле в момент времени t в точке с координатами х - возбуждаемое
монохроматическим источником света, может быть записано в комплексном виде
Е(х,/) = С/(х>“^, (1.4)
2л с
где с - скорость света, со ==-частота источника света,
и(х) = Л(х>кр(х) (1.5)
оптический сигнал, имеющий амплитуду Л(х) и фазу <р(х).
Выражение (1.4), в котором пространственная и временная переменные разделены, может быть использовано и для квазимонохроматического источника света, ширина полосы частот Лео которого существенно меньше средней частоты излучаемого света
(1.6)
/со 7
10
Фотодетектор регистрирует среднюю интенсивность света надостаточно большом интервале
времени (-Г,Г), существенно превышающем период Т » 2тг/со:
/W=^y /|£(м)|2<л
(1.7)
В двумерном случае фотодетектор регистрирует изображение /(xj, х2).
Отметим, что голографическая запись позволяет регистрировать как амплитуду, так и фазу оптического сигнала через его квадратурные компоненты - синусную и косинусную составляющие, каждая из которых может быть представлена как изображение.
Рассмотрим примеры оптических сигналов.
Пример 1. Сферическая волна описывается выражением
U(x) = -~e k , |х|2 =xf +Х2 +хз . (1.8)
Iх!
Поверхность постоянной фазы — сфера.
Пример 2. Плоская монохроматическая волна, распространяющаяся вдоль оси х3, имеет вид
t-X3/1
E(xvx2,x3,t)e с' . (1.9)
Поверхность постоянной фазы - плоскость.
Отметим, что сферическая линза преобразует сферическую волну в плоскую и наоборот, как изображено на рис. 1.2
Сферическая Плоская
волна волна
Рис. 1.2. Преобразование сферической волны в плоскую
II
Интерферограмма
Явление интерференции заключается в усилении или ослаблении поля двух световых волн в зависимости от разности их фаз. Зарегистрированное изображение интерференционной картинки называется интерферограммой. Интерференционные методы исследования часто применяются в физике и технике.
Рассмотрим интерферометр Ллойда, изображенный на рис. 1.3.
Рис. 1.3, Интерферометр Ллойда
На некотором расстоянии от зеркала находится источник монохроматического света 5, в зеркале появляется мнимый источник света 5'. Рассмотрим интерференцию волн от этих двух источников в точке х, учитывая что оптический сигнал, идущий от мнимого
источника 5', отличается только запаздыванием на время т, запишем
£(/)= u(t)+U(t-z). (1.10)
Приемник света в точке х регистрирует интенсивность
= = 2- f |УЭД2Л + -^ f |С/(^2<Й + | (1.11)
-Т -т -т ~т
Вводя в рассмотрение автокорреляционную функцию оптического сигнала
1 т -Л(т) = lim — f- t)A , (112)
T-Х» 2Т _Jr
из (111) при Т —>оо получим
/(т)=2й(0)+2й(т). (1.13)
Отметим, что использовать понятие “автокорреляция” для детерминированного оптического сигнала не вполне корректно, так как оно изначально введено для случайных
сигналов, однако этот термин укоренился и широко используется в оптике и смежных науках.
Пример 3. Рассмотрим точечный монохроматический источник.
£/(/)= Л cos со/. (114)
Автокорреляционная функция вычисляется в виде
I Т А2
Я(т) = lim — Гл2 cos ®/ cos[®(/ - т)]бйг =-cos сот, (115)
2Т 'т 2®
и интерференционная картина описывается выражением
/(т)=-^—(1 + coscot) . (1.16)
2®
График функции (1.16) приведен на рис. 1.4.
12
В двумерном случае интерференционная картина будет представлять собой чередование темных и светлых полос с плавным переходом от темного к светлому. Замерив расстояние между максимумами, можно определить частоту излучения со .
О т
Рис. 1.4. Интерференционная картина для монохроматического источника.
1.3. Двумерные линейные системы
Из курса физики хорошо известно понятие оптической системы, осуществляющей преобразование изображений по правилам, определяемым совокупностью используемых в ней оптических элементов и их взаимосвязью.
С математической точки зрения под системой будем понимать правило £, ставящее в соответствие входной функции f выходную функцию g. Различают одномерные (1-D) и двумерные (2-D) системы. Одномерные системы преобразуют функции одной переменной g(x)=g[/(x)]. (1.17)
Соответственно двумерные системы преобразуют функции двух переменных г(х1,х2)=йИх1-х2)[ 018>
Оптические системы по сути своей являются двумерными, но в некоторых случаях
могут рассматриваться как одномерные.
Особое место среди всевозможных систем занимают линейные системы. Система называется линейной, если для нее справедлив принцип суперпозиции (наложения), который заключается в том, что отклик системы на взвешенную сумму двух входных воздействий равен взвешенной сумме откликов на каждое из воздействий, то есть
Ф1 f\ (Х1 > *2 )+ alh (Х1 > *2 )1 = а1 (Х1 • х2 )1+ а2 E\h (*1 х2 )1 (1 19)
Принцип суперпозиций можно выразить в более общем виде, рассматривая произвольное число К входных воздействий
.*=]
к=1
(1-20)
В изучении оптических систем фундаментальную роль играет понятие точечного источника света. Точечный источник света описывается дельта-функцией Дирака
13
(121)
Х| = 0 и х2 = О, в других случаях,
Таким образом точечный источник обладает бесконечно большой плотностью яркости в бесконечно малой пространственной области - в точке Безусловно - это математическая абстракция, однако исключительно полезная в физике и допускающая ясную физическую трактовку: дельта-функция может быть определена как предел обычной функции, например
(I 22)
Согласно выражению (1.22) дельта-функция может рассматриваться как бесконечно узкая колоколообразная функция, одномерный вариант которой приведен на рис. 1.5.
Рис. 1.5. Физическая трактовка дельта-функции Дирака
Можно также ввести дельта-функцию, расположенную не в начале координат, а в
произвольной точке с координатами (q, £2) по формуле
','51 "
10, в других случаях.
(1 23)
Дельта-функция обладает следующими важными свойствами:
Свойство нормировки:
(1.24)
—со —оо
Физически это означает, что, хотя плотность яркости точечного источника бесконечна,
энергия его ограничена и равна единице.
Фильтрующее свойство
ОО 00
f <125>
где /(^j Л2) “ произвольная функция двух переменных Доказательство приведенных свойств
14
выполняются с помощью подстановки в (1.24) и (1.25) выражения (1.22) и раскрытия предела.
Рассмотрим 2-D линейную систему, иа вход которой подан сигнал в виде дельтафункции Реакция системы на дельта-функцию будет разной для различных систем. Она называется импульсным откликом и служит характеристикой 2-D системы. Систему называют пространственно-инвариантной, если ее импульсный отклик зависит от разности координат входной (х(,х2) и выходной (£р42) плоскостей. Для оптической системы,
показанной на рис. 1.6, это означает, что при перемещении точечного источника во входной (предметной) области изображение этого предмета в плоскости наблюдения будет также изменять положение, но сохранять форму'.
Для пространственно-инвариантных систем импульсный отклик описывается функцией
(126)
где х,-^ х2-^2=^2.
(1.27)
Используя функцию импульсного отклика, можно записать уравнение, связывающее изображения иа входе и выходе 2-D линейной оптической системы. Для этого представим входной сигнал /(xj ,х2 ) в виде (1.25) и подадим его иа вход 2-D системы с характеристикой
Выходной сигнал запишем в виде
g(xi,x2)=£[/(x1>x2)]=fi.
00
(1.28)
Поскольку операция £ линейна и операция интегрирования в фигурных скобках (1.28) также линейна, их можно поменять местами и записать
СО <Х>
^•*2)= 1 /Л1.;2Ж1-^1>*2-^)к1<2 -оо —оо
Учитывая, что по определению
_^z)}s ^(х1 Л2 -£2) 9
окончательно получим выражение, устанавливающее связь между изображениями во
входной и выходной плоскостях линейной системы
00 ОО
Ж1.*2) = I f/fel^2>h-^.*2-^kl^2-
—СО—ОО
(1.29)
Уравнение (1.29) называется интегралом свертки. Из этого уравнения следует, что, зная импульсный отклик оптической системы й(^р^2), можно рассчитать выходное изображение
по входному.
15
Рис. 1.6. Оптическая пространственно-инвариантная система
Рис.1.7. Пример двумерной свертки
Процесс свертки иллюстрирует рис. 1.7. На рис. 1.7а и 1.76 изображены функция /(хРхг) на входе и импульсный отклик. На рис. 1,7в показан импульсный отклик при
обращении координат, а на рис. 1.7г - со сдвигом на величину хрх0. На рис.1.7д заштрихована область, в которой произведение /(^р^2 Х*1 ”^2)» BX°A™ee в
подынтегральное выражение (1.29), не равно нулю. Интегрирование по этой области дает величину g(xpX2) для заданных значений координат хрх2. Таким образом, функция g(xpx2) иа вьтходе может быть найдена сканированием входной функции скользящим “окном” - обращенным импульсным откликом, и интегрированием по области, в которой эти функции перекрываются
16
2. СПЕКТРЫ СИГНАЛОВ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ. ЛИНЕЙНЫЕ СИСТЕМЫ
2.1. Спектр периодического сигнала
Периодический сигнал - это полезная математическая модель, позволяющая описывать некоторые существующие в природе процессы и их преобразования.
Вспомним определение периодической функции:
/(х)=/(х + /£), (2.1)
где L - период;
1 - любое целое число, принимающее положительные и отрицательные значения.
Периодический сигнал - это сигнал, описываемый выражением (2.1). Как и всякая периодическая функция, он может быть разложен в ряд Фурье по тригонометрическим функциям
/(*)=Co + Zcirosf2’t*7~«’A (22)
t=i \ L J
При этом периодический сигнал представляется суммой синусоидальных колебаний, частоты которых кратны основной частоте . Отдельные составляющие суммы (2.2) носят название гармоник. Колебание с частотой называется первой гармоникой (£=1), с частотой уг - второй гармоникой (£=2) и т.д. Величина с0 имеет смысл постоянной составляющей. Величины let. . имеют смысл амплитуд, a , фаз гармонических составляющих ряда. Для того, чтобы равенство (2.2) выполнялось, величины ск и ф* должны быть вычислены в соответствии с видом /(х) .
Выражение (2 2) часто записывают в форме
/(х) = с0 + 2UfcCos—x + dpin—X , (2.3)
Ь=Г L L 1
где
ak - ck ; bk = c* sin , к > 1 так что
I 2 ' 2
ck=Nak^^k ,4>к=агс*£— >
ak
Коэффициенты ак и Ьк вычисляют по формулам
17
)sm^2~x dx, £>1 (2.4)
/4 S
ak=\ J f(x)cod?~xdx, bk=j- J f(x _ L*/ -d*/
/2 2
При этом постоянную составляющую определяют по формуле
L/2
СО =7 Г/(хМ (2.5)
-£/2
Ряд Фурье может быть также записан в комплексной форме:
00 2тЫ
/(*)= £ Х > (2.6)
где
2dk = ске^ = ак ~ibk (2 7)
ск =2|^|> с0 ~dQ-
Величина dk называется комплексной амплитудой и может быть вычислена по формуле
/4 _г*к
f /(х)е 1 L (2.8)
^2
Замечательным свойством ряда Фурье является то, что, если произвести усечение ряда, то есть представить функцию /(х) в виде
_/ \ 2пк , . 2пк
/W = со + 2J ак cos—х + bk sin—х fc=P L L
то для любого к получается наименьшее квадратичное уклонение от точного значения /(х), если коэффициенты вычислены по формулам (2.4), (2,5). С увеличением К приближение улучшается, н при К —> «э приближенное равенство переходит в точное.
Как видим из формул (2.6), (2.7), функция /(х) полностью определяется совокупностью величин ск и ук . Совокупность величин ск называется спектром амплитуд. Совокупность величин ук называется спектром фаз. Вообще говоря, спектром называют совокупность всех значений какой-либо величины, характеризующей систему или процесс. В физике изучают оптические спектры-разложения света по длинам волн, акустические спектры - характеристики звука, выражающие его частотный состав, рентгеновские спектры и т.д. В теории информации изучаются спектры сигналов и систем вне зависимости от их физической природы. Заметим, что из общего определения спектра не
18
следует, что в качестве спектральных компонент обязательно должны быть коэффициенты функции по тригонометрическому базису.
Введение ряда Фурье позволяют описывать периодические сигналы по всей оси - да х £ оо. Они же широко применяются в теории информации для описания сигналов, заданных на ограниченных временных или пространственных интервалах (финитных во времени или пространстве).
Например, пусть сигнал /(х) отличен от нуля на отрезке £х£ —, а вне этого 2 2
отрезка равен нулю. Используем прием периодического продолжения и рассмотрим сигнал fL (х), заданный на всей оси (рис. 2.1). Сигнал fL (х) является периодическим и может быть разложен на ряд Фурье в любой из введенных выше форм записи. В то же время на отрезке Ь /^2’ L/Q сигнал ft W совпадает с сигналом /(х), поэтому из формулы (2.6) получим
,2я£
Дх)= L Х ,(2.9)
к^ z 2
где
Подчеркнем, что формулы (2 9) и (2.10) дают спектральное представление финитного сигнала на ограниченном отрезке времени. Для решения целого ряда задач такое представление является достаточным, однако не следует забывать что оно является в значительной мере формальным и не позволяет описывать сигнал Дх) полностью (на всей оси времени). Для полного описания непериодической функции следует использовать интеграл Фупье.
19
2,2. Спектр непериодического сигнала
Будем рассматривать непериодическую функцию как предельный случай периодической при неограниченно возрастающем периоде.
Возьмем формулу (2 6) и, подставив в нее значение dk из выражения (2.8), получим
1 "° i--x L2 -i — x
/М=7 Ее L f Лх)е L
k~-<x> _L/
/2
Формулы (1.11)и(1.13) являются основными в теории спектров сигналов. Они представляют собой пару преобразований Фурье, связывающих между собой вещественную функцию времени f(x) и комплексную функгщю частоты ^(со). Для обозначения этой связи будем использовать в дальнейшем символическую запись:
Дх)—- > ^(и), —----> f(x).
При этом функция /(х) описывается суммой бесконечно большого числа бесконечно малых колебаний бесконечно близких частот. Комплексная амплитуда каждого такого колебания составляет величину:
<& = —У(ш)с7со. (2.11)
л
Частотный интервал между двумя соседними колебаниями бесконечно мал и равен da. Величина
= (2,12)
da
выражает не непосредственно спектр, а так называемую спектральную плотность, то есть распределение сигнала по спектру. Однако эту деталь обычно опускают и называют F(a) комплексным спектром непериодического сигнала, а абсолютное значение (модуль) этой
величины называют просто спектром.
Рассмотрим некоторые свойства спектров, основанные на свойствах преобразования Фурье.
Перейдем к пределу при у -> ос. Вместо введем основную круговую частоту ш.
Эта величина есть частотный интервал между соседними гармониками, частота которых . k „
равна При предельном переходе сделаем замену по следующей схеме:
Т—> оо, tn —> da, 2л-> а ,
Т
где а - текущая частота, изменяющаяся непрерывно, da - ее приращение Сумма перейдет в
20
(213)
или
/(х) = f , (2.14)
-ОС
где
У(ш)= J/(x)e‘,<ax<&. (2.15)
-00
Линейность. Если F} (со) и F2(cd) - спектры функции /j(x) и /2(х), а а} , а2 -
произвольные комплексные числа, то спектр функции
/(х) = “1/](х)+а2/2(х)
равен
F(co) = а} Fj (со)+a2F2 (о) или в символической записи
/(х) = aj/j (х)+а2/2 (х)—> F(co) = а j Fj (со)+a2F2 (со). (2.16)
Смысл соотношения (2.16) кратко выражается так спектр суммы равен сумме спектров.
Изменение масштаба. Если a - действительное число, то
/(«)_£_> . (2.17)
[а] )
Особый интерес представляет случай при a - -1, тогда
/(-х)-А->Я(-ш). (2.18)
Свойство запаздывания. Если функцию /(х) сдвинуть на величину Q, то спектр функции /(х-£) окажется
(219)
г
Таким образом, при сдвиге функции /(х) на величину Q, ее Фурье-образ умножается на
е~1Ш^ , при этом изменяется только фаза, а модуль остается без изменения.
Перенос спектра. Если о - действительное число, то
F(co - gj) = ^[/(x)]e7tcir ,
(2.20)
то есть перенос спектра по частоте на ш приводит к появлению дополнительного множителя
1ПХГ А
е перед функцией исходного сигнала.
21
Спектр производной. Выполняя дифференцирование обеих сторон соотношения (2 14)
$ раз по х, получим
^^ = S"l[(to)IF(w)], (2.21)
dx
то есть дифференцирование функции соответствует умножению ее спектра иа (ко). При этом, конечно, полагается, что производная в левой части (2.14) существует.
Все перечисленные свойства элементарно доказываются из соотношений (2.14) и (2,15).
Теорема о свертке. Сверткой двух функций Д (х) и /2 (х) будем называть функцию /(х), определяемую соотношением 00
/(*)= (2.22)
Вычислим спектр этой функции:
—00 —00 —00 —00 —00 —00
Здесь после перемены порядка интегрирования сделана замена переменной по формуле
Итак, спектр функции /(х) есть
K(w)=F1(<B)F2(W). (2.23)
Теорема Парсеваля. Рассматривая интеграл от произведения двух функций /Дх) и /2(х) ’ нетрудно получигь соотношение 00 00
f/iMZzW* = 7- 1 Fi(®)F2(~a>)<*i>, (2.24)
или, с учетом F(-©)= F(co) ,
со 1 °0
1А W/2 Р1 (®И> (2 25)
—ОО -СО
Для частного случая j\ « f2 получаем соотношение
ОО СО
f/(x)A = ± f|F(<o)[2rf®. (2 26)
—00 —00
известное как формула Парсеваля.
22
2.3. Спектры импульсов
Рассмотрим спектры импульсных сигналов, наиболее часто встречающихся в практике. Прямоугольный импульс (рис. 2.2) выражается формулой
(2.27)
Рис. 2.2. Прямоугольный импульс и его спектр
Фурье-образ этой функции равен:
F(co) = с?[Пд(х)] = f -^-e^dx = -sin^A = sine—, (2.28)
2£ cd L Tt
sin x ,
где smex =----- называется функцией отсчетов.
x
Если прямоугольный импульс сдвинуть на величину £, то, согласно свойству запаздывания, получим
= (2.29)
CD £ It
Графики функции и компоненты ее спектра приведены на рис. 2.3.
Функция отсчетов произвольной частоты ш имеет вид
23
z/ \ тих sin tax /п ол\
f(x) - sine ——-. (2.30)
л tax
Спектр ее вычислим из соотношения взаимности. Если F(co) ~ Фурье-образ функции /(х),
то в результате прямого преобразования Фурье получим
F(x)——»2я/(- со).
(2 31)
Это соотношение вытекает из равенства
Л/с.2.5. Сдвинутый прямоугольный импульс и его спектр
В соответствии с формулами (2.28) и (2.31) получим
F(co) = ^ sinc^^ =2иП_(со)-
График функции отсчетов и ее спектр изображены на рис.2.4. Отметим, что спектр функции отсчетов вещественен и лежит в ограниченной полосе частот.
Два прямоугольных импульса разной полярности - "меандр" - имеют аналитическое
выражение
S(x)=nL(x + l)-n£(x-l).
(2.33)
24
Фурье-образ такой функции вычислим, используя свойства линейности и запаздывания,
ч sino£f _sin~®£
----- е -е 1 = 2/--------- aL \ J g)L
Графики меандра и его спектра приведены на рис. 2.5.
Рис, 2.5. Два прямоугольных импульса разной полярности и спектр их суммы
25
Треугольный импульс (рис. 2.6) можно записать в виде формулы
(2.35)
Легко убедиться, что функция (2.35) представляет собой интеграл от функции (2.33), деленный на 2L, то есть спектр функции (2.35) связан со спектром функции (2.33) S(a>)
соотношением
откуда искомый спектр
ЛШ) = ф£(х)]=±^)1.
(2.36)
Используя выражение (2.34), получим
2
~ sin coZ 11 .2 ®Z
F(co) = 2r--------—==smc —
co L 2L it
(2.37)
Замечаем, что спектр в данном случае - вещественная неотрицательная функция (см. рис.2.7).
Экспоненциальный спад описывается функцией, отличной от нуля, только прн х > 0:
Спектр функции вычисляется по формуле 00 1
с,/ \ Г -ах -нах , 1
г\со)=|е е ах~-------------
i а + /со
или через амплитуду и фазу со t -i-arctg * а
_______е Г2, 2 а + со
График амплитуды и фазы экспоненциального импульса приведен на рис.2.7
Двусторонний экспоненциальный спад выражается как
/М = е’Ф1
(2.38)
(2.39)
(2-40)
(2-41)
Спектр такого сигнала имеет вид
О °® 1 1 о
гр/ х f ах -itax . , f -ах -i(sbx , 11 ха *
л(со)= е е at + е е ах =-------------------+--------= —------- (2 42)
J J a-i® a + ia
и является вещественной функцией.
26
Рис. 2.7. Спектр экспоненциального импульса
'll
Функция Гаусса имеет вид
2 X 2
/(*)=* ° . (2.43)
Спектр ее вычисляется с помощью таблиц интегралов и имеет вид
2 2 СО а
Г(а)=а^е 4 , (2.44)
то есть также описывается гауссовской функцией, в чем и состоит двойственность рассматриваемого сигнала. График функции (2.43) приведен на рис. 2.8а, а график функции (2.44) на рис. 2.86.
Связь между длительностью импульса и шириной его спектра
Рассмотрим результаты этого параграфа в аспекте длительности импульса и ширины его спектра. У прямоугольного импульса длительности L ширина основного лепестка спектра пропорциональна величине . Чем выше крутизна спада экспоненциального импульса (чем больше а), тем шире его спектр; аналогичным свойством обладает гауссовский импульс. Представление о связи д лительности импульса с шириной его спектра вытекает из свойства изменения масштаба в преобразовании Фурье (2.17)' если длительность функции уменьшена в а раз, то во сколько же раз возрастает ширина спектра функции. При этом полагается, что определения длительности импульса А и ширины спектра Ао остаются неизменными. К практическому их определению можно подходить из энергетических соображений. В частности, под длительностью импульса следует понимать промежуток времени, в котором сосредоточена подавляющая часть энергии импульса,
А х+-2 00
J /2(4H = nJ/2fcH, (2.45)
А —оО
X--
2
где х - характерная точка, определяющая местоположение импульса на оси времени;
ц - доля полной энергии импульса, приходящаяся на промежуток А .
Аналогичным образом можно определить и ширину спектра:
Асо so
j|F(co)|2 d® = т] J|F(co)|2 d®. (2 46)
О О
Из уравнений (2.45) и (2.46) при заданном ц определяют Д и А©. Например, при 77=0,9 говорят, что длительность импульса и ширина спектра определены на уровне 0,9 по энергии
28
Так, для экспоненциального импульса (2.38) при ?т=0,9 имеем Д = 1.155—, Дю =6.16а, а
Дю измеряется в радианах в секунду.
Рис.2.8. Гауссовский импульс (а) и его спектр (б).
2.4. Спектры обобщенных функций
Представление о непрерывной среде или непрерывном поле, вытекающее из основных понятий классической математики, стало на определенном этапе тормозом в математической физике. Это послужило толчком для широкого развития теории обобщенных функций. Теория разрешает много неясных вопросов о преобразовании Фурье физических сигналов и создает удобный аппарат целого ряда прикладных задач. Рассмотрим наиболее важные для теории информации обобщенные функции.
Дельта-функция 8(х) введена физиком Дираком. Значение ее равно нулю всюду, кроме одной точки, где оно равно бесконечности, но интеграл от дельта-функции равен единице.
Вместо того, чтобы точно определить дельта-функцию, достаточно указать ее основное, фильтрующее свойство:
00
= (2.47)
29
где f(x) - любая достаточно “хорошая” функция, которая имеет непрерывные производные всех порядков. При х = 0 имеем соотношение
]б(?)/(СН = /(<>)• (2 48)
Функция единичного скачка (Хэвисайда) (рис. 2.9) задается выражением
и(х) = (’’ Х>0’ (2.49)
|0, х<0.
Легко заметить, что введенные функции связаны соотношением
S(x) = ^4f) (2.50)
d х
Можно также ввести функцию и(х - £), описывающую единичный скачок в момент времени £ .
Mr)
| ------------------
0 х
Рис. 2.9. Единичный скачок
Из дальнейших рассуждений увидим, что введенные здесь обобщенные функции являются очень полезными при решении задач преобразования сигналов в линейных системах, однако встречаются лишь на промежуточных этапах преобразований, а в окончательных результатах отсутствуют.
Рассмотрим спектры обобщенных функций.
Спектр дельта-функции определяется на основании ее фильтрующего свойства (2.48):
У[й(х)]= J 5(х)е= 1(ш), (251)
-ОО
где 1(со) - функция, принимающая значение 1 при -ос < о < оо (рис. 2.10).
Отсюда видим, что дельта функция обладает бесконечно широким равномерным спектром. С точки зрения связи длительности импульса и ширины его спектра здесь имеет место предельный случай: бесконечно узкий импульс имеет бесконечно широкий спектр.
Спектр функции 5(х - имеет вид
У[б(х-<;)]= = .
30
Модуль его равен 1(со), а фаза линейна (рис. 2.11).
Спектр функции и(х) может быть вычислен с учетом соотношения (2.50) на основании свойств преобразования Фурье
^[б(х)] = ,
откуда
Ф(*)]=—^[5(»)1=— •
IG) «В
(2.52)
Теперь рассмотрим сигналы, спектры которых выражаются через обобщенные сигналы.
Спектры гармонических функции cos их и sin их :
coswr Л[е- +е—+ (2.53)
1 Г
sin их = — е 2/L
-КЗ*
-е
•>in [б (со + и) - б(© - и)].
(2-54)
2.5. Двумерное преобразование Фурье
Пусть /(хрХ2) - функция двух переменных. По аналогии с одномерным преобразованием Фурье, определенным формулами (2.14) и (2.15), можно ввести двумерное преобразование Фурье
/(»1>Л2)=—у f jF(<a1,<o2)e"'0>|Il+'“2l2dco1rf<o2,
4’С00 “ °° (2.55)
f(co1,co2)= f {/(х1>хг)в ,<0,Х| КЙ|Х2<&>1<*>>2. __ — со
- jfax, +®iX2)
Функция е 1 1 1 х при фиксированных значениях , со2 описывает плоскую волну в плоскости (хрх2) (рис.2.12).
Величины Oj , ©2 имеют смысл пространственных частот и размерность лш-1 , а функция , со2) определяет спектр пространственных частот.
Сферическая линза способна вычислять спектр оптического сигнала (рис. 2.13).
На рис.2.13. введем обозначения:
, , 2ях. 2пх? м _
ф - фокусное расстояние, ю ~(2.56)
Хф Хф
Двумерное преобразование Фурье обладает всеми свойствами одномерного преобразования, кроме того отметим два дополнительных свойства, доказательство которых легко следует из определения двумерного преобразования Фурье.
31
Рис.2.12. Иллюстрация к определению пространственных частот
32
Рис.2.13, Вычисление спектра оптического сигнала с использованием сферической линзы
Факторизация
Если двумерный сигнал факторизуется
то факторизуется и его спектр
,F2(<e2).
Пример. Прямоугольная апертура (рис. 2.14) описывается факторизуемой функцией /(^Ь*2) = /1(^1)/2(^),гДе /1(*1) = П£|(х1), /2(*2) = П£2(х2).
Используя результат (2.28), получаем выражение для двумерного спектра
Р(., Ш1^1
sin q)2Z2 ®2^2
Радиальная симметрия
Если двумерный сигнал радиально-симметричен, то есть
/(х,,х2)а/(г), г = 7^2 +х2 >
то из (2.55) следует
f(r) = jpF(p)30(pr)<7p, о со
^(р)= Jr/(r)30(pr)rfr, о
(2.57)
(2.58)
(2-59)
(2.60)
(2-61)
где 30(рг) - функция Бесселя нулевого порядка.
33
Формулу (2.61), определяющую связь между радиально-симметричным двумерным сигналом и его пространственным спектром называют преобразованием Ганкеля
Рис.2.14. Прямоугольная апертура
2.6. Оптические линейные системы в частотной области
Введем понятие частотной характеристики линейной системы, определив ее как преобразование Фурье импульсного отклика (1.27):
#(©!,ш2)г J Jh{x^, х2)е Z0>1Xi 1Ш1Х2dx\ dx2 - (2 62)
Тогда спектры сигналов /(хрх2) и Их1»х2) 30 входной н выходной плоскостях, соответственно, связаны соотношением:
G(®р (о2 )= J > ю2 ) 1, <о2). (2.63)
При этом импульсный отклик может быть вычислен через частотную характеристику с использованием обратного преобразования Фурье
^(хрх2)=~У J |я(<о1,®2)е^Х|+/^^^С)1^2 •
X —со—со
(2 64)
34
3. ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЙ В КОМПЬЮТЕРЕ
3.1, Средства ввода изображения
Техническая задача, которую необходимо решить в компьютерной обработке изображений, это ввод оптических изображений в память компьютера и вывод (визуализация) изображений. К счастью, в современных компьютерах задача визуализации решена. Для этих целей используется высокоразрешающие цветные дисплеи и другая техника отображения информации.
Ввод изображений в память компьютера осуществляется с помощью видеодатчиков. Видеодатчик переводит оптическое распределение яркости изображения в электрические сигналы и далее в цифровые коды. Поскольку изображение является функцией двух пространственных переменных, а электрический сигнал является функцией одной переменной - времени, то для преобразования используется развертка Например, при использовании телевизионной камеры, изображение считывается по строкам: строка за строкой. При этом в пределах каждой строки зависимость яркости от пространственной координаты х преобразуется в пропорциональную зависимость амплитуды электрического сигнала от времени I. Переход от конца предыдущей строки к началу следующей осуществляется практически мгновенно. Широкое применение в качестве видеодатчиков находят также матрицы фотодиодов и матрицы приборов с зарядовой связью. При использовании матричных видеодатчиков изображение как бы наблюдается сквозь экран с множеством прозрачных ячеек. Число таких ячеек для современных видеодатчиков весьма велико и составляет величину 1024x1024 и более (см. рис. 3.1).
Исходное изображение, как уже
। Y отмечалось, представляет собой функцию
О О о\ двух непрерывных аргументов. В то же
k время цифровая память компьютера
6 О О О О о\ способна хранить только массивы данных.
9 Поэтому ввод изображения в компьютер
0-0—О-О-О-О О-О-О^Ъ неизбежно связан с дискретизацией
п! *1 ___
изображений по пространственным
Рнс3.1. Фрагмент матричного видеодатчика к00рдинатам и по яркости
3.2. Дискретизация изображений
Рассмотрим непрерывное изображение /(xi,X2) - функцию двух пространственных переменных х ну на ограниченной прямоугольной области (рис. 3.2).
35
Введем понятие шага дискретизации Aj по пространственной переменной х^ и Д2 По переменной х2 Например, можно представить, что в точках, удаленных друг от друга на
расстояние А| по оси xj расположены точечные видео датчики Если такие видеодатчики установить по всей прямоугольной области, то изображение окажется заданным на двумерной решетке
Рис.3.2, Переход от непрерывного изображения к дискретному Для сокращения записи обозначим
(3.1)
/(nA,n2A2)s/h>«2) (3-2)
Функция /(и|,и2) является функцией двух дискретных переменных и называется двумерной последовательностью. То есть дискретизация изображения по пространственным переменным переводит его в таблицу выборочных значений. Размерность таблицы (число строк и столбцов) определяется геометрическими размерами исходной прямоугольной области и выбором шага дискретизации по формуле ’2^/‘ _ /д1_
(3.3)
У2 =
где [...] обозначает целую часть числа.
Если область определения непрерывного изображения - квадрат Li=L2-L, и шаг дискретизации выбран одинаковым по осям и х2 (Л^Дз^Л), то
(3.4)
и размерность таблицы составляет N2.
Элемент таблицы, полученной путем дискретизации изображения, называют "пиксел ” или "отсчет”. Рассмотрим пиксел fin^n^). Это число принимает непрерывные значения.
Память компьютера способна хранить только дискретные числа. Поэтому для записи в памяти непрерывная величина f должна быть подвергнута аналогово-цифровому
36
преобразованию с шагом Д/ (см. рис 3.3).
Операцию дискретизации непрерывной величины по уровням часто называют квантованием. Число уровней квантования, при условии что значения функции яркости лежат в интервале + равно
е=[4С
L/4T
(3.5)
В практических задачах обработки изображений величина Q варьируется в широких пределах от Q=2 (“бинарные5’ или ‘‘черно-белые” изображения) до £>=210 н более (практически непрерывные значения яркости). Наиболее часто выбираются Q=2\ при этом пиксел изображения кодируется одним байтом информации. Из всего вышеуказанного делаем вывод, что пикселы, хранящиеся в памяти компьютера, представляют собой результат дискретизации исходного непрерывного изображения по аргументам и по уровням. Ясно, что шаги дискретизации Дь Д2 должны выбираться достаточно малыми, для того, чтобы погрешность дискретизации была незначительна, и цифровое представление сохраняло основную информацию об изображении.
При этом следует помнить, что чем меньше шаг дискретизации и квантования, тем больший объем данных об изображении должен быть записан в память компьютера. Рассмотрим в качестве иллюстрации этого утверждения изображение на слайде размером
Рис.3.3. Квантование непрерывной величины 50x50 мм, которое вводится в память с помощью цифрового измерителя оптической плотности (микроденситометра). Если при вводе линейное разрешение микроденситометра (шаг дискретизации по пространственным переменным) составляет 100 микрон, то в память записывается двумерный массив пикселов размерности №=500x500=25x104. Если же шаг уменьшить до 25 микрон, то размеры массива возрастут в 16 раз и составят №=2000x2000=4x106. Используя квантование по 256 уровням, то есть кодируя найденный пиксел байтом, получаем, что в первом случае для записи необходим объем 0.25 Мегабайт памяти, а во втором случае 4 Мегабайта.
С физической точки зрения выбор шага дискретизации диктуется шириной пространственного спектра изображения. Чем больше ширина спектра , тем меньше шаг дискретизации Д. Практически при дискретизации стремятся удовлетворить соотношению Д<<2/^ *
номер уровня
4- г
3 • I---
____I____1_____
2Л м
(3.6)
37
4. ПОСЛЕДОВАТЕЛЬНОСТИ И ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ
4.1. Последовательности
При цифровой обработке непрерывный сигнал f(t) представляется набором своих значений (отсчетов) в дискретные моменты времени - последовательностью. Мы ограничимся рассмотрением наиболее распространенного на практике случая, когда интервал между отсчетами (шаг дискретизации во времени) постоянен и равен А.
Для записи последовательности будем пользоваться одним из двух обозначений: /=И"Д)} или f = {/(л)}. В обоих случаях п- целое. Первая запись определяет значения элементов последовательности как значения непрерывного сигнала в дискретные моменты физической шкалы времени, то есть непосредственно отражает процесс дискретизации сигнала:
Длд)=/(О| ,=вД . (4.1)
Во второй записи в качестве аргумента дискретного сигнала используется просто порядковый номер отсчета п, которому в этом случае придается смысл дискретного безразмерного времени. Второе обозначение короче и поэтому предпочтительнее, одиако в случаях, когда требуется учитывать реальный масштаб времени, применяется первое.
Интервал определения последовательности может быть конечным, полубесконечным или бесконечным Прн п е , У2 ], где , W2 ’цеяь,е’ имеем последовательность конечной длины, при левостороннюю, а при яе(^,оо) правостороннюю
последовательность. При ле(-оо,оо) последовательность является двусторонней (бесконечной, неограниченной по аргументу). Для унификации рассмотрения всякую последовательность обычно приводят к бесконечной, полагая отсчеты, лежащие вие интервала определения, тождественно равными нулю. При этом данная классификация по существу относится не к области определения, а к области, в которой значения последовательности могут отличаться от нуля.
Последовательность называется детерминированной, если можно точно указать ее значения для любого момента дискретного времени п. Последовательность - случайная, если ее элементы - случайные величины. Пока мы будем рассматривать только детерминированные последовательности.
Приведем примеры важнейших детерминированных последовательностей.
38
Единичный импульс:
z ч f 1, п = О
(42)
Графическое изображение единичного импульса приведено на рж.4.1. Аналогично определяется и единичный импульс, сдвжутый на отсчетов:
Rtc.4.1. Иллюстрации единичного им пульса
Единичный скачок:
1,и>0
0,п<0.
(4.4)
Графическое изображение единичного скачка показано на рис.4.2. Единичный скачок
можно выразить через единичный импульс.
к=о
/Ъс. 4.2. Иллюстрация единичное о скачка
Приведенные обозначения единичного импульса и единичного скачка являются стандартными и используются далее везде.
Дискретный прямоугольный импульс дпины И:
39
[0,п <О или n>N.
Эта последовательность (рис.4.3) очевидным образом выражается через единичного импульса или единичного скачка:
jV-1
(4.5)
функщм
Иллюстрация дискретного прямоугольного импульса
Дискретная правосторонняя экспонента:
/(»)=
ап, п> О
п >~а и
(4.6)
График госледовательности гри 0 < а < 1 показан на рж.4.4.
Нлс.4.4. Иллюстрация дискретной правосторонней экспоненты
Дискретная комплексная экспонента задается выражением f{n) = eiwn, (4.7)
где i - мнимая единица, о ♦ константа, имеющая смысл безразмерной частоты. Последовательность (4.7) играет исключительно важную роль при анализе сигналов и систем в частной области (см .раз д 5)
40
4.2. Дискретные ЛПП-системы
Будем называть дискретной системой некоторое правило £ - преобразования одной последовательности f, называемой входной, в другую последовательность g, называемую выходной.
В общем вице это преобразование обозначается
Ы")}=</-(< (48)
Дискретная система £ называется линейной, если дня нее соблюдается принцип суперпозиции, то есть для любых /j, /2 и постоянных а.Ь
(»)+*Л(л)11 = a^fx W}1+ *Ф2(л)Ц- (4 9>
Дискреттая система с постоянными параметрами характеризуется тем, что, если справедливо соотношение (4.8), то справедливо и соотношение
И”-”о)}=еК/’(”-ло)}1 (41°)
при любом прлом п0. Иными словами, такая система обладает свойством инвариантности к сдвигу во времени задержка входного сигнала приводит к равной задержке выходного сигнала без изменения самого закона преобразования входа в выход
Дискретные системы, обладающие одновременно свойствами линейности и инвариантности к сдвигу, называются дискретными линейными системами с постоянными параметрами (JU U 1-системам и) Классу ЛЛП-систем принадлежат многие алгоритмы цифровой обработки силилов и дискретные модели реальных динамических объектов. Для таких систем даиболее глубоко разработаны математические методы анализа и синтез а. Мы ограничимся рассмотрением именно этого класса дискретных систем.
Чтобы описать систему с информационной точки зрегая, нужнз указать конкретное травило преобразования входного сигнала в выходной. J11И 1-систему можно огисать с помощью ее импульсной характеристики
Импульсная характеристика Л дискретной J11111-системы определяется как реакция системы на выходное воздействие в форме единичного импульса:
{*(»)}= е[{5(«)}]. (4.11)
Импульсная характеристика исчерпывающим образом описывает ЛПП-систему с точки зрения преобразования сигналов. Действительно, любую последовательность на входе Л ПП-системы можно представить в виде бесконечной суммы
/(»)= £/(*)3(Л-Л). (4.12)
В силу соотношения (4.9) преобразование суммы равно сумме преобразований
41
слагаемых. Каждое слагаемое в сумме (4.12) есть сдвинутый единичный импульс с коэффициентом - значением соответствующего отсчета входной последовательности. Согласно (4.10) и (4.11) каждый такой импульс дает на выходе отклик в виде сдвинутой импульсной характеристики с тем же коэффициентом. Полная выходная последовательность записывается в виде1
?(”)= £/(*)*(”-*)• (413)
£ = —оо
Таким образом, знания импульсной характеристики достаточно, чтобы по выходной последовательности вычислил» выходную.
Выражение (4.13) задает свертку последовательностей f и h. Часто используется его краткая символическая з апись:
Я”) = /(”)*й(”)- (4.14)
Отметим некоторые легко доказываемые свойства свертки (пусть а, b и с - произвольные последовательности)
коммутативность
д(и) * ^(и) = ^(я) * д(л) i (4.15)
ассоциативность
a(n)*[b(n) ♦ с(и)] = [д(и)* й(и)] ♦ с(и) (4.16)
дистрибутивность
а(и)*[&(я)+с(и)]= д(и)*б(и) + а(и)*с(и); (4.17)
для любой последовательности а
а(п)* б(и - и0) = а(и - и0 ) (4.18)
при любом целом w0 (так газываемое фильтрующее свойство единичного импульса)
Легко показать, что, если ЛГШ-система состоит из JV тюследователъно соединенных звеньев с импульсными характеристиками то ее импульсная характеристика
h равна свертке импульсных характеристик з веньев:
h(n) = (и)* /ц (и)*... (и) (4.19)
При параллельном соединении звеньев их импульсные характеристики суммируются, то есть для системы в целом
h(n)~ \(п) + Й2(л)+—+^у (и) , (420)
1 Здесь и далее полагаем, что последовательности, входящие в выражения вида (4.13) таковы, что эта сумма ряда сходится при любом конечном п.
42
4.3. Физическая реализуемость иустойчивоспъ ЛПП-систем
Дискретная система называется физически реализуемой, если значение выходной последовательности в гроиз вольный момент зависит только от значений входной последовательности фи п<п$. Иначе говоря, для физически реализуемой системы отклик не опережает входное воздействие.
Для независимости выхода физически реализуемой дискретной ЛПП-системы от “будущих” значений входной последовательности требуется, чтобы в свертку (413) все значения f{k) при k > п входили с нулевыми коэффициентами Очевидно, это выполняется, если h(n) = 0 при п < 0. (4.21)
*
Это условие является необходимым и достаточным для физ теской реализуемости ЛЛП-системы.
Дискретная система называется устойчивой, если любому ограниченному входному воздействию соответствует ограниченный отклик, иными словами, при
|/(«)|<A/Z (4.22)
выполняется и
\g(n)\<Mg, (4.23)
где A/у, М % -некоторые положительные константы. Необходимым и достаточным условием устойчивости дискретной J11111-системы является абсолютная суммируемость импульсной характеристики;
£|Л(й)|<со. (4.24)
Докажем это. Рассмотрим ограниченную входную последовательность г( 1 ПрИ А(-'О20-/w) ~~ « т / \ л (4-25)
-1 при Л(- и) < 0.
Определим значение последовательности на выходе системы фи п = 0. В соответствии с формулами (4.13) и (4.25)
g(o)= £/(*>(-*)= 5>(-*)|= ХШ-к=-<х> к~-<х> к--ао
Пусть условие (4.24) не выполняется Но тогда конечное значение g(o) отсутствует, то есть нет выходной последовательности, удовлетворяющей условию (423); система не является устойчивой Следовательно, выполнение условия (4.24) является необходимым
43
условием устойчивости системы. Для доказательства достаточности предположим, что условие (424) выполняется, и на вход системы поступает ограниченная последовательность, то есть справедливо неравенство (4 22) Тогда, используя свойство коммутативности свертки (4.13) получаем:
£л(*)/(л-А:)
|«(я)| =
* 2М)Н/("-*)|* Mf ЕК*)| = Mg <« . £—-00 k = -~QO
то есть всегда выполняется соотношение (4.23) выходная последовательность ограничена, и система устойчива.
Теперь, после введения понятий устойчивости и физической реализуемости можно дать простую, но важную классификацию ЛПП-систем по форме импульсной характеристики У ЛПП-систем с конечной импульсной характеристикой (КИХ-систем) как следует из самого названия, импульсная характеристика представляет собой последовательность конечной длины, то есть Л(п) = 0 при п € #2] КИХ-системы всегда устойчивы, так как для них
сумма (4.24) конечна. При Щ > 0 такие системы являются физически реализуемыми
ЛПП-системы с бесконечной импульсной характеристикой (БИХ-системы) имеют в качестве импульсной характеристики правостороннюю, левостороннюю или двустороннею последовательность, то есть Л(п) = 0 дои л < Л) или Л(п) = 0 при n > , или h(n) 0 дои
п£(-со,<ю). Такие системы могут быть неустойчивыми Требование физ теской реализуемости здесь выполняется только в первом случае дои?/| > 0.
Если у КИХ- или ШХ-системы импульсная характеристика равна нулю дои п < Д') < 0,, то такая система тоже может быть реализована, если допустить задержку в получении сигнала на выходе. Величига этой задержки должна быть достаточной чтобы ’’сдвинуть" импульсную характеристику в область деотридательных значений аргумента, то есть не меньше (-Л)). Строго говоря, при этом реализуется де исходах система, а другая, эквивалента последовательному соединению системы и звена задержки. Однако в большинстве практических приложений такая замета вЕплде допустима.
4,4. Ro постные уравнения
Как следует из выражений (4.13) и (4.21) дня физически реализуемой БИХ-системы значение последовательности на выходе зависит от текущего и всех предыдущих значений входной последовательности Описанье (4.13) де является конструктивным в том смысле, что де позволяет практтески построить БИХ-систему. для получения каждого значения выходной последовательности требуется выполнить бесконечное число операций сложения
44
и умножения. Число операций можно сделать конечным, если выразить текущее значение выходной последовательности не только через входные, но и через предыдущие выходные значения. При этом получаем описание ЛПП-системы в виде линейного разностного уравнения с постоянными коэффициентами'.
М N
sW = IXgfa-/)* <4-26)
где|ау j, коэффициенты уравнения, M,N - целые константы, характеризующие сложность системы
Величина М при ам * 0 определяет порядок разностного уравнения (ЛПП-системы). БИХ-системы всегда имеют ненулевой порядок и являются рекурсивными: для них каждое следующее значение выходной последовательности вычисляется через Л/ предыдущих. В частном случае, когда все коэффициенты {fly | равны нулю, уравнение (4.26) описывает нерекурсивную КИХ-систему, имеющую нулевой порядок.
Заметим, что разностное уравнение (4.26) при конечных описывает более узкий класс физически реализуемых ЛПП-систем, нежели свертка (4.13). Для некоторых форм импульсной характеристики переход от свертки к разностному уравнению осуществить не удается. Впрочем, такие "неприводимые" случаи на практике не встречаются и поэтому ниже не рассматриваются.
Обратный переход от разностного уравнения (4.26) к свертке (4.13) возможен всегда, его осуществление означает выражение выходной последовательности через входную в явной форме, то есть решение разностного уравнения Методы решения разностных уравнений хорошо разработаны. В простейших случаях продуктивным является последовательное отыскание отсчетов выходного сигнала путем прямой подстановки в уравнение с дальнейшим обобщением результата методом математической индукции
Пример. Пусть физически реализуемая ЛПП-система первого порядка описывается разностным уравнением
SW=ag(n -1) + /(л) , (4.27)
где а - постоянный коэффициент. Получим описание системы в виде свертки. Конкретный вид входной последовательности f не задан, поэтому решить непосредственно уравнение (4.27) нельзя. Найдем вначале импульсную характеристику системы. В соответствии с определением импульсной характеристики (4 11) уравнение (4.27) можно переписать в виде
Л(л)= ah(n -1)+ б(л). (4 28)
Рассматриваемая система физически реализуема, поэтому все значения импульсной характеристики при л<0 равны нулю (см. формулу (4.21)). При л>0 значения импульсной
45
характеристики определяются прямой подстановкой в уравнение (4.28) предыдущих значений с учетом формулы (4.2):
Л(0) = дА(-1)+5(0) = л0 + 1 = 1;
/»(1) = аА(0)+ &(1) = а 1+0 = а ;
Л(2) = аЛ(1) + б(2) = а а + 0 = а2 ;
Нетрудно заметить (и строго доказать), что импульсная характеристика имеет вид правосторонней экспоненты (4.6):
h(n)-a”u(n). (4.29)
С учетом свойства коммутативности свертки (4.13), а также выражения (4.4) для единичного скачка получаем окончательный результат:
g(w)= £*(*)/(*-*) = • (4.30)
к-~<х> к~~яо к~0
Заметим, что при решении разностного уравнения (4.26) прямой подстановкой необходимо задавать начальные условия, число которых зависит от сложности уравнения. Так, для получения решения при п>0 нужно задать j?(-l)Jj(-2)3...,а также 2),.. .,/(-#)„ то есть всего (M + ;V) величин.
Метод прямой подстановки, будучи громоздким, имеет весьма ограниченное применение. Существуют другие, более мощные аналитические методы решения разностных уравнении, позволяющие сразу получить результат в общем виде. Один из таких методов, основанный на применении z -преобразования, мы рассмотрим позже.
Описание ЛПП-системы с помощью разностного уравнения имеет важное практическое значение, поскольку непосредственно определяет алгоритм преобразования входной последовательности в выходную. По разностному уравнению легко строится структурная схема ЛПП-системы, состоящая из комбинации типовых элементов, осуществляющих операции суммирования (рис. 4.5а), умножения на коэффициент (рис. 4.56) и задержки (сдвига) последовательности (рис. 4.5в).
а) б) в)
Рис.4.5. Типовые элементы структурных схем ЛПП-систем.
а) элемент суммирования; б) элемент умножения; в) элемент задержки. На рнс.4.6 представлена структурная схема, соответствующая прямой реализации ЛПП-системы по разностному уравнению (4 26). Эта структурная схема системы является
46
наиболее очевидной, но не единственной. Возможны другие варианты структуры той же системы (с меньшим числом элементов задержки). Предлагается построить их
Рис.4.6, Пример структурной схемы для прямой реализации ЛПП-системы по разностному уравнению
4.5. Двумерные последовательности
Обобщим изложенное выше на случай двумерных сигналов (изображений).
Двумерный дискретный сигнал (последовательность) может быть получен из двумерного непрерывного сигнала /(хрх2) путем его дискретизации по аргументам. Пусть интервалы между отсчетами сигнала (шаги дискретизации) по каждой координате плоскости аргументов постоянны и равны Aj, А2 , то есть двумерная последовательность задается
выражением
/(л1Д1,и2Д2) = /(х1,х2)
Xj = n^Aj
(4.31)
х2 = «2А2
при целочисленных л,, л2 . Формула (4.31) определяет последовательность
f ~ V (ч|И2А2)) чеРез значения непрерывного сигнала в дискретных точках плоскости
аргументов, то есть непосредственно отражает процесс дискретизации сигнала. В тех случаях, когда “привязка” отсчетов к физической шкале непрерывных координат не играет роли, можно воспользоваться более кратким и удобным обозначением последовательности:
47
f - (/(лрл^)} > Где л2 приобретают смысл порядковых номеров отсчетов по координатам.
Следует заметить, что термин “последовательность” формально перенесен сюда из теории одномерных сигналов и в данном контексте не вполне корректен Действительно, для отсчетов на плоскости нет объективно существующего “следования” (то есть отношения порядка, описываемого понятиями “раньше” - “позже”), а имеется просто их двумерная совокупность или, как говорят, решетка отсчетов.
Заметим также, что, если в одномерном случае существовал единственный способ дискретизации с постоянным шагом, то для двумерного мы имеем бесконечное множество ее вариантов, отличающихся наклоном прямых, “вдоль” которых берутся отсчеты сигнала Записанная выше процедура формирования двумерной последовательности соответствует так называемой прямоугольной решетке (см. рис. 4 7а). В некоторых системах ввода изображений используется дискретизация по треугольной решетке (см. рис.4.76), которая как показывают исследования, обеспечивает определенные преимущества при обработке двумерных сигналов. Ниже мы будем рассматривать только двумерные последовательности, заданные на прямоугольной решетке, поскольку этот случай наиболее распространен на практике.
Рис.4.7. Положение отсчетов двумерной последовательности на плоскости аргументов непрерывного сигнала: а) прямоугольная решетка, б) треугольная решетка.
Укажем некоторые важнейшие детерминированные двумерные последовательности. Двумерный единичный импульс:
1 при п, - пэ = 0 ?
Л Л А (4.3;
О при П) 0 или «2*0.
б(^,л2) =
48
Графическое изображение единичного импульса представлено на рис.4.8.
Двумерный единичный скачок:
“(”p»2)=o
при > 0 и > О,
при < 0 и «2 < О-
на рис.4.9. Приведенные обозначения
Эта последовательность изображена единичных импульса и скачка будем использовать везде далее.
Двумерная экспоненциальная функция первого квадранта:
(4.33)
двумерных
Д»|,»2)=в”'ЙЛги(л1,»2). (434)
Изображение этой последовательности для 0 < а, b < 1 дано на рис. 4.10.
Двумерная дискретная комплексная экспонента задается выражением
(4.35)
где i - мнимая единица, а},а2 * вещественные константы, имеющие смысл безразмерных пространственных частот (см. раздел 5).
Важный класс двумерных последовательностей составляют разделимые последовательности, те, которые можно представить в виде произведения:
/("р"2)=Л(л1)/2(л2) (4-36)
Для разделимых последовательностей многие задачи анализа и синтеза двумерных сигналов и систем решаются наиболее просто, так как сводятся к решению соответствующих “одномерных” задач. Все рассмотренные выше двумерные последовательности, очевидно, являются разделимыми. Например,
5(«1. л2 )= 5(л1 Кп2 \ “(л1 > л2 ) = “(л1) “(л2 ) ’
где ), б(и2), и(пх \ и(п2) - одномерные единичные импульсы и скачки.
Как и в одномерном случае, можно дать классификацию двумерных последовательностей по форме области ненулевых значений отсчетов. Правда, здесь вместо четырех классов последовательностей (конечной длины, бесконечных, право- и левосторонних) мы будем иметь гораздо большее многообразие. Так, только для разделимых последовательностей, опираясь на классификацию одномерных последовательностей, входящих в (4.36), можно указать 16 классов. Столь громоздкая классификация не очень удобна для анализа, поэтому мы ограничимся разделением двумерных последовательностей всего на два класса: на последовательности конечной длины:
/(П1,л2)=0 при Л1 ejAZpAj
или п2 е [л/2,^21 5
49
где Л/ j, Л/2 ’ > ^2
целые константы <^), и на последовательности
бесконечной длины, для которых записанное условие не выполняется. Детализацию второго класса будем вводить по мере необходимости
Рис.4.8. Двумерный единичный импульс
Рис.4.9. Двумерный единичный скачок
Рис.4,10. Двумерная экспоненциальная функция первого квадранта
50
4.6. Двумерные дискретные ЛПП-системы
Двумерной дискретной системой будем называть правило £, ставящее в соответствие одной двумерной последовательности / называемой входной, другую двумерную последовательность g, называемую выходной. В общем виде это соответствие (преобразование) записывается в виде
U("pn2)}=elU(”l’n2)}l' <438)
Определение двумерных дискретных линейных систем с постоянными параметрами (ЛПП-систем) аналогично определению одномерных: для них должен соблюдаться принцип суперпозиции:
4Wi(nPn2)+6/2(nPn2)ll= a£lU(nPn2)}kM{/2(nP«2)}J (4 39)
для любых /|, f2 и постоянных о, Ь, и они должны обладать свойством инвариантности к сдвигу сигнала по каждой координате, то есть
МЛ1 -*>p л2 -т2)}= ^(л1 -ШРЛ2 -OT2)}1 (4 4°)
прн любых целых т^, т2 . Системы, для которых выполняется условие (4.40), называются еще пространственно-инвариантными (изопланатичными).
Импульсная характеристика h двумерной дискретной JLLII 1-системы определяется как реакция системы на входное воздействие в форме двумерного единичного импульса.
{л(лрл2)}=4{б(лРл2)}1- (4-41)
Импульсная характеристика исчерпывающим образом описывает двумерную Л1Ш-снстему с точки зрения преобразования сигналов. Выходная последовательность определяется через двумерную дискретную свертку импульсной характеристики и входной последовательности1:
g(/ipH2)= X ХЛ('”р'”2)/(л1_'”ри2_,л2)- <4-42)
/Tlj =—СО Wlj =-со
Ниже наряду с (4 42) будем использовать краткую символическую запись двумерной свертки:
г(лрП2)=й(и1эп2)**7(лрл2)- (4 43)
Двумерная свертка обладает всеми свойствами одномерной свертки: коммутативностью, дистрибутивиостью (см. п.4.2) н, кроме того, рядом дополнительных свойств, вытекающих именно из двумерности рассматриваемых последовательностей. Так,
’ Здесь и далее полагаем, что последовательность, входящая в выражения вида (4.42) таковы, что эта сумма сходится при любых конечных , п2 .
51
если h и f - разделимые последовательности, то и выходная последовательность также разделима. Действительно, при выполнении соотношений (4.36) н
Л("1>л2) = А1(л1)Л2(л2) (4-44)
из (4.42) получаем:
«(л1>л2)= Е *ОТ|)Л(”2-'лг)=
?Л1=-ао?П2^—ао
т^~—<х> т^=-<л
тре обозначено
«1(л1)= Ей1('л1)л(л1-,л1^ «2(л2)=
Л1] =“00 «2=-<ю
Иначе говоря,
1*1 (и,) h2 (п2 )] * *|У1 (Л1) /2 (л2)] = Ц) * Л (л, )J х 1*2 (и2) * /2 («2 )]. (4 45)
то есть для разделимых последовательностей двумерная свертка вычисляется через произведение одномерных.
Если импульсная характеристика двумерной J11И 1-системы разделима (выполняется соотношение (4.44)), то для произвольного входного сигнала
г(л1>л2)= 2 Л2('Л2)/(Л1-Л!1>Л2“,Л2)=Л1(Л1)*А2(Л2)*/(Л1-Л2)> <4 46)
«2=—СО
то есть операция двумерной свертки сводится к последовательному выполнению двух одномерных сверток. Это означает, что преобразование сигнала двумерной ЛПП-системой с разделимой импульсной характеристикой эквивалентно его последовательному преобразованию двумя одномерными системами, действующими во взаимоперпендикулярном направлении: с импульсной характеристикой по
координате и с импульсной характеристикой (л2) по координате л2 .
Развивая аналогию между одномерными и двумерными системами, отметим, что, как и в одномерном случае, двумерные ЛПП-системы могут характеризоваться фундаментальными свойствами физической реализуемости и устойчивости. Двумерная система называется устойчивой, если любому ограниченному входному сигналу соответствует ограниченный выходной сигнал, то есть при
|Л”1>л2)|5Л//
выполняется и
52
где некоторые положительные константы. Необходимым и достаточным
условием устойчивости двумерной дискретной ЛПП-системы является абсолютная суммированиесть импульсной характеристики:
Е ЕМ”1’”2^<<:0 (447)
п1=^°
Доказательство этого факта такое же, как и в одномерном случае, предлагается выполнить самостоятельно. С понятием физической реализуемости двумерных систем дело обстоит сложнее, этот вопрос требует отдельного рассмотрения.
4,7. Физическая реализуемость двумерных систем
Вспомним, что мы называли физически реализуемой такую одномерную систему, у которой выходной сигнал ие зависел от входного сигнала в опережающие моменты времени, то есть от его "будущих” значений. Однако, как уже отмечалось, в двумерной последовательности аргументы являются не временными, а пространственными, для ее отсчетов не определено отношение порядка типа "прошлое" - "будущее", и поэтому, строго говоря, понятие физической реализуемости системы не имеет смысла. Тем не менее на практике обычно приходится искусственно вводить указанное отношение и для двумерного сигнала, задавая некоторое правило его развертки (упорядочения отсчетов) в одномерную последовательность. При этом понятие физической реализуемости вновь приобретает смысл,
но оказывается жестко связанным с конкретным видом развертки.
Известны различные, в том числе и довольно сложные способы развертки, используемые в устройствах ввода и обработки двумерных сигналов. Наибольшее
распространение получила развертка телевизионного типа. Пусть имеется двумерная
последовательность конечной длины, отвечающая условию (4.37). Представим
прямоугольную область ее ненулевых отсчетов в виде матрицы размерами (Mj-мх + 1)х^2-м2 +1):
{/(«,, и2)} =
/(МрМ2+1)
/(м1+ии2) +i,jw2+i)
/Цл2) 1
/(м, +1Л2)
W.w2)
/(^,л/2+1)
... /(^Л2) J
Развертка телевизионного типа заключается в последовательном упорядочении строк или столбцов этой матрицы. Очевидно, существует восемь вариантов такой развертки: начиная с каждого из четырех углов матрицы, по ее строкам и столбцам. Мы ограничимся
53
рассмотрением лишь одного, наиболее часто используемого варианта - строчной развертки в направлении возрастания аргументов. В этом случае осуществляется так называемое лексикографическое упорядочение отсчетов, в результате которого они выстраиваются в одномерную последовательность вида
АЩ, м2 \ , м2 +1) .... ,n2 )
f(Mt +1,Л/21/0и, +1,Л/2 +1,у21...(/(^л2).
Для простоты изложения далее будем считать, что размеры матрицы отсчетов достаточно велика, чтобы не обращать внимание на нерегулярность строчной развертки, то есть на ее скачки с конца каждой строки на начало следующей. С учетом этой оговорки, для строчной развертки области “прошлого” и “будущего”, заданные относительно некоторого отсчета /(«j, п2 ), на плоскости аргументов выглядят так, как показано на рис 4.11. При этом из соотношения свертки (4.32) следует, что независимость выходных отсчетов g(n^,n2) от будущих (в принятом смысле) значении входного сигнала обеспечивается, если h(m^,m2)~0 при «|-0, т2<0 и при <0и любых т2.
Условие (4.48) является необходимым и достаточным для физической реализуемости двумерной ЛПП-системы при строчной развертке сигнала, его графическая иллюстрация дана на рнс 4.12а.
Часто к двумерной системе предъявляется более жесткое требование физической реализуемости при любом порядке возрастания аргументов , п2 выходного сигнала, то есть и при строчной развертке, и при ее транспонированном варианте - развертке по столбцам. В этом случае приходим к следующему необходимому и достаточному условию реализуемости:
= 0 при < 0 и любом пь,,
’ а (4.49)
и при любом и т2 < 0.
Двумерная J11111-система, для которой выполняется это условие, называется каузальной, иллюстрация для ее импульсной характеристики дана на рис.4.126.
Наряду с каузальными системами иногда приходится рассматривать н полукаузальные ЛПП-системы, для которых
,т2)=0 при Щ|<0 или т2<0 (4 50)
(см. рис.4.12в, г) Для таких двумерных систем считается, что вся строка (или столбец) матрицы отсчетов сигнала соответствует одному и тому же моменту времени. Соответственно, есть “прошлые” и ’’будущие” строки (столбцы), но отсчеты внутри каждой строки (столбца) поступают на обработку одновременно (параллельно).
54
И, наконец, существуют некаузальные двумерные ЛПП-системы, то есть такие, для которых не налагается никаких ограничений на область ненулевых значений импульсной характеристики Их одномерными аналогами являются физически нереализуемые ЛПП-системы.
Заметим, что, если импульсная характеристика двумерной системы является разделимой последовательностью (см. (4.34)), то прослеживается простая связь между физической реализуемостью составляющих ее одномерных систем и каузальностью. Если одномерные ЛПП-системы с импульсными характеристиками и обе физически реализуемы, то двумерная система является каузальной, если физически реализуема лишь одна из одномерных систем, то двумерная система полукаузальна, если обе одномерные физически нереализуемы, то двумерная некаузальна.
В заключение параграфа отметим, что, как и в одномерном случае, можно выделить двумерные ЛПП-системы с конечной и бесконечной импульсной характеристикой (КИХ- и БИХ-системы). У двумерной КИХ-системы импульсная характеристика - двумерная последовательность конечной длины. Такая система либо является каузальной, либо может быть приведена к каузальной системе введением задержки по строкам и столбцам при получении выходного отсчета. Как следует из (4.47), двумерная КИХ-система всегда устойчива.
Двумерная БИХ-система, как и ее одномерный аналог, в общем случае может быть и физически нереализуемой (иекаузальиой), и неустойчивой.
Рис. 4.11. Области “прошлого” и "будущего” при строчной развертке
55
а) б) _
I — 1 f ton
ь _J г и 2 - • * j ' ’1 ► - 1 1 4 • t- i — 1 г ' £ г
j 1 —-ж 1 f 1 ’ ч > - J 1 J , 1 — J t г <
L J > * • J 1 [— —1 11 t ч 1 — «
Рис.4.12. Области потенциально ненулевых значений импульсных характеристик двумерных ЛПП-систем (отмечены крестиками): а) - система, физически реализуемая при строчной развертке; б) каузальная система; в) каузальная система; г) полукаузалъные системы.
1 ' 1 j c.
- L Л ’ - 1 k
1 и 1 4 i : • 1 r
*1 L 1 ► J Г 3 L J i “'i
•1 J г > ► 1 J f . i 2 *
1 L П * 4
4.8. Двумерные разностные уравнения
Двумерные системы, обладающие свойством физической реализуемости при заданной развертке сигнала, во многих случаях можно описать, указав способ рекурсивного вычисления отсчетов выходной последовательности. Для двумерной ЛПП-системы такое описание дается в форме двумерного линейного разностного уравнения с постоянными коэффициентами:
H”t>”2)= s Z %,т2 «(«I ~ml’n2 ~m2)+ S S bmvm2 /("1 -m2),(4.51)
где " кОЭФФициенть1 уравнения, Qj , Qg - конечные множества
индексов, по которым производится суммирование отсчетов входной (/) и выходной (g) последовательностей.
Множества Qj- и Qg должны выбираться так, чтобы при заданном способе развертки двумерных сигналов используемые в (4.51) отсчеты входной последовательности не были “будущими” по отношению к текущему моменту (точке (п^ ,п2) на плоскости аргументов), а
56
отсчеты выходной последовательности были строго “прошлыми” Так, например, для
каузальной двумерной ЛПП-системы уравнение (4.51) записывается в виде:
М{ Му Ыу
И«Р«2)= Е Ъ Е Е -'к2)'(4 52)
т,=0 т7=0 “ т.=О m7=Q
foXMo.o)
где Л/|, Л/2, NvN2 - целые константы, характеризующие сложность системы.
Пара значений (мрЛ/2) при
max
0<w2<.W2
max О£т}<М}
>0
> 0 и
ашуМ^
определяет порядок разностного уравнения (4.52) (каузальной ЛПП-системы) по каждой из координат. Для БИХ-систем хотя бы одна из этих величин положительна, такие системы являются рекурсивными: в них каждый следующий отсчет выходной двумерной последовательности вычисляется через (л/) + 1)(л/2 + 1)-1 предыдущих. В частном случае, когда все J равны нулю, уравнения (4.51) и (4.52) описывают нерекурсивную КИХ-систему порядка (0,0). Для нее, очевидно, имеет место совпадение разностного уравнения со сверткой (4.51) при конечной импульсной характеристике
./ V {Ьт,т, прн
' 1 2/ 0 при
Как средство описания ЛПП-системы разностное уравнение имеет очевидное преимущество перед сверткой в нем каждый отсчет выходной последовательности может вычисляться за конечное число операций сложения и умножения, даже если импульсная характеристика системы неограниченна (число слагаемых в выражении свертки бесконечно). В то же время следует иметь ввиду, что представление в виде разностного уравнения удается применить далеко не к каждой двумерной ЛПП-системе. Во-первых, еще раз напомним, что такое представление имеет практический смысл, только если Jll II 1-система физически реализуема, и, следовательно, ее импульсная характеристика удовлетворяет известным ограничениям (например, в случае строчной развертки двумерного сигнала - условию (4.48)). Во-вторых, импульсная характеристика даже физически реализуемой системы может быть такова, что в разностном уравнении (4.51) потребуется использовать бесконечные множества Qf , Qg
(для каузальной системы уравнение (4.52) будет иметь бесконечный порядок). На вопросах переходов от импульсной характеристики двумерной ЛПП-системы к разностному уравнению (в случае, когда это возможно) и обратно мы остановимся позже в разделе 6.
57
Рис.4.13. Схемы вычисления отсчетов двумерной выходной последовательности по разностному уравнению (4.51)
Разностное уравнение (4.51) непосредственно определяет алгоритм преобразования двумерного сигнала дискретной физически реализуемой ЛПП-системой. Для иллюстрации такого преобразования часто используется условная схема вычисления отсчетов выходной последовательности, общий вид которой представлен на рис.4.13. Из этого рисунка становится очевидным, что, если последовательности f и g рассматриваются не на всей плоскости аргументов, то для осуществления рекурсивных вычислений по разностному уравнению необходимо задать довольно много начальных условий. Так, в случае каузальной ЛПП-системы, описываемой разностным уравнением (4.52), для получения отсчетов выходной последовательности в первом квадранте (при «j > 0 и п2 > 0) требуется указать значения g(«pW2) при
- A/j £ < 0 и п2 £ -Л/2 , Л] £ 0 и -М2 п2 < 0, а также рассматривать входной сигнал /(«рИ2) не только в первом квадранте, ио и при
- Nj < «! < 0 и и2 £ -N2 ,
> 0 и - Ы2 < п2 < 0 .
Ниже при использовании разностных уравнений мы будем считать, что входные и выходные сигналы заданы на всей плоскости аргументов, поэтому указывать начальные условия нам не потребуется.
58
5. ОПИСАНИЕ ДИСКРЕТНЫХ СИГНАЛОВ И СИСТЕМ В ЧАСТОТНОЙ ОБЛАСТИ
5.7. Частотная характеристика ЛПП-систем и спектры дискретных сигналов Весьма ценным для анализа ЛПП-системы является ее описание с помощью отклика на синусоидальный входной сигнал. В теоретических исследованиях вместо такого сигнала обычно берется комплексная экспонента, имеющая для непрерывного времени вид
/0=в'П' , (5 1)
где Q - угловая частота, имеющая размерность радиан/единица времени. Такая комплексная экспонента тесно связана с вещественным синусоидальным колебанием, поскольку известно, что для любых <р
= cos<p + jsincp, (5.2)
к? . e + e • е e /с
cos ф =------, sin <p = --—---. (5.3)
Как следует из формул (5.1) и (5.3), отклик системы на вещественное синусоидальное колебание всегда можно получить линейной комбинацией откликов на две комплексные экспоненты противоположных по знаку частот.
Для рассматриваемого нами дискретного случая сигнал (5.1), в соответствии с соотношением (4.1), преобразуется в последовательность вида (4 7) - дискретную комплексную экспоненту Д\ iQt iQArt 1<лп
”)=е 1=«д = е =е (5-4)
Обратим внимание на введение в выражение (5.4) безразмерной частоты
о = ОД , (5.5)
использование которой является традиционным при описании дискретных сигналов и систем вне связи с реальным масштабом времени.
Итак, пусть на вход дискретной J11111-системы поступает последовательность (5.4). Тогда выходная последовательность запишется в виде
*(„)= £*(*)/(„_*)= g h(k)e~'ak .
k=-(x> k--<x>
Мы получили выходную последовательность, совпадающую с входной с точностью до множителя, зависящего от частоты. Этот множитель
59
н(е'“)= (5.6)
называется частотной характеристикой дискретной ЛПП-системы Частотная характеристика задает "коэффициент передачи" ЛПП-системой с ее входа на выход специфического сигнала - комплексной экспоненты для каждого значения ее частоты и.
Частотная характеристика определена тогда, когда ряд (5 6) сходится. Условие устойчивости ЛПП-системы (4.24) одновременно является и условием абсолютной сходимости этого ряда. Таким образом, для устойчивой системы частотная характеристика определена всегда1.
Выражение (5.6) позволяет вычислить частотную характеристику по импульсной. Установим и правило обратного перехода, для чего умножим обе части выражения (5.6) на etain и проинтегрируем по интервалу частоты (-я, я) (учтем при этом, что равномерно сходящийся ряд можно интегрировать почленно):
j Яр°’]/ав</<В = |е,<оп . (5.7)
-Л -Я ”<эо -л
Вычисление интегралов под суммой с учетом формулы (4.3) дает
f= (2я ’ ” ~ Ч = 2л8 (л - *), 0 ,и # к
-л J
выражение (5.7) приводится к свертке и, в соответствии со свойством свертки (4 18), упрощается:
j Нfezc° jet<ando = ^h(k)2я8(w-k) == 2nh(w)♦ 5(n)~2ith(n) .
-1t ^=-C0
Таким образом, окончательно будем иметь
(5.8)
Выражения (5.6) и (5.8) известны в математике соответственно как прямое и обратное преобразование Фурье функции дискретного аргумента (последовательности) h.
1 Отметим, что ряд (5.6) можно рассматривать как степенной от комплексной переменной z = .
Известно, что степенной ряд, абсолютно сходящийся на некотором множестве точек (в нашем случае - на единичной окружности в плоскости z или, что одно и то же, на всей числовой оси вещественной переменной <в ), на том же множестве сходится равномерно. Этот факт равномерной сходимости нам понадобится ниже
60
Преобразование Фурье функции иначе называется ее спектром. Частотная характеристика
ЛПП-системы есть спектр ее импульсной характеристики
Преобразование Фурье можно записать и для произвольной последовательности fl:
4еН= е f^v,wk >
4 1 к=-<ю
(5 9)
4екяЪ'ви</а> . (5 10)
2л J \ 7
-71
Выражение (5.9) определяет спектр последовательности, а выражение (5.10) -представление последовательности через спектр. Будем считать, что ряд (5.9) сходится (на условиях сходимости ряда и, следовательно, существования спектра мы еще остановимся в следующем параграфе).
Спектральное представление сигналов и систем широко применяется при анализе измерительной информации, синтезе фильтров и т.д. Описание ЛПП-системы посредством частотной характеристики во многих случаях проще и удобнее описания во временной области. Убедимся в этом, установив связь спектров последовательностей на входе и выходе системы. Спектр выходной последовательности с учетом ее выражения через свертку (1.13) запишется в виде2
g(/“) = fgWe-/eW,= £ J f(k) e"'* .
Заменим переменную для внутренней суммы j = т-к. Тогда
g(>)= E/U) Еh(j)e-^+k^ tftk)*-"0* .
к=-<х> j--<x) к--<ю
Принимая во внимание выражения (5.6) и (5.9), получаем весьма простое соотношение
Таким образом, частотная характеристика ЛПП-системы однозначно связывает спектры входной и выходной последовательностей, то есть действительно, как и импульсная характеристика, полностью описывает систему с точки зрения преобразования сигналов.
1 Здесь и ниже любое преобразование последовательности (спектр в данном разделе, z -преобразование в следующем) будет обозначаться прописной буквой, соответствующей строчной букве, которой обозначается сама последовательность.
2 Можно обосновать допустимость перестановки сумм при условии ограниченности последовательности/и абсолютной суммируемости Л.
61
Сопоставление формул (4 13) и (5 11) показывает, что свертка последовательностей преобразуется в произведение спектров. Этот факт часто используют при анализе прохождения сигналов через ЛПП-систему и вообще при вычислении сверток: применение прямого и обратного преобразования Фурье и соотношения (5.11) по сложности вычислении иногда оказывается проще непосредственного использования формулы (4,13).
5.2. Основные свойства спектров последовательности
Перечислим некоторые наиболее существенные свойства спектров последовательностей. Для определенности будем в основном говорить о спектрах дискретных сигналов, хотя все сказанное, с точностью до обозначений, остается справедливым и для частотной характеристики дискретной ЛПП-системы Вначале приведем несколько свойств, качественно характеризующих спектры.
Свойство 1. Достаточным (ио не необходимым!) условием существования спектра последовательности f является абсолютная сходимость ряда (5.9):
£| /(«)!<«>• (5.12)
Л=-0О
При выполнении условия (5.12) спектр (5.9) есть непрерывная функция частоты <о. Соответственно, как уже отмечалось, частотная характеристика ЛПП-системы определена и непрерывна в случае, если система устойчива (см. формулу (4.24)). Если условие (5.12) ие выполняется, то ряд (5.9) либо расходится (при этом, естественно, спектр не определен), либо сходится условно (не абсолютно). В последнем случае спектр существует, хотя возможно не для всех значений частот, и может иметь разрывы.
Свойство 2. Спектр последовательности - периодическая функция частоты. Его период равен 2тс, то есть elG} j = для любого целого к. Это очевидным образом
вытекает из периодичности по частоте дискретной комплексной экспоненты, используемой в выражениях (5.9) и (5.10): icon i2nkn icon e J = e e ~e
В силу этого свойства для полного описания спектра достаточно задать его на любом интервале частот длиной в период. Обычно используется интервал о е [0,2л ).
В общем случае спектр - комплексная функция, которую можно представить через
вещественную и мнимую части или через модуль и фазу:
Fie l = ReFle 1-HlmFi е 1 =
Указанные компоненты спектра обладают следующим свойством.
62
Свойство 3. Если f - вещественная последовательность, то модуль и вещественная часть ее спектра являются четными функциями частоты, а фаза и мнимая часть - нечетными Элементарное доказательство этого свойства предлагается произвести самостоятельно.
Принимая во внимание периодичность спектра и рассматривая его на интервале о е [0,2тс) , данное свойство можно сформулировать иначе: модуль н вещественная часть спектра симметричны, а фаза и мнимая часть антисимметричны относительно середины интервала (точки = я ). Такая симметрия позволяет полностью описать спектр вещественной последовательности, задав его лишь на половине периода, то есть при ед е [0, л) . Рассмотрим примеры, иллюстрирующие указанные свойства.
Пример 1, Определим частотную характеристику ЛПП-системы первого порядка из (4.27). Импульсная характеристика системы задается выражением (4.29). Частотную характеристику -спектр импульсной характеристики - получим, подставив выражение (4.29) в (5.6):
//(<'“) = Хь(к)е-М
4=-оо
= ^аке-,ак^^е-1а^ . к-0 4=0
(5.13)
Полученная сумма геометрической прогрессии сходится, и притом абсолютно, если ае~1с*
Одновременно обеспечивается и сходимость ряда (4.24), то есть устойчивость системы. Пусть система устойчива. Тогда после суммирования ряда (5.13) получаем
=---------!-------- .
1-ае~™ I-acosGJ + iasinca
Модуль и фаза частотной характеристики определяются соответственно по формулам
1 — I
11 /| (----- "" ~ ........................... = ,
^/(1-acosto)2 + a2 sin2 и у 1+ а2-2а costa rr( . Я SIM GJ
arg//1e )- -arctg---------.
1-acosco
Частотная характеристика зависит от синуса и косинуса частоты, то есть является периодической (см. свойство 2). Семейства графиков для ее модуля и фазы при различных значениях параметра а приведены на рис.5.1. Видно, что частотная характеристика - непрерывная функция частоты. Так как импульсная характеристика системы вещественна, частотная характеристика обладает симметрией на рассмотренном интервале (см. свойство 3).
Если|д|>1 , то ряды (4.24) и (5.6) ие сходятся, система неустойчива, и ее частотная
характеристика не существует.
Пример 2. Последовательность
/(n)^ Sin Ю°”
Tin
ие удовлетворяет условию (5.12), но ее спектр существует на интервале частот [о, л]
точки о = ю0 и равен
(5.14)
всюду, кроме
63
( fl, О^ю<юп,
Fl?® M ° (5.15)
' fO,C00 <G) 71.
»rro легко проверяется подстановкой выражения (5.15) в (5.10) с учетом симметрии спектра. Для данной последовательности ряд (5.9) является условно сходящимся, и ее спектр имеет разрыв в точке ю = ш0.
ЛПП-система с импульсной характеристикой вида (5.14) называется идеальным фильтром низких частот дискретного времени. Этот фильтр удаляет из входного сигнала все спектральные составляющие в диапазоне частот < о < тс. Такая система не является ни физически реализуемой, ни устойчивой, но тем не менее играет важную теоретическую роль в задачах синтеза цифровых фильтров.
Следующие свойства спектров касаются различных действий с ними.
Свойство 4 Преобразование Фурье линейно. Это означает, что для любых последовательностей /j, /2 н постоянных а, Ъ из соотношения
/з(")= °/1 Й+Ц (") <516)
следует
е l = ard е l + d/^le L (5 17)
Свойство 5. Сдвиг последовательности соответствует умножению ее спектра на комплексную экспоненту, а именно, если
/2(”) = /1(л-по) > <518>
то
~ ( ко) с( ко) ,е |ПЧ
F2I е l = FJ е \е . (5.19)
Такое преобразование спектра оставляет неизменным его модуль, но прибавляет к фазе слагаемое (- ип0), , линейно зависящее от частоты.
Свойство 6. Инверсия (изменение знака аргумента последовательности) соответствует инверсии частоты в спектре, то есть если
/2w=/l(-«). (52°)
то
A2(e'<“) = Fl(e",<°) (521>
Если инверсии подвергается вещественная последовательность, то с учетом 4-го свойства модуль и вещественная часть ее спектра остаются без изменения, а фаза и мнимая часть меняют знак, то есть получаем спектр, комплексно-сопряженный исходному.
64
Справедливость выражении (5.17), (5.19) и (5.21) легко проверяется подстановкой последовательностей (5.16), (5 18) и (5.20) в формулу (5 29).
2 л
Рис.5.1. Модуль и фаза частотной характеристики ЛПП-системы первого порядка
Свойство 7. Свертка последовательностей соответствует произведению их спектров, то
о
есть последовательность
(5.22)
имеет спектр
Г* f ’
е
КО
Л ко '1 е
(5-23)
Й»
Это важное свойство в других обозначениях уже доказывалось и обсуждалось в предыдущем параграфе.
Свойство 8. Произведение последовательностей соответствует свертке их спектров, а
именно, если
/з(”)=Д(п) ЛМ »
(5.24)
65
то
= j . (5 25)
-л
Если говорить точнее, формула (5.25) определяет так называемую круговую (циклическую) свертку периодических функции н • Дл* доказательства данного
свойства покажем, что из соотношения (5.25) следует соотношение (5.24) Подставим
формулу (5.25) в выражение обратного преобразования Фурье (5 10) и далее переменим
порядок интегрирования1:
( ко) „ ( Ла>-ф]) fen , ,
е F21 е 1 J е ауа®
Введем новую переменную для внутреннего интеграла и = со - ф , получаем:
Все подынтегральные выражения - периодические, интегрирование идет по периоду, поэтому можно сдвинуть пределы интегрирования для внутреннего интеграла, тогда
что и требовалось доказать
5,3. Соотношение между спектрами непрерывных и дискретных сигналов
Как уже отмечалось, дискретный сигнал - последовательность - обычно получают посредством дискретизации непрерывного сигнала. Дискретизация оказывает влияние на характеристики сигнала и, в частности, изменяет его спектр. Определим, как соотносятся между собой спектр исходной непрерывной функции времени и спектр полученной из нее последовательности.
Известно, что непрерывный сигнал /(г) и его спектр FH(Q) связаны между собой парой преобразований Фурье:
1 Для допустимости перемены порядка интегрирования достаточно, чтобы подынтегральное выражение (то есть спектр F3 ) было ограниченным.
66
FH(O)« //(О* ‘^dl , (5.26)
-00
FH(Q)e'nr<m, (5.27)
Z7t J
где Q - угловая частота. Выражение (5.26) определяет спектр непрерывного сигнала (прямое преобразование Фурье), а выражение (5.27) дает представление сигнала через спектр (обратное преобразование)1.
Чтобы сравнить спектр (5.26) со спектром последовательности (5.9), нужно выразить последний в сопоставимых координатах, то есть задать спектр последовательности в виде функции размерной частоты. Подставляя выражение для частоты (5.5) в формулы (5.9) и (5.10), получаем
X е’04)» £/(*д)е_/П4* , (5.28)
' к=^п
It
А
В выражениях (5.28) и (5 29) использовано обозначение последовательности, отражающее процесс дискретизации непрерывного сигнала (см. формулу (4.1)). Спектр последовательности в формуле (5.28), в отличие от формулы (5.29), зависит от шага дискретизации А и является периодическим по частоте £1 с периодом 2я/Д.
Установим связь выражений (5.28) и (5.26)2. Для этого, с учетом формулы (4.1), перейдем от непрерывного сигнала (5.27) к последовательности
.со ©о (2т+1)к/А
/(Лд)=-5-jFH(Q)e,QA"<S2 = J- X рн«2)е,ПДл^.
-со т=-°о
1 Для взаимно однозначного соответствия непрерывного сигнала и его спектра достаточно, чтобы тот и другой были абсолютно интегрируемыми на (-°°,с0), кусочно-непрерывными и кусочномонотонными.
2 Дальнейшие преобразования ведутся в предложении, что функция F* ограничена и абсолютно интегрируема на (-оо,оо).
67
Здесь на втором шаге произведена тождественная замена несобственного интеграла бесконечной суммой интегралов по смежным интервалам длиной 2я/Д . После введения
для каждого слагаемого новой переменной интегрирования Q' = Q -—т получаем
Изменим порядок суммирования и интегрирования, отбросим ненужный штрих в обозначении частоты и учтем, что = 1 Тогда
Сравнение полученного выражения с выражением (5.29) выявляет искомое соотношение между спектрами:
F(e'nA)=4 Z л.( (530)
т=~аэ 7
Таким образом, спектр последовательности состоит из суммы бесконечного числа спектров непрерывного сигнала, сдвинутых друг относительно друга на 2я/Д .
Если спектр непрерывного сигнала ограничен по полосе частотой я/Д, то есть
FH(Q) = 0 при|£2|>я/Д, (5.31)
то в диапазоне Г2е(-хД,тгД), определяющем один период спектра последовательности, г[е'ПЛ] = 7^н(п) .
Этот факт иллюстрирует рис. 5.2 (на этом и следующем рисунках для простоты изображения спектры считаются вещественными). Очевидно, что в данном случае можно однозначно восстановить спектр непрерывного сигнала по спектру последовательности, а следовательно, и сам непрерывный сигнал по дискретному.
Если ограничение (5.31) не выполняется, то возникает эффект наложения спектров, выражающийся в том, что высокочастотные составляющие спектра непрерывного сигнала попадают в область более низких частот в спектре последовательности (рис. 5.3). Этот эффект всегда нежелателен, поскольку из-за него теряется взаимно однозначная связь спектров; часть информации, содержащейся в непрерывном сигнале, необратимо теряется при дискретизации.
Эффекта наложения можно избежать, если дискретизировать непрерывный сигнал с достаточно высокой скоростью: для выполнения неравенства (5.31) нужно, чтобы верхняя
68
частота Qe в спектре непрерывного сигнала была меньше тс/Д , или, соответственно, шаг
дискретизации
Д < .
Неравенство (5.32) представляет собой ограничение, налагаемое на шаг дискретизации непрерывного сигнала известной теоремой Котельникова.
5.4. Описание двумерных дискретных сигналов и систем в частотной области
Пусть на вход двумерной ЛПП-системы подается двумерная дискретная экспонента (4.35). При условии сходимости суммы (4.42) для данного входного сигнала на выходе системы имеем
g(^2> 1 £^1,И2)еЬ(",-».Ь2(»г-з)] =
=-^т2 =~°о
=е4<»1»1+<»2«2) £ ^т^т2у‘^+^ =—оо
Получили выходную двумерную последовательность, совпадающую с входной с точностью до множителя, зависящего от пространственных частот , ш2 . ^тот множитель
f (5.32)
x/nj ——оо
называется частотной характеристикой двумерной дискретной J11 ill-системы. Частотная характеристика задает коэффициент передачи J11111 системы прн входном сигнале -двумерной комплексной экспоненте для каждого значения параметров со1 и со2 . Выражение (5.32) задает прямое преобразование Фурье двумерной последовательности. Такое преобразование иначе называется двумерным (пространственным) спектром. Частотная характеристика двумерной ЛПП-системы есть пространственный спектр ее импульсной характеристики.
По формуле (5.32) можно установить и правило обратного перехода, то есть выразить импульсную характеристику двумерной системы через частотную1:
| j б/о2 , (5.33)
4я _х
1 Вывод этого соотношения, аналогичный выводу для одномерного случая (см. п.5.1), предлагается
выполнить самостоятельно,.
69
данное соотношение определяет обратное преобразование Фурье двумерной последовательности h.
Рис.5.2. Пример спектров непрерывного и дискретного сигналов
Рис. 5.3. Пример спектра непрерывного сигнала и дискретного с наложением спектров
Преобразования Фурье можно записать и для достаточно произвольного дискретного сигнала f.
70
f (5.34)
7 njs=~«)«2=-oo
J J //“i .Л de>2 . (5.35)
4я _я -я
Выражение (5.34) определяет пространственный спектр двумерной последовательности, а выражение (5.35) • представление двумерной последовательности через пространственный спектр.
Представления двумерных дискретных сигналов и ЛПП-систем в частотной области (то есть с помощью преобразования Фурье) широко применяются при их анализе и синтезе, поскольку во многих случаях проще и удобнее соответствующих представлений в области пространственных аргументов.
Перечислим некоторые важнейшие свойства спектров последовательностей. Доказательства приводимых ниже утверждений предлагается выполнить самостоятельно (их более простые "одномерные" аналоги изложены в а 5,2).
Свойство 1. Достаточным условием существования спектра двумерной последовательности f является ее абсолютная суммируемость:
X С536)
Из сопоставления условий (4.47) и (5.36) следует, что для существования частотной характеристики двумерной ЛПП-системы достаточно, чтобы система была устойчивой.
Свойство 2. Двумерное преобразование Фурье линейно. Это означает, что для любых последовательностей fx, f2 и постоянных а, Ъ из соотношения
/("1. «2 )= af\(ЛР п2 )+ Ь h ("1 ’ "2 ) > следует
, е™* )= a Ftр. )+Ь F^, .
Свойство 3. Если двумерная последовательность разделима, то есть для нее выполняется соотношение (4.36), то ее спектр также является разделимым:
(5.37)
Свойство 4. Спектр двумерной последовательности f - периодическая функция пространственных частот Его период по этим переменным равен 2я, то есть
71
, e"°2 +2rf| )><Л'>2+2я*г)'
при любых целых , к2 •
Рис, 5,4, Линии равных уровней спектров двумерной вещественной последовательности
Свойство 5. Если двумерная последовательность f вещественна, то ее спектр обладает следующими свойствами центральной симметрии:
Ue^^eAe4"2),
,ею* )=- ,е~™2 ),
-У К»| МО, _/ “МЛ -Я»,А|
F1 е , е I = /*1 е 1, е i I ,
МО. I®, А “Л»! -*»2
arg Fie ,e j=“-argF|e l,e .
В соответствии co свойствами 4 и 5, линии равных значений вещественной части (или модуля) и мнимой части (или аргумента) спектра двумерной последовательности в плоскости переменных , <й2 могут выглядеть, например, так, как показано на рис. 5.4. Очевидно, чтобы полностью описать такой спектр, достаточно задать его на периоде по одной пространственной частоте и на половине периода по другой, то есть, например, на двумерном "прямоугольном" интервале:
- £ я, 0^(»2^я,
Если вещественная последовательность разделима, то свойства симметрии ее спектры усиливаются, поскольку симметричным является каждый из двух одномерных спектров,
72
входящих как сомножители в (5.37). При этом достаточно рассматривать двумерный спектр иа одном квадрате шириной в половину периода, то есть, например, при
< л, 0<®2 -71
Свойство 6. Свертка двумерных последовательностей соответствует произведению их спектров, то есть последовательность (4.43) имеет спектр
g(> ,/<02)=я(> \
Из последнего свойства следует, что, как и в одномерном случае, частотная гт( ко, «о2 \ ___
характеристика Н е 1, е I полностью определяет ЛПП-систему, то есть однозначно задает правило преобразования входной двумерной последовательности в выходную (прн их описании в частотной области).
Остановимся на важном вопросе соответствия между спектром двумерной последовательности и спектром непрерывной двумерной функции, из которой эта последовательность получена. Прямое и обратное преобразования Фурье (переход к спектру и обратно) для непрерывной функции f пространственных переменных х1 , х2 задается соотношением:
/-'и(п,,П2)= J J/(x],x2)e '^a>x,+n2X^dxidx2 , (5.38)
/(xI;x2)=J | Ки(й1,П2)е^°Л+Ол1&1 dx2 , (5.39)
4я“ -«о -co
где Qj , - угловые пространственные частоты, имеющие размерность радиан/единица
длины. Из (4.31) и (5.39) выразим двумерную последовательность, полученную в результате пространственной дискретизации непрерывной функции, через спектр FH этой функции:
/(»1.«2)=/(«1Д1-«2Д2)=A- J J FH(nl.Я2)е/^А,И,+П2Ал)<Ю1 <К12 . (5.40)
4я~
С учетом значений шагов дискретизации произведем замену размерных пространственных частот на безразмерные coj = QjAj , ®2 =Q2^2 и выполним несложные преобразования выражения (5 40), заключающееся в разбиении интегрирования, замене переменных и порядка выполнения н суммирования:
/(”1>"2)=Л"1Д1’"2Д2) = А? I Г7_/?и^’72'>|е^|П|+<!>2Я2^“1‘ЙЭ2 =
4% -оо-«Д1Д2 1Д1 ^2)
73
« сю 00 1
-Т Z Z
4я =-ооЛ2 =-оо|
Д1 Д2
О»! ©2 «(w./t,+ю2л2)
—е 1 1 2 2 dfe). Jo-, =
А А 12
Д, ’д
< ею оо
7Т Z
Л1Л2 ^=^oA2=-oo
<о2+2^2
Сопоставление последнего
выражения
с формулой (5.35) выявляет
искомое
п
1
4* -л -п
2 ' ~ ^2
соотношение между спектрами:
‘Ч /°>2
1
А, Д
ОО сю
S Z л,
(Oj+2я£|
Д1 Л2
(541)
Таким образом, спектр двумерной последовательности формируется как сумма бесконечного числа спектров исходной непрерывной функции, сдвинутых друг относительно друга по переменным ©j , ©2 на интервалы, кратные 2я. Данное суммирование и
определяет периодичность спектра последовательности (см. свойство 4).
Если спектр непрерывной функции ограничен, а именно,
Fh(Qi,Q2) = 0 при |^i| Л1
1л К л ИЛИ р21 —> ^2
(5.42)
то на интервале |©j| < я, <о2 < я, определяющем период спектра последовательности,
с,тгУ 1 F [Ч
I ’ J Д,Д2 HUl’A2j'
В этом случае можно однозначно восстановить спектр непрерывного двумерного сигнала по спектру последовательности, а сам непрерывный сигнал - по дискретному.
Если ограничение (5.42) не выполняется, то наблюдается эффект наложения спектров, выражающийся в том, что высокочастотные составляющие спектра непрерывной функции попадают в область более низких частот в спектре последовательности. Такое наложение нарушает взаимно однозначное соответствие спектров непрерывного и дискретного двумерных сигналов н исключает возможность безошибочного восстановления непрерывной функции по ее отсчетам. Чтобы не допустить эффекта наложения нужно выбрать шаги дискретизации из условий
А . Я А .
Д! < , Д <..... ,
^Imax ^2 max
где ^imax ’ ^2 max ’ максимальные (граничные) пространственные частоты спектра
непрерывного двумерного сигнала:
^И(П1’П2) = 0 ПР” |ni|Snimax ИЛИ |Я2|^П2т^ ’
74
6. ОПИСАНИЕ ДИСКРЕТНЫХ СИГНАЛОВ И СИСТЕМ С ПОМОЩЬЮ Z-ПРЕОБРАЗОВАНИЯ
6.L Прямое z-преобразование
При изучении дискретных сигналов и систем чрезвычайно полезным оказывается представление последовательностей при помощи ^-преобразования. Прямым ^-преобразованием последовательности f называется комплексная функция1 * * * *
ао •
К(г)= (6.1)
П=—00
где z - комплексная переменная. Ниже иногда будем использовать сокращенную запись (6.1)
Z
в форме /(w)->F(z). Множество значении z, для которых ряд (6.1) сходится, и, следовательно, z-преобразование существует и является конечным, называется областью сходимости z-преобразования. Область сходимости зависит от формы преобразуемой последов ательности.
Если f - последовательность конечной длины, то есть f (и) = 0 при п е [ Nx yN2 ], то z-преобразование вычисляется как сумма конечного числа слагаемых
H*)= ЁЛ")г‘В • (6.2)
Очевидно, что его область сходимости включает те значения z9 при которых все слагаемые в сумме (6.2) конечны, то есть всю комплексную z-плоскость за исключением точки z = 0 , если N2 > 0 , н точки z = оо , если Nx < 0. Этот факт иллюстрирует рис. 6.1 а, на котором область сходимости z-преобразования отмечена штриховкой (такой способ изображения областей сходимости будем использовать и в дальнейшем).
Для полубесконечной левосторонней последовательности ( f ( п) - 0 при п > N2 )
^)= . (6.3)
п=-<о
1 Часто в литературе z -преобразование вводится в форме F(z)= £ /(л)г"я . Это так называемое
п=о
одностороннее z -преобразование, которое применяется для последовательностей, заданных тодько
при п > 0 . Выражение (6.1) задает более общее двустороннее z -преобразование. С математической
точки зрения оно определяет разложение комплексной функции F ( z) в степенной ряд Лорана.
75
В данном случае степенной ряд бесконечен по положительным степеням z. Известно, что такой ряд сходится в круге с центром в начале координат (рис.6.16), то есть при
Н < я+ , (6.4)
где R+ - внешний радиус сходимости, некоторая постоянная. Вопрос о сходимости на границе области, то есть при |zj = Я+ должен исследоваться дополнительно для каждого конкретного ряда. Следует заметить, что, если N2 > 0, то ряд (6.3) содержит и конечное число членов с отрицательными степенями z, в этом случае, очевидно, из области сходимости исключается точка z = 0.
а) б) в) г)
Рис,6,1, Примеры различных областей сходимости для z-преобразования
Для полубесконечной правосторонней последовательности (/(и) = 0приn<N^) имеем бесконечный ряд по отрицательным степеням z:
оо ^(z)= ^/(n)z ~п (6 5)
”=М
Опираясь на предыдущий случай, легко показать, что ряд (6.5) сходится во внешней части круга (рнс.6.1в).
|г|>я.
(66)
где - внутренний радиус сходимости, а также, возможно, на самой границе области (то
есть при |z| = R_ ). Если ТУ < 0, то из области сходимости исключается точка z = а>.
В общем случае, когда /- бесконечная двусторонняя последовательность, ее z-преобразование можно представить как сумму ^-преобразований левосторонней и правосторонней последовательностей:
оо N оо
Л*)= £/(«)*'” = Е/(Ф’И + E/to*"” > w
п=^-<х> n^-oo n=N+\
76
где N -произвольное целое число. Первое слагаемое в выражении (6.7) имеет область сходимости вида (6.4), второе слагаемое - область сходимости вида (6.6). Если R_ < R+ , то получаем, что полное ^-преобразование сходится внутри кольца (рис. 6.1г):
Я_<И<Л+ (6.8)
и, возможно, на его границах. Если R_ > R+ , то области сходимости слагаемых в выражении (6.7) не пересекаются, и z-преобразование двусторонней последовательности не существует. Если R_ = R+ , то z-преобразование определено лишь тогда, когда оба слагаемых в выражении (6.7) сходятся на границах своих областей сходимости. Примером такого "экзотического" случая может служить z-преобразование последовательности БШСЛлП ----—, сходящееся только на единичной окружности (см. табл., поз. 14). ям
Таблица z-преобразования некоторых последовательностей
№ л/п Последовательность z-преобразование Область сходимости z-преобразования
1 2 3 4
1 Единичг 8(л) = [ый импульс 1, п = 0, 0, 1 Вся z-плоскость
2 8(п~л0) =« 1, п = 0, 0, п Ф 0 z-"« z * 0 (при и0 > О) или Z * 00 (при «0 < о)
3 Единич и(и) = ный скачок 1, и>0, 0, п < 0 1 1-Z-1 1 2г| > 1
4 Прямоугольный импульс и («)- и (и - N), # > 0 1 + г',+г"2+... + ИЛГ_,) = 1 -АГ 1-Z |z| * 0
5 п a ъ '(«) 1 l-az 1 I2
6 -a -л-1) 1 1-<7 Z |z ИИ
7 пап и(п) az I2 )>|в|
(а -П 2 1 l-az 1
77
1 2 3 4
8 (и + 1) ап и(п) 1 (\ -1 V 1 1 -az j l2l>lal
9 — (л 4-1) ап 1 fi „-П2 1 1 - a z 1
Следует заметить, что функция F(z), если ее задать не через ряд, а в явном виде, может иметь смысл не только в области сходимости, но и на всей комплексной плоскости. Область сходимости начинает играть роль лишь тогда, когда мы связываем эту функцию с определенной последовательностью/ то есть пытаемся получить ее, суммируя ряд (6.1). Тогда при указании области сходимости соответствие последовательности и ее z-преобразования является взаимно однозначным. Одно и то же z-преобразование, но с различными областями сходимости, соответствует разным последовательностям (см. табл., поз. 5,6 н 8, 9), поэтому при вычислении z-преобразований н манипуляциях с ними указание областей сходимости является обязательным
78
Как следует из свойств степенных рядов, внутри области сходимости функция F(z) является аналитической. Особые точки функции, в которых она теряет аналитичность, определяют границу области
Важнейший класс ^-преобразований представляют дробно-рациональные функции* то
—1 есть отношения полиномов от z или, что эквивалентно, от z :
N
, (6.9)
j=0 где [bjf - постоянные коэффициенты.
Особыми точками дробно-рациональной функции, которые могут ограничить область сходимости z-преобразования, являются полюсы* то есть те значения z* при которых она обращается в бесконечность. Очевидно, полюсы - это корни полинома в знаменателе F(z). Введем в рассмотрение и нули дробно-рациональной функции - корни полинома в числителе. Разлагая полиномы на множители, можно привести формулу (6.9) к виду1
где [qj)- нули, \pj| - полюсы.
Как следует из формулы (ЗЛО), дробно-рациональное ^-преобразование с точностью до константы описывается расположением нулей н полюсов в z-плоскости. Диаграмма нулей и полюсов в сопоставлении с областью сходимости z-преобразования наглядно отражает основные качественные характеристики последовательности Отметим, что область
1 Предполагается, что коэффициенты bQ и с0 не равны нулю В более общем случае, когда
и с0 cl*...*cXfi все равны
нулю, выражение (6.10) принимает вид
J-I
здесь кроме нулей
и полюсов {/г} имеется еще - А\) - кратный нуль (если ) или
(ATt - - кратный полюс (если А^ > ) в начале координат
79
сходимости дробно-рационального z-преобразования никогда не включает границы, то есть соответствует строгим неравенствам (6.4), (6.6) или (6.8).
Пример. Вычислим z-преобразование правосторонней экспоненты f(n) = an и(п). В соответствии с формулой (6.1), имеем
f(z)= • л--« н=0
Этот ряд (геометрическая прогрессия) сходится, если az-1 или |z| > ja|. При этом F(z) = —-— .
1-az-1
Данное дробно-рациональное z-преобразование имеет единственный полюс в точке z=a и единственный нуль в начале координат. Соответствующая ему диаграмма нулей и полюсов для вещественного положительного а приведена на рис.6.2 (на этом и следующих рисунках полюсы обозначаются крестиком, а нули - кружочком).
Еще раз обратимся к выражению (6.1). Если комплексную переменную представить через модуль и фазу: z = г е , то
F(Z)=/retoJ= £/(»)<" .
И=—ao
(6.11)
При г = 1 выражение (6.11) совпадает с (5.9), то есть z-преобразование превращается в спектр последовательности. Таким образом, спектр последовательности - это ее z-преобразование, вычисленное на единичной окружности (рис. 6.3):
7(e‘“) = F(Z)|z=e« . (6.12)
Рис.6.2. Диаграмма нулей и полюсов для правосторонней экспоненты z-преобразования
80
Разумеется, выражение (6.12) имеет смысл только тогда, когда единичная окружность принадлежит области сходимости z-преобразования, то есть когда R~ < 1 , и R+ > 1, (см. формулы (6.4), (6.6), (6.8)). Если область сходимости не включает единичную окружность, то спектр последовательности не определен, однако z-преобразование существует. Следовательно, ^-преобразование является более общим средством описания последовательностей, чем спектр. Класс последовательностей, описываемых при помощи z-преобразования, включает не только затухающие в обе стороны последовательности, для которых сходится ряд (5.9), но и многие другие, не являющиеся ограниченными при устремлении аргумента к плюс или минус бесконечности.
Рис. 6.3. Иллюстрация к интерпретации спектра последовательности
6.2. Основные свойства z-преобразования
Для работы с ^-преобразованиями и, в частности, для вычисления ^-преобразований последовательностей, не вошедших в приведенную выше таблицу, могут оказаться полезными следующие их свойства
Свойство 1. Z-преобразование последовательности f существует, и ряд (6.1) сходится в кольце
/?_ <|z[<7?+ , (6.13)
где R_ - неотрицательная, а Я+ - положительная константы (д_ < Л+), если
to ,
п—>оо
to ^|/(-»Л=Л+, (6.14)
п—>ОО
81
где lim означает верхний предел последовательности* 1
Я—>оо
На границах кольца, то есть при |z| = /?_ и |z| = .R+ z-преобразование может как сходиться, так и расходиться Примем этот результат без доказательства, ограничившись его простотой интерпретацией. Пределы (6.14) означают, что абсолютные значения элементов последовательности могут, например, иметь экспоненциальную асимптотику
|/(л)|~A}Rn при «-><»,
|/(л)|~Л2я" при
где Лр А2- некоторые положительные числа. Если R+ > R_ > 1, то последовательность |/(и)|, является расходящейся, то есть lim |/(«)| = 0, lim |/(«)| - °о. Если R_ < R+ < 1, то она Я—>—ОО п—>—СО
сходится к нулю lim |/(«)| = оо, Jim |/(«)(= 0. При R_ < 1 имеем затухающую в обе Я—>—со я—>—оо
стороны последовательность lim |/(«)| = 0, для которой выполняется условие абсолютной п—>±оо
суммируемости (5.12).
Свойство 2. Z-преобразование линейно, то есть если J\ (л)—^->^(2),,
/2 (я)—(z) то Д™ любых постоянных а, b
аА (”)+ ft/2(n)—^->aft(z)+if2(z) (6 15)
Справедливость соотношения (6.15) вытекает из самого определения z-преобразования (6.1). Областью сходимости суммы (6.15) является пересечение областей сходимости слагаемых. Исключение составляют ситуации, когда, например, при линейной комбинации дробно-рациональных z-преобразований появившиеся нули компенсируют некоторые полюсы, в этом случае область сходимости может расшириться (такой эффект имел место при переходе от z-преобразования единичного скачка к z-преобразованию прямоугольного импульса, см. табл., поз. 3 и 4).
Свойство 3. Сдвиг последовательности соответствует умножению ее z-преобразования на целую степень z, а именно, если
1 Верхним пределом действительной последовательности а(п) называется число Л такое, что:
1) существует подпоследовательность данной последовательности, стремящаяся к Л;
2) каково бы ни было г > 0 , найдется такое N, что о(п) < А + е при п к N .
Всякая последовательность имеет единственный (конечный или бесконечный) верхний предел Верхний предел совпадает с пределом в обычном смысле, если последний существует.
82
Л W=/i(«-«o).
(6.16)
то
F2(2) = z’"»^(2). (6.17)
Для доказательства достаточно подставить последовательность (6.16) в формулу (6,1) и заменить переменную при суммировании:
л=-оо т=-<х> т--ао
При сдвиге последовательности область сходимости ^-преобразования не изменяется за исключением, возможно, точек z = 0 и z = <ю.
Свойство 4. Умножение последовательности на аргумент соответствует дифференцированию ее z-преобразования, а точнее, если
/2(п)=п/1(п), (6.18)
ТО
Докажем это, для чего запишем сумму (6.1) относительно последовательности j\ и продифференцируем:
—=- 2Ж" • «=—со
Внутри области сходимости степенной ряд можно дифференцировать почленно, поэтому
7Г (~\ СО . «3 03
Z/2Wz-n=-^F2(z), Л=—00 и=—00 И=—00
что эквивалентно соотношению (6.19). При умножении последовательности на аргумент область сходимости ^-преобразования ие меняется за исключением, возможно, точек границ области, на которых функция ^(z) теряет аналитичность.
Свойство 5. Умножение последовательности на экспоненту изменяет масштаб аргумента в z-преобразовании. Если f{(n)—>/|(z) с областью сходимости Я. <|z| < Я+ и
/2(«)=fl"/iW. (6.20)
то
F2^ = FAz,a}
(621)
S3
с областью сходимости |я|Я_ <|г|<|д|Я+ . Для доказательства этого свойства подставим последовательность (6.20) в формулу (6.1):
FzW= Sa"/i(»)z‘"= S/i("X2/a)’,,=Fi(z/a) л=-оа л=-<ю
что и требуется получить. Область сходимости для F2(z) получается подстановкой zla вместо z в неравенство для области сходимости Ft(z).
Свойство 6. Инверсия (изменение знака) времени последовательности приводит к замене переменной z на z 1 в выражении z-преобразования, то есть, если /(и)—^—tF^z) с областью сходимости R_ < |z| < R* и
Л («)=/>("»). (622)
то
F2(z)=F,(z-) (6.23)
с областью сходимости (l/#+)<|z|< (1/Я.) . Доказательство этого свойства сводится к подстановке последовательности (6.22) в формулу (6.1) и замене переменной при суммировании:
F1 W= Sa (-")2‘” = Za W2“ = Ё A H(2'‘) ’ =Fi (2') • И--00 0|a:-*ao Mt:~®
Область сходимости F2 (z) получим, подставив z~x вместо z в неравенство для области сходимости Fx (z),
Свойство 7. Свертка последовательностей соответствует произведению их z-преобразований Если
А>(»)=А(»)*Аг(«). (6.24)
то ^(и)=^(„)^(и). (6.25)
Доказательство, с точностью до обозначении совпадающее с доказательством аналогичногосвойства для спектров (см.п 5.1), предлагается провести самостоятельно. Областью сходимости F3(z) является пересечение областей сходимости Fx(z} и F2(z). Исключение составляют случаи компенсации полюсов ^(z) нулями F2(z) или наоборот, при которых область сходимости может расшириться
84
6.3. Обратное z-преобразование
Установим правило перехода от z-преобразования к исходной последовательности. Соотношение для такого обратного z-преобразования можно вывести из интегральной теоремы Коши, из которой следует, что
lzk~'dz = 2л»8(£), (6.26)
С
где интеграл берется против часовой стрелки по замкнутому контуру С, охватывающему начало координат комплексной z-плоскости. Умножим обе части выражения (6.1) на zk~x и проинтегрируем по С, выбрав контур так, чтобы он полностью лежал внутри области сходимости z-преобразования:
^F(z)zk~^d z = ^z* 1 ndz.
С С п=-<х>
Равномерно сходящийся на С ряд можно интегрировать почленно, поэтому с учетом формул (6.26) и (4.18) имеем
^F(z)zi’1Jz= ” 1 dz=2ni ^f(n)8(k~n)=2itif(k).
С п=-<ю с п=-<о
Отсюда следует окончательное соотношение для обратного z-преобразования:
/(») = — jF&z^dz, (6.27)
где С - контур, окружающий начало координат с направлением обхода против часовой стрелки и расположенный в области сходимости F(z).
Практически взять интеграл (6,27) можно несколькими способами. Если подынтегральная функция
W(z)= F(z)z"~' (6.28)
является аналитической во всей внутренней области контура, за исключением конечного числа особых точек, то универсальный способ вычисления дает теорема о вычетах. В соответствии с ней, интеграл (6.27) определяется через сумму вычетов:
^-{w(z)dz = f Resfr^h = pj. (6.29)
где N - число особых точек внутри контура С, {р} } - особые точки, Res[^(z)> z = pj ] - вычет
функции W(z) в точке z = pj .
85
Для функции W(z), имеющих своими особыми точками полюсы, вычеты вычисляются следующим образом. Если полюс в точке z = р простой, то есть W(z) можно представить в
виде
z~Pj
где U(z) - функция, не имеющая особенностей (аналитическая) в точке z = pj , то
Res[fr(zV = p.]= lim [(z-p .hp(z)] = u(p A. z^Pj J J
(6.30)
Если полюс в точке z- р} l-кратный, то есть W (z)= у—, / > 2 , то V-PJ
И. 1 * г Г/ \1п,< ^00
(2)г (/-1)! 7^
(6.31)
z=pj
Выражения (6,28) - (6.31) позволяют находить, в частности, обратные z-преобразования для дробно-рациональных функций F(z).
Пример Вычислим последовательность, соответствующую z-прсобраюванию
l-az
с областью сходимости |z| > |а|.
Согласно соотношению (6.27), в данном случае
1 „н-1 । „п
/(и) =---£-------dz =----i-----dz .
h^cl-az"1 2ni £ z-a
Контур интегрирования С должен располагаться в области сходимости, то
есть вне круга
>F(z)= — z-a
имеет один простой полюс в точке z = а . При л<0 появляется второй полюс кратности (-и) в начале
радиуса [п| с центром в начале координат. При и>0 подынтегральная функция
координат. Взаимное расположение области сходимости, контура интегрирования и обоих полюсов показано на рис 6.4. Как видно, оба полюса охватываются контуром. В соответствии с выражениями
(6,29) и (6.30) при п £ 0 f(n) = Res
2п
•---,z-a =ап . Прин<0 последовательность определяется
z-a
как сумма двух вычетов, значение первого из которых уже найдено:
' z" 1
----,z = 0 =^"+Res
zn z-a
Найдем вычет в начале координат. При п--\ полюс в z = 0 простой, и поэтому
zn
z-a
+Res
Z z-a
(6.32)
,z = 0 .
1
Res
,z = 0 --а 1 . При и = -2 полюс двукратный, В соответствии с выражением (6.31)
86
Res
Для произвольного отрицательного п получается
Таким образом, подставив выражение (6.33) в формулу (6.32), при п<0 имеем /(л)=д" - ап = 0 .
Окончательный результат: /(л) =
ап , п>О О , н<0
>-ап и
Непосредственное вычисление обратного ^-преобразования методом вычетов может оказаться весьма трудоемким, особенно если у функции F(z) имеется много особых точек. На практике чаще используют обходной пул», приводя F(z) к представлению в виде суммы простых функций, обратные ^-преобразования которых известны. Так, для дробнорациональной функции F(z) общего вида (6,9) применяется ее разложение на простые дроби:
кратность полюса pj, С -к - постоянные коэффициенты. Слагаемое А в разложении (6.34) присутствует, если степень полинома Р не меньше степени полинома Q, и определяется алгебраическим делением Р на Q, Значения постоянных С можно иайти методом неопределенных коэффициентов (см. пример ниже). Выражение (6,34) позволяет представить произвольную дробно-рациональную функцию через сумму табличных z-преобразований.
При переходе от выражения (6.34) к самой последовательности следует обращать особое внимание на взаимное расположение полюсов z-преобразования и его области сходимости вида (6.8). Как уже отмечалось, именно полюсы определяют радиусы области сходимости. Простая дробь
87
соответствует последовательности правосторонней, если > й левосторонней, если
Р] -Л+
Область сходимости такого элементарного z-преобразования будет определяться
соответственно неравенством
ИЛИ |z| <
1 Im z
Рис.6.4. Взаимное расположение области сходимости, контура интегрирования и полюсов: иллюстрация к примеру
Пример. Определим последовательность, соответствующую z-преобразованию f(z)=---------------------------П, И<1 (6.35)
с областью сходимости
И<1г1<К|- (б36)
Для этого запишем выражение (6.35) в виде отношения полиномов по отрицательным степеням z:
(6.37)
а затем, учитывая наличие полюсов в точках z=a и г=1/6, произведем разложение на простые дроби:
F(z)=-----1—+--------2—. (6.38)
ь где Ci С2 - неопределенные коэффициенты Для отыскания С\ и С% приведем выражение (6.38)
к общему знаменателю и сравним его с записью (6.37):
88
Приравнивая в числителях коэффициенты при одинаковых степенях z, получаем систему линейных уравнений
Г с j + с2 — о
Hr г 1
I b 1 2 b
решение которой дает: - 1, С2 = -1, то есть
F(z)=---Ц_ + —!—=F,(z) + F2(z) (6.39)
1-<Е ' a_'z-l ь
Первое слагаемое Fj (z)=-— имеет полюс в точке z=a, расположенной на внутренней границе
1-az 1
кольца сходимости (6.36), как показано на рис.6,5. Следовательно, оно соответствует правосторонней последовательности и имеет область сходимости |z| > |д|. Из таблицы г преобразований получаем:
Второе слагаемое в сумме (6.39)
F2(z)=—у— ь имеет полюс в точке z=l/i, расположенной на внешней границе кольца сходимости (6.36).
Рис. 6.5. Расположение полюсов: иллюстрация к примеру
Следовательно, оно соответствует левосторонней последовательности и имеет область сходимости |z| < . Из таблицы z-преобразований: /2 И = и(~ п ~ 0 •
89
В ситу линейности z-преобразования окончательный результат получаем в виде /(«)=/.(»)+А(»)=И’ [6 , п<0
6.4. Анализ и синтез ЛПП-систем с использованием z-преобразования
Определим передаточную функцию дискретной ЛПП-системы как z-преобразование ее импульсной характеристики:
#(z) = Ё*(«)г~” (6 40)
л=—00
Передаточная функция является еще одной формой описания ЛПП-системы, она однозначно определяет закон преобразования входной последовательности в выходную Действительно, учитывая соответствие формул (6.24) и (6 25), свертку (4.14) можно записать в z-области в виде
G(z)=f(2)//(z), (6.41)
где G(z\F(z) - z-преобразования выходной и входной последовательностей. Область сходимости G(z) состоит как минимум из пересечения областей сходимости F(z) и H(z).
Выражение, аналогичное (6.41), мы имели и раньше при описании ЛПП-системы в частотной области (см формулу (5.11)). Это естественно, ведь в соответствии с соотношением (6.12) частотная характеристика системы есть ее передаточная функция (а спектр дискретного сигнала - его z-преобразование) при значениях переменной z, взятых на единичной окружности в комплексной z-плоскости. Однако понятие передаточной функции существенно шире понятия частотной характеристики, поскольку применимо и к системам, для которых ряд (6.40) не сходится на единичной окружности.
Передаточную функцию нетрудно получить непосредственно из разностного уравнения ЛПП-системы. Покажем это на примере физически реализуемой системы, описываемой разностным уравнением (4.26). Используя сформулированные в п.6.2 свойства 2 и 3 z-преобразования (линейность н сдвиг последовательности), уравнение (4.26) можно записать в преобразованной форме:
М . N . М Л
G(z)=Sa/G(2)2 1 + Ё6;^2)2"7 =<7(г)Ёау 2"? + ^(2)Ё6; 2 1
7=1 j=0 j=\ у=0
Отсюда легко выражается G(z) в явном виде:
90
GW = -------• (6 42)
Сопоставив выражения (6.42) и (6.41), видим, что
Я
--------• (6.43)
/=1
Полученная передаточная функция H(z) отличается от записи (6.9) только обозначениями коэффициентов в знаменателе, то есть является дробно-рациональной. Нетрудно показать, что ЛПП-системы, допускающие представление в виде разностных уравнений конечного порядка, всегда имеют дробно-рациональные передаточные функции.
Заметим, что переход от уравнения (4.26) к (6.42) по существу определяет метод решения линейных разностных уравнении с помощью z-преобоазования. В отличие от громоздкого и неуниверсального метода прямой подстановки, рассмотренного в п.4, в данном случае можно получить результат в общем виде и не указывать начальные значения для участвующих в решении последовательностей (предполагается, что они являются бесконечными, то есть заданы для всех значении дискретного времени).
Пример. На вход ЛШ 1-системы, описываемой разностным уравнением (4.27), поступает сигнал - правосторонняя экспонента:
f(n) = bn и(п\ Ь*а. (6.44)
Определим последовательность на выходе системы. Для этого перейдем от разностного уравнения к передаточной функции:
G(z)=aG(z)z~{ + F(z) , G(z) = F(z)-?—- , (6.45)
#(z)=---* (6.46)
1 ~ az
Передаточная функция имеет один полюс в точке z=a и соответствует правосторонней импульсной характеристике (тик как система физически реализуема). Следовательно, область сходимости Я(г) - внешняя часть круга: |z| > |а|. Определив по таблице z-преобразований соответствующую передаточной функции (6.46) импульсную характеристику h(n)=an и (м), можно записать решение разностного уравнения во временной области в виде свертки:
k=Q
91
что совпадает с выражением (4.30). Однако в данном случае нам известна входная последовательность, поэтому можно конкретизировать результат. Для последовательности (6.44) из таблицы находим
G(z) =
> max
(6.47)
(6.48)
f(z)=7-^’
Подставив формулы (6.36) и (6.47) в (6.41), получим
lt_____
jl-ftz-1)’
После разложения G(z) на простые дроби имеем
\ а 1 b 1 G(z) =----х-----—-------х------~
a~b \-azX \-bzX
Сопоставление полюсов функции G(z) с ее областью сходимости показываем что оба
слагаемых в выражении (6.48) соответствуют правосторонним последовательностям. После перехода от (6.48) к последовательности получаем окончательный результат
_ L — Я+1
g(n)=----апи(п)-----~bn и(п)----------w(")-
я — о а- о а-Ь
Выполняя последовательность преобразовании (4.26) в (643) в обратном порядке, можно перейти от дробно-рациональной передаточной функции к разностному уравнению. Это открывает простую возможность синтеза структуры ЛПП-системы с заданной импульсной характеристикой.
Пример. Построим структурную схему ЛПП-системы с импульсной характеристикой
С помощью таблицы z-преобразований перейдем от характеристики (6.49) к передаточной функции системы:
я<гЬ-~т-2- И* И-
1 +а z
В соответствии с выражением (6.41)
G(z)= F(z)H(z)= F(z)—— 1 l + azz z
или
G(z)(l+a 2z'2)= F(z) , G(z) = -a2G(z)z~2 + F(z) .
Последнему соотношению во временной области соответствует разностное уравнение
g(n)= -a1 g^-^ g(n). (6.50)
Структурная схема системы, описываемой разностным уравнением (6.50), представлена на рис.6 6
Формулу (6.41) можно использовать и для определения передаточной функции ЛПП -системы по известным сигналам на входе и выходе, то есть для синтеза системы, осуществляющей заданное преобразование:
92
Я<г) = 7П> (6.51)
а также для определения входного сигнала по известным выходному сигналу и передаточной функции:
<6i2)
При этом однако следует учитывать, что соотношения (6.51) и (6.52) не всегда позволяют однозначно определить последовательность h и f соответственно, так как во многих случаях можно произвольно назначать область сходимости и, следовательно, получать правосторонние, левосторонние или двусторонние последовательности.
Рис.6,6, Структурная схема, описываемая разностным уравнением (6.50)
Пример. Определим, какую последовательность f нужно подать на выход ЛПП - системы с импульсной характеристикой h(n)= б(и)+ 23(« -1), чтобы получить на выходе g(w)^ 3 и(р).
Перейдем kz - преобразованиям:
Я(г)=1+2гЧ, z*0; |z|> 1 .
l-z~
В соответствии с формулой (6.52) z - преобразование входной последовательности
F(z)= G(z) —Ц = -2- -------—?. (6.53)
Щг) 1-z ' l + 2z 1
Для первого сомножителя в выражении (6.53) область сходимости известна (jz|>l). Для второго ее можно назначить либо внутри окружности, проходящей через полюс в точке z = -2 , либо вне ее. В первом случае область сходимости F(z) - кольцо: 1 < |z| < 2 , то есть f будет двусторонней последовательностью Во втором случае область сходимости F(z) - внешняя часть круга: |z| > 2 , то есть f - правосторонняя последовательность. Таким образом, задача имеет два решения:
f - двусторонняя последовательность
f(n) = и(п) - 2(- 2У’ и(- и - 1);
93
f - правосторонняя последовательность:
F(z)= 1------d------n= —!— + —±—
' (l-z-'Xl + lz-1) 1-z'1 l + 2z-‘;
H>2 I1!*1 H>2
/(п)=|1 + 2(-2)"]и(п).
Ранее было сформулировано условие устойчивости ЛПП-системы, выраженное как требование абсолютной суммируемости ее импульсной характеристики (см. неравенство (4 24). То же условие можно выразить и как требование к передаточной функции системы. Имеется простая взаимосвязь между расположением полюсов на z - плоскости, областью сходимости передаточной функции и такими свойствами системы, как устойчивость и физическая реализуемость. Неравенство (4.24) означает, что ряд (6.40) абсолютно сходится на единичной окружности, а такое возможно, если единичная окружность расположена в области сходимости ряда. Следовательно, ЛПП-система является устойчивой, если область сходимости передаточной функции содержит внутри себя окружность единичного радиуса наг - плоскости.
, Рис, 6, 7. Диаграмма полюсов для устойчивой физически реализуемой ЛПП-системы
Как уже говорилось, область сходимости дробно-рационального z - преобразования ограничена полюсами Если ЛПП-система физически реализуема, то есть ее импульсная характеристика является правосторонней последовательностью, удовлетворяющей условию
94
(4.21), то область сходимости передаточной функции - внешняя часть круга, проходящего через наиболее удаленный от начала координат полюс. Такая система устойчива, если все полюсы ее передаточной функции лежат внутри единичной окружности. Пример диаграммы полюсов для устойчивой физически реализуемой системы дан на рис 6 7.
Отметим, наконец, следующее: в соответствии с формулами (4.19), (4.20) и свойствами z - преобразования при последовательном соединении N ЛПП-систем (звеньев) передаточная функция объединенной системы
Я(г)=Пя/2) , (6.54)
7=1
где Hj (z) - передаточная функция /-го звена, а при параллельном соединении
Я(г)=£Я>). (6.55)
7=1
Соотношение (6.54) используется при реализации системы в последовательной (каскадной) форме, а соотношение (6.55) - в параллельной. Представление дробнорациональной передаточной функции в виде (6.54) легко получить, выразив ее через нули и полюсы (см. формулу (6.10)), а представление в виде суммы (6.55) - разложив ее на простые дроби (см. формулу (6.34)).
6.5. Двумерное z-преобразование
Итак, выше мы видели, что z-преобразование, введенное в п.6.1. для случая одномерных сигналов, имеет чрезвычайно широкое применение. Не менее полезным является и обобщение z-преобразования на двумерный случай.
Прямым z-преобразованием двумерной последовательности f называется комплексная функция
Hz|.Z2)= Е Е/("1’л2)гГ1г2Л2 (6 -56)
Л] <©/>2 =—<©
где Z], Z2 - комплексные переменные. Ниже иногда будем использовать сохраненную запись (6.56) в форме
Естественно, данное “двумерное** z-преобразование имеет смысл только в сгоей области сходимости, то есть на множестве таких значений и zj, при которых сумма (6.56) существует и является конечной Достаточным условием этого является абсолютная сходимость записанного двойного ряда:
95
Z Z pw<%’"2|= L Ё1/(^"2)НлЪГ"2<“- (6.57)
nj =-oo«2 =—OO П] =—00712 =—cx>
Из этой формулы следует важный вывод о том, что область сходимости определяется только абсолютными значениями комплексных переменных Z\ , z2 , а значит, может быть задана на плоскости в координатах (|z]|, [z2|)’. Рассмотрим частные случаи
Пусть f - двумерная последовательность конечной длины, удовлетворяющая условию (4.37). Тогда ее z-преобразование будет вычисляться как сумма конечного числа слагаемых:
*2
Hzi,z2)= Z Z/("i’"2)zi "'«г’’2 • С1-36)
n1=Af]W2=Al2
Очевидно, что область сходимости такого z-преобразования включает в себя те значения переменных zj, z2 , при которых все слагаемые в сумме (6.58) конечны, то есть все точки плоскости (]z||, |z2|) за исключением, возможно, некоторых: точки zi = O, если А^>0, точки оо , если Mi < 0, точки z2 = 0, если > 0 н точки |z2|= оо , если М2 < 0 •
Этот факт иллюстрирует рис. 6.8а, на котором область сходимости 2-преобразования отмечена штриховкой.
Пусть двумерная последовательность f разделима (для нее выполняется условие (4.46)). При этом ее даумерное z-преобразование также является разделимым:
^(zI;z2)= Z^K"' (6 59)
71| ——со ^2~—00
и, следовательно, область сходимости можно определить по каждой переменной. Известно что одномерное z-преобразование общего вида сходится в кольце, то есть для ^(zi) и области сходимости записываются соответственно в форме двойных неравенств:
где - некоторые постоянные, характеризующие границы области
сходимости. Система неравенств (6.60) определяет область сходимости разделимого двумерного ^-преобразования (6.59). В общем случае эта область имеет прямоугольную
1 Речь идет о внутренних точках области сходимости z-прсобразованил. На границах области условие (6.57) может не выполняться, по ряд (6.56) сходиться не абсолютно (условно). Вопрос о существовании z-преобразования в каждой точке границы области должен исследоваться дополнительно для конкретного ряда.
96
форму, (см рис.6.86). С конкретизацией одномерных последовательностей, входящих в (4.46), конкретизируется и форма области сходимости z-преобразования. Так, если / н /2 -правосторонние последовательности (в частности, если ненулевые отсчеты/лежат в первом квадранте), то область сходимости двумерного z-преобразования (6.59) определяется системой неравенств
(6.61)
и, следовательно, имеет вид, показанный на рис.6.8в.
Если / - двумерная неразделимая бесконечная последовательность, то область сходимости ее z-преобразования уже не выражается независимо по переменным |zj| и |z2|.
Так, можно показать, что, если ненулевые отсчеты последовательности сосредоточены только в первом квадранте плоскости аргументов (то есть при £ 0 и £ 0), то область сходимости z-преобразования опять задается системой неравенств типа (6.61), однако граница области по каждой переменной зависит от другой переменной:
(6-62)
Функции М^(-) и Л? ( ) здесь являются взаимообратными1, они определяют границу области сходимости в плоскости (|z||, |z2|). В соответствии с (6.62) эта граница не может иметь участков с положительным наклоном, то есть ограничивает область сходимости снизу и слева (см. рис 6.8г).
Аналогично, для бесконечной последовательности с ненулевыми отсчетами во втором квадранте (при < 0, л?2 £ 0 ) область сходимости определяется системой неравенств
(6-63)
при взаимообратных функциях (•) н Я?(). Здесь граница области сходимости имеет неотрицательный наклон и ограничивает область снизу и справа (см. рис 6.8д).
Для последовательности, расположенной в третьем квадранте (при £ 0, я2 0)
имеем
1 Здесь и ниже условие взаимообратности позволяет на практике ограничиться использованием любого одного из двух записанных неравенств.
97
(6.64)
при взаимообратных н » область сходимости ограничена сверху и справа (см.
рис 6.8е)
Для последовательности в четвертом квадранте (при > О э < 0 )
hl<42Ti|)
(6.65)
при взаимообратных и , область сходимости ограничена сверху и слева (см.
рис.6.8ж).
В самом общем случае, когда двумерная последовательность / рассматривается как отличная от нуля на всей плоскости аргументов, ее всегда можно представить в виде четырех
составляющих:
/(”1.л2)=/|("1.«2)+Л(«1.п2)+/з(пЬ"2)+/4("1,л2) • (6 66)
где / - последовательности с ненулевыми отсчетами только в /-м квадранте (i = 1,2,3,4 ). Слагаемые в (6.66) имеют ^преобразования с областями сходимости (6 62) - (6 65). Если эти области имеют общее пересечение, то существует н z-преобразование всей последовательности/, область сходимости которого может быть записана в виде обобщения системы двойных неравенств (6.60):
В соответствии с (6.67), любое сечение области сходимости при |z||=cohsZ или |z2|s= const является односвязным, граница области в общем случае замкнута и состоит из четырех сегментов, два из которых имеют неотрицательный наклон, а два -неположительный. Возможный вид такой области дан на рнс.6.8з. Для иллюстрации к сказанному рассмотрим несколько простых примеров.
Пример 1. Вычислим zпреобразование двумерной экспоненты первого квадранта (4 34): /(«], л2 )=я"1 b"2 «(«j ,п2).
Данная двумерная последовательность является разделимой, соотношение (4.36) для нее выполняется при
и(”1)> ЬМ=аПг "("г)
Z-преобразования и области сходимости приведенных одновременных последовательностей записываются в виде (см таблицу в п.6.1):
98
1 - azi1
1 ~°-2
В соответствии с (6.59), для рассматриваемой двумерной последовательности получаем
Область сходимости этого двумерного г-преобразования:
она имеет вид, показанный на рис.6.8в.
Пример 2. Вычислим z-преобразование двумерной последовательности /(n1,n2)=a"> «(njgfa-nj), (а - постоянная), представляющей собой ’’одномерную" экспоненту, расположенную по биссектрисе первого квадранта (см. рис.6.9а). Очевидно, данная последовательность не является разделимой, поэтому произведем вычисления по общей формуле (6.56):
п [•—оо Л 1=0
Если полученный ряд (сумма геометрической прогрессии) сходится, то
^(-1^2)------~Z
1-OZ! z2
Условие сходимости ряда:
его можно переписать в форме неравенств (6.62):
Вид этой области сходимости в плоскости (|z-||, [22!) показан на рис.6.9б.
Пример 3. Вычислим ?-преобразование двумерной последовательности /("1,"2)=PW =”2’
О при |л] * п2 , где а - постоянная (|zr[ < 1). Данная неразделимая последовательность представляет собой “крест” из одинаковых экспонент, “разбегающихся” по биссектрисам четырех квадрантов (рис.6.10а). Запишем ее через функции единичных импульсов и скачков в виде четырех составляющих по квадрантам: /(и1,л2)=°ЛЛ «("1)з(л1 м("л1 ~0з(и1 +п2)+
+ а~”1 «(-«j-1)б(л1-»2) + а>11 u(ni - 1)б(»1 + л2).
99
Рис,6,8, Формы области сходимости двумерного z-преобразования:
а) последовательность конечной длины, б) разделимая бесконечная последовательность (общий случай), в) разделимая бесконечная последовательность (правосторонние составляющие), г) произвольная бесконечная последовательность первого квадранта, д) произвольная бесконечная последовательность второго квадранта, е) произвольная бесконечная последовательность третьего квадранта, ж) произвольная бесконечная последовательность четвертого квадранта, з) последовательность, отличная от нуля на всей плоскости аргументов
100
Рис. 6.9. Импульсная характеристика и область сходимости её двумерного
z-преобразования: а) одномерная экспонента, расположенная по биссектрисе первого
квадранта; б) область сходимости двумерного z-преобразования одномерной экспоненты.
Для первой составляющей мы уже вычислили г-преобразование в предыдущем примере:
“(«1 - ”2 )->---------’
1 - ai\ z2
Производя аналогичные вычисления для остальных слагаемых, несложно получить
а щ м(- - l)5(wj + п2)-» ~2 ,
~2
а '*1 ?/(-/?]-1)б(и] -”2)->ДН~2 »
1 - azj z2
<
101
Для точек пересечения областей сходимости этих --преобразований можно записать
Указанное пересечение (область сходимости искомого --преобразования) существует при а < 1 может быть представлено в виде системы неравенств (6 67), в которой
[ 'й
Л1°Ы)= ы при |a|<Ns [ja)jz2| при 1<|г2|<1/|4
||а| ii.i
И ФИ
|a|[zjj при 1<|z]|<1/|4
при |л|<|г2|<1, при 1 < |z2| < 1/|4
При £1,
при 1<|Z||<1/|4
Форму данной области иллюстрирует рис 6 106.
Если двумерное ^-преобразование сходится при zjj = |z2| = 1, то, положив
при вещественных со2 , оъ > из формулы (6.56) получаем спектр Фурье (5.34) двумерной последовательности. Таким образом, как и в одномерном случае, преобразование Фурье есть частный случай z-преобразования, который находит применение при анализе двумерных абсолютно суммируемых сигналов и устойчивых ЛПП-систем (при выполнении условий (5 36) и (4 47)). Само же z-преобразование является более общим средством двумерных последовательностей и применяется значительно шире
Важный класс двумерных ^-преобразований образуют дробно-рациональные функции двух переменных, представляющие собой отношения полиномов от z} и z2 - Если использовать запись полиномов по отрицательным степеням переменных, то двумерное дробио-рациональное ^-преобразование имеет общий вид
М ЛЧ
V V к ^т\-~т2
у уг
—0 г»2=0
102
В одномерном случае подобные z-преобразования было удобно описывать своими нулями и полюсами, которые определялись в результате разложения полиномов числителя и знаменателя на простые множители. Такое разложение опиралось на основную теорему алгебры, согласно которой степенной полином одной переменной всегда может быть представлен через свои корни. Однако для полинома от нескольких переменных аналогичной теоремы в общем случае не существует, и подобное разложение невыполнимо. Многомерный полином, как правило, не имеет конечного числа корней, он равен нулю на непрерывных множествах значений переменных. В этом заключается главное качественное отличие одномерных и многомерных (в частности, двумерных) сигналов и систем, серьезно
усложняющее их анализ.
Рис.6.10. Импульсная характеристика и область сходимости ее двумерного z-преобразования. а) иллюстрация "креста" из экспонент по биссектрисам квадрантов, б) область сходимости двумерного z-преобразования.
103
6.6. Основные свойства двумерного z-преобразования
При работе с двумерным z-преобразованием полезно учитывать его свойства, которые перечисляются ниже. Некоторые из них достаточно очевидны или легко доказывается, другие - уже обсуждались в предыдущем параграфе.
Свойство 1. Если z-преобразование двумерной последовательности/существует, то ряд (6.56) абсолютно сходится во внутренних точках односвязной области сходимости, в общем случае определяемой системой двойных неравенств (6.67) В точках границы области ряд, соответствующий ^-преобразованию, может как сходиться, гак и расходиться. Область дробно-рационального двумерного z-преобразования всегда является открытой (не включает границы).
Свойство 2 Двумерное z-преобразование линейно, то есть если
/1 (л Ь п2 )~> fl (2b z2 )» fl ("b п2 )“► fl (“ b z2 ), то при любых постоянных а, b
af^n^bf^n^^aF^z^bF^z^}.
Областью сходимости этого суммарного z - преобразования в общем случае является пересечение областей сходимости слагаемых.
Свойство 3. Если двумерная последовательность разделима, то ее z-преобразование также является разделимым, то есть из соотношения
/(«|.Я2)=/|(«|)/2(я2)
следует
Свойство 4. Сдвиг двумерной последовательности по каждой координате выражается в умножении ее z-преобразования на целую степень соответствующей переменной, а именно, если
/2(«|.«2)= /1("1 “*1>"2 -^)
при целых к\ , 1'2 , то
<6 69)
При сдвиге последовательности область сходимости двумерного z-преобразования не меняется за исключением, возможно точек
*1=0, z2 =0, 1^1 = 00 и |^2| =00•
Свойство 5. Умножение двумерной последовательности на аргумент выражается в дифференцировании ее z-преобразования по соответствующей переменной, если, например,
104
/2(wl>«2) = nl/l('»l>«2).
TO
^2(21,22)= . (6.70)
При умножении последовательности па аргумент область сходимости двумерного z-преобразования не меняется за исключением, возможно, точек границ области.
Свойство 6. Умножение двумерной последовательности на экспоненту' изменяет масштаб аргумента в z-преобразовании. Если
Л("1.»2)—^^(zi.Zj)
с областью сходимости общего вида (6.67), и
/2(«1.”2) = ‘’''1 bn2fl(ni,n2) ,
где а,Ь~ произвольные постоянные, то
^(zi,Z2) = -Flf~>TI <6’7l>
к а о J
с областью сходимости, выражаемая системой неравенств
Свойство 7. Инверсия (изменение знака) аргумента последовательности приводит к замене соответствующей переменной в z-преобразовании на обратную величину, если, например,
с областью сходимости общего вида (6.67), и
Л("1.”2)=Г1(-"1.Я2).
ТО
F2(z),z2) = F1(zT1sz2) (6.72)
с областью сходимости, выражаемой системой неравенств
105
Свойство 8. Свертка двумерных последовательностей соответствует произведению их z-преобразований. Если
8(«1,Л2)=Л(И1,»>2)**/(«1.Я2) .
ТО
G(zbz2)= Я^И^) . (6.73)
Областью сходимости двумерного ^-преобразования G(zj,z2) является, как правило, пересечение областей сходимости H(zj,z2) и .
6.7. Анализ и синтез двумерных ЛПП-систем с использованием ^-преобразования
Как и в одномерном случае, введем понятие передаточной функции двумерной дискретной ЛПП-системы /f(zj,z2) - z-преобразования ее импульсной характеристики Передаточная функция исчерпывающим образом описывает систему, гак как с учетом соответствия (4.43) и (6.73) однозначно определяет преобразование входной двумерной последовательности в выходную.
Передаточная функция может быть получена непосредственно из разностного уравнения, опиадваютцего двумерную ЛПП-сисгему. Действительно, используя сформулированные в предыдущем параграфе свойства z-преобразования, уравнение (4.51) можно записать в преобразованной форме:
G(zl>^)= X 2X^2 <ХгЬ^)гГ’’22Я’2 + S Е6П>1^27?(21’22)2ГИ,гГ'2 • (J”!/n2)eQg
Отсюда
22 Swr1^2
G(2bS2)=_b^/----
Е Е^2^^2
(m^z)^
(6.74)
Сопоставляя выражения (6.74) и (6.73) видим, что
22 22^1^2 21 1г2 2
1- Е Е^/ГЧ"”2
(тг^п2)ед^
(6.75)
Аналогично, для каузальной JE111-системы, описываемой разностным уравнением (4.52), имеем
106
V1 к2 ---------------------------• (6-76) 1“ У' ат т Ztm^Z^m2 La La Mm1m2J&l *2. mj=0 m2=0 (т^ИМО
Передаточные функции (6.75), (6.76) представляют собой частные варианты записи выражения вида (6.68), то есп» являются дробно-рациональные. Несложно показать, что двумерные ЖШ-сисгемы, представляемые разностными уравнениями конечного порядка, всегда имеют дробно-рациональные передаточные функции.
Важной для практики является и возможность обратного перехода от передаточных функций (6.75), (6.76) через соотношение (6.74) к разностным уравнениям (4.51), (4.52). Такой переход позволяет решить задачу синтеза и реализации двумерной ЛПП-системы с требуемой импульсной характеристикой.
Пример. Построим разностное уравнение для каузальной Ж Ш-системы с импульсной характеристикой
й(«1,л2)=п(л1}Н2)"«(«! “О-
Графическое изображение этой импульсной характеристики дано на рис.6.11а. Вычисление z-преобразования от представленной двумерной последовательности (переход к передаточной функции) дает:
1,2 ’-гГ'-'г* + ’д1»2Ч ’ Г? >'•
Связь ^-преобразований входного и выходного сигналов задается выражением:
G(zl,z2) = H(zl, z2 V7(zi, z2) =--- -Г 2 : rfzj ,z2)
i-z; -z/ +.7^-
Отсюда получаем
+*llz2l)<Xrl>*2) = (l“z11 *2) > или
G(zl > z2 ) = -1 > z2 ) + z2 »z2 ) * ’11 z2(гЬ z2 ) + ^(zl> z2 ) “ zl' z2 l^(zl > z2 ) *
Последнему соотношению в области пространственных аргументов соответствует двумерное разностное уравнение
^(«l.n2) = H«l -1."2) + «(иЬп2 ~l.»2-,)+/(nl.«2)-/(”!“О-
Построенная на базе этого уравнения схема вычисления отсчетов двумерного выходного сигнала представлена на рис.6.116.
Аппарат z-прсобразования весьма эффективен при решении задачи синтеза двумерной ЛПП-системы, осуществляющей заданное преобразование сигналов, то есть при конструировании передаточной функции системы по соотношению
107
v ^.*2)
(6.77)
Следует однако иметь в виду, что результатами такого синтеза удается воспользоваться на практике только тогда, когда z-преобразования входного и выходного сигналов являются дробно-pai щональяыми, поскольку только в этом случае ЛИП-системе соответствует
разностное уравнение конечного порядка.
Рис, 6.11. Импульсная характеристика и соответствующая ей схема вычисления выходных отсчетов,: а) импульсная характеристика двумерной ЛПП-системы
б) схема вычисления выходных отсчетов
Пример. Построим разностное уравнение для каузальной ЛПП-системы, преобразующей
последовательность
/(И1Л2) = Ы(ЯЬИ2)-"(Л1 “Ц ’О в единичный импульс:
g(ni,n2)=S(nlsn2) •
Для z-преобразования входного сигнала имеем (см. предыдущий пример) _____________________________________1 - и1 у21 t hl>t 1 — Zj z2^ + zj ^?2^ Jz2 >
108
а для выходного сигнала
G’(zi,r2)«l прнлюбых |^i|,jz2| .
Следовательно, по (6.77) можно записать
1 - г”1- г-1 X г-1,"1
l-q’zj1
и далее перейти от передаточной функции к искомому разностному уравнению (см. также рнс.6.12) g(»l,*2 )=*(”! ‘“1’л2 ~ 0 + /(*Ь»2 )“/(«! -'1>И2)-/(ПРЛ2 ~0 + /(и1 “t"2 ~ 0 •
При решении подобных задач, связанных с “переворачиванием” z-преобразования. естественно, возникает вопрос об области его сходимости. В рассмотренном примере ответ на него достаточно прост и однозначен. Область сходимости записанной дробнорациональной передаточной функции ограничивается такими значениями zj, z2 , при которых ее знаменатель обращается в нуль, то есть выполняется равенство
1 -1 -1 л 1
1 - Zj z2 = 0 или ?! = — .
Ъ
Соответственно, для абсолютных значений комплексных Беременных имеем
Последнее соотношение задает гиперболическую границу области сходимости в координатах ([?i , |z2!)- Форма границы позволяет рассматривать два варианта самой
области:
Поскольку ЛПП-система полагается каузальной (с импульсной характеристикой в первом квадранте), то необходимо пр июнь первый вариант. Для нашего примера решение оказалось очевидным, однако в общем случае назначение области сходимости синтезированному” двумерному z-преобразованию может оказаться сложной процедурой с неоднозначным ответом.
Еще более сложным (а иногда и невозможным) является обратный переход от z-преобразования к исходной двумерной последовательности. Существует общий метод вычисления обратного двумерного z-преобразования, но он имеет весьма ограниченное применение из-за громоздкости вычислений, связанной, в частности, с невозможностью представления произвольных двумерных дробно-рациональных функций в виде суммы
109
простых составляющих. Обычно реконструкция двумерной последовательности осуществима згишь тогда, когда z-преобразование с учетом его свойств удается свести к совокупности “табличных” формул, для которых указанный переход заранее известен.
Рис. 6.12. Схема вычисления выходных отсчетов для ЛПП-системы, преобразующей последовательность вида и(пу,п2}~и(пу -1,^2 -1) в единичный импульс
Как и в одномерном случае, важным применением ^преобразования к анализу двумерных J11111-систем является проверка устойчивости системы по передаточной функции. Из сравнения основного критерия устойчивости (4.47) с условием сходимости z-преобразования (6.57) следует, что для устойчивости двумерной ШШ-сисгемы необходимо и достаточно, чтобы область сходимости передаточной функции включала в себя значения ее комплексных аргументов, для которых [z^ -1, = 1 . Это условие выглядит простым,
однако его выполнение обычно трудно проверить на практике. Для анализируемой J11111-системы, как правило, известно разностное уравнение, по которому можно легко построить саму дробно-рациональную передаточную функцию, но чрезвычайно сложно в явном виде выразить ее область сходимости. По этой причине находят применение косвенные тесты устойчивости, не требующие определения всей области сходимости и проверки охвата сю точки ^1 = 1, |z2| = l. Сформулируем в виде теорем (без доказательств) два наиболее известных таких теста, относящихся к каузальным системам.
Теорема Хуанга. Для устойчивости каузальной ЛПП-системы с передаточной функцией
<6-781
где Л(г1,г2), * двумерные полиномы конечного порядка от Zj, Z2 , достаточно
одновременного выполнения двух условий:
1) отображение единичной окружности |zj| =1 в ксмгитексную плоскость Zj с помощью
соотношения
no
A(zvt2)=0 (6.79)
полностью лежит внутри единичной окружности (то есть в области |г>2 j < 1);
2) любая точка , такая, что |z2 > 1, отображается с помощью (6.79) в область |zj | < 1.
Формулировка теоремы Хуанга “несимметрична” относительно переменных, но роли Zj, Z2 в ней можно поменять местами. Следующая теорема имеет симметричную форму.
Т еорема Дс Карло-Стрцнтциса. Для устойчивости каузальной ЛПП-системы с передаточной функцией (6.78) достаточно одновременного выполнения трех условий;
1) полином A(zy,Z2) не принимает нулевых значении при |q| = l и |z2| = l;
2) точка zj=l отображается с помощью (6.79) в область (zj) < 1;
3) точка ^2= 1 отображается с помощью (6.79) в область < 1 ;
Рассмотрим два примера использования приведенных теорем при анализе устой’швости двумерных ЛППсисгем.
Пример 1. Каузальная ЛПП-система описывается разностным уравнением: ginifn2)^ag(nl -l7n2) + ag(nl,n2 -l)+/(«i>*2) . Определим, при каких значениях параметра а она является устойчивой. Воспользуемся для этого теоремой Хуанга. Передаточная функция системы задается выражением
\ 1 “Ьг2)=-----Гц-----2Т\ ,
+ z2 /
то есть полином в знаменателе формулы (6.78) имеет вид
Для проверки первого условия устойчивости подставим в (6.79) значения переменной на единичной окружности ( Zj = erG>, где со - вещественный параметр) и решим полученное уравнение относительно z2 :
а
*7--------.— •
1 “П»
1 — ае
Вычисление модуля этой величины дает
Для устойчивости системы нужно, чтобы максимальное (по со ) значение \z^\ было меньше
единицы. Можно показать, что
Ill
max z2 = -(0
И
при «| < 1, при |д| = 1, при |а| > 1.
Значения выражений второй и третьей строки данного соотношения заведомо превышают единицу. А для первой строки из неравенства
-Ч-7<1 ’"И
получаем требование к параметру устойчивой системы:
При проверке второго условия устойчивости в качестве отображаемой точки удобно выбрать Z2 = оо , При этом из (6.79) получим
л(ао?12 ) = ’fl =0, Z[=a.
Условие выполнено, если
1^11 =и<1-
Как видно, в данном примере второе условие является более слабым и всегда выполняется при выполнении первого. Итак, окончательно получаем, что анализируемая ЛПЛ^система устойчива, если ее параметр удовлетворяет неравенству
Пример 2. Каузальная ЛПП-система описывается разностным уравнением: g(ni,n2)^ag{nl -kn2) + ag(nl,n2 -l)+bg(ni -1,л2 -1) + /(л1?и2).
При каких значениях параметров а, Ь система является устойчивой? Передаточная функция системы:
1 __________
1-a(zfl + z2l )-b zj-1 z2*
и полином в знаменателе формулы (6.78):
J(zi,zi)-l-a^l1 + *2*)~
Воспользуемся прн анализе устойчивости системы теоремой Де Карло-Стринтциса. Первое условие теоремы означает, что должно выполняться строгое неравенство
= |1-д^ IG>1 +е 1
при любых вещественных ©j , <о2 • Определим диапазон параметров а} b методом от противного
Пусть рассматриваемое условие нарушено, то есть существуют такие , со2 >что
_6e-'(“i+®2) =о, или ----
а+Ье^
112
+ &
Рис. 6.13. Область параметров, соответствующих устойчивой системе
Из последнего соотношения следует
\-ае~^
1 + а2 -2acosG)2
'2
a + be у a2+b2+2o1>cosg)
и далее;
1-6
COS®2 = ~^~ •
Косинус вещественного аргумента нс превышает по модулю единицы, следовательно, решение будет отсутствовать (первое условие теоремы будет выполнено), если
Ь»>1.
2а
Анализ второго и третьего условия теоремы в силу симметрии передаточной функции системы относительно z^ , z2 даст одинаковые результаты. Рассмотрим, например, второе. Подставив в
уравнение (6.79) Z\ = 1, получим:
= 0
а + Ь z2^~----.
1-л
Для устойчивости системы требуется, чтобы выполнялось неравенство । । а + Ь
Условия теоремы должны выполняться одновременно н, следовательно, параметры устойчивой
Л1Ш-системы удовлетворяют обоим полученным неравенствам:
а + Ь < 1
1-а
1-6 2а
Нетрудно показать, что эти параметры лежат в треугольной области плоскости (а. Ъ\ показанной на рис.6.13.
7. СПЕКТРАЛЬНЫЙ АНАЛИЗ ДИСКРЕТНЫХ СИГНАЛОВ
Анализ спектров - это одна из основных задач цифровой обработки сигналов Такой анализ, выполняемый с помощью ЭВМ, имеет свою специфику по сравнению со спектральным анализом в радиотехнике, физике и тд., когда используются аналоговые методы получения спектра Эта специфика заключается в том, что на ЭВМ обрабатываются последовательности, а не непрерывные сигналы При этом появляются существенные особенности и в смысле используемых способов вычисления спектра, и в смысле интерпретации результатов вычислеиий.
Основой цифрового спектрального анализа является дискретное преобразование Фурье (ДПФ), которое переводит последовательность, заданную во временной области, в последовательность, соответствующую компонентам спектра, и наоборот. Следует сразу подчеркнуть, что это не то преобразование Фурье, которое широко известно из классической математики, а лишь его некоторое приближение, в некоторых случаях достаточно грубое Связь между непрерывным и дискретным преобразованиями Фурье является одним из вопросов, рассматриваемых в данном разделе.
Практическая ценность ДПФ заключается в том, что для него разработаны чрезвычайно эффективные алгоритмы вычисления, называемые алгоритмами быстрого преобразования Фурье (БПФ). Принцип построения таких алгоритмов мы также рассмотрим ниже.
7.7. Дискретное преобразование Фурье
Пусть fH (г) - непрерывная периодическая функция времени (см, рис. 7.1).
Ш = /Л‘ + кТ), (7.1)
где Т- период, k - любое целое число
Рис. 7.1. Пример непрерывной периодической функции времени
Такую функцию можно разложить в ряд Фурье (п 2 L), то есть представить в спектральной области. Этот ряд (спектр) будет содержать гармонические (синусоидальные) составляющие с периодами Г, % ? %.. .В комплексной форме представление
114
периодической функции через ряд Фурье записывается в виде
«•> -к.
00 „ i — mt
A(0= т
т~-<х>
(7.2)
Здесь <е 7 I . Набор функций, образующих базис, по которому производится
разложение fN(t) в ряд, FH(m) - коэффициенты этою разложения - спектральные
компоненты сигнала Эти компоненты образуют последовательность ~ дискретный спектр (см. рис. 7 2). Заметим, что дискретность спектра связана с тем, что функция fH(i)
периодична
и-я/п (О)
Рис, 7,2, Дискретный спектр функции
Пусть теперь f(n) - последовательность, периодическая с периодом N: f(n)~ f(n + kN),
(7 3)
которую можно получить дискретизацией периодической функции непрерывного аргумента, удовлетворяющей условию (7.1). Такая последовательность есть частный случай периодической функции общего вида, поэтому для нее все сказанное выше остается в силе. При переходе от (7 1) к (7.3) мы просто заменили t на п, а Т на N. В новых обозначениях можно записать и ряд (7.2)
w 1—mn
Ап)= 2F Ме N (74)
ж=-оо Однако, то, что теперь функция рассматривается при целочисленных значениях
аргумента, дает основание не удовлетвориться такой записью. Действительно, в данной
>7V-
i —тп
ситуации базис разложения содержит только N различных функций: <е
)m=Q
остальные базисные функции совпадают с ними. Это связано со свойством периодичности дискретной комплексной экспоненты:
115
2тг/мл 'lit, ч t---- i —m
e N =e У
Естественно, одинаковые базисные функции дают и одинаковые коэффициенты
разложения Поэтому представление последовательности через ряд вида (7.4) является избыточным
Для устранения избыточности предлагается усечь ряд (7 4), ограничась базисом только из N различных комплексных экспонент Разложение по такому базису принято записывать в виде
д,_| 2птп
An)-~^HF^e N •
т=0
(7-5)
где последовательность коэффициентов F(tn) называется дискретным спектром (ДПФ) исходной последовательности. Появившийся множитель перед суммой не меняет характера представления, он вводится исходя из некоторых дополнительных соображений.
Определим коэффициенты разложения (7 5). Умножим обе части выражения (7.5) на 2л .
I кп
е N при 0 < к < N -1 и просуммируем по периоду:
i~kn 1 ^“1 z~w(/M-i)
= -^Е N
п=0 п—0 т-0
После замены порядка суммирования выражение (7 6) преобразуется к виду:
^“1 t~kn 1 AM ЛМ л(т-Л) S/w* =—X7?WZe'v я-О т=0 п=0
Будем рассматривать интервал значений индексов длиной в период: 0 < т,к < N - 1.
(7 6)
(7 7)
Нетрудно показать, что для этого интервала внутренняя сумма
(N т = к] ,
= л =№(">-*) (78)
и=о 1°
Подставив (7.8) в (7.7) после замены индекса получаем:
AM -i^mn
F(„)=X/We N W
п-0
Пара соотношений (7.9), (7.5) определяют дискретное преобразование Фурье
последовательности. (7.9) - прямое ДПФ, (7.5) - обратное.
Заметим, что, в отличие от «классического» преобразования Фурье, здесь и /(я), и
F(w) - последовательности. Как следствие, и в этом легко убедиться, и F(m), и f(n)-
периодичны с периодом N (условная иллюстрация этого факта дана на рис. 7.3)
116
0 Л 2/V m
Рис.7.3. Иллюстрация периодичности последовательности и ее дискретного спектра
Из соотношений (7 5), (7.9) видно, что для вычисления и прямого, и обратного ДПФ берутся отсчеты последовательностей только в N точках одного периода. Это позволяет формально использовать ДПФ и для последовательностей f(n) и F(m), заданных только на интервале [0,#-1], то есть непериодических (имеющих конечную длину). Однако при этом всегда неявно предполагается периодическая продолженность преобразуемых последовательностей на всю бесконечную числовую ось аргумента, как это показано на рис. 7.3.
7,2. Связь ДПФ с ^-преобразованием и непрерывным спектром последовательности
ДПФ это третье функциональное преобразование последовательностей, которое мы определяем в данном учебном пособии До этого были введены в рассмотрение “непрерывное” преобразование Фурье (см. раздел 5) и z-преобразование (раздел 6). Выясним, как связано ДПФ с введенными ранее преобразованиями.
Пусть имеется последовательность конечной длины:
/(/?)-О при и£[0,У-1].
Вычислим ее 2-преобразование (чтобы не было путаницы в обозначениях, будем индексировать его буквой z)'.
Л(Л= f/(«)<” = s' f(n)z~n (7.10)
Л=-ОС Л-0
Сравнение выражений (7 9) и (7.10) показывает, что они совпадают, если положить
117
Рис. 7.4. Связь ДПФ и ^-преобразования
Таким образом, коэффициенты ДПФ последовательности конечной длины N равны значениям ее ’-преобразования в N точках, равномерно распределенных по единичной окружности в комплексной z - плоскости (см. рис. 7.4):
F(m)= bz(z\z^ Nm, (7Л1)
Формула (7.11) задает простой способ определения ДПФ по ^-преобразованию
Возможен и обратный переход, то есть определение z-преобразования по ДПФ:
ДМ N, N-1 ^тп
л-0 п-0 т-0
1 /V-l jV-1
т~0 я=0
( 2я
,2л е'и
(7.12)
z-N у F(m) ъз 2 я
/м~0 1
1-е * <'
Выражение (7.12) интерполируют значения коэффициентов ДПФ на всю комплексную
’-ПЛОСКОСТЬ.
Теперь определим связь ДПФ и непрерывного спектра. Ранее мы уже получали, что преобразование Фурье последовательности есть ее z-преобразов анис, вычисленное на единичной окружности, то есть при z = t,K0 (см. формулу (6.12)). Поэтому здесь можно воспользоваться только что полученными результатами. Переход от непрерывного спектра к ДПФ задается выражением.
118
F(zn)=fz(e'“] 2n 1(0=—fn, N
0<m<N -1
(7 13)
Иными словами, коэффициенты ДПФ есть равноотстоящие отсчеты непрерывного спектра последовательности конечной длины на интервале частот [0,2я] (см. рис. 7.5).
Нетрудно выполнить и обратный переход, то есть вычислить непрерывный спектр по ДПФ. Для этого нужно в формулу (7.2) для z-преобразования подставить z = е1<£>. Поскольку получающееся при такой подстановке соотношение нам далее не понадобится, мы не будем его записывать.
7.3, Использование ДПФ для вычисления отсчетов непрерывного спектра
При цифровом спектральном анализе прикладной интерес представляют отсчеты непрерывного спектра. Если требуемое число отсчетов равно N - длине исходной последовательности, то оии непосредственно определяются через ДПФ в соответствии с формулой (7.13). Однако часто требуется более “детальный” анализ спектра, то есть получение большего чем N , числа отсчетов Дадим решение этой задачи.
Пусть имеется последовательность конечной длины.
/(л)=0 при л£[о,ЛГ“1]
и требуется определить L отсчетов ее непрерывного спектра
равномерно
распределенных на интервале [0,2/г], то есть на периоде спектра (/. > ЛГ) .
119
Преобразование Фурье (спектр) последовательности задается выражением (5 9), которое в данном случае записывается в виде
/ \ х Л'-1
Г‘)= • (7-14)
л=-х и=0
Определим отсчеты спектра в L точках спектра (7 14), а именно, прн значениях частоты
O/=yZ, 0<7<Л-1
L . (7.15)
С другой стороны, введем в рассмотрение новую последовательность длиной в L отсчетов.
, [ f(n) $<n<N-\
<7 i <7l6)
О N <n< £-1
и вычислим её £-точечное ДПФ:
L-\ -&п1 AM -/ — л/
L = Z/(«> L (7 17)
л=0 л=0
На последнем шаге преобразований здесь учтено, что, поскольку при ?/ < л < £ -1 последовательность (7.16) равна нулю, то пределы суммирования в (7 17) сужаются. Сравнивая выражения (7.15) и (7.17) видим, что
/г (.«“')= F*(/).
Таким образом, простое дополнение последовательности конечной длины нулями позволяет получить сколь угодно большое число отсчетов ее спектра при помощи ДПФ.
7.4. Использование ДПФ для вычисления последовательности по ее спектру
Спектральный анализ дискретного сигнала основан на переходе от последовательности к ее спектру. Выше мы видели, что для вычисления любого числа отсчетов спектра можно использовать ДПФ. Однако в практических приложениях встречается и обратная задача, когда спектр задан, а требуется получить саму последовательность Оказывается, для получения последовательности по спектру также можно использовать ДПФ (точнее, обратное ДПФ).
Для вычисления обратного ДПФ нужен не сам непрерывный спектр последовательности, а лишь его отсчеты, то есть дискретный спектр F(m). Переход от непрерывного спектра к отсчетам («дискретизация» спектра) может повлиять на форму получаемой последовательности. Поэтому, чтобы получить искомый результат, нужно
120
правильно выбирать значение - длину ДПФ (число отсчетов непрерывного спектра) Рассмотрим эти вопросы детально
Пусть /(и) - произвольная последовательность (не обязательно конечной длины)
Будем предполагать, что ^-преобразование
сходится в области, включающей в себя единичную окружность. В этом случае можно
положить z - и перейти к непрерывному спектру последовательности
п=—ОО
И теперь, имея мы должны при помощи обратного ДПФ получить исходную
последовательность f(n).
В первую очередь произведем дискретизацию спектра. Для этого на интервале частот [о,2тг) возьмем N равномерно расположенных отсчетов спектра, которые будем считать коэффициентами ДПФ.
( Л к тп
F(m)= Л’Л'Д 2я = У/W6 N 0<!«<N-l. (718)
— т _
Л' Я =
От дискретного спектра F(m) при помощи обратного ДПФ (7.5) можно перейти к самой последовательности Но, как уже говорилось, при этом получается не исходная (произвольная) последовательность, а периодическая с периодом N:
. V—I
I ’ 1 i—тп
/*W=iZFw>N (7|9)
Tv
Выясним, как связаны между собой /(л) и f N(n). Для этого подставим в выражение
(7 19) значения коэффициентов ДПФ (7.18) (при этом заменим индекс внутреннего
суммирования):
« ЛМ со
A(*)=^Z Z/(*>
2л i—тп
е »
Z
= ffl=0
(7.20)
~i- тк . N
_1_
Заметим, что в (7.20) внутренняя сумма при произвольных пу к.
N—\ izFLm[n-k}
z^
77? =0
'N
[о
при при
п- к + rN = 0
>
п - к + rN О
✓
00
где г - любое целое Поэтому продолжая цепочку преобразований (7 20), получаем:
121
A («)=-“ Х/^И X + = X ^f(k)&(n-k + rN)= ^f(n+rN) (7 21)
A--—co r=—» r~~aok. —=o r=—ас
Таким образом, периодическая последовательность полученная при помощи обратного ДПФ из дискретизированного спектра непериодической последовательности, состоит из бесконечной суммы сдвинутых копий исходной последовательности.
Если длина последовательности f{n) превышает N, то слагаемые в (7 21) имеют пересекающиеся области ненулевых значений, то есть возникает так называемый «эффект наложения» Для бесконечной последовательности эффект наложения есть всегда.
В случае последовательности конечной длины, чтобы эффекта наложения не было, следует выбирать N больше длины последовательности.
7.5. Основные свойства ДПФ
Дадим сводку некоторых свойств ДПФ, которые могут быть полезны в дальнейшем.
Свойство 1. - Линейностъ. Если /1 (п) —> F{ (m), Л(л)-> ^(m) т°.
afl(n) + bf2(n)^> aF\(m)+ bFz(m) при любых постоянных а, b Здесь предполагается, что
последовательности Д и /2 имеют одинаковую длину.
Свойство 2. - Периодичность (уже упоминалось выше). Последовательности, удовлетворяющие прямому ДПФ
ДГ -~1 -
v zv 1 , -I—тп
X N л=0
и, соответственно, обратному ДПФ
являются периодическими с периодом N. Такие последовательности удобно представлять не на числовой прямой, а на окружности, как показано на рис. 7.6.
При таком представлении их можно рассматривать одновременно и как периодические, и как последовательности конечной длины на интервале [о,ЛГ -1].
Свойство 3. - Сдвиг. Если последовательность f(n) - периодична с периодом N и ее
.2л
—i —
ДПФ - F\m), то последовательность имеет ДПФ F(m)e N
Следует учитывать особенности сдвига, если ДПФ применяется к последовательности конечной длины В этом случае последовательность дополняется до периодической и осуществляется так называемый круговой («циклический») сдвиг. Если представить такую
122
последовательность на окружности, то циклической сдвиг соответствует повороту окружности на точек
Рис.7.6. Представление конечных последовательностей, удовлетворяющих ДПФ
Эффект циклического сдвига для последовательности конечной длины, представленной на числовой оси, иллюстрирует рис. 7.7 На рис.7.7а показана последовательность конечной длины, заданная на [0,7У-1]. При ДПФ последовательность считается периодически продолженной (см. рис 7.76) При умножении ДПФ на экспоненту сдвигается именно периодическая последовательность, то есть мы получаем последовательность, показанную на рис.7.7в. И сдвинутая последовательность снова рассматривается на интервале [О, N -1], то есть в результате имеем последовательность конечной длины, показанную на рис.7.7.г, в которой отсчеты, вышедшие в результате сдвига за пределы интервала [О,— 1], например, как в данной иллюстрации, вправо, опять появляются на этом же интервале слева.
Свойство 4. Циклическая свертка последовательностей. Пусть f{n) и h(n)-периодические последовательности с периодом # и их ДПФ равны соответственно F(m) и Н(т) Сформируем новое ДПФ, перемножив два имеющихся:
G(m) = р(т)н(т) и вычислим обратное ДПФ от произведения. Полученная в результате этих действий последовательность g(n) будет связана с исходными последовательностями следующим соотношением
V-I
§(")= (7 22)
*=0
Выражение определяет так называемую круговую (циклическую) свертку периодических
п оследовател ь н остей
123
Рис. 7.7. Иллюстрация эффекта циклического сдвига
Рис. 7.8. Иллюстрация циклической свертки последовательностей
Такое название становится понятным, если рассмотреть последовательности на окружностях (см. рис.7.8) Значения циклической свертки получаются поэлементным перемножением соответственных отсчетов на окружностях и последующим суммированием произведений. На рис 7 8а дана иллюстрация для вычисления g(o)
124
/:-0
Различные значения отсчетов круговой свертки получаются при смещении одной окружности относительно другой (см рис. 7.8 б и в).
g(i)= ... .g(H=2W-i-*)
i=0 к=0
Очевидно, последовательность g(n) также является периодичной с периодом N. Рассматривается она на том же интервале [О, N-1], что и сворачиваемые последовательности.
7.6. Вычисление линейной свертки при помощи ДПФ
Практический интерес при обработки сигналов представляет линейная (апериодическая) свертка последовательностей вида (4.13), которая не совпадает с циклической сверткой (7.22). Тем не менее хотелось бы для получения линейной свертки применить ДПФ, поскольку это преобразование имеет очень эффективный алгоритм вычисления (см. далее п 7.7). Возникает задача, как, производя вычисление циклической свертки последовательностей, получить результат, совпадающий с линейной сверткой. Рассмотрим ее решение.
Пусть имеются две последовательности конечной (и, возможно, разной) длины f(n) = 0 при п £ [О, N\ -1| Л(п)-0 при Hg[0, #2~1) и требуется вычислить их линейную свертку (см также (4 13))
gW = if(k)h(n-k). (7.23)
Нетрудно убедиться, что последовательность (7.23) также имеет конечную длину в (Nj + ^2 -1) отсчетов
g(n) - 0 при п $ [о, Д') + N? “ 2].
С учетом этого согласимся получать вместо конечной последовательности - линейной свертки периодическую последовательность - циклическую свертку с тем условием, что на основном периоде (начинающего с точки п = 0 ) они совпадут. Такое совпадение возможно, если период циклической свертки будет не меньше, чем длина линейной (то есть не меньше jVj + No ~ 1 ) Но для того, чтобы циклическая свертка имела заданный период, такой же период должны иметь сворачиваемые последовательности, и такую же длину должно иметь ДПФ, применяемое здесь по схеме, изложенной в свойстве 4 (см. предыдущий параграф).
125
Поэтому исходные последовательности нужно дополнить нулями, как минимум до длины в (Ад + No -1) отсчетов и применять ДПФ такой же длины
Благодаря дополнению нулями при циклической свертке ненулевые значения периода одной последовательности /(и) будут взаимодействовать с ненулевыми значениями только одного периода второй последовательности h(n) При этом полностью исключатся круговые наложения, характерные для циклической свертки
Метод вычисления линейной свертки при помощи ДПФ, который иллюстрирован схемой на рис 7 9 получил название ‘ быстрой свертки” в отличие от непосредственного суммирования произведений в соответствии с (7 23) (’’прямой' свертки). Термин “быстрая1 здесь употреблен потому, что вычисление свертки через ДПФ более эффективно с точки зрения числа выполняемых арифметических операций. Выигрыш в эффективности начинает ощущаться при длинах сворачиваемых последовательностей в несколько десятков отсчетов (20-30) и быстро растет с увеличением Nj и N2
f(n) h(n) 0<«<N2-l
g{n) 0<n<Ar| + W2~2
Puc. 7.9. Схема вычисления линейной свертки при помощи ДПФ
126
7.7. Быстрое преобразование Фурье
Рассмотрим, наконец, принцип построения специальных алгоритмов вычисления ДПФ, называемых алгоритмами быстрого преобразования Фурье (БПФ).
Таких алгоритмов на сегодня разработано довольно много. Однако в их основе лежат близкие идеи, поэтому для понимания существа вопроса достаточно рассмотреть один из них. Мы построим так называемый алгоритм БПФ с прореживанием во времени, наиболее простой и часто используемый на практике
Итак, дискретное преобразование Фурье (прямое) можно записать в виде
/'(«')= Е .A"W" , (7 24)
п=0
2я
—i —.
где = е N - так называемый фазовый (поворачивающий) множитель. Если использовать известное векторное представление комплексного числа на комплексной плоскости в виде вектора, то умножение этого числа на поворачивает вектор вокруг
Рис. 7.10. Иллюстрация умножения комплексного числа на фазовый множитель
Сформулируем некоторые очевидные свойства фазового множителя, которые нам будут нужны далее,
1) = при произвольном целом /, то есть степень , рассматриваемая
как показательная функция, периодична с периодом N;
2) = 1 ,
3) ^'2=-1;
4)
Поскольку дискретный спектр (7.24) рассматривается в # точках (0< w < -1), то если вычислять его непосредственно по формуле (7 24), считая что фазовые множители
127
получены заранее, потребуется раз выполнить по N операций умножения и no (W-1) операций сложения комплексных чисел. Так как преобразование вычисляется на ЭВМ, то общее время его выполнения (без учета служебных операций) равно
Тдпф = w2?},+лг (w -1)7; « n2(tv + rj.
где Tv - время выполнения операции комплексного умножения, Тс - время выполнения операции комплексного сложения Очень быстрое (с квадратом длины) возрастание вычислительной сложности ДПФ и вызывает необходимость разработки алгоритмов БПФ
Одна из основных идей БПФ заключается в том, что исходная N- точечная последовательность разбивается на несколько более коротких последовательностей, дискретные спектры которых могут быть скомбинированы таким образом, чтобы в итоге получилось ДПФ полной последовательности Так, например, как будет показано дальше, можно разбить последовательность на две равные части по отсчетов. Тогда, если пренебречь затратами времени на объединение (комбинирование),
то есть имеем двукратный выигрыш во времени по сравнению с (7.25) Причем операцию разбиения можно повторять многократно, при этом выигрыш будет еще более значительным.
Реализуем идею разбиения для частного, но широко распространенного случая, когда длина ДПФ равна целой степени двойки: # = 2^ . Напомним, что преобразованию подлежит последовательность f{n\ 0<n<N-l. Введем в рассмотрение две -точечные последовательности, состоящие из четных и нечетных членов исходной последователь ности:
/1(/) = /(2/), /2(/) = /(2/ + 1), 0</<^-1.
Тогда # - точечное ДПФ разбивается на два слагаемых:
Л'-l W-l jV-1
F(,n)= Y = Е + Е /(«ХГ = /7=0 /7=0 /7=0 .
(по четным) (по нечетным)
М _] Л' _|
= Е r(2/)^m'+ Е Д2/ + 1)1Т”(2/+1), /=0 /=о
окончательно
128
Л' -I
Ф)= £ /|(оИГ+г^ х л(оИГ = /=0 /=0
.V -1 Л' ->-1
= 2/1 <№» 2m' + ^.V £ fl (0^2
l~O 1=0
(7 26)
= F\ (m) + F2 (w),
где Fj(w). F2 (т)-П/2 - точечные ДПФ последовательностей j\(n )и/2('’)
N
Дискретные спектры Fj (???) и F2(m) определены при 0 < т < — -1 , однако нам нужно знать F{m} при 0 < т < N -1. Поэтому нужно доопределить формулу (7.26) для интервала — < ?и < N -1} используя свойство периодичности спектров
v* _т]+~ у
N при 0 < w < — -1,
при ~ < т < N -1.
(.7 27)
2
Заметим, что из свойств фазового множителя следует:
У т--
w%=-wN 2.
это позволяет в два раза сократить в (7.27) число используемых значений фазового множителя и записать окончательно:
<
при 0<т<у-1,
. х Л'
( лМ т—
2F2
(7.28)
т----
2
2
при у < m < Лг -1.
В этой формуле в обеих строках содержатся одинаковые значения дискретных спектров Fj(w) и /*2(w) и одинаковые значения фазовых множителей.
Полученное соотношение определяет операцию объединения “половинных” ДПФ в целое, которую часто изображают графически Для этого приняты специальные обозначения. Вычисления по (7.28) требуют выполнения двух типов ’’элементарных1’ операций: сложение* вычитание пары чисел (так называемой ’’бабочки”): и умножения на постоянный множитель, который мы уже использовали ранее (см. рис. 7.11)
В качестве примера на рис 7 12 изображена схема формирования 8 точечного ДПФ из двух ДПФ длины 4.
Рис. 7.11. Элементарные операции, используемые в ДПФ
129
Используя аналогичную операцию разбиения (прореживания) вычислим каждое 4' точечное ДПФ через пару двухточечных. При этом обозначим
/| [(и) - четные члены /j(n),
/12(«)-нечетныечлены /j(n),
/21W " четные члены AW >
/22 (л) ‘ нечетные члены A W
Схема, соответствующая предпоследнему шагу преобразований показанная на
рис 7 12, имеет вид, изображенный на рис 7 13
Л(0)=/'®)— Л(П=/(2) — Л!2)=Д4> — Ai'3)=/Y<0 -1х„ s» । г1; ДПФ - Е,<0) —у— rfO j - F, ( 2 >-4V \(//- Т2) _ F, (л'-ДДХД/ЯЗ)
х х уХ
/ДО)«/(?)— /Д — у2(2)V (5)— /Д.ЗЦ/ (7) 4х- На: С ЛИФ - ? <5) - А* — Иб) - Г2( з)Л7ф. — /ч’ 71
Рис.7J 2. Схема формирования 8 точечногоДПФ из двух 4-тпочечных
Рис.7.13. Предпоследний шаг преобразования 8 точечной последовательности в ДПФ
И, наконец, двухточечное ДПФ может быть вычислено впрямую, так как показало на рис 7 14 для первого блока приведенной схемы Здесь учтено, что И^-1, поэтому преобразование выполняется без умножений
^п(0)=/п(0)+/11(1)
130
На рис 7 15 изображена схема 8 точечного ДПФ полностью, в ней учтено известное свойство фазового множителя WN - , а также ради регулярности структуры показаны
2
и тривиальные умножения. Аналогичную структуру имеет и схема ЬПФ для большего числа точек (равного целой степени двойки).
Произведем оценку вычислительной эффективности алгоритма БПФ. Преобразование выполняется за log2 N шагов. На каждом шаге, очевидно, нужно выполнить сложений (или вычитаний) и умножений. Поэтому' время выполнения БПФ
= yiog2^^+rJ,
(7 29)
То есть Т’БПф пропорционально A4og2A , что существенно меньше оценки (7.25).
Лг Относительный выигрыш от применения БПФ Лщф /ТБПф пропорционален ------------- и
Iog2 N растет с увеличением N.
В завершение параграфа сделаем несколько замечаний
Во-первых, из схемы БПФ видно, что дискретный спектр получается из последовательности с перестановленными элементами. Перестановка (переупорядочение) данных - характерная особенность большинства алгоритмов БПФ При У = 2м закон
131
перестановки весьма прост: отсчеты входной последовательности должны быть расположены в двоично-инверсном порядке Такой порядок определяется следующим образом. Нужно записать аргументы (номера) отсчетов последовательности в двоичном коде, используя М двоичных разрядов Затем порядок следования разрядов инвертируется (заменяется на обратный) Получаемые после этого числа и будут является порядковыми номерами отсчетов после перестановки.
На рис. 7 16 показана схема двоично-инверсионного переупорядочения отсчетов для N=8, на нем же приведено двоичное представление номеров отсчетов до и после инверсии.
Рис. 7.16. Схема двоично-инверсионного переупорядочения отсчетов, используемая в ДПФ длины 8
Если требуется обрабатывать последовательность, представленную в естественном порядке, нужно граф двоичной инверсии присоединить слева к рассмотренной ранее схеме БПФ
Второе. При применении рассмотренного алгоритма не требуется дополнительной памяти ЭВМ кроме той, которая отведена под исходные данные (обрабатываемый массив). Результаты всех промежуточных шагов вычислений, а также сам дискретный спектр можно размещать в той же памяти, что и входную последовательность. Подобные алгоритмы БПФ, в которых для входной и выходной последовательности, а также для промежуточных данных используется одна и та же область памяти, называются алгоритмами БПФ с замещением,
И, наконец, третье. Мы рассмотрели алгоритм прямого ДПФ, заданного выражениями (7 9) и (7 24). Очевидно, все сказанное остается в силе и для обратного преобразования (7 5):
77 №=о
Обратное ДПФ вычисляется по тому же самому алгоритму БПФ, если в нем заменить на PF-1 , а в конце вычислений, разделить результат на N. То есть рассмотренный
алгоритм БПФ обеспечивает вычисление как прямого, так и обратного преобразований.
132
8. ВЕРОЯТНОСТНЫХ МОДЕЛИ ИЗОБРАЖЕНИЙ
8.1. Случайные процессы
В отличии от детерминированных процессов, течение которых определено одно значно, случайный процесс (сигнал) представляет изменения физической системы во времени и в пространстве, которые заранее в точности предсказать невозможно.
Понятие случайного процесса хорошо знакомо. Каждый раз, когда проводится эксперимент (опыт), итогом его является функция, определенная на интервале времени, а не какое-либо одно чисто. Математическая модель случайного процесса иллюстрирована на рис. 8.1.
«сход первого опита
Рис. 8.1. Ансамбль реализаций
Если f - функция одной переменной, то говорят о случайном процессе, если/- функция двух или большего числа переменных, то говорят о случайном поле.
Аргумент функции / может быть непрерывным и дискретным. В последнем случае используют термин "случайная последовательность" - одномерная (случайный процесс) или многомерная (случайное поле).
Для описания изображений широко используются математические модели случайных двумерных последовательностей. На рнс.8 2 показаны примеры синтезированных случайных полей, полученные при использовании различных моделей. На рис.8.3 приведены примеры
133
текстурных изображений, полученные в электронном микроскопе при исследовании кровяной плазмы. На рис. 8.4 приведены аэрофотоснимки различных участков поверхности земли. При всем внешнем различии этих изображений, они могут быть описаны моделями двухмерных случайных последовательностей. В этой общности - достоинства и недостатки
вероятностных моделей изображений
Рис.8.2. Синтезированные случайные поля
Рис.8,3, Изображения кристаллограмм кровяной плазмы
Рис.8.4. Снимки различных участков поверхности земли
Заметим следующее: каждая отдельная реализация случайного сигнала является функцией детерминированной. Поэтому для описания индивидуальных свойств реализаций случайного процесса следует использовать методы, изложенные в предыдущих разделах. Особенности случайного процесса проявляются при изучении свойств совокупности
134
реализаций или всего ансамбля. Поскольку этот ансамбль - вероятностный, то и
характеристики случайного процесса оказываются вероятностными.
Одномерная функция распределения вероятностей ^(п) = п}
связана с одномерной плотностью вероятностей
Соответственно, г • мерная плотность вероятностей
( \ агл(ч)
А, /,. ir I’ll, ’ll,-- М=-——------------= '
где.- t = (rbr2- ^r\ Л = (пьП2--Hr)
Плотность вероятностей удовлетворяет условию нормировки:
ао
J А (’1)^1 = 1
—СО
(8.1)
(8.2)
(8.3)
(8.4)
- в одномерном случае, а в г - мерном случае
(8.5)
Последовательности функций А (п), (ЛьП2 •••Пг)
представляют своеобразную лестницу, поднимаясь по которой, удается все более и более подробно характеризовать случайный процесс В прикладных задачах часто достаточно знать о случайном процессе меньше, чем дают функции распределения: можно ограничиться числовыми характеристиками случайного процесса
Среди числовых характеристик случайного процесса наиболее важными являются среднее значение цу (/), дисперсия и корреляционная функция Bf(t, т):
Ц/(') = £{/(')}, ®/0= M/G))2)> #/(',т) = ЕVW-m/OVW’H/WIJ-
Очевидно, значения корреляционной функции зависят не только от степени взаимосвязи, но и от абсолютных значений процесса Эта зависимость устраняется введением нормировки:
/ Ч Д/0Т) g/0t) I Л bl
Р/ >Т 1Р/ ’Ч
• эту величину называют коэффициентом корреляции между сечениями процесса и она показывает меру их линейной зависимости.
Для определения меры статистической зависимости между двумя случайными
135
процессами f и g рассматривают взаимную корреляционную функцию
вг? ('х) = Е [(/(')- м/(0)(х(х)- J
Если описание случайного процесса не выходит за рамки введенных статистических моментов, говорят, что оно выполнено в рамках корреляционной теории или на уровне статистики второго порядка
Случайный процесс /(г) называется стационарным в узком смысле (строго), если аналитическое выражение плотности вероятности не зависит от выбора точки начала отсчета времени. Из приведенного определения стационарного процесса следует, что одномерная плотность вероятностей не зависит от времени, а для числовых характеристик стационарного процесса справедливы следующие свойства:
среднее значение и дисперсия не зависят от времени:
и/ (0=т/- «*/(')==7; (8 6)
корреляционная функция зависит только от разности t = f - т
B/(f,r) = Bz(z'-z)=B/(»). (87)
Прн этом
|B/(/)|<B/(0)=a} , В/0 = В/(-г). (8.8)
Кроме того, обычно выполняется условие:
при (8.9)
Случайные процессы, удовлетворяющие условиям (8 6), (8.7) называют
стационарными в широком смысле (по А.Я Хинчину). Случайные процессы, стационарные в узком смысле (строго), будут, конечно, всегда стационарными в широком смысле, но ие наоборот
Вместо термина "стационарный процесс" в двумерном случае используется термин "однородное поле" и корреляционная функция зависит от двух аргументов
Стационарный случайный процесс называется эргодическим, если любая его вероятностная характеристика может быть получена из одной достаточно длинной его реализации путем усреднения во времени (или в пространстве) : среднее во времени равно среднему по ансамблю. На практике, как правило, мы не располагаем множеством реализаций случайного процесса, но имеем возможность наблюдать его в течении большого промежутка времени Т или на большем пространственном интервале. В этом случае выражения для математического ожидания и корреляционной функции выглядят следующим образом:
136
1 т
2 о
1 о
В двумерном случае:
1 Т}Т1
М/ “77* f J/(О.'2)Л1Л2 • т^- о о
(8.Ю)
(8.11)
й/(т1,г2)=
77- f f(/(n-^)-H/)(/Oi + "^1’^2 + т2 О О
(8.12)
Свойство эргодичности стационарных случайных процессов создает конструктивную
основу для экспериментального определения требуемых вероятностных характеристик
8.2. Случайные последовательности и их характеристики
Произвольная случайная последовательность f(n) может быть описана посредством указания тех или иных ее статистических характеристик. В дальнейшем ограничимся рассмотрением статистик второго порядка Для среднего и дисперсии выражения будут иметь вид:
!*/(«)= £{/(")}> (8 13)
Корреляционная функция последовательности f и взаимная корреляционная функция последовательностей f и g определяются следующим образом:
йДМ)МШ-Н/(Й)И)-М/(/))}. (8 14)
Bfg(k,l)= (8.15)
Коэффициент корреляции для случайных последовательностей задается:
Л Bf{k,l)
pf ' Vfifyft1)’
при этом во многих практических приложениях важную роль играет коэффициент корреляции между соседними отсчетами ру - Е{р^(п,п +1)]
Условия стационарности случайной последовательности аналогичны условиям для случайных процессов.
Bf(k,l)=Bf(k~l), (816)
Для корреляционных функций стационарных последовательностей справедливы
следующие свойства:
137
B/(O) = a}, 2?/W=B/(-4), В^(к) = B/g(-k) (8 17)
lim 2?<Д)=0, lim BfJk)=O (8 18)
A —>oo A —>oo
Везде далее мы ограничимся рассмотрением именно стационарных последовательностей
Используя свойство эргодичности применительно к случайной последовательности можно получить оценки ее числовых характеристик Действительно, пусть число элементов последовательности I < п < N, тогда дискретные аналоги выражений (8 10)-(8 12) запишутся следующим образом’
1 ;V
к=\
В двумерном случае (1 < щ , 1 < и2 < ):
-/^2 Ьы
/vl/v2 a1=u2=]
(8-19)
^/(«b«2)*777----у,,----г E Е^(ЛьА?2)-Ц/)(/("1+Мл2+Ъ)-Н/)
1 2 1 (8 20)
Для одномерной стационарной случайной последовательности /(я) корреляционная функция представляет собой одномерную детерминированную последовательность.
Введем преобразование Фурье последовательности Bf(m), которое называется спектральной плотностью мощности (энергетическим спектром) последовательности /(«):
Ф/Н=
п~~00
(821)
При этом отсчеты корреляционной функции могут быть вычислены через спектральную плотность Ф/(?/ю) через обратное преобразование Фурье:
By(»i)= jФ/(е,®)е'<йи<Л>. (8.22)
-к
Соответственно, в двумерном случае связь корреляционной функции и спектральной плотности мощности определяется уравнением:
оо Е
(8 23)
138
B/(nI,n2) =
-L f .
4л" Я-Я
(8 24)
Отметим некоторые свойства энергетических спектров’ энергетический спектр Фу-- вещественная функция частоты; энергетический спектр всегда неотрицателен: Фу 0;
энергетический и взаимный энергетический спектры обладают свойствами симметрии
Рассмотрим примеры.
Пример 1 Белый шум (последовательность независимых случайных величин). Его корреляционная функция имеет вид
5у(л)=сг2б(л).
Из (8.21) следует
то есть спектральная плотность белого шума постоянна на всех частотах (см. рис.8.5)
ji Фб?'*)
* 6*
Рис.8.5. Спектральная плотность мощности последовательности типа "белый шум"
В двумерном случае.’
5/(^1, П2)~ СТу-б(?7и?72 ), Фу^в/Ю1’е'°2 = Оу,
Пример 2 Последовательность с биэкспоненциальной корреляционной функцией
в/(и)=а}рМ
(8.25)
имеет энергетический спектр следующего вида (см. рис.8.6):
где р - коэффициент корреляции между соседними отсчетами последовательности В двумерном случае:
^/(”1."2) = ст/ •Pl’1 Рр! -
фДе'°1,г'ш2
I + р]2 - 2pr cos(ft)j ) 1 + р2 - 2р2 cos(c0| )
- Л < (Oj < Л, - л£со2^л -
139
Рис.8.6. Спектральная плотность мощности случайной последовательности с биэкспоненциальной корреляционной функцией
8.3. Преобразование случайных последовательностей в ЛПП-системах
Пусть известны характеристики входного сигнала - стационарной случайной последовательности f(n): среднее значение, автокорреляционная функция и энергетический спектр. Требуется получить соответствующие характеристики для последовательности g{n} на выходе устойчивой ЛПП-системы с импульсной характеристикой h(n), а также взаимные статистические характеристики входной и выходной последовательностей
Среднее значение для выходной последовательности с учетом стационарности сигналов и известной формулы свертки определяется следующим образом:
(8.26)
*=-«> А=^о
То есть средние значения стационарных последовательностей на входе и выходе ЛПП-системы связаны коэффициентом пропорциональности, равным сумме отсчетов импульсной характеристики системы.
Если ЛПП-система описана не импульсной характеристикой, а частотной я(егш) или передаточной функцией я(д), то для вычисления среднего значения выходной последовательности можно воспользоваться соотношениями:
И?=Ц/ЯЦ=1> (8.27)
которые вытекают из сравнения (8.26) с формулами (5.6) и (6.40), определяющими указанные характеристики системы.
В дальнейшем для сокращения изложения будем полагать ц?=цу=0. При невыполнении этого равенства всегда можно учесть математическое ожидание и его преобразование отдельно на основании формул (8 26) и (8.27).
Корреляционная функция выходной последовательности
140
Bg (л) = + «)-))
определяется следующим образом
В«И = i fhWl + k) Bf(n-k).
А'=-<Ю /=—ос
(8.28)
Выражение (8 28), записанное с использованием оператора свертки, выглядит следующим образом:
5^(л) = А(и)*Л(-л)* Лу-(и). (8.29)
Итак, корреляционная функция случайного сигнала на выходе ЛПП-системы равна свертке (двойной) трех последовательностей: импульсной характеристики системы, ее инвертированной копии и корреляционной функции входного сигнала.
Взаимная корреляционная функция входной и выходной последовательностей при цр = 0 получается следующей:
£^(>?) = .EV(n)_M/)(g(" + *)-M/)}= £ h(k)Bf(n-k) = h(n)*Bf(n) (8 30) k=-^>
То есть искомая характеристика вычисляется как свертка импульсной характеристики ЛПП-системы и автокорреляционной функции входного сигнала.
Энергетический спектр последовательности на выходе системы легко выводится из уже полученного соотношения (8.29). Действительно, с учетом свойств z-преобразования (см. п.6.2) имеем
Ф?(2)=Я(г)я(-')ф/(2), (831)
и далее, положив z = е1Ш, получаем собственно энергетический спектр:
Фг('м)= (8.32)
Заметим, что, если импульсная характеристика ЛПП-системы вещественна, то ее частотная характеристика обладает известной симметрией н выражение (8.32) может быть записано в более компактной форме
я(ето)2фД?ю). (8 33)
Получаем, что энергетический спектр последовательности на выходе ЛПП-системы с вещественной импульсной характеристикой равен энергетическому спектру входной последовательности, умноженному на квадрат модуля частотной характеристики системы
Взаимный энергетический спектр входной и выходной последовательности
вычисляется аналогично:
141
и далее при z - ef(J)
Ф^(г)=//(г)ф^),
Ф/г(е'“)=
(8 34)
(8 35)
он равен произведению частотной характеристики системы и энергетического спектра входной последовательности.
8.4. Факторизация энергетического спектра
В развитие полученных результатов рассмотрим один важный методический прием, который часто используется при синтезе алгоритмов цифровой обработки сигналов
Поставим следующую задачу: синтезировать физически реализуемую устойчивую ЛПП-систему, которая при поступлении на вход дискретного стационарного белого шума дает иа выходе сигнал с заданной корреляционной функцией . Такую систему иногда называют “формирующим фильтром” Для простоты изложения будем считать что входной белый шум имеет единичную дисперсию, то есть его корреляционная функция
By («) = §(??).
Нам известно выражение (8.31), связывающее энергетические спектры на входе и выходе ЛПП-системы В данном случае Фу(г)=1, а энергетический спектр выходного сигнала Og(z) - вычисляется по заданной последовательности Bg(n) При этом вытекающее из (8.31) соотношение
Ф?(г)=Я(г)я(_-~') (8 36)
можно рассматривать как уравнение относительно передаточной функции H(z) искомого формирующего фильтра. Процедура нахождения h(z) предполагает разложение Ф^(г) на пару “симметричных” (в смысле (8.36)) множителей. Осуществление такого разложения будем называть факторизацией энергетического спектра.
Решение задачи факторизации ие является единственным. Для того, чтобы оно имело практический смысл необходимо выполнить следующие два требования:
1. Найденная передаточная функция H(z) должна соответствовать физически реализуемой ЛПП-системе конечного порядка, то есть допускать представление в дробнорациональной форме, (в виде отношения полиномов по отрицательным степеням z)
2. Передаточная функция H(z) должна соответствовать устойчивой ЛПП-системе, то есть иметь полюсы, лежащие внутри единичной окружности в комплексной z-шюскости.
Если энергетический спектр Ф?(г) является дробно-рациональным, то среди решений задачи факторизации всегда найдется такое, которое удовлетворяет выдвинутым
142
требованиям. Рассмотрим детально процедуру построения этого решения
В силу четности автокорреляционной функции 2?g(n) ее "-преобразование -энергетический спектр обладает свойством симметрии;
фг(л=ф8(- -')
и, следовательно, если он является дробно-рациональным, может быть представлен в виде
= (837)
где
м
A(z}~ ’ <8 38)
J=-M N
B(z)= Xbjz~J <839)
полиномы из положительных и отрицательных степеней z с коэффициентами, удовлетворяющими условиям:
aj = a-j, bj=b_j .
Рассмотрим сначала полином (8.38), стоящий в знаменателе дробно-рационального энергетического спектра (8 37). Уравнение
л(-)=о
имеет 2М (то есть четное) число корней. Причем, благодаря симметрии коэффициентов, если комплексное число р - корень этого уравнения (полюс функции фДг)), то и \/р также является корнем (полюсом). Если |р|<1, то 1/р|> 1 , то есть половина корней будет лежать внутри единичной окружности комплексной z-плоскости, а другая половина - вне единичной окружности комплексной окружности На самой единичной окружности корней нет, так как наличие таковых противоречило бы условиям сходимости рассматриваемого дробнорационального z-преобразования при |z| = 1). Обозначим через р} (1 < j < М ) корни, лежащие внутри единичной окружности. Несложно показать, что при этом степенной полином (8.38) может быть представлен через свои кории в виде:
4Л=П (' - pf )П 0 - pf} • <8 4°)
7=1 7='
где 4) " некоторая постоянная Введем обозначение
__М/ \
Л+(г)=Т^П(1-/’7-' ) <841)
7=1
после которого выражение (8.40) записывается в форме
143
Дг)=Л+(г)^+(г--1), (8.42)
то есть требуемая факторизация полинома Л(г) произведена.
Аналогичным образом осуществляется и факторизация полинома (8 39) из числителя дробно-рационального энергетического спектра
B(z)=B+(.-)B+(z-’), (8-43)
где
М ( \
5+(-)=V^nv-^-'‘) <844)
2=1
-полином по отрицательным степеням z, Bq - некоторая постоянная, q} (1 < j < N) - корни B+(r).
Следует остановиться на особенностях выбора корней полинома (8.44) Во-первых, уравнение B(z)~0 может иметь решение, лежащее на единичной окружности комплексной Z-ллоскости, (это всего лишь означает, что для некоторых частот со энергетический спектр равен нулю. Во-вторых, к корням q} (1 < j<N) нет необходимости предъявлять требование < 1, поскольку, как мы увидим ниже, они будут определять положение нулей передаточной функции искомой ЛПП-системы, не влияющей на ее устойчивость. Основные условия формирования полинома (8 44) заключается в том, что из всех 2У корней указанного уравнения должно быть использовано по одному корню из каждой пары взаимообратных.
Полученные факторизованные представления (8.42) и (8 43) полиномов (8.38) и (8.39) позволяют произвести факторизацию и энергетического спектра (8.37) в целом:
(845)
Л (z)A |z ) где
дробно-рациональиая функция от z-1 , не имеющая полюсов вне единичной окружности в z-плоскости. Из сравнения (8.45) с (8 36) видно, что в качестве искомой передаточной функции физически реализуемого и устойчивого формирующего фильтра можно принять
Я(2) = ф+(2)2~£
при любом целом L > 0 . Для простоты везде далее будем полагать L - 0 , то есть брать н(2) = ф+(2) = £й. (8.47)
144
Пример Определим передаточную функцию и построим разностное уравнение физически-реализуемой и устойчивой ЛПП-системы, преобразующей белый шум с единичной дисперсией в стационарную случайную последовательность с автокорреляционной функцией
- ар1*"*"1' |р|<1,|д|<0 5 .
С помощью таблицы в п.6 1 и свойств z-преобразивания (п.6 2) вычисляем энергетический спектр выходной последовательности
Полином в знаменателе сразу записан в требуемой факторизованной форме: Л0х(1-р--')(1-р2) = Л+(Лл+(:-|); где
л+(г)=1-рг-' .
Произведем факторизацию полинома в числителе, для чего решим уравнение 5(г) = (1 -р2)(1 - az~l - az)=0 или
a z1 - z + а = О .
Корни этого уравнения.
*1,2 = -^-G±71-4«2 2а V
Легко проверить, что они являются взаимообратными. z, = —. В зависимости от выбора одного из -2
этих корней, используемого в качестве (ft в (8.44), имеем два варианта факторизации B(z) :
где значения множителя
найдены подстановкой (8.44) в (8 43), раскрытием скобок и приравниванием коэффициента при любом из имеющихся степеней z к соответствующему коэффициенту в первоначальном представлении B(z).
Итак, согласно (8 47), получаем две различные передаточные функции искомой ЛПП-системы:
по которым легко строятся два варианта описывающих систему разностных уравнений:
145
Процедуру факторизации, очевидно, можно использовать и для решения более общей задачи, чем та, которая была поставлена в начале данного параграфа, а именно для синтеза физически реализуемой устойчивой ЛПП-системы, преобразующей стационарную случайную последовательность с одной автокорреляционной функцией в
последовательность с другой автокорреляционной функцией В„(п). Действительно, непосредственно из (8 31) следует
дробно-рациональные энергетические спектры входного и выходного сигналов могуг быть факторизованы
ф/(-)=ф/(-)ф/^4)’
где
Лу(г), Bj-(z), “ полиномы, определяемые в процессе факторизации, и,
следовательно, в качестве передаточной функции ЛПП-системы можно принять.
ф*(.-) 4(.-)д;(г)
ф}(-) 4(.-)в;(г)'
(8.48)
Заметим, что здесь нужно более строго, чем раньше, подходить к выбору корней при факторизации числителя энергетического спектра входного сигнала - Ф j-(z), то есть при
конструировании полинома в соответствии с (8 48) корни этого полинома
оказываются полюсами передаточной функции и для того, чтобы система была устойчивой, они должны обязательно выбираться внутри единичной окружности z-плоскости. Задача не будет иметь решения (система не получится устойчивой), если у Bj(z) будут иметься корни, лежащие на единичной окружности, и эти корни не будут скомпенсированы соответствующими корнями B?(z). о
146
9. КРИТЕРИИ КАЧЕСТВА ИЗОБРАЖЕНИЙ
При обработке и анализе изображений всегда приходится задаваться вопросом об их качестве Качество столь сложного объекта как изображение является очень важным, но одновременно и довольно нечетким понятием. Оно оценивается разными способами и в связи с различными задачами.
С одной стороны качество рассматривается как характеристика самого изображения и определяется его собственными свойствами (статистическими, структурными, семантическими) Соответствующие критерии либо являются субъективными, либо опираются на объективные характеристики изображения, форму и параметры распределения яркости, ширину пространственного спектра и т.п. Такой безотносительный критерий имеет довольно ограниченное применение и почти нигде не используется.
При другом подходе качество рассматривается как мера близости двух изображений: реального и некоторого идеального, или исходного и преобразованного Такой подход более конструктивен, он позволяет оценивать количественные изменения значений яркости, уровень искажений изображений при их преобразованиях (фильтрации, сжатие данных и т.д.), то есть, по существу, качество самого средства преобразования - алгоритма или устройства (системы). Именно это очень важно при построении систем обработки изображении, оценке качества алгоритмов обработки изображений
Информационные критерии качества обычно строятся применительно к частным задачам анализа видеоинформации и, как следствие, весьма многообразны При этом иногда информационный показатель можно отнести и к первому, и ко второму типу (подходу), все зависит от точки зрения исследователя и от трактовки оцениваемых величин
Рассмотрим наиболее часто используемые показатели качества изображений. 1
9.L Субъективный критерий (критерий визуального восприятия)
Он базируется на результатах специально проводимой экспертизы. Обычная процедура оценки качества здесь заключается в предъявлении пары изображений (анализируемые и идеальные) экспертам-наблюдателям, которые высказывают суждения на уровне: ’’искажения незаметны”, "заметны но ие ухудшают", "ухудшают, но не мешают", ”немного мешают" и т.д. Индивидуальные оценки обрабатываются и усредняются. Существуют специальные приемы, исключающие "привыкание" экспертов в процессе экспериментов, их пристрастия к конкретным сюжетам и т д.
Проведение подобной экспертизы - всегда сложная задача, и ее результаты весьма приблизительны. Для специальных изображений (которые, например, получаются прн дистанционном зондировании) эксперты должны быть специалистами по решению
147
соответствующих прикладных задач анализа видеоинформации
Но главный недостаток субъективного критерия - отсутствие количественных оценок Он не позволяет решать задачи оптимизации систем обработки изображений в пространстве непрерывно изменяющихся параметров Здесь возможен только перебор вариантов и то не очень большой.
Желательно, чтобы критерий имел простую аналитическую форму и просто вычислялся ио предъявляемым изображениям Этому требованию удовлетворяет ряд критериев, рассматриваемых ниже
9.2, Среднеквадратичный критерий
Пусть изображения и описываются моделями стационарных
случайных полей. Мерой соответствия реального изображения идеальным может служить среднее значение квадрата их разности.
е2„
- эта величина будет постоянной по всему полю аргументов, поэтому аргументы (одинаковые для f g ) для краткости не указываем
Если математические ожидания f и g равны (что является типичной ситуацией), то
-> разность имеет нулевое среднее и получает смысл дисперсии разности (а само значение еК6 - среднеквадратичного отклонения g от/) двух изображений.
Для стационарной модели обычно считается выполненным условие эргодичности, при котором усреднение по ансамблю реализаций может быть заменено на усреднение по одной реализации. Тогда для непрерывных изображений, заданных при ' х, । < Zj, х21 < L2, имеем
1 ^2
£“Я>ТГ7'] >
а для дискретных, заданных при 0 < < N- -1, 0 < п2 < N2 ~ 1 :
n,n2^
Заметим что в задачах сравнительного анализа вариантов и оптимизации постоянный коэффициент ни на что не влияет и может быть отброшен.
Последние записанные выражения позволяют вычислять среднеквадратичную ошибку и для пары произвольных изображений, не обязательно описываемых стационарными полями. Так часто и делается. Однако в этом случае следует иметь в виду, что показатель
будет характеризовать "среднее” качество изображения в целом, а на различных его
148
фрагментах ошибки, в принципе, могут различаться.
Достоинство среднеквадратичного критерия - его простота При его использовании многие задачи анализа и оптимизации алгоритмов обработки изображений легко решаются аналитически Поэтому он очень часто применяется.
При обработке изображений следует учитывать, что данный критерий плохо согласуется с критерием субъективного восприятия.
9.3. Критерий максимальной ошибки (равномерного приближения)
В непрерывном случае
= max ,/(*i> *3 ) “ > *2 )|
и в дискретном
е^. = тах/(”1.«2)-Я(«|Л2)
(Л.'Ъ)
Это очень строгий критерий Он используется в тех случаях, когда выдвигается требование высокой точности представления не изображения в целом, а каждой его точки (отсчета). Это необходимо в ответственных случаях, при получении ценных, уникалыгых изображений.
Однако данный показатель имеет серьезный недостаток - сложность теоретической оценки и, соответственно, использования его в процедурах оптимизации (по крайней мере для общепринятых моделей изображения).
9.4. Вероятностно-зональный критерий
Этот критерий является модификацией (и обобщением) предыдущего. В случае использования критерия максимальной ошибки считается, что все значения разностного сигнала (текущей ошибки)
лежат в диапазоне то есть распределение вероятностей для 8 имеет,
например, показанный на рис.9.1:
Рис.9.1. Пример распределенг1Я вероятностей разностного сигнала
Однако на практике во многих случаях это не выполняется Простейшим примером
149
является ситуация, когда изображение искажено аддитивным гауссовским шумом
имеющим плотность распределения шума, которое нигде не обращается в ноль (см. рис 9 2)
Рис.9.2. Плотность распределения гауссовского шума
Тогда и €-f-g--v- имеет такое же распределение. Если здесь и можно оценить максимальную ошибку то только с некоторой доверительной вероятностью р. Вероятностно-зональный критерий как раз и определяется парой чисел (е^ ,р).
Смысл этого критерия выражается формулой
и иллюстрируется на рис.9.3.
Рис.93. Иллюстрация вероятностно-зонального критерия
Здесь, как и в предыдущем случае, часто возникают сложности при теоретической оценке. Значение такого показателя качества получают экспериментально, в результате анализа гистограммы распределения ошибки е .
150
10. ПОГРЕШНОСТИ ДИСКРЕТНОГО ПРЕДСТАВЛЕНИЯ ИЗОБРАЖЕНИЙ
10.1. Соответствие между непрерывными и цифровыми изображениями
Реальное "физическое” изображение является функцией непрерывных пространственных координат - /Сч,^) В компьютере обрабатывается его дискретный аналог, матрица Цифровое изображение Оно лишь приближенно соответствует
непрерывному. Несоответствие обусловлено погрешностями, которые вносятся в данные в процессе преобразования в цифровую форму.
Все результаты цифровой обработки относятся именно к цифровому изображению Понятно, что такая обработка имеет смысл лишь в том случае, если цифровые изображения достаточно точно описывают первичные, то есть погрешность цифрового представления мала. Надо уметь оценивать эту погрешность.
Такая оценка важна еще и потому, что позволяет определить потенциальные возможности процедур цифровой обработки (фильтрации, кодирования и т.п.) с точки зрения точности
Определим погрешность двух основных процедур преобразования изображений в цифровую форму - дискретизации (по пространственным координатам) и квантования (по уровню - яркости). При решении этих задач примем описание изображения моделью стационарного случайного поля Начнем с квантования
10.2. Квантование параметра по уровню
Пусть преобразуемая величина (параметр) f может принимать любые значения из диапазона который называется шкалой параметра (рис 10.1).
Рис. 10.1. Шкала параметра
При представлении параметра в цифровой форме в пределах шкалы фиксируется (назначается) Q квантовых уровней: Текущее (фактическое) значение
параметра отождествляется с одним из квантовых уровней и далее в системе вместо значения
151
параметра используется просто номер выбранного уровня. Для представления этого номера обычно используется двоичный код. Если используется b - разрядный код, то имеется возможность пронумеровать Q = 2Ь квантованных уровней.
Расположение квантованных уровней на шкале параметров может быть различным На практике интервалы между квантованными уровнями обычно берутся одинаковыми (исключение составляют некоторые специальные случаи, о которых пока не будем говорить) При этом шаг квантования по уровню'. &у = fq-fq_\ для любых есть
величина постоянная.
Равномерное расположение Q уровней на шкале параметра показано па рис 10.2. Здесь, очевидно, шаг квантования
J max J пип _ Утах упип
В данном случае текущее значение параметра отождествляется с ближайшим квантованным уровнем. Будем рассматривать именно такой вариант квантования.
Рис 10.2. Равномерное расположение уровней квантования на шкале параметра
Для каждого конкретного значения параметр f выбирается свой квантовый уровень -fq, при этом ошибка цифрового представления параметра (ошибка квантования по уровню)
Поскольку f - случайная величина, то и Еу тоже случайна. Но можно определить максимальное и среднеквадратичное значения ошибки.
Максимальная ошибка квантования по уровню (для нашего варианта квантования)
152
£/max
= max
Обычно шаг квантования Ду значительно меньше шкалы параметра (то есть b > 1, Q »1,
Ду «/тах - ). При этом случайная ошибка еу имеет практически равномерное
распределение в диапазоне
Д/ А/ 2 ’ 2
(см рис. 1.3 )
Рис. 13. Распределение ошибки
Дисперсия ошибки.
7
7 Г 7 ду
Е7« = J е7р(Е/)Лг=-4-.
2
Или среднеквадратическое отклонение (корень из дисперсии):
А/ £/ max £/кв-27з’"7з“
Учтем далее следующее. Если параметр / имеет нормальное (или близкое к нормальному) распределение с дисперсией оу и математическим ожиданием Цу, то обычно стремятся выбрать шкалу так, чтобы она совпадала с “доверительным интервалом” [цу - За у, ру + Зсту ] (все значения/лежат в этом интервале с вероятностью « 0,997 ). Тогда
max ^min
= 6с/. Ay
2*
и получаем:
Зет f cj-
zf max ~ 3JT> zf xe ~
Пример 1 Пусть b = 8 (очень популярный сличай - байт на отсчет). Тогда относительная максимальная погрешность квантования (по отношению к среднеквадратичному уклонению параметра):
«0,012, то есть 1,2%.
<у7 2Ь 256
Относительная среднеквадратичная ошибка - в л/з раз меньше:
153
« 0,007, то есть 0,7%
оу 2Ь 256
Отношение сигнал/шум квантования по мощности
7 ° 7 22i 716
J2 = -—£_ =---= — * 20000 ’!!,
с2 3 3
Б/ кв
то есть погрешностью квантования здесь, видимо, можно пренебречь.
10.3. Дискретизация и восстановление непрерывных изображении
Перейдем к анализу второй процедуры преобразования изображения в цифровую форму - дискретизации по пространственным координатам.
Для рассматриваемого нами случая равномерной дискретизации по узлам прямоугольной сетки (прямоугольного растра)’
/(H|,«2) = /(xbx2)|x:=niAi .
Вообще говоря, это идеализированный случай. В реальных системах ввода изображений всегда берется не только точно отсчет (значение в точке) непрерывной функции, а ее среднее (взвешенное) значение по некоторой области - апертуре. Но мы таким усреднением пренебрегаем.
С какой погрешностью непрерывное изображение описывается своими дискретными отчетами? Чтобы ответить на такой вопрос нужно восстановить непрерывную функцию по отсчетам и сравнить ее с той, которая была до дискретизации.
Существуют ситуации, когда погрешность такого восстановления равна нулю. Известна на этот счет теорема Котельникова. К сожалению, реальные сигналы и изображения обычно не удовлетворяют требованиям ограниченного спектра, поэтому процедура восстановления при помощи идеального ФНЧ дает лишь приближенный результат. В связи с этим обычно используют простые в реализации способы восстановления, которые являются приближенными при любых характеристиках сигнала, то есть всегда восстанавливают не функцию /(xj, х2 ), а некоторую другую - /(хь х2 ) •
Чаще всего используется восстановление при помощи полиномиальной интерполяции, при которой f и f совпадают в узлах интерполяции (отсчетах) и различаются при всех других значениях непрерывных аргументов.
Рассмотрим некоторые интерполирующие функции, которые используют иа практике (или хотя бы имеют в виду при оценке погрешности дискретного представления изображений).
154
1) Прямоугольная (ступенчатая) несимметричная интерполяция.
- /<«1дьл2Д2) А™ л1д1 - *1 ~(wl + 1)Л1 И «2&2 - *2 ~(п2 +ОД2
Иллюстрация приведена иа рис 1.4. Это самый простой способ восстановления. Как мы увидим, он оказывается и самым плохим сточки зрения погрешности восстановления
2) Прямоугольная (ступенчатая) симметрическая интерполяция.
/(Xi,X2) = /(wlAb«2A2)
для
Дт . . Лп
«|Aj—-!-<Х|<Л|Д|+^
И
Д? . До
И2Д2----~ ~ *1 < п2^2 + •
Иллюстрация приведена на рис. 10 5а
Рис 10.4. Иллюстраг^ия ступенчатой интерполяции
Рис 10.5. Иллюстрация восстановления для двух способов интерполяции
Этот способ восстановления почти столь же прост, как и предыдущий, но является более точным. Нетрудно показать, что для полей с изотропными статистическими характеристиками погрешность восстановления при шагах Д],Д2 здесь равна погрешности
несимметричной ступенчатой интерполяции при половинный шагах (то есть при
Д| Л 2 Т’Т
Действительно, рассмотрим две картинки, иллюстрирующие восстановление на рис. 10.5 -для стационарных изотропных полей эти два случая статистически эквивалентны
155
Но несмотря на указанное преимущество и данная интерполяция является довольно грубой Здесь (как, впрочем, и в предыдущем случае) функция яркости восстановленного непрерывного изображения получается ступенчатой. Имеющиеся на ней скачки иногда мешают обработке
3) Билинейная интерполяция
Здесь строится поверхность, проходящая через четыре соседних отсчета Интерполирующая функция
/(х|,*2) - + ^х\ + 6jc2 +D
является линейной по каждой координате. Коэффициенты А.В.С,!) выбираются из условия прохождения интерполирующей функции через отсчеты. Определим их для случая, когда интерполяция производится на прямоугольнике, как представлено на рис. 10 6:
0 < Т| < Л|, 0 < *2 - ^2 -
Это эквивалентно выбору "локальной’' системы координат для каждой четверки отсчетов, образующей подобный прямоугольник.
Рис, 1.6. Билинейная интерполяция
Имеем систему:
7(0,0) = D
/(Д|,0) = ВД1+£>
'/(0,Д2) = СД2 + О
j\ Д], Л2 ) = /1 А[ А2 ^А| + СД2 + ‘Б)
Решаем эту систему
/>=/(о,о). Д=/(*МУ!> с =
Д| д2
А=-А- [(/(А| > ) - /(0,0)) - (/(Д1,0) - /(0,0)) - 7(0, Д2 )— л 0,0))]=
А] Л2
_ЛА1,Д2)-ЛА|,0)-Л0,Л2) + /(0,0)
А । Аэ
То есть для 0< Х| < Aj; 0< х2 < Д2
156
? /(Д1,Д2)-/(Д1,0)-/(0,Д2)-ь/(0,0) ЛДьО)-ЖО)
J (Л1 ,х2 ) -------------------------Х1 х2 +-~'Г-----* 1 +
q /2 Д1
±/(О,д2)-ЖО)Х2+ЖО) д2
или (так удобнее для работы)
j U1, *2)=/<Д|. д2) т г + ЛД1.0) I - ^-1+ Ж д, )[1 - Л-W+до,о/1 - дТ i -S-]
Д|Д? Д| Д2 у \ ^1/^2 \ А| А Д'1)
Существуют и другие более сложные интерполирующие функции, но они не всегда дают выигрыш в точности. Показано, например, что для экспоненциально спадающих автокорреляционных функций поля билинейная интерполяция близка к оптимальной. Поэтому ее используют наиболее часто Там, где налагаются жесткие ограничения на сложность, обычно берегся прямоугольная интерполяция
Следует сказать, что введенные нами интерполирующие функции важны для нас ие только с точки зрения оценки погрешности восстановления непрерывного изображения по отсчетам. Они широко применяются при геометрических преобразованиях цифрового изображения.
10.4. Оценка среднеквадратичной погрешности дискретизации
Погрешность дискретизации изображения (она же - погрешность непрерывного поля по отсчетам) зависит от следующих факторов:
g величины шагов дискретизации Д^, Д2 ;
g статистических свойств изображения;
q вида интерполирующей функции.
Оценим указанную погрешность, используя среднеквадратичный критерий
Напомним, что изображение - стационарное поле Пусть на каждом двумерном интервале между отсчетами интерполяция производится одинаковым способом. Тогда все интервалы со статической точки зрения эквивалентны, и при анализе достаточно рассмотреть один из них Возьмем интервал {0 < jq < Д]; 0 < х2 < Л2}
Если /(х|,х2)- исходное изображение, а /(xj,x2)- восстановленное, то в каждой точке изображения имеем ошибку:
8I(X|,X,) = /(jT| ,х2)-/(х|,х2)- это случайная величина.
(индекс х - так как дискретизация пространственная)
Дисперсия ошибки в каждой точке:
157
Нас интересует среднеквадратическая погрешность по всему полю. Она определяется через усредненную дисперсию Так как поле стационарно, усреднение достаточно выполнить по одному интервалу:
1 > f f 2/ ч f j
= TV J J A'A2 0 0
- квадрат среднеквадратичной погрешности
Это все в общем виде Проведем теперь указанные преобразования для конкретного случая Далее будем считать выполненными следующие два упрощающих условия
Q Шаги дискретизации по пространственным координатам равны Л] = Д2 = Д
q АКФ поля обладает следующими свойствами симметрии:
Bf(xhx2)= Bf(±x},±x2), Bf(x{,x2) = Bf(x2,xi)
при любых сочетаниях знаков
Такая симметрия выполняется либо для изотропного поля, либо для поля изотропного в перпендикулярных направлениях с линиями равных значений АКФ, имеющими вид показанный на рис10.7, то есть без "перекосов” и с четырьмя осями симметрии (по осям *2>х! и по диагоналям)
Рис. 10.7. Линии равных уровней для АКФ специального вида
Возьмем простейшую интерполирующую функцию - прямоугольную несимметричную
Для иее на интервале 0<(х|,х2) < Д:
/Сч^2)=Ж0).
То есть
Ъх (*1 > х1) = /(ХЬ х2 ) “ /ОТ
ст;(х1,х2) = £|У(х1,Х2)-/(0,0))2}=£Ь-(х1,хг)2)-2£{/(х1,х2)/(0,0)}+£{/-2(0,0))=
= ст2 +ц2 -ifffy (Х],х2) + ц2 ]+а} + ц2 = 2^7 - £/(хьх2)]
158
Для дальнейших преобразований удобно ввести обозначение:
5/(хьх2) =
где Rj-(x^x2) - нормированная АКФ (fy(0,0) -I). Тогда
сГе(а'1>^2) = 2<у}[1 " ^/(^1 Л?)1 •
Среднеквадратичная погрешность
2а> Г 1 ЛЛ
ел-А-е f/П “ =^а/ 1-----Г Jf ^/(xl,X2)dxidx2 .
Л” 0 0 L Л" 0 0
Полученное выражение связывает среднеквадратичную погрешность с величиной шага э
дискретизации Ли характеристиками поля (oy,Rf(x^X2)'). Но оно не всегда удобно для практического использования. Можно упростить вычисления, приняв во внимание следующее Нормированную АКФ при Х|,х2>0 можно разложить в степенной ряд (Маклореиа) (он всегда оказывается сходящимся):
Л/(х1,Х2) = EEaVxl’x27.
i=0j=0
здесь ау - коэффициенты разложения. Нам будет удобнее использовать этот ряд в следующем виде (с учетом того, что aQQ = 1):
00 ао 00 00
Л/(х|,л-2) = 1 + ^а,0Х1' + +
>1 /=1У=1
Подставляем этот ряд в выражение для погрешности. И для рассматриваемой прямоугольной
интерполяции получаем:
2 __ -> 2
ех кв “ f'
дд‘
00
00
= 2а}- 1-1-1Л0-Ау-2>0;
Учтем принятую симметрию АКФ: а, = aJt (и в частности = <з0/) и окончательно
получим:
2
£.v кв ~
00
аУ
Практический интерес представляют случаи, когда погрешность
0.
г~хке мала по
Л 00
159
сравнению с дисперсией Это соответствует ситуации, когда шаг Д мал, и ряд сходится очень быстро Поэтому при оценке погрешности в полученном выражении можно ограничиться только первым ненулевым членом, отбросив сложения высших порядков малости.
Пример 2 П}сть изображение имеет биэкспоненциальную АКФ Для принятого ’’симметричного” её
варианта
-aCpql+fo!)
Известно разложение экспоненты в ряд
2 3 4
-X , XXX
е - 1 - л 4---4 —
2 6 24
Следовательно, при Хр *2 - 0 (чтобы снять знак модуля)’
2
2
1 2 1 2 2 1 2 2
— + = 1 -cucj -ол2 + а + + ~а xz + •••
То есть
2
2 a
a01 “ aI0 “ ’ al 1 ~ a ’ ^02 _ °20 “
и т д.
Среднеквадратичная погрешность дискретизации:
2 -
Кв ~ f
Д а2 Д2
2 -а—+----—
2 2 3
2^_
2-2
-> 2 А
2a zaA.
Можно выразить эту погрешность через корреляционные свойства дискретизированного поля, а именно, через коэффициент корреляции между соседними отсчетами (в строке или столбце матрицы отсчетов). Этот коэффициент:
р = Л/(х„х2)|1|=(у^д=е-“д«1-сс
то есть аД « 1 - р, и выражение для погрешности получит вид:
е2и »2a2(l-p).
Произведем численный расчет. Обычно 0,8 £ р < 0,95. Возьмем р - 0.9. Тогда
“2a2 (1-0.9) = 0.2a2
Соотношение сигнал/шум дискретизации по мощности:
2 2°/ 1
d2 =—2- = — = 5.
е2 02
ьх кв
Относительная погрешность
' 0,45.
Qf д/5
Это 45% от среднеквадратичного отклонения - катастрофически большая погрешность! Конечно, мы пока взяли самую простую (и самую плохую) интерполяцию. Для других, видимо, будет лучше, но намного ли?
160
Мы не будем повторять полностью выкладки для других интерполирующих и автокорреляционных функций, а сразу дадим сводку результатов По-прежнему считаем шаги равными, а АКФ симметричной.
Для прямоугольной симметричной интерполяции:
Се(х|,х2) = 2а}[1-Л/(х|,х2)] для |х||<у, |х2|<^.
Д А
2
£х кв
00
°° ду
Д
=-2ст/ 2ло
Для билинейной интерполяции:
/=17=1
4/?у(Л,Д)
*1*2 'УР (к y х \ *1 (1 *2 1
-2^(Д - х1?Д ~х2)
при 0 < < Д, 0 <, Х2 S Д.
^хке
11^4 1 R Д Д
= a} U + -Лу(Д.О) +-Rf( Д, Л) - *2)0 - у) dx\dX2
Составим таблицу оценок среднеквадратичных погрешностей для разных интерполирующих е2 j
н автокорреляционных функций (табл. 1). В таблицу сведем средние значения .
<ту d2
Как видно из таблицы, самой точной интерполяцией из рассмотренных является билинейная. Выигрыш от ее применения особенно значителен для "гладких" изображений, имеющих гауссовскую АКФ. Погрешность дискретизации для биэкспоненциальиой и экспоненциальной изотропной АКФ примерно равны Для них билинейная интерполяция всего в 3 раза (по мощности) точнее простейшей прямоугольной несимметричной
интерполяции.
161
Таблица 1
АКФ Интерполяция
Прямоугольная несимметричная Прямоугольная симметричная Билинейная
Биэкспоненциальная ~ 2аЛ * 2(1 - р) ^оД~(1~р) х — аД к -(1 - р) 3 зv
Экспоненциальная неразделимая (изотропная) R/(xl,x2) = e-a^'+xl-Я/(ль»2) = р'’1+"2
Гауссовская изотропия: fi/(xl,x2) = e-u(x'2+x2) 2 2 Л/(''Ь«2) = Р',,+ 2 1 ®*«2Л2 «|(1-р) UaW^d-p) j 3 23 4 4 23/ к2 х — а Д4 (1-рГ 90 90
Пример 3. Для экспоненциальной АКФ, р = 0,9 и билинейной интерполяции:
g2
с.гкв
То есть -----0.26, что также достаточно много.
10.5. Оценка максимальной погрешности дискретизации
Теперь рассмотрим, как можно оценить погрешность дискретизации по критерию максимальной ошибки.
На двумерном интервале интерполяции текущая ошибка
Ех (Х1. *2 ) = /(ХЬ х2 ) " 7(*1 > х2) 'i
есть случайная величина с дисперсией ^(jq.x?) В некоторой точке двумерного интервала
(обозначим её координаты (ximax, Х2тах)) эта дисперсия принимает наибольшее значение:
CTLx=^(x1e,ax>x2m<u) = ^ , Ре(х1<х2)}
0<Х[<Т. 0<х2<Г (по-прежнему рассматриваем один интервал у начала координат).
162
Обычно точка t Х2тах)является наиболее удаленной от узлов интерполяции. Так,
max'
для прямоугольной интерполяции ( смотри рис. 10.8а)
Х1тах “^1’ Х2тах ~ ^2
Для прямоугольной симметричной и билинейной (рис. 10.86)
_ А] _ А2
Х\тах ~ 2 ’ — 2
Поскольку мы не знаем границ измерений текущей ошибки (известна лишь ее
дисперсия), можно говорить о максимальной ошибке лишь с некоторой доверительной вероятностью Самой широкий "размах4’ ошибки наблюдается в точке с максимальной
дисперсией. Эту точку и рассмотрим.
х.
о) б)
Рис. 10.8. Иллюстрация погрешности дискретизации
Зададимся доверительной вероятностью р того, что значения £х(х1>х2) в точке с
максимальной дисперсией лежат в интервале [-ех . Из теории вероятности
известно неравенство Чебышева, которое для нашего случая (в наших обозначениях)
запишется в виде:
1 Р< 2
Ч max
Отсюда получаем
max
В частности, при р = 0,99
£х max < 1Q у^тах •
Неравенство Чебышева справедливо для любой функции распределения случайной величины. Если распределение ех- нормальное (а это будет, если и поле f распределено нормально ), то можно воспользоваться более строгим соотношением
163
- интеграл вероятностей
Р = Л|6х(^1иии^2та1)|
Из последнего соотношения следует
известное "правило трех сигм":
__ о '
Ех max “ \^тах
при р « 0,997, или, что для нас удобнее,
2 max
~ 9 max
Используя последнюю формулу, определим выражения для максимальной ошибки при разных видах интерполяции. Как и при оценке среднеквадратичной ошибки, ограничимся случаем, когда А1 = А? = А и автокорреляционная функция обладает указанными в предыдущем параграфе свойствами симметрии.
Опять рассмотрим простейшую прямоугольную несимметричную интерполяцию. Для нее мы записывали:
(*1 ’ х2 ) = 2с/ [’ - Rf U1 • *2)].
и, как мы отмечали, Х[тах = ^^2тах = Тогда
®тах “ =Д — 2<Ту|1 Лу-(Д,А
|х2=Д
или
^хтах ~ 1 (Л> А)]-
Используя представление автокорреляционной функции в виде степенного ряда
оо оо со сю
Я(*1 э*2) =1 + 2ло V + 2^0/ *2J + X ХА *14 »
/=1 j=l i=l>l
получаем:
e2
max
И, уже учитывая симметрию АКФ, = aOj ):
е2 max
164
Как и раньше, здесь можно оставить только сла1аемое первого порядка малости и получить при этом приближенную оценку погрешности Пример этому будет дан немного позже. А пока - аналогичные соотношения для других интерполирующих функций (без вывода).
Для ступенчатой симметричной интерполяции (прямоугольной):
Д
’ Х2>пах
А
2 ’
7 °0 А1 -18оу- +
Для билинейной интерполяции:
_ А. = А Хйпах ~ 2 ’ Х^тах
E,v max
ОС У А со DO
7=1 i=l у=1
2|+7~3~1 2,+>-*
Сформируем табл.2, как в предыдущем параграфе, в которой укажем приближенные оценки
для
£х max
Таблица!
АКФ Интерполяция
Прямоугольная несимметричная Прямоугольная симметричная Билинейная
Биэкспоненциальная, экспоненциальная изотропная ~36аД «Зб(1 -р) к!8аД »18(1-р) ® 9а Д « 9(1 -р)
Гауссовская изотропная «36а2Д2 « 36 (1- р) ®9а2Л2 «9(1-р) 94.4 9 (. \2 «—а Д «-(1-р)" 2 2V
Пример 4 Для экспоненциальной АКФ при р = 0 9 и билинейной интерполяции:
е2
max
—^—«0,9 ИЛИ Ъхтах
Для получения высокой точности описания непрерывного поля отсчетами нужно брать
шаги дискретизации очень малыми, чтобы коэффициент корреляции между отсчетами р->1.
165
Работая с цифровым изображением, всегда можно по нему оценить коэффициент корреляции р, а затем вычислить, с какой погрешностью оно описывает непрерывное изображение
10.6. Общая погрешность цифрового представления изображений
Мы отдельно рассмотрели погрешность квантования отсчетов по уровню и погрешность дискретизации изображения по пространственным координатам. Обе они входят как составляющие в общую погрешность цифрового представления изображений.
Если изображение проквантовано по уровню, то его восстановление (интерполяция) производится не по истинным значениям отсчетов поля яркости, а по искаженным на случайную величину еу
Возьмем ступенчатую (прямоугольную) интерполяцию (несимметричную или симметричную) и попробуем оценить среднеквадратичную погрешность интерполяции (теперь это будет полная погрешность, так как в ней учтем и квантование по уровню).
Дисперсия ошибки в каждой точке интервала интерполяции (добавим в обозначение крышку, чтобы отделить от прежней дисперсии):
Cs(*l>*2) = £1/(*1’Х2)- (/(0.°)+ Е/)Р)=
= ,х,)- /(О,О))2}- 2£-{/-(х|, х, )е f}+ 2A’{/(0,0)e J+ Е^у }.
Если квантованных уровней много - шаг квантования намного меньше шкалы параметра, то можно считать, что ошибки квантования Еу и само изображение статически независимы. Тогда в полученном выражении останутся только первое и последнее слагаемые, которые с учетом приведенных ранее выкладок запишутся более компактно:
После усреднения по интервалу интерполяции получим:
2 2 2
— Е~ + В г ке хкв /кв
То есть полная среднеквадратичная ошибка определяется суммированием квадратов составляющих ошибок. Как определить каждую составляющую, мы уже знаем.
Такую же формулу можно использовать (и обычно используют) и для билинейной интерполяции, правда здесь она уже будет приближенной и даст для среднеквадратичной погрешности оценку сверху. (Более детальный анализ, который мы опускаем, в этом случае показывает, что:
? 4 э 2
4--Е Г + Е г ,
ХКВ 9 /КВ ХКВ /КВ
166
причем при е
/о
0 значение полной noi-решности смещается к нижней границе )
При оценке максимальной погрешности обычно ориентируются на самый "неблагоприятный", то есть считают, что ошибки суммируются:
Ewax max max >
эта формула справедлива для всех способов интерполяции, которые мы рассматривали
Отметим, наконец, следующее Мы рассмотрели "первичную" погрешность цифрового представления изображения, которая возникает при квантовании и дискретизации В процессе формирования и преобразований изображение подвергается действию еще многих искажающих факторов ( шумов, линейных искажений и т.п. ). Это действие может быть выражено введением дополнительной погрешности - zUCK кв, ^исктах
Кроме того дополнительную погрешность в данные вносят некоторые процедуры обработки изображений (в первую очередь - процедуры сжатия данных, то есть кодирования с возможностью последующего приближенного декодирования). Обозначим соответствующие погрешности - Ео6р кв, го6р тах
Если считать, что все искажающие факторы независимы, то
2 2 2 2 2 _
Еке = + + + Zo6pKB ’ £тах ~ тах + Е/ п1ах + £“ск тах + Z°6P тах ’
(на самом деле зависимость может иметься, поэтому эти оценки погрешностей приближенны).
На основании сказанного можно сделать следующие выводы:
1. Нецелесообразно предъявлять к цифровому изображению (отсчетам матрицы) требования по точности, превышающие точность "первичного" цифрового представления (обусловленную в первую очередь пространственной дискретизацией).
2. Нет смысла бороться с малыми искажениями (шумами).
3. Нет смысла требовать высокой точности восстановления отсчетов от процедур сжатия данных и т.п.
В любом случае требования к точности цифровой обработки должны быть согласованы с той точностью, с которой цифровое изображение (матрица отсчетов) описывает непрерывное.
167
11. ПРЕОБРАЗОВАНИЯ ЯРКОСТИ ИЗОБРАЖЕНИЙ
Рассмотрим довольно широкий класс операций, осуществляемых над отсчетами цифрового изображения (в пространственной области) или над его спектром (в частотной области), которые условно можно разделить на две основные группы
1 Повышение качества, то есть повышение контраста, чёткости, выравнивание яркости по полю и т.д. Важно отметить, что речь здесь идёт о качестве как о характеристике самого изображения (а не о мере близости к некоторому "эталону"), то есть цель обработки - не устранение искажений, а получение в каком-то смысле "удобного для наблюдения1’, "хорошего" изображения
2 . Препарирование, то есть специальная обработка изображения с целью выделения (подчёркивания) на нём некоторых существенных деталей или особенностей и, соответственно, подавления несущественных В этом случае мы получаем изображение, возможно очень сильно отличающееся от исходного (естественного), но более удобное для последующего анализа или визуальной интерпретации
Чётких границ между двумя этими задачами нет, во многих случаях одновременно преследуются обе цели. Рассмотрим основные задачи, решаемые с помощью поэлементных преобразований
ILL Коррекция амплитудных характеристик
Коррекция амплитудных характеристик выполняется для устройств ввода-вывода изображений. Реальные устройства ввода изображений в компьютер (видеодатчики) обычно имеют нелинейную характеристику передачи уровней яркости. Если £ - измеряемый физический параметр на входе видеодатчика, то на его выходе (то есть в компьютере) получим значение
f=и&),
где U - нелинейная функция преобразования (амплитудная характеристика) видеодатчика (рис Л1.1 а).
Нужно скомпенсировать нелинейные искажения при вводе, то есть найти и использовать при обработке такую функцию поэлементного преобразования U (/), чтобы
Это достигается, если функция U(/) является обратной по отношению к амплитудной характеристике (рис. 1110:
168
Такой операции поэлементного преобразования предшествует процедура калибровки, то есть экспериментального определения амплитудной характеристики при помощи детерминированных изображений известной яркости (испытательных таблиц, "оптического клина" и т.д). По данным калибровки строится либо аналитическая зависимость U(g) (и далее U 1(/)), либо непосредственно соответствующая таблица преобразования
Рис. ПЛ. Пример функции преобразование яркости видеодатчиком и обратная функция
Аналогичная задача возникает и при выводе изображений. Только здесь производится не компенсация уже внесённой нелинейности, а предыскажение отсчётов перед их выводом, чтобы точно воспроизвести требуемую функцию яркости на твёрдом носителе (фотоплёнке, бумаге), на экране дисплея, а точнее - в глазу. Функция предыскажения должна быть обратной по отношению ко всему комплексу факторов, обуславливающих нелинейность вывода: нелинейной амплитудной характеристике устройства, нелинейности фотографической (или какой-либо другой) записи поля яркости, нелинейной характеристике зрительной системы человека и т.д.
Здесь также проводятся предварительные эксперименты по определению "сквозной” амплитудной характеристики системы вывода. При этом используются изображения с известными значениями яркости, синтезированные на компьютере.
11.2 . Линейное повышение контраста
Изображения, вводимые в компьютер, часто оказываются малоконтрастными, то есть у них изменения функции яркости малы по сравнению с её средним значением (рис. 11.2а). При этом яркость меняется не от чёрного до белого, а от серого до чуть более светлого серого То есть реальный динамический диапазон яркости оказывается намного меньше допустимого (шкалы яркости) Задача повышения контраста заключается в "растягивании" реального динамического диапазона на всю шкалу (рис, 11 26).
169
Рис. 11.2, Линейное повышение контраста изображения
Эту задачу можно решить при помощи поэлементного преобразования - линейного
контраст ирован ия.
g = af + Ь,
g(n]jn2) = af(n{,n2)+b,
где ау Ь - постоянные Параметры этого преобразования можно определить двумя простыми способами.
Первый способ заключается в том, что диапазон [fm/n>fmax] преобразуется в диапазон
То есть имеет место система:
S min & fmin +
Smax ~ а fmax +
Откуда получается:
а — Smax ~ Smin . _ ffmin /max ~~omax /пип
fmax ~~ fmin /max ~ /nun
Очевидно, здесь нужно предварительно оценить fmin, fmax
Второй способ заключается в том, что берутся такие а и Ь, которые приводят математическое ожидание и дисперсию поля яркости к некоторым "стандартным" величинам. Здесь предварительно оцениваются математическое ожидание и дисперсия входного поля - цу,Оу, и коэффициенты а, b выбираются так, чтобы для выходного поля
9
получить "стандартные" pg,oj :
Д«1, п2)=---------~'ag+^g = ——,
Оу й Оу Оу
то есть , a g
а = ^~; b = ]Ag-\xf^-.
170
11.3 . Преобразование гистограмм
Ещё одна процедура повышения контраста заключается в приведении плотности распределения яркости к некоторому "стандартному” виду. Она реализуется при помощи нелинейного поэлементного преобразования, которое строится по экспериментально полученной гистограмме исходного распределения яркости (поэтому эта процедура и называется преобразованием гистограмм).
Как найти вид функции поэлементного преобразования0 Пусть случайная величина f имеет плотность распределения /у(Д И пусть преобразованная величина g^gxf) (тоже случайная) должна иметь плотность распределения pg(g) Будем предполагать, что g(J) -монотонно возрастающая функция
Введём в рассмотрение интетральные функции распределения:
/ £
Pf(.D= Jp/KM, ^(я) = Jpg(n)rfn
—OO — oO
Если случайная величина x принимает значение то вероятность этого события
P[f<fo]=Pf<M-
В силу монотонности функции поэлементного преобразования одновременно с указанным неравенством будет выполняться и другое соотношение:
8 < go = g(go) •
Вероятность этого события:
^U<go] = -pgteo)-
Указанные события жёстко связаны (являясь следствием друг друга, они наступают одновременно), их вероятности, естественно, равны:
P\f<fo\ = P\g<g(.fo)\
Отсюда, отбрасывая ненужный индекс, получаем
Pf^) = Pg(.g(fy)-
Зная требуемый вид плотности распределения pg(g), а значит и pg{g), из данного соотношения можно выразить функцию поэлементного преобразования.
Покажем, как это делается на примере очень популярной процедуры - зквализации (выравнивания) гистограммы В данном случае требуется получить такое изображение, у которого все значения яркости в пределах заданного динамического диапазона равновероятны (рис. 11 За)-
171
----------- ДЛЯ & < а < а ьпип — о - a max
Smax ~ Smm
Интегральная функция распределения на указанном интервале линейна (рис 11.36)
о max а тт
Отсюда
о(У') £тт
от:ц
и, следовательно,
(f) (атах а пип
опин
Следует сделать одно замечание, касающееся
практического применения метода
преобразования гистограмм для контрастирования
реально получаемые гистограммы
оказываются очень неровными, с оольшим числом
ников и впадин. Для тех значении
яркости, которые наиболее вероятны, будет пик Pf(f)> и интегральная функция Pj(f)
будет резко возрастать (рис. 11.4).
а)
б)
Рис. 11.3, Пример плотности вероятностей и функции распределения
яркости изображения
В результате такой высоко вероятный участок яркости сильно растянется Это может
привести к нежелательным эффектам из-за роста ошибок квантования по уровню (эффект
небритости" иа портрете) И, наоборот, интервалы с малой вероятностью отсчётов будут
сжиматься, то есть детали, имеющие "нетипичную" яркость будут терять контрастность
172
Рис, 11.4. Пример преобразования гнет ограмм
Чтобы избежать этих нежелательных эффектов, функцию преобразования строят не по истинной, а по сглаженной гистограмме. Правда при этом само преобразование гистограмм становится приближённым.
11,4 . Пороговая обработка
Многие задачи обработки видеоинформации связаны с преобразованием полутонового изображения (имеющего много градации яркости) в бинарное (двухградационное) или, как говорят, в графический препарат. Такое преобразование осуществляется для того, чтобы сократить информационную избыточность изображения, оставив в нём только ту информацию, которая нужна для решения конкретной задачи (например, очертания объектов), и исключив несущественные особенности (фон).
В ряде случаев требуемый графический препарат удаётся получить в результате пороговой обработки полутонового изображения Она заключается в разделении всех отсчётов изображения на два класса по признаку яркости, объект и фон. Например, в выполнении поэлементного преобразования вида
[1 при /(П|,л’)-/о> g(«l.«2) = 5n ,, ,
[О при /(п],п2)</о>
где /о - некоторое "пороговое" значение яркости. Функция преобразования при этом имеет вид, указанный на рис. 11.5.
Основной проблемой здесь является выбор порога. Пусть исходное полутоновое изображение содержит интересующие нас объекты одной яркости на фоне другой яркости (типичные примеры машинописный текст, чертежи, медицинские пробы под микроскопом
173
и т.д.) Тогда плотность распределения яркости должна выглядеть как два узких пика (в идеале два дельта-импульса); то есть так, как показано на рис. 11.6а. В таком случае задача установления порога тривиальна в качестве можно взять любое значение между ’’пиками". На практике, однако, встречается более сложный случай, реальное изображение зашумлено, кроме того, как для объектов, так и для фона характерен некоторый разброс яркостей В результате функция плотности распределения размывается (рис. 11.66)
Рис. 11.5. Пример порогового преобразования функции яркости изображения
Обычно бимодальность распределения тем ие менее сохраняется. В такой ситуации можно выбрать порог Д соответствующий положению минимума между максимумами (модами).
В общем случае гистограммы распределения яркостей, измеренные по реальным изображениям, могут оказаться унимодальными или, наоборот, иметь '’изрезанный", многомодальный характер (рис. 11.7). Укажем некоторые методики определения порога в этих ситуациях.
Методика 1 заключается в аппроксимации участка гистограммы между пиками какой-либо гладкой функцией ,например, параболой, и нахождении её минимума через
174
производную (рис. 11 7а). По существу такая аппроксимация реализует сглаживание (низкочастотную фильтрацию) гистограммы Для этого сглаживания можно построить специальный фильгр низкой частоты (например, КИХ-фильтр).
Рис. 11. 7. Методики определения порога при пороговой обработке
Методика 2 основана на том, что иногда удается подобрать хорошие модели отдельно для плотностей распределения яркости объекта и фона. Тогда можно произвести аппроксимацию гистограммы суммой этих плотностей (рис. 11 76):
р/(Л=р Р1(/)+(1 - р) Pi(f) ,
где Р](/)> Pztf) ~ аналитически заданные функции плотности для объекта и фона, р -вероятность объекта (точнее, доля площади изображения, занимаемая объектом). Эта вероятность и параметры указанных плотностей (все или некоторые) подлежат оценке. После оценки параметров можно выбрать порог в соответствии с принципом максимального правдоподобия, то есть из соотношения
РР1(/о)=0-р)Р2(/о)
Отметим, что данный способ определения порога сохраняет работоспособность и тогда, когда бимодальность гистограммы скрыта из-за большого разброса яркостей и малой вероятности р. Недостаток метода - сложность аппроксимации.
11.5 . Препарирование
Широкий класс процедур обработки называется препарированием изображений. Оно заключается в приведении изображения к такому виду, который, возможно, весьма далек от естественного, но удобен для визуальной интерпретации или дальнейшего машинного анализа. Многие операции препарирования могут осуществляться при помощи поэлементных преобразований специальных видов. Так, частным случаем препарирования является пороговая обработка, рассмотренная выше.
Используется и много других функций поэлементного преобразования для препарирования В чем их основные особенности? Во-первых, все они несколько
175
искусственны, трудно дать им строгую физическую интерпретацию, скорее речь здесь идет просто об эмпирическом подборе функции преобразования в интересах решения конкретной задачи. Во-вторых, препарирование обычно производится в интерактивном (диалоговом) режиме обработки изображений, поэтому соответствующие функции преобразования должны быть легко "управляемыми", то есть определены с точностью до небольшого числа параметров, смысл которых понятен пользователю (оператору) системы (как порог при пороговой обработке)
Приведем некоторые примеры функций поэлементных преобразований, используемых для препарирования
Очевидным обобщением пороговой обработки является преобразование яркостного среза (рис. 11.8а). Оно позволяет выделить определенный интервал диапазона яркостей * входного изображения. Перемещая "рабочий" интервал по шкале и меняя его ширину, можно определить какие значения яркости есть на изображении (и в каких точках), а каких нет, произвести визуальный анализ отдельных объектов на изображении, различающихся по яркости Детали, не попадающие в указанный интервал, то есть относящиеся к "фону", будут подавлены. В данном примере фон чёрный (подавлен). На рис. 11.85 приведен вариант яркостного среза с сохранением фона. В данном случае изображение в целом сохраняется, но на нем "высвечиваются" участки, попавшие в заданный интервал значений яркости. Если этот интервал примыкает к границе шкалы яркости, то получаем преобразование так называемой неполной пороговой обработки (рис. 11.8в).
Контрастное масштабирование в своем простейшем варианте совпадает по смыслу с линейным контрастированием, только без опоры на статистику (или экстремальные значения) входного изображения. С помощью этой функции определённый участок диапазона значений яркости растягивается на всю шкалу (рис. 11 8г). При этом возрастает контраст деталей, попавших в этот участок. Детали, имеющие значения яркости за пределами участка, заменяются на однородный фон: чёрный (рис. 11.8е), белый (рис. 11.8ж) или серый (рис. 2.1(h). В других случаях контрастное масштабирование может быть связано с обращением функции яркости, то есть получением "негатива" (рис. 11.85).
Еще один вариант - пилообразное контрастное масштабирование иллюстрируется на рис. 11.8м. Как показывает практика, если изображение состоит из нескольких крупных областей с медленно меняющимися (по плоскости) значениями яркости, то такое преобразование почти не разрушает целостности его восприятия, но, в то же время, резко увеличивает контрастность плохо различимых мелких деталей
176
ж з и
PucALft. Примеры поэлементных преобразований
К поэлементному препарированию можно отнести и преобразование изображения в псевдоцвета В данном случае каждому числовому значению (коду) яркости ставится в соответствие свой цвет (яркость, насыщенность) на экране цветного видеодисплея. В принципе, закон соответствия может быть любым, хотя на практике стараются, чтобы функция преобразования была гладкой в том смысле, что плавному изменению яркости исходного изображения соответствовало бы плавное изменение цвета в выходном (например, от красного до фиолетового). Представление изображения в псевдоцветах сильно повышает визуальную читаемость изображённых объектов, поскольку глаз человека более чувствителен к малым изменениям цветового тона, нежели к малым изменениям яркости.
177
11.6 . Адаптивные преобразования яркости
Выше мы рассмотрели большое число различных поэлементных преобразований. Некоторые из них опирались на статистику данных, то есть требовали предварительного анализа изображения (например, получения гистограммы)
Статистические характеристики могут быть оценены только по самому изображению До сих пор мы считали их неизменными по всему полю, то есть неявно предполагали, что изображения описываются моделью стационарного случайного поля. Однако во многих практически важных случаях функция яркости не является стационарной. При этом многие из рассмотренных выше процедур оказываются неработоспособными (или не обеспечивают требуемое качество обработки) Для нестационарных полей используются адаптивные (то есть подстраивающиеся под локальные статистические характеристики) методы.
Простейший подход к построению адаптивных процедур заключается в том, что все изображение разбивается на небольшие фрагменты, на каждом из которых оцениваются (и используются при обработке) “локальные” характеристики изображения. Каждый фрагмент обрабатывается независимо, как отдельное изображение со стационарными свойствами (то есть здесь принимается квазистационарная модель поля яркости). Достоинство такого подхода - простота, недостаток - плохая стыковка обработанных фрагментов: на полученном изображении образуются заметные скачки яркости (контуры) по линиям “швов”.
Чтобы устранить этот недостаток, оценку локальных характеристик делают зависимой от соседних фрагментов. В этом случае фрагменты, на которых используются локальные характеристики, и участки, по которым они определяются, становятся несовпадающими по размерам, первые по-прежне]иу стыкуются, а вторые - перекрываются (рис. 11.9)
Рис. 11.9. К локальному преобразован ию изображения
В предельном случае оценка характеристик, полученная по некоторому фрагменту, используется для обработки единственного отсчёта в центре этого фрагмента. Здесь мы приходим к довольно распространённой процедуре обработки изображений “скользящим окном", центр которого последовательно (отсчёт за отсчётом) пробегает все возможные положения на изображении.
Такие адаптивные преобразования функции яркости уже не являются, строго говоря, поэлементными, так как теперь функция преобразования каждого отсчёта зависит от значений отсчётов в некоторой области.
Кратко остановимся на свойствах и особенностях реализации адаптивных вариантов тех поэлементных преобразований, о которых мы говорили ранее.
178
11.7 . Адаптивное повышение контраста
Здесь, как и в неадаптивном методе линейного контрастирования, вычисляется
функция
Лэ) = а /(«ь п2)+ь >
но коэффициенты преобразования меняются по полю изображения a-afn^th), Ь = Ь(щ,П2).
Эти коэффициенты строятся на базе локальных оценок статистических характеристик. Чаще всего (потому что проще всего) оцениваются локальные средние и дисперсии yy(ni,n2), а далее рассчитываются коэффициенты преобразования, обеспечивающего
требуемые (см. выше):
Ср.
а(«1,л2) = —Ь(п}, и2) = Мг Л2) ——-
<V(«b*2) CT/(^bw2)
Так как изменения яркости на малом фрагменте обычно невелики (то есть оу(льл2) мало), то в результате преобразования именно эти небольшие изменения растягиваются на всю шкалу. Эффект повышения контраста здесь существенно выше, чем при использовании неадаптивного метода с глобальной оценкой дисперсии
Ещё один полезный эффект - "вытягивание” тёмных участков изображения и вообще выравнивание его по яркости. Это получается потому, что на каждом участке (фрагменте) среднее значение яркости приводится к стандартному .
11.8 . Адаптивное преобразование гистограмм
Это то же самое, что было и раньше, но только теперь преобразуются гистограммы, определенные по локальным фрагментам. Очень популярная процедура - скользящая эквализация Внешний эффект от обработки примерно такой же, как и при адаптивном контрастировании, только здесь ’'стандартизируются” не только числовые характеристики распределения, но и сам его вид.
'’Глобальная” гистограмма здесь тоже получается близкой к требуемой, но не совпадает с ней точно
11.9 . Адаптивная пороговая обработка
В чём необходимость введения адаптивности при пороговой обработке? Основной причиной является нестационарностъ фона изображения, из-за чего становится невозможным подобрать единый “порог”, обеспечивающий хорошее разделение по всему изображению, Рассмотрим одномерную иллюстрацию, приведенную на рис. 11.10::
179
изображение постепенно светлеет но строке Любой единый для всей строки ’порог" разделит изображение неправильно часть фона (светлого) будет отнесена к объектам, а часть объектов (тёмных) пропадёт. Гистограмма не является бимодальной из-за широкого диапазона изменения яркости фона (рис 11 10а).
Л (Я
1 ГН П А
Puc.il. 10. Иллюстрация пороговой обработки: а) пример функции яркости на изображении; б-г) локальные гистограммы функции яркости.
Если применить адаптивный подход, то локальные гистограммы pi(fy pjf) и p^tf), определённые по участкам 1, 2, 3, будут иметь более удобный вид для обработки. В случае, когда фрагмент захватывает и объект, и фон, его гистограмма будет бимодальной, и несложно выбрать некоторое локальное пороговое значение. Некоторую сложность представляет обработка фрагментов, содержащих только объект или только фон. Здесь гистограмма не будет бимодальной, и выбрать ’’порог” без привлечения дополнительных соображений нельзя (см, участок 2 на рис. 11.10). Обычно для разрешения этой ситуации используется информация о локальных порогах с соседних фрагментов.
Основная сложность при реализации адаптивных методов состоит в резком увеличении объёма вычислений, необходимых для оценки локальных статистических характеристик. Это особенно ощущается при скользящей обработке окном, когда статистику приходится набирать для каждого выходного отсчёта. Выход из положения - применение рекурсивных процедур оценки статистических характеристик, когда на каждом фрагменте они (характеристики) не пересчитываются заново, а определяются через поправки к вычисленным на предыдущем шаге Такие рекурсивные процедуры будут рассмотрены позднее.
180
12. ПОВЫШЕНИЕ РЕЗКОСТИ ИЗОБРАЖЕНИЙ
При вводе в компьютер изображения подвергаются действию нескольких искажающих факторов. Искажения, вызванные нелинейностью амплитудной характеристики видеодатчика, мы уже рассматривали Будем считать, что коррекция амплитудных искажений выполнена.
Из-за неточной настройки оптической части системы, ненулевой площади видеодатчика и других причин частотная характеристика системы формирования изображений отличается от идеальной (не равна всюду единице) То есть в изображения вносятся линейные искажения Обычно эти искажения заключаются в ослаблении верхних пространственных частот спектра изображения. Визуально они воспринимаются как дефокусировка^ ухудшение резкости изображения, при которых становятся плохо видимыми мелкие детали.
Следовательно, повышение резкости должно заключаться в подъёме уровня высоких частот спектра изображения или, как говорят, в его высокочастотной фильтрации. В результате этой фильтрации происходит подчёркивание границ объектов, улучшается различимость мелких деталей (ранее размытых), а также "текстуры", то есть небольших регулярных или случайных колебаний яркости на участках без контуров.
Следует отметить, что здесь не ставится задача восстановления изображения, то есть возврата к "оригиналу" (прямое решение этой задачи заключается в построении инверсного фильтра) Оказывается, при повышении резкости можно и ’’перестараться", то есть произвести перекомпенсацию искажений. Это подтверждают и эксперименты по психо визуальному оцениванию качества изображений, которые показывают, что объекты с "неестественно" подчёркнутыми границами на глаз воспринимаются лучше, чем идеальные с точки зрения фотометрии Таким образом, задача повышения резкости в равной степени относится и к улучшению качества, и к препарированию изображений
Итак, повторим, повышение резкости (или подчёркивание границ) заключается в усилении высокочастотных составляющих пространственного спектра изображения
12.1. Повышение резкости локальными методами
Конкретных методов повышения резкости (и вариантов их реализации) очень много Рассмотрим простой (и довольно эффективный) метод, который основан на уже упоминавшейся пространственной линейной обработке изображения "скользящим окном” небольшого размера. Это окно перемещается по изображению и при каждом его положении формируется один отсчёт выходного поля яркости (обычно этот отсчет соответствует центру
181
окна) В данном случае процедура повышения резкости реализуется как двумерная система с конечной импульсной характеристикой (КИХ-система) Размеры и форма окна определяют область ненулевых значений её импульсной характеристики
Вначале покажем качественно, как строится фильтр, подчёркивающий границы. Воспользуемся для этого рядом иодномерных” иллюстраций. Оказывается, процедуру обработки можно условно разбить на несколько шагов
Пусть fin) - произвольная строка исходного нерезкого изображения На рис 12.1 кривая 1 представляет собой некоторый участок с расфокусированной границей объекта (пунктиром показан идеальный случай), а справа спектр данного участка
Сначала осуществляется низкочастотная фильтрация, то есть дополнительное сглаживание сигнала (обозначим сглаженный сигнал - f\n), рис. 12.1, кривая 2). Далее из исходного сигнала вычитается сглаженный. В результате чего формируется разностный сигнал - высокочастотное изображение (рис. 12 1, кривая 3):
/’(я) = /(«)-/'(«)•
Затем этот разностный сигнал прибавляется (с некоторым коэффициентом) к исходному. Получаем результат g(w) - изображение с повышенной резкостью (рис. 12.1, кривая 4). В спектре этого изображения низкочастотные компоненты не изменились (то есть общий уровень яркости остался прежним), а высокочастотные усилились (то есть подчеркнуты локальные особенности - границы, мелкие детали).
Рис. 12.1. Пример подчеркивания границ с использованием низкочастотной фильтрации
Теперь повторим все сказанное на аналитическом уровне и для двумерного случая. Низкочастотная фильтрация (сглаживание) осуществляется усреднением отсчетов поля яркости по некоторому окну:
Л«|Л2)= -*1.«2-*2)
(*1.*2)еО где D - некоторая конечная область в пространстве аргументов, определяющая окно
((ЛрАд) е £)) Видно, что записанное выражение задает двумерную свертку сигнала с импульсной характеристикой сглаживающей КИХ-системы
182
Значения k-^D выбирается из тех соображений, чтобы получить
действительно сглаживание (то есть усреднение) отсчетов. Обычно берутся а^к^кт)^ Кроме того к процедуре сглаживания предъявляется требование, чтобы она не меняла среднего значения (постоянную составляющую) изображения, то есть должно быть
££а(ЛьЬ) = 1
Часто все коэффициенты импульсной характеристики берутся одинаковыми, при этом получается простое усреднение отсчётов изображения по окну.
Высокочастотное изображение (в нём среднее равно нулю).
/*(«1 > «2) = /(«1 Л?) - /'(«1Л2)
Изображение с повышенной резкостью:
g(«l, «2) ~ Япъ п2) + Q /*(«ь ”2)>
где q - коэффициент усиления разностного (высокочастотного) сигнала (#>0).
Раскрывая обозначения, записываем.
Если привести подобные члены, то можно записать это выражение в виде свертки: g(”l>«2) = £2Х*Ь*2)ЛП1 -ib"2 ~*г) (M2)sD
где h(k\,к2) - импульсная характеристика КИХ-фильтра, осуществляющего подчёркивание границ (повышение резкости):
й(0,0) = 1 + q - q д(0,0)
й(*1Л2) = ~?"(*b*2) (*b*l)€
На практике из соображений простоты берут обычно центрированное квадратное окно малого размера (3x3 или 5x5) При этом h(k^k2) имеет всего несколько ненулевых отсчётов. Значения этих отсчётов удобно задавать в форме так называемой ’’маски” (с этим понятием мы ещё встретимся неоднократно).
Рассмотрим в качестве примеров типичные маски размером 3x3 для повышения резкости изображений.
Маска I.
г0 -1 (Г
-1 5 -1
-1 °,
183
Она соответствует случаю, когда сглаживание производится усреднением по пяти отсчётам а(0,0) = а(1,0) = а(-1,0) = а(0,1) = а(0-1) = |
и коэффициент усиления q = 5
Маска 2.
_р
-I 9 -1
Она получается при сглаживании усреднением по девяти точкам:
а(ЛьЛ2) = | при -\<k^k2i 1 н ? = 9.
Меняя размеры окна, значения {</(£] ,k2)} и q, можно получить и другие маски, но для примера нам достаточно. Возникает вопрос, какие маски считать хорошими, а какие нет. Однозначно ответить на него невозможно, так как мы не определили строго показатель качества обработки. Но некоторые общие требования к маске (то есть к импульсной характеристике обрабатывающей КИХ-системы) сформулировать можно.
Два первых требования относятся к частотной характеристике КИХ-системы, которая в общем случае определяется соотношением.
Я(е'“>,еАа-)= •
Если импульсная характеристика является четной по обоим аргументам (как в приведенных примерах масок), то частотная характеристика будет вещественной и симметричной так, что достаточно ее рассматривать на двумерном интервале О< <В| ^7Г-
Итак, во-первых нужно, чтобы КИХ-снстема действительно повышала резкость, то есть ее частотная характеристика имела бы подъем в области высоких частот (при ф^ п; Ф2~>я). Убедимся, что это так, на примере рассмотренной нами первой маски.
Соответствующая КИХ-система имеет частотную характеристику:
Я(е‘ш«, е™2)« 5 - г™' - - е™2 - е~™2 = 5 - 2 coso1 - 2 cos ф2 .
Найдём и покажем на координатной сетке некоторые значения частотной характеристики (см. рис. 12.2)
При (01,ф2 я косинусы стремятся к (-1) и частотная характеристика достигает своего максимума. То есть действительно это фильтр высоких частот. При ob®2 ->0 частотная характеристика стремится к единице, то есть низкочастотные составляющие двумерного спектра сигнала (изображения) не искажаются
184
Рис. 12.2. Пример частотной характеристики высокочастотного фильтра
Второе требование - частотная характеристика должна быть близка к изотропной, то есть, в идеале, иметь линиями равных значений окружности Это нужно, чтобы границы объектов на изображении с любой ориентацией подчёркивались одинаково. В действительности это требование выполняется весьма и весьма приблизительно. Возьмём опять пример для первой маски. Для неё при оъ = 0 (или, наоборот, при coj=O,
со2=л) значение частотной характеристики Н(е,(Л], е,и>2) = 5, а в точке на окружности
л к радиусом л, но лежащей в диагональном направлении, то есть при toj == съ ~ •
Я(е,Ш1, е,ап- ) = 5 - 4 cos ~ 7.4. т/2
То есть получилось, что в диагональном направлении в плоскости частот частотная характеристика растёт примерно в полтора раза быстрее. Из-за этого наклонные границы будут подчёркиваться сильнее, чем горизонтальны и вертикальные.
185
Третье требование. Повышение резкости не должно сопровождаться чрезмерным повышение шума. Подчёркивание полезных границ линейной системой всегда сопровождается увеличением шумовых составляющих на изображении (они ведь тоже высокочастотные!). Хотелось бы, чтобы и границы подчеркнулись, и шум не очень возрос.
Рассмотрим этот вопрос подробнее Если на изображении присутствует шум, то это означает, что каждый отсчёт искажён, и на вход высокочастотного КИХ-фильтра поступает не f(nbn2), а
/(«1, «2 ) = Л«ь «2)+ v(wl ’ п2) > где v - аддитивный шум
Тогда и на выходе фильтра имеем смесь:
g(m, п) = y(«i, я2) + М «], ”2), где w - шумовая составляющая на обработанном изображении
H'(«i,»2)= -к\,п2-к2).
Для простоты рассуждений будем считать, что исходный шум v - белый. Тогда легко получаем выражение для дисперсии выходного шума:
= EEa2(M2) = 2°v.
где Q - коэффициент увеличения мощности (дисперсии) шума после подчёркивание границ линейном фильтром:
о= ZZa2(M2)-
(А1(А2)е£>
Для рассмотренных выше масок этот коэффициент поразительно велик: для. маски Г. 6=29, для маски 2 6=89’
Как уменьшить коэффициент увеличения мощности шума 6? Первый путь -уменьшение коэффициента усиления высокочастотной составляющей q при синтезе КИХ-фильтра (от q зависят и значения h). Однако это означает ослабление ’’подчёркивающей" способности фильтра, то есть теряет смысл сама обработка Можно несколько уменьшить Q (при сохранении “подчёркивающих" свойств) при увеличении числа отсчётов в окие обработки, то есть при переходе к маскам 5x5, 7x7 и так далее - это второй путь Но он находится в противоречии с ещё одним требованием к окну
Четвёртое требование-, процедура обработки окном должна быть достаточно простой, то есть желательно выбирать маску небольшого размера
Сформулированные требования, как видим, довольно противоречивы, поэтому всегда
приходится искать не оптимальное, а компромиссное решение.
186
Поиски 'масок” и вообще алгоритмов обработки отсчётов в окне - предмет продолжающихся исследований Предложено большое число эвристических нелинейных процедур, на которых мы пока не имеем возможности остановиться.
12.2. Спектральные методы повышения резкости
Обработка ”маской” - не единственная процедура, позволяющая усилить резкость изображения Аналогичные (а иногда и лучшие) результаты можно получить, обрабатывая изображения в области трансформант. Вспомним, что идея повышения резкости как раз и заключалась в изменении спектра сигнала, конкретно - в усилении высокочастотных спектральных компонент
Для повышения резкости может быть использована обработка в частотной области.
Часто применяется обобщенная линейная фильтрация изображения.
G(t?2j,W2) = ^(тЪт2^
где _ матрица так называемой обобщенной передаточной функции спектральных
компонент. Элементы этой матрицы должны иметь подъем в области высоких частот.
Следует отметить, что для произвольного базиса преобразования понятие "высокие частоты" является весьма условным. Высокочастотными спектральными компонентами обычно называют те коэффициенты разложения (трансформанты), которые соответствуют наиболее динамичным (быстро меняющимся или колеблющимся) базисным функциям.
В результате линейной фильтрации происходит усиление тех базисных функций в разложении сигнала, которые отвечают за воспроизведения границ и мелких структурных * особенностей поля яркости, то есть повышается резкость изображения. Неудобство метода -неопределённость в выборе конкретной Я(/иьт2).
Существует группа эвристических процедур повышения резкости, основанная на нелинейной обработке трансформант Этн процедуры используют тот факт, что трансформанты, соответствующие высоким пространственным частотам, для нерезкого изображения имеют существенно меныпую амплитуду, иежелн низкочастотные. Следовательно, для повышения резкости изображения большие трансформанты нужно уменьшить, а малые - увеличить.
Очень часто используется процедура возведения трансформант в степень. Точнее, обработка здесь заключается в том, что возводится в степень модуль (то есть амплитуда) трансформанты, а фаза (или знак) сохраняется.
В общем случае трансформанты можно представить в виде
187
F(mi, m2 ) = |F(W1, m2 )| el ar^m' }.
fo
Если трансформанты вещественны, но знакопеременны, то > .
Iя
Обработанные трансформанты
где а - показатель степени Для повышения резкости берется 0 < а < 1 Если взять а - 0 5, то получим известный метод извлечения квадратного корня. В предельном случае, когда а = О, получаем чисто фазовый спектр. Как ни удивительно, по фазовому спектру очень хорошо восстанавливаются все структурные особенности поля яркости (то есть фаза спектра содержит основную часть информации об изображении). Иногда идут ещё дальше и присоединяют к фазовому спектру "чужую" амплитуду, исходя из того, какова она должна быть для типичных изображений данного класса.
Ещё одна интересная процедура повышения резкости с нелинейной обработкой трансформант основана на их логарифмировании:
С?(/П|, т2 ) = с • log[a + 6|F(m], m2 )|] • е аг£ ,тг
После обратного преобразования получаем матрицу gfcpn?) “ обобщённый кепстр изображения /(«i,«2). (Первоначально кепстр был введен как обратное преобразование Фурье от логарифма преобразования Фурье сигнала, у нас он обобщённый, так как преобразование произвольно). Процедура логарифмирования тоже обеспечивает определённое подчёркивание границ на изображении.
Достоинство процедур повышения резкости в спектральной области - более высокая
помехоустойчивость и лучшее качество обработанных изображении Недостаток -сложность, более высокая, чем при обработке "окном1’ малого размера (даже несмотря на наличие быстрых алгоритмов преобразований).
188
13. ВЫДЕЛЕНИЕ КОНТУРОВ
13.1. Определение контура
Ранее были рассмотрены процедуры пороговой обработки изображений, которые позволяли осуществить разделение (сет ментацию) изображения на области (объекты и фон). Задача пороговой обработки - выделение областей, одинаковых (однородных) по яркости В результате пороговой обработки получалось бинарное изображение с выделенными областями (рис. 13.1) Геометрические характеристики этих областей служат важными признаками для классификации изображенных объектов и изображения в целом
Однако во многих случаях более информативными с точки зрения распознавания (и более удобными для анализа) являются характеристики не самих областей, а их границ -контуров. И биологические системы зрительного восприятия, как показывают исследования, используют главным образом обнаружение границ, а не разделение по яркости. То есть большая доля полезной информации, содержащейся в изображении, заключена не в значениях яркости объектов, а в их (объектов) очертаниях.
Пороговая обработка
Выдслснпс контуров
Рис. 13.1. Пороговая обработка и выделение контуров
Задача выделения контуров как раз и состоит в построении бинарного изображения (графического препарата), содержащего эти очертания, то есть графического "рисунка” полутоновой картинки, представленной на рис. 13 1
Прежде чем приступить к изложению методов решения этой задачи уточним ее содержание
Что такое контур9 Возможны различные трактовки этого интуитивно ясного понятия. Мы будем использовать наиболее популярную. Будем называть контурам изображения пространственно протяженный разрыв (перепад, скачкообразное изменение) функции
187
F( W1, m2 ) = |F(z^, )| • el а,^т^ >
[0
Если трансформанты вещественны, но знакопеременны, то argF^q,™?) = <
Обработанные трансформанты
G(m1>OT,) = |F(mbm2)|“e' ^Г(т< ,
где а ~ показатель степени Для повышения резкости берется 0 < а < 1 Если взять а = 0 5, то получим известный метод извлечения квадратного корня В предельном случае, когда а = О, получаем чисто фазовый спектр Как ни удивительно, по фазовому спектру очень хорошо восстанавливаются все структурные особенности поля яркости (то есть фаза спектра содержит основную часть информации об изображении) Иногда идут ещё дальше и присоединяют к фазовому спектру "чужую” амплитуду, исходя из того, какова она должна быть для типичных изображений данного класса.
Ещё одна интересная процедура повышения резкости с нелинейной обработкой трансформант основана на их логарифмировании:
G(W], т2) — с - log [л + b | F(m j, т2 )|] е аг^ 'т- .
После обратного преобразования получаем матрицу g(ri\,n2} - обобщённый кепстр изображения /(^,n2). (Первоначально кепстр был введен как обратное преобразование Фурье от логарифма преобразования Фурье сигнала, у нас он обобщённый, так как преобразование произвольно). Процедура логарифмирования тоже обеспечивает определённое подчёркивание границ иа изображении
Достоинство процедур повышения резкости в спектральной области - более высокая помехоустойчивость и лучшее качество обработанных изображений. Недостаток -сложность, более высокая, чем при обработке ’’окном" малого размера (даже несмотря на наличие быстрых алгоритмов преобразований).
189
яркости. Рассмотрим участок изображения с непрерывном аргументе) дана на рис 13 2
контуром Одномерная иллюстрация (при
Рис. 13.2. Контур и его определение:
а) пример контура; б) результат идеального определения контура.
Изображенное изменение функции яркости характеризуется высотой скачка - /д,
углом наклона - 0 и координатой центра наклонного участка - х0. Перепад функции яркости
считается контуром , если ею высота и угол наклона превосходят некоторые пороговые значения . Идеальный детектор контура должен указать на его наличие в единственной точке, расположенной в центре наклонного участка (рис 13 26).
В двумерном случае у перепада функции яркости появляется ещё одна важная характеристика - его ориентация (угол на плоскости) Па рис. 13.Зя изображен локальный участок, на котором контур прямолинеен Идеальный детектор контура должен дать бесконечно тонкую непрерывную линию по центру области изменяющейся яркости (рис 13.36).
Рис. 13.3. Определение контура на изображении:
а) изображение с контуром; б) результат идеального определения контура.
Сразу же отметим некоторые проблемы, связанные с принятым определением контура
Во-первых, введенное определение не гарантирует замкнутости контурных линий В процессе выделения контура могут наблюдаются его разрывы в тех местах, где функция яркости меняется недостаточно быстро Пример такой ситуации дан на рис. 13.4.
191
Теперь обратимся к самой процедуре выделения контуров Наиболее часто используемый подход к решению задачи обнаружения перепадов (выделения контуров) на одноцветном изображении можно проиллюстрировать простой схемой, показанной на рис. 13 8
Исходное изображение ^подвергается линейной или нелинейной обработке для того, чтобы выделить перепады яркости В результате этой операции формируется изображение /2 , функция яркости которого существенно отличается от нуля только в областях резких изменений функции яркости исходного изображения Затем после пороговой обработки из этого изображения формируется искомый графический (контурный) препарат - /3.
Вторую операцию - пороговую обработку мы уже рассматривали. Поэтому всё внимание перенесём на первую операцию - выделение перепадов яркости. Рассмотрим две наиболее важные группы методов выделения контуров
Рис. 13.6. Примеры контуров, не подходящих под определение
• 9 0 в О • в е • о • 0900 • •ООО
а)
в)
Рис. 13.7. Особенности выделения границ на цифровом изображении
Подчеркивание перепадов
Рис.13.8. Общий вид процедуры выделения контуров
192
73.2. Дифференциальные методы
Одним из наиболее очевидных и простых способов обнаружения границ является
пространственное дифференцирование функции яркости. То, что дифференцирование дает эффект, видно из простого "одномерного" примера. До дифференцирования сигнал имеет вид, представленный на рис 13.9а. После дифференцирования - вид на рис. 13.96, и теперь контур легко выделяется пороговой обработкой (рис. 13 96).
Очевидно, в двумерном случае, если мы имеем изображение /(х|,х2), то обнаружение Л „ а/
контуров, перпендикулярных оси Х|, обеспечивает взятие частной производной , а
перпендикулярных оси х2 _ частной производной (рис, 13.10). Эти производные йх2
характеризуют скорости изменения функции яркости в направлениях X] и х2 соответственно. Можно вычислить производную и но произвольному направлению. Нам однако необходимо найти характеристику, позволяющую обнаружить контур независимо от его ориентации. В качестве такой характеристики, являющейся признаком наличия контура в локальной области, можно использовать градиент функции яркости:
grad , х2) = V/(xb х2 )
Градиент - это вектор (в нашем случае в двумерном пространстве), ориентированный по направлению наиболее быстрого возрастания функции /(х|,х2)и имеющий длину, пропорциональную этой максимальной скорости (максимальному значению частной производной по направлению), (рис. 3.11).
Так как направление нас не интересует, ограничимся рассмотрением модуля градиента (длины вектора):
Отметим, кстати, что для вычисления модуля градиента вместо производных — и -----
дх^ дх2
можно брать производные по любой паре перпендикулярных направлений, этот факт нам еще пригодится Итак, для выделения контура произвольного направления можно использовать модуль градиента поля яркости.
193
а) б)
Рис.13.9. Дифференциальный метод выделения контура
а)
Рис. 13.10. Дифференциальный метод выделения контура на изображении
Рис. 13.11. К определению градиента функции
В случае цифровых изображений, представленных матрицей отсчетов, вместо производных берутся дискретные разности :
g/(xl>x2.) ~ 5{ Л2) - Дп{ -1, п2),
дх}
df(xbx2) _
бх2
Тогда преобразование, выделяющее перепады яркости, будет заключаться в вычислении модуля "дискретного” градиента изображения :
194
g(«bH2) = +[*2(”1Л2)12 =
= 7(7(^Ь«2)“/("1 ~ l"2)l2 +[/(«i,m)-/(W| Л2 - О]2
Видно, что это вычисление производится в два этапа Сначала изображение обрабатывается двумя двумерными КИХ-системами для получения дискретных разностей. Импульсные характеристики этих систем соотвегствуют "маскам” размерами 2x1 н 1x2:
Г-С / х
! (-1 1)
к и
На втором шаге вычисленные разности нелинейным образом комбинируются для получения g(«i>«2)
При реализации процедуры детектирования контуров стараются избегать трудоёмких операций типа умножения и извлечения квадратного корня. Поэтому используют выражения, вычисляемые проще, "аппроксимирующие" дискретный градиент. Чаще всего модуль градиента заменяют выражениями:
s("b'22)= |5i(wbw2)| + h(wb«2)|
или
g(«l Л2 ) = , «2 )|> b(wl ’ п2 )|}
Следует заметить, что такие приближения градиента уже не являются одинаково чувствительными к границам с любой ориентацией. Действительно, для строго вертикальных или горизонтальных границ все три формулы (с корнем, суммой и максимумом) дают одинаковые результаты. Но для границы с наклоном 45°, при котором 51(л1.л2) = 5’2(л1,л2), имеем:
7[51("1>и2)]2 +[-52(«l>n2)F = -Д|$|(л1,л2)|, |*1(л1.л2)|+|52(льл2)| = 2|$1(л1,л2)| -mex{|st (Л). п2 |«2 (л1, л2 )| }=|st (п], п2 ) .
Отличие приближений градиента от точного значения составляет Л раз Обычно такие вариации чувствительности считаются приемлемыми.
Другой простой вариант вычисления дискретного градиента дает оператор Робертса. При его построении используется упомянутый выше тот факт, что для вычисления модуля градиента можно использовать производные (разности) в любых двух перпендикулярных направлениях. В операторе Робертса берутся диагональные:
g(*b*2) = >
195
где
Л(«ьnz) = f (п! > п2) - ~ 1 лг -1); ^/("ь«2) = «2 “ 0 - *(*i -1 лг) •
То есть здесь отдельные разности формируются двумя НИХ- системами, импульсные характеристики которых соответствуют маскам 2x2:
f-1 (П f0 -Г| и
I 0 1J U oj
Очевидно, здесь тоже можно использовать вместо корня сумму или максимум модулей разностей
Еще один вариант - оператор Собела В нем обработанное (промежуточное) изображение ^(^,«2) формируется так же , как в операторе Робертса (и обычном градиенте), но величины и s2 вычисляются линейной обработкой масками 3x3
у -2 -р f-\ 0 ]'
0 0 0 И -2 0 2
< 1 2 Ь к"' 0 L
Существуют и другие приближения градиента, но мы их опускаем ввиду недостатка места. Следует отметить, что применение любых градиентных операторов дает обычно весьма сходные результаты. Некоторые различия наблюдаются только в их реакции на шум. Выше мы рассмотрели способы выделения перепадов, базирующиеся на использовании первой производной. Для решения данной задачи можно применять и дифференциальные операторы более высокого порядка. Очень популярным является, например, оператор Лапласа (лапласиан). В непрерывном случае:
v -----5----+----”3----‘
дх\ д x2
Причём, значение лапласиана является нечувствительным к ориентации границ областей, что и позволяет использовать его при детектировании контуров.
В дискретном случае оператор Лапласа можно реализовать в виде процедуры линейной обработки изображения окном 3x3. Действительно, вторые производные можно аппроксимировать вторыми разностями:
г Ауг) ~ /(И1 +1;„2)_ 2/(„ьИ2)+/(Л1 -1,„2), дху
2
д ~ ,п2 +1) - 2/(и,, п2) + Дл(, п2 -1).
сх2
Суммируя аторые разности получаем маску:
196
'0 I O' 1 -4 1
<0 1 °,
Это импульсная характеристика КИХ-системы, вычисляющей лапласиан. Лапласиан может принимать как положительные, так и отрицательные значения, поэтому, в операторе выделения контуров следует взять его абсолютное значение. Таким образом, получаем процедуру выделения границ, практически нечувствительную к их ориентации:
5(Л1,П2)=|/(п1 + 1,п2) + /(л1“1.и2) + /(пЬл2+1) + /(”|,Я2“1)-V(«l>"2)| •
Здесь тоже возможны варианты, на которых пока не будем останавливаться. У оператора Лапласа есть и достоинства, и недостагки но сравнению с градиентными операторами При обработке изображения он дает несколько другие результаты, нежели градиент. Дело в том, что вторая производная позволяет выделить не участки наклона функции яркости, а участки её изгибов. Одномерная иллюстрация сказанному дана на рис. 13.12.
j .т t
а) контур (функция яркости); б) модуль градиента; в) модуль лапласиана Рис.13,12. Особенности применения оператора Лапласа
Если граница размыта, то после обработки лапласианом она раздваивается (рис. 13.12»). Это недостаток лапласиана, для его устранения приходиться использовать дополнительную обработку полученного графического препарата. Однако тот же эффект (взятие второй, а не первой производной) позволяет легко выделять границы типа излома - это достоинство данного метода
Еще одно свойство лапласиана - сильнее выделяются отдельные точки (в частности, шумы),что является несомненным недостатком Однако процедура обработки изображения является в целом линейной (более простой) - достоинство.
13.3. Методы с согласованием
Общим недостатком рассмотренных выше методов детектирования перепадов яркости является высокая чувствительность к шуму Это объясняется тем, что действие дискретных дифференциальных (разностных) операторов состоит в вычислении и комбинировании разностей отсчетов в пределах "окна” малых размеров. Каждая разность вычисляется непосредственно по отсчетам, поэтому шум на изображении сразу же попадает (причем с
197
усилением) в результат преобразования.
В то же время сам подход к выделению контуров с помощью локальных преобразований изображения скользящим окном представляется довольно естественным н очень удобным для реализации. Нельзя ли, сохранив достоинство дифференциальных методов, повысить их помехоустойчивость?
Оказывается, можно, если перед применением дифференциального оператора применить аппроксимацию (сглаживание) функции яркости в пределах окна, то есть согласовать с функцией яркости (’’подогнать" под неё) некоторую поверхность первого или второго порядка. Такой подход реализуется дифференциальными методами с согласованием
Рассмотрим принцип методов согласования на примере "окна" 2x2. Вспомним, что дискретное изображение получалось из непрерывного:
/(^1,М2) = ЛХ1’Х2)|Х’=Д1Л1 •
*2=^2W2
Ниже для простоты изложения, не умаляя общности результатов, положим - Д2 ~ * •
По наблюдаемым значениям функции яркости в пределах выбранного "окна" 7(И!-1,л2-1) /(И1-1,П2)'
построим на нем аппроксимирующую плоскость.
7(xI,x2) = ax-i + Z>x2 + c.
Если плоскость построена, то есть определены коэффициенты о, ЬУ и с, то можно вычислить частные производные и искомый модуль градиента:
f
WbX2) =а lv/(xbX2)| = 5/P77.
дх^ дх2 ! 1
может служить признаком локального перепада функции яркости
Прн построении плоскости удобнее всего воспользоваться методом наименьших квадратов. При поиске коэффициентов будем минимизировать величину
Для любого положения окна коэффициенты будут определятся одинаковыми функциями отсчетов, поэтому возьмем окно при гц - гь = 1 , для которого все выкладка будут наиболее компактными. Итак, на рассматриваемом окне:
г2 = [а+с -/(1,1)]2+ [*+с-/(0,1)]2+ [а + с-/(1,0)]2+[с- /(о, О)]2
В точке минимума все производные погрешности аппроксимации по коэффициентам равны
198
нулю:
— = 0, — = 0, — = 0, да db дс
QTKyW
2a + b + 2c = /(1,1)+ /(1,0)
а+26 + 2с = /(1,1)+/(1,0)
а + & + 2С = 1(/(1,1)+/(0,1)+/(1,0) + /(0,0))
Окончательно выражения для коэффициентов будет иметь вид:
а = у(/(1.1)+/(1.0)-/(0,1)-/(0,0)), i = |(/(l,l)+/(0,l)-/(l,0)-/(0,0)).
Получилось, что коэффициенты а, b формируются в результате линейной обработки отсчетов изображения масками 2x2. Использование таких масок равнозначно усреднению дискретных разностей по окну 2x2 Построенный по таким усредненным разностям градиент
менее чувствительнее к помехам.
Теперь, закончив пример, сделаем очевидное обобщение. В общем случае построение процедуры, использующей дифференциальный метод с согласованием, заключается в следующем. Вокруг обрабатываемой точки на изображении задается некоторая область -"окно обработки’’. По отсчетом окна строится аппроксимирующая полиномиальная поверхность Естественно, нужно выбирать такой порядок этой поверхности, чтобы число коэффициентов было меньше числа отсчетов в окне. Для получения изображения с подчёркнутыми перепадами вычисляется дифференциальная характеристика (градиент или лапласиан) аппроксимирующей поверхности в центре окна.
Приведем без вывода (для справки) еще некоторые варианты реализации дифференциального метода с согласованием.
При аппроксимации плоскостью
/(х1»хз)= ^*1 +^х2 +с
окна 3x3 получается, что коэффициенты а и b формируются в результате линейной
обработки масками:
-1
0
1
0 Р
0 1
о tj
соответственно.
Множитель 1/6 можно отбросить, он влияет только на масштаб результата н может
199
быть учтен при установке порога В этом случае модуль градиента Va2+Z>2 Определяет оператор пПреВитт'\ который довольно часто используется на практике.
Если окно 3x3 аппроксимировать поверхностью второго порядка /(ЛЬЛ2)= +cXjX2 +OUCJ +0*2 + Y ’
то лапласиан в окне равен
V2/^!, х2 ) = ?Ц- + = la + 2Ь.
дх2 дх2
Коэффициенты а и b формируются масками.
fl 1 И А -2 Р
- -2 -2 -2 и - I -2 I , 6 6
и ’ и и । ’J
а поскольку лапласиан вычисляется как линейная комбинация этих коэффициентов, можно построить общую маску для ’’согласованного" лапласиана:
(2 -< 1 .
2 '
-1
Методы с согласованием обеспечивают существенно большую помехоустойчивость выделения контуров, хотя ничуть не сложнее "чисто" дифференциальных методов (просто используется маска с другими коэффициентами).
200
14. ЛИНЕЙНАЯ ФИЛЬТРАЦИЯ И ВОССТАНОВЛЕНИЕ ИЗОБРАЖЕНИЙ
14.1. Восстановление дискретного сигнала ЛПП-системой
Рассмотрим следующую задачу, имеющую важное прикладное значение
Пусть имеется полезный сигнал - последовательность fin}. Однако непосредственному наблюдению (измерению) он недоступен В нашем распоряжении имеется лишь сигнал g(«) - результат прохождения сигнала через некоторую “искажающую” систему, дополнительно искаженный шумом v(n) (см. рис 14.1)
Рис, 14.1. Модель наблюдения полезного сигнала
Требуется оценить полезный сигнал по наблюдаемому Для этого необходимо синтезировать такую восстанавливающую систему (фильтр), чтобы при подаче на ее вход искаженного (наблюдаемого) сигнала на выходе получалась бы оценка f(n) полезного сигнала (см. рис. 14.2).
Вос ста на вл ивдкнцая а
_j______0» система
(фильтр)
Рис. 14.2. Схема восстанавливающей системы
Далее мы сузим класс рассматриваемых сигналов и систем.
Во-первых, в большинстве практически важных случаев искажения сигнала удается описать моделью ЛПП-системы, рассмотрением которой мы и ограничимся. Будем считать, что известна ее импульсная характеристика h(n) Тогда наблюдаемый сигнал (последовательность) запишется в виде:
#(и) = f(n) * h(n) + v(n) (14.1)
Соотношение (14.1) задает так называемую линейную модель наблюдения в дискретном времени.
Во-вторых, восстанавливать сигнал будем также при помощи ЛПП-системы:
201
7(«) = g(«)*/’eoccm(n), (14 2)
где h6OCCm(n) - импульсная характеристика восстанавливающей ЛПП-системы.
В-третьих, и полезный сигнал /(«), и шум т(и) будем считать стационарными случайными последовательностями, статистические характеристики которых известны
В-четвертых, заметим, что, поскольку все преобразуемые последовательности случайны, то и ошибка восстановления.
г(п)=/(л)-/(«) (14 3)
в каждый момент времени случайна Мы будем строить такую восстанавливающую систему, которая обеспечивает минимум ошибки в среднеквадратичном смысле, то есть минимизируем ее дисперсию (в силу стационарности последовательностей не зависящую от времени).
Ё2 = [/(«)-/(и)]" j —> mm . (14.4)
Из всего сказанного наиболее существенным является ограничение, заключающееся в требовании линейности восстанавливающей системы. Однако для нелинейных систем получить конкретные результаты их синтеза гораздо сложнее. Кроме того из теории информации известно, что для важного класса сигналов - гауссовских - оптимальное * (наилучшее) в среднеквадратичном смысле восстановление обеспечивается именно линейной системой.
ЛПП-система, реализующая преобразование (14.2) и обеспечивающая при этом выполнение условия (14.4), называется "оптимальной линейной восстанавливающей системой" или "оптимальным линейным восстанавливающим фильтром" А ее применение реализует процедуру оптимального линейного восстановления.
Очень часто однако на импульсную характеристику восстанавливающей ЛПП-системы налагаются дополнительные ограничения, связанные с удобством реализации. Например, требуется, чтобы она была КИХ-системой илн физически реализуемой БИХ-системой (см п.4.3). В таких ситуациях ошибка восстановления несколькр возрастет, то есть мы получим квазиоптималъные процедуры восстановления
Мы на время объединим рассмотрение оптимального и квазиоптимального восстановления следующим образом: будем считать, что импульсная характеристика восстанавливающая ЛПП-снстемы отлична от нуля для значения аргумента из некоторого множества D (интервала наблюдения):
ASOccm(")=° при «2°-
(14.5)
202
Определим при этом ограничении параметры системы, минимизирующие ошибку
восстановления. С учетом сказанного выше конкретизируется формула (14 2)
оо
/(") = ^h^cem(k)g(n ~к)
к=-«> keD
(14 6)
и условие минимизации ошибки (14.4):
=#{ [/(«)“/(«)]“} =
Е<
(14.7)
/. ^восст Jc^D
(*)#(«-*)-/(«)
► -> min.
Минимизация ошибки осуществляется, путем варьирования ненулевых отсчетов
импульсной характеристики восстанавливающей системы В точке минимума
обеспечивается равенство нулю всех частных производных*
вое ст \т
те D.
(14.8)
Подставив (14.7) в (14.8), получаем:
де2
^восст (т)
~ сосет
(*)g(«-*)-/(«) g(w-m» = 0,
(14 9)
т е D .
Из последнего выражения следуют два важных соотношения
Во-первых, это выражение можно записать в виде
E{z{n)g{n- т)}-0, meD, (14.10)
то есть взаимная корреляционная функция Bcg(zw) = O, ошибка оптимального
восстановления некоррелирована с наблюдаемым сигналом. Это утверждение известно в теории оценивания как "лемма об ортогональном проецировании", которая будет нам полезна в дальнейшем.
Во-вторых, перенеся в (14.9) вычитаемое в правую часть после применения оператора математического ожидания, полу!им.
Yh‘°ccm(k)Bg(m~k) = B/g(-m) (1411)
keD
- это так называемое уравнение Винера-Хопфа.
Таким образом, импульсная характеристика оптимального линейного восстанавливающего (или квазиоптималъного) фильтра определяется из системы, состоящей из уравнения Винера-Хопфа и ограничений, налагаемых на импульсную характеристику: [ hgoeem (.т ~ т\ т € £),
\keD (14.12)
\heoccm (^) = 9, т £ D
203
Различный вид области D приводит к существенно различным методам решения
системы (14 12), они будут изложены позже А пока определим ошибку восстановления
сигнала оптимальным (квазиоптимальным) линейным фильтром, продолжив
преобразования, входящие в (14 7), с учетом (14.3) и (14 10)
8“
= ^с(п) ’
J,
^'< foeoeem keD
(*)g(” - - E[e(«)/(w)] =
= - к)}-£{e(w)/(h)}= -£{е(л)/(и)}=
keD
J^eoccni _k&D
(14 13)
= E{f2 W]- ~ *)}=
k&D
~ 'EheoecMBfg(.-k) keD
Рассмотрим важный частный случай, когда имеет место упрощенная модель наблюдения с белым шумом, независимым от сигнала
gW=/(«)+X«), Bv{k)=<3;.b(k) (14 14)
и нулевой отсчет импульсной характеристики heoccm(^) не равен нулю, ({о)е£>). В этом
случае
Bg(O=B/(O+»v(A:)=B/(O+^5(A);
Bfg (к) = E{f(n)g(n + к)} = £{/(л)|/(и + i)]+ v(n + fc)} =
= Е {/(«)/(« + *)} + £ {/(и) v(n + А-)} = Bf (к) = Bf (- к)
и из уравнения Винера-Хопфа (14.11) получаем:
(*)кДга “ *)+ CTV5(W “ *)]= BjXm)’ keD
heocctn О') $ f ~ + СГу к^осст 0я ) ~ Bf )
keD
и при т=0 :
^еосст (“ ) + av ^еосст (^) ~ • (14.15)
keD
При этих же условиях выражение (14.13) для ошибки приобретает вид:
~~ ®У ~ t^eoccm ~ ^еосст (^) ’
keD
а после подстановки в него выражения (14.15):
г2 =а;.Лвос.сот(0) (14.16)
Это очень простое соотношение нам будет полезно в дальнейшем.
204
14.2. Оптимальное линейное восстановление сигнала
Пусть на отсчеты импульсной характеристики восстанавливающей ЛПП-системы не наложено никаких ограничений, то есть она может быть отлична от нуля в любой точке. Это значит, что в оценке полезного сигнала будут учтены все наблюдаемые отсчеты (как “прошлые”, так и “будущие”). При этом восстановление, очевидно, будет иаилучшим (оптимальным).
Так как ограничений на heoccm(n) в данном случае нет, то из введенной в предыдущем параграфе системы уравнений (14 12) остается только уравнение Винера-Хопфа, записываемое в виде:
(k)sg (т-к)= B/g (- т). (14.17)
Выражение (14.17) можно интерпретировать как свертку последовательностей, поэтому, переходя к их ^-преобразованиям, получаем
Н еосст )Ф# О — Ф fg ) >
04181
Формула (14.18) задает передаточную функцию искомого оптимального фильтра. Его импульсная характеристика может быть определена отсюда обычным путем через обратное ^-преобразование.
Определим, какую минимальную ошибку восстановления обеспечивает оптимальный фильтр. Для этого можно было бы, конечно, воспользоваться формулой (14.13), полученной в предыдущем параграфе, но в данном случае удобнее и полезнее для анализа сделать иначе Определим сначала корреляционную функцию и энергетический спектр ошибки восстановления:
оО ОО
ВЕ(т) = £'М«)Е(«+ х + + f =
СО СО ОО СО
= heo€cnfa}heoccr>t/№g (л! — / + А:) — fe ^heoccnljfg (^ — /) + В^ (m).
Запишем это же выражение в сокращенной форме, используя оператор свертки.
A;(w) ~ ^eoccn^m} * ^восспк~ ~ ^еосспк~ т) * т)— keoccn/ni} * В(т) + Bj-(rn}. (14.19)
и перейдем к z-преобразованиям последовательностей, входящих в (14.19):
Фе(-) = Яеогси(г)Ятосся^-,)»г(2)-Явосст(г-|^/г^-1)-ЯвОс«и(2)ФА(г)+ф/(2).(14.20)
Выражения (14.19) и (14.20) справедливы для любой восстанавливающей системы, а не
205
только для оптимальной (действительно, мы здесь совсем не налагали ограничении на выбор Конкретно же для оптимального фильтра учтем соотношение (14 18) и получим
или, что удобнее,
восст
(14.21)
Из последней формулы искомую среднеквадратичную ошибку можно вычислить двумя очевидными путями
1 Перейти от z - преобразования (14.21) к самой последовательности (корреляционной функции ошибки)
ЯО
^6 (^ ) = $f ~ ^восст
к=-<х)
и далее при т = 0 получить
со
Е = ^~f ~~ восст ’
к=^с
(последняя формула, кстати, является частичным случаем формулы (14.13));
2. Перейти от z ~ преобразования к энергетическому спектру ошибки восстановления и вычислить саму ошибку через обратное преобразование Фурье.
е2=^-
-л
В общей постановке решение задачи на этом завершается. Более продвинутый результат можно получить, введя дополнительные упрощения.
Рассмотрим частную, но очень распространенную ситуацию восстановления сигнала при линейной модели наблюдения (14.1), когда полезный сигнал и шум статистически независимы. Оптимальный линейный восстанавливающий фильтр для этого случая называется фильтром Винера. Определим его передаточную функцию. Для начала подсчитаем корреляционные функции, входящие в (14.17). Корреляционные функции наблюдаемого сигнала:
СО
)}=^ ^h(k)f(n-k)+v(n)
оо
£Л(/)/(л + т-
х
iss-00/=-00
206
OQ
/=—oo
- /)v(«)}+ E{v(n)v(n + m)} = ^h(k)h(l)Bf(n + m-1)+Bv(m) = k, ——<x>
- Bv(m).
Соответственно, для z-преобразований записанных последовательностей:
ф5(.-)=я(Д//^-')ф/(Д+фг(2) .
(14.22)
Взаимная корреляционная функция полезного и наблюдаемого сигнала получается в результате аналогичных, но более простых преобразований:
со
Я^(ю)«£{/(иЫи + т)}= ^h(k)Bf(m~k)-h(m)^Bf(m) ,
к=-*>
то есть
Подставив (14.22) и (14.23) в (14.18), получаем передаточную функцию фильтра Винера:
.. н(г‘)фД2)
Ивосст г)=-ТГТчГГТГ—7\ (|4:
(в этой формуле дополнительно учтено, что Ф г (г1 )= Ф г (z)).
Фильтр Винера обеспечивает минимальную среднеквадратичную ошибку восстановления сигнала при линейной модели наблюдения и отсутствии корреляции между полезным сигналом и шумом. Энергетический спектр этой ошибки можно найти
подстановкой (14.23) и (14 24) в (14.21):
ФДДФД;)
Я(2)я(г-,)ф/(г)+Фг(2)’
(14.25)
а сама ошибка определяется отсюда известными двумя путями, описанными выше. Рассмотрим некоторые частные случаи применения фильтра Винера.
1. Пусть имеется упрощенная модель наблюдения без “линейных” искажений:
gW= /(*)+v(n). (14.26)
Здесь &(«)= б(п), H(z)~ I и поэтому из (14.24), (14.25) получаем:
Heoecm^=-T-4\zl i V 04.27)
« / \ Фу(~)Ф/(2) ( \тг ( \ /1Л эо\
ФеМ*/ Л / \ / \~ ^v\r)eoccm\-f - (14.28)
Нетрудно заметить, что в данном случае, поскольку Фу(^) = Фу^:-1), Фг(г)= Ф^-1)
207
то и нвосст^)= ^e«cm(z '), а это означает, что Л«х.ст(п) = heoccm(-л) - импульсная характеристика фильтра является четной последовательностью Очевидно, что такой фильтр является физически нереализуемыми за исключением единственного вырожденного случая, о котором пойдет речь позже
2. Пусть кроме того шум - белый, то есть Bv(m) = Оу5(л?)", Фг Ы- av -Тогда из (14 27), (14 28) имеем.
, ч Ф f(z)
нежст^=—^ , (14.29)
Фу(г)+<^
Фе(2) =
руф/СО Ф/СО+Оу
(14.30)
3. Пусть, наконец, и полезный сигнал также является белым шумом (этот вырожденный случай, как мы увидим ниже, имеет определенный практический смысл). Теперь
В/(т)= o}5(m); ф/(г) = а} . (14.31)
и, следовательно,
(14.32)
От (14.31) очень просто перейти во временную область:
и далее записать:
^восст (w) ~ 2 2 $(w) >
Gf +а;
то есть фильтрация заключается в простом умножении наблюдаемого сигнала на коэффициент (это так называемая “точечная” оценка сигнала).
Ошибки восстановления в соответствии с (14.32):
2 2 2 2
5Е(ш) = 4%8(т); ё2 = Ве(о)= , Gj + Gj- + о;
2
о G f
то есть дисперсия входного шума а у здесь умножается на коэффициент —2 -—< I - шум
убывает в максимально достижимой степени.
4. Еще один частный случай - отсутствие шума. При этом из (14.24) получаем:
208
' н М "ИЫ) _ 1 ^-я(г)4-.)ф/(г)-Я(г)
так называемый обратный (инверсный) фильтр В идеале такой фильтр обеспечивает абсолютно точное восстановление сигнала Однако в большинстве практически интересных случаев он, к сожалению, оказывается неустойчивым. При этом бесконечно малым отклонением входного сигнала обратного фильтра могут соответствовать бесконечно большие отклонения выходного сигнала, то есть задача восстановления начинает относиться к числу некорректных. Для получения устойчивого фильтра используется различные методы регуляризации, рассмотрение которых выходит за рамки настоящего учебного пособия
Пример Пусть модель наблюдения сигнала имеет вид (14 26), полезный сигнал имеет экспоненциальную корреляционную функцию:
jByr(m)=.a^pW ,
где р - коэффициент корреляции между сосед ними отсчетами, и наблюдается на фоне белого шума:
б(«).
Определим передаточную функцию фильтра Винера. В данном случае:
а^-(1-р2)
*/(*)=у—Ф„(?)=а^, -|1- р2
и, подставив эти величины в (14.27), после преобразований получаем:
Н восст U) =~2Г-I---------------П ’ (14.33)
</2(1-р2(l + p2j-p(z + Z-]
2 4
где обозначено = —— - отношение сигнал/шум по мощности.
Поскольку фильтр должен быть устойчивым, область сходимости данного z-преобразования должна включать в себя единичную окружность.
Из (14.33), основываясь на свойствах z-преобразования, можно определить импульсную характеристику фильтра Винера:
где
h восст (w) •.
Можно показать, что всегда А > 0 ; |а| < 1.
Фильтр с импульсной характеристикой вида (14.34), очевидно является физически
(14.34)
209
нереализуемым Поэтому вопрос его практического использования пока остается открытым Ответ на него мы получим позже А. пока определим ошибку восстановления. В нашем случае линейных искажений сигнала нет и шум белый, поэтому сразу можно воспользоваться формулой (14 16):
Выражение (14.35) имеет смысл проанализировать При р—>1, то есть при увеличении
2
коррелированност и полезного сигнала, е ->0 и возможность фильтрации шума возрастает При
2 Е2
увеличении отношения сигнал/шум ( d —> =о ) отношение — - > 1. и относительная эффективность
<JV
фильтрации (коэффициент подавления шума) стремится к единице Иллюстрация к сказанному дана на рис. 14.3
Рис, 143. Зависимость качества восстановления от параметров искажения
143. Реализация оптимального фильтра обработкой в прямом и обратном времени
Оптимальный линейный восстанавливающий фильтр, как правило, не отвечает требованию физической реализуемости. Поэтому оценка сигнала (14.2) не может быть вычислена впрямую. Как же практически воспользоваться процедурой оптимального восстановления?
Для этого есть два основных способа. В данном параграфе мы рассмотрим один из них, заключающийся в обработке сигнала в прямом и обратном времени
Этот способ обработки применяется в тех случаях, когда есть возможность сразу ввести в ЭВМ достаточно длинную реализацию сигнала Когда отсчеты последовательности записаны в память компьютера, понятия ‘‘прошлого” и “будущего” становятся условными
210
по сигналу (то есть по массиву отсчетов) можно двигаться как в направлении возрастания аргумента (индекса), то есть в прямом времени, так и в направлении убывания - в обратном времени. Этот факт и позволяет реализовать оптимальный фильтр
Ниже будем считать, что характеристики обрабатываемых сигналов таковы, что передаточная функция оптимального фильтра Heoccm(z) является дробно-рациональной. Она соответствует устойчивой, но физически нереализуемой системе, то есть взаимное расположение полюсов и области сходимости на z-плоскости имеет примерно такой вид, как изображенный на рис. 14.4.
, Im г
Рис, 14,4. Расположение полюсов в устойчивой физически реализуемой системе
Областью сходимости ^восс/л(2) является кольцо, включающее единичную окружность: при/Lcl; /^>1.
Как известно, дробно-рациональную передаточную функцию можно записать через нули и полюсы (см. также п.6.1, формулу (6.10)):
Нвосст^}=А^~---------(14.36)
ш-рл1)
7=1
где А, к - некоторые константы (к - целое). Часть полюсов в (14.36) имеет модуль меньше единицы, а часть - больше единицы. Представим передаточную функцию в следующей форме:
Нвосст (2) = ^еосст (2)^восст (-) > (14.37)
где к сомножителю Н^осст (г) отнесем часть знаменателя с полюсами, лежащими внутри
единичной окружности, а к Неосст(?) ~ с полюсами вне единичной окружности.
211
Распределение нулей и коэффициента Л, в принципе, произвольно. Очевидно^ что здесь мы снова решаем задачу факторизации (см. п.8.4), но уже в более общей, “несимметричной” постановке
Составляющая Н*осст (z) будет иметь область сходимости |г|>Я_ (Я_<1), то есть соответствовать передаточной функции некоторой устойчивой системы Эта система физически реализуема, так как ее импульсная характеристика htoccm W , соответствующая ^-преобразованию Н^осст (-) > является правосторонней последовательностью.
Аналогично, сомножитель Н6Осст (z) в (14 37) имеет область сходимости |г|<Я, (^>1), и соответствует передаточной функции устойчивой системы, реализуемой в обратном времени (ее импульсная характеристика ^восстМ будет левосторонней последовательностью).
Произведение передаточных функций соответствует каскадному (последовательному) соединению систем То есть мы имеем здесь “двухпроходную” процедуру восстановления, заключающуюся в последовательной обработке сигнала в прямом, и затем в обратном времени.
С другой стороны, можно представить передаточную функцию Heoccm(z) в виде суммы, используя разложение (14.36) на простые дроби, л/ (7
----Чг (14.38)
(выражение (14.38) записано для случая правильной дроби и простых полюсов, более общей формулой является (6.34)).
В данном случае получаем
Н еосст (2) ~ Н восст (14.39)
где слагаемые формируются по тому же принципу, что и раньше. Формула (14.39) задает двухпроходную процедуру параллельной обработки сигнала.
Пример В предыдущем параграфе мы получали, что для восстановления сигнала е экспоненциальной автокорреляционная функция из его смеси с независимым белым шумом импульсная характеристика оптимального (винеровского) фильтра имеет вид
где А >0 , |<х| < 1 - величины рассчитываемые через характеристики сигнала и шума
212
Передаточная функция этого фильтра:
11 восст
1 п - - г. -
с полюсами Р2~ Построим двухпроходныи последовательный алгоритм обраоотки.
a
Очевидно, можно принять
И 11 восст
1-az’1
По этим передаточным функциям легко строятся разностные уравнения. На первом шаге обработки (в прямом времени) из искаженного сигнала g(«) получаем промежуточную
последовательность w(n).
На втором шаге обработки (в обратном времени) получаем искомую оценку сигнала
Можно построить и двухпроходный параллельный алгоритм. Для этого, вообще говоря, (z) на простые дроби. Но в данном
нужно разложить передаточную функцию Н6Осст
конкретном случае поступим проще и представим импульсную характеристику фильтра в
следующем виде:
h
‘ ‘восст
+ а и\
то есть
tj
п восст
восст
где
fj-r
Г1 восст
Н восст
Aaz 1-az'1
!___. н-
_) > п восст
w(«) = о, wl
п +
1 1
--------+----
1 - az 1 1" (
~ ri восст
-1-az 1
А 1 -az
В соответствии с полученными соотношениями, при обработке в прямом времени формируется последовательность /+(л):
а при обработке в обратном времени - f (п)
Далее для получения результата восстановления эти последовательности суммируются
7(»)=7+W + .Г(п)-
213
14.4. Реализация оптимального фильтра при помощи ДПФ
Существует ситуация, в которой оптимальный линейный фильтр физически реализуем и притом чрезвычайно прост, это восстановление белого шума на фоне белого шума, сводящееся, как мы видели, к точечной оценке сигнала (14 32) Реальные же сигналы как правило, не являются белым шумом, и в них наблюдается статистическая связь (корреляция) между отсчетами. Если попытаться наилучшим образом использовать эту корреляцию для получения минимальной ошибки восстановления, то мы придем к физически нереализуемому оптимальному линейному фильтру, рассмотренному выше Однако есть и другая возможность построения процедуры оптимального восстановления Можно произвести над сигналом некоторое обратимое преобразование, которое разрушило бы статистическую связь между отсчетами, то есть произвело декорреляцию сигнала. К декоррелированному сигналу можно применить процедуру точечной оценки, которая для такой ситуации является оптимальной. Затем после обратного преобразования получим искомую оценку сигнала.
Оказывается, требуемым декоррелирующим свойством обладает известное нам дискретное преобразование Фурье, задаваемое соотношениями (7 24) для прямого и (7 30) для обратного ДПФ. Рассмотрим более подробно процедуру оптимального восстановления, основанную на ДПФ, на примере, когда имеется модель наблюдения без динамических искажений, заданная соотношением (14.26).
Поскольку ДПФ предполагает работу с последовательностями конечной длины, наблюдаемый сигнал разбивается на отрезки длиной по N отсчетов. Рассмотрим один из таких отрезков при После применения ДПФ к (1426) получаем уравнение
наблюдения для дискретных спектров:
G(m)=F(m)+V(m), 0<m<N-\. (14.40)
Поскольку последовательности в исходной модели наблюдения считаются случайными, их ДПФ тоже являются случайными последовательностями. И для восстановления сигнала нам нужно знать их статистические характеристики.
Далее все количественные соотношения и формулы получим для нашего традиционного примера из п. 14.2 и п. 14.3 будем считать, что экспоненциально коррелированный сигнал наблюдается на фоне белого шума, то есть
Bz(A) = a}pW, (14 41)
Bv(k) = al.5(k). (14 42)
Определим корреляционную функцию ДПФ полезного сигнала По определению, для нестационарной комплексной случайной последовательности ( 0 < £, /< jV-1 )
214
BF(k,/)=£jF(k)F*(/)|, (14.43)
где * -знак комплексного сопряжения Подставив в (14.43) сначала (7.24), а затем (14.41), после выполнения ряда преобразований получаем:
ВМ= Е S’/(₽)»# S' f^WNr‘ [р=0
г=0
}Г~Р\ _
р=0 г=0
p=0 r=0
p~'^ 1
"M i-p-1»^
(1444)
= a}W8(fc-Z)-
L l-P WN
____1_______
p-'^jfl-p^)
9
X
1 - p-4v
Первое слагаемое в (14.44) отлично от нуля только при к - 1, то есть тогда, когда АКФ
превращается в дисперсию. По сравнению с этой дисперсией при »1 вторым слагаемым можно пренебречь, то есть
(14.45)
- единичным импульс с коэффициентом. То есть ДПФ сигнала является дискретным ’’почти” белым шумом. Положив в (14.45) к = / = т определим его дисперсию в каждой точке:
(т) = Вр (т, т ) = ст у- N
P^N l-p-’й^
l-p-’^”
Of N-------) = erJV---------------------------—ч-----
J I 4- 4. W~m I J < 2 <4 2?t
1 + p p Ifr/v + w n ) 1 + p - 2p cos — m
(14.46)
Видно, что дисперсия каждой спектральной компоненты F(ra) зависит от ее номера т,
длины последовательности N и корреляционных свойств сигнала р.
Аналогичным путем можно вычислить и дисперсии ДПФ шума Однако в нашем конкретном случае нет необходимости повторять весь ход преобразований С учетом (14 42) можно, положив в (14.44) р = 0 и заменив индексы сигнала на индексы шума, сразу
получить:
Sp(i,Z) = ZVc;8(ifc-Z)>
- белый шум во временной области переходит в белый же шум в спектральной области В отличии от дисперсии (14.40), дисперсия спектральных компонент шума не зависит от иг
215
<jjz (m) = °и ~ N (14.47)
Таким образом, для модели наблюдения в спектральной области задача сводится к оценке белого шума с дисперсией (14 46) на фоне белого шума с дисперсией (14 47). Восстановление заключается в точечной оценке, то есть в умножении каждого спектрального отсчета на коэффициент Кт :
?(w)= 0<m<N-l, (14.48)
где
_ а^(т) _ ^2(i-p2)
2/^ _2 L _ 2л
-p“J+ (1 +р j-2pcos — т
Далее полученная по (14 48) оценка Б(т) переводится во временную область при помощи обратного ДПФ (7 30) Блок-схема всей процедуры восстановления изображена на рис 14 5
ДО)
^1)
gW)
Рис, 14.5. Блок-схема процедуры восстановления сигнала с использованием ДПФ
Такая процедура восстановления является асимптотически оптимальной при N -> оо . На практике хорошее совпадение получаемой оценки с оптимальной достигается уже при небольших N (как правило, достаточно, чтобы длина ДПФ была больше интервала
1 X корреляции сигнала N >---).
1-р
14.5. Восстановление сигнала физически реализуемым БИХ-фильтром
Рассмотренные выше способы реализации оптимального фильтра позволяют на практике воспользоваться результатами теории оптимального восстановления сигналов. Однако в некоторых случаях эти способы все же оказываются неприменимы. Например, при обработке сигналов в темпе процессов измерений не всегда имеется возможность
216
обрабатывать его в “обратном"’ времени. Использование ДПФ при больших оказывается для некоторых применений чрезмерно сложным, несмотря на наличие быстрых алгоритмов преобразования. В этой связи наряду с оптимальными фильтрами получили распространение су б оптимальные (квазиоптимальные) процедуры восстановления, имеющие более простую реализацию
Ниже рассмотрим восстановление сигнала БИХ-фильтром с импульсной характеристикой, удовлетворяющей условию.
^осс/и(л)=° ПРИ n<N} . (14 49)
Если отсчеты этой импульсной характеристики выбраны исходя из минимизации ошибки восстановления (14 4), то такой фильтр называется физически реализуемым оптимальным фильтром или, в случае независимости сигнала и шума в модели наблюдения, физически реализуемым фильтром Винера Очевидно, что он будет работать несколько хуже, чем оптимальная восстанавливающая система, так как на часть отсчетов heftrcm(n} наложено сформулированное выше ограничение.
В зависимости от значения постоянной в условии (14.49) здесь возможны
Рис, 14.6. Различные варианты квазиоптимального восстанавливающего БИХ-филътра
В первом случае осуществляется восстановление без задержки, оценка строится на основании наблюдаемого сигнала в текущий и предыдущие моменты времени Во втором случае (рис. 14.66) восстановление производится только по “прошлым” значениям наблюдаемого (искаженного) сигнала, то есть имеет место предсказание (экстраполяция) сигнала. В третьем случае (рис. 14 6 в) фильтр является уже физически нереализуемым, здесь восстановление производится с учетом некоторого числа “будущих” отсчетов сигнала. Такой фильтр может был» сведен к физически реализуемому, если допустить задержку в получении выходного сигнала. Здесь мы имеем процедуру восстановления с задержкой (интерполяции).
Ниже мы ограничимся рассмотрением только первого случая.
Итак, построим физически реализуемый БИХ-фильтр, осуществляющий оптимальное (квазиоптимальное) восстановление сигнала без задержки. Для него с учетом (14 49) система
217
уравнений (14.12) может быть переписана в более конкретном виде: оэ
. £h,occm(k)Bg(m-k)=Bfg(-ni) т > 0, (14 50)
^еосст G”) т < 0-
Рассмотрим сначала простой (но далекий от практики) случай, когда искаженный сигнал g(n) является белым шумом с единичной дисперсией
Z?^(w)=5(w), (14.51)
то есть представляет собой последовательность из некоррелированных отсчетов. Тогда, подставив (14.51) в (14.50), сразу получаем:
/ \ f & fo т - о,
heOceM= 7 ’ (14.52)
(0 т < 0
Соответственно, передаточная функция искомого фильтра.
(14 53)
т=0
Здесь необходимо сделать небольшое отступление и ввести понятие (и обозначение) "реализуемой части последовательности" (или ее z-преобразования). Для произвольной последовательности {/'
[/(«)]«= /(”)“(”). (14 54)
ЖЯ= Ь(4г'"=Ь(<". <14-55)
Л~-ао П=0
Если известно z-преобразование F(z), то [?’(г)]Л можно найти двумя способами:
1. Первый способ универсален, но всегда удобен в практическом применении. В соответствии с ним нужно взять обратное z-преобразование, полученную последовательность умножить на функцию единичного скачка (выполнить операцию (14 54)), и затем снова взять z - преобразование (выполнить (14.55)).
2. Второй способ специфичен для дробно-рациональных z- преобразований. Если F(z} -такое z-преобразование, сходящееся в кольце
то можно вычислить реализуемую часть, разложив его на простые дроби. Действительно, в общем случае (см. формулу (6.34)):
Nf г
Z/ -%
к I у-1 fa — pi z J
218
где к, I - индексы, принадлежащие некоторым конечным множествам, по которым производится суммирование, р/ - полюсы кратности Nj. Реализуемая часть получится, если взять из этого разложения только те слагаемые, которые соответствуют последовательностям, отличным от нуля при п > О
N/ Г*
т=х^^+ х X/--у7 и.
к>0 l]Pl\<R-J=^-pt2 7
- то есть часть дельта-импульсов и правосторонние экспоненты.
Итак, возвращаясь к задаче восстановления, если наблюдаемый сигнал g(n) - белый шум с единичной дисперсией, то характеристики оптимального БИХ-фильтр а, заданные соотношениями (14 52) и (14.53), могут быть записаны в форме:
heOccm{n)=\Bfg{-n)\R . (14.56)
fI4 57)
На практике, как уже говорилось, наблюдаемый сигнал #(и) не является белым шумом Но мы можем превратить его в таковой, пропустив через специально рассчитанную ЛПП-систему - “отбеливающий” фипыпр. При этом вся процедура восстановления приобретает вид, показанный на рис. 14.7, то есть будет представлять собой последовательное соединение отбеливающего и восстанавливающего фильтров.
§(») . Отбеливающий фильтр Восстанавливающий фильтр для некоррелированных наблюдений
Рис. 14,7. Физически-реализуемый оптимальный восстанавливающий фильтр
Пусть Нотв(у) “ передаточная функция отбеливающего фильтра, a w(n) -
последовательность на его выходе. Тогда:
Я4ОССЯ1(Л=• (1458)
Выразим входящие в (14 58) z-преобразования через известные нам характеристики. Во-первых, определим передаточную функцию отбеливающего фильтра. По смыслу его применения, должно быть или
Н отб (г)Нотб^ ф *(г). (14.59)
219
Здесь необходимо решить задачу факторизации функции Ф„(д) (см п 8.4), то есть о
представить ее в виде
Ф.(:)=фД:)ф*(г-1), (14.60)
где Ф (д) - передаточная функция физически реализуемой ЛПП - системы, имеющая нули расположенные внутри единичной окружности. Последнее требование обусловлено тем, что из (14 59) и (14.60) мы получаем:
(1461)
и упомянутые нули (ставшие теперь полюсами) обеспечат устойчивость отбеливающего фильтра.
Во-вторых, вычислим взаимный энергетический спектр последовательностей на входе и на выходе второго блока процедуры, показанной на рнс. 14.7. В соответствии с (8 34) и (14.61),
ФА(2) = Ф/г(г)йоибМ = ^^ (14.62)
фДг)
Подставив (14 61) и (14 62) в (14.58), окончательно получаем'
Пример. Построим физически реализуемый восстанавливающий БИХ-фильтр для экспоненциального коррелированного сигнала, искаженного статистически независимым белым шумом, то есть для модели наблюдения (14 26).
В силу независимости последовательностей в модели наблюдения имеем: Bg(m)= Bv(m).
Отсюда, переходя kz- преобразованиям, получаем:
сгЛ-Р . . -+a-|z + z J
T + ----7-----V |р|<И<П •
(1-pz 71-pz) l.„ L..-п |pi
p где значение параметра а определяется из уравнения
1 1 0
— + a = a — р + — + р a <р J
с условием a| < 1. Решение этого уравнения дает:
(14.64)
(14.65)
220
Формулу (14.64) можно представить в виде "симметричных" сомножителей:
фг(4=<^£
s а
1 - ад
1-pz
после чего решение задачи факторизации становится очевидным
Ф1(г)=<1^-ау1 |р|<!- (14.66)
к Va l-pz 1
Передаточная функция (14.61) отбеливающего фильтра здесь равна
Нотб= “7S= ' । P'~-i ’ W> '
ф^(2) -уР °v l-az
Далее определим взаимный энергетический спектр последовательностей:
фл(г)°фЛН v
^1-pz д1-рг) |Р|
и физически реализуемую часть z~ преобразования, входящую как сомножитель в формулу (14.63):
Для отыскания реализуемой части разложим z-преобразование (14.67) на простые дроби (при
(14.67)
этом коэффициент пока оставим в стороне), а область сходимости будем указывать непосредственно
под формулами:
1 = 1 1 1 1
(1 pz-1)[l-az) 1“«Р 1-pz"1 l-apj.lz-l
|p|<W<|3 kW |Z|“W
Реализуемой части соответствует первое слагаемое, то есть с учетом коэффициента в (14 67) имеем:
Передаточная функция всего восстанавливающего фильтра получается подстановкой (14.66) и
(14.68) в (14 63)
7pav(l-ap) 1-pz
(14.69)
С
где на последнем шаге обозначено С = ^——<-—г-, a - определяется соотношением (14 65). Из р(1-ар)
(14.69) легко строится разностное уравнение, задающее рекуррентный алгоритм фильтрации сигнала:
/(л) = а/(и-1) + Cg(w). (14.70)
221
Простая структурная схема ЛПП - системы, соответствующей уравнению (14 70), показана на рис. 14.8.
Ри с. 14.8. Структурная схема ЛПП - систем ы, реализующей рекуррентное восстановление сигнала
Импульсная характеристика восстанавливающего ЬИХ-фильтра: ^восст (w)C(i. .
В соответствии с формулой (14.16) ошибка восстановления сигнала здесь равна:
14.6. Восстановление сигнала КИХ-филь трем
Построим теперь квазиоптимальный восстанавливающий КИХ-фильтр. В этом случае за оценку сигнала f(n) принимается взвешенная сумма конечного числа отсчетов наблюдаемого сигнала g(w), то есть здесь оценка строится нерекурсивно, как результат непосредственного вычисления свертки:
У'^восст (k)g(n-k), (14.71)
k&D
где D - конечное множество отсчетов, задающее “окно” обработки.
Выбрав область D вокруг восстанавливаемого отсчета достаточно большого размера и рассчитав оптимальные коэффициенты КИХ-фильтра, можно получить среднеквадратичную погрешность восстановления, очень близкую к минимально достижимой, обеспечиваемой оптимальным физически нереализуемым линейным фильтром. Более того, даже при относительно небольших размерах окна обработки ошибка получается, как правило, меньше, чем у физически реализуемого восстанавливающего БИХ-фильтра. Это происходит благодаря тому, что в данном случае формируется “двусторонняя” (интерполяционная) оценка, в которой учтены не только “прошлые”, но и некоторое число 1 будущих” отсчетов наблюдаемого сигнала Естественно, в этом случае восстановление реализуется с некоторой задержкой
Задача синтеза квазиоптимального восстанавливающего КИХ-фильтра заключается в
222
определении значений heoccm(n) в пределах окна обработки, обеспечивающих минимум среднеквадратичной ошибки восстановления Как и ранее, они определяются из системы уравнений (14 12). Отличие от предыдущих случаев состоит в том, что теперь область D содержит конечное число элементов - Ау) . Поэтому уравнение Винера-Хопфа (первая строка системы (14.12)) определяет систему из линейных алгебраических уравнений с таким же числом неизвестных - значений искомой импульсной характеристики. Методы решений таких систем хорошо известны.
Пример. Построим простейший КИХ-фильтр вида (14 71) - процедуру восстановления сигнала по трем точкам
1 восст ~ ^)~ ^восст^— восст ” О
*=-1 для экспоненциально коррелированного сигнала, искаженного статически независимым белым шумом (для модели наблюдения (14.26)). Здесь D - {-1,0,1}. Из уравнения Винера-Хопфа получаем:
при w - -1 при т = О
при т = 1
( 1)^вОСС?Л (о)+В?(-2)й
восст
4 Bg (1) heoccfn (— 1) + Вg восст (0 + &g (~ О восст (0 = & fg СД
5g восст (— 0+вг(1)лвосст (o)+Bg(o)h
восст (1)=5^(-1}
В данном случае
5g (т) ~ В j- (те) + Bv {tn}~a2j. + a J 8(те),
5/(-те)-5у(те> cj.pl'”’ , поэтому записанная система уравнений конкретизируется:
f + \ )^soc<7tt (” 0 + G f Р восст (О) + в у Р восст 0 ) ~ 0 у Р>
) ® у Р ^восст (“О'*" у + ° v ^восстп (^) + у Р восст (0 — ® у »
у Р hвосст (0 + у Р Ьвосст (^) + (^у + ® v j^eoccm (0 — ® у Р-
Решение системы (14.72) имеет вид:
(14.72)
hвосст ~
? f
где, как и раньше, использовано обозначение d -ov
Полученный КИХ-фильтр может быть реализован с задер/ккой на один шаг в форме прямой свертки так, как показано на рис. 14 9
223
Рис. 14.9. КИХ-филътр, реализованный в форме прямой свертки с задержками
Ошибка восстановления сигнала здесь опять определяется по формуле (14 16).
£“ Ov ^восст 0)— с v z \z \
, 1 II i 1 2-1
1 + ~У 1 + ~2+Р Г2р
I d2 Л d2 J
Достоинство нерекурсивных процедур восстановления состоит в простоте их расчета. Для построения восстанавливающего КИХ-фильтра достаточно решить систему линейных уравнений, а не решать сложную задачу факторизации энергетических спектров. Кроме того, как уже отмечалось, КИХ-фильтр может обеспечить качество восстановления более близкое к оптимальному чем физически реализуемый винеровский фильтр.
Еще одно достоинство заключается в том, что данная методика расчета процедур восстановления легко обобщается на случай обработки многомерных сигналов.
224
15. НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ
Линейная фильтрация очень широко используется при устранении шумов на изображениях Линейные КИХ-фильтры достаточно эффективны в вычислительном отношении и просты в реализации Однако в приложении к цифровым изображениям они обладает рядом существенных недостатков: размывают границы и могут уничтожать мелкодетальные особенности изображения.
Эффект размывания границ может быть существенно снижен при использовании нелинейных фильтров Наиболее простым примером является метод медианной фильтрации.
15.1, Медианная фильтрация
Этот метод нелинейной обработки сигналов, разработанный Тьюки оказывается очень полезным при подавлении шума, то есть в случае, если имеет место простая модель наблюдения
g(«b«2)=/(«b«2)+u(wbw2)-
Причем, он особенно эффективен, если шум и - импульсный (а не стационарный флуктуационный), то есть представляет собой некоторый набор (поток) больших значений на фоне нулей.
Метод очень прост, не требует настройки (является непараметрическим) и поэтому получил широкое распространение. Медианный фильтр реализуется как процедура локальной обработки скользящим окном различной формы (рис. 15.1), которое включает некоторое нечетное число отсчетов изображения (обозначим количество отсчетов в скользящем окне через АО-
Процедура обработки заключается в том, что для каждого положения окна попавшие в него отсчеты упорядочиваются по возрастанию (или убыванию) значений - строится так называемые вариационный ряд значений. Средний отсчет в этом упорядоченном списке , . xr N-]
называется медианои рассматриваемой группы из N отсчетов, для него существует
отсчетов, меньших или равных ему по величине и столько же больших или равных. Эта медиана заменяет центральный отсчет в окне для обработанного сигнала.
В результате применения медианного фильтра наклонные участки и резкие перепады (скачки) значений яркости на изображениях не изменяются, это очень полезное свойство именно для изображений, на которых, как известно, много контуров (ступенчатых границ функции яркости). В то же время импульсные помехи, длительность которых составляет менее половины окна будут подавлены. Чем больше окно, тем более крупные детали будут стираться (рис 15.2).
225
Рис. 15.2. Примеры обработки медианным фильтром с различными окнами
Возможны различные стратегии медианного фильтра для подавления помех Одна из них рекомендует начинать с минимального окна Если изменение изображения незначительно, то окно расширяется, и так до тех пор, пока фильтрация не начнет приносить больше вреда, чем пользы (“съедать” заведомо полезные детали) Другая возможность заключается в каскадной обработке изображения одним и тем же фильтром Следует заметить, что те области, которые остались без изменения на данном шаге каскадной обработки, не будут меняться и в дальнейшем, то есть в процессе фильтрации изображения постепенно стабилизируется.
Существует много модификаций медианных фильтров, как одномерных, так и двумерных. Отметим одну из них. Взвешенный медианный фильтр отличается от простого тем, что при построении таблицы упорядоченных отсчетов каждый отсчет берется не одни раз, а столько, сколько указано его “весом” в окне. Например, для окна 3x3 можно задать веса:
1 1 1
1 3 1
1 1 1
(теперь таблица будет составляться из 11 чисел).
Результат обработки таким фильтром изображения из предыдущего примера выглядит так, как показано на рис 15.3, то есть представляет собой нечто среднее между полученными ранее результатами
Веса (целочисленные) должны удовлетворять двум условиям:
226
• их сумма должна быть нечетной (для возможности выбора медианы),
• каждый вес должен быть меньше половины суммы (иначе применение фильтра
бессмысленно)
Очевидно, метод медианной фильтрации является эвристическим. Он предполагает использование интерактивных систем обработки изображений, когда пользователь осуществляет экспериментальный подбор окна и текущий контроль за результатами обработки. Теоретическому анализу медианные фильтры почти не поддаются.
X X X
X X X
X X X
X X X
X X X
X X X
Рис. 15.3. Результат реализации взвешенного медианного фильтра
Что касается качества их работы, то экспериментально установлена их относительно слабая эффективность при фильтрации флуктуационного (например, нормального белого) шума. Лучший эффект они дают при обработке изображений, искаженных импульсными помехами, помехами типа “царапин”, сбойных строк, “штрихов” и т.п.
При равной среднеквадратичной погрешности восстановления изображение, обработанное медианным фильтром визуально воспринимается лучше, чем изображение, отфильтрованное линейными методами, так как в данном случае сохраняются контуры и границы областей
15.2. Адаптивные фильтры
Для сохранения контуров и границ объектов на изображении при фильтрации флуктуационного шума широко используют адаптивные фильтры с конечной импульсной характеристикой. Термин "адаптивный” означает то, что коэффициенты импульсной характеристики фильтра изменяются в соответствии со структурой обрабатываемого изображения В общем случае большинство адаптивных фильтров реализуют локальную обработку вида
g("l.»2)=^7 f(kx,k2),
где коэффициенты фильтра зависят от значений функции яркости
изображения в 11 скользящем окне” с центром в точке (п^пэ), Н - нормализующий
коэффициент фильтра.
227
Например, коэффициенты фильтра можно определить как , п2 Л i >*2) =1 “ |/(«1 > п1) “ *21 >
при этом нормализующий коэффициент
<*1-*а)еО(и|.и2)
Более простой вариант формирует маску фильтра следующим образом
' I И J1 если inl,n2,kl,k2)=\
[О иначе
где у - константа, выбираемая пользователем, или стандартное отклонение значений яркости в скользящем окне или на всем изображении
Это очень напоминает другую распространенную процедуру, реализующую а -фильтр, которая выполняет взвешенное усреднение только тех отсчетов в окне, чье значение не слишком сильно отличается от значения яркости центрального пиксела обрабатываемого окна g(«b«2)= Лк(кх,к2)-f{kx,k2),
(kt ,к2 )еО(п^ ,п2)
где обрабатываемая окрестность формируется следующим образом
а коэффициенты фильтра реализуют либо стандартное усреднение, либо гауссовский фильтр.
Другой пример - фильтр Ли. При его реализации выполняется оценка локального среднего и дисперсии <t2(«i,w2) значений яркости изображения, расположенных в
текущем окне D(nhи2) размера N = (2«j + 1Х2л2 + 0 Выходное значение фильтра
формируется следующим образом
м(”1,«2)> “(«1>и2) =
шах< 0, °
a2(nbn2) ,
где oj - оценка дисперсии шума на обрабатываемом изображении. Если о(«1,И2)» а„, то а(и|,л2)«1 и g(nb«2)= /(л1>и2), т0 есть никаких изменений не происходит, но если а(и1,л2)«, то а(и1л2) = 0 и g(«],«2)= Таким образом, фильтр выполняет
сглаживание лишь тогда, когда сигнал слабо отличается от шума, и оставляет значения яркости неизменными когда обнаруживается наличие сильного сигнала Основным недостатком этого фильтра является то, что в окрестностях контуров, границ объектов и других деталей изображения шум не устраняется
228
15.3. Ранговая обработка изображений
После медианных фильтров будет совсем несложно понять принцип действия ранговых Это существенно более широкий класс процедур, куда медианная фильтрация входит как частный случай. Понятие ранговой обработки введено совсем недавно (уже в 80-х годах), хотя многие давно известные алгоритмы можно интерпретировать как ранговые. Причем фильтрация и восстановление сигналов это лишь одна из задач, которые решаются при помощи ранговой обработки. Среди других можно назвать препарирование изображений, выделение областей заданной геометрии, анализ статистических характеристик изображений и т.д Тем не менее фильтрация - важнейшее приложение ранговых фильтров, поэтому они и рассматриваются в данном разделе
Чтобы не быть жестко привязанными к задаче фильтрации, мы далее вернемся к “традиционным” обозначениям и будем считать, что/- входной сигнал, g - выходной, то есть идет преобразование / —> g (а не g —> f , как при восстановлении)
Также как медианные фильтры и многие другие известные нам процедуры обработки изображений, ранговые фильтры реализуют обработку “скользящим окном”:
g("|."2 ) = ф[{/(”1 + *1>«2 +i2)l (il.^)s£l]>
где Ф - оператор преобразования отсчетов входного сигнала {/},
D - “окно” определенное относительно начала координат.
Принцип действия (и идея) ранговой обработки заключается в том, что для каждого положения окна (то есть для фиксированных значений («],«2)) строится и анализируется
вариационный ряд по отсчетам, попадающим в окно.
Рис. 15.4 Вариационный ряд бинарного изображения
Вариационным рядом
совокупности из N чисел {/} называется последовательность , в которой эти числа упорядочены по неубыванию
/1 h /з - • • fN Конкретное значение индекса г (порядковый номер числа fr в
вариационном ряду) называется рангом, а само это число г - порядковой статистикой (или статистикой порядка г).
Итак, для ранговых алгоритмов нелинейный оператор преобразования Ф строится через вариационный ряд отсчетов в окне D'
229
g(«l .«2 ) = Ф1(Л(''|.«2 ))X1 J»
где )} " вариационный ряд для положения окна с центром в точке при
котором формируется выходное значение g(npny), число отсчетов в окне D
Ниже, учитывая, что для всех (п1}и2) обработка ведется одинаково, аргументы мы писать не будем. Пределы индексации вариационного ряда тоже очевидны (1 < г < N )> поэтому опустим и их Таким образом, будем использовать краткую запись:
g = Ф[{/гЯ
Приведем примеры простейших ранговых фильтров
Пример 1. Медианный фильтр в терминах ранговой обработки записывается в виде
g = /.v+i ,приЛГ-нечетном.
2
Пример 2 Пусть обрабатываются бинарные изображения. В вариационном ряду будут- только два значения порядковых статистик
Тогда могут быть определены следующие операции:
эрозия- g = Л ,
дилатация: g = fy .
Те же операции на полутоновом изображении дадут выделение, соответственно наименьшего и наибольшего отсчета в окне (эта операция тоже может быть полезна).
Очевидно, для приведенных примеров можно построить один универсальный фильтр g = /r , где ранг г задается в виде параметра.
Пример 3. Подчеркивание контуров.
g = fN ~fl
На участках без контуров (с малыми вариациями яркости) значение g будет близко к нулю, а на участках со скачком яркости произойдет выделение перепада (рис. 15.5).
а) исходный сигнал; Ь) выделенный контур.
Из других видов формирования отсчета выходного сигнала по вариационному ряду отметим его (ряда) усреднение:
230
1 v
r=l
Пока это не имеет явного смысла (усреднение по вариационному ряду дает тот же результат, что и простое усреднение отсчетов по окну), но при дальнейшем изложении мы увидим ситуацию, когда выполнение этой операции будет оправдано
Далее, во многих случаях полезно принимать во внимание и значение центрального отсчета входного сигнала - Мы его для кратности обозначим , тогда ранговый
фильтр запишется в общем виде.
g =ф[У). Л)]
Указание значения центрального отсчета дает возможность построить многочисленные
новые процедуры обработки (или переосмыслить известные с точки зрения “ранговостн”)
Пример 4 Экстремальный фильтр*
/|
S=U
при
при /о- fl^fN ~fo-
Выходной отсчет будет максимальным или минимальным в окне в зависимости от того, к чему
ближе центральный отсчет в окне. Зачем нужен такой фильтр? Рассмотрим одномерную иллюстрацию (рис. 15 6).
Рис. 15.6. Иллюстрация работы экстремального фильтра
Вспомним, при пороговой обработке была проблема с выбором порога из-за размытости мод (Рис. 15.7а). После многократной экстремальной фильтрации "промежуточные” значения исчезнут, и моды станут четче (Рис.15.76). Теперь neine выбрать порог (можно взять любое значение между модами)
Кроме того, при многократной экстремальной фильтрации изображение стремится к кусочно-постоянному, на нем выделяются однородные области. А это решение задачи сегментации, которая часто возникает при распознавании объектов (и анализе сцен).
И. наконец, приведенный пример показывает, что такой обработкой можно повысить резкость и улучшить качество изображений, так как снимаются динамические искажения функции яркости
(происходит восстановление исходного изображения из рас фокусированного в предположении, что
исходное - кусочно постоянное).
Правда, экстремальный фильтр в описанном варианте все перечисленные задачи решает не очень качественно: на результат сильно влияют шумы Его достоинство одно - простота
231
Рис. 15.7. Пример использования экстремального фильтра: а) распред едение значений исходного сигнала; б) распределение значений преобразованного сигнала.
Прежде чем двигаться дальше, сделаем одно важное отступление. Построение вариационного ряда для большого размера окна является трудоемкой процедурой. Тем более, что ее надо выполнять для каждого положения окна (то есть для каждого отсчета выходного сигнала). Если делать это через традиционную сортировку, то сложность
'У
вычислении будет примерно пропорциональна Однако есть другой путь реализации рангового алгоритма, обходящий указанную трудность Он основан на следующем факте: вариационный ряд целочисленных (квантовых по уровню) отсчетов взаимнооднозначно связан с локальной гистограммой (распределением) отсчетов в окне Данное утверждение иллюстрируется на рис. 15.8.
Рис. 15.8. Пример соответствия вариационного ряда и гистограммы
Гистограмму при движении окна можно вычислять рекурсивно и, следовательно, быстро и без зависимости сложности от размеров окна N.
Связь вариационного ряда и гистограммы полезна не только в ''технологическом” смысле, то есть для упрощения вычислений. Не менее важно, что, имея эту связь в виду,
232
можно интерпретировать в ранговой форме те процедуры обработки изображения, которые традиционно основывались на анализе распределения яркости. Продолжим примеры.
Пример 5 Скользящая эквализация изображений.
В ”поэлементных преобразованиях" мы говорили об эквализации изображений, при которой значение яркости делались равномерными в некотором диапазоне [g^ gmax] Ранее отмечалось, что такая эквализация может быть адаптивной и, в частности, скользящей. Оказываегся, это тоже ранговая процедура Действительно, для эквализации выполняется поэлементное преобразование вида:
8 ~ (gmax — grain gmin >
где Р(/о) - интегральная функция распределения отсчетов в окне.
Интегральная функция, будучи умноженной на JV, показывает число отсчетов, не превышающих /0 , то есть ранг отсчета /0 , его положение в вариационном ряду
Az -/’Oo)~r/o ' где г* " ФУНК1^ИЯ обратная fr .
То есть
ffmax ~ grain .
$ у /о g •
Вернемся теперь к задаче фильтрации. Пусть обрабатываемое изображение искажено шумом Можно предположить, что наиболее искаженные отсчеты (то есть отсчеты, наиболее отличающиеся от среднего), будут располагаться по краям вариационного ряда, полученного по окну. Средняя часть ряда будет характеризовать полезный (медленно и мало меняющейся) сигнал. Для достижения эффекта фильтрации, прежде чем формировать выходное значение из вариационного ряда, полезно отбросить в нем шумовые "хвосты". Или, что эквивалентно, выделить в нем центральную часть. Обычно выделяемая часть вариационного ряда строится как некоторая окрестность вокруг отсчета с заданным значением с. В качестве центра окрестности обычно берут:
входной центральный отсчет с =
медиану- c = fN+]
ПГ
среднее значение - с = и т.п.
Причем, в литературе выделяется три основных типа окрестностей. Для их пояснения воспользуемся рисунком рис 15 9 (на рисунке окрестность строится строго вокруг некоторого отсчета со значением с)
1) Окрестность по значениям определяется неравенством:
2) Окрестность по рангам
233
rc - er < r < rc +
3) Окрестность no К- ближайшим соседям
min max |c-/r[ rc -k<p<rc p<r<p+k
- отбираются Hl отсчетов в вариационном ряде начиная с номера р^ . Обозначим операторы выделения окрестностей (то есть формирования ’’укороченного" вариационного ряда следующим образом
для окрестности по значениям:
j~ Z)x[{xr},£x,c] , для окрестности по рангам:
j—Z)r ), Бг , с] ,
для окрестности по К ближайшим соседям:
(причем будем считать, что у усеченного ряда ранги уже перенумерованы: 1 < г < N*,N* < N ).
Рис. 15.9. Основные типы окрестностей в вариационном ряду
В различных ситуациях предпочтителен разный тип окрестности. Выбор окрестности по значениям позволяет учесть при обработке априорную информацию о величинах скачков на изображении, дисперсии шума и, напрнмер, отбросить отсчеты слишком далекие от /д
Окрестность по рангам полезна при фильтрации импульсных помех. Окрестность по К соседям позволяет использовать при обработке фиксированное число отсчетов (то есть ориентироваться на детали определенной площади). Есть и реализационные различия Окрестность по значениям проще всего определяется по гистограмме Окрестность по
234
рангам - по вариационному ряду Окрестность по К - ближайшим соседям определяется наиболее неудобно в любом случае.
После выделения окрестности получаем более короткий вариационный ряд С ним можно проделывать те же операции, что и с полным вариационным рядом: формировать выходное значение, еще раз выделять окрестность другого типа и т.д.
Пример 6. В 1978 г. Розенфельц описал алгоритм сглаживания по К соседям, который в наших обозначениях запишется в виде:
g = E{DKl{frVj0]]
- то есть за центр окрестности принимается значение центрального отсчета в окне
Такой фильтр оказался очень эффективен для сглаживания шума на кусочно-постоя иных изображениях, т к. он усредняет шум по близким +1) отсчетам и при этом не искажает перепады (скачки) яркости.
Пример 7. В 1983 году Ли (Lee, США) опубликовал статью о сигма-филътпре^ работающем по правилу:
(здесь а - то же, что выше обозначало ех ).
При надлежащем выборе ширины окрестности сигма-фильтр хорошо фильтрует шумы и, кроме того, подобно экстремальному фильтру приближает изображение к кусочно-постоянному.
Описанные фильтры могут быть применены многократно до получения требуемого результата.
Существует масса других процедур ранговой обработки, на которых мы не останавливаемся. В завершение краткого обзора можно сказать следующее. Каждый конкретный фильтр, мог бы быть построен с упрощением Например, для экстремального можно было бы сразу находить максимум и минимум из отсчетов в окне. Для сигма-фильтра можно проводить усреднение непосредственно по отсчетам (с отбрасыванием данных по значениям). Однако унификация подхода полезна тем, что позволяет создать небольшое число простых блоков (аппаратных или программных) обработки и составить процедуры сочетанием этих блоков. Для этого необходимо реализовать следующие процедуры:
• построение вариационного ряда
• выделение окрестности одного из типов
• извлечение характеристики вариационного ряда: порядковой статистики, ранга гх , усреднение.
Все остальные процедуры обработки достигаются их сочетаниями. Если учесть еще возможность исследования разных окон и комбинирование с линейными и поэлементными преобразованиями, то очевидны большие возможности ранговых алгоритмов при решении самих разных задач обработки изображений
235
16. ИЗМЕРЕНИЕ ГЕОМЕТРИЧЕСКИХ ХАРАКТЕРИСТИК ОБЪЕКТОВ
Задача измерений на изображениях заключается в получении по имеющимся видеоданным некоторых количественных параметров, характеризующих либо изображение в целом, либо отдельные изображенные объекты (области)
Класс таких задач очень широк:
- оценка статистических характеристик изображений, то есть построение и уточнение математической модели двумерного сигнала,
- обнаружение объектов и измерение их координат, измерение геометрических параметров объектов и т д.
Рассмотрим последнюю из перечисленных задач, традиционно представляющую наибольший интерес в практических приложениях. Она заключается в определении тех или иных параметров, характеризующих ''геометрию" изображенных объектов: размеры, положение, ориентацию и т.д.
Постановка задачи такова.
Пусть имеется изображение, описываемое моделью 'рассеивания, то есть содержащее некоторую совокупность объектов на однородном фоне. Без потери общности можно считать, что изображение бинарное (рис. 16.1), то есть значения отсчетов, соответствующих объектам, равны единице, а отсчеты фона имеют нулевые значения . Полутоновое % изображение всегда может быть приведено к бинарному в результате пороговой обработки.
Рис. 16.1. Пример изображения с объектами
Требуется определить общее число объектов (частиц), их площадь, центры тяжести, поперечные размеры и т.д. Эти параметры объектов могут представлять самостоятельный интерес и использоваться в виде списка значений или гистограммы распределения, а могут служить признаками (или "сырьем” для формирования признаков) для автоматической классификации (распознавания) объектов
Анализ поставленной задачи показывает, что многие параметры объектов могут быть
236
определены с помощью одного и того же универсального алгоритма обработки бинарного изображения. При использовании этого алгоритма все искомые параметры определяются за один проход по изображению, например, при его построчной развертке
Опишем данный алгоритм измерения геометрических характеристик объектов на примере определения площадей объектов (это наиболее простой случай) Будем считать, что площадь - это число отсчетов, принадлежащих объекту, то есть каждый отсчет представляет собой квадрат единичной площади (рис. 16.2) Объект определяется по критерию четырехсвязности.
Рис. 16.2. Иллюстрация к определению площади объекта
Пусть прямоугольная матрица отсчетов обрабатывается в порядке построчной развертки, то есть слева иаправо в строке и сверху вниз) по строкам. Рассмотрим произвольный отсчет f(n},и2) > не принадлежащей первой строке и левому столбцу матрицы (обработку граничных отсчетов рассмотрим позднее).
Если /(«1^2)-0, то есть отсчет принадлежит фону, то осуществляется переход к следующему отсчету
Если /(^1, п2) = 1, то выполняется анализ принадлежности текущего отсчета. Для этого дополнительно рассматриваются два соседних уже отработанных отсчета: /(и1~1,и2)и
Если /(я]-1,л2)= /(«],и2-1)=0, то текущей отсчет /(и^аъ) представляет собой начальную точку новой области (новый объект). К таблице характеристик областей (в рассматриваемом примере - площадей) добавляется строка этой области, и в нее заносится начальное значение характеристики (для площади - единица)
Если /(иьп2 -1)=1 -1, я2) = 0, то отсчет присоединяется к области, к которой
принадлежит соседний по горизонтали единичный отсчет (/(«|,и2-1)), пересчитывается характеристика этой области (прибавляется единица к площади).
Если /(и1>Л2-1)=0 и /(«! -1, и2 )= 1, то такое же действие выполняется по
237
отношению к области, к которой принадлежит отсчет /(nj - кч2)
Если j\nbn2 -1)= /(«1 - l,n2)~ 1 , то анализируются области принадлежности отсчетов
В случае, если оба соседних отсчета принадлежат одной области, то выполняется присоединение к ней, как в двух предыдущих случаях
В случае, если эти отсчеты принадлежат разным областям, то эти области, а также текущей отсчет объединяются в одну область, характеристики областей пересчитываются в общую характеристику (площади суммируются и прибавляется единица, чтобы учесть и текущий отсчет).
Все сказанное можно проиллюстрировать следующей блок-схемой, представленной на рис. 16.3.
Рис.16.3. Схема алгоритма расчета геометрических характеристик на изображении
Обработка по приведенной схеме выполняется для всех отсчетов, не принадлежащих верхней строке и левому столбцу изображения Обработка граничных отсчетов ведется по упрощенному алгоритму для первой строки не рассматриваются отсчеты /(^,ч2 ^ля
238
левого столбца не рассматриваются отсчеты /(kj.hj “О (они полагаются нулевыми), а при анализе углового отсчета у(0, 0) либо ничего не делается (если у(0, 0)=0), либо заводится строка в таблице характеристик (/(0, 0)=1).
Для окончательной ясности рассмотрим пример. Будем измерять площади объектов на фрагменте 5x5 (рис. 16.4а). Составим таблицу площадей объектов и покажем, как она модифицируется и наращивается в процессе построчного просмотра отсчетов.
Текущей отсчет Характеристика (площадь) области
Обл. 1 обл. 2 обл 3
/0,1) 1 - -
/0,2) 1+1=2 - -
/1,0) 2 1 -
Л 1.2) 2+1=3 1 -
/2,0) 3 1+1=2 -
/2,1) 3 2+1=3 -
/2,2) 3+3+1=7 объединена с обл. 1 -
/3,3) 7 - 1
/3,4) 7 1+1=2
Для краткости в таблице показаны только те строчки, для которых /(«1,^2)=! (то
есть отсчеты соответствуют объектам, и таблица изменяется).
Разметка областей приведена на рис. 16.46. В итоге получим две области: площадь первой - 7 отсчетов, второй - 2 отсчета.
Рис. 16.4. Измерение площади объекта на изображении:
а) пример фрагмента изображения; б) пример разметки областей алгоритмом.
Аналогично считаются и многие другие характеристики объектов Возникает вопрос
239
какие? Единственным требованием к характеристикам, измеряемым по описанному алгоритму, является следующее: должно существовать правило вычисления характеристики объединенной области по характеристикам объединяемых областей. Конкретнее, пусть F(D) - характеристика, вычисленная по области (множеству отсчетов) D. Тогда должно существовать правило Ф такое, что
kJ D2) = Ф^СА), F(L>2)] ( n Z>2 = - области не пересекаются)
Очевидно, что это не очень жесткое ограничение. В частности, ему удовлетворяют произвольные характеристики следующих видов:
1) F(£>)= ^(ф(иьи2)) ' "аддитивные” характеристики,
2) F(d)= maX {ф(nbи?)}-"экстремальные” характеристики, min
(w],w2)eD
где <р(«ь«2)» ф(пьи2) - произвольные функции координат .
Примеры:
а) площадь. F(d) = X1 то есть аддитивная характеристика с ф(яj,п2) = I;
б) координаты "краев" изображения по вертикали и горизонтали (рис. 16.5а).
Здесь
* F\(P)=, max Ц}; ^2(о)= min {и,};
F3(P)= max !»2J; A3(P)= min !я2}
йлг)^ й^гя^
- экстремальные характеристики с ц/j («j ,л2 )=Щ и Фг^Лг)" п2
Рис. 16.5. Измерение геометрических характеристик объектов: а)координаты краев области на изображении, б) область изображения и ее центр тяжести, в) размеры объекта на изображении.
Подобные "объединяемые" характеристики можно назвать первичными (базовыми). По ним можно вычислять некоторые вторичные (производные) характеристики, которые сами по себе не удовлетворяют сформированному требованию. Например, следующие:
240
а) Центр тяжести объекта или области D (рис. 16.56) для случая непрерывных аргументов вычисляется по формулам:
Jpl^i^z2 fjz2^zl^z2
Т __ D_________ . r _ D
1 ~~ f f 5 ^2 f f
J j dt} dt2 f f <*| dl2
D П
Для цифрового изображения приведенные выражения запишутся:
w2 =
Е "2 (nbn2)sD
I («{л2)еО
то есть
*00 = Е1 * *
Л10 . Л01 г V4
И| =-=“-, т2=-^-, где Е10= 2Л Г
*00 *00
Е01 = Хп2 (П1,»2^О.
- три аддитивные первичные характеристики.
б) Размеры объекта по вертикали и горизонтали (рис. 16.5в):
Ал] = max {п}}- min {wj}, Дл2 = max {л2т!П {п1}
(п[гп2^Р («1Лг)еО (пъп2^Р
считается через четыре экстремальные характеристики, рассматриваемые выше
Подобная методика измерений параметров объектов (и, соответственно, понятие первичных и вторичных характеристик областей) могут быть обобщены на случай обработки полутоновых изображений.
241
17. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ
Существует достаточно широкий круг задач, в которых изображения рассматриваются как источник информации, на основе которой необходимо вынести некоторое решение. Например, такого рода задачи возникают в медицинской диагностике, где изображение того или иного человеческого органа анализируется с целью определения возможного заболевания. В криминалистике для установления личности человека сравнивают изображения отпечатков пальцев. Современные приборы регистрации видеоинформации (фотоаппараты, видеокамеры и др.) анализируют получаемые изображения для автоматического определения оптимальных параметров съемки (дальности, экспозиции и др.). Этот список, несомненно, может быть продолжен. Все задачи такого рода относятся к задачам распознавания образов.
Распознавание образов - это научное направление, которое занимается разработкой теории, методов, алгоритмов и устройств обработки информации с целью классификации поступающих сигналов (в частности, изображений).
Заметим, что с задачей распознавания, в более широком ее понимании, сталкивается каждый человек. Читаем ли мы текст, переходим ли улицу, смотрим ли телевизор, слушаем ли музыку - в каждый момент времени мы решаем задачу распознавания. Для человека это стало настолько естественно, что не вызывает никаких затруднений. В то же время, попытки автоматизировать этот процесс, научить техническое устройство или компьютер делать то, что с такой легкостью делает человек, наталкивается на ряд нетривиальных проблем Обозначим их на примере.
Представим ситуацию, в которой необходимо обучиться узнавать некоторый наперед заданный объект (например, человека) в ситуации, если этот объект не наблюдается визуально. Подобная ситуация часто возникает в криминалистике и решается путем составления словесного описания (портрета) искомого объекта: фиксируется рост человека, его комплекция, цвет волос и глаз и т.д. Сопоставляя полученное описание с параметрами человека, которого мы впоследствии видим, становится возможным утверждать - похож ли этот человек на составленный портрет или нет.
Приведенный пример позволяет заметить принятое в теории распознавания образов разделение процесса распознавания на два этапа. На первом этапе из некоторых априорных сведении об объекте производится формирование определенного набора свойств или, в терминах распознавания образов, признаков Сформированный набор признаков объекта, или его образ, на втором этапе используется для вынесения решения о классе объекта (в данном примере присутствует всего два класса: люди, похожие на составленное описание человека и не похожие) Таким образом, собственно распознавание или классификация осуществляется
242
в некотором пространстве, называемого в теории распознавания образов пространством признаков Процесс классификации может производиться по следующему правилу, если набор признаков классифицируемого объекта близок к набору признаков другого - значит и сами объекты похожи и, соответственно, относятся к одному классу. Если известен класс для
одного из объектов, который выступает в качестве эталона, то по указанному правилу легко определить, какие из объектов относятся к тому же классу. Геометрическая интерпретация подобного правила приведена рис. 17.1.
образы сбскгов того же класса, что ц згалон
Рис. 17.1. Пример классификатора объектов
Граница, которая разделяет образы объектов, относящиеся к разным классам, называется в распознавании образов разделяющей границей, а правило, производящее это разделение - классификатором.
Данный пример, а также приведенный комментарий, позволяют достаточно четко определить те основные группы проблем, которые возникают при решении задачи распознавания. Первая, очевидно, связана с выбором свойств или признаков, которые будут использоваться для распознавания. Вторая - с построением собственно классификатора, который бы оптимальным образом производил разделение образов на классы. Эти проблемы, несомненно, возникают не только в задачах распознавания изображений, а носят более глобальный характер. В то же время в каждой прикладной области существуют свои специфические методы их решения.
Дадим теперь формальную постановку задачи классификации.
17.1. Постановка задачи классификации
Пусть задано некоторое множество Г из J подлежащих распознаванию объектов.
Г = {тоЛЬ-.ТУ-1}.
образы объектов, отличных от эталона
оораз эталона
разделяющая граница
243
и задано его разбиение на L непересекающихся подмножеств, называемых в дальнейшем образами или классами.
L 1
Л-ЧГо.Г!.....г£Ч}, (Jr,=r.
/=0
В качестве объектов могут выступать как собственно изображения, так и их фрагменты, одномерные сигналы и т.д. Пусть каждый из объектов уеГ представляется набором числовых характеристик, называемого вектором признаков
У = (У0>Уъ-)Т
Задача классификации заключается в отыскании решающего правила, которое по заданному вектору признаков у(у) указывает, какому классу Г/ принадлежит соответствующий объект у. Построение такого решающего правила эквивалентно разбиению метрического пространства признаков Z) = {у : у е £)} на множество непересекающихся областей:
> L-1
/^ = {£>0,^...DL_t}, \JD,=D. (17 1)
7=Ю
При этом решение о принадлежности некоторого объекта у е Г к классу 1} принимается в том случае, если соответствующий объекту вектор признаков y(y)cD принадлежит области D/.
Решающее правило, предназначенное для указания, какой области Dj признакового пространства D принадлежит предъявленный вектор признаков у, называется классиф икат ором.
В идеале классификатор должен быть таким, чтобы области, выделяемые в пространстве признаков, соответствовали классам, то есть в идеале для элементов множеств Яр и ^0 Должно выполняться следующее условие: объект у принадлежит классу Г/ тогда и только тогда, когда соответствующий объекту вектор признаков у (у) принадлежит области
VyeT: уеГ/<»у(у)е£>,, / = 0,1-1. (172)
Как правило, на практике данное условие не выполняется, и существует вероятность неверно проклассифицировать объект или допустить ошибку при распознавании.
Обозначим Ру = 0, А-1) вероятность того, что классификатор принимает решение
об отнесении вектора признаков некоторого объекта к области , в то время как сам объект принадлежит классу Г/:
244
(173)
Plj = P\y eDj/Vi)
При / * j вероятности pfj характеризуют ошибки распознавания и называются вероятностями неверной или ошибочной классификации, а при l = j вероятности рц задают вероятности верной (правильной) классификации представителей соответствующего класса Уменьшение вероятностей ошибочной классификации - это основная задача, которая возникает при построении классификатора
Обычно классификатор задается не в виде областей признакового пространства (17 1), а в виде набора, так называемых, дискриминантных или решающих функций <?/(у(у))> (/ = 0,Ь~1). При этом процесс принятия решения осуществляется по следующему правилу: объект считается принадлежащим тому классу, дискриминантная функция которого для соответствующего вектора признаков является максимальной
V;*/: 1У/(у(у))>^7(у(у))=>у(у)еЛ/. (174)
Замечание 1 Выбор решающих функций не единственен. Так, очевидно, наряду с функциями (/ - О, L ~ 1), решающими функциями также являются:
• £1 (у М (у)+82 (у ), гДе 8] (у) любая неотрицательная функция, a g2 (у) - любая функция, не зависящие от номера класса /,
где g(...) - любая монотонно возрастающая функция, не зависящая от номера класса.
Часто за счет приведенных преобразований удается существенно упростить вид классификатора.
17,2, Качество классификатора
Качество классификатора характеризуется величиной, называемой в теории статистических решений условным средним риском. Она задает среднюю величину потерь, связанных с принятием классификатором решения об отнесении данного вектора признаков у к классу с номерому:
1
Л7(у) = -г-^С//(Г;)р(у/Г/). (17 5)
Ах) /=о
В данном выражении:
L-\
• P(jy) - априорная вероятность появления объектов из класса I}, причем 2}Р(Г/)= 1;
1=0
• р(у/Г/) - условная плотность вероятностей случайного вектора признаков Y для объектов класса Г/ (в теории распознавания образов ее называют функцией правдоподобия для соответствующего класса),
245
• Р(У) ’ безусловная плотность вероятностей случайного вектора Y ,
• элементы квадратной матрицы
c=ht’l0 (,76)
характеризуют величины штрафов или потерь за ошибки классификатора Матрица С может быть достаточно произвольной. Единственным ограничением на ее элементы является то, что штраф за ошибочное решение должен быть больше, чем штраф за решение правильное, то есть с/у > сц.
Интегральной величиной, характеризующей качество классификатора является математическое ожидание потерь или общий риск, который с учетом (17 5) и (17 3) имеет вид:
£-1 £-1£-1
я = X I Rj (у )р(у> = Е X cijp^t 'fp'j- <17 7>
j=ODj J=0l=0
17.3. Оптимальные стратегии классификации
Процесс классификации аналогичен игре двух лиц, в которой выигрыш (проигрыш) одного из участников равен проигрышу (выигрышу) другого. Выбор оптимальной стратегии в игре зависит от количества исходной информации Могут использоваться байесовская, минимаксная стратегии или стратегия Неймана-Пирсона. В зависимости от того, какая из стратегий используется для построения классификатора, последний называют, соответственно, байесовским классификаторам, минимаксным классификатором или классификатором Неймана-Пирсона.
Байесовский классификатор
Байесовская стратегия используется при наличии полной априорной информации о классах, то есть когда известны:
• функции правдоподобия для каждого из классов, Д А
• матрица штрафов;
• априорные вероятности для каждого из классов.
Стратегия решения выбирается таким образом, чтобы обеспечить минимум общего риска (17.7). Минимальный общий риск при этом называется байесовским риском. В соответствии с выражениями (17 5) и (17 7), минимум общего риска R будет обеспечен, если разбиение пространства признаков D будет осуществляться по следующему правилу: вектор у е D относится к области D] только тогда, когда соответствующий условный средний риск Му) минимален:
246
Vj*Z Л/(У)<Лу(у)=>уе£>/,
(17 8)
Графическая иллюстрация байесовской стратегии приведена на рис 17.2а.
Если матрица потерь (17.6) является простейшей* 1, то после подстановки в (17 8) выражения для условного среднего риска (17.5) и с учетом Замечания 1 имеем следующий явный вид байесовского классификатора (см. Рис. 17.26):
/>(г/)р(у/Г,)>7’(г,)р(у/Г,)=>уеО/. (17 9)
Из (17 9), в частности, видно, что решающими функциями байесовскою классификатора являются функции-
ад=Р(Ш/гд / = (17 10)
Часто используют также следующую форму записи байесовского классификатора:
При этом функция А/у(х) =
Vj*l Г>) > => у е £>;. (17.11)
Ху гр р(г,) ' 17
/^у Д). называется отношением правдоподобия, а величина
Ху г7)
у/ Р(Г ) " поРоговЬ1М зиачением Таким образом, байесовский классификатор основан на сравнении отношения правдоподобия с пороговым значением..
V;*/ Л/у(у)>?.у/=>уеО7,
и называется поэтому классификатором отношения правдоподобия.
Легко показать, что при произвольном виде матрицы штрафов в случае двух классов байесовский классификатор имеет вид.
Ху г,) > Р(г0)(с0| -cqq)
ХуГ0) < Р(Г|)(с10-сп) с дискриминантными функциями:
dj (У) = P(Tj )(сд 1-,) - сц )Ху/Г,), j = 0,1.
Минимаксный классификатор
Классификатор, основанный на минимаксной стратегии, используется для случая двух классов и если известны:
• функции правдоподобия для каждого из классов;
• матрица штрафов.
1 Матрица потерь С называется простейшей, если ее элементы
О, i = j
удовлетворяют равенству с = <
1, > * j
247
Рис.17.2. Построение байесовского классификатора для простейшей матрицы штрафов: а) байесовская стратегия минимизации общего риска; б) байесовский классификатор
Минимизировать величину общего риска при отсутствии информации об априорных вероятностях классов, очевидно, невозможно. В то же время, предполагая возможность произвольного изменения значений априорных вероятностей классов, можно минимизировать максимально возможное значение риска. Действительно, общий риск (17.7) в случае двух классов может быть представлен в следующем виде:
Я = (ci 1 + р\o(qо “q J)) + Р(Г0)• [(cqo + Poi(с01 ~^оо))-(С11 + Р1о(сЮ “С11 ))] 0 7-12) При фиксированном классификаторе изменение априорной вероятности приводит к изменению величины общего риска, причем характер зависимости в (17 12) линейный (рис 17 3). Поэтому поиск классификатора, минимизирующего максимально возможную величину общего риска, эквивалентен поиску такого байесовского классификатора, для
248
которою величина (17 12) является постоянной, не зависящей от значения априорной вероятности Р(Го) величиной Таким классификатором, очевидно является байесовский классификатор, удовлетворяющий следующему дополнительному условию:
(соо + Ан (coi ~ соо))“ (ч1 + Р\о(С1 о - С11))= ° (17 13)
Из рисунка Рис. 17.3 видно, что значение величины общего риска для минимаксного классификатора равно максимальному значению байесовского (минимального) риска. Пара априорных вероятностей (р (Гу),1-Р (Гд)), при которых байесовский риск принимает максимальное значение, называется наименее благоприятным распределением априорных вероятностей. Таким образом
минимаксный классификатор - это байесовский классификатор, полученный для пары наименее благоприятных априорных вероятностей.
В более простой ситуации, когда элементы матрицы штрафов таковы, что
соо = сп = А, сю = сь с01 ~ с0>
условие (17.13) преобразуется в следующее:
PoKo = P10<Y (17 14)
Последнее выражение представляет собой условие выбора областей Dq, D] в байесовском классификаторе.
Рис.17.3. Иллюстраиияминимаксной стратегии построения классификатора
Классификатор Неймана-Пирсона
Классификатор, основанный на стратегии Неймана-Пирсона, используется для случая двух классов, и если известны только функции правдоподобия для каждого из классов Суть стратегии Неймана-Пирсона состоит в следующем- задается допустимое значение
249
вероятности ошибки первого рода’ Д), а затем классификатор строится таким образом,
чтобы обеспечить минимум вероятности ошибки второго рода д
mm
<
.Ро = Ро
(17J5)
Решением задачи Неймана-Пирсона является классификатор вида
(17 16)
где значение пороговой величины к определяется, исходя из условия. р$ = р$ (рис 17 4)
Из выражения (17.16) следует, что классификатор Неймана-Пирсона - это классификатор отношения правдоподобия
17.4. Байесовский классификатор для нормально распределенных векторов признаков
На практике часто возникает задача распознавания детерминированных объектов или сигналов в условиях помех. Она стала традиционной в таких дисциплинах, как теория сигналов, обработка изображений, распознавание образов. Ниже приведен достаточно типичный пример постановки подобной задачи и ее решения с использованием байесовской стратегии.
Пусть входной сигнал, задаваемый вектором у = (уо>-У и подлежащий распознаванию, представляет собой аддитивную смесь детерминированной и шумовой составляющих. Будем считать, что наблюдаемые вектора имеют нормальный закон распределения в каждом из L классов, то есть имеют плотность вероятностей вида:
р(у/Г/)=----==ехрГ-1(у-ц,)гВ/’1(у-ц/й Z = O,L-1. (17.17)
(24 2 )
Здесь
1 Критерий Неймана-Пирсона в теории статистических решений традиционно используется для проверки гипотез. Поскольку в классической постановке задачи используется только две возможные гипотезы, то различают два типа ошибок.
О ошибку первого рода рй - в контексте настоящего изложения р0 - р01,
О ошибку второго рода р. - в контексте настоящего изложения р{ = /?10.
Заметим, что в общем случае + р0 * 1 В дальнейшем изложении данная терминология и приведенные обозначения также используются
250
1*1 =£{Y/rz}, В) =м((¥-ц,ХУ-М/)7'/г/)
математическое ожидание и корреляционно^ матрица вектора признаков из класса Г/, соответственно Математические ожидания или средние характеризуют детерминированные составляющие распознаваемых сигналов, а корреляционные матрицы - характер шумовой составляющей. Считаются также известными априорные вероятности Р(Г/) появления векторов из каждого класса. Требуется по реализации у случайного вектора Y определить класс, к которому данный вектор принадлежит.
% д
Рис. 17.4. Иллюстра ция страт еги и Неймана-Пирсона п ос троения классиф икатора Решением данной задачи является байесовский классификатор с дискриминантными функциями следующего вида:
4(y) = !n?(r/)-lnJ^-|(y-(i/)r/ = 0ДП. (17.18)
Выражение (17.18) может быть существенно упрощено в некоторых частных случаях.
Случай 1
Предположим, что компоненты наблюдаемого вектора Y являются независимыми и
2 2
имеют одинаковую дисперсию , то есть 5/ = ор7, где 1 - единичная К к К матрица
Тогда законы распределения (17 17) отличаются только средними значениями, а решающие функции байесовского классификатора преобразуются к следующему виду:
rf/(y) = 2a^lnP(r/)-||y-|I/||* 2 Z = O,Z-1, (17.19)
здесь ||..J - евклидова норма При равных априорных вероятностях данное решающее правило приобретает очевидную трактовку: вектор признаков х относится к тому
классу, расстояние до центра которого минимально
Классификатор в этом случае называют классификатором по минимуму евклидова
251
расстояния. Пример разбиения пространства признаков при использовании подобного классификатора для случая трех классов приведен на рис 17.5а.
>х
X \
, х ______1______I \ I_______I______I_____1____
-2 -1.5 -1 -0 5 0 0.5 1 1.5 2
Рис. 17.5. Байесовский классификатор в случае нормально распределенных
векторов признаков: а) признаки статистически независимых и одинаково распределены; б) корреляционные матрицы одинаковы; в) корреляционные матрицы различны.
Нетрудно видеть, что решающие функции (17 19) можно преобразовать к линейной форме:
252
^(У) = нГу-|нГн/ +<т?1пР(гД / = 0,1-1.
В этом случае разделяющие границы между различными областями D/, задаваемые соотношениями вида.
4,(уМЛу)-<Му) = 0. о</<7</.-1,
также являются линейными:
^7G') = U-M7F У-|и+»*7Г(ц/-М7)+СТг 0</<У<Л-1
и говорят о линейном классификаторе.
Случай 2
Предположим, что все корреляционные матрицы одинаковы: Bf - В. Тогда решающие функции байесовского классификатора представляются в виде
d, (у) = 2 In Р(Г;)- (у - м, )Г В'1 (у - М/), I = О.ГЙ.
Величина
р(У.Н/) = (у-М;Г-В“1(у-ц/) (17.20)
называется расстоянием Махаланобиса между векторами у и Ц/ и является мерой близости вектора у к центру класса Г), учитывающей как дисперсии компонент вектора ¥ , так и их взаимную корреляцию. Очевидно, что в данной ситуации классификатор снова оказывается классификатором по минимуму расстояния Махаланобиса (см. рис. 17.56). Кроме того, и решающие функции, и разделяющие границы снова являются линейными
4(у)=мГвчу-|ц/гв-'д, +1п?(Г;), /=0,1-1
^(у) = (1‘1-р7Г51у-|^, + р7)гВ_,(р/-ру)+1пФ^, 0</<у<£-1,
а, следовательно, линейным является и классификатор.
Случай 3
В ситуации, когда все корреляционные матрицы различны, необходимо пользоваться выражением (17.18) для дискриминантных функций. Разделяющие границы в этом случае
представляются в следующем виде
+ -м/в-')у
-М/Г5/-1м; + р/ву,ру ,
0</< 7<£-1
и являются, очевидно, квадратичными функциями. Такие границы называются
гиперквадриками (гиперсферы, гиперпараболы и т.д., пример их приведен на рис. 17 5с), а сам классификатор называется квадратичным
253
/7.5. Вычисление вероятностей ошибочной классификации
Эффективность любого классификатора характеризуется вероятностями ошибок. Однако их нахождение в общем случае оказывается достаточно сложной задачей, поскольку требует вычисления многомерных интегралов
Plj = Jр(у/Г/)ф, / * Л l,J = 0.L- 1
Dj (1723)
При использовании байесовского классификатора, который является классификатором отношения правдоподобия, многомерный интеграл (17.23) может быть заменен одномерным от плотности вероятностей отношения правдоподобия Лу в каждом из классов. В частности, в случае двух классов для вероятностей ошибок имеем следующие выражения’
Ро = /рл(«/го)^«. Р1 = (17.24)
X -оо
где Л = Л(У) - П) , а = ~ поРоговое значение Плотность вероятностей
отношения правдоподобия удается найти далеко не всегда. Однако, когда случайный вектор Y имеет нормальный закон распределения, это может быть сделано.
Вычисление вероятностей ошибочной классификации для нормально распределенных векторов-признаков
Пусть вектор признаков в каждом из двух классов характеризуется нормальным законом распределения, причем все корреляционные матрицы являются равными В} = В (l = 0,1). Тогда случайная величина Л = 1п(А(у)) имеет нормальный закон
распределения с параметрами.
£{\/г0}= £{1п(л(¥))/Г0}= -|Р(яо.М1)>
£{л/Г, }= £!1п(л(¥))/Г, } = |p(ji0, р,),
И((л/Г/)-Е^/Г, j)2 j = pGio.m), I = 0,1
где p(po,Pi) - расстояние Махал апобиса между векторами средних р0 и рц.
Выражения для вероятностей ошибок (17 24) преобразуются к следующему виду'
/?0 = 1-Ф
^ + -'р(1*о.1‘1) ч/р(яо-М|)
*~5р(цо.М1)
* --1 —г—
Vp^O-Mi)
где Ф(...) - функция Лапласа, а
= 1лЛ = 1п
ЛгоХсо1 ~сооЛ J’faXqo-q i) )
254
новая пороговая величина (рис. 17.6) В частном случае, когда матрица штрафов является простейшей и априорные вероятности классов совпадают, имеем
1 = 1, 1 = 0, Ро=1-Ф| |л/р(мо>М1)] Р0 =ф^7р(м° М|)
Общий риск при этом определяется формулой
Л =1 -Ф[^а/р(мо>М|)
и монотонно убывает с ростом расстояния Махаланобиса между векторами средних
Рис. 17.6. Плотности вероятностей логарифма отношения правдоподобия для нормально распределенных векторов признаков с равными корреляционными матрицами Минимаксный классификатор
Предположим, что матрица штрафов имеет следующие элементы: со] ~ Qо = с, ego = сц = 0 Тогда соотношение (17.14) для выбора разделяющей границы байесовского классификатора, соответствующего минимаксной стратегии, превращается в равенство вероятностей ошибочной классификации pq - pj. С учетом выражений (17.24) получаем, что пороговое значение для минимаксного классификатора* X = 1, X = 0 Классификатор Неймана-Пирсона
Используя условие (17 15) и равенства (17 24), получаем, что пороговое значение классификатора Неймана-Пирсона определяется по формуле:
Х = Л, Х = -|р(ц0,ц1)+7р(мо411)Ф“1(1-Ро), где р$ - задашгая величина вероятности ошибки первого рода.
255
18. БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка изображений. - М.: Высшая школа, 1983. - 295 с.
2. Виттих В.А., Сергеев В.В., Сойфер В.А. Обработка изображений в
автоматизированных системах научных исследований.- М.: Наука, 1982. - 214 с.
3. Воробьев Н.П. Теория рядов. - М.: Наука, 1973. - 208 с.
4. Голд Б., Рэйдер Ч. Цифровая обработка сигналов: Пер. с англ - М.: Сов. радио, 1973. -367с.
5. Горелик А.Л., Скрипкин В.А. Методы распознавания. - М.: Высшая школа, 1984. -208с.
6. Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания. - М.: Высшая школа, 1985. - 160с.
7. Даджион Д., Мерсеро Р. Цифровая обработка многомерных сигналов. - М.: Мир, 1988.-488 с.
8. Дуда Р., Харт П. Распознавание образов и анализ сцен: Пер. с англ. - М.: Мир, 1976.-512 с.
9. Нуссбаумер Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток: Пер. с англ. - М.: Радио и связь, 1985. - 248 с.
10. Прэтт У.К. Цифровая обработка изображений: Пер. с англ. - М/. Мир, 1982. - Кн.1. -312 с.
11. Прэтт У К. Цифровая обработка изображений: Пер. с англ. - М.: Мир, 1982. - Ки.2. - 480 с.
12. Ту Дж., Гонсалес Р. Принципы распознавания образов: Пер. с англ. - М.: Мир, 1978.-412с.
13. Фомин Я.А., Тарловский Г.Р. Статистическая теория распознавания образов. - М.: Радио и связь, 1986. - 264с.
14. Фукунага К. Введение в статистическую теорию распознавания образов: Пер. с англ. - М.: Наука, 1979. - 368с.
15. Шабат Б.В. Введение в комплексный анализ. 4.1. - М.: Наука, 1976. - 320 с.
16. Ярославский Л.П. Введение в цифровую обработку изображений. - М.: Советское радио, 1979. - 312 с.
17. Ярославский Л.П. Цифровая обработка сигналов в оптике н голографии: Введение в цифровую оптику. - М.: Радио и связь, 1987 - 296с.
Учебное издание
Сойфер Виктор Александрович, Сергеев Вла/шслав Викторович, Попов Сергеи Борисович, Мясников Владислав Валерьевич
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
Учебное пособие
Компьютерный набор и верстка: В.В Мясников, Л.В.Потапова, И И Успленьева.
Лицензия ЛР № 020301 от 30.12.96г.
Подписано в печать 07.07.2000г Формат 60x84^^.
Бумага офсетная. Печать офсетная.
Усл.печ.л 14,8. Усл.кр.-отт. 14,9 Уч.-издл. 16,0
Тираж 200 экз. Арт С-3(ДЗ)/2000.
Заказ $1.
Самарский государственный аэрокосмический университет имени академика С П. Королева
443086, Самара, Московское шоссе, 34
ИПО Самарского государственного аэрокосмического университета.
443001 Самара, ул Молодогвардейского, 151