Текст
                    КУРС ТЕОРИИ АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Паллю be Ла Барьер
R. PALLU DE LA BARRI^RE
Professeur a la Facultd des Sciences de Caen Maitre de Conferences a I’Ecole polytechmque
COURS
D’AUTOMATIQUE ТНЁОИЮиЕ
DUNOD
> PARIS 19GG
Р. пАллю ДЕ лА БАРЬЕР
КУРС ТЕОРИИ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
Перевод с французского под редакцией д-ра физ.-мат. наук, проф. П. И. КУЗНЕЦОВА
Москва «МАШИНОСТРОЕНИЕ» 1973
П12
УДК 61-50 (07)
Р. Паллю де Ла Барьер. «Курс теории автоматического управления». Пер. с франц, под ред. П. И. Кузнецова. М., «Машиностроение», 1973, 396 с.
В книге с единой точки зрения изложены основы различных математических дисциплин, необходимых современному инженеру-исследователю по автоматическому управлению.
В частности, изложены сведения из теории множеств, теории линейных топологических пространств, теории функций действительной переменной и теории меры, теории обобщенных функций, гармонического анализа, преобразования Фурье и Лапласа, теории вероятностей и др. Специальные главы посвящены классической и современной теории автоматического управления, а также линейному и динамическому программированию. Все изложение пронизано понятиями и методами современной математики.
Книга представляет интерес для математиков, которым она открывает возможность применения результатов чистой математики в теории управления, и для инженеров по автоматике, которым она предлагает краткое изложение современных математических методов, находящих применение в новейших теоретических работах по автоматическому управлению. Книга полезна также специалистам по обработке информации и исследованию операций, студентам и аспирантам университетов и технических вузов, специализирующихся в области ТАУ.
Табл. 11. Ил. 50. Список лит. 75 назв.
3313-601
038(01)-73
119-72
© Издательство «Машиностроение» 1973 г.
ПРЕДИСЛОВИЕ К РУССКОМУ ПЕРЕВОДУ
Предлагаемая вниманию читателей книга является переводом с французского языка одного из выпусков университетской математической серии и посвящена главным образом изложению с единой точки зрения основ различных математических дисциплин, необходимых современному инженеру-исследователю по автоматическому управлению.
В основе книга представляет собой изложение курса лекций, прочитанных проф. Паллю де Ла Барьером на факультете естественных наук в Кане в 1962—1964 гг. для студентов, специализирующихся по теории автоматического управления (ТАУ). Курс лекций был издан в Париже в 1966 г., а в следующем 1967 г. издание этой книги вышло на английском языке. Перевод книги на русский язык представляет тем больший интерес," что в ней ставится задача, рассматривающая .основные математические методы ТАУ и знакомящая читателей с наиболее современными методами ТАУ, включая теорию оптимизации. Следует отметить, что автору в основном удалось справиться с этой трудной задачей.
В книге подробно рассмотрены гармонический анализ, изложенный на основе теории обобщенных функций; преобразования Фурье и Лапласа, которые- являются незаменимым аппаратом классической ТАУ применительно к линейным системам; элементы теории вероятностей, марковские цепи и случайные стационарные процессы.
Изложенные методы и математический аппарат использованы автором при рассмотрении классической теории линейных систем автоматического регулирования, а также вопросов фильтрации и предсказания, в связи с чем были привлечены работы Винера и Хопфа. В книге приводится материал по дискретным системам управления, причем рассматриваются вопросы применения ранее изложенного математического аппарата к этим системам.
Основная и наиболее интересная часть книги посвящена новому направлению развития теории управления — теории оптимизации. Сначала приводятся основы линейного и нелинейного программирования Р. Веллмана и теории оптимальных процессов Л. С. Понтрягина. Особенностью изложения материала является
5
то, что автор старается Дать полные и строгие Доказательства всех теорем.
Столь широкий охват материала, естественно, не позволил автору изложить все вопросы с одинаковой полнотой. Однако этот материал, а в необходимых случаях и дополнительный, по поводу которого можно обратиться к приводимой в конце книги литературе, может дать читателю достаточно полное представление о методах и результатах, используемых в современной ТАУ.
Все изложение (даже в главах более технических) пронизано понятиями современной математики (в частности, теории обобщенных функций). Поэтому для усвоения материала необходимо знание математического анализа и алгебры в объеме университетского курса. Ознакомиться с основными понятиями современной математики можно также по многочисленным советским или переводным изданиям, посвященным отдельным математическим дисциплинам.
Перевод выполнили: гл. 1, 2, 3, 4, 10, 11, 15, 17, 18 — Керимов М. К-’, гл. 5, 6, 7, 16 — Ширяев А. Н.; гл. 8 и 9 — Прокофьев А. С.; гл. 12, 13, 14 — Поддерюгин В. Д.
П. И. КУЗНЕЦОВ
ПРЕДИСЛОВИЕ >
Эта книга появилась в результате обработки лекций, прочитанных ' автором на факультете наук Канского университета в 1962—1964 гг. по курсу «Теоретическая автоматика». Ее содержание, конечно, не определяет точных границ этой дисциплины, тесно связанной с другими разделами математики как по используемым методам, так и по содержанию. Под одним общим названием соединено изложение общих теорий, таких как теория обобщенных функций и гармонический анализ, которые являлись традиционными для автоматики, а также новой теории автоматического регулирования, в частности работы школы Л. С. Понтрягина. Значительная часть книги посвящена задачам оптимизации, например изложению основ линейного и нелинейного программирования — этих незаменимых дисциплин при углубленном изучении методов оптимизации динамических систем.
Что касается вероятностных задач, автор счел возможным включить одну главу об основах теории вероятностей, так как на факультете наук этот предмет не входит в обязательную программу. Последующие главы посвящены теории случайных процессов и связанным с ними задачам оптимизации.
Пользуясь случаем, я выражаю моим слушателям глубокую благодарность за критические замечания, способствовавшие улучшению первой редакции этой книги.
Автор
ГЛАВА 1
ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
1.	ТЕОРИЯ МНОЖЕСТВ *
Мы будем в дальнейшем пользоваться общепринятыми в литературе понятиями и обозначениями.
Если f — отображение множества Е в множество F, то будем писать def (f) = £, а через val (f) обозначим множество значений у = f (х) для хЕ Е. Отображение f множества Е в множество F называется взаимно однозначным, или инъективным, если из f (х) = f (у) следует х = у. Отображение называется сюръективным, если val (/) = F, и биективным, если оно одновременно является инъективным и сюръективным. Инъективное (соответственно сюръективное, биективное) отображение называется также инъекцией (соответственно сюръекцией, биекцией).
Введем следующие обозначения:
/? — тело действительных чисел; С — тело комплексных чисел; Z — кольцо целых чисел; Т — одномерный тор (фактор-множество тела /? по отношению эквивалентности «х—у является целочисленным кратным 2л»).
Тождественное отображение на множестве Е обозначается через 1Е или просто через /, если это не приведет к недоразумениям. Характеристическую функцию части А множества Е обозначим через 8д.
Отношения порядка
Отношение есть отношение порядка на множестве Е, если это отношение удовлетворяет следующим условиям:
1)	х х;
2)	х у и у	г Ц х г **;
3)	х ^у и у	х -=^ х = у.
* По поводу понятий и обозначений, не объясненных в книге, см.: Р Фор, А. Кофман и Д. Дени-Папен. «Современная математика». М., «Мир», 1966; Р. Эдвардс. «Функциональный анализ. Теория и приложения». М., «Мир», 1969. Прим. ред.
** Здесь => символ импликации, или логического следствия: «влечет» или «имеет следствием». Прим, перев,
7
Тогда говорят, что множество Е упорядочено. Если х у и х =f= у, то пишут х < у.
Если, кроме того, выполняется дополнительное условие:
4)	если для Vх*, У € Е имеем х у или у х, то отношение порядка называется совершенным \Е называется совершенно упорядоченным).
Отношение, удовлетворяющее только условиям 1) и 2), называется предпорядком. Тогда отношение х у и у х есть отношение эквивалентности, и предпорядок индуцирует отношение порядка на фактор-множестве множества Е по этому отношению эквивалентности. Элемент х упорядоченного множества Е называется максимальным, если из х у следует у = х. Всякое конечное упорядоченное множество имеет, по крайней мере, один максимальный элемент.
На Rn рассмотрим отношение порядка, определяемое следующим образом: если х1 и у1 — соответственно компоненты векторов х и у. то полагаем х у, если х1 у1 (v i = 1, . .	п). Кроме
того, пишут х < у, если xl <Zyl (v i = 1, . .	/г). Множество
элементов x^Rn, удовлетворяющих условию х 0, обозначим через
2.	ТОПОЛОГИЧЕСКИЕ ВЕКТОРНЫЕ ПРОСТРАНСТВА
Действительным (соответственно комплексным) топологическим векторным пространством называют векторное пространство Е, снабженное топологией, такой, что отображения х, у—* —> х + У (х,у С Е) и %,х —* Кх [X G R (соответственно С), х£ Е] являются непрерывными.
Структура топологического векторного пространства полностью определяется, если известен базис окрестностей точки 0; тогда базис окрестностей любой точки х получается сдвигом на х.
Полунормой на векторном пространстве Е называют отображение х —* р (%) пространства Ев/?, обладающее следующими свойствами:
1)	Р W 0;
2)	р (Хх) = |Х| р (%);
3)	р (х + у) р (х) + Р (у).
Если выполняется еще следующее дополнительное условие:
4)	р (х) = 0 =4 х ~ 0, то р называется нормой.
Полунорма р! называется более крупной (более грубой), чем полунорма р2, если существует константа k такая, что pi (х) < kp2 (Х).
Символ Vх означает: «для всякого элемента х». Прим, персе,
8
Если, кроме того, р2 более грубая, чем plt то рх и р2 называются эквивалентными. Если рг и р2 — лве заданные полунормы, то полунормы р3, р^ определенные равенствами
Рз (*) = Pi (*) + рз (*);
Pi (х) = шах (рх (х), р2 (х)),
эквивалентны между собой и мельче (тоньше), чем р± и р2. Всякая полунорма, более тонкая, чем р± и р2, оказывается тоньше р3 и р4-
Всякая полунорма на векторном пространстве Е определяет структуру топологического векторного пространства, для которой множества р (%) р (р > 0) образуют базис окрестностей точки 0. Для того чтобы определенная таким образом топология была отделимой, необходимо и достаточно, чтобы р была нормой.
Две эквивалентные полунормы определяют одну и ту же топологию.
Пространством Банаха называется нормированное (т. е. снабженное нормой) и полное (в топологии, определенной этой нормой) пространство.
Всякое семейство ра полунорм на векторном пространстве Е определяет структуру топологического векторного пространства, для которого множества V (аь . . ., а*; р) такие, что
. хЕ V (ау, . . ., а*; р) ф pai (х) < р (i = 1, . . ., k),*
где р — произвольное число >0 и . ., ak — любое конечное семейство значений ос, образуют базис окрестностей точки 0.
Топология, полученная таким образом, отделима, если она удовлетворяет следующему свойству:
Ра U) = 0 (V а) =) х = 0.
В частности, если семейство полунорм ра счетное, то его можно занумеровать целым индексом и обозначить через рп (п = 1, 2, . . .). Тогда в качестве базиса окрестностей точки 0 можно взять множества V (Af; р), определенные таким образом (р > 0, N - 1, 2, . . .):
. х е V (ЛА; р) ф Рп (х) < Р (V « < N).
В частности, если рп более тонкая, чем рп_г (в этом случае говорят, что полунормы рп расположены по возрастающей тонкости), то в качестве базиса окрестностей точки 0 можно принять множества W (п, р), определенные следующим образом (р > 0, п = 1, 2. . .):
хе w (п, р) ф рп (х) =< р.
* Символ <—> означает логическую эквивалентность, или «справедливо как само утверждение, так и его обращение». Прим, перев.
9
Наконец, если семейство полунорм ра конечно, то топология, которую оно определяет, может быть задана одной полунормой, например S Ра или SUP Ра-а	а
Два семейства полунорм ра и называются эквивалентными, если они определяют одну’ и ту же топологию. Для этого необходимо и достаточно, чтобы
а)	для всякого а существовало конечное множество . . ., Р& значений р и константа /С такие, что
pa(x)^/Csup?P/(x);
б)	для всякого Р существовало конечное множество . . ., значений а и константа К такие, что
> qt(x)^K.sAippai(x).
Всякая последовательность р„ полунорм эквивалентна последовательности полунорм qn, расположенных по возрастающей тонкости, Например, можно принять
<7n = sup pk. k
Всякое отделимое топологическое векторное пространство, топология которого определяется счетным множеством полунорм, метризуемо. Оно называется локально выпуклым метризуемым пространством.
Пространством Фреше называется всякое локально выпуклое метризуемое полное пространство.
Пусть Е и F — два пространства, топологии которых определяются соответственно полунормами ра и Для того чтобы отображение f пространства Е в F было непрерывным, необходимо и достаточно, чтобы для всякой полунормы % существовало конечное множество а1? . . ., ak значений а и число р > 0 такие, что:
Ра. (Х)<Р • • • ♦ pak(x)^p

Основные теоремы на пространствах Банаха и Фреше
Если Е и F — два топологических векторных пространства, то через L (Е, F) обозначим пространство непрерывных линейных отображений из Е в F. Если Е —действительное (соответственно комплексное) пространство Фреше, то сопряженное ему пространство L (Е, R) [соответственно L (Е, С)] будем обозначать через Е'. Слабой топологией на Е' называется топология простой сходи-10
мости на Е. Если Е и F — пространства Банаха, то L (Е, F) является пространством Банаха с нормой
Л —||Л|| = sup ||’Лх||.
В частности, пространство, сопряженное к пространству Банаха, есть пространство Банаха. Справедливы следующие основные теоремы.
- Теорема. Пусть Е и F — два пространства Банаха. На всяком шаре из L (Е, F) топология простой сходимости на Е совпадает с топологией простой сходимости на всяком подмножестве, плотном в Е.
Теорема Банаха. Всякий замкнутый шар в пространстве, сопряженном к пространству Банаха Е, является слабо компактным.
Теорема Хана—Банаха. Пусть Е — пространство Банаха, F — замкнутое векторное подпространство пространства Е и и — непрерывная линейная форма на F. Тогда и может быть продолжена в виде непрерывной линейной формы на Е.
Предположим, что F имеет конечную коразмерность, т. е. является пересечением конечного числа k замкнутых гиперплоскостей и описывается уравнениями (х) = 0 (i = 1, . . ., k), где — непрерывная линейная форма.
В этом случае формулировка теоремы Хана—Банаха элементарна. Действительно, легко можно построить непрерывный проектор Р на F и достаточно положить
и (х) = и (Рх) для х G Е.
Мы будем пользоваться также следующей теоремой.
Теорема о замкнутом графике. Пусть ЕнР- два пространства Фреше и f — линейное отображение из Е в F. Если график отображения f (т. е. часть пространства Е X F, образованная парами (х, f (х), где х пробегает Е) замкнут, то f является непрерывным.
Поскольку пространства Е и F метризуемы, то условия теоремы означают, что если lim хп = х и lim f (xft) = у, то.у = f (х).
72->-}-ОО	72->-}-со
При этом можно ограничиться случаем, когда х = 0.
Из теоремы о замкнутом графике вытекает следующее утверждение: если f — непрерывная биекция из Е в F (Е и F — два пространства Фреше), то f"1 является непрерывной.
Предгильбертовы и гильбертовы пространства
Отображение х, у —-> А (х, у) произведения Е X F двух комплексных векторных пространств в комплексное векторное пространство G называется полуторалинейным, если оно линейно относительно у и полулинейно относительно х.
П
Действительным (соответственно комплексным) отделимым предгильбертовым пространством называется действительное (соответственно комплексное) векторное пространство В, на котором определена билинейная (соответственно полуторалинейная) форма х, у (х, у), обладающая следующими свойствами:
1)	(х, у) — (у, х} (соответственно (х, у) = (у, х});
2)	(х, х) 0;
3)	(х, х> = 0 х = 0.
Всюду в дальнейшем мы будем пользоваться термином «предгильбертово» вместо «отделимое предгильбертово». Всякое предгильбертово пространство есть нормированное пространство с нормой
||x|i = y'<x, X).
Полное предгильбертово пространство называется гильбертовым пространством. Всякое конечномерное предгильбертово пространство является гильбертовым. Действительное (соответственно комплексное) конечномерное пространство называется евклидовым (соответственно эрмитовым) пространством.
Мы будем считать известными классические свойства предгильбертовых и гильбертовых пространств.
Матричное исчисление
Элементы х из Сп (называемые n-векторами) можно представить в виде
"х1"
х =
> '	хп
Обозначим через п-вектор, f-я компонента которого равна 1, в то время как все остальные равны 0.
Матрицей называется отображение А пространства Сп в пространстве Ср-
Матрицу А можно записать в одном из следующих видов:
где
12
Если у = Ах, то
= ЕЖ-
i=i
Столбцы At равны Аг1.
Единичная матрица обозначается через 1. Через А обозначим матрицу такую, что (Л Я А}. Если матрица А — действительная (соответственно комплексная), то матрица А называется транспонированной (соответственно транспонированной эрмитовой) для А. Если А = А, то матрица А называется симметрической в действительном случае и эрмитовой в комплексном случае.
Пусть £ есть n-мерное векторное пространство и S = [ех, . . ., . . ., еп] — его базис. Всякий элемент х£ Е можно представить единственным образом в виде
п
X = S ХЙ(--
I =1
Пусть
Если S' — другой базис пространства Е, то можно записать • xs = K.xs',
где К — матрица с п строками и п столбцами, которая называется матрицей перехода от одного базиса к другому.
Если и £2 — Два конечномерных векторных пространства с базисами Sx и S2 и А — линейное отображение из в Е2, то существует матрица такая, что t/s2 = As2s2 Xs,. Если Si и So — два других базиса соответственно пространств Е\ и Е2, то
Л^, ^KfAS1S,Kx,
где и /С2 — матрицы перехода от одних базисов к другим в Ег и £2.
Пусть Е — эвклидово или эрмитово ^-пространство с базисом
S = [е1? . . ., еп]. Любому % 6 Е можно сопоставить п-вектор
\еъ х)
и можно считать как компоненты вектора х относительно ба-
зиса S, называемого дополнительным базисом для S.
13
Можно записать
— G (S) xs.
Матрица G (S), называемая матрицей Грама базиса S, имеет вид '^1,	епУ
1
<?($) =
^1) ' ' '	^п)_
Кроме того,
<х, у) = xsG (S) ys.
Если S' — другой базис для £, то
G (S') = KG (S)/С,
где К — матрица перехода от одного базиса к другому.
Вообще, если е19 . . ., епсуть /г независимых векторов в предгильбертовом пространстве Я, то они порождают эвклидово или эрмитово n-мерное подпространство В, для которого эти векторы образуют базис S.
Пусть G (S) = G (ех, . . ., еп) — соответствующая матрица Грама и пусть х — любой вектор из Н, а Рх — его проекция на Е. Так как х — Рх | eL (yi = 1, . ..., п), то
Рх)1 Г(еь х}~
(Рх^
УГ-пл Рх} _ У&п> X) _
Отсюда находятся компоненты вектора Рх относительно базиса S = [ех, . . ., еп]\
"<*1, X)"
(Px)s = G-'(S) • • •
X} _
п»
Замечание. Если ei, . . .,епсутьп любых векторов предгильбертова пространства, то для них можно составить матрицу Грама с элементами (е/, е/>. Для линейной независимости векторов ei, ...» еп необходимо и достаточно, чтобы их матрица Грама была обратимой.	5
Квадратичные формы	}
Матрица А£ L (/?", Rn) называется положительно полуопре-	1
деленной (соответственно положительно определенной), если вы-	j
полняется неравенство хАх 0 для любогох £ Rn (соответственно	J
хАх > 0 для любого х£/?п, отличного от нуля). Пусть Е—	I
действительное конечномерное векторное пространство. Квад- | ратичной формой на Е называется всякое отображение х —»ср (х, х),	|
14	1
где ф — билинейная форма. Можно всегда считать, Что <р является симметрической.
Для всякого базиса S существует матрица si (S) такая, что Ф (х, х) — xssi (S) xs.
Если S' — другой базис, то
ф (X, X) = XS' ^(S') Xs', где	_
si (S') =	(S) К;
К. — является матрицей перехода от одного базиса к другому.
Квадратичная форма называется положительно полуопреде-ленной, если ф (х, х) 0x(v* € Е), т. е. если матрица si-(S) является положительно полу определенной. Она называется положительно определенной, если, кроме того, из ф (х, х) = 0 следует х = 0, т. е. если матрица st- (S) является положительно определенной.
Если ф — билинейная форма и х —4 ф (х, х) — положительно определенная квадратичная форма, то отображение х, у —» ф (х, у) определяет эвклидову структуру, для которой si (<$) является матрицей Грама.
Если Е — эвклидово пространство, то для всякой квадратичной формы х—» ф (х, х) существует матрица А £ L (Е, Е) такая, что
Ф (х, х) — (х, Ах), причем А может быть симметрической.
Спектральное разложение
Пусть Е есть n-мерное векторное пространство. Оператор Н Е Е (Е, Е) называется нильпотентным, если существует целое число k такое, что Hk = 0. Тогда Нп = 0. Пусть А Е Е (Е, Е) и Р (s) = det (s — Л) — характеристический полином для А.
Напомним следующую теорему.
Теорема Кэли—Гамильтона. Справедливо соотношение Р (Л) = 0.
Пусть sx...... sp — собственные значения матрицы Л;
klt . . ., kp— их кратности. Приведем две формы теоремы спектрального разложения.
Теорема о спектральном разложении (геометрическая форма). Существует разложение пространства Е в прямую сумму подпространств . . ., Ер, обладающих следующими свойствами:
1)	Е1У ..., Ер — инварианты относительно Л;
2)	dim (Е() = kf,
3)	сужение АЕ[ матрицы Л на Е( имеет единственное собственное значение sz и, следовательно, представимо в виде s{ + ht, где hi является нильпотентным = о)»
15
4)	Et = noy ((st- — A)ki\
Теорема о спектральном разложении (аналитическая форма). Существуют проекторы л, и нильпотентные операторы Ht такие, что:
1)	= 1,	= О Для * ** =£ /»
2)	val (ль) инвариантны относительно А;
3)	= tfz;
4)	А = S (8/ +	л{._
I
Из этих теорем следует, что Et = val (rtz), ht есть сужение Hi на Et. Подпространство Et называется спектральным подпространством, соответствующим собственному значению sz, а проектор л£ — спектральным проектором, соответствующим собственному значению sz.
Разбиения
Пусть А С Е (Сп, Ст) и а — отображение множества {1, . . ., . . ., k} (0 << k п) в множество {1, . . ., т}. Обозначим через Аа матрицу, t-й столбец которой состоит из элементов Аа(/).
Аналогично, если 0 — отображение множества {1, . . ., h} (0 < <Zh^m) в множество {1, . . ., т\, то через А& обозначим матрицу, /-я строка которой состоит из элементов Положим А& = (Аа)3 = (Лр)а. Матрица А% называется подматрицей матрицы А.
Для простоты в качестве а возьмем упорядоченное подмножество множества {1, . . ., п], а в качестве 0 — упорядоченное подмножество множества {1, . . ., т\. Это позволит писать р£ а (соответственно q £ 0) вместо р Е val (а) (соответственно q С Е val (0)) и а2 = С а? вместо val (а2) = С val
Если а1? . . ., образует разбиение множества {1, . . ., п], а 01, . . ., 0П — разбиение множества {1, . . ., т\, то множество матриц А^г (г = 1, . . ., X, s = 1, . . ., ji) образует разбиение матрицы А. Такое разбиение можно представить следующей схемой:
А
яРц
* Символ поу означает ядро множества, заключенного в скобку. В математической литературе чаще встречается символ Кег (•)• Прим, перев.
** Здесь G М означает множество, дополнительное к множеству М. Прим.
перев.
16
Если <х1( . . ., ах образует разбиение множества {1, . . п] и если В £ L (С9, Сп), то для А и В получаются следующие разбиения:
Btti
ЛЧ-М'-'Ы; в =
Согласно правилу умножения матриц, получаем формулу
АВ = %АВ\
Г
3. МЕРЫ
Рассмотрим пространство Rn. Обозначим через D° (Rn) или, короче, через D°, векторное пространство непрерывных комплексных функций с компактным носителем. Это пространство представляет собой плотное подпространство пространства непрерывных комплексных функций, стремящихся к нулю на бесконечности; нормой служит норма равномерной сходимости:
f-»||f Ik = sup | f (x) |.
X
Обозначим через D# пространство непрерывных комплексных функций с компактным носителем. Если ввести норму равномерной сходимости, то становится пространством Банаха.
Мерой назовем всякую линейную форму р на £>°, удовлетворяющую следующему условию непрерывности (СС0): для всякого компакта К сужение меры р на Dx есть линейная непрерывная форма в смысле топологии пространства
Обозначим через J /-р значение формы р для элемента f G DQ. Его можно также обозначить через j /(х)-р*, если необходимо явно указать «переменную интегрирования». Условие (СС0) можно выразить еще так: для всякого компакта К существует константа Мк 0 такая, что
/ер°х=)|р-^|<^||/цц.
Пусть £>+ — множество положительных или равных нулю функций, принадлежащих пространству DQ. Условие (СС0) выполняется, если J/-р^О для всего f 6 £>+• В этом случае говорят, что р есть положительная мера.
Между мерами можно установить отношение порядка, полагая
p,<v<=> Jf-v (v/6Z>+).
2 Р. Паллю де Ла Барьер
Для того чтобы мера р была положительной, необходимо й достаточно, чтобы р 0. Мера р называется действительной, если для всякой действительной функции f значение J f-p является действительным. Любая мера р может быть записана в виде р = = 11! + /р2, где рх и р2 — действительная и мнимая части меры р.
Пусть р — действительная мера. Существует положительная мера р+ такая, что
p-p+ = supj<p-fi (vfez>+).
jOCqXf 1ф€п°
Тогда можно положить р = р+ — р", где р~ — также положительная мера. Меры р+ и р" называются положительной и отрицательной частями меры р.
Если v — положительная мера, удовлетворяющая условию р v, то тогда р+ С v и, следовательно, р+ есть «наименьшая из положительных мер, превосходящих р».
Примеры.
I. Линейная форма f -> J f (х) dx есть положительная мера, называете
мая мерой Лебега. Ее значение для элемента f будем обозначать через J Д
II. Линейная форма f -> f (а) есть положительная мера, обозначаемая через 6fl и называемая мерой Дирака в точке а. Тогда
при этом вместо 60 пишут просто 6.
Продолжение меры
Пусть р—положительная мера. Примеры показывают, что J /• р можно определить также для некоторых функций, отличных от непрерывных, с компактными носителями. Для всякой меры р условия непрерывности можно заменить условием измеримости, иначе говоря, можно определить класс функций, называемых измеримыми относительно меры р. Способ введения понятия измеримости во многом завист от выбранного способа построения, и мы этого уточнять не будем.
Ограничимся основными сведениями об измеримых функциях и об их интегрировании:
1.	Непрерывные функции измеримы.
2.	Измеримые функции образуют векторное пространство.
3.	Нижняя и верхняя грани конечного множества действительных измеримых функций измеримы.
4.	Если f измерима, |/| также измерима.
5.	Если fk — последовательность измеримых функций и fk(x) стремится к f(x) для всякого х, то f(x) измерима.
18
Пусть f — отображение из Rn в Rp. При у = f(x) положим yt = ft (х). Отображение f называется измеримым, если каждая из функций ft измерима. Если, кроме того, g есть непрерывное отображение из Rp в /??, то go f измеримо. Если f — положительная измеримая функция, то J/*ропределенно,номожетравняться + со. Если j [1 =£ + оо, то функция f называется интегрируемой. Комплексная функция f называется интегрируемой, если она является измеримой, а |/| — интегрируемым. Тогда
IJ J 1Лн-
Множество интегрируемых функций образует векторное пространство и отображение / —> /-р линейно на этом векторном пространстве.
Множество Е называется измеримым, если его характеристическая функция является измеримой. Тогда
И (£).= | е£-р.
Если р (Е) =/= +оо (т. е. если 8^ интегрируема), то множество Е называется интегрируемым. Сумма или пересечение счетного множества, измеримых множеств измеримы. Дополнение измеримого множества измеримо. Множество называется р-пренебре-жимым, если его мера относительно р равна нулю.
Две функции f и g называются равными почти всюду (п. в.), если они равны всюду, за исключением множества меры нуль, п. в
Тогда пишут f = g, или f = g почти всюду относительно р. Если f измерима, то g также измерима.
Для того чтобы две измеримые функции были равны почти всюду, необходимо и достаточно, чтобы ||/ — g|-p = 0. Отно-п .в.
шение f = g является отношением эквивалентности.
При р 1 через Lp (р) обозначим фактор-пространство по отношению эквивалентности п.в множества измеримых функций, таких, что \fp\ является интегрируемой. Для простоты мы будем писать f£LP (р), если f измерима и \fp\ интегрируема.
Множество Lp (р) является векторным пространством с нормой
f-*na=[f шр-н]1/р.
Относительно этой нормы пространство Lp (р) является полным, т. е. образует пространство Банаха. Измеримая функция f называется существенно ограниченной, если найдется число т такое, что множество элементов х, для которых /1 f (х) | > т, имеет меру нуль.
2*	19
' Обозначим через L™ (р) фактор-пространство по отношению эквивалентности п.в множества существенно ограниченных измеримых функций. Обозначим через Ц/Ц^ нижнюю грань чисел т таких, что множество элементов х, удовлетворяющих условию имеет меру нуль. Отображение f —> Ц/Ц^ является нормой на L00 (р) и относительно этой нормы Л°° (р) образует пространство Банаха.
При р 1, =^= + оо пространство L? (р) является сопряженным- к пространству Lp (р), где
В частности, сопряженным к L1 (р) будет пространство £°° (р). Мы будем писать (р), если функция f измерима и существенно ограничена.
Функция f называется измеримой (соответственно интегрируемой) относительно действительной меры, если она измерима (соответственно интегрируема) относительно р+ и р". Если f интегрируема относительно р, то полагаем
J/• н = J Лн+—J Ли"-
Аналогично функция f называется измеримой (соответственно интегрируемой) относительно комплексной меры р, если она измерима (соответственно интегрируема) относительно действительной Re р и мнимой Imp частей меры р.
Если f интегрируема относительно р, то полагаем
/Ли = р-(Кец) +1 jf-(Imp).
Замечание. Если р — мера Лебега на пространстве Е, то вместо Lp(p)(l^ +оо) пишется Lp (Е) или Lp.
Ограниченные меры
Положительная мера р называется ограниченной, если J 1 • р =£ + оо. Можно записать J 1 • р — j р. Это число называется полной массой меры. Оно может быть определено также следующей формулой:
J ц = sup j/.p.
( 1.
Действительная мера называется ограниченной, если р+ и р" являются ограниченными. Комплексная мера называется ограниченной, если ее действительная и мнимая части являются ограниченными.
20
Если р — ограниченная положительная мера, то всякая существенно ограниченная измеримая функция является интегрируемой. Тогда
I j f-H I Jp-
В частности, если f — ограниченная непрерывная функция, то она является интегрируемой и
IJ •_[ и-
Если [г — ограниченная положительная мера, то Lp (р) cz cz Lq (р) при q «С р.
Мы вернемся к изучению ограниченных мер в первом параграфе гл. 3.
Носитель меры
Носителем меры называется наибольшее замкнутое множество F такое, что |/-р = 0для всякой функции f£DQ с носителем в дополнении к F.
Всякая мера с ограниченным (т. е. компактным) носителем является. ограниченной мерой.
Теорема Лебега
Теорема. Пусть р— мера на7?п. Рассмотрим последовательность интегрируемых функций Д, стремящихся просто (почти всюду) к функции /. Если существует интегрируемая функция g такая, что \fk\ < g, то функция f интегрируема и
lim j fk -и = р-ц.
k -> 4- °°
Произведение меры и локально интегрируемой функции
Пусть р — некоторая мера. Измеримая функция ф называется локально интегрируемой, если 8^ф интегрируема для всякого открытого интегрируемого множества Q. В этом случае можно определить меру фр такую, что
J Лфн=J Лфн (v fe z>°).
Можно показать, что для того, чтобы функция f была интегрируемой относительно меры фр, необходимо и достаточно, чтобы Др была интегрируемой относительно р. В этом случае предыдущая формула остается справедливой.
Чтобы фц была ограниченной мерой, необходимо и достаточно, чтобы ф G L1 (р). Если нужно указать «переменную интегрирования» х, то вместо фр будем писать ф (х) р\ Если v = фр, то ф называется плотностью v относительно р.
21
Прямое произведение двух мер
Пусть [1 и v — меры соответственно на Rn и Rp. Тогда на Rn+p существует одна и только одна мера pv, такая, что
J f •Р’ = J* [J f(x, г/)-цж] • = J [J f(x, у)- V»]• Р* (v/€ D° (Rn+P)).
Изменение порядка интегрирования производится на основании следующей теоремы.
Теорема Фубини. Пусть pnv—две положительные меры соответственно на Rn и Rp.
Если f £ L1 (pv), то:
а)	функция х—>/(х, у) принадлежит L1 (р) для всех значений у, исключая те, которые принадлежат некоторому v-прене-брежимому множеству;
б)	функция у —> J / (х, у)-рх (определенная почти всюду) принадлежит ь1 (V);
в)	справедливо равенство
= J[j f (х, г/).рл]. W.
Обратно, если f — положительная функция и условия а) и б) выполнены, то f g L1 (pv) и имеет место условие в).
Если р и v — ограниченные меры, то pv является ограниченной.
Если р и v — положительные меры, то pv является положительной.
Если; р и v — ограниченные положительные меры; то
J pv = J р . J V.
Если ф.и ф локально интегрируемы относительно р if v, то функция х,у —> ф (х) ф (у) локально интегрируема относительно pv и справедливо равенство
[ф (х) ф (у) ] pxv^ = [ф (х) рх] [ф (у) v*].
Из теоремы Фубини следует правило дифференцирования интегралов, зависящих от параметра. Мы ограничимся формулировкой следующей теоремы.
Теорема. Пусть р — мера на Rn и х,у —> f (х,у) — непрерывная функция, определенная для всех xg Rn и у £] а, Ь[.
1)	функция х —> / (х, у) интегрируема относительно р для всех у £] а, 6[;
2)	частная производная fy (х, у) существует и непрерывна' на Rnx ] а, Ь[}
3)	существует положительная функция g, интегрируемая относительно р и такая, что \ f'y (х, у) | g (х).
22
Тогда функция у —> j f (х, у) • р* непрерывно дифференцируема и ее производная определяется по следующей формуле:
j f(x, у) -Н*=J f'y (X, у) ух.
Образ меры при измеримом отображении
Пусть р — мера на Rn и ср — измеримое отображение из Rn в Rp. Если для всякой f £ D° (Rp) функция /оср интегрируема относительно р, то на Rp можно определить меру, называемую образом меры р при ср, при помощи следующей формулы:
= J (/о<р).И, т. е.
j f (у)-^у = J f (ф
Если р — ограниченная мера, то ее образ при измеримом отображении всегда существует и является ограниченной мерой.
Свертка двух мер
Пусть р и v — две меры на Rn. Если для всякой f £ £>° (/?") функция х, у —* f (х + у) интегрируема относительно pxv^, то свертка р * v мер р и v (которая является мерой на Rn) определяется по формуле
J f-p, * v = Jf(x + t/)-p.xv» (y/f£D°(Rn).
Иначе'говоря, p * v есть образ меры pxv^ при отображении х, у —> х + у. В частности, свертка р * v всегда определена в следующих случаях:
а)	р и v — ограниченные меры;
б)	р или v имеет компактный носитель;
в)	р и v обе имеют ограниченные снизу носители (или обе имеют ограниченные сверху носители).
Свертка коммутативна. Формула.
(р * v) * р = р * (v * р) справедлива в следующих основных случаях: а) р, v, р ограничены;
б) р и v имеют ограниченные носители;
в) р, v, р имеют ограниченные снизу носители.
Если р имеет плотность f относительно меры Лебега, то полагаем р * v = f * v. Тогда / * v имеет некоторую плотность относительно меры Лебега и мы получаем
п-в с
(f*v)(x) = ]f(x—y)vi/,
23
причем правая часть Определена всюду, за исключением множества значений х с мерой Лебега, равной нулю.
Если v имеет плотность g относительно меры Лебега, то можно положить f * g = f * v, при этом справедливо равенство
\	П-В f
(/ * g) (х) = J f (х — у) g (у) dy.
Если правая часть определена для всех х, то можно записать
(f * £) (х) = J f (х — у) g (у) dy.
Меры на Т
Рассмотренная теория остается справедливой на Т. Можно, впрочем, погрузить Т в /?2 и отождествить меры на Т с мерами на R2, носители которых находятся в Т. Поскольку Т компактно, то получаются следующие упрощения:
1)	всякая мера является ограниченной;
2)	всякое измеримое множество интегрируемо;
3)	всякая существенно ограниченная измеримая функция интегрируема;
.4	) всякая локально интегрируемая функция интегрируема.
4. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Пусть Е и F — пространства Банаха и пусть f — отображение открытого множества Q из Е в F. Говорят, что / дифференцируема в точке х£ Q, если существует А 6 L (Е, F) такое, что
/(х + /1) = / (X) + А/г + ||/г||е (Л),
где е (/г) —> 0 при h—> 0. Элемент А называется производной от / в точке х.
Отображение / называется дифференцируемым на Q, если оно дифференцируемо в каждой точке х £ Q. Его производная в точке х обозначается через /' (х), и отображение /' из Q в L (Е, F) называется производной отображения /.
Тогда имеем
/(х+Л) -/(х) + /' (х) h + \\h\\t(h).
Если /' — непрерывное отображение из Q в пространство Банаха L (Е, F),Tof называется непрерывно дифференцируемым.
Если /' само дифференцируемо на Q, то его производная обозначается через /". Тогда
/" (х) 6 L (Е, L (Е, Е))
24
и, следовательно, г (х) (й) е L (£, F);
Г (х) (h) (k) £ F.
Если f" непрерывна, то отображение /г, k —> f" (х) (/г) (k) является симметрическим.
Справедлива формула Тейлора—Маклорена:
f (х + К) = f (х) + f' (х) (/г) + Г (х) (/г) (Л) +
+ И||2е
где е (/г) —* 0 при /г — > 0.
Можно также определить производные высших порядков Как правило, мы ими пользоваться не будем.
Если Е = Ц и F = Rp, то положим
Х)_
Тогда
- (Н' (х) -
Г(х) =
О)
Если Е = Rn и F = R, то Д (х) = f (х) (ег). Эта величина является частной производной от f относительно х, в точке х.
Она обозначается также через f' (х). Тогда
f (х) = [Л(х)--7п (х)]-
Наконец, если Е = Rn и F = /?р, то yi = fi (х) и
Г W =
_О(х)---(Г)Рп(х)_	_(Н'(Х)_
где
a')Hx)=(fo;(x).
25
В случае Е = Rn и F = R (/" предполагается непрерывной) получаем
	f (х) (Я) (k) = S fa (х) frk', i
где	fii (.X) = f" (x) (e.) (8,).
Можно образовать матрицу Н с элементами Н[ = fa (х), при
ЭТОМ	• f" (X) (/i) (k) =hHk.
Матрица Н является симметрической.
Вообще, если непрерывна, то
/(т) (х)(/ц). ..(hm)= 2
где	11 > • • • > m
Заметим, что /<т)(х) можно представить в виде некоторой симметрической m-линейной формы.
ГЛАВА 2
ТЕОРИЯ ОБОБЩЕННЫХ ФУНКЦИЙ*
1.	ОПРЕДЕЛЕНИЕ ОБОБЩЕННОЙ ФУНКЦИИ
Мы знаем, что меры представляют собой линейные формы, определенные на пространстве Z)0 непрерывных функций с компактными носителями. Можно также рассматривать линейные формы, определенные на пространствах значительно меньших, чем Z)0, и не определенные на всем /)°.
В частности, в R вместо меры Дирака 8а в точке а, определенной для всякой f £ DQ, т. е.
мы можем рассматривать линейную форму
которая определена только для дифференцируемой в точке а формы /. Эта линейная форма обозначается через — 8'а (о знаке«—» будет сказано ниже).
Сохраним обозначение, которое использовалось в теории меры. Положим
/'(а) = — j/.6'.
Таким же образом можно рассмотреть линейную форму
обозначенную через (—1)р6дР) [о множителе (—1)р будет сказано ниже]. Таким образом,
/<Р) (а) = (—1)PJ/-6ар).
Линейная форма 8аР) вполне определяется, если / является р раз дифференцируемой в точке а.
Линейные формы 6^, . . ., 8{ар}, ... не являются мерами, так как они не определены на Z)0. Это примеры так называемых «об-
* Для начального знакомства с теорией обобщенных функций можно рекомендовать книгу Г. Е. Шилова «Математический анализ. Второй специальный курс». М., «Наука», 1965. Прим, перев.
27
общенных функций» или «распределений». Процесс введения обобщенных функций состоит в следующем:
1) выбирают функциональное пространство;
2) обобщенную функцию определяют как линейную форму на выбранном функциональном пространстве, удовлетворяющую некоторому условию типа непрерывности, аналогично тому, как это делалось при определении меры.
Таким образом, мы дадим следующие предварительные и неполные определения, действительные в /?/г.
Обозначения. Через D обозначим векторное пространство бесконечно дифференцируемых комплексных функций с компактными носителями.
Через Dm обозначим векторное пространство т раз непрерывно дифференцируемых комплексных функций с компактными носителями.
Если р т, то Dp cz Dm.
В дальнейшем мы часто будем говорить «т-дифференцируемая» и «оо-дифференцируемая» вместо «т раз непрерывно дифференцируемая» и «бесконечно дифференцируемая».
Определения. Назовем обобщенной функцией линейную форму на Р, удовлетворяющую некоторому условию непрерывности, уточняемому дополнительно.
Назовем обобщенной функцией порядка т линейную форму на Dm, удовлетворяющую некоторому условию непрерывности, уточняемому дополнительно.
Векторное пространство обобщенных функций обозначим через D'.
Векторное пространство обобщенных функций порядка т обозначим через .
Во избежание всяких противоречий в терминологии условия непрерывности выбираются таким образом, чтобы: а) всякая обобщенная функция порядка т, рассматриваемая на являлась при р т обобщенной функцией порядка р; б) всякая обобщенная функция порядка т, рассматриваемая на Z), являлась обобщенной функцией.
Кроме того, условие непрерывности, налагаемое на обобщенные функции порядка т, выбирается таким образом, чтобы при т = О оно сводилось к условию непрерывности мер; иначе говоря, оно выбирается таким образом, чтобы меры являлись обобщенными функциями нулевого порядка. Например, линейные формы Sa, 6д, . . ., 6дР) являются соответственно обобщенными функциями порядков 0, 1, . . ., р.
2. ИССЛЕДОВАНИЕ НЕКОТОРЫХ ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВ
Введем следующие обозначения:
DK — векторное пространство бесконечно дифференцируемых функций с носителями в компакте К;
28
£)% — векторное пространство т раз непрерывно дифференцируемых функций с носителями в компакте /С.
Рис. 1 схематически указывает отношения включения между
Р, DK, Dm,
Для всякой ограниченной непрерывной функции <р мы обозначим через ||ф||и норму равномерной сходимости:
Ml« = sup|q>(x)|. X ____________
Исследование пространства
У к
Пространство D% можно снабдить структурой нормированного векторного прост-
Рис. 1
ранства.
В /? полагаем
ШНЛЖЛ«+---+11М1И
(сумму, приведенную в правой части, можно заменить верхней гранью; тогда получим эквивалентную норму на
Аналогично, в Rn полагаем
mi + m2+“-mn
где через Dt (i = 1, . . ., ri) обозначена производная по Z-й переменной х1'. Мы предполагаем, что снабженное этой нормой пространство является полным, т. е. пространством Банаха.
Замечание. Легко видеть, что в R отображение f ->	является нор-
мой на и что эта норма определяет топологию на (иначе говоря, нет нужды добавлять к этой норме суммы || f ||м + • • • + ||	“^Не-
действительно, если f имеет носитель в [а, д], то
X Ш=р'; а
х	4
f' W = J
а
х
fdn-ц^ = J ' а
29
61кУДД
«гЬ(т) L
Таким образом, отображения ............................
суть нормы, менее тонкие, чем норма f -> ||	||а.
Это замечание можно перенести и на случай функций со значениями в Rn. Снабдим Rn нормой (например, обычной нормой евклидовой структуры). Пространство р-линейных форм на Rn будет иметь норму
||t/|| = sup|t/(/4,. ..,hp).	,
IIM^l
Тогда для Dx и p m можно положить || ML = sup ||/(₽)(< X
Пусть d — диаметр шара, содержащего К; по'теореме о конечных приращениях имеем
||f<p)||u<dOT-p||f(m)ll« (Р^т).
Следовательно, топология в	определяется нормой
'MIIMIL-.
Исследование пространства DK
Топологию пространства DK на 7? можно определить последовательностью норм:
f4\f{p}\\u, Р = 0, 1, 2....
Аналогично, на Rn топология пространства DK может быть определена последовательностью полунорм:
....*„ = о, 1, 2.....
где Di обозначает производную по i-й переменной, или, еще проще, последовательностью полунорм
MIIML. р = о. 1. 2....
Итак, является локально выпуклым метрическим пространством. Мы полагаем, что оно полное. Следовательно, это пространство Фреше.
Рассмотрим случай п = 1. Чтобы последовательность {Д-} элементов из DK стремилась к 0, необходимо и достаточно, чтобы, 30
какое бы ни было р 0, последовательность Д-р) стремилась равномерно к 0 (т. е. чтобы вместе с частными производными стремились равномерно к 0).
Если п принимает любые значения, то, для того чтобы последовательность элементов из DK стремилась к 0, необходимо и достаточно, чтобы, каковы бы ни были числа plt . . ., рп 0, последовательность Z)P1, . . . , Dpnnfi стремилась равномерно к 0 (т. е., чтобы fi вместе с частными производными стремились равномерно к 0).
Мы не определяем топологии в D и в Df\ так как ими неудобно пользоваться (хотл они полезны при теоретических исследованиях).
Теперь мы исследуем связь между пространствами и D^. Сначала дадим пример бесконечно дифференцируемой функции с компактным носителем:
а) в R (рис. 2)
s fW =
б) В
0, если
ехР (—если
|х|^1;
| х |	1;

если
если ||х||=^ 1,
где || х||2 = (х1)2 + • • • + (х'!)2.
Этот пример позволяет нам посредством аффинного преобразования осей построить функцию р*, обладающую следующими свойствами (рис. 3, при п = 1):
 pft бесконечно дифференцируема;
Ра > 0
' pk имеет в качестве носителя шар ||х|| -р
. | р* (х) dx = 1,
31
Предложение 1. Пусть f и g — две непрерывные функции с компактными носителями. Если g непрерывно дифференцируема т раз, то свертка f * g также дифференцируема т раз и (/*£)'=/* £', • • •; (f*£)(m) = /*£(т)-
Доказательство. Имеем
(/ * g) (х) = j f (х — у) g (у) dy = J g (х — z/) f (у) dy.
Доказательство предложения следует из возможности дифференцирования под знаком интеграла, стоящего в правой части.
Замечание. В Rn предыдущее предложение принимает вид
w?.	„	( rnX rn„ \
Di •Dnn(.f * g) = f *\Dl •Dnng), где
mi H— •+ mn^. m.
Предложение 2. Если /С Z>°, то f * p& равномерно стремится к /, когда k стремится к бесконечности.
Доказательство. Имеем
(f * Ра) (*) = J fix — у) pk (у) dy =
II У II < 1/А
= f (xk) J (у) dy = f (xk),
II у II
где xk — элемент шара с центром в х и радиусом r!k.
Следовательно, поскольку f равномерно непрерывна, f * р/г равномерно стремится к f.
Отметим, что f * рл € D, так как (f * р^)(р) = f * plp). Более того, если / С Dp, то (/ * р^)(р) = /(р) * р/г стремится равномерно к
Заметим, что предложение остается верным, если значения функции f принадлежат конечномерному векторному пространству, (достаточно изучить отдельно любую компоненту вектора f).
' Теорема 1. Для всякого замкнутого шара>К множество D% плотно в Dk при р т, а множество плотно в Dp^.
Доказательство. Так как a D^, то достаточно доказать вторую часть теоремы. Пусть f £ D%. Для % < 1 функция х—>/(%/%),/ принадлежащая D™, имеет носитель в шаре %/С и стремится к f в D% при %, стремящемся к 1. Для доказательства теоремы достаточно показать, что для / С D% с носителем в шаре КД (X < 1) существует последовательность функций gk £ стремящихся к f в смысле топологии пространства D%.
Тогда можно принять gk = f*Pk- Для достаточно большого k функция gk имеет носитель в 7<; следовательно, gk € DK. Более того, gk равномерно стремится к f и при g т последовательность 32
(ё^) “	* Pfc равномерно стремится к f{q} при й—>сю. Сле-
довательно, gk стремится к f в D™.
Мы теперь в состоянии дополнить определение обобщенной функции.
Определение. Обобщенной функцией называется линейная форма Т : f J /• Т, определенная на D и обладающая следующим свойством непрерывности:
(СС) Для всякого компакта /( сужение Т на есть непрерывная линейная форма.
Число J f-T называется интегралом от функции f относительно обобщенной функции Т.
Условие непрерывности можно еще выразить в следующей форме: для всякой последовательности функций f z € D с носителями в фиксированном компакте К, равномерно стремящихся к О вместе с частными производными, последовательность \fi-T стремится к О/
Эквивалентность этих двух формулировок вытекает из метризуемости пространства
Обобщенной функцией порядка m называется линейная форма Т :: f —> J f-T, определенная на Dm и удовлетворяющая следующему условию непрерывности:
(ССт) Для всякого компакта К сужение Т на D% есть непрерывная линейная форма.
Условие непрерывности может быть выражено еще в следующей форме: для всякой последовательности функций fl С Dm с носителями в фиксированном компакте /С, стремящихся равномерно к 0, вместе с их частными производными порядков, меньших или равных т, последовательность J fb-T стремится к 0.
Эквивалентность этих двух формулировок следует из того, что D™ является пространством Банаха, а следовательно, метри-зуемым пространством. Можно слова «любая частная производная порядка заменить словами «частные производные порядка т» или «производная порядка т».
Замечание. Для того чтобы проверить условия (СС) или (ССт), достаточно взять в К семейство шаров с центром 0 и произвольно большими радиусами.
Примеры. Всякая мера есть обобщенная функция порядка 0, и наоборот. В частности, всякую локально интегрируемую функцию <р можно отождествлять с мерой, для которой она является плотностью относительно меры Лебега, и, следовательно, можно рассматривать как обобщенную функцию. Значение этой обобщенной функции для f £ D записывается в виде
4-со
J Лф = J f W Ф (х) dx.
—:со
Заметим, что является обобщенными функциями порядка р.
3 Р. Паллю де Ла Барьер
Рассмотрим теперь обобщенную функцию Т, определенную в R:
4-00
t=0
Для всякой конкретной функции f g D ряд, записанный справа, есть конечная сумма. Поэтому величина j f-T является вполне определенной.
Если К = [—г, + г], где г £ Z+ и fa g то
i=0
следовательно, если ft вместе с производными порядка — 1 стремятся к О равномерно, то | fa-T также стремится к 0.
Отсюда следует, что Т является обобщенной функцией, не определенной ни на каком из пространств Dm\ это обобщенная функция «бесконечного порядка».
Важно знать, можно ли обобщенную функцию (определенную на D) продолжить в обобщенную функцию порядка m (определенную на Dm). Практическим критерием такой возможности может служить следующая теорема.
Теорема 2. Для того чтобы обобщенную функцию Т (определенную на D) можно было продолжить в обобщенную функцию порядка m (определенную на £>т), необходимо и достаточно, чтобы Т удовлетворяла следующему условию: каков бы ни был компакт Д', сужение функции Т на DK должно быть непрерывным относительно топологии, индуцированной пространством т. е. чтобы для всякой последовательности функций 6 D с носителями в фиксированном компакте /С, равномерно стремящихся к 0 вместе с частными производными порядков ^т, последовательность J Д • Т стремилась к 0.
Доказательство. Условие необходимости очевидно. Покажем, что оно является и достаточным. Для всякого замкнутого шара К через Тк обозначим сужение Т на D%. Так как Тк непрерывна относительно топологии, индуцированной пространством то Тк продолжается в линейную форму 7^, непрерывную на D^.
Пусть / б Dm и К — замкнутый шар, содержащий носитель отображения /. Положим
Легко показать, что определение J f-Tm не зависит от К-
34
Действительно, пусть К с К'- Тогда имеются следующие включения:
Ок cz Djc
П П
/>к W
и индуцирует на линейную форму Т^, а на — линейную форму 7\ (ибо Тк есть сужение линейной формы Т^> на Ок)-
Поэтому Т^' индуцирует на линейную форму, которая сама индуцирует на форму Тк и которая, следовательно, может быть только непрерывным продолжением формы 7\ в Т™. Таким образом, Т% есть сужение формы на Ок-
Следовательно, если /С О$ и Кс.К', то
р-?к = р-7Т-
Отсюда получаем, что если К и К' —два замкнутых шара, содержащих носитель отображения /, то
= р-7^.
Действительно, если К" — замкнутый шар, содержащий К и К', то
Отображение Тт, которое является вполне определенным, будет линейным:
(О
J = %
так как, если К — замкнутый шар, содержащий носитель отображения /, то
J (X/). Тт = f (X/) -	= X J f -Т% = X J f Tm,
(»)
Действительно, если К — замкнутый шар, содержащий носители отображений f и g, то
J(/ + £).Tm = f(/ + g).T£==
= J f -П + Jg• Т’к = J f-Tm + J g-Tm.
3*
35
Остается проверить, что Тт непрерывна на Dm. Это очевидно, поскольку сужение Т™ функции Тт на D™ является непрерывным в О%.
Следствие. Пусть Т — обобщенная функция. Если для всякого компакта К сужение функции Т на непрерывно относительно топологии равномерной сходимости, то Т можно продолжить в некоторую меру (единственную).
В этом случае для простоты говорят, что Т есть мера.
Замечание. Чтобы доказать, что обобщенная функция является продолжаемой в обобщенную функцию порядка т, достаточно проверить условие, сформулированное в теореме 2, беря, например, вместо К семейство шаров с центром О и произвольно большими радиусами.
Определение. Говорят, что обобщенная функция Т является положительной, если для всякой положительной функции . /, принадлежащей £>, справедливо неравенство j
Теорема 3. Всякая положительная обобщенная функция является положительной мерой.
Доказательство. Пусть К — замкнутый шар. Пусть ф — функция, обладающая следующими свойствами: ф 0, ф С D и ф (х) = = 1 для х G К-
Пусть /6 DK. Тогда
откуда
- lift f f-T^fWu J Ъ-Т, т. e.
На основании следствия теоремы 2 можно заключить, что обобщенная функция Т является мерой. Пусть f Е Z)°, f 0. Допустим, что f имеет носитель в шаре А и пусть К = ХЛ, где % > 1. Применим предложение 2. Тогда для достаточно большого k имеем / * > 0 и f>	D^. Отсюда
( f-T = lim f f* pk-T^O.
Следовательно, T — положительная мера. Теорема доказана.
Носитель обобщенной функции. Продолжение обобщенной функции
Пусть А — замкнутое множество. Говорят, что обобщенная функция Т имеет .носитель в Л, если j f-T = 0для всякой функции f£Dc, носителем в С Л. Можно показать (но мы здесь этого делать не будем), что существует наименьшее замкнутое множе-36
ство Л, обладающее таким свойством. Его называют носителем обобщенной функции Т. В действительности, понятие «иметь носитель в» вполне достаточно для формулировки многочисленных теоретических результатов и удобно. Обобщенная функция часто имеет носитель в замкнутом множестве Л, хотя сам носитель точно неизвестен. Заметим также, что если 7\ и Т2 — ^ве обобщенные функции с носителями в Л, то всякая линейная комбинация функций 7\ и Т2 также имеет носитель в А.
Для обобщенной функции Т, заданной- явно, вообще говоря, не трудно определить ее носитель. Например, легко проверить, что ба, ба, . . ., бдР) имеют в качестве носителя {а}.
Замечание. Для меры ц имеем J /• |л=0, если / обращается в нуль на носителе меры |Л. Обобщенная функция этим свойством не обладает. Например, из
(«)) — О не следует, что / равна нулю на носителе функции ба, т. е.
в а.
Наоборот, мы имеем J /*Т = 0, если / обращается в нуль в окрестности1 носителя функции Т. Это свойство следует из определения. Если Т имеет носитель в Л и если / обращается в нуль в окрестности множества Л, то Jf-T=O.
Используя предыдущие понятия, распространим определения обобщённой функции на некоторые оо-дифференцируемые функции с некомпактными носителями.
Определение. Пусть Т — обобщенная функция с носителем в А и / — бесконечно дифференцируема с носителем в В.
Если множество А П В ограниченное, то положим
где ф — функция из £>, равная 1 на окрестности множества А П В.
Для обоснования этого определения необходимо убедиться в в том, что оно не зависит от А, В и ф. Покажем справедливость этого утверждения, например, для ф.
Пусть ф1, ф2—две функции, равные 1 на открытом множестве С, содержащем А П В (это множество можно положить одним и тем же для фг и ф2). Функция / (фт—ф2) имеет носитель в В П С С, а значит, в С А и, следовательно,
рОЬ-'М-т = 0.
Легко проверить, что Т можно продолжить и сделать линейной формой на пространстве оо-дифференцируемых функций, носитель которой пересекает носитель Т по ограниченному множеству.
1 Назовем окрестностью множества Е всякое множество, в котором расположено открытое множество, содержащее Е.
37
Примеры. I. Обозначим через <§ векторное пространство комплексных оо-дифференцируемых функций с любыми носителями, а через — пространство обобщенных функций с компактными носителями.
Для выполнения условия Т £ (S’ необходимо и достаточно, чтобы существовало компактное множество К, в котором Т имеет носитель.
Для f & и Т £ можно определить j fT. Продолжение в этом случае осуществляется по формуле

гдеф — функция из D, равная 1 в окрестности носителя функции Т или в окрестности множества Л, если известно, что Т имеет носитель в К.
Таким образом, всякая обобщенная функция с компактным носителем продолжается в линейную форму на <S.
Можно показать также, что всякая обобщенная функция порядка m с компактным носителем продолжается в линейную форму на векторном пространстве^’'71 комплексных ш раз дифференцируемых функций с произвольными носителями. Через обозначим пространство обобщенных функций порядка ш с компактными носителями.
Например,
S(m) £ И
j f.= (_ l)m fW (a), v /
II. Множество А из Rn будем называть ограниченным сверху (соответственно снизу), если для любого х из А все его компоненты ограничены сверху (соответственно снизу).
Пусть f £ <S и Т С Р'. Тогда для Т с ограниченным снизу носителем и для f с ограниченным сверху носителем (или наоборот) можно определить j f-T. Таким образом, всякая обобщенная функция с ограниченным снизу носителем продолжается в линейную форму на пространстве оо-дифференцируемых функций с ограниченным сверху носителем.
Через />+ обозначим векторное пространство обобщенных функций с носителями в 7?^ (говорят еще «с положительными носителями»). Если функция /Е имеет ограниченный сверху носитель и Т G DT, то j f'T вполне определяется.
Топология в D'
Снабдим пространство D' топологией простой сходимости на Z). Из определения этой топологии следует: чтобы последовательность Ti обобщенных функций сходилась к 0 в £>', необходимо и достаточно, чтобы для любого f <z D последовательность J f-Tt сходилась к 0.
После определения топологии в D' можно рассмотреть ряды, членами которых являются обобщенные функции. Ряд Tt i будем называть коммутативно сходящимся к сумме S (S — обоб-38
щенная функция), если для любого f £ D справедливо равенство
i
причем ряд, стоящий в левой части, абсолютно сходится.
Например, в R рассмотрим обобщенную функцию Т, определенную равенством
4-со j f-T= (о-i=0
Тогда можно записать
4-СО т= S (—W’. 1=0	•
3. ДИФФЕРЕНЦИРОВАНИЕ ОБОБЩЕННЫХ ФУНКЦИЙ
Мы дадим определение дифференцирования обобщенных функций, являющееся развитием определения дифференцируемых функций.
Рассмотрим пространство R, Пусть ф — непрерывно дифференцируемая функция; тогда для всякой f£D имеем
j /.ф' = [/ф]±“ — J /'.ф = —J /'.ф.
Эта формула позволяет дать следующее определение.
Определение. Производной обобщенной функции Т назовем обобщенную функцию (обозначим ее через Т' или DT), определяемую по формуле/
\f-DT = | f-T' = -.[/'• Т
Следовательно, всякая обобщенная функция Т на R допускает производные DpT = произвольного порядка. Имеем
J f -DpT = J f/Г® = (—1)₽ j • T.
Пример. В R обобщенная функция представляет собой производную функции да. Действительно, имеем
р< = -Г(а) = -р'.6а.
Аналогично обобщенная функция, которую мы обозначаем через есть p-я производная обобщенной функции Ьа.
39
Таким же образом в Rn получаем естественное обобщение определения дифференцирования функций, если положить
где через Dt обозначен оператор дифференцирования по i-й переменной.
Следовательно, всякая обобщенная функция Т на Rn имеет производные Di1, . . ., DPnnT любого порядка. Имеем
J /-Of1 • • •Z)nn7’ = (—1)Р1+ +p" j Di1 • • • DPnnf-T.
Заметим, что здесь можно менять порядок дифференцирования. Например,
J f • Di1   -DPnn8a = (- ])Pi+ "+Pn (of1 • • -Op7) (a).
Легко видеть, что если Т — обобщенная функция порядка т, то предыдущие формулы позволяют определить р-е производные как обобщенные функции порядка m + р. В частности, на R первая производная меры есть обобщенная функция порядка 1.
Наконец, заметим, что если Т имеет носитель в Л, то все ее производные также имеют носители в А.
Пусть ср — функция, обладающая разрывами 1-го рода и допускающая всюду, кроме точек разрыва, непрерывную производную ф' в обычном смысле. Нижеследующая теорема показывает, что производная в смысле обобщенных функций отличается от ф'. Поэтому £)ф мы используем для обозначения производной в смысле обобщенных функций.
Теорема 4. Если функция ф имеет разрывы 1-го рода в точках со скачком crz и обычную производную ф', непрерывную всюду, кроме точек ah то ее производная в смысле обобщенных функций вычисляется по формуле
Dtp = ф' + 2
L
Доказательство. Для простоты возьмем случай одного разрыва в точке а со скачком о. Имеем
а	4-оо
j/.£>ф=—р'.ф = — j /'-ф — j /'.ф = —оо	а
а	4-со
= - [/«pj-co + f /•<₽'- [/Tit” + J /•<₽ =
—оо	а
40
4-со
= —f(a)<P(a—0) + f(a)q>(a + 0)+ J f-<p' =
—co
4-co
= f (a) о + J f .ф' = J f .(<p' + u8a),
—co
что и требовалось доказать.
Пример. Функция Хевисайда 6?/, определяемая формулой
fl, если х^ 0;
имеет в смысле обобщенных функций производную D6# = 6.
Приложение. Если ср, ср', ср", . . . имеют разрывы 1-го рода в начале координат со скачками а0, сг2, . . то
Dtp = ф' -|_ аоб;
D2q = ф" атб -|_ сг06';
D3cp = ф„ + a2g + aig, + ао5„ .
Определение. Кумулятивной (или, примитивной) функцией для меры ц на R назовем всякую функцию F такую, что a^b~) J p,z=F(b') — F (а).
[а,Ь[
Из определения следует, что 1
F (а) + J р, если х
г , \	[Л. *[
Р W =	Г
F (а) — I р, если х а.
[х, а[
Мы видим, что кумулятивная функция для меры определяется с точностью до аддитивной постоянной.
Если ц — ограниченная мера, то обычно полагают
F W = J Z И-
—со, %[
Теорема 5. Всякая мера ц есть производная своей кумулятивной функции.
Доказательство. Положим а = О, F (о) = 0.
1 Автор придерживается обозначений, установившихся в современной французской математической литературе: [а, х[ означает [а, х). Для интервала (at b) употребляется обозначение ]а, Ь[. Мы решили везде сохранить обозначения автора. Прим. ред.
41
Достаточно показать, что для всякой f£D имеем ]/-р.= = —j f'-F. Пусть А — множество, определенное неравенствами (рис. 4)
|0	у <Zx при х	0;
(х	у <0 при х	0.
Пусть Ах и Av — разрезы множества Д по вертикали с абсциссой х и по горизонтали с ординатой у. Тогда
Н-СО Г
J f (x)sgn(x) J цу ~CO l"
dx =
= J Г J sgn.(x) f (x) dx

Ho
f sgn (X) f' (x) dx =	(+°°) - Hi/) при у > 0	1 = _f (y)>
I— [f (y) — f (—oo) ] при у	of
откуда
что и требовалось доказать.
Замечание. По теореме 5 интеграл р-р, от функции из D0 относительно меры р можно записать в виде j f'DF, r&eDF — кумулятивная функция для F. В литературе обычно употребляется обозначение j f'dF (интеграл Стилтьеса).
Можно показать, что всякая функция с ограниченной вариацией имеет в качестве производной некоторую меру. Этот результат позволяет интерпретировать теорию интеграла Стилтьеса в терминах понятий меры и обобщенной функции.
Дифференцирование мер позволяет сформулировать следующую теорему, относящуюся к локальной структуре обобщенных функций.
Теорема 6. Пусть Т — обобщенная функция на R. Для всякого компакта К существует мера р с носителем в К и число пг такое, что
f f- Т= J f -D^ (= (- 1)- J
Можно сказать, что на DK обобщенная функция Т выражается через производную надлежащего порядка некоторой меры.
42	’
Вообще говоря, число т зависит от рассматриваемого компакта.
Доказательство. Для всякого компактного промежутка К обозначим через Тк сужение функции Т на D%. По определению обобщенной функции Тк есть непрерывная линейная форма на для которой через 7\ (J) мы обозначаем значение \f-T для функции f G DK.
Так как Тк является непрерывной, то существует окрестность V точки 0 в такая, что
Нормы f—образуют последовательность, расположенную в порядке возрастания тонкостей. Следовательно, множества, определяемые неравенством ||/(р) ||м «С Ц, образуют для р целого и т] > 0 базис окрестностей в D%. Поэтому существует целое m и т] > 0 такие, что
Иначе говоря, является непрерывной относительно топологии, индуцированной на Dji пространством 2)^, и, следовательно, продолжается в непрерывную линейную форму на D^, и при f 6 Die имеем
p.T = 7^(f).
Рассмотрим теперь отображение Dm (f —>	из D™ в D^-
Пусть 2)4 — множество значений этого отображения, т. е. множество для / С D^. Так как топология пространства определяется нормой / —*	то Dm, а также его обращение
являются непрерывным взаимно однозначным отображением из D™ в (для того чтобы последовательность {/4 из D% сходилась-к 0, необходимо и достаточно, чтобы последовательность сходилась к 0 в D^. Следовательно, существует линейная форма L± на 2)4 такая, что
По теореме Хана—Банаха, Lr можно продолжить в непрерывную линейную форму Лг на Имеем также
Т%Ф = Ь2(П, Vft D%.
Рассматривая D\ как замкнутое векторное подпространство пространства непрерывных функций, стремящихся к 0 на бесконечности, и применяя снова теорему Хана—Банаха, мы мо-43
жем продолжить L2 в линейную форму на LOT, т. е. в ограниченную меру р. Тогда имеем
Если заметить р, через	— характеристическая функ-
ция множества К), то можно выбрать р с носителем в К-
Окончательно имеем
J f.T = Т% (Г) = J • И = (- 1)'" J
что завершает доказательство.
Замечание. Определим подпространство ЭЛ пространства условием g£ тогда и только тогда, когда
р= р' = ••• = jg(m-1) = O.
Оно имеет конечную коразмерность. Следовательно, продолжение формы Li в непрерывную линейную форму L2 делает необходимым иметь элементарную формулировку теоремы Хана—Банаха. Кроме того, если К — [a, b], то L2 продолжается в непрерывную линейную форму L3 на подпространстве пространства образованном функциями <р, исчезающими при х = а их — Ь, если положить
Ьз (ф) = (едф).
Продолжение Ls в непрерывную линейную форму на (т. е. меру) делает необходимым иметь только элементарную формулировку теоремы Хана—Банаха, так как & имеет коразмерность 2.
Замечание. I. Можно доказать, что в пространстве всякая обобщенная функция Т для любого компакта К совпадает на с суммой производной для мер.
II. При помощи предыдущей теоремы можно показать, что всякая обобщенная функция с компактным носителем имеет конечный порядок.
4. ПРЯМОЕ ПРОИЗВЕДЕНИЕ. МУЛЬТИПЛИКАТИВНОЕ ПРОИЗВЕДЕНИЕ
Обозначим через D (Е) пространство бесконечно дифференцируемых функций с компактным носителем в векторном пространстве Е и через D' (Е) — пространство обобщенных функций на Е.
Если f — функция двух переменных, то j f (х, у)-Тх обозначает значение интеграла от отображения х —» f (х, у) относительно обобщенной функции Т.
Предложение 3. Если f^D(ExF) и Т £ D' (Е), то функция <р, т. е.
У~* j f (х, у)-Тх,
44
принадлежит пространству D (F) и имеет производную
УJ fy (х, у)-Тх.
Доказательство. Легко видеть, что если К кН — два компакта из Е и F такие, что f имеет носитель в ДХН, то ср имеет носитель в Н. Кроме того, имеем
<р(& + k) — <р (&) _ г f(x, b-\-k) — f(x, b) Тх k “J k	'
_	, n ,	f (x, b + k) — f (x, b)
При >0 функция x—+	——------- стремится
в DK к функции x —» f'x (x, b); отсюда
lim ,Ф(Н.^НФ.(± = f fx(x, b)-T.
k^O	“	J
Следовательно,	x
~\f(x,y)-Tx==\Ky(x,y)-Tx.
Последовательно применим это правило й убедимся, что функция
У~>\[(х. у)-Тх
является бесконечно дифференцируемой.
Теорема 7. Пусть f С D (ExF), S € D' (Е), T^D (F). Тогда
(а)	*/);Н-Ту = J[J/(х, у) -Т*>.
Доказательства. Мы ограничимся случаем, когда Е = F = R. Пусть К и Н — два компакта из R такие, что f имеет носитель в ДхН. Пусть р и v —две меры такие, что. .
| S = Dp[i на DK;
I Т = D^v на DH.
Тогда
j [f f(x, y)Sx] Ту = f [J/ (x, -D^y =
W=
При помощи теоремы Фубини такое же выражение можно получить и для правой части равенства, и теорема доказана.
45
Обозначение. Обозначим через J f(x,y)*SxTy значение, общее для левой и правой частей равенства (а). Легко проверить, что SxTv есть обобщенная функция (т. е. линейное отображение, удовлетворяющее условию непрерывности (ОС) обобщенных функций). Тогда отображение Sx, Ту —» SxTv является билинейным отображением пространства D' (Е) X D' (Е) в D' (ExF). Обобщенная функция 8хТу называется прямым произведением Sx и Ту. Легко проверить, что если S имеет носитель в К, а Т в Н, то SxTv имеет носитель в КхН. Точнее, можно доказать, что носитель обобщенной функции 8хТу есть произведение носителей для S и Т.
Мультипликативное произведение
Определение. Для .ф£	(т. е. оо-дифференцируемой) и T^D'
определяем срТ по формуле
Mf^D.
Для обоснования этого определения заметим, что правая часть существует для всякой f£ D и что условие (СС) удовлетворяется..
Это определение можно обобщить на случай, когда ср £ <£т (т. е. /n-дифференцируемая) и Т £ (DmY.
Теорема 8- Если Т — обобщенная функция на 7?, то
(фТ)' = ф'Т + фТ'.
Доказательство. Достаточно проверить, что для всякой f£D имеем
=	+ J /.«pF,
т. е.
-р'.фТ = рф'.Т-4 (/ф)'.Т
или
J (Лр)'-т = J (/'ф + ф'Л-т.
Это следует из правила дифференцирования произведения двух * функций.
Замечание. Для обобщенной функции Т на Рп можно показать, что
где Di — производная по i-й переменной.
46
5. ИНВОЛЮЦИЯ И СВЕРТКА
В пространстве комплексных функций существуют две обычные инволюции—и определяемые равенствами
ш = Ж 7(х) = й=Т).
Мы определим также две инволюции Т —* Т н Т—+Т в D' по формулам
vfeD.
Если Т — некоторая функция (локально интегрируемая), то эти определения совпадают с определениями для обычных функций.
Кроме того, мы положим 7 = 7 (7 (*) = f (—х)) и Т = Т. Имеем
Заметим, что отображение Т —-> Т не является инволюцией, так как оно линейное. Мы его будем использовать только для упрощения некоторых обозначений.
Если Т имеет носитель в А, то Т тоже имеет носитель в Л, тогда как Т и Т имеют носители в —А.
Свертка двух обобщенных функций S и Т определяется для некоторых пар S, 7\ В этой главе ограничимся определением свертки двух мер, что позволит нам определить свертку двух обобщенных функций S и Т, налагая некоторые ограничения на носители этих обобщенных функций. В следующей главе мы дадим другое определение.
Определение. Свертка S * Т двух обобщенных функций S и Т на одном и том же пространстве Rn определяется следующей формулой:
p.S*T=Jf (х + y)-SxT«.
В этом случае должны выполняться следующие условия: а) правая часть определена для всякой f£D (Rn);
б) выполняется условие непрерывности (СС).
Возьмем три множества А, В и К. такие, что S, Т и f имеют носители соответственно в А, В и К- Положим f (х, у) = f (х + у). Функция f бесконечно дифференцируема в /?2п и имеет носитель в полосе К с уравнением х + у £ К- Кроме того, SxTv имеет носитель в АхВ. Следовательно, если (ДхВ)ПК ограничено, то
f f(x + y)-S*Tv = J?(x, frSW
47
вполне определяется. Если ^АхВ)(}К ограничено для любого компакта X, то условие а) по определению удовлетворяется. Это будет, в частности, при следующих двух обстоятельствах:
1) А или В — компактное (рис. 5);
2) А = В = /?+ (рис. 6) (иначе говоря, А и В ограничены снизу или сверху).
Ь На рис. 5 и 6 единицы на Ох, Оу и на главной биссектрисе выбраны таким образом, что отображение х, у х + у осуществляет проекцию на главную биссектрису.
Теорема 9. Пусть S и Т имеют носители, соответственно в Я и В. Если для любого компакта К полоса К с уравнением х + у£К пересекает АхВ по ограниченному множеству, то свертка S * Т вполне определяется. Условия теоремы можно сформулировать еще так: если х£ А, у£ В и сумма х + у ограничена, то х и у остаются ограниченными.
Доказательство. Мы видели уже, что условие а) удовлетворяется. Условие б) также удовлетворяется. Пусть— компакт и функция ос £ D (7?2п) равна 1 в окрестности множества (Л х X В) П К. Возьмем последовательность функций Д £ DK (Rn)-Тогда — бесконечно дифференцируемая функция с носителем в К. Имеем
J fr (S * Т) = J f,,(х + у) ,S*TV = Д (х, у) .S*T« =
= \ а(х, у) Ц(х, у) -SxTy.
Ноaft £ D(axb)[]k (R'2n>), и если ft стремится к 0 в DK(Rn), то af( стремится к 0 в D(a х в)Пк (R2n) и, следовательно, j fi (х + y)-SxTu стремится к 0.
48
Остановимся на двух основных случаях, когда S * Т определена:
1) S или Т имеют компактный носитель;
2) S и Т имеют положительные носители, т. e5S, Т g ZXp
*	Из определения следует теорема 10.
Теорема 10. Свертка коммутативна; если S * Т опреде-| лена, то Т * S определена и Т * S = S * Т.
Легко доказать следующую теорему.
Теорема 11. Отображение S * Т является билинейным 1 в следующих двух случаях: 1) S , Т D' (или S £ D' и 2) SeD'+, T£D'+.
Теорема 12. Если S или Т имеет компактный носитель или же ( S и Т имеют ограниченные снизу или ограниченные сверху носители, то
S * Т — S * Т\
(S * ту = S * Т;
1	(S * Т)'' = S * т.
Чтобы применить определение свертки, часто необходимо про-
* .дести вычисление J f (х + y)-SxTv, где f^D. Если не предполагать компактности носителя функции х, у—* f (х + у), то
) теорема 7 непосредственно не применима. Следующая лемма позволяет преодолеть это препятствие.
3	Лемма 1. Соотношение
»	f f(x+r/).5*^=1
справедливо в следующих случаях:
1) f£D и S имеет компактный носитель;
2) f£D и Т имеет компактный носитель;
3)/^и$иТ имеют компактные носители;
4) и имеет ограниченный сверху (соответственно снизу) носитель, a S и Т имеют ограниченные снизу (соответственно ’ сверху) носители.
Доказательство. Возьмем случай 1). Пусть К — носитель для f и S имеет компактный в А носитель. Предположим, что функция ос g D равна 1 в окрестности второй канонической проекции С множества (Лх7?п) П К.
Функция х, у —> ос (у) f (х + у) принадлежит пространству D (/?2“), поэтому
/	f f(x + y).S*Ty = f	+	=
= J[Ja(y)f(x + y)-S*]-7X
4 Паллю де Ла Барьер	49
i
Функция
У -> j а (у) f (х + у) • 8х = а (у) J f (х + у) Sx принадлежит пространству D (следует из предложения 3). Так как а может быть выбрана равной 1 в окрестности любой точки, то отсюда следует, что функция
У j f (х + у) • Sx
является бесконечно дифференцируемой. Эта функция имеет носитель в С. Следовательно,
J [J f (X + у)• 8х]• ТУ = J [J / (х + у) 8х] а (у).Ту =
= Ш f(x + y)a(y).Sx].Ty.
В случае 2) доказательство проводится аналогично. Если Т имеет носитель в компактном множестве В, то можно взять а С D, равную 1 в окрестности множества В.
В случае 3) полагаем, что S (соответственно Т) имеет носитель в компактном множестве А (соответственно В). Пусть а (соответственно (3)—функция из D, равная нулю в окрестности множества А (соответственно В). Тогда справедливо соотношение
J f (х + y).SxTy = J а (х) ₽ (у) f (х + y)-SxTy =
= J[Ja(x)P(z/)/(x + z/).8x]-7^ =
= jp(f/)[j a(x) P(x + f/) 8х].Ту =
=	+ И -Ту.
В случае 4) доказательство проводится аналогично предыдущему. Если S и Т имеют носители в А и В, где А и В ограничены снизу, то можно взять а £ § (соответственно (3 С с ограниченным снизу носителем, равную 1 в окрестности множества А (соответственно В).
Примеры. I. Вычислим 6 * S для S £ D'.
По определению имеем
р-6 * S= Jf(x+//) -6xS^= J [р (x+f/)-d*]-S^ =J f(y)-Sy = j f-S,
we*»,
откуда
d * S = S.
Следовательно, 6 является нейтральным элементом для преобразования свертки.
II. Вычислим д' * S для S £ В'.
50
По определению,
р.у *$= pCx + jOW-s^ J [ j f (x + j/).(6T]-Stf =
= J-r (f/)«y=J /-S';
отсюда находим основную формулу:
d'*S=S'.
В частности, имеем
6'* ба= Sa-
III. Известно, что операция 6а * f осуществляет сдвиг аргумента функции f на а.
Таким образом,
(«в*/)(х)=/(х-а).
По аналогии с этим 8а * S будем называть операцией сдвига обобщенной функции S на а.
Справедлива следующая формула:
p.s=pfl*f.6a*s (v/ez>),
которая выражает инвариантность интеграла относительно одного и того же сдвига функции и обобщенной функции. Действительно, j 6а * f-8а * S= j f(x — d) -8a* S =
= J [f f(x + y-d). 62] • Sy = J f(y) .S^\f.S.
Теорема 13. Пусть S £ D' и ф£<^. Тогда равенство
(S * ф) (a) = | ф (« — x) • Sx
выполняется в следующих трех случаях
1)	S имеет компактный носитель;
2)	<р имеет компактный носитель;
3)	S и ф имеют компактные носители.
Доказательство. Пусть f^T)- Тогда
J /-(S * ф) = J f (х + y)-Sx<? (у) dy =
= J [/(*'+ У) ф (У) dy]-Sx =
= j [ j / (и),ф (и— х du] •£* =
= J [J ф (u + x)-f(u)du] -Sx =
= j ф (и + х) • S*f (и) du = j [ j ф {и -j- х) S*] f (и) du.
1 Точнее говоря, функция и -> J (р (и—x)-Sx является представлением для S * ф.
51
Третье, пятое и шестое равенства вытекают из леммы Г*. Таким образом,
(S * ср) (и) = J ф (и + х) • Sx = J ф (и — х) • Sx.
Теорема 14. Пусть S, Т, U — три обобщенные функции. Тогда равенство
(S * Т) * U = S * (Т * U) справедливо в следующих двух случаях:
1)	S и Т имеют компактные носители;
2)	S, Т, U имеют положительные носители.
Доказательство.	то по лемме 1 имеем
J f • (S * Т) * и=J f (и + г) • (S * Т) “ и* = j [ J f (и + z) • (S * Т)“] • Uz=
= J [f + y+z)-S*Ty] • Uz = J [ j f (x + у+г) .S*] • TyU' =
= j[Jf(x + v)S*] -(T*U)V= J
Пример. Если T имеет компактный носитель или же Т и U имеют положительные носители, то
I/) = (д' $ Т) * I/, т. е.
(Т * U)' = Г * U, а также
<	Т * (д' * [/) = (Т * д') * Ut
т. е.
Т * U' = Г * U, откуда окончательно получаем
(Т * иу = Т' * U = Т * {/'.
Этот результат можно выразить следующим образом: чтобы продифференцировать свертку, достаточно дифференцировать один из сомножителей.
Обозначение. Если даны обобщенная функция Т и функция Д то мы положим
при условии, что правая часть имеет смысл.
Теорема 15. Равенство
<Л s * ту = (S * Д Т}
. справедливо в следующих случаях:
1)	два из элементов Д S, Т имеют компактные носители;
* Величина 3 введена только для облегчения применения леммы L
52
2)	S и T имеют ограниченные снизу носители, a f имеет ограниченный сверху носитель.
Доказательство. Имеем
<А S * Т> =4 Кх+ у) .s*T* = J [ f 7 (х+у) .$*]. ТУ =
= J [J 1(у-х)-S‘] ТУ = J (/ * S). Т = {f * S, Т).
Теорема 14 выражает свойство ассоциативности свертки. В следующей главе ассоциативность мы будем доказывать и в других случаях. Поскольку свертка не всегда определена, то при применении формулы
(S * Т) * U - S * (Т * U)
нужно проявить осторожность и убедиться, что мы имеем дело с одним из случаев, в которых она имеет смысл. Будем рассматривать «пространства обобщенных функций» (т. е. векторные подпространства £>')» на которых свертка всегда определена и введена структура алгебры. В таком случае будем говорить, что такое пространство обобщенных функций является алгеброй свертки. Мы имеем здесь два известных примера: — пространство обобщенных функций с компактными носителями и D'+ — пространство обобщенных функций с положительными носителями. Кроме того, с пространством обобщенных функций мы связываем пространство обобщенных функций С такое, что для S £ С п U Е имеет место S * U Е Тогда справедливость свойства ассоциативности проверяется следующим образом: если S, Т G С, то
s * т е с и (S * т) * и - s * (т * и).
На пространстве С свертка всегда определена и С есть алгебра свертки. Элементы пространства С называются свертывателями на а С — алгеброй свертывателей на
Например, <?' есть алгебра свертывателей на D'.
Чтобы применить формулу (S * Т) * У = S * (Т * [/), необходимо убедиться, что выполняется одно из следующих условий:
a)	S, Т и U принадлежат одной и той же алгебре свертки;
б)	U принадлежит некоторому пространству обобщенных функций, a S и Т — алгебре свертывателей этого пространства.
Рассмотрим алгебру свертки содержащую б. Так как обобщенная функция б является нейтральной для свертки, то к можно применить общие результаты о коммутативных алгебрах с единичным элементом.
В частности, пусть A £ Если существует Л_х такое, что А * Л_х = б, то Л_х является единственным. Величина А_± называется обращением свертки для Л, а Л —обратимым в алгебре свертки,
Если А обратимо в то уравнение Л * X = В имеет для В 6 Ж единственное решение X = Л_х * В.
-53
Алгебра свертки D'+ обладает еще следующим свойством, которое мы приводим без доказательства.
Теорема 16. Алгебра свертки есть алгебра без делителей нуля, т. е. если 67*7 = 0, то(7 = 0 или 7 = 0.
Отсюда вытекают следующие свойства. В D'+ справедливо:
1)	если уравнение А * X = В имеет решение, то это решение единственное (даже, если А не обратимо);
2)	всякое равенство U = V эквивалентно равенству, получаемому из него свертыванием с некоторой обобщенной функцией, отличной от нуля (из Р'+).
Пример. Имеем Щ и д' *	= д.
Следовательно, и д' являются взаимными обращениями при свертке.
Поэтому для (7, V £ Р-р следующие соотношения эквивалентны:
U=DV=d'*VnV=<2/*U.
6. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ
Непрерывность операций над обобщенными функциями
1.	Дифференцирование является непрерывным отображением. Пусть, например, в 7? дана последовательность обобщенных функций 7\-. Тогда для всякой f^D имеем
р.7-, = -р.Т„
Следовательно, если —> 0, то J /' . 7\—>0, поэтому Т'; —» 0. То, что D снабжена топологией простой сходимости на D (топологией не метризуемой), не достаточно для доказательства непрерывности отображения Т —> Т'. Поэтому, чтобы дополнить предыдущее доказательство, необходимо воспользоваться общим определением непрерывности. Мы оставляем это читателю, который может при этом воспользоваться доказательством теоремы 12 из. гл. 3.
2.	Умножение Т —» срТ на функцию ср С & есть непрерывное отображение из D' в D'.
Доказательство весьма элементарно, поэтому мы его не приводим.
3.	Примем без доказательства, что для обобщенной функции U с компактным носителем отображение Т —* U * Т является непрерывным отображением из Df в D'.
Векторные обобщенные функции
Пусть Е — пространство Банаха. Обобщенной функцией на Rn со значением в Е назовем всякое линейное отображение Т из D в В, удовлетворяющее следующему условию непрерывности: для всякого компакта К сужение отображения Т на DK есть линейное непрерывное отображение из DK в Е.
54
Для указания значения отображения Т в точке f^D мы будем по-прежнему пользоваться обозначением J f-T.
Если Е = 7??, то полагаем
J
р.т=
j
где отображения I4 — скалярные обобщенные функции. Если Е — пространство Банаха,-и х'—элемент сопряженного к Е пространства Е', то линейная форма /—* \\f-	является скаляр-
ной обобщенной функцией.
Дифференцирование векторной обобщенной функции можно определить так же, как и для скалярных обобщенных функций; например, в R оно определяется формулой
Jф.Т' = — jqp'-T, V<p€ D.
Мультипликативное произведение обобщается без труда. Напротив, определение свертки довольно трудно, поэтому оно будет введено для частного случая (см. гл. 5, 7).
ГЛАВА 3
ПРЕОБРАЗОВАНИЕ ФУРЬЕ
Теорию преобразования Фурье мы будем развивать на R. Далее мы укажем некоторые результаты, верные также на Rn, которые нам понадобятся в последующих главах.
1. ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ МЕРЫ
Обозначим через' М множество ограниченных мер на R. Множество ограниченных положительных мер будем обозначать через А1+. Всякая мера р £ М определяет некоторую непрерывную линейную форму на пространстве ограниченных непрерывных функций f и, в частности, на пространстве Lm непрерывных функций, стремящихся к 0 в бесконечности.
Следовательно, всякую меру ц С Af можно рассматривать как элемент сопряженного к Zoo пространства.
Положим
Ин|1= SUP |р-н|-f £ L<x> 1 II f II < 1
Если цЕ Af+, то || ц || = J |х. Всякую меру р £ М можно также рассматривать жак элемент пространства, сопряженного к пространству ограниченных непрерывных функций. Имеем'
IJ лиМн-ии V f ограниченная непрерывная, гДе ИЛ1« = sup If (*)|.
х g R
Теорема 1. Пусть р — некоторая мера. Если существует константа k такая, что
то р является ограниченной мерой.
56
Доказательство. Для простоты считаем р, действительной. Для всякой f Е £>+ имеем
(ЛН+ = sup (ф-рГ
J	[<р J
10<ф< f
Так как
то
vfep°+,
а также
VZ6P+-
Следовательно, f |л+ = sup ~	* реп+
I z<i
а также
j р“ /г.
Итак, рЛ и р“ — ограниченные меры; следовательно, ц является ограниченной.
Теорема 2. М является сопряженным к пространству непрерывных функций, стремящихся к 0 на бесконечности.
Доказательство. Пусть т — непрерывная линейная форма на La,. Сужение формы т на L>° (согласно предыдущей теореме) есть ограниченная мера р. Продолжение меры р на Leo — непрерывная линейная форма, которая совпадает с т, поскольку L>° плотно в Loo.
Замечание. М является только подпространством пространства, сопряженного к пространству ограниченных непрерывных функций. Иначе говоря, существуют непрерывные линейные формы на пространстве ограниченных непрерывных функций, которые не являются мерами. Доказательство этого утверждения выходит за рамки данного курса.
Топология на мерах
Определение. Широкой топологией (topologie vague) на множестве мер мы будем называть топологию простой сходимости на Р°. Последовательность мер рл широко стремится к мере р, если для всякой f £ L>° выполняется равенство
о»
57
В М можно рассмотреть две другие известные топологии.
Определение. Слабой топологией на М будем называть топологию, слабую в обычном смысле на сопряженном к пространстве. Последовательность мер С Af слабо сходится к мере jut С М, если для любой	выполняется равенство (1).
Определение. Узкой топологией (topologie etroite) на М называется топология, слабая в обычном смысле, когда М является подпространством пространства, сопряженного к пространству ограниченных непрерывных функций. Последовательность мер
С М стремится узко к мере р С Л4, если для всякой ограниченной непрерывной функции f выполняется равенство (1).
На М узкая топология является более тонкой, чем слабая топология, а слабая топология является более тонкой, чем широкая топология. На любом шаре || р|| А широкая и слабая топологии совпадают. Действительно, плотно в £ю, поэтому можно применить первую фундаментальную теорему о пространствах Банаха и Фреше (стр. 11)
Примеры. Если п -> +оо, то -> 0 слабо, но не узко, пдп -> 0 широко, но не слабо.
Лемма 1. Если последовательность ограниченных положительных мер рп. широко сходится к ограниченной мере р0 и если lim prt = р0, то для. всякого 8 > 0 существуют компакт К Н-Э-оо*'	J
и целое число N такие, что
n>:N =) рп(СК)<8.
Более того,
Но(СК)^8.
Доказательство. Первую часть леммы докажем от противного. Если бы условия леммы не выполнялись, то существовало бы 8 > 0 такое, что для всякого компакта К нашлась бы последовательность nk, стремящаяся к бесконечности, причем
(С К) > е.
Пусть Z>°, где 0 f 1. Применим предыдущее свойство к носителю Д функции f. Существует последовательность nk —> —> + сю такая, что
j j— s;
отсюда следует
f /‘Но f Но —8.
Это свойство, справедливое для всякой D° такой, чточ О f sg 1, противоречит определению J «fio. Вторая часть леммы вытекает из того факта, что отображение р —* р (й) для всякого 58
открытого Q является полунепрерывным снизу для р, принадлежащего пространству Af+ с широкой топологией. В самом деле, имеем
р, (Q) — sup /• р (7 g J t f < ей
и отображения р —* j	р непрерывны для р, принадлежащего М+
с широкой топологией.
Теорема 3. Если последовательность ограниченных положительных мер рЛ‘широко сходится к ограниченной мере р и если lim J prt = I р, то последовательность рЛ узко сходится П->со J	J
к р.
Доказательство. Пусть f — ограничена и непрерывна; возьмем М такое, что М. По предыдущей лемме для всякого е существует компакт Д' такой, что
р (С Д) &/М и р,„ (С К) г!М при N.
Пусть <р £ D° (О Ф «С 1) равна 1 на К. Тогда
I f — f ФI {
на С /С;
= 0 на
откуда
| J ЛН» — |/ф-Нп| е при п N
И
I J /• И — J/ф-ИI ^8-
Так как имеет компактный носитель, то существует N± такое, что
Afi => | J /Ф-H»—j/ф-н| < 8, откуда при п js max (#!, N) справедливо неравенство lfr-Нл—J Лн | < 38>
что завершает доказательство.
Подмножества множества М'
Рассмотрим пространство L1 функций, интегрируемых относи- _ тельно меры Лебега (определенных с точностью до функций, равных нулю почти всюду).
Всякой функции f G L1 можно сопоставить меру f (х) dx с плотностью f (х) относительно меры Лебега. Таким образом, L1
59
можно отождествить с частью пространства 7И. Норма меры f (х) dx равна норме функции f в L1: Ц/Цз. = J |/|.
Эта идентификация позволяет естественным образом рассматривать всякую часть пространства L1 как часть пространства Л4, в частности как пространство £>° непрерывных функций с компактным носителем или пространство D бесконечно дифференцируемых функций с компактным носителем.
2. ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОГРАНИЧЕННЫХ МЕР
Пусть р — ограниченная мера. Ее преобразование Фурье З^р представляет собой функцию от одной переменной со, определяемую формулой
(^ р) (со) = J * рх;
индекс х при р указывает, что при интегрировании со рассматривается как параметр, иначе говоря, х является переменной интегрирования.
Теорема 4. З^р является непрерывной функцией и К^" н) (®)| <114
Доказательство вытекает из теоремы Лебега (или его следствия, относящегося к интегралам, зависящим от параметра), поскольку |eZ(0A; |	1.
Частный случай. Если р = f (%) dx, то полагаем р = &"f. Таким образом, преобразование Фурье функции f <z L1 определяется по формуле
4-СО
f) (со) = j ei(i)xf (х) dx.
Примеры. I. Пусть да — мера Дирака в точке а\ тогда
gz-6a(w)= jeI'“x.6a = eMa.
II.	Пусть f (х) = -j—тогда
+°О
П (“) = f eiaXdx =	1 “1
—со
(это можно показать, например, методом вычетов).
3.	ДИФФЕРЕНЦИРУЕМОСТЬ ПРЕОБРАЗОВАНИЯ ФУРЬЕ
Теорема 5. Если р — ограниченная мера и если функция х—> х интегрируема относительно р,то STр является дифференцируемым * и (#~р)' = г^(хр).
* Здесь обозначает преобразование Фурье меры, являющейся произведением р на.функцию х -> х. Далее, мы пишем xf (х) £ L' вместо того, чтобы говорить, что функция х-> xf (х) интегрируема относительно меры Лебега. Через
(xf W) обозначим преобразование Фурье функции х -> xf (х) и т. д.
60
Доказательство вытекает из теоремы о дифференцировании под знаком интеграла, зависящего от параметра.
Следствие. Если L1 и xf (х) € L1, то SFf дифференцируемо и
= i SF(xf (х)).
Примеры. I. Проверим теорему для |Л = да.
Имеем
(^6fl)(co) = e‘™ и	'
(хда) = IP* (ада) = ia&'ba,
т. е.
i [F №)] (®) = iaelaB> = ~ (е1аа>).
И. f W = -j-^r 6 Ь1. но xf (X) =	$ Г.
В данном случае' Sff (<о) = ле~ * фактически не дифференцируема.
4.	ПРЕОБРАЗОВАНИЕ ФУРЬЕ ПРОИЗВОДНОЙ ОТ ФУНКЦИИ
Теорема 6. Если f — непрерывно дифференцируемая функция такая, что f, f С L1, то
ЭТ) (®) = -i® (<Ff) (®).
Доказательство. Имеем
X
Их)-НО) + Jr о
Следовательно, f (х) имеет пределы при х—> -фоо и при х —> —•> —оо. Так как /Е L1, то эти пределы могут быть только нулями. Тогда, интегрируя по частям, находим
(iFf) (®) = J el(axf' (х) dx = [ela>xf (х)]	—
—со	—со
+?
— J i(oeiax f (х) dx = — j® (Ff) (®).
 —co
Следствия. I. Если f непрерывно дифференцируема и /, f' E L1, то при co —> oo имеем (&~f) (co) — О (1/co).
II.	Если f бесконечно дифференцируема и все ее производные принадлежат L1 (в частности, если	то для любого k
имеем (^/) (со) = О (1/сой) и, следовательно, для любого k имеем также f (со) = о (1/со^). Это свойство можно выразить так: «/ быстро убывает на бесконечности». Эти результаты можно улучшить, если воспользоваться следующей теоремой.
61
Теорема 7 (Лебега). Для любой L1 справедливо равенство
lim (^7) (ю) = 0.
(0->оо
Доказательство. Рассмотрим на L1 форму и® вида
(D = (^7) («)•
Тогда |ии||<;1, поскольку | (3*7) (со) | ==с ||/||Li (фактически имеем || ми| = 1, так как норма функции иа совпадает с нормой функции х—> eiax в £“).
Для f£D имеем lim (f) = 0. Так как D плотно в £х,
СО->оэ
а функция «о принадлежит единичному шару сопряженного к Z1 пространства, то для всякой f £ £х имеем lim иа (/) = 0.
5.	ТЕОРЕМА ПЛАНШЕРЕЛЯ
Рассмотрим преобразование определенное равенствами
(^*ц) (и) = J е~1<ЛХ• цх при цЕ М;
4-00
(^*7) (®) = j e~ie> f (х) dx при /Е L1. —со
Это преобразование называется сопряженным преобразованием Фурье. При выполнении условий, аналогичных условиям предыдущих теорем, имеем
(^»' = — 1^* (хр);
(<^*П (®) = i® (<T*f) (®);
(^7)' = W (х)).
Обозначение. Зададим меру ц и интегрируемую относительно ц функцию /; положим ~
<f, Р> = J Ли-
В частности, если fg интегрируема, то
(Л £> = f ~fe-
Если f и g принадлежат пространству L2 функций, измеримых и интегрируемых с квадратом относительно меры Лебега, то выражение <f, g) представляет собой обычное скалярное произведение, которое определяет в L2 структуру гильбертова пространства.
Выражение (/, р,> вполне определяется, если |л ограничена, а / непрерывна и ограничена.
Теорема 8. Если L1 и нЕТИ, то
и) = <Л
62
а также
p> = <A H>-
В частности, если f, g£ L1, to {<&!, g> = <f, <^*g)-Доказательство. В самом деле, имеем
(<^7, Н> = ШT&)e-iax-dx] = ИT13e-iwc -dx-p”
И
</,	= J [7w j e~iax• И“] dx = J j Цх) e-iax-dx^.
Замечание. Мы будем употреблять также следующие формулы, эквивалентные формулам из теоремы 8:
JVf .р,= р .-Fp., j sr*/.p=	(V/6Z-1. РЕМ).
Теорема 9 (частичная формулировка теоремы Планшереля). Если f£D, то
2"Jlfl2 = J |<O2 = f 1<^*Л2.
Доказательство. Пусть f g D п T — число такое, что f (х) = О Г Г i^l вне промежутка------g-, +-у .
Рассмотрим функцию fT вида | fT (х) = f (х)	г т т I
( fT (х + Т) - fT (х); при L ~2Г’ +~Н
функция fT — периодическая с периодом Т.
Коэффициенты Фурье вычисляются по формуле +4
Ор = у- j f(x)exp ip-^-x^dx =	(p .
__T_ 2
По формуле Парсеваля имеем + 772	+оо	+оо
4- J \fT(x)\*dx;= 21^13 = 4- 2|^*ф-4-)|2, — Т^	—оо	—со
т. е.
+J I Д(х) |Мх = А 2 ф (р ^-) > где Ф = |^7|2. —00	—00
63
Если мы примем Т = п2л, то получим
2л7|^)12^ = -г2Ф(“г)-
—со	—со
Правая часть этого равенства представляет собой полную массу меры
= X "ТФ (пг) SP/"-р=—со
Через Ek обозначим промежуток {k, k1]. При. п—> +<ю выражение (£)г) стремится к
й+1 j Ф (и) d®. k
Но
4-00
J Hn Ил
k——со
Более того, так как Ф (со) быстро убывает, то Ф (со) можно мажорировать интегрируемой функцией ф (со),, построенной на всех интервалах Ek. Имеем
4-00 &4"1	+°°
j ф (со) dco = j ф (со) dco.
k=—со k	—со
Тогда
*+i (В*) j (®) d®.
k
• Следовательно, ряд с общим членом (£&) (& — индекс суммирования) является равномерно сходящимся, поэтому
4-со	4-00
lim щ (Л) = lim £ р,„ (Eft) = 2 lim Н* (£&) =
П->ОО	n->co k=z—ai	k=—a>
4-о° Л4-1	+00
= 2 j Ф (®) d® = J Ф (и) d®, k=—со k	—со
т. е.
2л j | f (х) |а dx = J Ф (®) d®,
—со	—со
что и требовалось доказать.
64
Следствие. Если f, g£ D, то
4-co	4-°э
2л j fg = j g,
—co	—co
t. e.
2л (f, g) =	g).
Имеем также
2п-(/, g) = (^7,
6.	ПРОДОЛЖЕНИЕ ПРЕОБРАЗОВАНИЯ ФУРЬЕ НА L2
По предыдущей теореме преобразования ^/]/2л и ^*/)/2л
можно продолжить в два изометрических оператора на £2, для
которых мы сохраним обозначения <^7]/2л и <^*/]/’2л.
Соотношение (о77, g):={fi справедливое для f, g£ D, по непрерывности остается верным для f,g(~L2. Отсюда следует, что и являются .сопряженными один к другому, и поэтому ^/]/2л и (У"*/]/2л являются унитарными и взаимно обратными на £2:
Более того, соотношение = = (f, ,	справедливое g для
ZX TI £2, D, сохраняет силу как в случае, когда в качестве & взято его продолжение на £2, которое только что было определено, так и в случае первоначального определения^ на L1. Это показывает, что
продолжение преобразования Фурье на L2 совпадает на A1 Q L2 с первоначальным ‘ определением этого преобразования. На рис. 7 схематически показаны пространства, на которых определено преобразование Фурье, а также их взаимное расположение. Из сказанного следует теорема 10.
Теорема 10 (Планшереля). Если f £ L1 П £2, то 3TIPL2 и |2 = 2зтП Л2.
Если Д gE L1 П L2, то
J g = 2л j fg.
5 Р. Паллюде Ла Барьер
65
ж ч
7.	ПРЕОБРАЗОВАНИЕ ФУРЬЕ БЕСКОНЕЧНО
ДИФФЕРЕНЦИРУЕМЫХ ФУНКЦИЙ С БЫСТРЫМ	УБЫВАНИЕМ	•
Рассмотрим пространство 5 бесконечно	дифференцируемых	I
функций f, все производные которых быстро убывают, т. е. такие,	j
что х*/(Л) (х) —> 0 для любых h и k, положительных или равных	|
нулю.	!
Легко видеть, что если fg S, то сказанное справедливо	для f	?
и xf (х), а также для х*/<л> (х) или (xkf (x))h.	;
Очевидно, что
DcScL'ftL2.	!
Мы рассмотрим на 5 метризуемую топологию,	определенную	{
последовательностью (двойной) полунорм
f- \\xkf^ (х)||2
(||‘||2 обозначает норму в L2).
Последовательность функций fnQ S стремится к 0, если для любых h и k 0 имеет место соотношение
И!.*’ «1-0.
Отсюда следует, что || (xkfn	||2 —> 0, каковы бы ни были h
и k 0.
Очевидно, что относительно этой топологии два оператора f Г и f xf являются непрерывными.
Допустим, что 5 — полное пространство, т. е. пространство Фреше, и что D плотно в 5.
Если fn —> 0 в 5, то fn равномерно стремится к 0, так как
I fn (*) | =
X
j f'n(u)du
F2
^ll fn GO (1 + ^2) Ik J 12 •
Отсюда следует, что xkfy (x) —> 0 равномерно, каковы бы ни были h и k. Обратно, можно показать, что если xkfn} (х) —» 0 равномерно для любых h и k, то fn стремится к 0 в 5.
Теорема 11. Если/С 5, то ^/существует и принадлежит 5, а является на 5 изоморфизмом, обращение которого имеет вид 1 г* 2л:
Доказательство, Если f£S, то /£ Т1; следовательно, существует и дается формулой
4“СО
(^Г)(ОУ)= j f(x)eiaxdx.
—со
66
Кроме того, xkf С L1 для всякого k. поэтому является бесконечно дифференцируемой.
Так как (xkf)^ существует для всякого h и принадлежит а также
[(xkf)W] (CD) = (-to)* & [(Xkf)] (CD) = (-i^h (-i)k	(CD),
то для любых h и k величина соЛ	(cd) является ограниченной. Поэтому при любом k функция	быстро убывает.
Отсюда следует, что
Кроме того, если fn —> 0 в 5, то	—> 0 в 5, так как по
теореме Планшереля имеем
1И(ЛЯ||2	||2.
Так как и	являются взаимно обратными в £2, то
2л	г	’
это имеет место и в 5.
8.	ОБОБЩЕННЫЕ ФУНКЦИИ МЕДЛЕННОГО РОСТА
Обобщенной функцией медленного роста называется всякая непрерывная линейная форма на 5. Через S' обозначим пространство обобщенных функций медленного роста, которое представляет собой пространство, сопряженное к 5. Сужение обобщенной функции медленного роста на D есть обобщенная функция.
Обозначение. Значение обобщенной функции медленного роста Т для функции f£S будем обозначать через J f-T. Положим
<AT> = J/.T.
Если обобщенная функция Т непрерывна на D относительно топологии, индуцированной пространством 5, то ее можно продолжить по непрерывности на 5, и это продолжение есть обобщенная функция медленного роста. Для простоты мы скажем, что Т — обобщенная функция медленного роста и ее продолжение на 5 будем обозначать той же буквой Т.
Если Н — пространство Банаха, то* обобщенная функция медленного роста со значением в Н определяется как непрерывное отображение из 5 в Н. Это понятие мы будем употреблять только в гл. 7.
Примеры.. I. Всякая обобщенная функция с компактным носителем есть обобщенная функция медленного роста.
II. Всякая ограниченная мера р определяет (при помощи сужения на S) обобщенную функцию медленного роста. Действительно, отображение f-> j определено на 5, и если fn -* 0 в 5, то fn стремится равномерно к 0, поэтому J fn-\i стремится к 0. Следовательно, можно написать JfczS', в частности, L1, Sc=S'.
5*	67
III. Мера p, определяет обобщенную функцию медленного роста, если отображение f j непрерывно на D относительно топологии, индуцированной на D топологией пространства 5. Тогда по непрерывности предыдущее отображение можно прддолжить на 5. Если отображение f £ S интегрируемо относительно р, то интеграл J f-p, представляет собой значение продолжения на 5 отображения f -+ J f-р,, определенного на Z). Так, локально интегрируемая функция ср определяет обобщенную функцию, принадлежащую S', если отображение f ->
J / <р непрерывно на D относительно топологии, индуцированной топологией пространства Это имеет место, например, если ср — непрерывная функция с медленным ростом, т. е. такая, что существует целое k, для которого <р (х) а О (xk) при х -> оо. В частности, всякий полином есть обобщенная функция медленного роста.
Топология в S'
Мы используем слабую топологию или топологию простой сходимости на 5: последовательность Тп обобщенных функций медленного роста стремится к 0, если j f-Tn—> 0 для любого f £ S, или, в другой записи, если (/, Тп) —» 0 для любого f£S.
9. ДИФФЕРЕНЦИРОВАНИЕ ОБОБЩЕННЫХ ФУНКЦИЙ МЕДЛЕННОГО РОСТА
Производная Т' обобщенной функции Т медленного роста определяется аналогично производной любой обобщенной функции: \f-T'	vf€D.
Правая часть равенства непрерывна относительно f в топологии, индуцированной пространством 5 на £); такое же утверждение справедливо для левой части равенства. Отсюда следует, что Т' есть обобщенная функция медленного роста. Это равенство остается верным по непрерывности при f£S. Таким образом, можно сформулировать следующую теорему.
Теорема 12. Производная Т/ обобщенной функции медленного роста есть обобщенная функция медленного роста, и
p.r = _p'.T, vfes, .	
или
</, Г) = ту, yfes.
Заметим, что производная функции медленного роста не обязательно является функцией медленного роста, но ее производная определяет обобщенную функцию медленного роста. Кроме того, непрерывная функция медленного роста имеет производную в S', даже если она не дифференцируема в обычном смысле. Наоборот, всякая обобщенная функция медленного роста есть производная некоторого порядка непрерывной функции медленного роста. 68
Теорема 13. Оператор дифференцирования непрерывен в S'.
Доказательство следует из того, что производная в S/ совпадает срочностью до знака с сопряженной к производной в S. Применительно к данному случаю общее доказательство проводится следующим образом. Рассмотрим окрестность % точки О в 5'. Она определяется при помощи конечного числа g19 . . ., gk элементов пространства 5:
1.
В частности, имеем т. е.
г е%<=)| j 1.
Так как множество элементов Т £ S таких, что | J	1,
есть окрестность %' точки 0, то всякой окрестности % точки .0 можно сопоставить окрестность %' точки 0 такую, что
те%<=)ГсЛ'.
Отсюда следует, что отображение Т Т' непрерывно;
10. ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОБОБЩЕННЫХ ФУНКЦИЙ МЕДЛЕННОГО РОСТА
Определение. Если Т — обобщенная функция медленного роста, то ее преобразование Фурье определяется по формуле
</,	= П,
Это определение согласуется с определениями, данными ранее для Т £ М. или £2, поскольку приведенная формула остается верной в этих двух случаях. Следовательно, мы имеем дело с продолжением преобразования Фурье из пространств М и L2 на’5'.
Сопряженное преобразование Фурье на S' определяется по формуле
</,	= <<^7, Л, yfts.
Замечание. В дальнейшем мы часто будем пользоваться следующими формулами, эквивалентными формулам, приведенным выше:
=	vfts, T£S'.
Теорема 14. Преобразования Фурье ^7” и^"*, определенные на S'-, являются непрерывными изоморфизмами, и имеет место формула
69
Доказательство. Преобразование на 5' является сопряженным к преобразованию на 5. Следовательно, оно непрерывно (прямое доказательство аналогично доказательству, приведенному для дифференцирования). С другой стороны, преобразование ^*, определенное на'5', является сопряженным к преобразованию &\ определенному на 5; поэтому оно непрерывно.
Кроме того, преобразования^* и J^/2л являются взаимно обратными на 5, поэтому их сопряженные^ и d^*/2n взаимно обратны на 5. Отсюда следует, что — ^~*^~ = 2л (на 5'). Это можно проверить и непосредственно: для любых	и.
Т С S' имеем
(/, &~ЗГ*Т) = (^7, &~*Т) = Г) = 2л (f, Т),
откуда
^~*Т = 2лТ,
Следствие. Если для последовательности обобщенных функций Tri^S' справедливо соотношение ЗГТп—> 0, то Тп —> 0..
Пример. Вычислим преобразование Фурье для‘да. Оно определяется^ по формуле
(Л sr^ = (^7,	= - J (Р/)'Л = - Wyy («);
НО
(^7) (®) = J f (°) e~l(iiXd(f), №*{)' (©) = — i J ©/ (co) e~tax da), откуда
(^7)' (a) = -i j co/ (co) d©, (^7)' (a) = i j ©/ (©) eia® d© и
grs'a (co) = —iae1010.
Аналогично,
ST6(ak) (co) = (—ia>)keiaa> и, в частности, (co) = (—ico)ft, а также
ST*^k) (co) = (ico)*, 
t. e.
s(ft) = ^-^(Gw))*
или
^(co4) = 2л (—1)^.
70
11. МУЛЬТИПЛИКАТОРЫ В S И S'
Через От обозначим пространство функций ср таких, что qf£S, какова бы ни была f£S. Элементы из От называются мультипликаторами на 5. Эти функции являются бесконечно дифференцируемыми. •
Будем говорить, что функция ср . имеет медленный рост, если существует k 0 такое, что ф (х) = О (xk) при х—> сю.
Очевидно, что если функция ф и ее производная имеют медленный рост, то ф является мультипликатором на 5. Мы допускаем, что справедливо и обратное утверждение.
Заметим, что От есть алгебра.
Если ф G От и Т С 5', то фТ определяется по формуле
j f-m = J/ф-т’
или .	__
<А уТ) = {qf, Т).
Обратно, если ф — бесконечно дифференцируемая функция такая, что фТ Е S' для любой Т £ S', то можно, показать, что ф £ Offl*
" Таким образом, От есть алгебра мультипликаторов на S' и на 5.
Заметим, что Omc.S'. Например, всякий полином принадлежит пространству От.
Теорема 15. Пусть Т £ 5. Допустим, что Т — оператор, действующий на функцию от переменного со. Тогда
(^Т)' = ^(гсоТ) и (^Г)' =	(—
Доказательство. Имеем
= _ (/со^г*д Т) =	iaT) {f,
Следствие. Пусть Т g S'. Допустим, что — оператор, действующий на функцию от переменного со. Тогда
(Г) = цо^*Т и & (Т) = — гео^Т.
Доказательство. В первой формуле предыдущей теоремы применим преобразование к обеим частям и положим
<^Т = (/;
Тогда
2л ’ т. е.

71
12.	ИНВОЛЮЦИИ И СВЕРТКА
Отображения f—*f и /—»/ являются инволюциями на >5, а отображения Т —» Т и Т —» Т — инволюциями на S'.
Если /Е 5 и Т £ S', то
J/-T = / Гт или =7ГТУ,
j	или</, Т) = (/, Т).
Теорема 16. Справедливы соотношения



для fES и
для ТЕ S'.
Иначе говоря, две инволюции ~ и _ посредством преобразований или переходят одна в другую.
Доказательство. Если /ES, то
 оГ/(со) = J/(x)e‘“xdx = j/(—x)eiaxdx-
= f f (—x)e~iaxdx — f (x)eiaxdx = ^f(co), откуда
<^7 =
Положим = g и применим преобразование^* к обеим частям. Получаем 2л/ = <^'*g, т. е.
(c7'*g')~ = &T*g.
Если ТЕ S', то для всякой fES имеем
7, ^Т) = (<^*/, т> = <(<^7)~, т> =
= <^77 Т) = <д .гт> = </, ^7), Откуда
= ^Т.	.
Если / Е 5 и 17 Е S', то можно 'определить св.ертку U * / по Следующей формуле (раньше это было доказано для случаев, когда / или U имели компактный носитель или же / и U имели положительные носители):
(U * /) (х) = J / (х - у) U\
Тогда функция U * f является бесконечно дифференцируемой. Действительно, легко видеть, что для всякой f Е S функция
X-+	— f(x)]
72
стремится к f' в 5 при /г —> 0.
Поэтому
4 * /) (х + /г) - (U * D (х)] - f 4	+ h ~ ~ f •U"
и, следовательно,
lim 41(С7 * /) (х 4- /г) - (U * Л (х)]'= J Г (х—t/) • откуда
(и * fy (X) = J Л (X-//) -иу.
Аналогично,
(U^w(x) = \f(m\x~yyUy.
Через Ос обозначим подмножество множества 5', образованное обобщенными функциями медленного роста U такими, что U * f£S для всякой fES. Элементы Ос будем называть' свертывателями на 5. Множество Ос содержит все непрерывные функции с быстрым убыванием, а также все их производные любого порядка в смысле обобщенных функций. Всякая обобщенная функция с компактным носителем принадлежит множеству Ос.
Теорема 17. Если U £ О'с, -то оператор f —> U * /, определенный в 5, является непрерывным.
Доказательство. Этот оператор имеет замкнутый график. Действительно, если fn —> 0 в 5 и U * fn —> g в 5, то g = 0, так как U * fn просто сходится к 0. Заметим, что 5 есть пространство Фреше, поэтому всякий оператор на 5, имеющий замкнутый график, является непрерывным.
Определение. Если U 6 Ос и Т 6 S', то U * Т определяется по формуле и*т> = ту, vfes.
Это следует из того, что правая часть является вполне определенной (U * f С S) и что, если последовательность fn сходится к 0 в 5, то U * fn сходится к 0 в 5; следовательно {U * fni Т) сходится к 0. Это определение согласуется с определениями U * Т, данными выше (гл. 2, теорема 15).
Кроме того, отображение Т —> U * Т непрерывно в S'. Действительно, если Тп —> 0 в 5', то
lim(f, 67 * Тл> = lim {(7* Д 7\> = 0,
П -> 4- оо
При данном здесь обосновании можно также воспользоваться тем, что отображение Т —» U * Т в S' является сопряженным к отображению f —> U * f в S.
73
На основании данного определения Ос будем называть множеством свертывателей множества S' и множества 5.
Заметим, что Oc<cS\ поэтому U * V вполне определяется при U, V С Ос Мы видим, что Ос является коммутативной алгеброй свертки.
Теорема 18. Если U С Ос и /,	5, то
<и * f, g> = <и, g* f>-
Доказательство. Формула верна для f, g£ D. По непрерывности она верна также для f £ 5 и g б D -и, далее, для f, g£ S.
Теорема 19.
а)	Если p.,v С 7И, то (р * v) =	v
б)	Если U £ Ос и f £ S, то <&' (U * f) —
в)	Если U £ Ос и Т £ S, то (U * Т) =
= cTU:TT
гце&'ие От
Доказательство.
a)	[<^(p*v)]((o) = feI“z (p*v/ =
= J ёа {x+y}  pV=
б)	Пусть g<c S; тогда •
(U * f), g) = {U * f, ^*g) = • = .<t7, <^*g * Ъ =
= g-tf!) = g), откуда следует требуемая формула. Для U б О’с имеем
какова бы ни была f£S. Следовательно, для любого 5 имеем	S. Поэтому С От.
74
Пусть g £ 5, тогда'
(и * т), т, = = {т\ й* <^*g> = = i<^>	=
= {<3~Т, ^V-g) =	
= {^'T-^'U, g>, откуда следует требуемая формула.
Следствия. I. Если U, V £ Ос, то
и * V = V * и.
Действительно, это соотношение можно записать в виде
V) = <^г (V * U), т. е. з-и-з~у = ^V-FU.
II. Если U, V £ Ос и Т£$', то
(U * V) * Т = U * (V * Т).
Действительно, это соотношение можно записать в виде [(t/ * V) * Т] = & [I/ * (V * Т)], т. е.
(JJ * У) &Т = &-и & (V * Т), или
[3-U-3~V] PT = &U [3~V-3~T].
В частности, свертка ассоциативна на Ос- Поэтому она является алгеброй свертки.
Примеры.
I. Имеем — —но, откуда
(Т') = ЗГ (8' * T) = Sr8f^T = — id)^T.
II. Справедливо
ЗГ(Т * 8a) = ^T-ST8a = SrT^eia(ii
13. ПРИМЕНЕНИЕ К ПРЕОБРАЗОВАНИЮ ФУРЬЕ ОГРАНИЧЕННОЙ МЕРЫ
Теорема 20. На единичном шаре из 7И (т. е. на множестве мер с нормами =С1) слабая топология совпадает с широкой топологией и с топологией, индуцированной слабой топологией пространства S'. В этой топологии множество компактно и замкнуто в S'.
75
Доказательство. На единичном шаре из М слабая топология совпадает с топологией простой сходимости на всякой плотной части пространства в частности с топологией простой сходимости на D° (широкая топология) и с топологией простой сходимости на 5 (топология, индуцированная слабой топологией пространства 5')- Более того, М1 компактно относительно этой топологии, так как — единичный шар пространства, сопряженного к пространству Банаха. Следовательно, замкнуто в 5'.
Замечание. Множество М не замкнуто в S'.
Если последовательность мер тесно сходится к мере р, то просто сходится к 3р (по определению тесной сходимости). Нижеследующие теоремы посвящены исследованию сходимости мер, основанному на сходимости их преобразований Фурье.
Теорема 21. Если prt—последовательность мер такая, что: а) II Нп ||	1; б) [Ln сходится почти всюду к функции ф, то рп
слабо сходится к мере р с нормой такой, что ^р = ф почти всюду.
Доказательство. Для любого со имеем |5грЛ(со)|^ 1. Следовательно, | ф (со) | «С 1 почти всюду. Поэтому ф определяет обобщенную функцию медленного роста. По теореме Лебега
J f-^.-
для всякой / С 5; следовательно, > ср в S'; имеем
Нп—=	в S'.
Так как единичный шар из М замкнут в 5', то ^~-1ф есть мера р с нормой (такая, что ^р = ф почти всюду).
Теорема 22. Если к условиям предыдущей теоремы добавить, условия: в) prt 0; г) 3" сходится к ф равномерно в окрестности точки 0, то.р„ узко сходится к положитёльной мере р такой, что ^7~р* = ф почти всюду.
Доказательство. Функция ф непрерывна в точке 0 и [p, = cp(0) = lim(^'[x„)(0) = lim f |л„,
поэтому prt узко сходитсц к р. Более того,, р является положительной, так как широкий предел положительных мер является положительным.
Сформулируем еще одну теорему, которую мы используем в дальнейшем.
Теорема 23. Пусть prt — последовательность положительных мер с массой 1 и р — мера с массой 1. Если Згрп почти всюду сходится к #~р, то р„ узко сходится к р.
Доказательство. Действительно, согласно теореме 21, prt слабо сходится к р. Так как j рп сходится к J р, то р„ узко сходится к р.
76
14. ПРЕОБРАЗОВАНИЕ ФУРЬЕ С НЕСКОЛЬКИМИ ПЕРЕМЕННЫМИ
Для функций, мер или обобщенных функций на действительном конечномерном векторном пространстве Е теория преобразования Фурье строится аналогично. Понятия меры, ограниченной меры, обобщенной функции на Е определяются без затруднений, если использовать какой-нибудь базис пространства Е и перейти к случаю пространства Rn. Вернемся к этому вопросу в начале гл. 5.
Если р— ограниченная мера на Е, тоЗ^р определяется как функция на сопряженном пространстве Е' к Е по формуле

Пространство Е' можно заменить любым пространством, сопряженным, к Е,~в частности самим Е, если Е является евклидовым пространством.
Если Е = Rn, то положим
-х1-

и U = [Ult Un].
Хп
Тогда

Мы будем пользоваться формулой (р * v^^Fp-^Fv, которая легко обобщается.
Допустим, что преобразование Фурье ограниченных мер является взаимно однозначным. Мы используем также естественное обобщение результатов параграфа 13.
Сводка формул
В литературе известно шесть различных определений преобразования Фурье. Использование различных. определений обусловлено вкусами авторов и спецификой дисциплин, в которых они встречаются:
(SFf) (ю) = j f(x)eiaxdx-,
V 2л J
(srf)(<o) = J f (x) e2inax dx.
77
- Остальные три определения получаются заменой I на —I, т. е. заменой определений^- и^-*. Мы даем здесь список формул, основанных на первом и третьем определениях:
(5Г/)(®) = \ f (х) eiax dx-, (у>) = \ f (x) e~i<ax dx-
Теорема Пл аншер ел я:
, (^7)(ffl) = J f (x)e2i™Kdx;
(co) = J f (x) e~21nax dx.
\&-ТУ = &~(1хТУ, = ЗГ* (— ixTy &"Г = — 1&ТТ-, &"*Т’ = «о#-*?;
^'(6(ft))= (— ^-*(6ft) = (z(o)ft;
6Г fv\h _
_2л__ o(ft). (—£)Л 6 ’
1__ar*.
2л ’
(«У'Т)' = & (2глхТ);
(— 2inxT);
TT = — 2zn®^-7’; ^*7' = 2m®^*7; ST (6ft) = (— 2ш®)Л;
(Xй) = —Ц-6(/1);
v ’ (2in)h
&~*(xh) =------!—гб(Л);
v 7	(—2in)ft
ГЛАВА 4
ПРЕОБРАЗОВАНИЕ ЛАПЛАСА
1. Преобразование Лапласа мер с положительными носителями
Определение. Преобразованием Лапласа меры р с положительным носителем называется функция J?p комплексной переменной р, определяемая по формуле
Сначала функция определяется для значений ртаких, что e~pt является интегрируемой относительно р/. Потом, учитывая аналитичность функций ,2? и, в области ее определения, можно продолжить эту функцию.
Примеры. I. Справедливо
(^Sa)(p) = p-P<.S'a = е-"а.
Заметим, что — целая функция комплексного переменного р.
II. Если р имеет плотность f относительно меры Лебега, то можно положить 2?f = ^р, т. е.
4-00 (2?) (р) = J f(t)e~pt di.
О
Это определение применимо для всякой локально интегрируемой функции с положительным носителем. Пусть, в частности,
(%еС),
где
(0 = ( 0
при t О, при t < 0.
Тогда
4" со	со
(р) = J eKte~pt dt= J еа~р} * di.
0	Q
79
Интеграл в правой части равенства абсолютно сходится при Re р > Re %. Поэтому
В частности,
GW)(p)=^.
Таким образом, преобразование Лапласа для f (/) = QJ (t) eKt представляется в виде рациональной дроби.
Замечание. Две функции fi и fz с положительными носителями, локально интегрируемые и равные почти всюду (относительно меры Лебега), имеют одно и то же преобразование Лапласа.
Выясним теперь некоторые общие свойства множества значений р, для которых преобразование
(^р) (р) = J e~pt. р*
имеет смысл. Это множество состоит из значений р, которые обладают одним из следующих эквивалентных свойств: e~pi интегрируема относительно р*; e~pt • [i С Л (множество ограниченных мер).
Положим р = g + гт]. Тогда
e~pt = е~^е~^.
Следовательно, для того чтобы e~pt была интегрируемой относительно меры р/, необходимо и достаточно, чтобы функция е~& обладала таким свойством. Иначе говоря, множество точек, в которых e~~pt является интегрируемой относительно р*, инвариантно при чисто мнимых сдвигах. Это—полоса, покрытая прямыми, параллельными мнимой оси.
Кроме того, если для /? функция е~^ интегрируема относительно р , то е 5 также интегрируема относительно р при £ 3s Bi, поскольку
Следовательно, множество значений g таких, что интегрируема относительно pz, представляет собой либо открытая полупрямая ]g0, -j-oo, либо зам’кнутая полупрямая ]£0, 4~оо, либо все /?, либо пустая часть. Отсюда вытекает следующая теорема.
Теорема 1. Существует действительное число g0 (которое может равняться +оо или —оо) такое, что интеграл
-	(^н) (P) = p-₽V
имеет смысл при Re р > |0 и не определен при Re р < |0.
80	 •
Число So называется абсциссой интегрируемости. Заметим, что если |л имеет плотность f, то теорема показывает, что интеграл ,
+ со
• Ш) (р) = J f (0 e-pt dt .
О
абсолютно сходится при Re р > £0 и не абсолютно сходится при Rep <g0- Он может быть полусходящимся для значений р таких, что Rep<g0-
Таким образом, здесь нет полной аналогии с положением, с которым мы сталкиваемся при изучении, множеств абсолютной сходимости числовых рядов.
В дальнейшем мы не будем употреблять обозначение (<=27) (Р) для интеграла	z
4- со
J f (0 e~pt dt,
если он не является абсолютно сходящимся. В случае одной функции f абсцисса интегрируемости обычно называется абсциссой абсолютной сходимости (сокращенно абсциссой А. С.).
Примеры. I. (^да) (р) = j e~pi-Sa = е-~ар имеет в качестве абсциссы интегрируемости —оо.	'
II. При f (0 =	(!) еи
4- СО
(27)(p)=J e^-p^dt = —L_ о	р~Х
имеет в качестве абсциссы абсолютной сходимости ReX.
III. Если |л или f имеет компактный носитель, то абсцисса интегрируемости для или равна —оо. '
Теорема 2. Если | f (t) |	| g (t) |, то абсцисса абсолютней
сходимости для J?/ меньше или равна абсциссе.абсолютной сходимости для J^g.
Доказательство немедленно следует из определений..
Приложение. Если | f (/) | AeKt (%£ 7?), то абсцисса абсолютной сходимости для меньше или равна %.
Обозначения. В теории через J?7 можно обозначить преобразование Лапласа функции f. На практике часто f задаются их аналитическими выражениями в виде функций от t и от р.
Если F = то можно писать
f (0 □ Р (?)•
Примеры.
6 Р. Паллю де Ла Барьер
81
Некоторые формулы
Преобразование Лапласа является линейным; если и имеют абсциссы интегрируемости g0 и то абсцисса интегрируемости для 3? (яр, + fcv) меньше или равна max (£0, gj, и имеет место формула .
[=2* (ар + bv)] (р) = а (^р) (р) + b,(^v) (р), где
Re р > max (g0, gr)..
Следующая таблица содержит некоторые преобразования Лапласа.
НО
F (Р)
W) X
1 • .
— sm wZ со
COS G)t
1 u .
— sh tot to
ch tot
1 p2 (02 p p? + (02 1 P2 — (02 p • p2 — (02
Эти формулы выводятся из формулы
Отметим также следующее правило: если f □ F, то '/(4)zjuW) и-4(4)3Г(ад.
Теорема 3 (голоморфность преобразования Лапласа).
Если
(J?p) (р) = Je“PV
имеет абсциссу интегрируемости £0, то (J?|n) (р) является голоморфной функцией от р при Re р > g0, и справедлива формула
(^p)<fe) (р)=(-1)4-2* ОМ (р).
Иначе говоря, если f (0 J F (р), то (— V)kf (0 □ F(ft) (р).
82
•J i
i
Доказательство.
Пусть gx — абсцисса интегрируемости для (/р/)- Покажем, что: a) gi go- При всяком g > gx имеем
!	€ М,
откуда
<. б) пусть g>£0 и ге ни и-
Тогда
е~^ 6 М, откуда
te~#  р/ - te~	 р/ с М
и, следовательно, g gx.
Согласно пунктам а) и б) имеем £0 = li‘>
в) Г > g0. Допустим, что £ >> Г- Рассмотрим
’ как функцию двух действительных переменных g, т].
При условии применимости правила дифференцирования интеграла, зависящего от параметра, будем иметь
ад	J
(Л?р) (£ + *1) = - i J ter •!?.
Так как
то правило дифференцирования применимо. Поэтому d [(^р) (g + in)] = - (dg + i dT]) J te~.
Отсюда следует, что функция (g + ir[) голоморфна в по-< луплоскости g > g', а следовательно, и в полуплоскости g > g0 и что имеет место формула
(^р)' (р) = - J te~pt • р* =	(-/р')] (р).
Легко указать такЖе правило вычисления k-й производной.
Следствие. Если |л имеет компактный носитель, то является целой функцией. *
Приложение. Пусть
где а >0.
5*
83
При р >• 0 действительном имеем
4- со 1 dt=
о
4- со
1	1 f „а—1 и j 1 .
= Ж’71 'е du==~^’
X
(J?7) (р) — голоморфная функция от р при Re р >> 0. Поэтому
(^о(р)=4-
р
(это справедливо при действительном р £ /?+).
Теорема 4. Если «З’р имеет абсциссу интегрируемости |0, Too? (ewp/) имеет абсциссу интегрируемости |0 + % и справедлива формула
(р) = [Л? (р)] (р - X) при Re р > g0 + %.
Доказательство. Имеем
Эта мера ограничена для g — X, принадлежащих множеству интегрируемости для^р, откуда следует первая часть теоремы. Далее имеем .
[^(гМ] (Р) = f= [^(И)] (р-Х).
Приложение. Справедлива формула
„м ta~x г-,	1
Г (а)	(₽-%)“’	>
Связь между преобразованием Лапласа и преобразованием Фурье
Пусть |0 — абсцисса' интегрируемости для
(-?>) (р) = Je-pt^.
Положим Р ~ g + Й|- Для 5 > 5 О (и при В— Во, если пря- • мая g = g0 является частью множества интегрируемости) имеем (-?Н (5 + п) = J е- '/ = j е—• р.',
т. е.
(^и) (I + г-Л) V)] (л).
Эту формулу можно также записать в виде
(^р) (£-Нп)=[^*(е~М] 01), где через е~^' обозначена функция t—> е~^;
В частйос'ги, (если / — локально интегрируемая функция, то при | (а возможно и при g = go) справедлива формула (-27) (g + in)=[^(e~VW)] (П).
Эту формулу можно также записать в виде
(jff) (£ + »]) =[^‘(<^7)] (ц).
Если р — ограниченная мера или если f'£ L1, то
(-2» (in) = (^*р) (п);
(-27) (in) = (^=7) (п), т. е.
(^-р) (n) = ^р (-in);
(STf) (Л) =	(_ IT]).
Теорема 5 (преобразование свертки). Пусть р и v — две меры с положительными носителями, преобразования Лапласа которых соответственно имеют абсциссы интегрируемости Во, 11- Если Re р > sup (g01 gx), то
(р * v)] (р) = (^р) (р) • (^v) (р). .
Доказательство. Имеем
(е~р‘р) * (е~р‘ v) = е~р' (р * v). ур£С.
Следовательно, при g > sup (g0, gx) мера е~^' (р * v) ограничена и для Re р > sup (go, Bi) справедлива формула
J e~pt (р * v/ = J e-pt • p' • j e~pt • v‘, что доказывает теорему.
Следствия. I. Пусть р — мера с положительным носителем, go — абсцисса интегрируемости для J?p. При Re р >> sup (g0, 0) имеем
[^*pj(p) = -L(^p)(p).
Заметим, что почти всюду справедливо соотношение
* р) (0 = J р. [0, t [
Иначе говоря, * р почти всюду совпадает с кумулятивной функцией для р, равной нулю при t < 0.
Напомним, что соотношение f —	* р можно записать
также в виде р = S' * /; отсюда вытекает второе следствие:
II. Если р = 6'* /, то
(-2» (р) = р (.27) (р), при условии, что Re р больше абсцисс интегрируемости для и J?p. Этот результат остается в силе,' если р заменить локально интегрируемой функцией.
85
2. ПРЕОБРАЗОВАНИЕ ЛАПЛАСА ОБОБЩЕННЫХ ФУНКЦИЙ
Мы ограничимся обобщенными функциями Т с положительными носителями, т. е. обобщенными функциями Т f Z>+, обладающими следующим свойством:
(А) Т — производная надлежащего порядка некоторой функции с положительным носителем, преобразование Лапласа которой имеет абсциссу абсолютной сходимости, отличную от +оо.
Более глубокое исследование показывает, что это ограничение позволяет охватить и те случаи, которые требуют определения преобразования Лапласа более общими приемами, чем те, которое мы здесь употребляем.
Определение. Для Т Q	такой, что Т = Dkf и	имеет
абсциссу абсолютной сходимости £0, положим
(=ZT) (р) = pk	(р) (при Re р > go).	(2)
Тогда является голоморфной функцией при Re р > g0. Мы покажем, что это определение представляет собой продолжение определения, данного в предыдущем параграфе, и что оно не зависит от выбора k.
Заметим, что если определить двумя различными методами (в. одном случае как голоморфную функцию при Re р > 0, в другом случае — как функцию, голоморфную при Re р >> Ь), то достаточно убедиться, что эти два определения совпадают при Re р > шах (а, Ь), т. е. что это имеет место и при Re р > с, где с > шах (а, Ь).
Пусть Т — мера. Если Т = Dkf, то формула (2) справедлива для Re р, превосходящего абсциссы интегрируемости для f и Т.
Кроме того, если Т = Dkf = Dhg, где k < h, то имеет место f = Dh~k g, откуда находим
(^Л(р) = р”-Ч^)(р)
и
Pfe (^f) (р) = Pft W
при Re р, превышающем' абсциссы абсолютной сходимости для f и g.
Таким образом, законность данного нами определения показана.
Пример. Пусть DkJrl6y. Тогда
(2’6(*’)(p) = Pft+1(^)(P) = Pfe+1 — = Pfe-
Из определения преобразования Лапласа обобщенной функции Т вытекает, что является функцией, голоморфной в полуплоскости Re р > а.
Теорема 6. Справедлива формула = J? (fT).
86
Доказательство. Пусть
Т = Dkf, (^Т) (р) = р* (^f) (р).
Т0ГДЭ (^Т)' (р) = kp^ (^f) (р) - pfe (tf)] (р);
(tT) = ^(tDkf) = <S? [Dk (tf) — kDk~ V] и, следовательно,
(tT)] (р) = р» [Я (tf)] (р) - kp*-' (&f) (р).
Теорема 7. Пусть Т и U — две обобщенные функции из D^, обладающие свойством (Л). Тогда
(Т * U) =
Доказательство. Пусть Т = Dkf и U = Dhg. Тогда
T*U = Dk+h (f * g).
Следовательно,
(^Т) (р) = pk (JZT) (р);
(^U)(p) = p^(^g)(p)
(Т * [/)] (р) = р*+* [J? (f *g)] (р) = =pk^(^f)(p).(^g)(p).
Следствие. Если Т = DkU, то (^Т) (р) = р* (^U) (р). Эту формулу можно также получить непосредственно, основываясь на определениях ТТТ и
Теорема 8. Имеет место соотношение .
(^(е^Т)](р) = (^Т)(р-Ь).
Доказательство. Мы допускаем, что теорема верна для всякой обобщенной функции Тх вида Dkf. Теперь мы покажем, что она верна и для обобщенной функции вида Dk+*f.
Пусть Т — Dk+lf = DTlt где Tr = Dkf. Имеем е^Т = еи DTt = D (еи TJ —	Tlt
(е^ DTJ] (р) = р^ (е» Т.) (р) -	(е^‘ 7\) =
= (р-Х)х(^Т1)(р-Х).
Так как
и?(ЯЛ)].(р) =Р(^Л) (р),
то формула доказана также для Т.
Теорема 9. Пусть Т = Dkf и имеет абсциссу абсолютной сходимости go- При g >g0 справедлива формула
87
Доказательство. 1Аъ\ считаем, что £0 > 0 (другие случаи приводятся к этому случаю, если положить Т = eatT0, гдеа + £о > 0. Тогда мы получаем
.. (.ST) (5 + й) = (£ + X (=27) (I + 17]) =
= (£+ ;*])* [^*(^7(0)] (п) =
= (I + if])k[^ (е-У •	* • • • *	* Л] =
= (5 + iri)k[<r* (e-VW (П)	T)] (n) =
= [^ (е-^Т)](л).
3. ФОРМУЛЫ ОБРАЩЕНИЯ
Учитывая <;вязь между преобразованием Лапласа и преобразованием Фурье, мы можем заключить, что если З’Т равно нулю при Re р > а, то Т = 0.
Теорема 10. Пусть F —	£0— абсцисса абсолютной
СХОДИМОСТИ ДЛЯ И £>.£()• Если функция J]-—> F (£ + Й]) интегрируема, то
^4-ICO f(') = T>7 f F(p)‘”ip £—ico
(почти всюду относительно меры Лебега).
Интеграл в правой части простирается по прямой с абсциссой g в направлении возрастания т].
Доказательство. Имеем
F (£ + *]) =	(0)] (л);
отсюда почти всюду
4-00
е-57(/) = 2_ J р (g 1Л)
4-СО
J F £+Z11)et <5+1'л) d^’
т. e. почти всюду

14-loo
j F (p) dp.
88

dp, g>0;
Теорема 11. Пусть F (р) — функция, голоморфная при Re р > 0 и непрерывная при Re р 0. Допустим, что*/7 при Re р 0 удовлетворяет условию вида
Существует функция f с положительным носителем такая, что р.= ^[ с абсциссой абсолютной сходимости, меньшей или равной 0, причем функцию f можно выбрать непрерывной и стремящейся к 0 при / —> оо. Тогда
= F (i-ц) е‘^ d-ц.
—со
Доказательство. Пусть
s+too J F(p)ept
—со
При фиксированном g функция F (£ + и)) ограничена и, кроме того, при ц —» оо
F(l + iv])=.O (т^-).
Следовательно, интеграл	• _
—J-CO
j F (g + it]) eW d-ц
—co
абсолютно сходится для любых g и t. Справедлива оценка
из которой следует, что приведенный выше интеграл сходится равномерно относительно g. и t. Следовательно, функция (/) непрерывна относительно пары g, t.
Покажем, что (/) не зависит от g. Так как fo(O = lim^(O, £->о
то достаточно показать, что (/) =	(/) при 0 <g2 <gi.
Пусть
8 = A1(0-fgt(0= ’
11+too	Ь+too
= 2^ J F^ePidP~4l J F(p)eP»dp.
b—too	b—too
89
Возьмем контур у = 71 + 7г + 7з + 74 четырехугольника, образованного точками + iR, + iR, с выбранным на нем положительным направлением (рис. 8).
Тогда
8==^2ЙГ i F(p)e^dp.
«->со V1+Vs
Так как F (р) голоморфна при Re р > 0, то
8 =	F(p)eRdp =
R-+ СО V<+V2
1-	1
= lim 2l3X
J F(g + zR)e<?+‘«) .Ь
Sf
R/g —J F(l — iR)e^-iVtd% &
и, следовательно,

Г Правая часть стремится к 0 при У? —> оо; отсюда следует, что 8 = 0. Через f (/) обозначим значение (независящее от функции (/). Имеем, в частности,
Рис. 8.
fW = + J F {Irj) e1*'Л].
Поэтому f непрерывна, ограничена и стремится к 0 на бесконечности. Кроме того,

V?>0,
t. e.
Ce& 2g • .
Пусть t < 0. Устремим g к +оо; тогда f (/) = 0. Мы видим, что f ограничена, поэтому абсцисса абсолютной сходимости для =57 является отрицательной или нулем.
Наконец, формула обращения преобразования Фурье, примененная к формуле (3), позволяет получить для g > 0 следующее выражение:
-Ьсо
F (g + /Л) = J ПО е-^е-^ dt =	+ й]),
что завершает доказательство теоремы. 90
Замечание. Условия предыдущей теоремы не позволяют утверждать, что -f £ L1. Этот факт можно установить в частных случаях, если использовать свойства дифференцируемости функции т] -> F (fq) и то, что 2л/ является преобразованием Фурье этой функции.
Следствие. Если функция J4 * * 7 (р) голоморфна при Re р > с и удовлетворяет условию
Q при Rep>c,
то F (р) является преобразованием Лапласа функции f с положительным носителем, такой, что имеет абсциссу абсолютной сходимости, меньшую или равную с.
Доказательство. При всяком сг > С функция F (р — cj = F± удовлетворяет условиям предыдущей теоремы. Существует функция такая, что F\ = причем абсцисса сходимости является отрицательной или равной нулю. Тогда
F = ^f, где f = ec^f±9
причем абсцисса сходимости меньше или равна сг. Так как можно выбрать сколь угодно близким к с (но больше с), то абсцисса абсолютной сходимости меньше или равна с.
Теорема 12. Если F (р) голоморфна при Re р > с и удовлетворяет неравенству
F(р) ^С\р\т при Rep>c, то F (р) есть преобразование Лапласа обобщенной функции Т
с положительным носителем.
^(Р) р^+2
Доказательство. Функция
удовлетворяет условиям при-
веденного выше следствия. Следовательно, она есть преобразование Лапласа функции f. Тогда F (р) является преобразованием Лапласа для £)™+2Д
Замечание. В обозначениях предыдущей теоремы можно будет вычислить Т. Имеем Т = Dm+2f, где	•
£4-tco
/со
(при | > 0, превосходящем абсциссу абсолютной сходимости для J&f).
4. ТЕОРЕМЫ О НАЧАЛЬНОМ И КОНЕЧНОМ ЗНАЧЕНИЯХ
Чтобы интерпретировать теоремы, сформулированные в этом параграфе, приведем некоторые дополнительные сведения о мерах. Назовем совершенной прямой (обозначим ее через /?) мно-
жество /?, к которому присоединены две точки +оо и —сю. Снаб-
дим /? топологией, определенной следующим базисом окрестно-
91
стей: фундаментальной системой окрестностей точек % =£ +’оо будем считать систему окрестностей в /?; . фундаментальной системой окрестностей точки +оо (соответственно —оо) является объединение точки 4-оо (соответственно —оо) с дополнениями ограниченных справа (слева) множеств в /?.
Отображение Arctg, дополненное условиями Arctg (+оо) = =n/2,Arctg(—оо) =—л/2, есть гомеоморфизм из R на [—л/2, +л/2]. Отсюда следует, что 7? является компактным.
Пусть Ф — множество функции /, определенных и непрерывных на R и имеющих пределы при +оо и —оо. Всякую f £ Ф отождествляем с ее непрерывным продолжением на R, определенным условиями
f(-4-oo)= lim./(/), /(—оо)= lim f(t). f->4-c°	—00
Отображение f —* /otg есть изоморфизм из Ф на пространство функций, непрерывных на	+-у]- Относительно топо-
логии равномерной сходимости имеем
11/11 = II Mg||.
Мерой на R называется всякая линейная форма р, непрерывная на Ф. Всякой мере на R можно сопоставить меру рх на R с носителем в £—+ -у], такую, что
J f-Н = J А-И1, где Л = Мё-
Мера рх называеся образом меры р при отображении Arctg. В частности, рассмотрим меры, определенные по формулам
j f.6+00 = f(+oo);
при f £ Ф,
образы
8 « н
+ 2
которых при отображении Arctg соответственно равны б я • Кроме того, всякая ограниченная мера, за-~~2
данная на R, определяет мёру на R, поскольку любая функция f Q Ф интегрируема относительно ограниченной меры на R.
Снабдим меры на R топологией простой сходимости на Ф. Тогда имеем
и <=> j Ли»-» j Ли; v f С ф-
_ Для того чтобы рд стремилась к р, необходимо и достаточно; чтобы образ последовательности рд стремился узко (или широко) к образу меры р.
92
Лемма 1. Пусть р,д — положительная мера на R с полной массой, равной 1. Если для всякой замкнутой окрестности V точки а выполняется равенство lim р,д (У) = 1, то рд узко и->оо
стремится К бд.	'
Доказательство. Из соотношения [лп (v) + (О V) = 1 получаем, что |л„ (CJ7) —» 0. Пусть f € Do- Имеем
[ f-Pn —	([f — J [f —/(«)!• f If—
J	v	 cv
Возьмем 8 > 0. Выберем V такое, что х С V —> | f (х) — — f'(a)\^e.
Тогда
J [/ —/(а)1-Ип|^е-v	I
Пусть N такое, что
иЛ/ =>р.„(0V)211flL ‘
При п N имеем
J lf-f(a)]-
СИ
==^е,
и, следовательно,
|	— /(a)|==s2s.
Следствие. Если [л„ — положительная мера на R с полной массой, равной 1, и если рп ([Д, 4-оо ]) стремится к 1 при всяком А-, то |л„, рассматриваемая как мера .на R, стремится к 6_|_т.
Теорема 13. Мера (0 е~м dt при X Е /?+ является положительной с полной массой 1.
При % —> + оо эта мера узко стремится к 6. При Л —» 0 она стремится к 6+<Х).
Доказательство. Имеем
+<»
% J e~Mdt = 1. о
Для исследования предела при % —> + оо можно использовать предыдущую лемму или тот факт, что преобразование Фурье имеет вид
*
Преобразование Лапласа равно
X р + X
93
и просто стремится к 1 при % —> + -оо. Поэтому мера (t) e~Kt dt узко стремится к 6 при %—> +оо. Кроме того, имеем
4-СО
limX f е~м dt = Пте-Хл = 1.
д	Х->0
Следовательно, мера Х4/ (/)' е~м dt стремится к 6+оз приХ—* 0.
Следствие. I. Для всякой ограниченной непрерывной функции f справедливо равенство
limpF(p) = /:(0), где F —
(р->4-СО ’ \р£К
II.	Для всякой функции /Е Ф имеем
lim pF (р) = f (+ оо), где F = Д? (ftff).
fp->0
Ьб*-
Приведем некоторые результаты, улучшающие утверждение этого следствия.
Теорема 14. Пусть f — функция с положительным носи-
телем, имеющая преобразование Лапласа = F. Тогда:
а)	если f имеет предел справа при t—» 0, то
limf (/) = lim pF (р);
lp->-|-co
б)	если f при t—>стремится к определенному пределу, то имеет абсциссу абсолютной сходимости	и справед-
ливо равенство
- lim/(/) = limpF (р).
—со	(pg/?
1р->0
Доказательство, а) Покажем сначала, что если f равна нулю . на отрезке [0, е] (в >• 0), то
lim pF (р) = 0.
р^+со
Пусть такое, что
j If (t)\e-W 6#<4-oo. О
При р > go имеем
j I f (О I ре-pt dt = j I f (t) I е-Ы ре(р-Ы t dt < 8	8
^pe-(p-5o)e j | f (t) | e-^f dt.
8
94
При р —* Ц- оо последний член стремится к 0. Наше утверждение доказано.
Предположим теперь, что
lim f (t) = 0.
Пусть 8 > 0. Существует т] такое, что для 0 t т] имеет место \f (t) | sC 8. Далее,
4-co	Y|
J pe-pf f (0 dt = j ре-р* f (/) dt +
0	0
- 4-00
+ \ pe~ptf(t)dt,
n где
n j pe-pt p о
и, кроме того, 4-CO
lim f	dt = 0.
Следовательно,
существует' Р такое, что при р Р имеем
pe-^f^dt ^2е,
откуда
4-СО
lim [ ре-Р* f(t)dt = O. р->4-со о
Положим
тогда
откуда
т. е.
limf (t) = а\
lim [f (t) - a<V (01 = 0, f->4"0
lim (pF (p) — d) = 0, p->4“03
lim pF (p) = 0.
p->4-CO
б) Положим теперь, что
lim f (t) — 0. f->4-°°
95
Пусть 8 > 0. Существует А такое, что при t А имеем | / (/) ^ е. Тогда
b00	A	-4~oo
j pe~p‘ dt — p j e-pt f (t) dt 4- j pe~pf f (t) dt.
0	a
о Функция
является целой;
А
р —* J e~pt f (/) dt
Q
следовательно,
A
limp f e~ptf(t)dt == 0.
p->0 Q
Кроме того,
[ pe~Ptf(t)dt
A
Следовательно, существует т] такое, что при О^р «с г] имеем
откуда
4-со lim [pe-P(dt = O. р->о о
Положим теперь
(	lim f (t) — а.
£->-}-СО
Имеем 
lim[f (0 —aV(01 = 0, /->о
откуда
lim [pF (р) — а] = 0, р-»0
т. е.
 lim pF (р) = а, "	р->0
что завершает доказательство.
5. ПРИМЕНЕНИЯ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА
Из многих приложений преобразования Лапласа мы выберем применение к уравнениям в свертках. Из не рассмотренных здесь упомянем решение некоторых дифференциальных уравнений 96
с переменными коэффициентами и уравнений в частных производных.
Рассмотрим уравнение в свертках: а * х = Ь,
где а, Ь, х — обобщенные функции с положительными носителями.
Если а и b имеют преобразования Лапласа Л и В, а уравнение имеет решение в D'+ (обязательно единственное) с преобразованием Лапласа X, то
А (р) X (р) = В (р),
откуда
V /л\ ___ & (?)
Достаточно исследовать (при помощи таблицы преобразований Лапласа) оригинал функции X (р).
Этот метод не применим в двух случаях:
если а или b не имеют преобразования Лапласа;
если уравнение а * х = b имеет решение, для которого не существует преобразования Лапласа.
Поэтому можно сказать, что если а и Ъ имеют преобразования Лапласа и если В (р)/А (р) есть преобразование Лапласа обобщенной функции х с положительным носителем, то эта обобщенная функция является единственным решением уравнения а * х = b в D+.
Элементарным решением уравнения а * х — b (в D'+) называется решение (единственное, если оно существует) уравнения
а * х^ = 6,
т. е. обращение для а в алгебре свертки Z)+.
Если xQ допускает преобразование Лапласа, то оно равно
Тогда общее решение уравнения а * х = b имеет ’ вид х — — х0 + b.
Дифференциальные уравнения
Метод решения дифференциальных уравнений при помощи преобразования Лапласа состоит в следующем. Данное уравнение заменяют уравнением в D+, которому удовлетворяют произведения неизвестных данного уравнения на Начальные значения исходных неизвестных дадут соотношения между обычными производными и производными в смысле обобщенной функции модифицированных неизвестных.
Р. Паллю де Ла Барьер	97
Примеры. I. Решить систему дифференциальных уравнений
с начальными условиями:
х (0) = 0;
V (0) = — 1;
У (0) = 1.
Заменим исходную задачу следующей: найти две функции х (О и у (i) такие, что
х	* (О = У (О — 0 при t<Z О,
х (/) и у (0 дифференцируемы при и их производные удовлетворяют системе (4) при t^> 0:
х(+0)	0; х' (+0)= -И J/(+0)= 1.
dx dy
Соотношения между обычными производными и производными в смысле^ обобщенной функции Dx и Dy имеют вид
Dn=^ + 6.
Отсюда получаем следующую систему:
Dx 4- Dy — 6 — х + у = е2';
D*x + 6 + Dy — 6 = Зе2'; т. е.
(D — 1) х + (D + 1) у = 6 + е2';
D2x + Dy = Зе2'.
Пусть X = ^х, Y = Jfy. Получаем
(р-1)Х + (р+1)У=1 + ^2;
p*X + pY = -^. р 4
Решение этой алгебраической системы имеет вид
Y — _ Р2 — 4р — 3	.
Л~ р(р2+1)(р-2) ’
Y _ У3 ~ Р2 ~ 3Р + 3
~ р(р3+ 1)(р-2) •
98
Разлагая на простые дроби, находим
>	х =____3 ,	7	,4	р-3 .
2р 10 (р —2)	5 ’ р2+ 1 ’
у =____3	1	4 Зр + 1
2р 10 (р — 2) “г 5 р2 4- 1 ’
откуда
х(0 = — 4+4cosZ~ -ТГ5’П/(ПРИz>°) Z 1U	О	о
у (о=—4+4re2i+’4cos/+4sin 1 (при 1 >0)-
II. Найти элементарное решение в уравнения
х" — Зх' + 2х = 0.
Оно является решением уравнения
D2x — 3Dx+ 2х= d, откуда
(ра _ Зр + 2) X (р) = 1 (X = 3?х), т. е.
у ГМ =	1	=	»	= "I ,	1
W р2-Зр+2	(р—1)(р—2)	р-1	р-2
х (Z) = — е f 4-е2* (при t > 0).
Интегральные уравнения типа свертки
Пример. Решить уравнение
t
J sin.(£— 9)x(9)d9~/2 при о
где.х имеет положительный носитель.
Уравнение имеет вид а * х — Ь, где
а (0 =	(0 sin /, b (0 =	(0 Z2.
Переходя к преобразованию Лапласа, получим
1 V / nX 2(Р2+1) _ 2 , 2
Р2 + i Л W ~ Р3 “ р -1- рЗ и х(0 = (2+	1
Если дано уравнение
t
jsln(/ — Q)y(Q)d(Q) = 2t (/^0),	(5)
о
99
у с положительным носителем, то таким же образом получаем
—5—— у (р) — — р2 _|_ 1	р2 >
откуда
Y(p) = 2 + -^
И
У = 26 + 21Щ (f)-
Следовательно, уравнение (5) не допускает решения в виде функции.
Уравнение а * у = с, где а (/) = sin с (Q = 2<V (0 имеет
решение
у = 28 + 2Щ (0 (в Р;) *.
Очевидно, что у = Dx, так как с = Db.
6. ПРЕОБРАЗОВАНИЕ ЛАПЛАСА ВЕКТОРНЫХ ФУНКЦИЙ
Преобразование Лапласа без труда обобщается на случай функций f с положительными носителями и со значениями в конечномерном пространстве Е. Соответствующим выбором базиса можно отождествить Е с пространством Rn. Тогда положим
ГГ(01	rWWl
f(0= • И ОТ(Р) =	•

LOTn> (p)J
Преобразование Лапласа представляет собой голоморфную функцию со значением в Rn.
Эти рассуждения, в частности, остаются справедливыми, если (i) С L (Rn, R+ Тогда мы получим следующую теорему.
Теорема 15* Преобразование Лапласа функции t — равно (р — Л)"1 (при £ (Rn, Rn)).
* Правая часть представляет собой сумму меры Дирака 6 и функции t ->	(t), точнее класса эквивалентности этой функции, с точностью до функ-
ций, равных нулю почти всюду. Поэтому обозначения далеки от того, чтобы быть удовлетворительными. Однако трудно отказаться от компромисса в примерах, так как функции почти всегда выражаются при помощи аналитических зависимостей, делающих необходимым введение независимой переменной.
100
Доказательство, Пусть р таково, что Re р больше действительных частей собственных значений матрицы А. Тогда
J е*Ае~р*<и= j	= —(р —Л)-1[е-(р-л)']/=он“ =
О	о
= (Р-А)~\
, Это доказывает теорему, если учесть, что функция р —> (р — — Л)"1 — рациональная дробь.
Теорему 15 можно использовать для вычисления eiA.
Пример. Пусть
Тогда
(р —Л)-1 =
1
(р 4- 1) (р — 4)
2'
Р-
Разлагая на простые дроби, получим
(p-АГ
1
Р — 4
Используя таблицу преобразования «Далласа, запишем:
Сводка формул преобразования Лапласа
но Df	F (р) pF(p)	(t)x	
ем№	F'(p-X)	eu	1 p —X
44)	XF (Хр)	1 • . — sin co/ (0	1 p2 + co2
4 44)	F(Xp)	cos co/	p p2 +
t 4 0	F(p) P	1 — sh art (!)	1 p2 — co2
/1 * /2	Pi (P) Ft (b)	ch co/	p p2 — co2
101
f (0 Df	F (p) pF (p)	(0 X	
(—l)kf (0	.	(p)	^a—1 Г (a) <a> °)	1 Pa
6	1	1 Vi	Ул V~p
80	e-flP		
6'	p	1 еХ/Г(а)(а>°)	1 (p-%)“
e;	e~ap p		
б(й>	Pk		
<4	1 p		
ГЛАВА $
ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
1. МЕРЫ НА ВЕКТОРНЫХ ПРОСТРАНСТВАХ
Через Е обозначим /г-мерное векторное пространство, через D° (Е) — пространство непрерывных на Е функций с компактными носителями и через (£) — пространство непрерывных на Е функций с носителями в компакте К, Напомним, что мерой на Е называется всякая линейная форма Ц (/ —> j fp) на' пространстве Z>° (Е), сужение которой на £>?< (Е) является непрерывным, каков бы ни был компакт X.
Пусть S — базис пространства Е. Для всякого X € Е обозначим черех Xs компоненты n-мерного вектора X.
В базисе S всякую функцию f можно представить функцией fs такой, что
f (X) = fs (Xs).
Для того чтобы имело место включение /££>°(£), необходимо и достаточно, чтобы fs С DQ (Rn).
Любая мера ц на £ может быть представлена мерой на Rn такой, что
J/(X).p =J/s(Xs).ps.
Заметим, что есть не что иное, как образ ц при отображении X —> Xs. Для того чтобы мера ц была ограниченной, необходимо и достаточно, чтобы была ограничена мера |xs. С другой стороны, если с каждым базисом S связана мера ц5, то для того, чтобы представляла некоторую меру ц на Е, необходимо и достаточно, чтобы интеграл
J fs (Xs) Hs
не зависел от S, т. е. чтобы при переходе к новому базису S', где Xs = KXS^ выполнялось равенство
J fs (KXs')= j fs (Xs) • Hs-
Иначе говоря, необходимо, чтобы мера была образом меры Hs' при отображении К : Xs' —> Xs (К — матрица перехода от одного^базиса к другому).
103
Пример. Мера Лебега на векторном пространстве.
На векторном пространстве мера Лебега определяется с точностью до коэффициента пропорциональности. В самом деле, если для некоторого базиса S положить
Hs =
то для другого базиса S' в качестве |л5, следует брать образ меры |л5 при отображении Х5 -> Xs,, т. е.
p.s, = |detK|dX|,---dXg,,
где К — матрица перехода от одного базиса к другому.
Если, однако, Е — эвклидово пространство, то существует каноническая мера Лебега dX на Е такая, что
j f(X) dX = (Xs) /i(S)dxi- • -dX",
где g (S) — детерминант Грама базиса S (g (S) = det G (S)).
При использовании матрицы перехода к другому базису (Xs, Xs) получаем
g(S')= (detX)2£(S), откуда следует инвариантность определения относительно выбранного базиса.
2. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
Определения. Конечномерное векторное пространство Е называют вероятностным, если в Е задана положительная ограниченная мера с общей массой, равной единице, называемая распределением вероятностей.
Всякое измеримое подмножество А множества Е называется событием, а его мера — вероятностью события А. Эту вероятность обозначают 1 через Р (Л).
Если а£ А, то говорят, что произошло событие А. Событие А называется невозможным, если А = 0.
Событие, состоящее в одновременном происшествии двух событий А и В, будет обозначаться через А П В или АВ. Если АВ — невозможное событие, т. е. АВ = 0, то события А и В называются несовместимыми. Объединение двух событий А {] В обычно называется суммой событий А и В. Это событие происходит тогда и только тогда, когда происходит по крайней мере одно из событий А или В.
Аналогичным образом определяется сумма произвольного числа событий.
Событием, противоположным событию А, будет называться событие С А. Это событие происходит тогда и только тогда, когда не происходит события А.
1 Иногда вместо Р (А) пишут prob (А), как это принято во французском оригинале данной книги (Прим, перев.).
104
Примеры. I. Дискретные распределения. Эти распределения имеют вид
где (at-) — конечное или счетное множество точек из Е, а коэффициенты р( удовлетворяют условиям
Pi За О,
Коэффициенты pi могут быть интерпретированы как вероятности событий {яД. Можно записать
Pi - р {al}>
идентифицируя всякое элементарное событие (элементарный исход) а$ с событием {а/}, образованным этим исходом
Если А — некоторое событие, принадлежащее Е, то
Р(А)= 2 Pi.
,aitA
II.	Абсолютно непрерывные распределения. Так называют распределения, обладающие плотностью по мере Лебега.
Если р — распределение вероятностей с плотностью 0 (т. е. если = = 9 (X) dX), то
Р(Л) = И(Л)= Je(AW.
А
Заметим, что 6	0, 9 С L1.
Остановимся на некоторых частных случаях:
а)	Равномерное распределение на отрезке [a, b]£ R- В этом случае
1
Ь — а '
О ,
9(Х) =
если ХЕ[а, Ь]\
если X $ [а, Ь].
б)	Стандартное гауссовское распределение на R. Это распределение имеет плотность
9(Х) = _*	е-х’/г.
V '	/2л
Ясно, что 0^0. Убедимся, что
4-со
j e(x)dx= i.
—со
Действительно,
J е~х2/2	= 2/2 J е_у2 dY = /2 Г (г/2) = /2л.
—со	0
105
в)	Центрированное гауссовское распределение на векторном пространстве.
Пусть на векторном пространстве Е размерности п положительно определенная квадратичная форма для каждого базиса S выражается в виде X —> Xss£ (S) Xs. Рассмотрим для каждого базиса S меру
ns -	ех₽ (-	<5) Xs) dx's  
При переходе к новому базису Xs = KXs> образ меры ps равен
ехр (---Е Xs^ (S') ХзЛ I det (К) I dX^  • -dX’^.
j	'	/II
Так как
то
det a (Sf) = det Ж (S) (det (/<))2 и, следовательно, образ меры ps равен ps'.
Таким образом, существует мера р, представление которой в любом базисе S равно ps. Такая мера называется центрированным гауссовским распределением на Е. Ясно, что р 0. Для проверки того, что J р = 1, достаточно показать, что J ps = 1 для какого-нибудь базиса S. Выберем S так, чтобы (S) = 1. Тогда (опуская индекс S в правой части) получим
Из =	[-4- S (X‘)21 dX1-.-dX",
(/Л)	L	I	J
откуда со
Z —оо
Теорема 1. Теорема о сложении вероятностей. Пусть Е— вероятностное векторное пространство, а событие А есть сумма конечного или счетного числа попарно несовместимых событий А£. Тогда
р И) = S р Ш-i
Доказательство. Так как р — распределение вероятностей, то р (Л) = ц (Д) = Е и (4) = S PtAiY
106
Следствия.
I.	Имеем
Р (С А) - 1 — Р (Л)..
II.	Цели А и В какие-нибудь два события, то
Р (Л + В) - Р (Л) + Р {В) — Р {АВ).
Определения. Событие с вероятностью, равной единице, называется почти достоверным. Событие с вероятностью, равной нулю, называется почти невозможным. Если события А и В таковы, что АВ является невозможным событием, то эти события называются почти несовместимыми.
Определение. Пусть А — событие с ненулевой вероятностью. Назовем «условным распределением вероятностей относительно события Д» распределение вероятностей
_ ЕЛИ
Р(А) '
где —характеристическая функция множества А.
Очевидно, j = 1. Для всякого события В через Р (В|Л) обозначим вероятность события В относительно распределения Вероятность Р (В|Л) называется вероятностью события В при условии, что произошло событие А. По определению т. е.
Р (ВА) = Р (Д).Р (В\А).
Теорема 2 (теорема о полной вероятности).
Пусть {Л; — конечное или счетное множество почти несовместимых событий, сумма которых образует почти достоверное событие. Если В — некоторое событие, то
P(B)=S Р(Л()Р(В|4). i	.
Доказательство. Требуемый результат вытекает непосредственно из формулы
Р(В)=2Р(ВЛ). I
з. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Определения. Пусть Е — вероятностное векторное пространство. Назовем случайной величиной (скалярной или векторной) всякое конечное измеримое отображение, определенное на. Е.
107
Средним значением, или математическим ожиданием, случайной величины Y — f (X) называется величина
где рх — распределение вероятностей на £.
При этом предполагается, что:
а)	если Y — скалярная величина, то£ (У) определено, когда /6 L1;
б)	если Y — векторная величина со значениями из F, то приведенная выше формула означает, что для всякой линейной формы и на F
Е (и (У)) = J u (f (Х))-р,х
и что для каждого базиса S из F справедлива формула
£(У|)=
причем эта формула остается справедливой для любого другого'' базиса.
Тогда Е (У) определено, если u°f Е L1 для всякой линейной формы и на F, что эквивалентно тому, что fs Е L1 для некоторого базиса S и любого Л
Свойства случайной величины
Имеем
Е (%1У1 + %2У2) = ^Е (Ух) + Х2Е (У2);
Е (а) = а, если а = const.
В частности,
Е (X) = j Х-цх.
Две случайные величины Уг = Л (X); У2 = /2 (X) называются совпадающими почти наверное, если (X) = f2 (X) почти всюду по мере рх, т. е. если событие (X) = f2 (X) является почти достоверным.
Примеры. I. Если р = J] т0
 £(У) = Ер^(а»)=2^г‘’> t	i	,	_
где положено Yl = f (ai).
Если число т элементарных событий at конечно, то Е (У) всегда существует. Тогда случайной величиной Y можно считать m-мерный вектор-столбец
"КГ
ут
108
ел (%) =
ГДе Y* есть зйачейие Y на элементарйом исходе а*. Математическое ожидание Е (Y) есть центр тяжести этих значений, имеющих «веса» р{. Если событий сц счетное множество, то Е (У) определено только в том случае, когда ряд S Pit (ai) абсолютно сходится.
II. Если |лх = 0 (X) dX, то
оо E(Y) = j f(X)9(X)dX. — СО
III. Со всяким событием А можно связать бернуллиеву случайную, величину 1, Х£А;
О, Х$А,
являющуюся характеристической функцией множества А. Ясно, что £(вл)= Jn=nG4)=P(A).
А
Определение. Случайная величина X называется центрированной, если Е (X) = 0. Центрированные случайные величины образуют векторное пространство, являющееся подпространством векторного пространства L1 случайных величин, для которых математическое ожидание определено.
Пусть Е — вероятностное векторное пространство, X С Е и Y = f (X) — случайная величина на Е. Пусть Y С F, где F — векторное пространство. При отображении / распределение вероятностей рх на Е переходит в vy, которое называют распределением вероятностей случайной величины Y (ясно, что vY 0
Образ vY таков, что
для всякой скалярной функции g, измеримой относительно vy, если только один из интегралов в последнем равенстве имеет смысл. Положим Z = g (У) = g (f (X)). Случайная величина Z может рассматриваться либо как случайная величина на F, либо как случайная величина на В. Интеграл j g(Y)-vY представляет собой среднее значение EF (Z), когда Z рассматривается как случайная величина на F. Аналогично, J g(/(X))-px есть Ее (Z), когда Z рассматривается как случайная величина на Е.
Согласно определению vy, среднее значение случайной величины Z = g (У) может быть вычислено как с помощью распределения vy на F, так и с помощью распределения рХ на F.
* В действительности этот m-мерный вектор-столбец определяет класс величин Y для отношения эквивалентности «равенство почти достоверное».
109
Значение этого среднего далее будет обозначаться просто Через Е (Z). Например,
£(У)=ф(Х).их= jy.vr
Это свойство без труда обобщается и на тот случай, когда Z является векторной случайной величиной. В частности, пусть У1, . . ., Ym—действительные случайные величины, определенные на Е. Если положить	<
ГУ1!
Ут_
то можно рассмотреть в распределение вероятностей vY m-мерного вектора-столбца У, являющегося образом распределения вероятностей рх при отображении X —> У. Это распределение позволяет вычислить среднее значение Е (Z) для всякой функции Z = g (У1, . . ., Уш) = g (У):
Е (2) = j g(Y)-vY.
4. ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
Ограничимся понятиями, наиболее часто употребляемыми при описании расйределений вероятностей.
А. Изучение действительных случайных величин
Пусть X — скалярная случайная величина с распределением вероятностей рх. Приводимое ниже определение есть частный случай определения кумулятивной функции меры.
Определение. Назовем кумулятивной функцией, или функцией распределения, функцию
F(x) = j p* = P{X<x}.
]—со, Х[
Имеем F (—оо) = О, F (+©о) = 1. Нетрудно видеть, что функция F возрастает, поэтому и обладает следующими свойствами:
f F	непрерывна слева,
( F (х + 0) — F (х) = р, ({х}) = Р {X = х}.
В самом деле, пусть последовательность {х„} такова, что limx„ = x и хп х. Пусть еп — характеристическая функция /2-> ОО интервала ]—оо, хп [ и 8 — характеристическая функция интервала ]—оо, х[. Тогда
е (X) = lim 8„ (X),
Л-»со
но
откуда
F (х) = f e (X) • px = lim [ e„ (X) • px = F (X„).
J	n-> co J
Пусть теперь последовательность такова, что lim хп = х и хп х. П->со
Тогда
( 1, ХЕ]—оо, х], lirne„ (X) = 1 n v .	.
v I О, Х<]— оо, х],
откуда
F (х + 0) = lim F (хп) = lim J еп (X) • р,х = П-> со	П-> со
= J нх = р-(]— оо,хО + н({х!) = /7(х) + н({х}). ] —со, X ]
что и требовалось доказать.
Замечание. Если р не содержит точечных масс (в частности, если р определяется плотностью, то F непрерывна. Если р есть сумма конечного числа точечных масс, то функция F является ступенчатой.
Напомним, что
f И = F (b) - F (а),
[а, b [
т. е.
Р (а X < b)  = F (Ь) — F (а).
В приложении приводится таблица значений функции распределения (стандартной) гауссовской случайной величины.
Обозначение. Обозначим через X случайную величину X — о	о
— Е(Х). Ясно, чтоЕ(Х) = 0, т. е. X является центрированной.
Определения. Назовем моментом Л-го порядка величину tnk (X) = Е (X*), центрированным моментом &-го порядка величину mk (X). Моменты определены для k klt где kr — зависит от распределения вероятностей.
Очевидно,
'	(X) = Е (X).
Центрированный момент второго порядка называется дисперсией.
Обозначим его. через <r2 (X). Имеем
ff2(X) =Е((Х-£(Х))2).	.
Ill
Поскольку
ст2 (X) - Е [X2 — 2Е (X) X + (£ (X))2], то
<т2 (X) = Е (X2) — (Е (X))2.
Заметим, что
а2 (X + а) = о2 (X) для всякого а£ R, а2 (ЙХ) = 62о2 (X).
Назовем стандартным отклонением положительное значение а (X) квадратного корня из дисперсии:
<г(Х) = +	\
Случайную величину X будем называть нормированной (стандартной), если Е (X) = 0 и О’ (Л) = 1 *. Какова бы ни была случайная величина X, величина
X — Е(Х)
<г(Х)
оказывается нормированной (она называется нормированным отклонением величины X).
Пример. Пусть ед—бернуллиева случайная величина с Р (Л) — р. Положим q = 1 — р. Тогда Ед == ел, откуда
Е (8л) = Е (Ел) = Р
и, следовательно,
<т2(ел) = р — p2 = pq, o(eA)=Ypq.
Характеристической функцией случайной величины X назовем преобразование Фурье распределения вероятностей рЛ:
<рх (и) = J е1иХ 'Р>Х = Е (е1иХ\
Характеристическая функция («) непрерывна. Кроме того, <рх (0) = 1.
Если моменты mk (X) до порядка ki существуют, то срх дифференцируема k± раз и
(м) = j (iX)k eluXрЛ; k^kv
Следовательно,
<$> (0) = ikrnk (X).
Отсюда, разлагая фх в окрестности нуля, получим
<рх(«) = 1	----+	k^kr
* Это определение согласуется с уже упоминавшимися определениями гауссовских стандартных случайных величин.
112
Примеры.	i
I. Пусть X — нормированная гауссовская величина с плотностью вероятностей
е(%) = -^= й-Х2/2 .
У^2л
Характеристическая функция имеет вид
со
где
1	00
= f Xke~X2/2dX.
1/2л J
—co
Положим X = Y J/2. Тогда
-poo
1	(/2)*+i f Yke~Y‘dY.
У 2л	J
—oo
Если k нечетно, то mk — 0. Если k = 2ht to
W(== ' V f Y2he-Y2dY =
У Л J
2й
2й 1	3 2ft —1 лЛ-
7s г-/я =
= l-3---(2ft-l) = ^2Л)! , 2ft (ft!)
откуда
h=Q
i2fim2h (X) гл = (2ft)!
Н =: б”"2/2
h=o

Таким образом, характеристическая функция нормированной гауссовской случайной величины равна g—w2/2.
8 Р. Паллю де Ла Барьер
113
II. Распределением Пуассона с параметром с назовем распределение целочисленной неотрицательной (почти наверное) случайной величины X, для которой
P{X = fe}=e-cTr; V*€Z+-
Следовательно, это распределение вероятностей может быть записано в виде

Имеем также
Е(Х) = е~с
<т2 (Х) = Е(Х2)-(Е(Х)Г--с.
Характеристическая функция имеет вид
-4-со	—|-оо
4>х^ = е^ \е ~k\
£=0
__ с—ceceLt __ ес (eli — 1)..
Нижеследующая теорема показывает результат применения операции гомотетии, или сдвига к характеристической функции.
Теорема 3. Пусть <рх, <рх+а— характеристические функции случайных величин Х,‘ XX, X + а. Тогда
Фхх («) = Фх (W. Фх+0(«) = е‘'аифх(и).
Доказательство.
Фхх (u) = Е (eiuKX) = <рх (hi);
Фх+а («) = Е (eiu <х+о)) = e'a“ <рх (и).
Замечание. Не следует путать первую формулу этой теоремы с формулой, указывающей действие преобразования гомотетии на преобразование Фурье некоторой функции: если g (X) = f (XX)f то
114
Различие здесь обусловлено тем, что преобразование гомотетий йЗмейяет плотность вероятностей.
Определения. Скалярная случайная величина X. называется гауссовой, если
X — Е(Х)
<т(Х)
является нормированной гауссовой случайной величиной.
Положим Е (X) = т, <т (X) = о. Тогда Y = (X — т\[<з, будучи нормированной гауссовой случайной величиной, имеет распределение вероятностей
dY.
/2л
Следовательно, распределение вероятностей для X имеет вид
—Ц=- e-(A'-m)2/2a2 dX. о /2л
Характеристической функцией для Y является
<рг (и) =
а для X = <YY + т
(и) — eimu(py (OU) = gimug—a1^^^
Б. Изучение распределений вероятностей в Rn
Рассмотрим для примера случай п = 2. Пусть
Х =

Маргинальным распределением называется распределение скалярных величин X1 и X2. По определению, маргинальные распределения суть образы распределения вероятностей рх в /?2 при отображениях
-Xi-
X2
->Хг и
'X1'
X2
— X2,
т. ,е. при проектировании на оси координат.
Примеры. Дискретное распределение часто записывается в форме
Следовательно,
Pij~P^ = ait X2 = bj).
Поэтому распр?деление вероятностей для X1 имеет вид
vi= S
i
8*
115
ГДе
qi = P(X' = ai)= J P‘.i-
i
Аналогично распределение вероятностей для X2:
V2= S A'’
i
где
г/= P (№ = &/) =2 Pl-i-i
Если распределение вероятностей имеет плотность 0 (X1, X2), то распределения вероятностей для X1 и X2 имеют соответственно плотности
+г
?l(X1) = I e pc1, X2) dX2;
—со
4-СО g2(X'2)= J QfX^X^dX1.
—со
Среди условных распределений особенно часто рассматриваются распределения, когда события X1 £ А или X2 £ В фиксированы. В частности, для дискретного распределения обычно рассматриваются:
1) условное распределение X1 при X2 = Ь, которое равно
i
где
2) условное распределение X2 при X1 = а£, которое равно
/
где
Вернемся к случаю пространства Rm. Моментами называются величины Ат = £[(х1)А1...(хтГ"’].
Можно также определить характеристическую функцию /	ч г i ----------
<P(«i....«т) = £[е k 1	т <],
которая является преобразованием Фурье для распределения вероятностей рх величины X.
116
В. Изучение векторных случайных величин
' Характеристическую функцию случайной величины X £ Е с распределением вероятностей рЛ можно определить следующим образом:
((7) = Е (е1 <х- и>) = J е‘ <х- и>цх = (.^цх) (U),
где U — некоторый элемент пространства £', сопряженного к £, или всего пространства £, двойственного к £ (в частности, £' = £, если £ эвклидово). При использовании базиса пространства £ можно получить такое же аналитическое выражение, как и в случае, когда £ = Rn.
Теорема 4. Пусть Х£ £ — случайная величина, Е, (£, F). Пусть фх, фх+а, фкх — характеристические функции случайных величин X, X + а и ДХ. Тогда
фо(Г) = фх(ГЮ (ven.
Доказательство.
Фх+а((7) = Е(е‘ <*+“’ ^>) = E(el u>ei<x, и>) = е1 <а>'и> фх(17);
Фо (У) = Е (е*	v>) = Е(е> <*> ^>) = Фх (X* V).
5.	ГЕОМЕТРИЧЕСКОЕ ИЗУЧЕНИЕ СКАЛЯРНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
Пусть £ — векторное вероятностное пространство и Н — пространство действительных случайных величин X таких, что т2 (%) = е (X2) <оо.
Удобно отождествлять две случайные величины, если они равны почти наверно. Тогда пространство Н совпадает с пространством функций, интегрируемых с квадратом относительно вероятностной меры на £; две такие функции тождественны, если они равны почти всюду.
В пространстве Н определим обычное скалярное произведение
<х, n =	= гдеХ = ИЮ =
Пространство Н с таким скалярным произведением превращается в гильбертово пространство. Рассмотрим в Н прямую {1}, о
образованную постоянными, и подпространство Н, образованное центрированными случайными величинами.
Имеем
Е(Х) = <1, X).
117
Так как условие 21 (X) = 0 переписывается в виде <1, X) = О, то Н есть не что иное, как гиперплоскость, ортогональная к прямой {1}. Для всякого X Е Н* имеем
Х = Х-|-Е(Х), где (
О'	о
Отображение X —* X есть ортогональное проектирование на Н. Его называют центрированием.
Определения. Ковариацией двух случайных величин X, Y£H называется величина
v (X, У) = Е (X, У).
Тогда
v(X, У) = <Х,оУ>.
Так как {1} и Н ортогональны, то формулы
X = X + Е (X);
у = у + е (У) влекут за собой условия
(X, У) = (X, У) + Е (X) Е (У), откуда
Е (ХУ) = v (X, У) + Е (X) Е (У), т. е.
v (X, У) = Е (ХУ) — Е (X) Е (У).
Рис. 9 схематически показывает связь между основными понятиями, рассмотренными выше.
Для Y = X находим
V(X, X) = Е (X2) = а2 (X).
( Следовательно, для гильбертовой структуры пространства Н
имеем ff2 (X) = ||Х||2, т. е. <т ( X) = ||Х||.
Определение.- Коэффициентом корреляции между Х'и Y назы-О о
вается косинус угла между X и У в Н, т. е. величина
Р(Х, У)^....
иначе говоря,
П/У П- У(Х’У) Р(Х, У) —
118
• Заметим, что р (X, Y) неопределен, если <т (X) или <т (У) равны нулю.
Коэффициент, корреляции обладает следующими свойствами:
Р (X, У)е [-1, + U;
р(Х, У) = 0( = )у(Х, У) = 0(=>£(Х, У) = Е(Х)Е(УУ,.
( = >№(Х + У) = <г2(Х) + <т2(У); .
р (X, У) = ± 1 (=) 3 а такое, что У = аХ;
(=) Э а, Р такие, что У = а ф- (3.
Замечание. Соотношение р (X, Y) = 0 записывается также в виде X J_ Y (в Н).
Определение. Матрицей ковариаций р случайных величин Хь . . Хр называется матрица Грама величин Хь . . Хр для гильбертовой структуры из Н. Она обозначается через V(Xi, . . Хр). По определению
" g2(*i) v(XbX,) ... v(Xb Хр)~
V(Xb ...,ХР)-
v(X2, X,) tf2(X2)
_v(Xp, Х2)	... а2(Хр)
Пусть Е — вероятностное векторное пространство и S — базис в Е. Матрица ковариаций V (Xs, . . Xs) будет обратимой всегда, кроме случая, когда существуют постоянные . . ., Кп такие, что
<т (%iXs	KfiX&) = О
или
MXs ~Г ’ • • + KiXs — k почти наверно. Это возможно тогда и только тогда, когда распределение вероятностей имеет носитель, сосредоточенный^ аффинной гиперплоскости пространства Е.
Пусть Е — пространство линейных случайных величин на Е. Так как Е изоморфно пространству линейных форм на Е (всякая линейная случайная величина является линейной формой на В), то Е двойственно к Е. о о
Пусть У, ZE Е. Отображение У, Z—-> Е (УZ) есть билинейная форма. Для всякого базиса S в Е величины Xs образуют двой-Z-S.	‘	о О
ственный базис S в Е. Билинейная форма/; (YZ) для них имеет вид £(X|X0 = v(X^, X's).
119
Следовательно, V (Xs, . . Xs) есть дважды ковариантный тензор на Е (т. е. дважды контравариантный на Е). В частности, если базис в Е преобразуется по формуле Xs = kXS', то матрица преобразования базиса в Е будет К' = X"1 и, следовательно, v(xis .... X^) = XV(X|,..................Xs)k,
т. е.
v(xi...... x^) = xv(xl-....... x^k.
Несколько более общим методом можно получить следующую теорему (доказательство ее вытекает из предыдущих объяснений):
Теорема 5. Пусть X есть n-мерный случайный вектор и Y = MX, где М£ L (/?",,Тогда
V (У1, . . ., Yp) = М V (X1, . . ., Хп) М.
Доказательство. В самом деле, имеем
Yh = 2 ^Х1'; Yk = S М ’Х1, i	J
откуда
v(r\ = (Xz, Y’^M^^mIv (xf, y’) (m)L 4	' O'
что и требовалось доказать.
Случай комплексных переменных
Пусть Е — вероятностное действительное векторное про- ! странство. Для изучения комплексных случайных величин введем пространство Н, образованное переменными X такими, что Е (| X |2) <сю. Будем рассматривать, как и в действительном случае, прямую {1}, образованную постоянными, и ортогональную ей гиперплоскость Н, образованную центрированными переменными.
Будем всегда считать, что X = X + Е(Х).
Обозначим через X комплексную величину, сопряженную к X *. Ковариацией между X и Y назовем величину
v (X, У) = Е (^, У), а дисперсией случайной величины X — величину
а2 (Х) = v (X, X) - Е (| X |2).
Определение матрицы дисперсий остается неизменным.
* Это обозначение можно путать с обозначением транспонированной матрицы. Там, где это может произойти, мы через будем обозначать транспонированную матрицу, а через СХ — вектор, комплексно сопряженный к X.
120 j
Линейная регрессия
Определение. Пусть Хъ . . Хр суть р действительных случайных величин таких, что Е (X/) <оо, и Y — случайная величина такая, что Е (У2) <оо. Регрессией величины Y относительно Хь . . ., Хр называют случайную величину
yWX^------------
где постоянные сс', . . ., сс^1 выбираются из условия минимизации Е ((у—У')2). Постоянные а1, . . ., ар называются коэффициентами регрессии Y относительно Хь . . ., Хр. Можно написать
Y' = axXi Ч-----1- ссрХр Ч- аР+Ч.
Следовательно, Y' есть проекция Y на подпространство, порожденное величинами Хь . . ., Хр, 1 в Я.
Коэффициенты а1, . . ., можно' вычислять обычным методом, обратив матрицу Грама переменных Хь . . ., Хр, 1. Можно упростить числовые выкладки с помощью следующих рассуждений.
Имеем Y — Y' I X' и Y — Y' I 1. Последнее условие эквивалентно тому, что
Е (У) = Е (У'), т. е.
Е (У) - а>Е (Хх) Ч- * • • + (Хр) +
Отсюда получаем
У' = Ч----------h ссрХр
и
Е ((У — У')2) = а2 (У — У').
Таким образом, нужно выбрать такие а1, . . ., а^, при которых а о
а2 (У— У') принимает минимальное значение. Иначе говоря, о	о
Y' есть проекция величины Y на подпространство, порожденное переменными Х1( . . Хр.
Следовательно, если V (Хь . . ., Хр) обратима, то
-a1-	“v (Хъ Y)~
• =V~4Xi, .... хр). •
_v(Xp, Y)_
Рассмотрим частный случай. Регрессия Y' величины Y относительно переменной X определяется по формуле
121
т. е.
Y' — E (У). = (X - Е (X)).
Определение. Прямой регрессии величины Y относительно X Гх"
называется прямая на плоскости пар записывается в виде
, уравнение которой
у-Е(У) = ^^(х-Е(Х)).
Прямая регрессии величины X относительно Y определяется уравнением
х-Е(Х) = ^^(у-Е(У)).
Эти две прямые пересекаются в точке
ГЕ (*)1
. Необходимым
и достаточным условием их совпадения является
v (X, У) __ o2(Y)
<r2 (X) “ v(X, Y) ’
т. е. р (X, Y) = ±1.
Точно так же, если регрессия величины Y относительно Xt и Х2 равна
Y' — E (Y) = а1 (Хх - Е (Х2)) + а2 (Х2 - Е (Х2)),
то плоскостью регрессии называется плоскость, определяемая уравнением
у - Е (У) - а* (х, - Е (XJ) + & (х2 - Е (Х2)).
Определение. Полным коэффициентом корреляции величины Y относительно Хь . . Хр называется величина
R(Y-,X1, . . ., Хр) = Р(У, У') = -^О-.
Заметим, что
а2 (У') = аЧ (Хъ У) + • • • + (Хр, У).
6. СТОХАСТИЧЕСКАЯ НЕЗАВИСИМОСТЬ СЛУЧАЙНЫХ ВЕЛИЧИН Определение. Пусть X1, X2 — две действительные случайные величины, ц — распределение вероятностей пары
ГХ1] х“[х2]’
vi и va — распределения вероятностей величин X1 и X2.
122
Будем говорить, что X1 и X2 стохастически независимы, если
Н - vxv2.
Два события А и В называются независимыми, если случайные величины Бернулли, соответствующие им, стохастически независимы.
Напомним, что мера ViV2 характеризуется свойством
jf(Xl)g(X2).vf*v2x’ = Jf(X1)vf‘. Jg(X2)v2x% (*)
каковы бы ни были f и g £ Z)°. Это свойство остается верным для f и g интегрируемых и, тем более, для fug, интегрируемых с квадратом. Соотношение (*) переписывается в виде v (/ (Х1),^ (X2)) = = 0. Таким образом, получается следующая теорема.
Теорема 6. Для стохастической независимости X1 и X2 необходимо и достаточно,, чтобы
р (/ (X1), g (X2)) = о, -
каковы бы ни были f, g € D° или каковы бы ни’ были
/е ge l2(v2).
Следствия.
1. Если X1 и X2 стохастически независимы, то такими же являются f (X1) и g (X2).
2. Если X1 и X2 независимы, то события Х1^ Alt X2 £ £ А 2 независимы, каковы, бы ни были множества Af и Л2 из Я (измеримые относительно мер и v2).
Теорема 7. Чтобы события А и В были независимы, необходимо и достаточно выполнение каждого из следующих’ условий:
(1)	Р (АВ) = Р (А) Р (В);
(2)	Р(А|В) = Р(А) (в предположении, что Р(В) =£0);
(3)	Р(А|В)= Р(А|СВ) (в предположении, что Р (В) 4=0 или 1);
(4)	v (ед, ев) = 0.
Доказательство вытекает из соотношения
(a) v (8Л, 8В) = Е (ъАгв) — Е (8Л) Е (вв) = Р (АВ) — Р (А)Р (В)
и формул
(р) Р (АВ) = Р (В) Р (А\ В)-
(У). Р (А) = Р (В) Р (Л I В) + Р (С В) Р (Л |[С В).
В самом деле:
а)	Предположим, что Л и В независимы. Тогда имеем (4) (по определению), откуда согласно условию (а) вытекает (1) и согласно условию ф) — вытекает (2). Далее
V (8д8с в) = V (8д, 1 — 8в) = —- v (8д, 8В) = 0,
откуда Р (Л) = Р (Л | С В) и, следовательно, выполняется (3).
123
б)	Функции от еа (соответственно 8В) образуют двумерное векторное пространство, имеющее своим базисом &А и 1 — гА (соответственно и 1 — 8В ). Следовательно,
(4) => V (/ (8л), g (8В)) = 0, V А ё-
Таким образом,, из (4) следует независимость событий А и В.
Поэтому (1)=>(4) согласно условию (а), (2)=>(1) согласно' условию (0), (3) => (2) согласно условию  (у) и соотношению Р(В) + Р(СВ) = 1.
Введем аналогичные определения для случая р случайных величин.
Случайные величины X1 *, . . Хр называются стохастически независимыми, если распределение вероятностей рЛ вектора
"X1"
равно произведению распределений вероятностей vb . . vp случайных величин X1, . . ., Хр. События Аъ . . Ар называются независимыми, если соответствующие им случайные величины Бернулли 8л,, . . 8л независимы.
“Xi-
Замечания. I. Пусть рЛ— распределение для X =
Если рх представимо в форме
px = vx‘, . . ., Vх",
у 1	и	VI	Х/7
где v , . . ., v —распределения вероятностей, tov , . . v являются распределениями вероятностей случайных величин X1, . . ., Хп и, следовательно, X1, . .	X’7 независимы1. Действительно, для всякой f £ DQ (7?) имеем
откуда видно, что vxt есть образ меры рЛ при проектировании X -* Хг.
II.	Если X1, . . Хп независимы и если положить
то Ха и Х^ независимы.
III.	Если X1, . . ., Хп— независимые скалярные случайные величины, то (доказательство по индукции)
Е (X1 . . .Х«) = Е(Х!) . . . Е(Х").
1 Далее автор, говоря о стохастической независимости, часто опускает слово
стохастическая. (Прим, трее.)
124
Теорема 8. Пусть X и Y — две стохастически независимые случайные величины с распределениями вероятностей и vy. Случайная величина X + V имеет распределение вероятностей |i * v и, следовательно, ее характеристическая функция равна произведению Фхфу характеристических функций величин X и Y.
Доказательство вытекает из определений и из формулы
(fl * v) =	(ц) ST (v)
для двух ограниченных мер.
Теорема 9. Если X и Y — независимые скалярные гауссовы величины, то Z = Х + Y есть гауссова случайная величина со средним Е (Z) = Е (X) + Е (У) и дисперсией a2 (Z) = <т2 (X) + + а2 (У).
Доказательство. Пусть <рх, <ру, <pz — характеристические функции случайных величин X, Y, Z. Тогда
<рх (и) = exp (iuE (X)) exp (—и?а2 (X));
<ру (u) = exp (iuE (У)) exp ( — -i-«2a2 (У)) , откуда
фг («) = Фх+у («) = exp [iu (Е (X) + Е (У))] х х exp [- -1- «2 («2 (X) + а2 (У))] , что является характеристической функцией гауссовой случайной величины со средним Е (X) + Е (Y) и дисперсией а2 (X) + а2 (У).
Теперь вычислим матрицу ковариаций п случайных величин X1, . . Хл, имеющих центрированное гауссово распределение.
Пусть
|<<1е4д) ехр (-i-X^x) dXl. . . dXn
(2л)"/2	\	2	)
есть их распределение вероятностей. Мы можем рассматривать это распределение вероятностей как представитель (в- некотором специальном базисе) распределений вида
ц5 = ^^Дехр (-4~Xs^(S)Xs)dXl ... Ж .
Пусть S' — такой базис, в котором (S') = 1. Тогда
= n7=“p(-T«-)2W-
125
Следовательно, Xs> являются независимыми нормированными гауссовыми случайными величинами, откуда
V(xk ...» Xs')= 1.
Вернемся к произвольному базису, положив Xs, = KXS\ Xs = К~гХ8’  Имеем
v (Xi,. • •, Xs) =
Таким образом, мы получили следующий результат: матрица ковариаций п случайных величин X1, ..., X", имеющих плотность
/ 1
—-^ехр^_—
равна <s$-1.
Докажем также следующее утверждение. Если X =
п
.имеет гауссово распределение и q (Х‘, X') = 0 для I =/= /, то слу-чайные величины X1, . . ., Хп независимы.
Для этого случая имеем
<Т1 ... О
v(x\
_о ...
Распределение вероятностей для X можно записать в виде
ц* =------ехР f-----------Г V dX'- • • dX>l =
(2л)"/2 Пщ н 2 Zj °i
2,
= П-----^=-ехр (---rfXz.
• Ol /2л н \	2, а2 j
Вычислим теперь характеристическую функцию для гауссова распределения, имеющего плотность
Kdet(^)
(2л)"/2 Р \	2 Х^Х) •
126
Будем рассматривать это распределение как представитель более общего распределения вероятностей, имеющего вид
(S)	/	1 у о//о\ у \
Пусть S и S' —два базиса: положим Xs = X; XS' = X'; j^(s) = Предположим, что (S') = 1.
( i<X', U'>X
Пусть cpX' (U) = E \e J —характеристическая функция величины X'. Тогда
<Х, U}=^U'kXk\ k
ei<Xf, U’> _ ["J eiUrkXXk k
т. e. случайные величины X k независимы. To же самое можно о	iu'kx'k
сказать и о случайных величинах е , откуда
ФХ' (и') = Е(ei<x’’ с/'>) = П Е (eiU'kx'k] = k
= П q>x,k (u'k) = exp (— -X (u'k)2) = exp (--b £/'£/')
Положим теперь X' = XX, X = K~rXf. Тогда
Фх- (^) = Фх- = exp (- 4-,
или = XX, откуда, возвращаясь к первоначальным обозначениям, получим
Фх((7) = ехр (--
Следовательно, справедливо следующее утверждение: характеристическая функция гауссова распределения, имеющего плотность
(2л)"/2 еХР \	2" Х^Х ) ’
имеет вид
фх([/) = ехр(---
127
Отсюда можно получить следующий результат (его доказательство такое же, как и в скалярном случае): пусть X и Y — две n-мерные независимые случайные величины с плотностями
>^ехр(- '
(2л)га/2 F \ 2	/
l^det^ /_______— Y^V\
(2л)"/2	2Y®Y)
соответственно. Тогда n-мерная случайная величина X у имеет гауссово распределение с плотностью
l^det G /______1 V/d у \
(2л)"/2	Р\	2ХСХ)’
где С~г =
Замечание. Формула (5-1 =	+ ^"1 выражает аддитивность матриц
ковариаций от X и У, т. е. аддитивность, которая имеет место в более общем случае, а не только, когда случайные величины X и Y независимы.
Имеет место следующее утверждение.
Предложение 1. Пусть два n-мерных случайных вектора X и Y таковы, что q (Х\ Yj) = 0 у h
Тогда
V (X1 + У1, ..., Хп + У") = V (X1, ..., X") + V (у1, ..., У").
Доказательство. Имеем
v (X1' + Y‘, X’ 4- Y1) = v (X1’, X1) + v (У\ У') +
4-у(Уг, yy) + v(x£, y')-v(x\ Х;) + v (У‘, У').
Теорема 10. Пусть X есть n-мерный гауссовый центрированный случайный вектор с плотностью
Kdet Л /	1
(2л)"/2 Р \	2 Х^Х) •
Пусть М G L (Дп, /?р). Тогда Y = MX является гауссовым центрированным р-мерным случайным вектором с матрицей ковариаций МЖ-1М (предполагается, что ранг матрицы М равен р).
Доказательство, Характеристическая функция величины X равна
Фх({/) = ехр(-----
откуда
Фмх (V) = ехр (---L VMs/^MV^ .
Частный случай. Если oyg (/?")', то Y = wX является гауссовой центрированной случайной величиной с дисперсией
128
Следовательно, если X есть n-мерный центрированный гауссо-вый случайный вектор, то каждая его компонента является центрированной гауссовой случайной величиной.
7. СХОДИМОСТЬ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ И СЛУЧАЙНЫХ ВЕЛИЧИН
Введем узкую топологию в множестве распределений вероятностей. Будем говорить, что последовательность случайных величин Хп сходится по распределению к случайной величине X, если соответствующие им распределения вероятностей узко сходятся к распределению вероятностей pt случайной величины X; иначе говоря, что если для всякой непрерывной ограниченной функции f
lim (f-p.n= Jf.g.
n->co J	J
Согласно результатам, полученным в теории преобразования Фурье, имеем следующие теоремы<
Теорема 11. Для сходимости по распределению последовательности случайных величин Хп к X необходимо и достаточно, чтобы соответствующая им последовательность характеристических функций фд просто сходилась к характеристической функции ф случайной величины X.
Если последовательность характеристических функций фд случайных величин Хп просто сходится к функции ф, равномерно в некоторой окрестности нуля, то ф является характеристической функцией и Хп сходится по распределению к случайной величине X с характеристической функцией ф.
Теорема 12 (предельная теорема). Пусть Хп есть последовательность одинаково распределенных скалярных независимых случайных величин 1 со средним т и стандартным уклонением <г. Тогда случайные величины
у __(Xi + • • • 4~ Хп) — пт
(Г ]/ п
сходятся по распределению.к нормированной гауссовой случайной величине.
Доказательство, Заметим, что Yn нормированы. Положим у* — Xk т Xk-—^~.
Тогда
у —	+ К”
1 Т. е. Xi/. . Хп независимы при любом п.
9 р. Паллю де Ла Барьер	129
где
E(X'k) = O, o(Xk) = l.
Пусть ф •— общая характеристическая функция случайных величин X'k. Очевидно, что
(/ и \\п
41Ы) 
При п —> сю правая часть представляет собой неопределенность типа Iе0. Имеем
1пфу (и) =/1 Inф(——=:] — п ф(— 1 , п	\ г п / L \ V п j J
или
ф (и) == 1 —	+ о (и2) при и О,
поскольку X'k нормированы. Отсюда
ln<pyJW)~n(-^) = -4 и
linicp,z =е-“2/2_ П->со п
Таким образом, Yn сходятся по распределению к случайной величине, характеристическая функция которой равна е““2/2, т. е. к нормированной гауссовой случайной величине.
Можно дать следующее обобщение этой теоремы.
Теорема 13. Пусть Xlt . . ., Хп, • • • есть последовательность m-мерных центрированных случайных векторов, имеющих одинаковое распределение с матрицей ковариаций V. Тогда
X I . I у случайные m-векторы ' 1	‘" сходятся по распределению
у п
к m-мерному центрированному гауссовому случайному вектору с плотностью
(2^‘rHveXp(-4-7v"y )
Топология в пространстве случайных величин
Пусть Е — вероятностное векторное пространство, Н — пространство случайных величин таких, что Е (| X |2) <сю. Рассмотрим в//обычную гильбертову топологию. Будем писать Хп— (читается: Хп сходится к X в среднеквадратичном), если Хп сходится к X в Н, т. е. если
Е.(\Хп —Хп\*)—>0.
130
Напомним два типа сходимости, используемые в пространстве случайных величин:
1. Пусть gg Е, Xn = frl(l), X = f (g). Говорят, что Хп сходится почти наверное к X, если fn (g) сходятся к f (g) почти всюду относительно распределения вероятностей на Е.
2. Говорят, что Хп сходится по вероятности к X, если v 8 > О для Р (| Хп — Х|^е}—>0 при п —> оо.
Таблица для нормального гауссового распределения
В таблице^ приведены значения F (х) вероятности того, что нормальная гауссова случайная величина X примет значения, не превосходящие х.
X	F	к	F (х)	। Х	F(x)	X	F (х)
0,0	0,50000	1,0	0,84134	2,0	0,97725	3,0	0,99865
0,1	0,53983	1,1	0,86433	2,1	0,98214	3,1	0,99903
0,2	0,57926	1,2	0,88493	2,2 -	0,98610	3,2	0,99931
0,3	0,61791	1,3	0,90320	2,3	0,98928	3,3	0,99952
0,4	0,65542	1,4	0,91924	2,4	0,99180	3,4	0,99966
0,5	0,69146	1,5	0,93319	2,5	0,99379	3,5	0,99977
0,6	0,72575	1,6	0,94520	2,6	0,99534	3,6	0,99984
0,7	0,75804	1,7	0,95543	2,7	0,99653	3,7	0,99989
0,8	0,78814	1,8	0,96407	2,8	0,99744	3,8	0,99993
0,9	0,81594	1,9	0,97128	2,9	0,99813	3,9	0,99995
						4,0	0,99997
Для х < 0 следует			пользоваться формулой F (х) =			1 -F(	—*)•
I
ГЛАВА 6
ЦЕПИ МАРКОВА
Рассмотрению некоторых примеров случайных процессов посвящены гл. 6 и 7. Мы не даем точного определения случайного процесса и пока под случайным процессом будем понимать просто некоторое явление, протекающее во времени и имеющее случайные характеристики. При рассмотрении частных примеров это понятие будет уточняться.
1.	ОПРЕДЕЛЕНИЕ ЦЕПЕЙ МАРКОВА. ПОНЯТИЯ ТЕОРИИ ГРАФОВ
Цепи Маркова
Определение. Стохастической матрицей называется любая квадратная матрица Р, элементы которой удовлетворяют следующим свойствам:

Пример. Следующие матрицы являются стохастическими:
Определение. Будем говорить, что эволюция системы подчиняется цепи Маркова, если
1)	моменты, в которые система наблюдается, образуют последовательность 0, 1, 2, . . ., т.....;
2)	система может находиться в одном из конечного числа состояний 1, 2, . . ., п\
3)	существует вероятностное множество, на котором определены следующие события: «система находится в момент т в состоянии I»;
4)	с каждым моментом т связана стохастическая матрица Р (т), элемент которой Р{ (т) равен условной вероятности (если она существует) того, что система будет находиться в состоянии / в момент т + 1 в предположении, что она находится в момент т
в состоянии i;
132
5)	условная вероятность того,что система будет находиться в состоянии / в момент т + 1, в предположении, что она находится в состоянии i в момент т, и при известных состояниях системы в моменты 0, 1, . . ., т — 1 также равна (если она определена) Р[ (т). Матрица Р (т) называется переходной матрицей системы в момент т.
Свойство 2) введено для упрощения изложения. Свойство 5) выражает марковский характер процесса.
Пусть
-х1 (ту
хп (ту
суть вероятности различных состояний в момент т *. Заметим, что
х' (т)	0;
S (т) = 1 •
Вероятности
“х1 (т + 1)“
x(m+ 1) =
_хп (т + 1)_
состояний в следующий момент т + 1 даются теоремой полной вероятности:
X1 (т + 1) = S Pi (^)х'(т)
или
х (т + 1) = Р (т) х (т).
Ъаким образом, если х (0) есть начальное распределение вероятностей различных состояний, то распределения в последующие моменты будут иметь вид
х (1) •= Р (0) х (0), х (2) = Р (1) х (1) = Р (1) Р (0) х (0) .
и в общем случае
х (mj = Р (т — 1) • • • Р (1) Р (0) х (0).
* Набор п величин х (т) определяет распределение случайной величины (w), описывающей состояние системы в момент т.
133
Цепь Маркова называется однородной, если ее матрица перехода не зависит от т. Тогда
х (т + 1) = Р X (/и) и, следовательно,
х(т) = Рх(0).*
В этой главе будут рассматриваться однородные цепи Маркова с одинаковыми матрицами перехода, но отличающиеся начальным распределением состояний х (0). Особенно нас будут интересовать асимптотические свойства величины х (т) и зависимость этих свойств от х (0).
Пусть Р —стохастическая матрица. Будем говорить, что переход i —> / разрешен, если Р{ Ф 0. Теория показывает, что асимп-т
тотические свойства величины Р при т —>оо тесно связаны с изучением разрешенных переходов. Для этого изучения мы воспользуемся основными понятиями теории графов.
Теория графов
Определения. Ориентированным графом на множестве X называется любое отображение Г множества X на множество частей X. Мы будем говорить просто «граф» вместо «ориентированный граф».
°<г	Элементы X называются верши-
----нами, или точками, графа.
Дугой графа Г называется любая пара (х, у) такая, что у £ Г (х); х называется начальной вершиной (или началом), а у — конечной вершиной (или концом) дуги (х, у).
Если X — конечное множество, то его элементы могут быть представлены точками на плоскости. Тогда Г будет представлено множеством своих дуг. Рис. 10 дает пример такого представления.
любая последовательность вершин х0, xz+1 6 Г (xz); число k 0 — длина пути.
Путь ненулевой длины может быть определен как последовательность, дуг (х0, xj, (хь х2), . . ., (х^_!,.х^). Вершина х0 называется началом пути, а вершина xk — концом пути. Путь называется элементарным, если xz xf для i =f= j.
Контуром называется любой путь, начало которого совпадает с концом. Любой путь нулевой длины есть контур. Контур длины 1 называется петлей.
Рис. 10.
Путем называется
Xi, . . ., xk такая, что
k
* В этой главе А будет обозначать k-ю степень матрицы (если не оговорено противное).
134
При заданном графе Г можно определить графы Г& (k 0) следующим образом: у Е Г* (х), если в графе Г существует путь длины k, для которого х есть начало и у — конец.
В частности,
у С Г° (х), если у = х (другими словами, Г° (х) = (х), у х Е X) и Г1 = Г.
Определим, кроме того, граф Г следующим образом: у £ Г (х), если существует путь (безразлично какой длины), ведущий из х в у.
Очевидно,
Г (х) = и г* (х).
/г=0
Заметим, что отношение «у £ Г (х)» есть квазипорядок (в частности, х£ Г (х), у х ^0- Если у С Г (х), то говорят что у ДОСТИЖИМО ИЗ X.
Граф Г называется сильно связным, если для любых х, у С X в Г существует путь, ведущий из х в у\ иначе говоря, если Г (х) = = X для любого х Е X.
С каждым графом связано отношение эквивалентности (называемое каноническим), определенное следующим образом: х ~ у, если у 6 Г (х) и хЕ Г (у). Это отношение есть просто отношение эквивалентности, связанное с квазипорядком «г/ Е Г (х)». Классы эквивалентности называются классами графа. Отношение квазипорядка «z/ Е Г (х)», будучи отношением канонической эквивалентности, определяет порядок для классов графа. Мы будем говорить, что класс С2 достижим из класса С\, если любое х2 € С2 достижимо из любого хх Е С\ (достаточно, чтобы это было выполнено для какой-нибудь одной пары х1? х2).
Подмножество А множества X называется замкнутым множеством, если
хЕ А; у=Г(х) =)уеА;
иначе говоря,
хе А =) Г (х) cz А,
т. е. не существует дуги с началом в А и с вершиной в С А. 1
Класс называется конечным (финальным), если он представляет собой замкнутое множество; иначе говоря, если он является максимальным элементом для отношения порядка между классами. Если существует только конечное число классов (в частности, если X конечно), то имеется по крайней мере один конечный класс. Класс, который не является конечным (финальным), называется переходным (невозвратным).
135
Граф, связанный со стохастической матрицей
Пусть Р — стохастическая матрица, имеющая п строк и п столбцов. Мы сопоставим ей графе вершинами {1, 2, . .	п)},
определенный следующим образом:
/ег(о wp*>o.
Если считать матрицу Р переходной матрицей цепи Маркова, то отношение / € Г (О обозначает, что переход из состояния i в состояние j (за один шаг) разрешен.
&	k
Заметим, что матрице Р соответствует граф Г .
2.	СПЕКТРАЛЬНЫЙ АНАЛИЗ СТОХАСТИЧЕСКИХ МАТРИЦ
Мы будем использовать в Сп следующую норму:
%—|И1=£М. i
а в L (Сп, Сп) — соответствующую ей норму
Л —»|| Л j[ = sup || Лх»' ||.
11*11 «с 1
Предложение 1. Имеем .
||Л|| = sup S |л{| = sup|| Л£||.
i i
Доказательство. Из
Ах = S i
следует
(a) Px||^S |х‘ | H||^sup||4||. S |хЧ, i	i	i
т. е.
MxKsup||4||.||x||. i
Поэтому
MKsupiiAH. i
Пусть теперь iQ таково, что
supMi|| = ||A0||. i
Тогда
Aio = Aeio, ||eZo||= 1, откуда || Л || > sup || Л£ ||
136
и_ окончательно
MHsuppj i
Предложение 2. Равенство || Ах || = || А || -1 х || может иметь место только тогда, когда из х* =/= 0 следует | AL || = || А ||.
Доказательство. Второе неравенство в (а), как следует из предыдущего доказательства, может стать равенством только в случае, когда
MIIAII = MsupM4
i
Рассмотрим стохастическую матрицу Р. По определению,
i
будем считать Р элементом пространства L (С\ Сп}. Тогда из предыдущих соотношений вытекает следующее.
Предложение 3. Норма любой стохастической матрицы равна 1.
Следствие. Собственные значения стохастической матрицы по модулю не превосходят 1.
Предложение 4. Любая стохастическая матрица имеет собственное значение 1.
Доказательство. Пусть т] = [1, . . ., 1]. Так как х\Р = т], то Рц =-т], т. е. 1 является собственным значением матрицы Р. Следовательно, то же справедливо и для Р.
Предложение 5. Для любой стохастической матрицы Р нильпотенты, соответствующие собственным значениям, по модулю равным 1, равны 0.
Другими словами, если в есть собственное значение кратности k, по модулю равное 1, то векторное подпространство собственных векторов, соответствующих собственному значению о, имеет размерность k.
Это предложение вытекает из следующих трех лемм г:
Лемма 1. Если Н нильпотентно, то ядро Hk~l содержится строго в ядре Hkt каково бы ни было k 1 такое, что ядро РР-1 отлично от всего пространства.
Доказательство. Очевидно, что noy (РР) zd noy (РР-Х).
Предположим, что noy (РР) ~ noy (РР-1). Тогда
поу (Я/г+1) = Н (noy (РР)) = Н (поу (Я*-1)) = noy (РР),
откуда noy (Нр) = поу (Hk~x) для р k — 1, что неверно, если ядро РР-1 отлично от всего пространства, поскольку Нр = 0 для достаточно большого р.
1 В этих трех леммах k-я. степень матрицы А обозначается через Ak.
137
Лемма 2. Пусть Е — конечномерное нормированное векторное пространство и пусть II А II — норма в L (Е, £), соответствующая норме в Е:
M|| = supMx||.
п«||<1
Тогда, если Н — ненулевой нилЪпотент и <r £ С, то ||a + tf||>|a|.
Доказательство. Известно, что || о + Я||	| в |, так как о + Н
имеет единственное собственное значение о (при этом можно предположить, что а = 1).
Покажем, что || 1 + Я||> 1. Пусть х таково, что Нх =f= О и Н2х = 0. Тогда (1 + H)k х = (1 + kH} х, откуда
lim ||(1 +H)kx\\ = 4-00.
k -> 4- °°
Но
||(1 +/7)^Н||1 +Я|П|х||;
следовательно, || 1 + Я||‘> 1.
Лемма 3. Пусть Е — конечномерное нормированное векторное пространство. Введем в L (Е, Е) норму, соответствующую норме в Е.
Пусть A g L (£, Е) и <г — собственное значение для А такое, что | о | = ||Л||. Тогда нильпотент, соответствующий а, равен 0.
Доказательство. Пусть М — спектральное подпространство, соответствующее а. Сужение А на М имеет вид а + Н, Если Н =£= 0, то || А ||	|| а + Н || > а, что противоречит предполо-
жению.
Определение. Назовем носителем элемента х 6 Сп множество индексов i таких, что xl 0.
Пусть а — множество индексов. Обозначим через Еа множество элементов х таких, что х1 = 0 для i $ а, т. е. множество элементов, носители которых принадлежат а. 
Пусть а =£ 0. Непосредственно видно, что для замкнутости а необходимо и достаточно, чтобы Еабыло устойчиво относительно Р, иначе говоря, чтобы Р разбивалась на подматрицы следующим образом:
" рОС
ра ’ а 4J
Р =
О
Предложение 6. Если х — собственный вектор стохастической матрицы Р, соответствующий собственному значению, по модулю равному 1, то носитель х есть замкнутое множество. 138
Доказательство. Пусть
Г ха 1	( х1 0, если iG а;
х = l-тт- , где
L 0 J [ Рх=^х | % | — 1,
рос
рр
L а
и
рсс ~
^г
Тогда
Р“х“ = Хх“,
откуда
И«1-1И1=М1.
что влечет ||Ра|| = 1 (очевидно, что ||«С 1).
Тогда из предложения 2 вытекает, что столбцы Р% имеют норму, равную 1. Поэтому Р« = 0. Отсюда следует, что а есть замкнутое множество.
Определение. Стохастическая матрица называется неприводимой, если Еи устойчиво лишь для а = 0 и а = {1, ..., п}\ иначе говоря, если Р допускает в качестве замкнутых только пустое и полное множества, т. е. не существует разбиения Р вида
1°
Чтобы Р была неприводимой, необходимо и достаточно, чтобы существовал только один класс, т. е. любое состояние j было достижимо из любого состояния i. Действительно, если Р неприводима, то любой конечный класс может быть только полным множеством. Следовательно, полное множество есть класс, притом единственный. Обратное утверждение очевидно.
Предложение 7. Собственные значения неприводимой стохастической матрицы, равные по модулю 1, суть простые.
Доказательство. Пусть Р — стохастическая матрица. Если s — кратное собственное значение, по модулю равное 1, то соответствующее векторное подпространство имеет размерность 2 и содержит ненулевые векторы, имеющие по крайней мере одну ненулевую компоненту, т. е. существуют собственные векторы, носитель которых отличен и от пустого, и от полного множеств. Согласно предложению 6 отсюда следует существование нетривиального замкнутого множества, т. е. приводимость матрицы Р.
139
Пусть а, 0, . . ., .X — конечные классы Р. Имеем следующее разбиение г:
Предложение 8. Собственные значения, по модулю равные 1, суть собственные значения стохастических матриц . . ., Рх, соответствующих конечным классам.
Доказательство. Требуется доказать, что Q не имеет собственных значений, по модулю равных 1. Имеем следующее разбиение т
Для Р:
т т (Р%=Р«, tn (р% = Pl т т
(Р)к = Рк-
Пусть, кроме того, А = a J Р U ••• U — объединение конечных классов, и В = С А.
Для любого i С В существует путь, начинающийся в i и кончающийся в j £ А. Пусть //—длина одного из таких путей. Его можно удлинить, присоединив путь произвольной длины, «содержащийся в А». Следовательно, для любого I 1( существует путь из I в А. т
Пусть tn = sup lt. Образуем Р. По построению над каждым '€в m	II nt II
столбцом Q имеется ненулевой элемент. Следовательно, ||Q|| < 1, т. е. Q не может иметь собственного значения, модуль которого равен 1. То же самое справедливо для Q, что и требовалось доказать.
Следствие. Порядок кратности собственного значения 1 равен числу конечных классов.
Последнее предложение показывает, что для изучения собственных значений с модулем 1 надо рассматривать неприводимые
1 Звездочкой мы обозначаем подматрицу произвольного вида. Звездочки, фигурирующие в разбиениях двух разных матриц, мог.ут соответствовать разным подматрицам.	'
140
стохастические матрицы. Нам осталось изучить случай собственных значений с модулем 1, отличных от 1, для чего требуется более глубокое изучение комбинаторных свойств неприводимых стохастических матриц.
Определение. Пусть Р — неприводимая стохастическая матрица. Периодом Р называется наибольший общий делитель длин контуров.
Предложение 9. Пусть Р — неприводимая матрица с периодом d и пусть, Zx и Z2 — длины двух путей, начало и конец которых совпадают. Тогда
lr = /2 (mod d).
Доказательство. Пусть 1Г и /2 — длины двух путей, ведущих -из I в /, а /3 — длина пути, ведущего из / в i. Имеем
h + /3 = /2 + /3 (mod d),
откуда
1х = /2 (mod d).
Определение. Подклассами неприводимой матрицы Р называются классы эквивалентности при следующем отношении эквивалентности: «длина любого пути, ведущего из i в /, кратна d».
Предложение 10. Существует d подклассов с0,сх, . . ., cd_x, которые можно перенумеровать таким образом, что любой путь из ch в ck будет сравним с k—h по модулю d.
Доказательство. Выберем произвольное состояние а. Пусть /х и /2 — длины двух путей, начинающихся в а и кончающиеся в i и j соответственно. Пусть, кроме того, /3 — длина пути, начинающегося в i и заканчивающегося в /.
Имеем
/х + l3 = l2 (mod d).
Если i и / принадлежат одному и тому же подклассу, то 13 = = 0 (mod d), откуда
/х = /2(modd).
Обратно, если /х = l2 (mod d), то
13 = 0 (mod d)
и i и / принадлежат одному и тому же подклассу.
Каждый подкласс, следовательно, однозначно характеризуется ' длиной (mod d) пути ведущего из а в какую-нибудь точку этого подкласса. Пусть ch (h = 0, . . ., d—1) — подкласс состояний i таких, что существует путь из а в i с длиной, сравнимой с h.
Пусть i g сЛ; / € ck и пусть /х — длина пути, ведущего из а в i; /2 —длина пути, ведущего из а в /; 13 — длина пути, ведущего из i в /.
141
Имеем
1-l = A (mod d);
/2 = &(modd);
Zi + /3 = /2 (mod d), откуда
/3 = k — /i(mod d), что завершает доказательство.
Замечание: Удобно положить ср = 'cq, если р = q (mod d). Используя это обозначение, мы получаем следующее следствие.
Следствие* Пусть f0,	ik —последовательные со-
стояния пути. Тогда, если (0 Е ср, то ik £ cp+k.
В частности, если /.£ Г (0 и i £ ср, то / С ср+1, а если /€	(0, то i и / принадлежат одному и тому же подклассу.
Разбиению множества состояний на подклассы соответствует следующее разбиение матрицы Р:
где
Ph - Pch-
Замечание. Матрицы могут не быть квадратными, так как подклассы могут иметь разное число состояний.
Предложение 11 (Фробениуса). Корни уравнения sd = 1 являются простыми собственными значениями, по модулю равными 1, неприводимой стохастической матрицы периода d.
Все составляющие собственных векторов, соответствующих собственному значению 1, имеют один и^тот же аргумент (существует х > 0 такое, что Рх = х).
Доказательство. Пусть Р — стохастическая матрица периода d и пусть s и х 0 таковы, что
( Рх = sx;
(|s|=l
Вспомним, что х1 =/= 0, каково бы ни было i.
Соотношение Рх = sx записывается следующим образом:
(₽)	S Ptf = sx1,
142
откуда (поскольку | s | = 1)
S IS Pixl I = S I х11. / М I ‘ ‘ I I
Так как
S^=i(vO, /
то
откуда
S|S^'| = S(S
Учитывая неравенство
|S р{х1 I ^s
I i I i	'
получаем
ISЖ| = S ИИ = ЕИ*'|	(V/).
| i I i	i
Следовательно, Arg Р\х1 для любого j не зависит от i (при любом i таком, что Р\ 0).
Согласно соотношению (р) имеем
Arg(pzV) = Arg(s?)
(при любых / и I, для которых р{ =4= 0).
Отсюда
'	j € Г (/) => Arg (xz) = Arg (sx/).
Следовательно, для любого пути длиной I выполнено равенство sl = 1. Поскольку множество тех т, для которых sm = 1, есть идеал, содержащий все длины циклов, то это множество содержит также наибольший общий делитель длин циклов. Отсюда следует, что
sd = 1.
Заметим, что если s = 1 и / € Г (i), то
Arg (%9 = Arg (%/).
Покажем теперь, что любой корень уравнения sd = 1 есть собственное значение матрицы Р. Используем разбиения Р, х и Рх9 соответствующие подклассам. Мы получим (расположение
143
таково, что'любой подстолбец Рх есть произведение х на часть Р, находящуюся слева от него):
Г %0 1
xd~l
XL/-1
п2у
= Рх.
Dd-l„d-2
*d-2x	.
С другой стороны^
о
о
d .
(Р)\
о
о
• d . 1
где
(Р)? = P°d_i- • .P?Pj, и в общем случае
(Р)н = Рн-1 • • •	• • -PhgPh^-
Соотношение Рх = sx записывается в виде
(Y)	Чэ Чэ Чз г и и ч II
	Pd^~2 = SX^-1
Пусть х° =£ О таково, что
(P)gx° =
Определим х1, ...» х^1 последними d—1 равенствами соотношения (у). Тогда
Р&. . .P?Pjx° = sd-lxd-1,
144
а умножая на получим
, (Р)°х° = s^P^-1,
т. е. (поскольку sd = 1) О_____________________________ т^О уЛ—1
SX — Р d—р*	*
Таким образом, х есть собственный вектор, соответствующий собственному значению s.
’ d
Замечание. Матрица Р содержит d конечных классов, каждый из которых имеет период, равный 1.
Резюмируем полученные результаты.
Теорема 1. Пусть Р — стохастическая матрица, имеющая р конечных классов с периодами dh. Тогда собственными значениями с модулями, равными 1, матрицы Р являются:
1) собственное значение 1 кратности р;
2) решения уравнений sdh = 1, отличные от 1, с порядком кратности, равным числу уравнений этого типа, которым они удовлетворяют.
Пример. Если Р имеет 5 конечных классов с периодами 1, 2, 3, 4, 6 соответственно, то собственными значениями будут:
1	кратности	5;
—1	»	3	(решение	для	s2 =	1,	s4	=	1, ss 6 — 1);
e2tn/3 и e—2гл/з	>y	2	(решение	для	s3 =	1,	s6	=	1);
i и — j	»	1	(решение	для	s4 —	1);
e~~l7t^ и	e—t^/з	»	j	(решение	для	s6 =	1).
Определения. Стохастическая матрица называется эргодической, если 1 есть простое собственное значение; иными словами, если имеется только один конечный класс. Стохастическая матрица называется регулярной, если 1 есть простое собственное значение и период конечного класса равен 1.
Стохастическая матрица Р называется примитивной, если 1 является единственным собственным значением с модулем, равным 1, т. е. все конечные классы имеют период 1.
3. АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ
т
Лемма 4. Если|$| <1 и Н — нильпотент, то s+Я стремится к 0 при т —>оо.
fe+i
Доказательство. Предположим, что Н = 0. Тогда
s 4* Я = sm -|- твт~гН 4- • • • -\-т(т— !)• • - (zn— k 4- 1) sm~kH,
откуда и следует лемма, поскольку слагаемые стремятся' к 0 при т —>оо.
Ю Р. Паллю де Ла Барьер	И5
Пусть теперь
Р — лг (sr + ^г) —
спектральное разложение Р, причем
( 1;
( Нг = 0, если | sr| = 1
(операторы суть спектральные проекторы, операторы Нг — нильпотенты и sr — собственные значения).
Имеем т
Р = S Пг (sr 4- Яг) = 2 Лу-в™ + е (/и), г -	|Sr|—1
где 8 (т)	0 при tn —* + сю.
Теорема 2. Три следующих свойства эквивалентны:
(I)	Р — примитивна; т
(II)	Р имеет предел при /п —> + оо; т
(III)	каково бы ни было х (0), х (т) = Рх (0) имеет предел при m —> + сю.
Если эти три свойства выполнены, то lim./5 = где — т->-|-со спектральный проектор, соответствующий собственному значению 1.
Доказательство.
т
(1)=) (II): Если Р — примитивна, то lim Р = n1? где — т-»4 оо
спектральный проектор, соответствующий собственному значению 1.
(II) =) (III): Очевидно. т
(II) —) (I): Если Р имеет предел, то же самое справедливо иг
для лгР = n,rs™ и, следовательно, для srm, откуда sr = 1,- если • ы = 1-
т
(III) =) (II): ЕслиРх(О) имеет предел для любого х (0), то т т	'	т
(Р); = Ре{ также имеет предел, а следовательно, и Р имеет предел.
Теорема 3. Чтобы х (т) имела предел, не зависящий от х (0), необходимо и достаточно, чтобы Р была регулярной.
Доказательство. Заметим, что для справедливости теоремы необходимо и достаточно, чтобы Р была примитивной и чтобы имел ранг 1.
146
Рассмотрим теперь следующую матрицу:
1 (	т—ц
Q(m) = ^U+P+ ..- + Р
Будучи средним значением т стохастических матриц, Q (т) является стохастической матрицей.
Теорема 4. Справедливо соотношение
lim Q(m) —
т-±-\-со
Доказательство. Имеем
(т—1	\
4'Ssj+ei(m)>
I м	k==Q
где
т-1
81 (/») = — S 8(A). т 6=0
Следовательно, 8Х (m) —» 0 при т —>оо, поскольку 8(A) —> О при k —> 4-сю. Но
--> 0, если s ~=f= 1;
1, если s = 1,
откуда вытекает утверждение теоремы.
т
Следствие. Если положим х (т) = Рх (0), то
lim -Г- к(0)+------\-х(т— 1)] = л1х(О).
/П-»СО 171
Другими словами, последовательность х (0), . . ., х (т), . . . имеет предел в смысле Фейера. Чтобы этот предел не зависел от х (0), необходимо и достаточно, чтобы имел ранг 1, т. е. чтобы Р была эргодичной.
Замечание. Если Р эр годична, то Jti имеет ранг 1, и все столбцы не только пропорциональны, но и равны, поскольку Лх стохастичен. Общее значение столбцов есть вектор со, инвариантный относительно Р и удовлетворяющий соотношениям (02> 0 и S ®г = *• Носителем этого вектора является единственный конеч-i
ный класс. Вектор со есть предел в смысле Фейера для х (т) [каково бы ни было * (0)].
10*	147
Следующая таблица резюмирует изложенное.
Тип	Комбинаторные свойства	Спектральные свойства	Асимптотические свойства
Примитивный	Все конечные классы имеют период 1	1 есть единственное собственное значение с модулем 1	т Р имеет предел
Эрго-дичный	Единственный конечный класс	1 есть простое собственное значение	Предел х (т) в смысле Фейера не зависит от х (0)
Регулярный (примитивный и эрго-дичный)	Единственный конечный класс с периодом 1	1 есть единственное, притом простое, собственное значение с модулем 1	х (т) имеет предел, не зависящий от х (0)
Неприводимый	Единственный класс	1 есть простое собственное значение; компоненты соответствующих собственных векторов отличны от нуля	Предел х (т) в| смысле Фейера не^ зависит от х (0) и его компоненты отличны от нуля
ГЛАВА 7
СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ВТОРОГО ПОРЯДКА
1. ПОЛОЖИТЕЛЬНО ОПРЕДЕЛЕННЫЕ ФУНКЦИИ.
ТЕОРЕМА БОХНЕРА
Напомним, что комплексная матрица А с k строками и k столбцами называется положительно полуопределенной, если хах^о, ухеск
(через X обозначена матрица, полученная из X транспонированием и заменой всех элементов комплексно сопряженными).
Если комплексная матрица А эрмитова (Л = Л) и такова, что ХАХ = 0 для любого X g Ck, то Л = 0. Действительно, если положить <р (X, Y) = XAY, то <р будет полубилинейной эрмитовой формой, и мы получим
4<р (X, У) = <р (X + У„ X + У) — <р(Х — У, X — У) —
— йр (X + г’У, X + iY) + х<р (X — 1’У,-Х — /У).
Следовательно, из равенства
<р (Х, Х)=0 (V X) получаем <р (X, У) = 0 (v X, У) или
ХЛУ = 0 (уХ, У),
откуда Л У = 0	(у У) и А — 0.
Пусть теперь Л — комплексная матрица. Положим
а — д
Л = At 1’Л2,	1	2 ’
—	где	_
Л -= Ах £*Л2,	д ____ А — А
-	21	•
Матрицы Ах и Л2 эрмитовы и
ХАХ = ХАхХ + (ХЛ2Х.
Следовательно, если ХАХ ^0 (уХ), то ХЛ2Х = 0 (уХ), откуда А г = 0. Таким образом, любая комплексная положительно полуопределенная матрица — эрмитова.
149
Заметим, что над полем действительных чисел из неравенства ХАХ ^0 не следует симметричность А.
Пусть А = £ “	— положительно полуопределенная ма-
трица.
Положим ф (X, Y) = ХА Y. Тогда
Ф (X, X) - XAY 0;
|ф(Х, У) |2 ф (X, X) ф (У, У) (неравенство Шварца).
Но, поскольку
ф (ei, £i) = а; <Р (г2> е2) = bi ф (еь е2) = с, то
а^О;	\c\^Vab.
Пример. В эрмитовом пространстве матрица Грама k векторов ei, . . ., ek (т. е. матрица коэффициентов (ei, е/>) положительно полуопределена.
Определение. Говорят, что комплексная функция f, определенная на действительном векторном пространстве £, положительно определена, если для любых	xk£ Е (k — про-
извольно) матрица коэффициентов f (xt — х;) положительно полуопределена.
Полагая k = 2; xt = 0; х2 = х, получим, в частности, такую положительно полуопределенную матрицу:
л_ГН°) fW] LH-*) /(О).’
Отсюда следует, что любая положительно определенная функция обладает следующими свойствами:
/ = 7; f (0)>0; |/(х)|^Л(0).
Тем самым, любая положительно определенная функция ограничена.
Предложение 1. Преобразование Фурье положительной ограниченной меры есть (непрерывная) положительно определенная функция.
Доказательство. Чтобы упростить обозначения, мы предположим, что ц — положительная ограниченная мера на R. Пусть f т. е.
/И = J е'“ .|Х"
Пусть, кроме того, х1( . . ., xk£ R, zx, . . ., С. Тогда
Г(Х,—x;)=je'“ «<-/’ .и",
150
откуда
2 f (Xh x;.) ZiZi=j s г??iu> {xi -=J S z‘ei™^xi • p“ = i\ /	i,/	i, i
= f 2^2.и“^о.
i
Справедливо также обратное предложение, называемое теоремой Бохнера.
Теорема 1 (Бохнера). Любая непрерывная положительно определенная функция есть преобразование Фурье положительной ограниченной меры.
Доказательство. ограничимся случаем непрерывной положительно определенной функции на R. Положим f ~3~Т, где Т — обобщенная функция медленного роста.
(а)	Для любой ф Е D имеем
Jf-(q>*<p)>0.
Действительно,
= J р(* + y)(f\x)(f(y)dxdy =
= П КУ — x)^c)ff(tj)dxdy =
4-00
— lims2	f(ms—ns) ср (ns) tp (ms) О
т, п=—со
(заметим, что написанная выше сумма конечна, поскольку ср имеет, компактный носитель).
(б)	Для любой <р Е 5 имеем
j /ф * ф^О.
S	~	S ~
Пусть фл С D такова, что фп-> ф. Тогда фп * Фп-* Ф * ф.
В самом деле, отображение ф, ф —> ф * ф непрерывно из 5 X Sb 5. Это свойство легко доказать, используя соотношение
11ф*1Н«^11ф1ЫМЬ-
Применяя свойство (а) к фп, переходом к пределу получаем свойство (в).
(в)	Для любой ф С S имеем
j ффТ 0.
В самом деле, положим
Ф = ^~ф, ф =
151
Тогда.
=-~ JV(W) =	j<p*q>7>0.
г) Для любой D, О выполнено неравенство j й-Т^О.
Достаточно показать, что и может быть приближена в D функциями вида фф, где ф £ D. Пусть а £ D положительно и равно 1 в окрестности носителя функции и. Тогда
lima2(^ + 8)>
J £>0
I е->0 где
а2 (и + е) = ф2; ф = а]/и + е£ D.
Утверждение (г) может быть сформулировано также следующим образом:
(г') Т есть положительная, мера.
(д) Т есть ограниченная мера.
Положим 0Л (%) = е~~х^2п\ Тогда
Ст = НшС0„Т = 4- lim (>0J.
«7	П-> + оО tJ	fl->-TcO tJ
Кроме того,
Если П —> + сю, то 0П просто сходится к 1. Поэтому
J ^"0Л = 2л0„(О) = 2л.
Следовательно (см. гл. 3, теорему 23), &"8п узко сходится к 2лб и
lim ^0rtf = 2nf (0) < оо, л->со
что завершает доказательство.
2. УНИТАРНЫЕ ПРЕДСТАВЛЕНИЯ R В ГИЛЬБЕРТОВОМ ПРОСТРАНСТВЕ
Определение. Унитарным (непрерывным) представлением множества R в гильбертовом пространстве Н называется отображение t —> Ut множества R на множество унитарных операторов в Н, обладающее следующими свойствами:
(I)	Us+t = UsUt-,
(II)	t/_s = (t/s)-1(=t/:);
152
(Ill)	уа£ H отображение t—*Uta непрерывно из R в Я, в котором задана «сильная» топология, определяемая нормой.
Из свойств (I) и (II) следует, что Uo = Us_s = USU_S = 1.
Примеры.
I. В ориентированном эвклидовом пространстве размерности 2 отображение, которое каждому t £ R ставит в соответствие поворот на угол t вокруг центра О, есть унитарное представление множества R.
II. Пусть L2— гильбертово пространство функций, интегрируемых в квадрате по мере Лебега на R. Отображение Ut :f -> f * 6/ есть унитарное представление множества R.
Теорема 2. Если t—*Ut — унитарное представление множества R в Я, то функция t{Uta, а) положительно определена, каково бы ни было Н.
Доказательство. Пусть tr, . . ., tk£ R. Тогда, полагая ср (0 = (Uta, а), получим
<Р (h —	а) =
— ^U*t.Utia, а\ = {Ut.a, Utja).
Следовательно, матрица коэффициентов <р (/, — tj) есть ма-трйца Грама векторов Ut.a. Значит, она положительно полу-определена.
Следствие. Положим
• фа,И0 = <UiU>b)\
^a,a^ = (Uta, а).
Функция фд.д есть преобразование Фурье положительной меры «а, а на R.
Поскольку, кроме того, отображение a, b—» <ра> b (t) полубилинейно, то имеем
4фа, Ь = фа+Ь, a+b ' 4>a-b, a-b ^a+ib, a+ib “Ь itya-ib, a-ib,
т. е- фа, ь есть линейная комбинация преобразований Фурье положительных ограниченных мер и поэтому тоже является преобразованием Фурье ограниченной меры. Положим
Фа, b =	«а,
Отображение а, b —>	ь полубилинейно. Покажем, что
ФЬ, а — фа, Ь-Действительно,
:	Фь, а(0 = а) = {a, Utb> =
= {U^ta. b) = <ра, b(—t) = <pfl> b (0,
153
откуда следует, что
®Ь, а — «>Ь, а
Меры obta называются спектральными мерами. Отметим, что ‘ f «а, b = фа, Ь (0) = <а, &)•
Теорема 3. Если t—> Ut — унитарное представление множества R в Я, то любой ограниченной мере р можно поставить в соответствие непрерывный оператор U (р,) в Я такой, что
(х, (7(jw) i/> = рх,
Этот оператор называется оператором Радона.
Доказательство. Положим
С/(р) = jtW;
t/(]ii)x =
Из неравенства
U <х, Uty} • p'l sup I (х, Uty'! НИ1 ИКИуИМ следует, что для фиксированного у отображение
J(x, Uty)-^
есть непрерывное полулинейное отображение. Поэтому существует элемент уг такой, что
J (х, Uty)-p — (х, z/i).
Очевидно, что уг линейно зависит от у, поэтому
ШНЫНН
Следовательно, отображение у —> у± есть линейный оператор с нормой ^ || р ||. Положим у± — U (р) у, тогда
Теорема 4. Отображение р. —> U (ц) из М в L (Н, Н) линейно, и справедливы следующие соотношения:
(1)	POOIKHI;
(2)	=
(3)	и (р * v) = U(p)U (v) = и (у) и
(4)	U(6t) = Ut.
154
Доказательство.
'	(1) Аналогично доказательству предыдущей теоремы
(2)	(%, U (|*) у} = f {х, Uty}  р =
= f (х, U_ty) / = j {Utx, у)р =
= j {У, Utx)-ii = (у, U(fi)x) = (Щ/л)х, у}.
(3)	(х, U (ц) U (v) у) = J <х, UtU (v) у) • ц' =
= J (U_tx, и(у)у)-11 = j {U_tx, Unyi-itv® =
= j (x, Ut+9y) -fiv = j (x, Uxy)  (ц * v)x = (x, U(p*v)y).
Следовательно, U (jut) U (v) = U (ji * v). Аналогично, U (v) U (p,) = U (v * p,) = U (jut *v).
Таким образом, порядок операторов Радона можно менять на обратный.
(4)	Непосредственно следует из определения.
Теорема 5. Имеют место следующие равенства:
Фх, UWy = 4t, у *v;	(О
=<Рх, Д’	(2)
^у, U (v) у	• (Ох, у>	(3)
(ц) х, у =	у.	(4)
Доказательство.
= j {Utx,Uty}-^ =
= J (i/i-sX, z/)-v° =
= R/Z-0)V =
= (<Px, у * V) (0-
(2)	qW)^ = 4VuWx= («Pj,.x*p) = ч>0,=	'
(3)	Запишем соотношение
ср ТГ, ч — v * <р Чх, U (v) у	Ч'х, у
155
в виде
^(aX,U(v)y = V^^.y
и применим преобразование Фурье к обеим частям равенства. Тогда
Or, U (V) у =	• (0x> у.
(4)	(ц) х, у — Шу и (ц) х — Ц • ©г/, х — Р ’ у*
Следствие. Имеют место соотношения
{U (|Л) х, у} = фи (р.) х. у (0) = j ®х, у,
(х, U (v) у) = фх> и (v) у (0) = j	-юх, у-,
||С7(р.)*Ц3 = J
Определение. Сильной топологией на пространстве операторов в гильбертовом пространстве Н называется топология простой сходимости на Н (в котором задана гильбертова топология).
Теорема 6. Если последовательность положительных ограниченных мер р„ узко сходится к р, то оператор U (рЛ) сильно сходится к оператору U (р) (т. е. U (рл) х сходится к U (р) х всех х Е Н).
Доказательство. Докажем сначала следующую лемму. Если последовательность элементов хп гильбертова пространства Н такова, что
lim (xni у) = (х, у}
П-> со
для любого у£ Н (г. е. хп «слабо», сходится к х), и если, кроме того,
lim h„|| = ||x||,
П->со
то lim хп = х (в гильбертовой топологии, т. е. сходимость «сильна со
ная»).
Действительно,
К — *112 = Ш12 — 2Re(xn, х) +||х||2 и
lim (хп, х) = ||х||2, откуда ||х„ — х||2 —> 0. П->со
Пусть теперь у £ Н. Тогда
(.у, и (р-л) х) = I <У> Уп‘
156
Так как функция t—>{y, Utx) непрерывна и .ограничена, а сходится узко к |ш, то
lim {у, U (р,„) х) = [ <.у,и{х)-р‘ = (у, U (р.) х).
72~> со	J
Кроме того,
№< =
(по следствию теоремы 5).
Далее, существует М такое, что j р.„ М, откуда получаем \&~* |И„ | М. Поскольку просто сходится к то
lim ||t/ (р„) х II2 = J I ^*|Lt I2®., х = || и (н) х II2. П->со
Следовательно,
lim U (p„) х = U (|л) х.
П->со
Замечание. Предыдущая теорема верна также и для последовательности произвольных ограниченных мер узко сходящихся к ji. Доказательство этого предложения более тонкое, и мы его опускаем.
Рассмотрим еще некоторые свойства спектральных мер.
Для любого х С Н будем обозначать через Нх замкнутое векторное подпространство, порожденное элементами Utx, где t £ /?, и через Jtx — векторное подпространство (вообще говоря, не замкнутое), образованное элементами U (f) х, где f^S.
Имеем Jtx сг Нх. Кроме того, соотношение UtU (f)x = U (f * 8t) x показывает, что Jtx устойчиво по отношению к операторам Ut. Заметим еще, что если fn£ S положительна и сходится узко к 6 в М, то U (fn) сильно сходится к 1. Следовательно, U (fn) х сходится к х, т. е. х есть точка прикосновения для J(x. Таким образом, замыкание множества Jtx есть замкнутое векторное подпространство, устойчивое относительно всех операторов Ut и содержащее х. Это замыкание совпадает, следовательно, с Нх, или, другими словами, Лх есть плотное подпространство пространства Нх.
Рассмотрим теперь формулу
(U (f) х, и (g) х) = J	х.
Из этой формулы, в частности, следует, что
II (/ 0 х||2 = f |^7|2-®х. х.
Кроме того, она показывает, что из условия U (J) х = 0 следует равенство = 0 почти всюду относительно &Хг х. Поэтому из условия U (fx) х = U (f2) х вытекает, что	почти
всюду относительно х.
157
Сопоставляя каждому у = U (/) х, f С 5, элемент из L2 (ох> х), определенный через мы введем отображение из Ях в L2 (<ох> х), являющееся изоморфизмом предгильбертова пространства Jtx в плотное подпространство L2 (<ох> х). Это подпространство образовано из элементов L2 (<ох> х), которые могут быть представлены функциями из 5. Пусть теперь ?С Нх. Существует последовательность элементов fn£ S такая, что lim U (fn) х = г.' По-скольку
II - zm II2 = J I <F*fn - F*fm I2 • ©x, x,
то функции &~*fnопределяют последовательность Коши в £2 (®ж, х). Поэтому существует функция фг)ж€ £2 (©ж, ж) такая, что
фгц = lim ^*fn в L2 (©ж, х). /г->со
Если z = U (/) х, то, по определению, фг । х = почти всюду относительно ©ж, х-
Предложение 2. Если z £ Нх, то ©ж, г = Фг|х ©х, х-
Доказательство. Пусть h £ S. Тогда
=	(h) х, z} =
= lim (U (Л) x, zn) — lim (U (ft) x, U (fn) x) =
= Ит[^Г^*/„.©ж,ж= [Л-фг|Л-^. x, п-УК)	J
откуда следует требуемое соотношение.
Предложение 3. Если z(E Нл, то ®г, z = |фг|ж |2 ©ж, х-
Доказательство. Пусть h £ 5. Тогда
f П- ©г, 2 = (U (/г) z, z) = lim (U (/г) z„, zn) =
J	П->со
= lim<t/ (h)‘U (fn) x, U(fn)x) = П^-ео
= lim [^.^7„.^7„.©ж, x.
Поскольку в L2 ((ox> x) имеем lim^*/rt== ф2|Х и в силу ограми со ниченности &~*h
lim	• ф2|ж,
158
то отсюда следует, что
f F*h&z, z = \&*h • I ihix I2 •	x;
это завершает доказательство.
Замечание. Если z^H, то	2 =	2,, где /—проекция z на Нх.
Действительно, для любой f £ S имеем
f	• (®., г -	г') =	(П Х- *-?'> = 0.
Следовательно,
®Х, Z = ^2'|х Х‘
Таким образом, любая спектральная мера (ox 2 имеет плотность относительно &х х и эта плотность интегрируема в квадрате относительно х Отсюда f l^'lxl2 «*,*=] t»z, z,.
3. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ВТОРОГО ПОРЯДКА
В этом параграфе будут рассматриваться случайные процессы, представляемые физической переменной X, значение которой в момент t есть случайная величина X(t). При этом мы постоянно будем пользоваться результатами параграфа 5 гл. 5.
Определения. Пусть заданы вероятностное пространство и пространство Н случайных величин / таких, что E(|Z|2)<joo. Пусть задан также случайный процесс, представляющий собой отображение X : t X (/), которое ставит в соответствие каждому моменту R случайную (скалярную или векторную) величину X (/). Процесс называется центрированным, если Е (X (/)) = 0. Такой процесс называется стационарным, если распределения случайных величин X — 0), . . ., X (tk — 0) и X (Zj), . . ., X (tk) совпадают для любых моментов . . ., tk (k — произвольно) и любого 0 С R.
В том случае, когда X (0 — скаляр, этот процесс называется стационарным процессом второго порядка, если
Е (X (t)) не зависит от
‘ v (X - 0), X (/2 - 0)) = v (X (^), X (/2));
V ^2, *2, 0 € /?.
Заметим, что если X (0 — стационарный процесс, то он будет стационарным второго порядка при условии, что X (t) Е Н.
159

Если процесс
X (0 — стационарный процесс второго порядка, то X, определяемый выражением
t _ X (0 = X (0 — тх,-
где
тх = Е (X (/)), будет центрированным стационарным процессом Константа тх называется средним процесса Стационарный процесс второго порядка t —з непрерывным (в среднем квадратичном), если отображение t —> X (t) из R в Н непрерывно.
woi
второго порядка. X.
X (0 называется
Процесс t —> X (/) =
будет называться стацио-
_Xm (/)_ нарным процессом второго порядка, X‘(t)eH, \ft^R, Е (X (t)) не зависит от t;
v(X‘(^-0), X/(/2-0) = v(X‘(/1), х/’о,
V /. 0. Л, h-
. Такой процесс называется центрированным, если Е (X (/)) = = 0. Процесс
если
i = 1, . . ., т\
X (О - X (О — тх,
где
тх = Е (X (0),
— центрирован. Вектор тх размерности т называется средним процесса X.
Стационарный процесс второго порядка будет называться непрерывным в среднем квадратичном, если отображения t —> —> X1' (0 из R в Н непрерывны.
Если
/-»х(0 =
стационарный процесс второго порядка, то таким же будет и любой процесс Х« : t —» Х“ (Z), где а — множество индексов, содержащееся в {1, . . ., т\, в частности любой процесс Х‘ : t —> —» Х‘ (/). Однако из стационарности каждого из процессов X' не следует стационарность процесса X.
Обозначения. Мы обозначим через Нх замкнутое подпространство Н, порожденное элементами Х‘ (i), где t £ R, i = 1, . . ., tn. 160


Теорема 7. Для того чтобы центрированный процесс
moi
X:/->X(fl =
Д'" (О
был непрерывным стационарным процессом второго порядка, необходимо и достаточно, чтобы существовало непрерывное унитарное представление 0 —> (Д множества /? в Н такое, что
Xl{t — 0) = С/еХг(О.
Доказательство. Достаточность. Если представление 0 —> Un существует, то
v(Xi(/1 —0), Х'(/2 — 0)) = <Хг(4- 0), Xi(t2 — 0)) =
= <(/еХ‘(/1), (/еХ/(/2)^ = (Х'(^), Х/(/2)) =
= v(X‘(/1), Х/(/2)).
Кроме того, отображение t —» Х‘ (/) = U_tX> (0) непрерывно.
Необходимость. Пусть Л’х — подпространство в Н, образованное элементами вида
S4x£’(^)>
i h
где моменты th произвольны. Подпространство Нх пространства Н есть замыкание множества J^x.
[t п
* J таких, что и т] допускают представления 1^вида
£а?Х(/Л), th.
ih.
Множество Г является очевидно векторным подпространством пространства Нх X Нх (вообще говоря, не замкнутым).
Пусть имеется другая пара [^]вГ. Можно всегда предположить, что моменты thi фигурирующие в представлении g', совпадают с th в представлении Поэтому можно написать
i' = Sa;Ax/(^');
jk
= Sa^X'fo-O).
И Р. Паллю де Ла Барьер	161
Тогда
<t],	= S (X1 (th - 0), X! (tk - 0)) =
ih jk
= S ajaf (X1 (th), X/O = (LU, ihjk
откуда, в частности, следует, что |||| = ||t)|| и (в силу того, что Г — векторное подпространство)
Следовательно, из равенства £ = вытекает равенство ц = = rf. Другими словами, для любого £ С -^х существует, и притом единственное, ц £ Nx такое, что € Г. Положим Л = Uoc. Здесь t/9 —линейный оператор, определенный на плотном подпространстве Л’х пространства Нх и удовлетворяющий равенству
<t/eg, tzer> = <B, Г)-
Он продолжается по непрерывности в изометрический оператор на Нх, обозначаемый также через £7в, такой, что
67eX'(/) = X‘(/-0) (VO-
Это условие определяет его на Нх полностью. Отсюда получаем £/в14-е2 = £/91Д92;
£/-е = (Де)"1.
Отображение 0 —» Uo является, следовательно, унитарным представлением 7? в Нх. Это представление непрерывно. Действительно, если 0„—»60, то	—» £7ео| для любого
Поскольку Ц U$n || = 1, то топология простой сходимости на Jfx совпадает с топологией простой сходимости на Нх. Следовательно, Uenx —♦ UqX для любого х € Нх. Можно распространить UQ на все Н, полагая До| ~ В Для £ € #х’
Теорема 7'. Для того чтобы процесс
t-*X(t)
_xm (0.
был непрерывным стационарным процессом второго порядка, необходимо и достаточно, чтобы существовало непрерывное унитарное представление 0 —♦ U» множества /? в Н такое, что
xi(t—е) = ДоХДС;
£7el = 1.
162
Доказательство. Достаточность. Можно ограничиться случаем Н = Нх. Оператор 1Д является перестановочным с орто-о	о
тональным проектором на /У, так как {1} и Н устойчивы по отношению к Uq .
Следовательно,
о
Отсюда заключаем, что X — непрерывный стационарный про-цесс второго порядка. Кроме того,
Е (X (0) = (1, X (0) = (1, U*t X (0)) = {Ut 1, X (0)) = = (1,Х(0)) = Е(Х‘(0)>.
Необходимость сразу доказывается, если взять 1Д таким, что
•	U9X(t — 0) = {/9Х(/) и t/e| = g для
Далее все рассматриваемые стационарные процессы будут считаться непрерывными.
Пусть t —> Г^/21 —центрированный стационарный процесс второго порядка, причем X (t) и Y (/)— скалярные случайные величины.
Взаимной корреляционной функцией величин X и У называется функция
0 -> V (X (t - 0), Y (/)) = {X(t- 0), Y (0) = (t/eX (/), Y(/)).
По предположению, она не зависит от I, поэтому вместо обозначения q>x(t). K(t)> соответствующего обозначениям параграфа 2, мы будем писать фх г. Если Y = X, то <рх,х называется автокорреляционной функцией. По определению,
фх, у (9) = Фх (О. Y V (0) = <^еХ (0, Y (/)) =
= (Х(/-0),у(О) = у(Х(^-0),у(О).
Так как
фх, У = фХ (О. У (О = &®Х (i). у (О,
где &х (<)1 у (о — ограниченная мера, не зависящая от t, которую мы обозначим через г, то
Фх, у — у
и, в частности,
Ч’х, х = ^*®х, х»
11*
163
Где ®х * — ограниченная положительная мера. Меры Y и х называются спектральными распределениями взаимной мощности величин X и У. Мера сох х называется спектральным распределением мощности величины X.
- Нетрудно видеть, что
Фу, X = Фх, У» Юу, X “ ®Х, У
Для нецентрированных X, Y будем полагать ' .
Фх, у ~ Фх, У’ шх, у'== ю х, У
Отметим, что
у = v (X (О, Y (0), j ®х, х = О® (X (0).
Если <йхх (соответственно <ох, у) имеет плотность ФХ,Х(ФХ, у) относительно меры Лебега, то ФХ1Х(ФХ, у) называется спектральной плотностью мощности величины X (соответственно спектральной плотностью взаимной мощности величин X и Y).
4. СВЕРТКИ ДЛЯ СТАЦИОНАРНЫХ ПРОЦЕССОВ ВТОРОГО ПОРЯДКА
Теорема 8. Пусть X (t —» X (/)) — стационарный 1 * * скалярный процесс, и 0 —> Ue — соответствующее унитарное представление (удовлетворяющее условиям теоремы 7 или 7').
Для любой ограниченной меры ц процесс Z, определенный формулой
Z (0 = J X{t — 0) • / = U W Х стационарен, так же как и процесс
ГХ(0’ z(/). •

t
Мы положим Z — р. * X.	ч
Доказательство. Из соотношений
[/(И)Х(П = jueX(t)p° = Jx(/ —0)-
и
следует, что процессы Z и t
Z (t — т) = U (ц) X (t — т) = U (ц) UxX (/) = = UxU(p)X(f)==UxZ(t) 'Х«У Y(t)_
Замечание. Имеем Z (0 £ Нх (V € Я).
1 Далее мы будем говорить просто «стационарный» вместо «стационарный
второго порядка».
164
стационарны.
&
Теорема 9 (свойства свертки). Если t
x(ty
Y(t).
нарный процесс, а ц и v — ограниченные меры, то
—стацио-
(1)0* *.v)*X = |i* (v* X);
(2)(6т*Х)(0 = Х(*-т);
(3)	фц*х, у = И * Фх, у', ’
(4)	Фх, V*Y — v * Фх, У’
(5)	<йц*х, у — F * ц - <0х, у!
(6)	СОХ1 v * у ==	* V.®x, У-
В частности,
(OJ1*X, ц*х = 1^"*Н 12,С0х,х!
(7)/пи*х = тх Jp...
Доказательство. При доказательстве свойств (1)—(6) можно предположить, что X и Y центрированы. Тогда
(1)	[(H*v)*X](0 = t/(H*v)X(0= i/(p)t/(v)X(0 =
= [Ji * (v * X)] (0;
(2)	(6t * X) (0 = и (6t) X (0 = Ux X (0 = X (t - t);
(3)	Фц*х, у = фи (g) x (/), у (/) = P- * фх («), у (О — И * фх, у;
(4)	фх, у*У = фХ «). U (V) У (/) = V * фх (f), у «) = v * Фх, у‘>
(5)	Юц*Х, У =	(g) X (t), У (О =	(О, у (О —	* Н'®х, у’>
(6)	fi>x, v*y = ®Х (Z), и (/) У (t) ~^~*V-(i>x (О, У (t) =	* V-®x, у!
(7)/пц#х = £((|**Х)(0)=<1,>*Х)(0) = J<1,X(0> ф' = = 1 "»хР = fnx j р.
Замечание. Свойство (7) можно записать также следующим образом:
т^х =тх (^*ц)(0).
Ограниченные меры являются, следовательно, универсальными операторами свертки для стационарных процессов второго порядка.
165
5. ДАЛЬНЕЙШЕЕ ИЗУЧЕНИЕ СВЕРТКИ
Рассмотрим снова унитарное представление множества /? в гильбертовом пространстве Н. Будем обозначать по-прежнему через векторное подпространство, образованное элементами вида U (f)x, где/С 5. Для каждого Т 6 Ос мы введем оператор U (Т) (область определения которого есть плотное векторное подпространство пространства Н) следующими свойствами:
Если х ё def (U (Т)), то U (Т) х ё НА.;
.<C/(T)x,l/tf)x) = <x, t/(T*f)x), vf€S.
Заметим сначала, что из равенства U (/) х = 0 вытекает соотношение (х, U (Т * f) х) = 0. Действительно, из равенства U (f) х = 0 следует, что &~*f = 0 почти всюду (относительно <oAj х). Следовательно,
{х, U(T*f)x} = \ ЗГ*(Т * /) • х = j	х = 0.
Если 2Г*Т ё £2 (соХ1 х), то
|<х, £/(Т*/)х)|2<{^*7’р.®ж,ж. j|^7l2-®x,x, т. е.
| (х, и (Т * f) х>'|< (J,)1/2Р(/)х||, откуда следует, что отображение
U(f)x->{x, U(T*f)x) есть непрерывная линейная форма. Таким образом, существует элемент z/ё ^х такой, что
(у, U(f)x) = (x, U(T*f)x), где у = U (Т) х. Следовательно, справедлива следующая теорема.
Теорема 10. Если Т ё Ос и если j	A<J + сю,то
существует, причем единственный, элемент U (Т) х такой, что
U(T)x€Hx-,
{U(T)x, U(f)x) = (x,U(T*f)x),
Таким образом, условия х ё def (U (Т)) и
эквивалентны.
166
Предложение 4. .Множество def (U (Т)) есть векторное подпространство пространства Н.
Доказательство непосредственно вытекает из следующей леммы.
Лемма 1. Если х, у 6 Н, то (ях+у,х+у^2((»Х)Х-\~
Доказательство. Для любой функции Z>+ отображение х —> J	есть положительно полуопределенная квадратичная
форма, соответствующая эрмитовой полубилинейной форме
X, У~+ J f-®x,y
Однако для любой эрмитовой полубилинейной формы Атакой, что (х, х) 0, выполняется неравенство
(х + у, X + у) -С 2 {si- (х, х) + st- (у, «/)).
Следовательно,
J f • tox+yt х+у	2 J f • ((Ox-t х + (dyt у).
Предложение 5. Если х£ def (£7 (71)) и z^H, то
W)x,
Доказательство.
а)	Случай z = U (f) х, f(zS. Имеем
<U(T)x, U(f)x> = \&*T-0-*fvx,x = ^*T'tox,U(f)x.
б)	Случай z£ Нх. Положим z = lim zn-, zn — U (/„) x,' fn£ S.
П->оо
Тогда
{U(T)x, z) = lim {U(T)x, U(fn)x) =
П->ОО
= lim	^f.^x>x = \^T.aXtZ.
tl ->co J	J	J
в)	Общий случай: z£ H. Пусть z' — проекция z на Hx. Тогда
{U (Т) х, z) = {U (Т) х, г') = j ^Т-г. = J ^Т-тх, г.
Предложение 6. Если х, у£ def (U (Т)), то
U(T)(x + y) = U(r)x + U(T)y, U(T)(Xx) = W(T)x.
Доказательство. Второе равенство очевидно. Чтобы доказать первое равенство, напишем
(U (Т) (X + у), Z) = J	г = J . (®х, г + ~^у, z) =
= <С/(Т)х, z} + {U(T)y, Z).
167
Заметим, наконец, что	|
def (t/(T))=3^(v х^Н).	'	|
Действительно, если у = U (/) х, f £ S, то <йуу |2-®Х1Х. t
Поскольку &~*Т С От, то &~*ТС 5 и, следовательно,
f | ff~*T I2 у = j I <F*T М I2 шх, х < со. .
Справедлива следующая теорема.
Теорема 11. Если Т £ Ос, то U (Т) является линейным оператором, область определения которого есть плотное векторное подпространство пространства Н.
Заметим, что определения оператора U (Т), данные для Т £ М и Т Е ОС) совпадают на Ж Q Ос-
Предложение 7. Имеют место следующие соотношения:
если х£ def (U (Т));
если г/6 def
если х С de
&U(T)x,	у
(Г) х, у =	* Фя, у
>
®и (Г) х, и (Т)х ~ \&"*Т |2 Фа (П х, и (Т) х =	>
Доказательство. В самом деле,
<(7(Т)х, z> = f^f.®x.2,
откуда для любой f £ S имеем
£/(П»> =
следовательно,
Таким образом,
Пятое равенство немедленно следует из первого и третьего. j Другие формулы выводятся при помощи преобразования Фурье. | 168	i
Теорема 12. Пусть Тъ Т2£0'с. Если х 6 def (U (7\)) и U (Л) х € def (U (Т2)), то х 6 def (U (Т2 * Тх)) и U (Т2 * 7\)х = = U (TJ U (TJ х.
Доказательство. По предположению,
j । &~*Т212 • йу (Г1) у (Г1) х <5 4-оэ.
Из второго неравенства получаем
J | ^*Т2 |2 • |	|2 • йж, х = j | {Ti * Т1) |2 . ж < +ОО,
откуда
x6d6f((7(T2*T1)).
Далее, для у С Н имеем
({/ (Т2) и (ТО х, у} = j ^Т2 • йу (Г1)х,у = f ^*т2 .^*Тх • ЙХ, у-,
{U (Т2 * ТО х, у) = J	• йх, у= J	. йх, у,
Теорема 13. Имеет место def ([/ (Т)) = def (U (Т)), и если х, у е def (U (Т)), то
{U(T)x, у) — (х, U(T)y).
Доказательство. Первая часть непосредственно следует из того, что ST* (Т) — ST* (Т). Кроме того,
(€/(Т)х, у} = |^.йх,/
(х, U(Г) у} = J ^*Т.йх, у = J ^Т-®х. у
Применим теперь полученные результаты к стационарным процессам второго порядка.
Пусть X — стационарный процесс второго порядка. Пусть t —Ut — соответствующее унитарное представление множества R.
Положим для . Т С Ос
z (t) = и (Т) х (0 = (Т * X) (О, считая, что X (t) С def (U (Т)). Последнее выполнено тогда и только тогда, когда
.	||^Т|2.йх,х<4-оо.
Отсюда
UXZ (0 = U (6Т) U (Т) X (0 = U (Т) X (t — т) = Z (t — т).
169
Следовательно, процесс
Имеют место следующие
XI
стационарен, свойства свертки:
(S * Т) * X = S * (Т * X),
если правая часть определена;
y ~ $ * Фх у> если определено;
Фх г * у = 7" * Фх у» если ? *Y определено;
фг * х т* х~Т *Т *<рх х, если Т * X определено;
v = ^~*S‘(nY v, если S*X определено; О А, Y	A t Г 7	x .
®x T * y = ^~*T • g>x Y, если T * Y определено;
т * x = I I2 ®x X’ если T * %- определено,
fnT.x = mx^*T)(<3).
1 ф Л.	A '	zxz
В частности, мы будем называть производной процесса X процесс 6' * X, если только последний определен. В этом случае X будет называться дифференцируемым (в среднем квадратичном).
Необходимым и достаточным условием дифференцируемости является условие
J ®2-“х, Х<+°°-
Тогда имеем
Фб' * х, 6' * х = ® ® * Фх, х ~ Фх, х> * X. д' * X = ®2 ‘ ^Х, X-
Заметим, что из существования б' * X следует, что фх,х дважды непрерывно дифференцируема. Справедливо и обратное утверждение, но мы не будем его здесь доказывать. Можно было бы также показать, что необходимым и достаточным условием ,,	v	Х(0 —Х(0)
дифференцируемости X является существование для —----------
предела в Н при t —> 0, причем
(6' * X) (0 = lim -X(f + A<)~X.(Q., Д/->0	д‘
где предел взят в смысле топологии пространства Н. Именно это свойство оправдывает название «дифференцируем в среднем квадратичном». Заметим, наконец, что если носитель ®х, х ком‘ пактен, то"Х бесконечно дифференцируем.
170
6. ОБОБЩЕНИЯ. ПУАССОНОВСКИЙ ПРОЦЕСС
Пусть X — стационарный процесс второго порядка, не обязательно центрированный. Для любой меры р мо^йно определить случайную величину Хм следующим соотношением:
Хц = J = * X) (0) = £7(н)X (0).
Имеем
Е(ХМ) = (1, Xfl> = J<l,X(0>.|*< = jE(X(/))-^ = m4 Ji.
Далее
v(Xv, X„)=fw-' ’ и J v * х, g * х
= J	= j ^V-^-(dx,x.
Это же выражение можно вычислить С'Помощью корреляционной функции Фх,х. В самом деле,
(Xv, Хц} = <fv	(0) =
. = (V * i* * Фх, х (0) = [(V * ц) * <рх> х] (°) = J Фх, x-(**n).
, Итак,
v(Xv> XJ = J^-^*®x, х = JФх, x-(**l*).
Очевидно, что
£(ХМи)=£(Хц);
v(X6a*v, Хба*ц) = у(Ху, Хц) для любого а€/?.
Перепишем эти формулы для случая, когда р, и v заменены функциями f, L1, используя при этом более удобное для данного параграфа обозначение:
f f.X=\f(t)X(t)dt.
Тогда
v(Isr'XJ^X) = i^f-x.x = jg* f-Фх.х;
£(fr-x)=/nx.[7.
Аналогично
E (J (V M =E (J f.x)
И
v(j(«a»g)-X,	=v(Jf-X, f^-x), уа€Л.
171
Применение. Пусть Р (D) z = х (t) — дифференциальное уравнение, a Zo (0 — его элементарное решение в D+. Если х (/) имеет положительный носитель, то решением с положительным носителем будет
t
z (0 = (z0 * х) (t) = j z0 (t — 0) x (ft) dft для t 0. о
Пусть теперь X — стационарный случайный процесс второго порядка, и — функция Хевисайда. Мы определим также реакцию на воздействие ‘V (f) X (/) соотношением
t
Z (t) = j z0 (t — 0) X (ft) dft для t 0. о
Для t > 0 положим
__ f Zo (t — 0) для 6 € [0, q, z — 1	0	для ft 3 [0, t].
Тогда
Z(f) = j X (V)ht(tyd9 = |ht-X
и, следовательно, для tr, 0
v (Z (/i), ZJtJ)	x.
Естественно, процесс Z не будет стационарным.
Дадим теперь обобщение понятия случайного процесса. Мы видели, что любой стационарный процесс второго порядка ставит в соответствие любой_ функции /С L1 случайную величину J/-X 6 Н. Поэтому мы получим естественное обобщение, ограничивая область определения этого отображения, например, просто предполагая, что оно определено на D. Если выполняется условие непрерывности (СС), то это обобщение сводится к определению отображения f—* J/-X как распределения со значениями в Н. Предположение о том, что J/-X принадлежит Н, введено для упрощения изложения. Кроме того, мы ограничимся случаем, когда отображение f —» j f-X определено на 5. Мы приходим, таким образом, к следующему определению.
Определение. Процесс-обобщенной функцией медленного роста называется всякая обобщенная функция медленного роста X на R со значениями в пространстве Н случайных величин, интегрируемых с квадратом, т. е. всякое непрерывное отображение X : / —> jf-X из 5 в Я.
172
В дальнейшем вместо «процесс-обобщенная функция медленного роста» мы просто будем употреблять «процесс-обобщенная функция».
Процесс-обобщенная функция будет называться обобщенным стационарным процессом второго порядка, если
E(J(6a*f).x) = E(p.x)
J(6a*fH) = v(j£.X, J f-x).
В дальнейшем будут рассматриваться только обобщенные стационарные процессы второго порядка.
Стационарные процессы второго порядка, рассмотренные в предыдущих параграфах, являются частным случаем процесс-обоб-щенной функции. Чтобы подчеркнуть этот факт, мы будем их называть процесс-функциями.
Пусть X — процесс-обобщенная функция. Отображение f—> —/-Х) является непрерывной линейной формой на 5, т. е. обобщенной функцией медленного роста. Более того, если X стационарен, то эта обобщенная функция инвариантна относительно сдвига, откуда следует, что она пропордиональна мере Лебега. Следовательно, можно положить
Е(р-Х) = Иф.
Число тх называется средним значением процесс-обобщенной функции X.
Если тх = 0, то X называется центрированной. Процесс-обобщенная функция X—тх является центрированным процессом.
Покажем, что существуют положительная мера медленного роста сох, х и обобщенная функция медленного роста <рх,х такие, что
<Рх, х == &(Ох, х\
v(jg-X, J f-X) =	x = f	x-
Эта формула обобщает формулы, данные в начале параграфа для процесс-функций. Мера ©х, х называется спектральной мерой, а обобщенная функция фх, х — обобщенной автокорел-ляцией процесса X. Если мера ©х,.х имеет плотность Фх, х относительно меры Лебега, то Фх, х называется спектральной плотностью процесса X.
Можно определить свертку процесс-обобщенной функции X с обобщенной функцией Т £ Ос следующим образом: процесс Т * X есть процесс-обобщенная функция, которая каждой функ-
173
ции f£S ставит в соответствие случайную величину J f-T * X, определенную формулой
]МТ*Х) =
Это определение есть общее определение свертки векторной обобщенной функции медленного роста с обобщенной функцией из Ос- Оно обобщает (с точностью до обозначений) определение, данное в гл. 3 для свертки скалярной обобщенной функции медленного роста с обобщенной функцией из Ос. Проверим, что процесс Т * X является стационарным. Действительно,
E(J(da*/).(T*X)] = E(J (f *6a*f).x) =
= f(J (T*f)-X) = E(Jf-(T*X)).
Теорема 14. Имеет место равенство тт*х = (^"*7) (0)-/пх. Доказательство. В самом деле,
E(jf.(T*X)) = E(J (Т *f)-X] = mx^T *f =
= tnx • (Т */)] (0) = тх.(0). j f.
Теорема 15. Справедливы равенства
т*х =	х
и
т*х = Т *Т *фх, х-
Доказательство. Для f, g£ S имеем
JSTg-@~f-(dT*x, т*х = v j g-(Т * X), J f '(T * X)} —
= V (J (T * g).x, J (T -x) = pF (T * g) &	* f)-©X, x =
= f $-T'$^.&-T-$-f-ax,x = J откуда
^Л®^х,^х = ^Л|^*Т|2-Ох,х (Vfe5).
Как следствие (беря, например, (SFf) (со) — е~®2 и умножая на е02), получаем доказательство первой части теоремы. Вторая часть теоремы получается с помощью преобразования Фурье.
Замечание. Можно без труда получить аналоги формул (3), (4), (5), (6) из теоремы 9, если ввести двумерный обобщенный процесс.
174
Пусть Отображение f—>	|/• X / является скаляр-
ной обобщенной функцией медленного роста. Обозначим его через Xg. По определению,
<Е.рХ>=Фхг-
Лемма 2. Для Т С Ов имеем
(Т * X)g = Т *
Доказательство. Пусть S. Тогда
Jf.(T* х)6 =<g, Jf.(T*Х)> = J (т * f)-x) =
= j(7’*f).Xfe = jf.(T*Xg), что доказывает лемму.
Как применение этой леммы рассмотрим свертку процесс-обобщенной функции с функцией /г £ 5.
Теорема 16. Если h 6 5, то h * X есть процесс-функция и (Л* Х)(0= Jh(t — Q)-Xе.
Доказательство. Каковы бы ни были g Е Н и fES, имеем
<i. Jf(o[H-o)-x’]d/>==
= J f (0 О, f h (t - 0) -Х9> dt = J f (0 [ J h (t - 0) -xf ] dt=\ == f * xg) (o dt = f f (o (h * х)6 (o dt =
= 0, Jf./i*x>.
Следовательно,
jf (/)[{/, (7_6) Xe]^ = Jf.(A*X), что и доказывает теорему.
Теорема 16 показывает, что свертка с элементом пространства 5 преобразует рассматриваемую процесс-обобщенную функцию в процесс-функцию. Для заданной процесс-обобщенной функции может существовать другой элемент с таким свойством. Вообще, для того чтобы Т * X был процесс-функцией, необходимо и достаточно, чтобы удовлетворялось условие
Это условие, очевидно, необходимо, поскольку левая часть равна j <&т*х, т*х- Чтобы показать его достаточность, воспользуемся следующей теоремой: для того чтобы процесс-обобщенная
175
функция Y была процесс-фу нкцией, необходимо и достаточно, чтобы j + оо. Трудности, встречавшиеся при определении свертки процесс-функции с элементом Т£ОС (см. параграф 5), привели к тому, что мы постарались определить Т * X как процесс-функцию и объяснить возможные условия, при которых она существует.
Применим предыдущие понятия к изучению случайных процессов Пуассона. Рассмотрим явление (например, телефонные вызовы на линии, излучение частиц и т. д.), которое возникает время от времени и моменты появления которого зависят от случая. Обозначим через п (Е) число появлений этого события в интервале времени Е. Это число — случайная величина. Точное определение процесса Пуассона требует наложения некоторых требований на случайную величину п (Е).
В дальнейшем в качестве интервала Е возьмем [я, Ь[, где а и b конечны.
Определение. Процессом Пуассона называется отображение £ —> п (£), которое каждому интервалу Е ставит в соответствие случайную величину п (£) (на некотором вероятностном пространстве) таким образом, что:
1) распределение вероятностей величины п (£) есть распределение Пуассона с параметром 1с, где I есть длина интервала Е ис — положительная постоянная; следовательно,
2) если Ег й Е2 — два непересекающихся интервала, то п (Ej) и п (Е2) являются независимыми случайными величинами.
Постоянная с называется плотностью пуассоновского процесса.
Из определений следует, что
E(n(£)) = cZ; о2 (п (£))== cl.
Сейчас мы построим обобщенный процесс, исходя из процесса Пуассона.
Обозначим через F векторное пространство, образованное функциями, обладающими лишь конечным числом значений. При этом пусть каждое ненулевое значение принимается только на объединении конечного числа интервалов.
Пусть f, g£F. Тогда можно найти конечное число интервалов Et таких, что (рис. 11):
прилСЕ,-;
(О при (J
|t]z при х£Е(, (О при х $ (J Е{.
S W
176
Пусть l{ — длина интервала Е{. Функциям f и g поставим в соответствие случайные величины
Xf = S^o i	i
Тогда
£(Xf) =	= ф
i	i	i
и, аналогично,
£(xg)=cj^.
Отсюда
v(Xg,Xz)=2’>/^v(n(Ei), «0 = i
= S ъ^®2 (« (£»)) = S ^ih'cli=c j gf. i	i
В частности, о2 (Xf) '= c J |/|2. Следовательно, норма Xf в H дается формулой
ТО = с2| J / |2 + с Jif I2.
Рассмотрим теперь пространство Банаха £1Q£2 с нормой f-Ш1;2 = № + 1Ик.
Тогда F cz L1 [) £2 и отображение f —» Xf есть линейное непрерывное отображение из F в Н, где F имеет топологию пространства L1 П L2. Это отображение продолжается до непрерывного отображения X из L1 П £2 в Н, которое, в частности, определено и непрерывно на 5. Следовательно, это—процесс-обобщен-ная функция. Положим Xf = J/-X для / С F. Формулы vfjg.x, р.х) = фг, справедливые для f, g£ F, остаются справедливыми (по непрерывности) для f, g£ L1 П £2- Проверим, что определенный таким образом процесс является стационарным. Действительно,
Е (J (6а* /).Х] = cf 8а * f = с j f = Е (J f -Х),
V (J (6а * g) -X, J (6a*f)-х) = с J (6^7)• (6а * f) =
= 4?f=v(Jsr-x, Jz-x).
12 р, Паллю де Ла Барьер	177
Вычислим спектральную меру <ох>х и обобщенную автокорреляционную функцию. Имеем
v(Jg-x, =	=
Сравнивая ее с общим определением, мы видим, что спектральная мера равна мере Лебега, умноженной на иначе говоря, она имеет постоянную спектральную плотность Фхх(<°) ==='^-Обобщенная автокорреляционная функция равна, следовательно, сб. Наконец, среднее тх равно с. Таким образом, справедлива следующая теорема.
Теорема 17. Всякий пуассоновский процесс с плотностью с можно рассматривать как процесс-обобщенную функцию X с постоянной спектральной плотностью --р обобщенной автокорреляционной функцией сб и средним с.
Процесс Пуассона с постоянной спектральной плотностью обычно называют пуассоновским («белым шумом»).
Исследуем свертку процесса Пуассона с обобщенной или обычной функцией. Можно, естественно, воспользоваться общей формулой свертки с элементом Т Е О'с- При этом мы получим один классический результат, относящийся к свертке с некоторой функцией.
Для h^S имеем'
(h * X) (0 = J h(t — 0) Xs.
Выражение справа сохраняет смысл при L1 П £2, и последняя формула позволяет, следовательно, определить h * X для h Е В1 П L2.
Если h = lim hn, где /i„ С <$, то п->со
(h. * X) (0 = lim {hn * X) (/).
П-»со
Теорема 18 (Кэмпбелла). Свертка h * X процесса Пуассона X с функцией /гС L1 П £2 есть процесс-функция со спектральной плотностью | &"*h |2/2л, с функцией автокорреляции h * h и со средним с J h.
Доказательство. Если /г(Е 8, то утверждения теоремы вытекают из теорем 14 и 15. В общем случае заметим, что h = = lim hn лежит в L1 П L2, если hn£ 8.
П-> ОО	'
178
Пусть теперь Y = h * X и Yn = hn * X. Тогда lim Yn (/) = 4	n->co
= Y (t) (в H) и, следовательно,
фу. у (0 = V (Г (0), Y (t)) = lim v (Yn (0), Yn (t)) =
= lim <pr у (0 = lim J hn (t — 0) hn (6) M = M->co	n->00 v
= j£(/— о)Л(0)4/е = (/Г* /г) (t).
Таким образом, <pr> Y = h * h и, следовательно, «к. Y = I гг-л I2.
Далее •
/nr = (l, Y (ty = lim (1, Yn(t~)} — lime [ hn = c f h. n->oo	rt->co J	J
Процессы Пуассона обладают многими замечательными свойствами. Отметим сейчас лишь следующее.
Теорема 19. Пусть Т1г Т.........Тп, . . . — моменты времени
^0, упорядоченные в возрастающую последовательность (моменты Tt есть моменты появления событий). Случайные величины Тъ Т% — Ти . . ., Тп — независимы и имеют одну и ту же плотность распределения:
(се~са при «^0;
0 («) =
[ , 0 при и<0.
12*
ГЛАВА 8
ЛИНЕЙНЫЕ СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
1. ОПИСАНИЕ ЛИНЕЙНЫХ СТАНДАРТНЫХ ЗВЕНЬЕВ
Под звеном будем понимать всякую физическую или нефизическую систему S, преобразующую входную величину е (/), которая изменяется во времени, в выходную величину s (t), также
изменяющуюся во времени.
Входная и выходная величины могут быть величинами скалярными или векторными. Звено называется линейным, если выход-
е
5
5
Рис. 12
ная величина s связана со входной линейной зависимостью. Звено называется стационарным, если всякому изменению во времени входной величины будет соответствовать такое же изменение во времени выходной величины, иначе говоря, если преобразование
е —> s перестановочно относительно сдвига по времени.
Рассмотрим случай, когда входная и выходная величины являются скалярными величинами. Линейное стационарное звено для этого случая имеет вид, указанный на рис. 12.	-
Налагая некоторые условия на допустимые входные величины (при которых определено преобразование е—» s), можно показать, что всякое линейное стационарное звено записывается в виде свертки е —> s = f * е, где f может быть обобщенной функцией. Тогда можно убедиться, что преобразование е—> s определено не только для функций, но и для мер или обобщенных функций.
С другой стороны, можно считать, что всякой свертке соответствует линейное стационарное звено. Линейное стационарное звено можно определить также при помощи следующих понятий: импульсная переходная функция; реакция звена на единичный скачок; передаточная функция; реакция на гармоническое воздействие; годограф Найквиста.
Импульсная переходная функция
Импульсной переходной функцией называется элемент f (функция, мера или обобщенная функция) такой, что
s = f * е.
Следовательно, импульсная переходная функция представляет собой значение s для е = 6 (единичный импульс). Исходя из фи-180
зических соображений, всегда полагают, что f имеет положительный носитель, и система не будет реагировать на воздействие, пока существует импульсная функция в качестве входной функции. Совокупность входных величин, для которых преобразование е —* f * е = s имеет смысл, естественно, зависит от /*.
Реакция звена на единичный скачок
Под единичным скачком понимают функцию^, определяемую следующим образом:
^(0 =
11 при t 0; (0 при t <; 0.
Реакция звена на единичный скачок имеет вид f * бЦ. Ее производная в смысле обобщенных функций равна f. Иногда Щ называется скачком положения. Функции * ‘V и часто называют соответственно скачком скорости и скачком ускорения.
Для них имеем
(<У *<V) (0 =
t при 15= 0;
0 при t 0;
(<?/ *	* <V) (/) =
| /2/2 при t 0; | 0 при /<<0.
Передаточная функция
Передаточной функцией F (р) называется преобразование Лапласа функции f. Если е имеет положительный носитель и допускает преобразование Лапласа Е (р), то s имеет положительный носитель и допускает преобразование Лапласа S (р), определяемое по формуле
S (р) = F (р) Е (р).
Пример. Предположим, что зависимость между е и s представлена дифференциальным уравнением с постоянными коэффициентами:
(a) aQDns + aiD^s +------Ь dn-i Ds + ans = e
или в более сжатой форме
A (D) s = е, где х
А (р) = аорп + щря-1 + • • • + Hn-iP + ап.
* Заметим, что если f есть функция, то эта функция определена только с точностью до некоторого слагаемого, равного почти всюду нулю.
181
Если е= б, то существует единственное решение с положительным носителем (обозначим его через /), преобразование «Лапласа F (р) которого определяется по формуле
A (р) F (р) = 1, т. е.
Это f является элементарным решением уравнения (а) в D^_. Если е имеет положительный носитель и допускает преобразование Лапласа Е (р), то уравнение (а) имеет единственное решение s с положительным носителем, преобразование Лапласа которого определяется по формуле
Если е имеет произвольный носитель, то условимся выбирать среди решений уравнения (а) (которые определяются с точностью до слагаемого некоторого решения уравнения без правой части) те решения, которые определяются срот-ношением
s =f * е,
если правая часть имеет смысл. При этих условиях уравнение (а) определяет линейное стационарное звено, импульсной переходной функцией которого является f, а передаточной функцией
Вообще, если связь между е и s определяется соотношением A (D) s = В (D) е,
где А и В — полиномы, то импульсная переходная функция f будет решением в уравнения
A (D) f = В (D) 6, а передаточная функция имеет вид:
Вообще говоря (исходя из физических соображений), степень (В) степени (А).
Реакция на гармоническое воздействие
Допустим, что импульсная переходная функция звена является ограниченной мерой (в этом случае /Е L1). Тогда в качестве входной функции можно взять е (t) = elGit. На выходе получим S (0 = (ц *е) (0 = J (<-6)-р = ем J е~м • р? =eia>t (^*р) (®).
Пусть М (р) — преобразование Лапласа для р,, т. е. передаточная функция. Имеем (^*р.) (о) = М (йо), откуда
е (0 = eiat =) s(t) = M (in) eia,t.
182
Функция Л4 (fco) называется гармонической реакцией звена. Если вещественная, то М (ио) = М (—но).
Если
е (0 = е0 cos (at + <р) = е0 [№*' + е~^е-м], то получим
S (/) = eQ [et<₽ м (ио) ем + е“1ф М (— ico) е“£<0/] = s0 cos (со£ 4- гр), где
s0 = е01М (/со) |; гр = <р + ArgM (но).
Таким образом, для синусоидальной входной функции выходная функция тоже будет синусоидальной с амплитудой | М (гео) | и фазой Arg М (но).
Определить заранее гармоническую реакцию для любой импульсной переходной функции невозможно.
Рассмотрим звено, описываемое дифференциальным уравнением вида
A (D) s = е.
Импульсная переходная функция при 0 является частным решением уравнения
A (D) s = 0.
Если все корни уравнения А (р) — 0 имеют строго отрицательные действительные -части, то импульсная переходная функция быстро убывает при t—> -|-оо и является интегрируемой. Используя предыдущие результаты, получим
e(0 = ^=>s(0 = -7(tr^-
В случае, когда некоторые из корней уравнения А (р) = 0 имеют положительные или равные нулю действительные части, свертка е * f не определена при е (/) = eiat. Но среди решений уравнения А (£>) s = е всегда существует частное решение, равное (кроме случая, когда гео является одним из корней /1 1(0 J
полинома А). По этой причине величина во всех случаях называется гармонической реакцией звена.
Заметим, что если F (р) — преобразование Лапласа импульсной переходной функции Д то"
- ~л'7- \ F (и°). Я (ко) v '
Вообще, когда соотношение между входной и выходной величинами выражается формулой
A (D) s = В (D) е, где А и В — полиномы, реакция звена на гармоническое воздействие определяется функцией В (/©)/А (ио).
183
Пусть f — импульсная переходная функция звена, а У7 — =cS}f — передаточная функция. Если все нули функции имеют отрицательные действительные части, то
е (0 = s (0 = (е * f) (0 = е1а* = F еМ-
В общем случае можно утверждать, что среди решений уравнения A (D) s = В (D) е при е (/) = etGit имеется частное решение
s<') = 47Sre" = f(»)e'"
Наконец, если передаточная функция F является мероморфной в полуплоскости Re р > а, где а < 0, то реакция на гармоническое воздействие определяется функцией F (Усо). Следует заметить, что использование величины е = el(i)t в качестве входной физически невозможно, так как все входные величины должны иметь положительный носитель, если 0 является моментом, с которого экспериментатор использует звено. Поэтому необходимо исследовать сигнал на выходе, соответствующий входному сигналу е (t) = Щ (f) Получаем следующий результат.
Теорема 1. Если импульсная переходная функция является ограниченной мерой, то выходная величина s (/), соответствующая входной величине е (f)	(tye1®*, имеет вид
s (0 =	(/). М (ио)	+ в (/),
где
М = gy, и lim е (/) = 0.
+ со
Доказательство. Положим
s2(0==
Тогда Sj — s2 имеет отрицательный носитель. Поэтому доказательство теоремы непосредственно получается из следующей леммы.
Лемма 1. Если- ji — ограниченная мера, a h — ограниченная функция с отрицательным носителем, то
lim (ц * h) (t) = 0.
В самом деле,
(}1*/г)(0=	—6)-]ш6= ( h{t —
[f, +со откуда.
| (ц * h) (t) | < sup | h (t) |.j* ([£, 4-oo[).
184
Или имеем
lim (tf, +оо[) = 0,
1-++ со
откуда следует доказательство леммы.
При использовании этой теоремы можно легко вычислить величину М (гео), если на входе имеем е (t) =	(0 при усло-
вии, что pt является ограниченной мерой. В частности, если справедливо уравнение
A (D) s = В (D) е,
то 8 (t) (см. теорему 1) при t >> 0 является частным решением уравнения A (D) Y = 0. Если все нули функции А имеют отрицательные действительные части, то теорема применима. Если функция А имеет нули с положительными иЛи равными нулю действительными частями, то применить теорему нельзя.
Годограф Найквиста
Пусть имеем звено, передаточная функция F (р) которого является мероморфной для Re (р) > а, где а < 0. Годографом Найквиста называется геометрическое место точек F (йо) в ком-, плексной плоскости при изменении <о от —сю до 4~оо. Поэтому годограф Найквиста представляет собой графическое изображение'' реакции звена на гармоническое воздействие. Для реальных звеньев F (—йо) = F (гео). Ветви годографа Найквиста, соответствующие значениям (о 0 и (о 0, симметричны относительно вещественной оси. В приводимых ниже примерах ветвь годографа, определяемая значениями <о 0, указана пунктирной линией.
Примеры.
Это передаточная функция звена, для которого
(Тр+ 1) s (р) = Е (р), т. е.
TDs + s = е.
Имеем
F^ = TTTi^-
Годограф Найквиста представляет собой окружность, проходящую через диаметрально противоположные точки 0 и +1 (рис. 13).
Это передаточная функция звена, для которого
TD2s + Ds = е.
185
Имеем
iw (1 + Т1ы) *
При co -> О получим бесконечную ветвь с вертикальным асимптотическим направлением. Для конечного участка кривой имеем
F (tco) =	----Т + е (о), е (со) -> 0 при со —> 0.
Годограф Найквиста имеет вертикальную асимптоту с абсциссой—Т, При (о->оо получим F (tco) = —1/со2. Следовательно, годограф Найквиста имеет
в начале координат точку возврата (рис. 14).
3)	Влияние полюса передаточной функции при р = 0. Предположим, что
г(р) = -4-л (р), р
где функция Fi голоморфна и не равна нулю при р = 0. В этом случае говорят, что звено допускает k интегрирований. Тогда имеем
F (по) ~ Ft (0) при со -> 0. (icof
Следовательно, годограф Найквиста имеет бесконечную ветвь. Если Fi (0)> 0, то асимптотическими направлениями являются —kn/2 при со ->+0 и fai/2 при со -> —0.
4)	f(p)= (1 + Лр) (1 + г2р) •
Эта передаточная функция соответствует звену второго порядка без интегрирования. Имеем
F (1Ю) = (1+Лйо) (1 +Т2(<о) '
Годограф Найквиста не имеет бесконечной ветви. При со -> оо получим
F (1ю) ~ ТгТ^ ’
186
откуда следует, что начало координат является точкой возврата (рис. 15).
5)	F(p) = е“тр(т>0).
В этом случае s =	* е; такое звено называется звеном с запаздыванием.
Имеем
F (ia) =
Годограф Найквиста представляет собой окружность с центром в точке О и радиусом, равным 1 (рис. 16).
В заключение остановимся коротко на линейных стационарных звеньях со многими входами и выходами (т. е. с векторными входными и выходными величинами).
Пусть (Z) (i = 1, ’. . ., р) — входные сигналы и s;- (t) (j = = 1, . . ., q) —выходные. Предположим, что существуют элементы f£t j (функции, меры или обобщенные функции) с положительными носителями такие, что
3/ = S fl. 1 * eZ-i
Элементы fit j называются импульсными переходными функциями (импульсными реакциями). Если они имеют преобразования Лапласа Fitто последние называются передаточными функциями.
Если входные величины е£ имеют положительные носители и преобразования Лапласа Е/, то выходные величины s}- тоже имеют положительные носители и преобразования Лапласа S/. Имеем
S/(p) = Srz,/(p)E/(p).
L
Можно ввести также понятие реакции на гармоническое воздействие.
2.	ЗВЕНЬЯ УПРАВЛЕНИЯ
Пусть имеется звено S с входным сигналом с (/) и выходным сигналом s (/); кроме того, известна величина е (/). Предлагается поместить перед системой S звено 2 с выходным сигналом с (/), предназначенное для вычисления или определения с (/) таким
187
образом, чтобы s (t) было достаточно близко к e(t) (в некотором смысле) (рис. 17, а).
.В зависимости от природы входов звена 2 можно выделить два случая:
1)	звено 2 имеет только один входной сигнал а; тогда полная система называется разомкнутой (рис. 17, б);
Рис. 17.	Рис. 18.
она является системой управления или регулирования. Во втором случае звено 2 называется звеном управления, величинам (/) называется управлением.
Интерес представляют замкнутые системы со скачкообразным управлением. В их состав входят два звена Л и В, имеющие соот
а)
Рис 19.
ветственно входные сигналы е и $; выходные величины этих звеньев подаются на звено, называемое дифференциалом, и их разность затем направляется в третье звено С, на выходе которого получается управление с (/) (рис. 19, а и б). На рис. 19, а изображена функциональная схема в том виде, в каком она обычно представляется.
Звено А называется звеном опережения, звено С — корректирующим звеном, а звено В — звеном обратной связи. В частном 188’
случае, когда В осуществляет тождественное преобразование, т. е. имеет в качестве импульсной переходной функции 6, а в качестве передаточной функции 1, говорят, что система имеет единичную обратную связь.
Отметим, что звено опережения включено последовательно с остальной системой, поэтому можно изучать системы без звеньев опережения. Наиболее простой системой, которая будет рассматриваться, является замкнутая система без звена опережения и с единичной обратной связью.
Рассматривая корректирующее звено и звено управления как единое целое, получим функциональную схему, показанную на рис. 20, на которой е (/) представляет собой скачок е (/) — s (/) между входным и выходным сигналами.
Следует отметить, что если все рассмотренное выше кажется ествественным с физической точки
t(t)
e(t)
sit)
Рис. 20.
зрения, то еще не очевидно, как
оно способствует созданию линейных стационарных систем* Необходимо проверить, приводит ли это к определенному соотношению между входным сигналом а (/) и выходным сигналом s (/) и будет ли это соотношение типа s = g * е.
Рассмотрим сначала систему с единичной обратной связью (рис. 20). Пусть f — импульсная переходная функция системы S, a F =	— передаточная функция. Зависимость между вход-
ным и выходным сигналами будет иметь вид
f * (е — s) = s,
т. е.
(5 + /) * s = / * е.
Предположим, что это уравнение имеет решение s в при е = 6, т. е. уравнение
(6 + f) * g = f
имеет решение g в Тогда можно записать
s = g * е,
и g будет импульсной переходной функцией рассматриваемой системы. Если f и g имеют преобразования Лапласа соответственно F и G, то справедливо равенство
Q lp\ — f И
189
Наоборот, если правая часть F (р)/[1 + F (р)] есть преобразование Лапласа обобщенной функции из то она является импульсной переходной функцией системы.
Вообще можно показать [см. 64, стр. 143], что если f является локально интегрируемой функцией, то уравнение
(6 + Г) * g = f
имеет локально интегрируемое решение gt которое поэтому является импульсной переходной функцией системы.
Рассмотрим теперь систему с неединичной обратной связью. Пусть h — импульсная переходная функция звена обратной связи. Тогда зависимость между входным и выходным сигналами запишется в виде
f * (е — h * s) = s, т. е.
(6 -ф- f * h) * s — f * e.
Если уравнение
(6 + f * h) * g = f
имеет решение g£ D'+, to
s = g * e
и g является импульсной переходной функцией системы. Если /, h, g имеют соответственно преобразования Лапласа F, Н, G, то справедливо следующее сотношение:
а —	f(p)
сцр; -	- l+F(p)H(p) *
Обратно, если правая часть есть преобразование Лапласа обобщенной функции из то эта обобщенная функция является импульсной переходной функцией системы. Вообще, если f * h — локально суммируемая функция, то уравнение
(6 + f * h) * g = f
имеет локально суммируемое решение g, которое является импульсной переходной функцией системы.
3.	УСТОЙЧИВОСТЬ
Определения. Пусть дано звено, импульсная переходная функция f которого имеет положительный носитель. Тогда справедливы следующие определения.
1.	Если f (/) стремится к 0 при +<х>, то говорят, что звено устойчиво.
2.	Если f (t) ограничена при t —>4-00, то говорят, что звено квазиустойчиво.
190
3.	Если f (t) не ограничена, то говорят, что звено неустойчиво* 1.
Пример. Пусть звено определяется дифференциальным уравнением
A (D> s - В (D) е, где А и В — полиномы, причем степень В меньше степени А.
Для />>0 импульсная переходная функция является решением уравнения A (D) f = 0.
В результате получаем:
если все нули полинома А(р) имеют (строго) отрицательные вещественные части, то звено устойчиво;
если полином А (р) имеет нули с положительными вещественными частями, то звено неустойчиво;
если все нули полинома А(р) имеют вещественные отрицательные или равные нулю части, то система будет квазиустой-чивой, если его чисто мнимые нули являются простыми, и неустойчивой в ^противном случае.
Рассмотрим теперь замкнутую систему с передаточной функцией
G (р) =z________
Положим р = I + ио. Назовем контуром Найквиста контур У = Y1 + у2 + Уз + Y4 (рис. 21), где: Yi — отрезок [fe, iR] мнимой оси; Y2 — полуокружность с центром О и радиусом R, расположенная в полуплоскости £	0; у3 — отрезок [—iR,
—is ] мнимой оси; у* — полуокружность с центром О и радиусом е, расположенная в полуплоскости £	0.
Предполагается, что контур Найквиста имеет отрицательное направление.
Пусть Р — число полюсов функции F (р) внутри контура Найквиста (полюс считается столько раз, какова его кратность). Предположим, что Z —число нулей функции 1 +F (р), расположенных внутри контура Найквиста (каждый нуль считается столько раз, какова его кратность).
Имеем
 Р - Z = AY Arg [1 + F (р)],
1 Принимая во внимание, что / определяется с точностью до функции, равной нулю почти всюду, эти определения должны быть уточнены следующим образом:
1. Если среди реализаций импульсной переходной функции имеется f такое, что f (f) стремится к 0 при t -> + оо, то звено устойчиво.
2. Если среди реализаций импульсной переходной функции имеется f такое, что f (t) является ограниченной при t -> +оо, то звено квазиустойчиво.
3. Если условие 2 не выполняется, то звено неустойчиво.
Это можно выразить также следующим образом. Для любого t пусть a (t) — нижняя грань чисел М таких, что f (0) М при 0^ t, исключая множество с мерой Лебега, равной нулю. Величина a(t) не зависит от выбранной реализации импульсной переходной функции, поэтому:
1) если lim а (/) == 0, то звено устойчиво;
/->-{-00
2) если а (/) ограничена при t -+ +оо, то звено квазиустойчиво;
3) если a (t) не ограничена при t -> +оо, то звено неустойчиво.
191
где правая часть представляет собой изменение аргумента функции 1 + F (р), когда р пробегает контур Найквиста.
Допустим также, что F (р) стремится к нулю при р —» оо, Re р 0. Тогда в указанной формуле R можно устремить к 4~оо, в результате чего получим следующее правило.
Правило. Пусть Р — число полюсов функции F(p), отличных от 0 и расположенных в полуплоскости Re р 0, a Z — число нулей, расположенных в той же полуплоскости. Тогда имеем
P-Z = kr Arg[l+F(p)], где правая часть представляет собой изменение аргумента функции 1 +	(р), когда р = | + ио Дописывает в направлении
Kpwypr
Рис. 22.
«возрастания со» путь Г (рис. 22), состоящий из луча мнимой оси со «С е; полуокружности с центром О и радиусом е, расположенной в полуплоскости 1^0; луча мнимой оси © е.
Если нуль не является полюсом функции F (р), то можно заменить указанный контур мнимой осью в направлении «возрастания (О».
Следствие 1. Предположим, что F (р) — рациональная дробь, стремящаяся к нулю при р—»оо и не имеющая чисто мнимых полюсов, отличных от нуля. Тогда необходимое и достаточное условие устойчивости системы с передаточной функцией
ед=ттгй -записывается в виде равенства
. Ar[Arg(l+E(p))] = P,
где Р — число полюсов функции F (р) в полуплоскости Re р > 0, а Дг [Arg (1 + F (р))] — изменение аргумента функции 1 + + F (р), когда р ^пробегает контур Г (или мнимую ось, если 0 не является полюсом функции F).
Назовем дугой соединения геометрическое место точек F (р), когда р описывает полуокружность с центром 0 и_радиусом е. 192
Ее можно получить, если аппроксимировать функцию F (р) при р —> 0. Если 0 является полюсом порядка k функции F, то
где Fr голоморфна и не равна нулю в точке 0.
Отсюда получаем
Следовательно, F (р) изменяется около окружности с радиусом 1/еА, а ее аргумент делает приблизительно ±& полукругов. Оставшаяся часть геометрического места точек F (р) при изменении р по контуру Г представляет собой часть годографа Найквиста.
Прежде чем перейти к примерам, введем некоторые изменения в обозначениях. Заменим F (р) функцией KF (р), где постоянная К, называемая коэффициентом усиления, определяется следующим образом:
если 0 не является полюсом функции F, то полагаем F (0) = -1;
если 0 является полюсом порядка k функции F, то полагаем F (р)— 1/р* при р —* 0.
Если -имеется годограф Найквиста при К = 1, то годограф Найквиста при других К получается преобразованием гомотетии относительно К. из годографа Найквиста при К — I.
Примеры.
° F (р) = (1+Т1Р)(1 + Тгр) ’
где Ti, 0.
Годограф Найквиста изображен на рис. 23. Имеем Р — 0 и
[Arg (14- F(p))] = 0.
Эта величина представляет собой изменение Arg (1 + F (iw)) при изменении ш от —оо до+оо.
Следовательно, система устойчива для любого К.
2)	F (₽) = p(p2 + 2zp + 1)’ W
Положим
F1	~ p(p2 + 2zp 4- 1)'
Годограф Найквиста вычерчен для К=1. Рис. 24 и 25 отличаются расположением точки—1 относительно точки пересечения годографа Найквиста с вещественной осью. Годограф дополнен геометрическим местом точек Fi (р), когда р описывает полуокружность с радиусом г. При р -> 0 имеем
Fi (Р) ~ 4-
13 р. Паллю де Ла Барьер
193
и Fi(p) описывает приблизительно полуокружность с радиусом 1/г; аргумент изменяется от+л/2 до —л/2. Так как Р — 0, то при К ~ 1 система устойчива в случае, показанном на рис. 24, и неустойчива в случае, показанном на рис. 25. В двух случаях имеется значение коэффициента усиления До такое, что если
К < Ко, то система устойчива; если К> Ко, то система неустойчива.
Для выбранного значения К, меньшего До, отношение До/Д называется запасом устойчивости по усилению1.
Читатель может убедиться, что для z<0 система неустойчива при любом Д.
3>fM- Pd+rp) <?><> «><»
На рис. 26 вычерчен годограф Найквиста для случая Д — 1. Система устойчива при любом Д* *.
= ст > о. к > о).
Годограф Найквиста изображен для случая К = 1 (рис. 27). На дуге соединения изменение аргумента функции 1 + F (р) приблизительно равно одному обороту. Система неустойчива при любом значении Д, потому что
Р = 0, ArArg(l + F (р)) = •—2.
1 В инженерной практике отношение Ко/К измеряется в децибеллах; в этом случае единицей измерения берется 20 log10(K0//Q. Если До/К = 1,3, то величина его в децибеллах равна 2,Зе. Запас устойчивости позволяет предупредить потерю устойчивости при случайном изменении коэффициента усиления.
* Однако в этом случае инженеры утверждают, что реальные системы не могут быть надлежащим образом описаны такого рода уравнением. Замечено, что физически осуществимые системы такого рода становятся неустойчивыми при увеличении коэффициента усиления.
194
Теперь дадим второе следствие, позволяющее применить правило к системе, передаточная функция которой не является рациональной дробью.
Следствие 2. Предположим, что F (р) — мероморфная функция в полуплоскости Re р > а при а < О,' не имеющая чисто мнимых полюсов, отличных от 0. Далее допустим, что для Re р 0 имеет место F (р) — О (1/р2) при.р —> оо. Необходимое
Рис. 26.
и достаточное условие устойчивости системы с передаточной функцией
Q (п\ — . F(p)___
W 1 + F (р)
выражается равенством
Ar[Arg(l+F(p))] = P,
где Р — число нулей функции F (р) в полуплоскости Re р >• 0, а Дг [Arg (1 + F (р))] — изменение аргумента функции 1 + + F (р), когда р пробегает контур F (или мнимую ось, если 0 не является полюсом функции F).
Действительно, если
Ar[Arg(l + F(p))] = P,
то G (р) не имеет полюса в полуплоскости Re р > 0.
Следовательно, G (р) является голоморфной в этой полуплоскости. Кроме того, G (р) — О (1/р2) при р—> оо, где Re р 0. Поэтому (см. гл. 4, теорему 11) G (р) является преобразованием Лапласа функции g, стремящимся к 0 в бесконечности.
Обратно, если Дг [Arg (1 + F (р))] =£ Р, то G (р) не является голоморфной в полуплоскости Re р £> 0.
13*	195
Пример.
Кё~~Тр
F^-p-^+zp + xr гДег>0иК>0.
Вычертим годограф Найквиста при К=1. Положим
е~тр
F^-p^zp+^H^TP’
где
p(p2+zp+l)'
Имеем
Fi (io) = Н (in) e~iT(a.
Годограф Найквиста Fi(p) получится из годографа Найквиста для передаточной функции Н (р) поворотом точки с параметром ш на угол —Тео (рис. 28);
здесь предполагается, что система с передаточной функцией Н (р)/[1+ Н (р)] устойчива. Так как имеем Р = 0, то условие устойчивости записывается в виде
Дг [Arg (1 +F(p))]= 0.
Очевидно, существует такое значение коэффициента усиления Кг, что при K<ZKT система устойчива, а при Кт система неустойчива. Заметим, что KT<Z KQ (при 0). В частности, существуют значения К (заключенные между и Ко) такие, что система с передаточной функцией КЯ(р)/[1 ф + 7/(р)] будет устойчивой, тогда как система с передаточной функцией
КН(р) е~Тр \+Н(Р)е~Тр
будет неустойчивой. Этот факт можно выразить другими словами: введение в передаточную функцию разомкнутой системы чистого запаздывания уменьшает устойчивость системы или делает ее неустойчивой
4.	ВЫБОР КОЭФФИЦИЕНТА УСИЛЕНИЯ
Пусть система имеет один контур управления без звена опережения. Если KF (р) является передаточной функцией разомкнутой системы, то для замкнутой системы
_ KF(p) 
~ 1+^(р) ’
Система будет наиболее совершенной, если выполняется условие s (0 = е (0 при любом е (/). Для этого необходимо, чтобы
1 Этот математический результат находит подтверждение в случае колебаний, совершаемых автомобилем, за рулем которого сидит уставший водитель.
196
\
G (p) было равно 1. Точно выполнить это условие практически невозможно, но к нему можно приблизиться, если брать К по возможности большим. На практике значение К ограничено условиями устойчивости, согласно которым К должен быть меньше критической величины а отношение больше или равно необходимому запасу устойчивости. В этом случае говорят, что качество системы управления в целом зависит от правильности определения условий устойчивости и точности, от нахождения такого компромисса между ними, чтобы выходной сигнал s (t) был достаточно близок к входному р (t).
Можно использовать различные критерии точности. Среди них критерий такого вида:
j е2 (/) dt, где 8 (/) = s (/) — е (t), о
который вычисляется для входного сигнала частного вида; например, е (t) =	(0 *.
Рассмотрим реакцию системы на единичный скачок положения, скачок скорости и скачок ускорения. Положим е (i) = е (t) — —s (t), <S = Имеем
>(p) = Е (р) - S (р) = [ 1 - G (р) ] S(p) =	5	•
Пусть ео(0 =	(0, *1 (0 =	(0> «2 (0 =	W), а s«
si (ty, s2 (0 — соответствующие входные сигналы.
Положим
8; = et — s{; SSSi = Ер, £st = Sf;' S’e, = St (i = 0, 1, 2).
Имеем
£0(p) = -y;	=
-откуда
= 1 +KF(p) • ~p ’
~ 1 4- KF (p)  T5" ’
= 1 -f-KF(p) ' p5" ‘
* Критерий точности, полученный таким образом, достаточно условен. Его преимущество состоит в простоте математических расчетов. Однако на практике предпочтительно использовать входной сигнал е (Q по возможности такого вида, с которым системе предстоит работать.
197
Если е,- (/) имеет предел при t —♦ +оо, то по теореме о начальных и конечных значениях имеем
lim 8г (t) = lim р&t (р).
^->4-00	р->0
Следовательно, чтобы 80 стремилось к 0 при t—> 4-оо, необходимо, чтобы выполнялось соотношение
l+KF(p) =0’
откуда следует, что F (р) имеет полюс в 0.
Аналогично, чтобы e1(Z) стремилось к 0 при t—♦ 4*оо, необходимо, чтобы выполнялось соотношение
lim .	----- = О,
р->о 1 + FF (р) р
откуда следует, что 0 является полюсом второго порядка функции F (р). Для того чтобы е2 (f) стремилось к 0 при t—♦ -j-oo, необходимо, чтобы 0 являлся полюсом третьего порядка функции F (р).
Обратно, предположим последовательно, что F не имеет полюса в точке 0; далее, что имеет в ней полюсы порядков 1,2.......и
исследуем пределы при t—> -f-оо для <S й (/), 8i (/), е2 (/).
Ограничимся случаем, когда F является рациональной дробью и система устойчива. В этом случаев,- (р) тоже является рациональной дробью, все полосы которой, отличные от 0, имеют строго отрицательные действительные части, и справедливо равенство lim (/) = lim р<8z (р).
р->0
A)	F не имеет полюса в точке 0 (в передаточной функции разомкнутой системы отсутствует интегрирующий член). Тогда имеем
lim Вд (0 = j-py, lim 8Х (t) = lim e2 (t) = оо.
Из первого соотношения следует, что существует позиционная ошибка, равная 1/(1 + А) (рис. 29).
Б) F имеет простой полюс в точке 0 (передаточная функция разомкнутой системы содержит один интегрирующий член). Тогда имеем
lim 8О'(/) = 0;
lim za_JL.
<->+«. е1 V) — к. ’
11m 82 (/) = оо.
198
В данном случае позиционная ошибка отсутствует. Из второго соотношения следует, что существует скоростная ошибка, равная Ж (рис. 30).
В)	F имеет в точке 0 полюс второго порядка (передаточная функция разомкнутой системы содержит два интегрирующих члена).' Тогда имеем
lim ео(О= 1*т e1(Z) = O;
/->-|-оо	/~>4" со
lim е2 (t) = 4г.
/->4-00
Г) F имеет в точке 0 полюс третьего или более высоких порядков. Тогда
lim 8о(О= lim 8!^)= lim е2(^) = 0;
/->4-со	/->+оо	/->4-00
этот случай редко встречается в практике.
’ В случае, когда существует по крайней мере один интегрирующий член в передаточной функции разомкнутой системы, в качестве критерия устойчивости можно использовать величину
4-со
J e?0(t)dt. О
Имеем
(^•)(“)=^») = йточ=)’
откуда по теореме Планшереля получим
j 8о (0 dt — — j + KF |2 . О	—оо
Замечание. В случае, когда звено обратной связи имеет передаточную функцию Н (р), результаты, относящиеся к реакции на скачок положения, скорости и ускорения, остаются неизменными при условии, что Н (0) =1, как это имеет
199
—|~со
место на практике. Приведенное выше выражение для J Eq (0 dt принимает о
более сложную форму, в чем читатель может убедиться, применяя теорему План-шер ел я.
5.	КОРРЕКЦИЯ И ОПЕРЕЖЕНИЕ
Если звено управления задано, то выбор корректирующего звена, звена обратной связи и звена опережения, которые вместе образуют систему' управления, является достаточно сложной задачей, в решении которой опыт инженера имеет большое значение. Ограничимся рассмотрением нескольких передаточных функций, обычно применяемых для этих звеньев, и показом их влияния на качество системы.
Обозначим через KF (р) передаточную функцию системы управления. Корректирующее звено в простейшем случае является, очевидно, звеном умножения на постоянную Тогда коэффициент усиления разомкнутой системы равен Для обеспечения устойчивости следует выбрать, достаточно малые величины что связано с получением необходимой точности.
В частности, если система не имеет
	= в прямой цепи интегрирующего звена,
то в ней постоянно будет иметь место позиционная ошибка.
Коррекция путем управления
= У по производной
'	1	Введем корректирующее звено с
ц	передаточной функцией
I	Fi (р) = 1 + гр.
На рис. 31 изображен годограф.
'	Найквиста для такого звена. Видно,
Рис. 31.	что при © > О имеет место
Arg Ft (f©) = Arctg т©.
Следовательно, годограф Найквиста функции F± получается из годографа функции F вращением точки с параметром © > О в положительном направлении на угол Arctg т©. Это преобразование обеспечивает устойчивость системы (пример показан на рис. 32).
На практике часто указанную передаточную функцию заменяют передаточной функцией вида
Л(Р) =
1 ~4~ Т1Р
1 + т2р ’
где Tj 200
Т2.
Годограф Найквиста для этого случая показан на рис. 33. Этот тип корректирующего звена без введения интегрирующего члена используется в случае, когда система имеет единственное управление.
Коррекция чисто интегральным управлением
Введем корректирующее звено с передаточной функцией
Л(Р) = 1+^.
Годограф Найквиста для такого звена показан на рис. 34. На рис. 35 для сравнения показаны годографы Найквиста функций F и F±F. Заметим, что коррекция чисто интегральным управ
о=0
Рис, 34.
лением снова приводит к введению интегрирования (что повышает точность) и сходна с коррекцией по производной (которая исключает неустойчивость).
201
Тахометрическая обратная связь
Введем звено обратной связи с передаточной функцией
Fz (р) = 1 + тр.
Влияние его на устойчивость такое же, как в случае коррекции по производной.
Тахометрическое опережение
Введем звено опережения с передаточной функцией
F3 (р) = 1 + тр.
Такое звено не влияет на устойчивость. Оно служит для замены величины е (f) на входе на величину е* (01= е (0 + te' (0, Рас”
сматриваемую как опережение величины е (t + т) (рис. 36). Выбор т зависит от характеристик входа. Этот вопрос еще раз будет рассмотрен в гл. 9.
ГЛАВА 9
ФИЛЬТРАЦИЯ. ПРЕДСКАЗАНИЕ. ОПЕРЕЖЕНИЕ
1. СИСТЕМЫ СО СЛУЧАЙНЫМИ ВХОДНЫМИ СИГНАЛАМИ
Допустим, что входными сигналами линейной стационарной системы являются случайные стационарные процессы второго порядка и что зависимость между входным и выходным сигналами
8/ = s fl, j * et i
остается справедливой и в этом случае.
Условимся рассматривать только такие входные сигналы, при которых fit j * et определены для любых i и /; особенно это касается условий для входных сигналов е4-, если импульсные переходные функции fn будут ограниченными мерами и, в частности, интегрируемыми функциями.
В частности, пусть имеем звено с импульсной переходной функцией /С М, передаточной функцией F = g7/, реакцией на гармоническое воздействие
F (Йо) = (g-*f) (©).
Если рассматривать входной сигнал е (£) как случайную стационарную функцию второго порядка, то выходной сигнал s (/) тоже будет случайным стационарным процессом и будем иметь (см. обозначения в гл. 7):
Фе, s = фе, f*e = f *. Фе, е‘>
<Ps,s = f * f *
<&е , s ““	f е>
6)s s = | &~*f 12®г е.
Можно также рассматривать системы, в которых только отдельные входные сигналы являются случайными. Тогда можно разложить каждый выходной сигнал s;- на две составляющие, одна из которых соответствует реакции на неслучайный входной сигнал, а другая — на случайный. Эта последняя часть (когда предполагается, что е£ есть стационарные случайные величины второго порядка) тоже будет случайным стационарным процессом второго порядка.
203
Пример. Система, показанная на рис. 37, имеет два входных сигнала е (/) и b (0 и один выходной s (/). Сигнал е (t) называется основным входным сигналом, ему соответствует идеальный выходной сигнал (без помех). Сигнал b (t) является случайным возмущением, называемым шумом.
Примем, что входной сигнал b (t) имеет положительный носитель, и найдем преобразования Лапласа Е, В, S величин е, b, s. Обозначим через KFi и Fa передаточные функции звеньев Sx и Sa (К является коэффициентом усиления звена Si) и предположим, что они являются рациональными дробями. Тогда имеем
S (р) = F2 (р) [В (р) + KF1 (р) [£ (р) - S (р)]], откуда следует
О zns _ KFj (р) f2 (р) р_______________F2(p)	_
(р)	1 + ^1(P)B2(P) £(р) + 1+WPH2(P)	(р)’
Видно, что при b = 0 имеем В = 0 и получаем обычную формулу системы управления. Имеем две передаточные функции:
а)	передаточную функцию системы по основному входу
б)	передаточную функцию по входу шума
Gh (с}-
1+KF!(p)FAp) •
Предположим, что система будет устойчивой при b = 0. Тогда функция Кр F
—:—:—-у-,;—;— является голоморфной во всех точках полуплоскости Re	0; такой
1 + A Fl? 2
- 1 же является функция —г-•——-=—.
1 + KFiF2
Кроме того, предположим, что система Sa устойчива, тогда и Fa голоморфна в каждой точке полуплоскости Rep 0.
р
Тогда функция —2 - •— голоморфна для Rep > 0.
1 + дг 1Г 2
Так как
Пт ______________= 0
Р->оо l+KF1(p)F2(p) U>
то система будет устойчивой при 6== 0. Вследствие этого она устойчива при двух входных сигналах е и 6.
Заметим, что этот вывод не был бы справедлив, если бы звено Sa было только квазиустойчиво, в частности, если бы Sa обладало интегрирующими свойствами. 204
Примем теперь в качестве входа b центрированный случайный стационарный процесс второго порядка, спектральное распределение мощности которого
обозначим через &ь,Ь- Будем иметь
«(0 = 51 (0 + М0,
где Sj/O — реакция системы на входной сигнал е при b = 0 и s2 (t) — реакция системы на входной сигнал b при е == 0.
При этом имеем
_ о гтто е _ KFi (?) F2 (Р) р
Slt где S^p) 1+Kfl(p)f2(p) EW-
Величина s2 является центрированным случайным стационарным процессом второго порядка, имеющим спектральное распределение мощности
~	_ I Г2 (*<*>) I2 ~
“S2,S2 ~ | 1 +КЛ(1®)^2(1<о) | ь-
Чтобы система была наименее «чувствительной к шуму», необходимо, чтобы величина
= fl_____№_________|2.«
s* J I 1+КЛ(йоН2(йо) |	6,6
тоже была возможно меньшей. Все это приводит к необходимости максимального увеличения К. Вообще, его величина определяется с учетом обеспечения не только устойчивости системы, но и определенного запаса устойчивости.
2. ФИЛЬТРАЦИЯ И ПРЕДСКАЗАНИЕ. УРАВНЕНИЕ ВИНЕРА—ХОПФА
Проблема фильтрации заключается в нахождении линейного стационарного звена, обладающего следующими свойствами:
входной сигнал должен являться суммой е = i + b двух центрированных случайных процессов, где пара является стационарным процессом второго порядка;
выходной сигнал s должен быть по возможности близок к i.
Точнее говоря, стремятся минимизировать мощность | о>е е ошибки в = s — i. Величину b будем называть шумом.
Проблема предсказания заключается в отыскании линейного стационарного звена, обладающего следующими свойствами: входной сигнал е есть центрированный стационарный случайный процесс второго порядка; выходной сигнал s должен быть такой, чтобы функция s (/) была по возможности близка к е (t + Т). Точнее говоря, стремятся минимизировать мощность ошибки в (/) = s (/) — е (t + Т) при в = s — (е * б_г).
Можно сочетать две задачи при рассмотрении, например, проблемы фильтрации и с учетом в (/) = s (/) — i (t + Т). При этом
205
получаем задачу фильтрации с предсказанием. Впрочем, эти две проблемы можно рассматривать как два частных случая следующей задачи.
Пусть дан центрированный стационарный процесс второго [х Г /) "1
Найти линейное стационарное звено, для которого величина J	будет минимальна, принимая х
в качестве входного, а у — выходного сигналов.
Для задачи чистой фильтрации имеем х = i + b, z = i\ для задачи чистого предсказания х = е, z = е * б_7; для задачи фильтрации с предсказанием х — i + b, z = i* S_T.
Попробуем найти решение этой главной задачи. Обозначим через Н гильбертово пространство случайных переменных g таких, что	<4 4-00.
Рассмотрим линейное стационарное звено с импульсной переходной функцией р Е М (с положительным носителем). Имеем
+ со
уЦ) = J Х(/-0)./.
о
Обозначим через 3Jlt замкнутое подпространство пространства Н, порожденное элементами х (т) при т <
Тогда имеем
Действительно, для всех a Е 901/* имеем {а, х (т) ) = О (V т /)> откуда
+ со
<a,y(tY)=\ {a, x(t — 0))-fA=O. О
Также имеем
f «,_г. y_z = Е (| у - г |2) = \\у (t) - г (01|^ (V О-
Для того чтобы величина j была минимальной, необходимо и достаточно, чтобы у (/) была проекцией элемента z (t) на (рис. 38). Заметим, что ||г/(/)—z (0||н не зависит от t-, если это условие выполнено для одного значения t, то оно выполнено при всех t.
Можно ввести унитарное представление 0 —> i/0, связанное с процессом	тогда
,х(/ —0) = t/ex(O;
z/(Z-0) = i7ey(O;
z(t-Q) = U6Z(t).
206
Запишем условие
z (/) — у (/) ± 3R, при t = 0.
Имеем
z (0) — z/(0)	(9)	(ve<0),
т. е.
<х(0), ?(0)) = <х(0), у(0)>	(V0<0),
или
<(Л_е х (0), z (0)) =	(0), у (0)) (V 6 > 0),
или
<C7ex(0), z(O)> = <t/ex(O),z/(O)>	(V6^O),
или, наконец,
Фх.х(0) = Фх,у(0), (V0>0).
где Фх, z — взаимная ‘корреляционная функция величин х и z, а у — взаимная корреляционная функция величин % и у.
Имеем также
Фх, у = Фх, х * Р,
y(t)
Рис. 38.
где х — автокорреляционная функция величины х.
Тогда получим следующую зависимость:
Фх, г W = J Фх, х(0 — 0 ’Р' (V 0 0).
или, изменяя обозначения,
фх, Z (0 — J Фх, х О'	0) • Нв >	V О’
Это уравнение известно под названием уравнения Винера— Хопфа. Оно определяет необходимое и достаточное условие, при котором р, будет импульсной переходной функцией для линейного стационарного звена, оптимального в указанном выше смысле.
3. РЕШЕНИЕ УРАВНЕНИЯ ВИНЕРА—ХОПФА
Случай, когда спектральная плотность является рациональной дробью
На комплексной плоскости назовем верхней (соответственно нижней) полуплоскостью множество комплексных чисел с положительной или равной нулю мнимой частью (соответственно с отрицательной или равной нулю), а открытой верхней полуплоско-
207
стью (соответственно открытой нижней) — множество комплексных чисел с положительной мнимой частью (соответственно отрицательной).
Пусть fx Е УИ имеет положительный носитель. Тогда имеем (®)==(ад (г®)..
Так как (S» (р) голоморфна в полуплоскости Re р > 0, то является сужением на действительной оси функции, непрерывной в нижней полуплоскости и голоморфной в нижней открытой полуплоскости. Иначе говоря, может быть аналитически продолжена в нижнюю полуплоскость.
Кроме того, заметим, что (р) ограничена при Re р > О, поэтому рассматриваемое продолжение^*^ в нижнюю полуплоскость является ограниченной функцией.
При замене^ на аналогичный результат получается для функций с отрицательным носителем. Приведенная ниже таблица иллюстрирует полученные результаты.
не м	аналитическое продолжение	ST* JLI аналитическое продолжение
С положительным носителем С отрицательным носителем	В верхней полуплоскости В нижней полуплоскости	В нижней полуплоскости В верхней полуплоскости
Обратно, имеет место следующее предложение.
 Предложение 1. Пусть F— непрерывная функция, принадлежащая L* и аналитически продолжимая в нижнюю полуплоскость в виде медленно возрастающей функции, т. е. удовлетворяющей условию вида
F(p) = O(pA:) ПРИ
Тогда SFF имеет положительный носитель. (
Доказательство. Положим F (<о) = Fr (fco) для (о С R. Тогда F± аналитически продолжается в полуплоскость Re р 25 0 и в этой полуплоскости имеем f х (р) =0 (pfe). Поэтому F± — где Т — обобщенная функция с положительным носителем. Кроме того, Т = Dk^g, где <£g имеет отрицательную или равную нулю абсциссу абсолютной сходимости.
Для Bcexjg\> 0 имеем
[^(е^Т)] (®) = Л (£ + «»).
При £ —> О функция ® —» Fr (g + г®) стремится в 5' к функции ® —> (гю), т. е. к F. Следовательно, обобщенная функция 208
t	1	1
e -T стремится к &~F, откуда следует T = -у- ^F. Итак, &~F имеет положительный носитель. Заметим, что в конечном итоге Т Е L2.
Составим аналогичную таблицу для полученных результатов, заменив FT на или нижнюю полуплоскость на верхнюю полуплоскость.
F£L2 аналитически продолжается в медленно возрастающую функцию	PF	-
В верхней полуплоскости В нижней полуплоскости	С отрицательным носителем С положительным носителем	С положительным носителем С отрицательным носителем
Представим теперь один из способов решения уравнения Винера—Хопфа. Рассмотрим уравнение
(a)'	q>x.z(0 —(фх.х*1*) (0 = 0 при ^>0.
Положим
(₽)	Фх,г(Ц-(фх,х*р)(0 = Л(0	(У*€Я).
Функция h имеет отрицательный носитель. Запишем
Фх, 2	^^Х, Z1
фх, X	X’
Предположим, что ыхх и имеют плотности Фхх и Фх г относительно меры Лебега, при этом Фх>х — рациональная дробь, а Фх,з — рациональная дробь, умноженная на функцию вида е1(дТ. Эти условия выполняются в случае общей задачи фильтрации с предсказанием, если (os>s, <oSiZ, имеют плотности; которые являются рациональными дробями.
_ Будем иметь
Фх, 2	^X, 2>
Фх, X “ ^Фх. X*
' Так как ФХг2 и Фх>х бесконечно дифференцируемы и их производные интегрируемы, то фх>2 и фхх быстро убывают. В частности, и фх>х интегрируемы. Это справедливо и для фХ( х* jjl, а следовательно, и для h.
Применим к обеим частям формулы (Р). Полагая = М и = Я, получим
(?)	Фх, г (®) — Фх. х (®) М (ю) = Н (и),
14 Р. Паллю де Ла Барьер	209
где М (©) аналитически продолжается в нижнюю полуплоскость, а Н (со) — в верхнюю полуплоскость.
Положим
Фх х = Ф+Ф_,
где Ф+ и Ф_ — рациональные дроби, обладающие следующими свойствами:
’ Ф+ не имеет ни полюсов, ни нулей в открытой верхней полуплоскости;
Ф_ не имеет ни полюсов, ни нулей в открытой нижней полуплоскости;
ф_ (ф) = Ф+ (ф).
Такое разделение всегда возможно, так как Фх х (о) О для со £ 7? вследствие того, что вещественные нули функции Фхх имеют четные порядки кратности.
Соотношение (у) может быть записано в виде Фх, г (<*>) — Ф+ (®) Ф- (<>) М (о) = Н (о) или
(6)	^,2/? —ф (ft>)M(fi>)=	.
47	Ф+ (ш)	- 4 7	4 1 Ф+ (<»)
Напомним, что имеет место (см. гл. 7, параграф 2, примечание) Фх, г ~ ^х|г Фх, х, где + со	' .
J |^|г(Ю)|2.Ф,. Д<о)^< + оо, —со
т. е.
г I Фж, г(о) I2 j Фх, X (w)
da) << + оо,
или имеем	f 1 фх,г(<а) |2 J	! J Ф+ (©) Ф_ (©) 	00
так как	|Ф+ (®) | = | Ф_ (®) | При (об R.
Наконец,	®x, z z- г 2 ф+ ь *
210
Кроме того, имеем
J Ф+ (о) Ф_ (о) dea = j | Ф_ (<о) |2 d<a, —оо	—оо
откуда Ф_ £ L2 и (Л4 — ограничена) Л4Ф_ С L2; следовательно,
— GL2 ф+ •
Применим к обеим частям уравнения (6) преобразование полученное из & умножением на	и^-1. Функция Я/Ф+
аналитически продолжается в верхнюю полуплоскость. В этой полуплоскости Н ограничена, поэтому существует такое k, что
Следовательно, \ф~) имеет отрицательный носитель. Поэтому
= 0.
Аналогично (Ф_Л4) имеет положительный носитель, поэтому (ф_М) = ФМ.
Полагая
получаем следующее соотношение:
'Г(й)) — Ф_ (©) Л1 (©) = О, которое определяет М (со).
Наоборот, предположим, что pt — ограниченная мера, такая, что
^(о) — Ф_ (<о) Л1 (®) = 0.
Положим
®Х, 2 _ Пр __ Н
Ф+	Ф+ ‘
Левая часть является преобразованием при ЯГ 1 = функции (1—) с отрицательным носителем.
Так как ST быстро убывает, а значит интегрируема, то -^2 — 4е становится ограниченной функцией в замкнутой верх-14*	211
ней полуплоскости и	голоморфной функцией	в открытой верхней	|
полуплоскости. Следовательно, Н голоморфна и ограничена в верх- ' i ней полуплоскости.	Тогда	?
®x,z— ФХ,ХМ=:Н	'•
И
Фх, 2 — Фх, X * М' =
где h = &~H имеет положительный носитель. Следовательно, мера jut является решением уравнения Винера—
Хопфа.
Пример. Пусть t ->	—центрированный стационарный процесс вто-
рого порядка. Найти линейное стационарное звено с входным сигналом i (i) +
+ b (t) и выходным сигналом s (Q, которое реализует минимум величины I сое 8 при е (0 = s (t) — i (t + Т).
Спектральные плотности имеют вид

Фл ь = Ф*. i = 0.
Пусть
х = i + &; у = s; z = i * д_т.
Имеем
фх, X = Фг, i + Ф&, Ъ (так как Ф/, ь = Фь, I = 0), откуда
zn	(2со2—1-1)2
х ('®) ~ (®2 + 1) (<о4 + о2 + 1) '
Кроме того, ptT<0 фх, г (®) = г * б_т («>) = Ф/, i (®) (^Ъ) (®) = ijqrj •
Далее
х(«) =-----:----,
(ш + i) (ш — i) (со + а) (<о + а) (ш + ₽) (<о + ₽)
где
_ 1 + i УЗ .
2	’	J
а -l+f/3 |₽=-------2-----\
212
т. е.
фх, X (<°) — ф+ (w) ф- (<о)» где
_ (w /2 + t)2 + W - (со + i) (со + а) (со + ₽)
И
А ' (со /Г— О2 ф_ (со) =--------—---.
(со — i) («► + <*) (<о-(-0)
Вычисляем:
Фл, г (®) _ elTa (со + t)(co + а) (и + Р) _ ®+ (w)	(со2 + 1) (со /2 + с)2
= eiTa> (со2 +t® /3~— 1)' = е{та Г А	В	С '
(со — i) (® ]/2 -|- i)2	[®—(®y"2+i)a	®/2 4-i.
где
л_ 2 + /3 2/24-3 
(величины В и С не используются).
Теперь вычислим
Функция elT<i> ограничена в верхней полуплоскости. Вследствие этого функции
eiT<d	eiT<i)
(ш J^2 + t)2 co j/"2 + i
будут ограничены и голоморфны в верхней полуплоскости. Поэтому их преобразования Фурье имеют отрицательные носители. Оператор	преобра-
зует их в нуль.
Найдем теперь преобразование Фурье функции
Имеем
—(lw)> гДе (Р) — —тт, ш —г ко 4- 1	4 7	Р +1
т. е. G (р) — S? (QJ е^), откуда следует, что
(т7=т)](0=2^(0е-/,
поэтому
(^0) (/) = 2tW U + Т) e~-{t+T)
213

откуда
<4 (О [(^ 0) (01 = 2ine~Tey (t) е~‘
И
(sr^grej (<0) = ie-r [s,	(0 e-i)j (Ze>) =
'— Ю	:---------г .
1(0 + 1	(0 — I
Получаем
T («,) = [(<F-i W (^2.) j (w) =	,
ик далее
м w_	_ л,-т	- 1 .
ф-(ю)	((о]Л2— i)2
Передаточная функция искомого звена, следовательно, имеет вид
F(p) = M (Р) = Ае~т р2 ^3+1 .
\ 1 /	(р /2 + 1)2
Импульсная переходная функция будет иметь вид
р, = аб
В заключение отметим, что при некоторых дополнительных условиях метод решения уравнения Винера—Хопфа можно применять в случаях, когда спектральные плотности не являются рациональными дробями.
4. ОПЕРЕЖЕНИЕ
В этом параграфе возратимся к проблеме выбора г в опережающем звене с передаточной функцией 1 + хр (см. гл. 8, параграф 5). Пусть G — передаточная функция системы, к которой добавлено звено с опережением. После этого вся система в целом имеет передаточную функцию (1 + хр) G (р).
Если на вход подать .центрированный случайный процесс второго порядка e(t), ошибка s = s — е имеет спектральное распределение мощности
©8, е = I 1 — (1 + G (Г®) р ©е, е , то можно выбрать т таким образом, чтобы минимизировать величину
J ®е, е = J | 1 — (1 + G (Г©) |2 е.
Правая часть является полиномом второй степени относительно х, поэтому можно легко вычислить оптимальную величину т.
214
ГЛАВА 10
ДИСКРЕТНЫЕ СИСТЕМЫ
1. ОПРЕДЕЛЕНИЯ И ОБОЗНАЧЕНИЯ
Назовем двусторонней последовательностью всякое отображение а (п -> а (п)), определенное naZ*. В этой главе мы будем называть последовательностью всякую комплексную двустороннюю последовательность. Положим,
4-СО _
{a, b) = S а(п)Ь(п)
п=—оо
при условии, что ряд в правой части абсолютно сходится.
Через I1 обозначим пространство суммируемых последовательностей. Если ввести норму
—J—оо
а-»IIа 11= S |а(«)1,
П=—ОО
то I1 становится пространством Банаха.
Через Z2 обозначим пространство последовательностей, суммируемых с квадратом. Если ввести норму
/ 4"°°	\ х/а
а—♦ ||а|| = I S |а(»)12 I
\/2=—со	/
и скалярное произведение
____
a,	b—>(a, b) — a(ri)b(ri), п=—со
то Z2 становится гильбертовым пространством, ортонормальным базисом которого является последовательность такая, что
6.	(п) = 0 при =£ г и 6, (Z) = 1.
Напомним, что Z1 cz Z2. Действительно, если а Е Z1, то а (п) —♦ —> 0 при п —>оо и, следовательно, последовательность а является ограниченной.
* В этой и следующей главах мы обозначаем через а (п) (а не через ап) член последовательности а с номером п £ Z. Это позволит нам унифицировать обозначения, относящиеся к преобразованию Фурье в /?, Т и Z. Читатель при желании может вернуться к обычным обозначениям. Мы поступаем аналогичным образом и в других главах данной книги. Кроме того, для облегчения чтения гл. 10 и 11 последовательности, которые там встречаются, обозначены полужирными буквами.
215
Пусть М такое, что | a (n) | М (\/ п).. Тогда
4-СО	-|-00
S | а (п) |г	|а(п).|.
п=—со	п——со
Через s обозначим пространство последовательностей «с быстрым убыванием». По определению, a£s, если для всякого k >> 0 имеем nka (/г) —> 0 при п -> ±оо. Снабдим s топологией, определенной возрастающей последовательностью норм
а—»||л||й=( S (1+п2)4а(п)|2У2(£ = 0, 1, 2,...).
Тогда s становится метризуемым локально выпуклым пространством. Можно показать, что s является полным и, следовательно, это — пространство Фреше. Указанную последовательность норм можно заменить эквивалентной последовательностью полунорм
/ 4-0°	\Ч2
а—>||а||4=	2 | nk a (n)|2)	.
\ П——со	J
Через s' обозначим пространство последовательностей «с медленным ростом». По определению, a£s', если существует k >> О такое, что а (п) = О при п —> оо.
Теорема 1. s' является сопряженным к s.
Доказательство, 1) Пусть a£s и Ь Е s' • Положим
- 4	’	+со ____
(&, а) = 2 Ь(п)а (п).
П——со
Ряд в правой части абсолютно сходится, так как
limn2& (га) а (п) = 0. п->оо
Отображение а —* (&, а) является линейной формой на $. Покажем, что она непрерывна. Предположим, что \Ь (п) М (1 + n2)k. Тогда
4-со
| <&, а) | < S М(1-j-n2)*a(n) = п=—со
= М S ‘ (1+га2)*+1|а(га)|.
П=—со 1 "Г
К правой части применим неравенство Шварца (в Z2). Тогда
(4-00	\	/ 4-°°
S a W(ft+1)|aW =
/г=—со	/	—со	/
IIа Ik (H-i)’*
216
Следовательно, отображение а —» (&, а} непрерывно относительно одной из норм, определяющих топологию пространства т. е. оно непрерывно.
2) Пусть и — непрерывная линейная форма на Заметим, что при всяком k норма а —* || а ||^ связана с гильбертовой структурой на s, определенной скалярным произведением
4-00	____
&, #—>(&, a)k = S (1+n2)^&(n)a(n).
k——co
Найдется й такое, что линейная форма и является непрерывной относительно нормы || -||^. Следовательно, существует последовательность &' такая, что
S (1+»!)1|&'(п)|1< + оо’;
—со	t	s
-4-0°	—---
и (а) = {Ь', a)k — S (1+п2Г&'(n)a(n). k=—co
Положим
&(n) = (l+rt2)fe&'(n).
Тогда
+“ _____
и (a) —	b(n)a(n).
n=—CO
Из первого соотношения следует, что Ь (п) — О ((1 + п2)*/2) Поэтому Ь Е s'. Таким образом, мы доказали, что существует взаимно однозначное соответствие между s' и сопряженным к s пространством; при этом, всякий элемент Ь Е s' по формуле
4-°° ’__
< &, а> = Z! (п) п=—со
определяет непрерывную линейную форму на 5, и, наоборот, всякую непрерывную линейную форму на s можно определить по предыдущей формуле при помощи элемента b £ s'.
Топология пространства s'
Снабдим пространство s' топологией простой сходимости на s. Через D° (Г) обозначим пространство непрерывных функций на Т, снабженное топологией равномерной сходимости, которая определяется нормой
Ф--Ч1 <pII« = sup II т Wilts £ т
217
Тогда Z)° (Г) становится пространством Банаха.
Через М (Т) обозначим пространство мер на Т, иначе говоря, сопряженное к D° (Т) пространство непрерывных линейных форм Н’ф —» j ф-f* на D° (Т). Тогда М (Т) становится пространством Банаха с нормой
I*—IIM = sup IJ
Если положительная мера, то
W=Jh.
Заметим, что всякой функции <р на Т можно сопоставить периодическую с периодом 2л функцию ф на /? по формуле
ф(0 = ф(0.
где t сравнимо с t по модулю 2л. Функция ф называется разверткой функции <р на R.
Обратно, всякой периодической функции ф с периодом 2л на R по предыдущей формуле можно сопоставить функцию ф на Т. В частности, если ф непрерывна, то же самое можно сказать о ф, и наоборот. Отображение
Ф-» J y(t)dt (ф€Р°(Т)) а
определяет независимую от а меру на Т, которую называют мерой Лебега на Т. Положим
4-л
J Ф (6) dQ = J ф(0^. т	—л
Мера Лебега на Т инвариантна относительно сдвига. Функция Ф на' Т будет измеримой относительно меры Лебега на Т тогда и только тогда, когда она является измеримой относительно меры Лебега на R. В дальнейшем мы будем говорить просто «измеримая» вместо «измеримая относительно меры Лебега».
Через L1 (Т) будем обозначать пространство измеримых функций ф на Т таких, что
-{-л;
J |ф(6)|^0= j Ф(01	<4 4-00.
т	—я
Пространство L1 (Т) есть пространство Банаха с нормой ф—*11ч>11 = JI ф(в) | de, т
если мы будем рассматривать как равные два элемента фх и ф2 такие, что фх (6) = ф2 (9) почти всюду.
218
я
J
Таким же образом через L2(T) будем обозначать пространство измеримых на Т функций, таких, что __________________________________
}|ф(0)|М0 = j |q>(012 dt <3 + 00• т	—л
Если ввести скалярное произведение
4-я _
Ф, Ф —* < ф, Ф > = j Ф (6) Ф (в) dti == J ф (f) ф (О dt, т	—л
то L2 (Т) становится гильбертовым пространством при условии, что два элемента фх и ф2 считаются равными, если <рт (0) = ф2 (6) почти всюду. Соответствующая норма определяется в виде
Z-4-л	\ 1/2
<р_.||<р|| = И । <р(0) |MeY/2 = f Iф(012 dt . \ Т	I	\ —л	/
Заметим, что L2 (T)cz L1 (Т). Действительно, 1 £ £2 (Т) и, следовательно, если фЕ L2 (Т), то <1, ф > — j ф (0) dQ. Из т
этого следует, что фЕ Z1 (Т). Чтобы функция ф на Т была k-дифференцируемой (соответственно сю-дифференцируемой), необходимо и достаточно, чтобы ф была ^-дифференцируемой (соответственно оо-дифференцируемой). Имеем (ф)' = (ф)'.
Через D (Т) обозначим пространство оо-дифференцируемых ' функций на Т. Его можно также обозначить через 5 (Т). Действительно, на JR различие между D и S обусловлено поведением на бесконечности. Такое различие не существует на Т.
Пространство D (Т) можно снабдить метризуемой локально выпуклой топологией, определяемой последовательностью полунорм
ф—>ll4)(fe)|k2(7')
или всякой эквивалентной ей последовательностью. Оказывается, что снабженное такой топологией пространство D (Г) является полным, т. е. является пространством Фреше.
Через D' (Т) обозначим пространство, сопряженное к D (Т). Элементы этого пространства называются обобщенными функциями на Т [его можно обозначить также через S' (Т)1- Снабдим его топологией простой сходимости на D (Т).
2. ПРЕОБРАЗОВАНИЕ ФУРЬЕ
Пусть 6 С Т и t такое, что t — 6; положим eiQ = elt. Поэтому О _> eiQ есть функция на Т, разверткой которой на /? является t —>
219
Определения
I.	Преобразованием Фурье заданной последовательности а € Р называется &~z а, определяемая на Т по формуле
(^za)(b) = J” а(п)е1пв.
П~—со
Из условия а Е 1\ следует, что ряд в правой части равномерно сходится. Следовательно, z а — непрерывная функция на Т, разверткой которой на R является функция
a(n)eint-п=—СО
Таким же образом полагаем
(<Г»(0) = £ а(п)е^.
П~—СО
Если это не приведет к путанице, мы будем вместо (соответственно писать ST (соответственно ^F*).
II.	Преобразованием Фурье заданной меры р Е 7И (Т) будем называть- последовательность т р, определяемую по формуле
(^т р) (n) = j ем. ре (06 Т)
Последовательность ^гр является ограниченной. Имеем |(^тр)(п)|^||р||. .
Если <р£ L1 (Т), то полагаем
,	“И?х
(^тф) (и) = ] ф (6) einQ dQ = j ф (t) eint dt. т	—л
Аналогично,
(^rp) («) = J ё1ле p6 (при P € M (T)) T
й
+я
(n) = J <p(9) e~lnede = j Ф (0e~int 4t (при <p£ L1 (T)). T	—Л
' Если это не приведет-к путанице, мы будем вместо 3^т (соответственно писать (соответственно
Напомним следующую фундаментальную теорему.
Теорема 2	(Парсеваля—Бесселя). Если ф£ L2 (Т), то
^тф € /2. Если ф, фЕ £2 (Т), то
<3 ^гФ, гф В> 2л <3 ф, ф
220
т. е.
+°° ________ г____________________
U (^'Гф)(п)(5ггф)(й) = 2л] ф(0)ф(О)Лб.
П=—CO	у
В частности,
||^rqf = 2Myh т. е.
Ч-со
S 1^-гф(п)12 = 2л1 |<р(0)|ме.
П=—ОО	у
Эти утверждения остаются в силе, если т заменить на ЯГ*т.
Теорема 3. Если at Z1, то Т'т&'га — 2ла.
Доказательство.
+<»
(Ра) (6) = S а (п) einQ = ф (6); п=—со
.	(£) = J Ф (0) e-ikf) dQ =
Т +00	г
= S Я (n)j ei ed6 = 2ла (£).
tl=— СО	у
Следствие. Если ф€ L2 (Т)	то
ДгЗг*ф = 2л ф.
Действительно, пусть а =^"*ф. Имеем также а = -^-&~*&~а, откуда ф = (поскольку является взаимнооднозначным на £2 (Т)) и 2лф = &~а = &Г3Г*^.
Предложение 1. Если f — функция, непрерывно дифференцируемая на Т, то
(£Гф') (га) = —m (^ф) (п) и
(^"V)(«) = »ra(^"*<P)(«).
Доказательство. Пусть ф и ф' — развертки на R функций ф и ф'. Тогда
(^ф') (n) = J е^ф' (0 dt = [eint^ (/)]+£ —
—я +" — in J eint<p (/) dt = —in	(ri).
—Л
221
Следствие. Если ср 6 D (Г), то ^"срЕ s и (^-<р(*>) (и) = (— irif (^ср) (п).	'
Предложение 2. Если а £ I1 и последовательность п —> па' (п) также принадлежит I1, то а дифференцируема и
(£Га)'(0)= S ша(п)-е1П0.
п=—00
Иначе говоря, преобразованием Фурье для последовательности п —> ina (п) является функция а)'.
Доказательство, Пусть
4-00
Ф =	ф(0= S a(n)eint.
П=—со
Тогда
4-со ср' (0 = Zj ina (п) eint П==—со
(из сделанных предположений следует законность почленного дифференцирования), откуда
4-00 ср' (6) = S ina (п)1пв. П =—00
Следствие. Если $, то SPa Е D (Т) и (ZPayP есть преобразование Фурье последовательности п —> (iri)ka (га).
Теорема 4. Преобразования Фурье ST z Для S в D (Т) и iT'r для D(7) в s являются непрерывными изоморфизмами, удовлетворяющими соотношениям
Доказательство, Формулы STzSFt = 2л и z = 2л вытекают из теоремы 3 и ее следствия.
Топологию для s можно определить следующими полунормами:
/ +03	\ 1/2
а-»||а||й=	S 1«*а(п)|2 .
\М— — оо	/
В D (Т) мы используем полунормы
<₽- II <р Ik = [ J 1ф(*> (») I2 de]1/2 = || <р<*) ||м (Г).
По теореме Парсеваля—Бесселя, из соотношения а =
(т. е. ф = — ^za ] следует
||a|k = /2S||<p|k.
222
Это показывает, что г и &~*т являются непрерывными изоморфизмами.
Определение. Преобразованием Фурье обобщенной функции U € D' (Т) называется последовательность 3"rU £ s', определяемая соотношением
(а)	<а, #'т-£/>=<а,^''7-а, i/>, \fa(zs-
Аналогично ^*ти определяется соотношением
<3 а, 3^rU	zO, U >>, V ® € s.
Преобразованием Фурье последовательности а 6 s' называется обобщенная функция ^za<zD'(T), определяемая по формуле
ф)	<ф, 3~za> — <3'г(р,а^>,	у<рб£)(Т).
Аналогично 3~“ а определяется соотношением
< ф, 3~‘/.а > = <3ГТ^, а >, уфб-ЩТ).
Для обоснования этих определений необходимо убедиться, что соотношение (а) справедливо при U £ М (Т), а соотношения ф) при а € I1- Пусть а 6 s и р £ TH (Т). Тогда +га _________________________________f
< а, 3~ р > — J] а (п) I einSns —
П=—СО
"+S
= J S « Ф) е‘"е - J10 — <3~*а, ц >. у. П~ — ОО
Пусть <р С D (Т) и а £ I1; тогда с__________________________/ +°°	\
<<р, 3~ а »> = J ф (0) I S а(п) е'пв dQ = у.	\ п~ оо	/
+°° с_____________
= 2] а (п) I <р (9) е-"10 t/в = <^*ф, а>.
П—--ОО
Из определения следует теорема 5.
Теорема 5. Преобразования Фурье z (соответственно для s' в D'(T) и (соответственно для Dr (Т) в sf являются непрерывными изоморфизмами, удовлетворяющими соотношениям
Z.SFт — 2^т	2jt;
z.	7*3"2. 2л.
Теорема 6. Если U £ Dr (Т), то
(^7)(n) = JeinSt70;
(га) = j e-MU°.
223
(РЙа) («) =
Доказательство. Имеем
{з-U) (п) = <б„, sru} =	и>.
Но
(^*6„)(6) = е-‘'!0, откуда
(#7/)(п) =	;
Теорема 7. Если a б s', то
5 a(n)ein*-,
п=—00 4-со S a(n)e-in\ п=—со О' (Т)	>
знак - ••----- означает, что ряд в правой части сходится в D (7) и что его сумма равна левой части1.
Доказательство. Пусть Рм— проектор, определенный в s' 3 соотношением
а(п), если М ^n^N\
О, если n~>N или п<^М.	1
Тогда ИтРм = 1 (тождественный оператор в s').
[Л1-> — со
Предельный переход осуществляется относительно пространства s', т. е. топологии простой сходимости на 5.
Действительно, для любого b £ s имеем
4-оо	N ____
{Ь, а)= S Ь (n) a (n) = lim S b (n) a (n) = .
,n= — co	4" °° n=M
l-M-y — co
= lim (&, Рма). (Лг-> + ОО \Л1-> — co
Так как — непрерывное отображение, то
а = lim &~Рма, J7V->4-°° (Л1-> — со
где	'	N '
0ГРЙа)(О)= S a(n)eine, п=М
откуда следует утверждение теоремы.
1 Следовательно, здесь не утверждается о сходимости правой части для каждого значения 0.
224
Следствие. Для всякого U £ Dr (7) имеет место соотношение
+°о
S a(n)einQ,
П=—СО
где
a (n) = W = i f е-1'"9 •U<>-Т
3. ДИФФЕРЕНЦИРОВАНИЕ СВЕРТКИ. ИНВОЛЮЦИЯ
Производной обобщенной функции U Е D' (7) (обозначают ее через DU или 67') называется обобщенная функция, определяемая по одной из следующих формул:.
(<р, DU) = — <<?', U),
J tf-DU = —
Легко проверить, что это определение является обобщением определения производных функций, дифференцируемых в обычном смысле, и что производная обобщенной функции есть непрерывное отображение.
Произведение tyU обобщенной функции U £ D' (7) и функции
6 D (7) определяется по одной из следующих формул:
<Ф, гр[/> = <грф, U),
J ф-ф(7 = Jфф-67.
Тогда D (7) можно рассматривать как множество мультипликаторов на D' (7).
Теорема 8. Справедлива формула
(3~TDU) (n) = — in (3~TU) (n), v U е D' (7).
Доказательство. Действительно,
(P~DU) (га) = J ем  (DU)e = — j D (ем) • Ue =
= — inje‘n9-U = — in(3rU)(n).
Следствие. Если а, s', где а (п) = —inb (п), то
ST za = D&~ zb.
Теорема 9. Для всякой обобщенной функции U 6 D' (Т) существуют функции <р и целое k >> 0 такие, что U = (1 — Z)2)^qp.
Доказательство. Пусть U = &~а, где а £ s'. Существует целое положительное k и & £ I1 такие, что а (п) — (1 + п2)*& (п). Полагая ср = ^&, находим
(/ = (1—D2)2/.
15 р. Паллю де Ла Барьер
225
Так как ф — функция непрерывная, то отсюда следует доказательство теоремы.
Если заданы две обобщенные функции U и V из D' (7), то для всякой бесконечно дифференцируемой на Т2 функции ф можно определить прямое произведение UV по формуле
J* <р (01, 02). UW> = [ J <р (0Ь 62) Ue>] V6* =
= [J<P(01, 62)^]v0-.
Справедливость последнего равенства, как и для обобщенных функций на R, доказывается при помощи теоремы Фубини и теоремы о структуре обобщенных функций на Т (см. теорему 9).
Тогда свертку U * V для U, V £ Dr (7) можно определить по формуле
(0)-(С7	= J ф(0! + 62)-W*.
Таким образом, Т имеет то преимущество, что на нем свертка двух обобщенных функций всегда определена. Это объясняется тем, что, поскольку Т компактно, условия на носители или на поведение на бесконечности, введенные на 7?, не имеют смысла в случае Т.
Если ф С D (Т) и U С D' (7), то f * U является функцией, определяемой формулой
(ф*£/) (0) = Jq>(6 —
Во многих случаях, например, когда ф, ф € L2 (7) или Ф С L1 (Т) и ф £ D° (7), свертка двух функций ф и ф определяется по формуле
(а)	(ф* гр)(0)= Jq>(0 —т)ф(т)с?т;.
т
Пусть Ф * ф = %. Обозначим через ф, ф, % развертки функций ф, ф, % на 7?. Имеем
-j-* л
Х(0 — j <р(^ — u)-ip(u)du. — Л
Для всякой ф g D (Т) через ф обозначим функцию, определяемую равенством
ф(0) = ф(—0).
Для всякой U С D' (Т) через U обозначим обобщенную функцию, определяемую равенством
<Ф, Й) = <ф, U), уф€^(Л
226
или
f <p-f/ = j ф-t/.
Теорема 10. Если U, V £ D' (T), to
(0	TT(U, V) = ^tU-^tV;
(и)	^т(Р)=^7(йу,
такие же формулы справедливы при замене на Доказательство.
(г) Пусть W = U * V. Тогда
(n)	— J е1л9№9 = j eln	—
= j eln^ -U9>-§ ein^ . Vй* = (FU) (n) (^V) (n).
(it) Это утверждение проверяется непосредственно.
Из данной теоремы следует, что D' (Т) является алгеброй свертки. Для алгебры свертки D' (Т) в качестве единичного элемента служит мера Дирака 6 в точке 0 пространства 7.
Перейдем теперь к исследованию операций над последовательностями. Умножение последовательностей есть элементарная операция, которая встречалась выше. Заметим только, что s' и$ суть алгебры с умножением. Если a£s и b G s', то ab Е <$• Обратно, можно показать, что если b — последовательность такая, что аЬ £ s для всякого а С s, то Ь С s'. Таким образом, s' есть алгебра мультипликаторов на s.
Для всякой последовательности а мы определяем последовательность а по формуле а (п} = а (—п).
Перейдем теперь к свертке в пространстве последовательностей. Поступая так, как в случае пространства 7?, мы обозначим через d пространство последовательностей с конечными носителями1, а через dr — пространство произвольных последовательностей. Если a g d и а £ d', то полагаем 4-00	_
(а, а) = S а(п)а(п). п= — оо
Если даны две последовательности a, b £ (d')> то свертку с = а * Ъ можно определить по формуле
S а(п)с(п)= S «(р + q)a(p)b{q)
П~ — со	р , д= — оо
1 Носителем последовательности а называется множество п таких, что a (и) =j= 0.
2 2
при условии, что правая часть определена для любых а Е d. Для этого необходимо и достаточно, чтобы оно имело место для
а = дп при любом п. Тогда
е(п) = S а (?)&(?) = 2 а(р)Ь(п — р). р+Ч=п	р= —со
Приведем несколько примеров, в которых определена а * Ь:
1)	аб s, &€ s';
2)	a, b&lz;
3)	aEl1, Ь ограничено;
4)	а и Ъ имеют положительные носители;
5)	а или Ь имеют конечные носители.
Рассмотрим S как пространство свертывателей на s'. Заметим, что s' также является пространством свертывателей на s. Действительно, справедлива формула
(а* Ь, с) = (Ъ, а* с) д.ля а£ s, &G s', s.
Кроме того,
а * (& * с) = (а * &) * с,
если а, Ь, с имеют положительные носители или же если a, b 6 s и с € s'.
Пространство s является алгеброй свертки.
Теорема 11. Если aG s и &С s', то
(О fz(O'*Ь)=^z• zb',
(И) &~za = za.
Доказательство.
(i)	Пусть c = a * b. Тогда
4-00	4-co
(^c)(0)= E c(ti)einQ = S ( S а(р)&(ф£пв = n= —oo	n = — 00 \p-\-q=n	/
4-co	4-°o	-	4-00
= S а(рЩ^М> = S a(p)e‘p°- S b(q)ei<fi = pt q= — co	p—— co	q= — co
= (^a)(0).(^)(O).
(fi) Это утверждение проверяется непосредственно.
Замечание. Эту теорему можно доказать при других условиях на а и 6, например, если а, Ь £ I2 или а £ I1 и b ограничено.
В заключение этого параграфа приведем некоторые свойства алгебры свертки d\. последовательностей с положительными носителями (эти последовательности можно отождествить с односторонними последовательностями).
228
Теорема 12, d'+ есть «кольцо' целостности», т. е. если а, b С d'+ и если а, Ь 0, то а * b =)= 0.
Доказательство. Предположим, что а и & не равны нулю. Пусть
f i такое, что	a (i)	0	па (р) = 0	для р < г,
t j такое, что	Ь (/) =f= 0	и b (q) = 0	для q<Z j.
Тогда
(а *	&) (i + j)=	£ а (Р) Ь (q) = a	(i) b (t) =h 0.
Теорема	13. Если a	(0) =£ 0,	то а допускает обратное в d'+
относительно свертки.
Доказательство. Нужно найти b Е d'+ такое, что а * Ь = 6 и
2 а (п — р) Ь (р) = 0 при п >1; а (0) b (0) = 1. р=0
Первое соотношение записывается в виде
и—О
а (0) b (п) — — S а (п ~ Р)& (Р) р=0
и позволяет найти & (п) по рекуррентной формуле.
Замечание. Часто последовательности а с положительным носителем сопоставляется формальный .степенной ряд
—|— оо
X а (я) Хп, п=о
который обозначается через Sa (X). Если
sb W = "s Ь (Р) ХР.
то полагаем
(X) = S)a (X); Sa (X) + S„ (X) = Sa+& (X);
+» Sa(X)Sb(X)= S a.(n)b(p)Xn+P. n, p=0
Последнее соотношение можно записать в виде
Sa (X) Sb (X) = sa*b (X).
Таким образом, изучение алгебры формальных рядов (с заранее определенными правилами х) сводится к изучению алгебры коэффициентов. Впрочем,
'1 Существует другой важный факт — замена. См. Н. Cartan. Theorie elemen-taire des fonctions analytiques d'uhe on plusieurs variables complexes (Herman editeur), Chap. I § 1.
229
слово «формальный» указывает, что важны одни лишь коэффициенты степенного ряда, исключая природу «неопределенности» X.
Если а имеет положительный и конечный носитель, то Sa (X) есть формальный полином Ч
4. СВЯЗЬ МЕЖДУ ГАРМОНИЧЕСКИМ АНАЛИЗОМ НА R
И ГАРМОНИЧЕСКИМ АНАЛИЗОМ НА Т ИЛИ Z
Разложение на /? некоторой функции на Т
Всякой функции ср на Т мы сопоставим периодическую функцию2 на R по формуле <р (^) — <р (?), где t сравнимы с t по модулю 2л.
Функция ф называется разложением функции ф на R. Имеем
|ф = j <р (если фЕ£1 2(Т)) Т . -л
и, следовательно,
|фф= j фф (если ффЕ£1(Г)). т	—П
Приведение на Т периодической функции на R
Обратно, каждой периодической функции f на R можно сопоставить функцию /т на Т, определяемую по формуле (0) = = f (/), если 0 = t. Очевидно, что
(Ф)Т=Ф;
ГМ
Обобщенная функция (/на R называется периодической с периодом т, если справедливо соотношение
U *	= (/.
Заметим, что если U или V является периодической, то U * V также является периодической при условии, что свертка определена.
Приведение на Т периодической меры на R
Всякой периодической мере ц на R можно сопоставить меру цт на Т по формуле
J ф.рТ= . J1.
Г	[—л, +л[
1 Отметим тенденцию, которая развивается в преподавании элементарной математики и которая состоит в определении до «конкретных полиномов» одной определенной переменной «абстрактных полиномов» как односторонних последовательностей, равных нулю, начиная с некоторого места, и множество которых снабжается структурой алгебры свертки.
2 Мы будем говорить «периодическая» вместо «периодическая с периодом 2л».
230
Если pz = f (t) dt и f — периодическая, то рт =	(0) d0
(приведение на Т меры с плотностью f имеет в качестве плотности приведение на Т функции /).
Заметим, что это определение нельзя применить к обобщенной функции. Существенно, что для промежутка интегрирования нужно брать полуоткрытый отрезок [—л, +л[ (или всякий другой промежуток, полученный из него сдвигом), а не замкнутый отрезок [—л, 4-л]. В этой предосторожности нет необходимости, если р имеет плотность относительно меры Лебега.
Периодизация ограниченной меры на R
+со
Обозначение. Мы обозначим через А меру 2 б*. 2л- Заме-
тим, что A£S' и А является периодической.
Пусть f Е D° (/?). Тогда
+со
(А */)(/)= S — 2л) '	k=—оо
и А * f является периодической непрерывной функцией, называемой периодизацией функции /. Если р — ограниченная мера на /?, то А * р определяется классической формулой
Jf(A*g) = Jf(6i +Шв‘-Л02-
Действительно, правая часть определена и равна
ОО	\
2 f(01+&.2n)Le* = J(A*f).fi.
k=—со	/
Мы доказали также формулу
]>.(А*И)=|(f* А).И (Ием(«), гепчю), или
(/, А * fi) = (А * f, |Л);
мера А * ц называется периодизацией меры р.
Если fi имеет плотность g (6 L1) относительно меры Лебега, то А * fi имеет плотность А * g, где
(A*£)(/)=^jg(/-u).A“, т. е.
4-00 (А*^)(0^ S g(t-k.2n). k=—co
Лемма 1. Если fi — периодическая мера на R и если D° (/?), то
[-JT, 4-л[
ч 231
Доказательство, Имеем
-^-СО	4-00
Jf ^= 2 J t'V= 2 I (f*wi»= J k=—co I £	k=2—co [—Л, 4-n[	[—Л, 4-Jl[
где .
Ik = [—л: + А2л, зт + &2л[.
Укладка на Т ограниченной меры на R
Пусть ц — ограниченная мера на /?. Ее образ на Т при ото-.	о
бражении t—> I есть мера ц на Т, определяемая по формуле
= J ф(0-р , V<p€Z>°(T)> т. е.
j Ф°р = J Ф-ц.
Отображение p — > р будем называть укладкой.
В частности, предположим, что р/ = g (0 dt, где g<z D° (7?). Тогда
|ф-р= |ф(0§-(0<# = j <p.(A*g). f<p-(4*g)T (лемма 1). [-Л, +«[
Видим, что имеет плотность (Л * g)T. Мы положим g = = (А * g)T. Тогда справедлива следующая лемма.
Лемма 2. Если jll (£ М (/?)) имеет плотность g£ D° (7?), то
имеет плотность
g-(A*g)T.
Замечания.
-I. Ниже мы покажем, что для всякой ограниченной меры имеет место р = (А * р) т.
II. Справедлива формула (g * o2rt)° с = £°-
Лемма 3. Отображение ff из D° (7?) (соответственно D (/?)) в D° (Т) (соответственно D (70) является сюръективным-, т. е. для всякой функции <р С D° (Т) (соответственно D (Т)) существует функция f Е D° (7?) (соответственно D (7?)) такая, о
ЧТО f = ф.
Доказательство. Пусть ср £ D (Г). Предположим, что ф равна ' нулю в окрестности точки 0. Определим функцию f:
f(/) = | если 2л^;
[fl 7 $ [0, 2л[.
23
Функция f — бесконечно дифференцируема и А * f = <р; отсюда (А * f)T = ф. Следовательно, множество G функций f для f£D (7?) содержит все'оо-дифференцируемые функции, равные нулю в окрестности точки 0.
Кроме того, G инвариантно относительно сдвига (так как (/ + 6а)° = f * 6а). Следовательно, G содержит все оо-дифферен-цируемые функции с носителями, отличными от Т. Так как всякая функция ф С D (Т) есть сумма двух оо-дифференцируемых функций с носителями, отличными от 71*, то ф = /, где f € D (R).
Аналогично можно доказать, что всякая функция имеет вид ф = /, где f £ D° (/?).
Следствие. Всякая непрерывная периодическая функция на R имеет вид А * f, где f € D° (/?). Всякая периодическая оо-диф-ференцируемая функция на R имеет вид А*/, где f£D(R).
Разложение на R меры или обобщенной функции на Т
Пусть U £ Df (Т).
. Разложением для U на R называется обобщенная функция U, определяемая равенством
Обобщенная функция U является периодической. Если U — мера, то мерой является и U. Это определение согласуется с определением, данным для функции. Если Un стремится к U в D' (Т), то йп стремится к U в D' (/?).
Лемма 4. Отображение U —> U является инъективным, т. е. если U = 0, то U = 0.	'
Доказательство. Если U = 0, то
vfeP(/?),
и, следовательно,
f<p£7 = 0, v<P€Z>(n
откуда U = 0.
Лемма 5. Пусть pt — периодическая мера на /?, v — мера на Т. Тогда два .соотношения juT = v и jul = v эквивалентны.
* Для доказательства можно взять 0О, 0i £ Т, 0О =j= 0i, а £ D (Т), где а (0) = 0 в окрестности 0О и а (0) = 1 в окрестности 01 и записать <р = aq> -j-+ (1 — а) <р.
233
Доказательство, а) Предположим, что рЛ = v. Пусть ft D (/?). Тогда
jf.v= p.v = p.pT= j }.и== J (Д*/).Ц = р.щ,, [—л, 4-л[	[— л, 4-я[
откуда ц = v.
б) Предположим, что ц = v. Пусть ф С D° (Т). Положим
Ф = f = (Л * fj'T, где ftD° '(/?). Тогда
(p.v=p.v = j f-v= j f-n= J (A*f).p = [—л, 4-л[
= f (A*DT-nT = fv-j*7»
T	T
откуда v = |mT.
Лемма 6. Пусть jut — ограниченная мера на R. Тогда
р = (А*|»)т.
Доказательство. Пусть ф£ D° (Т). Положим <р = f, где D° (/?). Тогда
= р-Р = |(Д* f)T-H= |(Д*/)-^ =
= j Л(Д*р) = р-(А*р)т>
откуда следует искомое соотношение.
Следствие. Имеет место соотношение Ат = 6.
Погружение. Всякой последовательности а мы сопоставим меру
4-СО а = S a (k) б*. k=—со
Справедливы следующие легко доказываемые леммы.
Лемма 7. Отображение а—+а является инъективным.
Лемма 8. Если а С s', то а Е S'. Если а С s, то а £ ОР
Лемма 9. Справедливо равенство а * b = а*Ь.
Выборка функции. Выборкой функции f на R называется последовательность f* — сужений f на Z. Таким образом, имеем
/* (n) = f (п) для п С Z.
+с°	#
Замечание. Имеем f* = f Ьп. Вместо f можно написать f*
П=—со
Теорема 14. Справедливы следующие утверждения:
(\')^й=^и	лляиеОДТ).
(II) Т (А * ц) =	для [X е Ж («).
234
(Ill)	3~p = (Гр)*
(IV)	Грг = Гр
3~ a = 3~ a
(V)	j S’ +<x>
3~a = S fl COeint
для р£Л!(/?).
для периодической p£ TH (/?).
для a E s'.
Доказательство.
(V) Нужно доказать, что если U = 3~а, то U = 3~а. Но (обозначения такие же, как в доказательстве теоремы 7):
а — lim Рма (в : проверяется непосредственно),
“	( ?/->+со
( М->—оо
откуда
N
3~а = im 3~Рма = lim J}a(n)eint.
f ->4-оо ,	TV—>—|—со П—М
( ->—оо	7И->—оо
Таким образом,
S' +от
З^а = а (п) ем.
П=—со
Напомним, что
Df (Т}
З7 а = X! a(ra)e‘"0.
П=—оо
N	N
Но S а (n) eint есть развертка для S a (ti) einQ. Переходя п=М	п=М
к пределу, получаем, что 3~а есть развертка для 3~а.
(I) Положим U = 3~*а, т. е. а = -^—3~U. Имеем U = Зг*а, откуда
= 3'3г*а = 2ла = 3~U.
Утверждение (IV) выводится из утверждения (I), если положить рт = U.
(III) Имеем
(#-р) (n) = J eine • ре = J eint У = (^р) (п) = (^р)* (п). т
(II) Имеем
p^^pf,
отсюда, на основании утверждений (IV) и (III), получаем
(Д * р) = (Гр = ((Гр)*.
235
Мы сопоставим обобщенной функции U на Т периодическую. | обобщенную функцию на R.	$
Операция обращения определена только для меры. Мы теперь t изучим периодические обобщенные функции на R.	|
Теорема 15. Всякая периодическая обобщенная функция медленного роста1 имеет в качестве преобразования Фурье' меру вида 4-00 S a(k)bk. k=—co
Доказательство. Пусть U — периодическая обобщенная функция медленного роста. Пусть t2
Тогда U * h является периодической функцией. Следовательно, существует & С s' такое, что
4-00	4
,	k=2—co
Так как (<o) = e~u2l\ to	•
4-co
S ek2!*b(k)bk. k——co	У
Следствие. Для всякой периодической обобщенной функции медленного роста V существует единственная обобщенная функция V на Т	такая,	что	V=U.	Мы	будем полагать V = Ст.	:
Действительно,	пусть	4
S	a(k)6k.	5
k=—со
"Положим	1
V =	J-	'<
т. хе. а = &~V. Имеем &~V = а = и, следовательно, V = U.
Обратно, если V = U, то мы имеем ~&"U\ это показывает, г; что V является единственной.	Л
1 Можно показать, что всякая периодическая обобщенная функция имеет медленный рост и, следовательно, из условия теоремы можно выбросить слова «медленного роста».	v
236	1
Теорема 16. Справедливо равенство
4-СО ^-д = S б„. П~— 00
Доказательство. Достаточно в формуле (II) теоремы 14 ПОЛОЖИТЬ [1=6.
Следствие. Формула суммирования Пуассона. Если f С 5, то
2л £ f(n-2n)= S (&7)(п)-П=:—ОО	П=—СО
Действительно, левая и правая части этого соотношения равны соответственно 2л; (Д, f) и
s’ 6П1	= О = 2л<Д, f>.
—со	z
* Эта теорема приобретает более удобный вид, если воспользоваться следующим определением преобразования Фурье (на R) (см. гл. 3, сводка формул): (^g)(x)= J е2я£“х-|л“.
4-СО
Тогда имеем £ГА = А, где А = • п——оо
Мы отказались от этого определения, имея в виду области приложения преобразования Фурье, в которых оно оказывается в противоречии с принятым в них определением.
ГЛАВА И
ДИСКРЕТНЫЕ СИСТЕМЫ
(Продолжение)
1. ПРЕОБРАЗОВАНИЕ ЛАПЛАСА ОДНОСТОРОННЕЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Одностороннюю последовательность a-отображения из Z+ в R или С можно рассматривать так же, как двустороннюю последовательность с положительным носителем, полагая a (k) = О при k< 0.
Определение. Преобразованием Лапласа односторонней последовательности а называется функция 2?а комплексного переменного z, которая определяется по формуле
п=0
Существует число R, называемое радиусом сходимости (положительное, равное нулю или + сю), такое, что ряд в правой части будет абсолютно сходящимся при | z\ >> R (а в некоторых случаях и при | z | = 7?) и расходящимся при | z [ < R. Круг с радиусом R называется кругом сходимости. Считается, что функция S£a определена при | z| > R (а иногда при | z| 7?).„
Преобразование Лапласа последовательности а часто называется преобразованием этой последовательности по z.
Последовательности а можно сопоставить меру
Ц-оо
—	п=0
преобразование Лапласа которой имеет вид
(Sa) (р) = S a (и) е~пР = (Sa) (ер). ~	п=0
Заметим, что функция имеет период 2ш.’
Пример. Пусть <2/* — последовательность, определяемая следующим образом:
(	(я) = 1 при 0;
\	(^) = 0 при ti<Z 0.
238
есть выборка для функции Хевисайда Имеем
со
П—О
Напомним, что
4-со .^*=1; в», . п=0
откуда
й’Г(р)=У^ = 7^.
ер— 1
п=0
Теорема 1. Преобразование Лапласа последовательностей есть линейное отображение: (i) вне большего из кругов сходимости ~Еа и SEb имеет место
(а + &)] (г) - (<?а) (?) + (<?&) (г);
(И) вне большего из кругов сходимости Sa и Sb справедлива формула
S(a*b)^Sa-Sb.
Доказательство. Доказательство утверждения . (i) очевидно. Доказательство утверждения (И) аналогично соответствующему доказательству для преобразования Лапласа на /?. Действительно, имеем
S (а * Ь) (^) = [S (а * &)] (р) = [S (а * &)] (р) -= l^qj (р) • [Sb] (р) - (Sa) И • (Sb) (ер).
Следующая теорема указывает на связь между преобразованием Лапласа и преобразованием Фурье последовательностей.
Теорема 2. Справедлива формула
(SEa) (ре‘в) = pF* ()1 (0), р 0, 6 G Т.
L I р JJ
Доказательство. Действительно, имеем
(^а) (ре‘в) = е^Пв'
Следствие. Если 2?а = SEb, то а — Ь.
239
Следующая таблица содержит преобразования Лапласа нескольких распространенных последовательностей.
а
S
6.
V
1
п
и2
sin (шо)
COS (nd))
X
1
1
zk
z z — X ___1_ z — 1
z к-ж ?(* + D (2-1)3 z sin co z2 — 2z cos co + 1 Z2 — Z COS CD z2 — 2Z COS CD + 1
Обращение преобразования Лапласа
Пусть A (z) — функция, голоморфная при | z | > R. При | z | > > R ее можно разложить в ряд Лорана:
-j-00 л(г) = уг^>.
При этом имеем А = 2?а. Таким образом, всякая функция Л, голоморфная при | z | > R, есть преобразование Лапласа последовательности а. Это замечание указывает также практический путь вычисления последовательности а. Коэффициенты а (п) можно искать по классической формуле
(a)	a(n) = ^j^A (г) г"-1 dz,
где Г — окружность радиусом р >> R, пробегаемая в положительном направлении. Формула обращения преобразования Фурье дает при р > R
= 2^ И i J А (Ре‘'9п>еМ d0’ р'*	Zwlr	ZJl
откуда
а (п) = j А (рем0) ем dQ.
240
Эту формулу можно получить из выражения (а), если положить в нем z = ре‘0. Поэтому формула обращения преобразования Фурье не вносит здесь ничего нового.
Другой метод состоит в разложении функции A (z) в линейную комбинацию табличных функций. Инженеры, которые интенсивно используют преобразование Лапласа последовательностей, в основном следуют по такому пути. Естественно, этот метод предполагает наличие весьма полных таблиц.
Применения преобразования Лапласа последовательностей
Мы ограничимся указанием применения к уравнениям в свертках и прежде всего к рекуррентным уравнениям.
Отметим, что
(а * 6i) (п) — а (п — 1)*
и вообще
- (а * 62) (я) = а (п — £).
Пример. Решить рекуррентное уравнение
а (п) — За (п — 1) + 2а (п — 2) = 1 - при п 2 с начальными условиями а (0) = 1, а (1) = 0.
Естественно положить а (п) = 0 при п <0. Тогда
1 при 2;
а (п) — За(п — 1) + 2а (п — 2) =
— 3 при п = 1;
1 при п = 0;
0 при п<0.
Это можно записать в виде
(6 — 36х + 262) * а =	— 46T.
Отсюда, полагая 2?а = Л, находим
О—1- + ^)лИ = г^т-т;
Вычислим a (tiy.
Г
где Г — окружность с радиусом, большим 1, пробегаемая в положительном направлении. Следовательно, а (п) есть вычет в точке
z = 1 функции (г_1)2 
* Оператор а * di часто называется оператором сдвига вперед и обозначается через Е: а * 61 — Еа.
16 р. Паллю де Ла Барьер	241
Положим z — 1 = и. Тогда
гп(г-2) = (1+и)” (-1+п) Ц+пи + О^)] (-!+«) _ (z—-I)2	'и2	и2
= --£г + Ц-П + О(1) прин—>0.
Следовательно, а (п) = 1 — п при п 0. Преобразование Лапласа можно применить также к решению уравнения в свертках: а * х = &, где а, &, х имеют положительные носители. Если а и & имеют преобразования Лапласа Л и В и если В (z)IA (г) есть преобразование Лапласа последовательности с положительным носителем, то указанное уравнение имеет единственное решение х, преобразованием Лапласа которого является
у (7\_& (2)
А W “ A (z) ’
Напомним, что если а (0) =f= 0, то уравнение имеет решение при любом & и, в частности, элементарное решение х0 такое, что
- а * х0 = 6
и преобразование Лапласа которого (если оно существует) имеет вид
Хо(г)=^.
Решение уравнения а * х = & можно записать в виде х = = х0 * Ь. Если X (р) существует, то можно записать
X (Р) = Хо (р) В (р).
Теоремы о начальном и конечном значениях
Одна из двух теорем о начальном и конечном значениях в случае последовательностей оказывается тривиальной. Она формулируется следующим образом.
Теорема 3. Имеет место соотношение lim (2?d) (г) = а (0).
2 -» СО
Пусть z^R. Тогда
п=0
так что последовательность
можно рассматривать на Z+ как положительную меру с полной массой, равной 1. Следовательно, если а (п) С Ic, d], то
^(ЗД(г)€[С d].
242
Теорема 4. Если lima (п) существует, то 2?а имеет радиус п -> 4" оо
сходимости, меньший или равный 1, и справедливо соотношение lim (^а)(г) — lima(п).
[ Z > 1 2	п -> 4-00
1 Z -> 1
Доказательство. Из условий теоремы следует, что последовательность а ограничена; следовательно, ряд с общим членом a (ri)lzn абсолютно сходится при | z| > 1.
Предположим, что lim а (п) = 0. Тогда
п -> 4- °°
(а)	г-^*(^а)(г) =
N ( х	. ' +°о
= г — 1 V-(га) 4- г~ 1 У 2^
~ г гп + г	’
п=0	гг—N4-1
Пусть е > 0. Выберем N такое, что | а (п) | «С е при п N. Тогда
2—1 У <е. 2	Zn
п=ЛЧ-1
Так как
lim£riy£^) = o, P>i г ^4 ?
I 1	п== 0
I Z -> 1
то отсюда следует, что
lim z-^- (S’a) (г) — 0. {:::
Предположим теперь, что lim а (п) — %. Применим предыду-П > '[- ОО
щий результат к последовательности п —► а (га) —	преобра-
зование Лапласа которой имеет вид
т. е.
lim	(z) = К.
Гг>1 г
I г-> 1
243
2. ПОСЛЕДОВАТЕЛЬНОСТЬ ПОЛОЖИТЕЛЬНОГО ТИПА
Определение. Действительная или комплексная последовательность а (на Z) называется последовательностью положительного типа, если для любых . ., nk£ Z матрица коэффициентов а (пс—nj) является положительно полуопределенной. Полагая k = 2, пг = 0, п2 = п, мы находим из самого определения, что если а — последовательность положительного типа, то матрица
Г а (0) а (п)
_ а (—п) а (0)
является положительно полуопределенной, откуда следует а(п) = а(— п), т. е. а — а\ ‘ а (0)^0;
. | а (п) | а (0).
Теорема 5. Если ц — положительная мера на Т, то является последовательностью положительного типа.
Доказательство, Пусть	.	., nk	С Z и	.	., zk£ С,
Тогда
k	k
2 a {nt — пу)	2	Iе*	=
i, /=1	T
k
i, j=l T
Теорема 6 (Бохнера). Всякая последовательность положительного типа есть преобразование Фурье положительной меры.
Доказательство. Пусть а — последовательность положитель- ? ного типа. Тогда а является ограниченной, поэтому а 6 s'.	"
Положим
а = U = -^$-*a, где U€D'(T).
а)	Покажем, что для всякой b(z s справедливо неравенство
* Ь, а >	0. Имеем
(b*b)(n) = £ b(n — m)b(m) = . S b(m — ri)b(m). tn——CD	tn=—CD
244	|
Следовательно,
~	+СО’ .	____
< b * &, а > = Zj & (m — и) & (m) а (п) =
п, т=—оо
= S Ъ(р)Ь (т)а(т--р)
т, р=—со
(полагая т — п = р).
Но на основании определения последовательности положительного типа получаем
S b(p)b(m)a(tn — p)^>z0.
т, p=—N
Поэтому
~ +“ _
< & * Ь, а>>= S b (р) b (т) а (т — р) 0.
т, р——со
б)	Покажем, что для всякой гр £ D (Т) справедливо неравенство J гргр[/ 0. Положим & = ^гр, т. е. гр =	Тогда
4л2гргр = ^* (&*&), откуда
J гргр • U = < гргр, =	а >> ^ 0.
в)	Как и в случае теоремы Бохнера на /?, мы получаем, что j <р- U 0 при ф> 0, поэтому U является положительной мерой.
3. УНИТАРНЫЕ ПРЕДСТАВЛЕНИЯ КОЛЬЦА Z В ПРОСТРАНСТВЕ ГИЛЬБЕРТА
Унитарным представлением кольцаZ в пространстве Гильберта Н называется отображение n—* Un из Z в L (Н, Н) такое, что
Un является унитарным;
Uп+т = UnUm\ и_п=и?
Очевидно, что Un = ((7i)n. Следовательно, всякое унитарное представление кольца Z в Н имеет вид	где U — унитар-
ный оператор. Обратно, если U является'унитарным, то отображение п —» Un является унитарным представлением.
Теорема 7. Если п Un — унитарное представление в Н, то для всякого Я последовательность п —♦ <рл, х (га) = ~ << Unx,x > является последовательностью положительного типа.
245
-	-'Я
г
Доказательство. Имеем
Фх, х (ni — ni) = (U~ni~nix, х) = {Unix, Unix}.
Таким образом, числа x(nt—tij) являются элементами матрицы Грама векторов Uni х. Поскольку последняя является положительно полуопределенной, то отсюда следует доказательство теоремы.
Следствие. Можно положить
Фх. х = х, Т. е. tpXi х (ti) = J <х,
Т
где х — положительная мера на Т.
Для х, z/б Н, полагая <рх>у (n) = (Unx, у), будем иметь
Фх, у = ^х, у> т- фх, у (^) = J е ®х,у>
d
где соХ| у — мера на Т.
Отображение х, у—>6).^ является полуторалинейным.
Легко убедиться, что
Фг/, X - Фг/, X»
™у, X ®х, у
Теорема 8. Пусть п —> Un — унитарное представление в Н. Всякой а Е Z1 можно сопоставить непрерывный оператор U (а) в Н такой, что
+°°
(х, и (а) у) = S а («) (х, Uny), П=—со
V-v, У^Н.
Отображение а —> U (а) есть линейное из I1 в L (Н, Н) и удовлетворяет следующим условиям:
(I) l|f/(a)KHz>= S |а(п)|; п==—со
(И)	U(a) = u*(ay,
(III)	i/(a*₽) = t/(a)i/(p);
(IV)	U(bn) = U\
Оператор U (а) называется оператором Радона.
Доказательство. Имеем	'
S a(n)(x, Uny) 1^11 а||z.||x||\\у||.
П=—со
246
Следовательно, для всякого у £ Н отображение
+ со
х—> 2 а (п) (х, Uny)
П=-—оо
является непрерывным полулинейным на Н. Поэтому существует r/i £ Н такое, что
4-со
U а(п){х, Uny) = (х,^) ч	П=—оо
и
Следовательно, отображение у —> yt является линейным непрерывным. Можно положить уг = U (а) у, где || U (а) ||	|| а || /х»
откуда следуют существование U (а) и доказательство утверждения (I).
Докажем утверждение (II). Имеем для всех х, z/E Н:
~ +°° ~
(х, и (а) у} — S а (n) (х, Uny) = П——СО
= s а (— га) (U~nx, у) = п——оо
+ °О ___
= S а (га) (Unx, у) —
п=—00
Ч-со ___ ______
= S а (га) {у, ипх) =
П=—со
= (у, и (а)х) = (U (а)х, у) = (х, U* (а) у).
Докажем утверждение (III). Имеем для всех х, у£ Н:
4-00
(х, и (а * Р) у) = S (а * р) (га) (х, Uny) =
—со
4-00
= 2 а(п)Р(т)(х, ип+ту}. п, т
(x,t/(a)i/(P)z/)= S a(n)(x,(7«t/(₽)//) = п=—оо
= s a(n)(t/-«x,(7(p)y) =
П=—со
4-00
= S а (га) Р (гаг) (U~nx, Umy) — п, т=—оо
4-со
= S а (га) Р (гаг) (х, Un+my) —
п, пг——со
= (х, и (а * Р) у).
247
Справедливость утверждения (IV) следует из самого определения.
Теорема 9. Справедливы следующие утверждения:
• (I)	Фх, и (а) у = фх, у * а;
(П).	фу(Р)х,» = Фх,»*Р;
(III)	ц Wy = ^*a-(Ax>y,
(IV)	&и о) х, у = ^’*Р®х, у.
Доказательство. Докажем утверждение (I). Имеем
Фх, и (а У (п) = (Unx, и (а) у} =
Ч-СО
= S «(р) (Упх, иру} =
Р=—СО
Ч-СО
= X а (Р) {Un~Px, у} = р=—оэ
Ч-СО
= S «(Р)фх,р(« —р). р=—со
Докажем утверждение (II):
фу (Р) х, у = ф«/, и (0) х = (ФУ, X * Р) = фх, у * Р-
Докажем утверждения (III) и (IV). Имеем
и (а) у — 2^~	(7 (а) у ~
= 2^ ^.У^ = ®х. У^О',
G>u (Р), х = 2гГ^*Ф^' (Р) X, у =
= 2^^*Фх,Г^*Р = ®х,,-^Р.
4. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ ВТОРОГО ПОРЯДКА
В этом параграфе мы изучим случайные процессы, описываемые последовательностями п —* X (п) случайных скалярных или векторных величин.
Такой процесс называется стационарным, если для любых моментов времени п19 . . ., nk (k произвольное) и р распределение вероятностей переменных X — р), . . X (nk — р) совпадает с распределением вероятностей переменных X (nJ, . . ., X (nJ. 248
Пусть Н — пространство скалярных случайных величин Z < таких, что Е (|Z |2) < + оо и Н — гиперплоскость для Н, образованная центрированными переменными. Процесс
называется стационарным процессом второго порядка, если Х^Н
Е (X (п)) независимо от п;
vfX^-p), Х/(п2-р)=У(ХДп1),ХДп2))
(Vi, /, «1, «2, р).
Такой процесс называется центрированным, если Е (X («)) = 0.
Процесс п —> X (и) — Е (X (п)) является центрированным.
Теорема 10- Для того чтобы центрированный процесс
ГХг(п)
п —> X (п) =
LX™ (n) J
был стационарным процессом второго порядка, необходимо и достаточно, чтобы существовал унитарный оператор U в Н такой, что
Х‘(л—l) = t/X‘(n) (V0,
т. е. унитарное представление р —> Up кольца Zb Н такое, что
Х‘(х —p) = i^X‘(n).
Доказательство проводится так же, как и в случае непрерывных процессов.
Достаточность. Если U существует, то
' v (Хг («! — р), Xi (п2 — р)) =
= {X1 (ti! — р), Xi (п2 — р)} —
= JUpX1 (П1), UPXi Ы =
= (Xi(n1),XI(n2)) =
= у(Х‘(П1),Х1(П2)).
Необходимость. Возьмем в Н множество 23х, образованное элементами вида
£ = £4х‘’(/л), ih
и его замыкание Нх.
249
Рассмотрим множество Г пар ставления вида
-Л-
таких, что g и т) имеют пред-
l=TlahiXi(th)-, th
П = Е4х‘(*А-ih
Легко проверить, странства Нх х Нх и
что Г —
векторное подпространство про-
.nJ’ Ln'. (1.1') = (n, n').
откуда следует, что при всяком g С существует единственное Г|1 п € такое, что
кЛ-
тор U, определенный в Нх, такой, что 77g = i] и Х*(п — 1) = UX1 (п).
что, если
€ Г, то
G Г, Тогда существует унитарный опера-
Оператор U можно продолжить на все пространства Н, если положить, например, (7g = g для g £ Нх. Таким образом, мы получаем унитарный оператор в Я, который удовлетворяет условиям теоремы.
Таким же образом можно сформулировать теорему, аналогич-гхт
ную теореме 7 из гл. 7. Пусть /—> у (ri) — центрированный стационарный случайный процесс второго порядка.
Функцией взаимной корреляции называется последовательность у, определяемая по формуле
<₽x,y(p) = v(X(n —р), У(п)) =
= (X (ft — р), Y (ft)) = (UpX (п), Y (ft)).
На основании результатов параграфа 3 мы получаем
Фх, Y =	®Х, У,
где (oXi y — мера на Т.
В частности, имеем q>XtX = &~(&XtX, где (ох,х — положительная мера на Т.
Меры (&х,у и wy,x называются спектральными распределениями взаимного влияния величин X и Y, Мера называется спектральным распределением влияния величины X. Справедливо
Фг, х	Фх, у» ®у, х ®х, у.
250
Теорема 11. Пусть X (п—* X (п)) центрированный стационарный случайный процесс второго порядка. Пусть а Е Z1. Процесс Z, определенный равенством
4-СО
Z (п) = 2 а (р) X (п — p) = U (а) X (п), а также процесс
являются центрированными стационарными процессами второго порядка.
Мы полагаем Z = а * X.
Доказательство. Имеем
(7(а)Х(п)= £ а(р)U?X (п) = а(р)Х(п — р). р——со	р=—со
С другой стороны,
UZ (п) = UU (а) X (п) = U (а) UX (п) =
= U(a)X(n — l) = Z(n— 1).
Следовательно, процесс Z, так же как и процесс
ГХ(п)1 rt~4Z(n)J’
является стационарным процессом второго порядка.
Свойства свертки
Как и в случае непрерывных процессов, можно доказать справедливость соотношений:
(а * Р) * X = а * (Р * X);
(6р*Х)(п) = Х(п-р);
фа * X, Y = & * фх, Y\
фХ, 0 * У = Р * Фх, Y\
* х, у “	у\
<*>Х, 0 * У = ^~*Р‘Юх, У-
В частности,
«а * X, а* X =
5.	ДИСКРЕТНЫЕ СИСТЕМЫ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ
Линейное стационарное звено определяется соотношением между входным сигналом е и выходным сигналом s вида
s = f * е.
251
Последовательность f называется импульсной реакцией (т. е. значение выходного сигнала s при е = 6). Исходя из физических соображений, считается, что она имеет положительный носитель.
Таким же образом можно определить линейное стационарное звено при помощи: v	f
а)	реакции f * на единичную ступенчатую функцию
б)	передаточной функции F (г), т. е. преобразования Лапласа последовательности f\ она устанавливает между преобразованиями Лапласа Е (z), S (z) входного е и выходного s сигналов следующую связь:
5 (z) = F (z) Е (z)
(при условии, что е имеет положительный носитель и допускает преобразование Лапласа);
в)	гермонической реакции F последняя будет определена, если F определена при | z| > р, где р < 1, а также для систем, описываемых рекуррентными уравнениями.
Пример. Если дано
sn — 4sn_i + sn_2 = еп, то получаем
(1“V + ^)5(z)==£(z)’
откуда
где
Имеем
и
s (г) = F (г) Е (г),
1	Z2
F (г) = j 4	7 = z2 — 4z 4- 7 ’
z "I” z2
1 i	1 i
z	2	/3	2
z2 — 4z + 7 z — (2 + 1'Кз) z —(2—i/”3)
/7 / ч / 1	\	2	i / 1 I 1	\	?_____________
—2 ГзЛ-(2 + /Гз) +^2	/3/ г-(2-1-Г1)‘
Следовательно,

(2 + i / 3)" + [j +	(2 - i K's)" .
Положим 2+ »КЗ= 7e‘“. Тогда

72	+	4.	72 e~ina
[	2
= 7 cos na -I-------— sin /га
\	/ 3
252
Формулы для вычисления передаточных функций дискретных систем автоматического регулирования такие же, как и в непрерывном случае. Пуёть f имеет положительный носитель. Вообще говоря, систему регулирования с единичной обратной связью можно определить соотношением
(е — s) * / = s, т. е.
(/ + 6) * $ = г * /.
Действительно, известно (см. гл. 10, теорема 13), что если f (0) =f= —1, то / + 6 допускает обращение в d'+, например £*, и соотношение между е и s можно записать в виде
5 = g * е.
Если g имеет преобразование Лапласа G, то оно равно
и представляет собой передаточную функцию в замкнутой системе.
В случае, когда звено обратной связи имеет передаточную функцию Н (р), то таким же образом можно убедиться, что передаточная функция в замкнутой системе имеет вид
G (z) =____- —_____
U 1 + Н (z) F (z) ’
Звено или система импульсной реакции/называется устойчивым, если lim/(n) = 0; квазиустойчивым, если последователь--J- со
ность / ограничена; неустойчивым, если последовательность/ неограничена.
Предположим, что F = £f — мероморфная функция вне круга радиуса р < 1. Для того чтобы система была устойчивой, необходимо и достаточно, чтобы функция F была голоморфной при I z| > 1. .
В частности, если соотношение между е и s имеет вид aQs (и — р) + ars (п — р + 1) + • • • + aps (n) = е (п), то
S (г) = F (z) Е (г), где
«0 + ~Ь • • • “Г
Звено будет'устойчивым, если все нули знаменателя по модулю меньше 1; квазиустойчивым, если все нули знаменателя по модулю меньше или равны 1; неустойчивым во всех других случаях.
При рассмотрении дискретных управляющих систем можно использовать критерий, аналогичный критерию Найквиста.
253
I
6. ВЫБОРКА. БЛОКИРОВАНИЕ
Теорема 12. Пусть f — функция, равная нулю при t < О, непрерывная при t > 0, имеющая при t = 0 правый предел f (-f-О). Пусть F — преобразование Лапласа функции f и 10 — абсцисса интегрируемости.
I. Если F (р) = О при р —> +оо (отсюда следует f (+0) = 0), то преобразование Лапласа функции/-имеет абсциссу интегрируемости, меньшую или равную g0, и справедливо соотношение
(^/-) (р) = Е F (р + k2in), где Rep > g0. k=-—-оо
II. Если F (р) = -у- + О (у-) при р +оо, то преобразование Лапласа функции f— (р) имеет абсциссу интегрируемости, меньшую или равную g0, и справедливо соотношение
(<?/*) (р) = lim У F(p + ^2w)4-^( + 0^-.
Доказательство. I. Пусть р = | + i и,	Пусть
Ф| — функция, определяемая по формуле
Ф^(ю) = F (| + «о).
Имеем
Ф5е L1, ф. = ^* и
Е F (р -j- k2in) = Е (® + &2jt) = (Д* Ф§) (®); k=—оо	k=^—оо
^(Д*Фё) = ^Д^Ф5 = ^( £ Ак/ = \Л—— QO /
Так как А * Ф^ — ограниченная периодическая функция, то последовательность	является ограниченной для любого
| > |0. Поэтому — ограниченная мера для любого | Таким образом, преобразование Лапласа функции f* имеет абсциссу сходимости, меньшую или равную и справедливо равенство
Е F (В + г® + k2in) =	{e-t f *} (®) = (^/*) (| +1®).
&=—ОО
4~ЛТ	+°°
II. В дальнейшем вместо lim Е мы будем писать Е ' k— М	—00
254
Положим
(	при
'1 (' ~1 0	при t < 0.
Имеем
откуда
Fy (р) = (Ж (р) = F (р) -
f- = ff + f (+0) <V*;
№) (р) = S е-"р = —, 6=0	1 — е р
(<Z-fi)(p) = ^fr(p) + f^ =
= ^1(р + Ш) + ШЛ = k——co
+ со
= У, [F(p + k2ia) k=—оо
Н + о)-1 р -|- k2in J
/( + 0)
1-е-Р'
Так как У — L.- - существует, то существует и k=—оо
+ fe2in); можно еще записать:
(а) а (S7±) (р) = S F (р + k2m) + k=—оо
+ f(+0)
1-е-Р
р + k2ix
1
1
Используя классическую формулу
+ с° г.
ctsz= Е’тть-
k=2—CO
мы можем легко получить
(Р) Zj p + k2in =~2ci^~2~-k=:—ОО
255
Кроме того, имеем
(v)	-—=4“cth -г+-у •
Подставляя выражения (0) и (у) в соотношение (а), мы получим искомую формулу.
Замечание. Если период выборки есть Т, то, полагая
—J-оо fW'bnT, n=0
можно найти
k=—со
J
В частности, имеем
(£7*) (ш) =-Ь 2 ' F (ia + kT?)
т. е. формулу, которая позволяет построить годограф Найквиста для . Заметим, что отображение со -> (^/—) (гео) имеет период 2л.
Блокированием называется операция, которая всякой последовательности а ставит в соответствие функцию f, определяемую равенством
f (0 = ап при /£ ЬЛ (я + 1) 74.
Звено, осуществляющее эту операцию, называется блоком. Имеем по определению
f = а * а, где	’
+ со а= S а(л)б„г' 11=—оо
И
| 1 при t G [0, 1[;
а(0 = [ о при t <$[0, 1[.
Предположим, что а имеет положительный носитель. +°°
Пусть Л (р) = S а (п) е~ ?n— преобразование Лапласа по-п=0
следовательности а. Так как а = бЦ — 6т * то
1	р—рт	,.1  р—-рт
256
Тогда преобразованием Лапласа функции f будет н 1_____________________________р—рт
г
Выборка непрерывных случайных процессов
Пусть /—>Х(/) (/€/?)—центрированный стационарный случайный процесс второго порядка. Процесс п X (п) (п С Z) является стационарным дискретным процессом второго порядка, который мы обозначим через X*. Полагаем, что X* (n) = X (п) при пЕ Z. Имеем
<Рх*. х* (р) = v (X* (n — р); X* (р)) = <рх> х (р) и, следовательно,
фх*, X* = фх, X-
Отсюда следует, чтоюх*, х*=^х,.х и поэтому ©х*, х* = А * ©х, х-В частности, если юх,х имеет плотность Фх,х, то©х*, х* будет иметь плотность Фх*, х* = ®х,х (на Т)- Развертка на R этой спектральной плотности записывается в виде
Фх*, х* ~ А *Фх, х*
Если Фх.х непрерывна, то
+ со
Фх*, х*(®)= S Фх.х^ +
k=--—со
17 р. Паллю де Ла Барьер
ГЛАВА 12
ВЫПУКЛЫЕ МНОЖЕСТВА
1.	ОПРЕДЕЛЕНИЯ И ЭЛЕМЕНТАРНЫЕ СВОЙСТВА
Все рассматриваемые в этой главе векторные пространства — вещественные.
Определение. Пусть дано векторное пространство Е. Назовем центром тяжести элементов xlf . . xk пространства Е всякий элемент х вида
k
1=1
где
k
2 хг = I, (VO.
1=1
Будем обозначать через A.k множество элементов X =(Х1, . . k
. . ., Х&) из Rk таких, что S Xz = 1 и О (у/).
i=i
Обозначим через:
[xi, хг]	множество	элементов	вида	х =	Xixi +	Х2Х2	при	X £ Аг,
]хх, X2I	множество	элементов	вида	х—	Х1Х1 +	Х2Х2	при	X £ Аг,
Xi =# О, Х2 ¥= 0;
]хх, X2I	множество	элементов	вида	х =	Xixi +	Х2Х2	при	X £ Аг,	Хг	ф	0;
[xi, хг[	множество	элементов	вида	х =	Xixi +	Х2Х2	при	X £ Л2,	Xi	#=	0.
Первое из этих четырех множеств называется сегментом с концами хг и х2.
Подмножество А векторного пространства Е называется выпуклым, если из условия xlf х2£ А следует [хх, х2] А.
Примеры. Шары (с произвольными центрами) в нормированном векторном пространстве являются выпуклыми множествами.
Множество Ak выпукло в Rk.
Теорема 1. Пусть А —выпуклое подмножество векторного пространства Е. Каковы бы ни были xlf . . ., xkE А, всякий центр тяжести элементов xlf . . ., xk принадлежит А.
258
Доказательство. Поскольку это свойство имеет место при k = 1 и k = 2, можно применить индукцию. Предположим, что теорема верна для k — 1. Имеем:
k 	k—\	k—i
^iXi = ^iXi + ^kXk = I	Xi + ^kXkf
1=1	Z=1	1=1
k-1
где I =	.
Так как
1,
то
£-1
«=1
и так как I +	= 1, то
k
S М€А
1=1
Теорема 2. Пусть Е и F — векторные пространства и f — аффинное отображение из Е в F. Тогда:
а)	образ всякого выпуклого подмножества множества Е при отображении f есть выпуклое подмножество множества В;
б)	прообраз всякого выпуклого подможества В множества F при отображении f есть выпуклое подмножество множества Е.
Доказательство. Утверждение а) вытекает из того факта, что образ сегмента [хь х2] при преобразовании f есть сегмент Ц (*1), f (х2)].
б)	Пусть Хь Х2£ f 1 (В). Положим у У = f (Хх), у 2 = f (х2). Имеем у1У у2£ В, откуда [уь у2] с В и, кроме того, f (ki, х2]) = 1У1, у2], откуда [х1? х2] cz f’1 [уъ y^cif-^B).
Теорема 3. Пересечение любого семейства выпуклых подмножеств векторного пространства Е выпукло.
Доказательство вытекает непосредственно из определения выпуклых множеств.
Теорема 4. Произведение выпуклых подмножеств At векторных пространств Et выпукло в произведении пространств Et.
Доказательство вытекает непосредственно из определений.
Теорема 5. Пусть А и В — выпуклые подмножества векторного пространства Е и а, 0 — вещественные числа. Множество аД + РВ (образованное из элементов ах + Ру, где х(Е А и у С В) выпукло.
17*	'	259
Доказательство. Множество аЛ + РВ является образом вы-' пуклого множества А х В пространства Е2 при линейном отображении х, уах + ру.
Определение. Выпуклой оболочкой подмножества А векторного пространства Е называется пересечение Ж (А) всех выпуклых подмножеств Е, содержащих А.
Из теоремы 3 следует, что Ж (Л) выпукло. Это—«наименьшее» выпуклое множество, содержащее А.
Теорема 6. Выпуклая оболочка множества А есть множество всех центров тяжести элементов множества Л, т. е. множество всех элементов вида
*	( хел., Х^А
• *= L Mi, где { А
"1 1 1	( k — любое.
Доказательство. Пусть А' — множество всех центров тяжести элементов из Л. Непосредственно убеждаемся, что Л' выпукло. Кроме того, по теореме 1, Л' cz Ж (Л), отсюда Л' = ’ = Ж (Л).
Теорема 7 (Каратеодори). Пусть Л — подмножество n-мерного векторного пространства Е. Тогда выпуклая оболочка Ж (Л) множества Л состоит из элементов вида
«4-1
где %€Лл+11 xt^A (yi).
1=1
Доказательство. Всякий х £ ЗС (Л) имеет вид
k
X = S Mz, где £ Afe> xi € A (vO •
1=1
Покажем, что если k >> п + 1, то среди представлений такого вида'можно найти такое, в котором одно из чисел = 0.
В самом деле, если k > п + 1, то элементы х± — xk, . . ., Xk-i — Xk линейно зависимы. Существуют, следовательно, . ., №_i € не все равные нулю, такие что
(«1 — xk) н--+ (Xk_r — xk) = 0.
Положим,
k-\ м* = — S н<-1=1
Тогда имеем k	k	•
S мл = 0; S Mz = °-i=l	1=1
Можно написать для всякого t£R
k k .
x = S	xh причем S (Xf —	= 1.
250
Пусть / — множество индексов i таких, что > 0 (/ не пусто). Пусть г о 6 I таково, что
— = шш
Ъд ____ /
----- — — 4о-I g I Hi
Имеем
k
x=S (X,— t^Xi, где
1=1
^i0	~
Таким образом, x есть центр тяжести k — 1 точки из Е.
Применяя этот прием многократно, мы сможем последовательно выразить х как центр тяжести k — 1, k — 2, . . ., п + 1 точек из Е, что доказывает теорему.
2. ВЫПУКЛЫЕ МНОЖЕСТВА В ТОПОЛОГИЧЕСКИХ ВЕКТОРНЫХ ПРОСТРАНСТВАХ
Теорема 8. В топологическом векторном пространстве Е замыкание выпуклого множества А есть выпуклое множество.
Доказательство, Ограничимся случаем, когда Е — метрическое пространство. Пусть х, у € А. Существуют последовательность и последовательность {уп\ со значениями в Л, такие, что
П->со	П->оо
Пусть ХЕ [0, 1]. Имеем
^хп + (1 — Уп б и, следовательно,
Хх + (1 — 1) у — lim (Хх„ + (1 — X) t/„)6 А.
П->со
Определение. В топологическом векторном пространстве Е замкнутой выпуклой оболочкой подмножества-Л называется пересечение Ж (Л) всех замкнутых выпуклых подмножеств, содержащих А.
Множество Ж (Л) выпукло, замкнуто и содержится во всяком замкнутом подмножестве £, содержащем А, Пусть Ж (Л) — замы-кание множества Ж (Л). Имеем Ж (Л) cz Ж (Л), откуда Ж (Л) cz cz Ж (Л), и, кроме того, по теореме 8, имеем Ж (Л) cz Ж (Л), откуда окончательно получаем Ж (Л) = Ж (Л): замкнутая выпуклая оболочка множества Л есть замыкание выпуклой оболочки множества Л*.
* В то же время она не обязательно является выпуклой оболочкой замыкания множества Д.
261
Теорема 9. В конечномерном векторном пространстве выпуклая оболочка Ж (Д) компактного подмножества А компактна \
Доказательство. В силу теоремы Каратеодори (теоремы 7) всякий х Е М (Д) имеет вид
Кх1, где х^А^1\
1 = 1
Иначе говоря, Ж (Д) есть образ множества Л^+1 X Д/г + 1 при отображении
Хъ ... , Xk+1 *
Поскольку Ak+1 и А компактны, то этот образ тоже компактен.
Теорема 10. В топологическом векторном пространстве Е, если А — выпуклое множество, содержащее внутреннюю точку х0, и если хг £ Д, то любая точка из [х0, является внутренней для А.
< Доказательство. Пусть у £ [х0, хх[. Рассмотрим гомотети-ческое преобразование h с центром у, переводящее х0 в хг. Коэффициент X этого преобразования строго отрицателен. Пусть V — открытая окрестность точки х0, содержащаяся в Д. Тогда h (У) — открытая окрестность точки хъ пересечение которой с А не пусто. Следовательно, существует V такое, что h (z) С Д, и тогда
h (z) — у = X (z — у) = X (z — h (z)) +
+ X(/l(2)-y), откуда
y — h(z) = -^=_(z — h(z)).
Таким образом, у служит образом элемента z при гомотетиче-ском преобразовании g с центром h (z) и коэффициентом / = = Х/(Х — 1).-Имеем 0, 1 [. Таким образом, g (V) есть открытое множество, содержащееся в Д *. Так как	то у
является внутренней точкой множества Д.
1 Эта теорема в бесконечномерном случае неверна. Если Е — пространство Банаха, то имеет место следующая теорема: замкнутая выпуклая оболочка Ж (Л) компактного подмножества компактна. Отметим также, что даже в конечномерном случае выпуклая оболочка замкнутого множества не обязательно замкнута. Например, если в 7?2 определить А как объединение двух множеств, определяемых соотношениями {ху^1, х 0, у 0} и {ху^.—1,	0,	то
А оказывается замкнутым, а его выпуклая оболочка есть открытая полуплоскость х > 0.
* Заметим что если А выпукло и если g есть гомотетическое преобразование с центром у £ А и коэффициентом t £ [0, 1 ], то g (Л) cz А. В самом деле, для всякого х £ А
g(x) = у + t(x — y) = tx+ (1 — 0 у
есть центр тяжести точек х и у.
262
Следствия. I. Множество всех внутренних точек выпуклого множества есть выпуклое множество (если применить предыдущую теорему, взяв л^еА),
II. Если А ={= 0, то А = X и А = А.
В самом деле, из предыдущей теоремы следует, что если А не пусто, то всякая точка Е А является точкой прикосновения множества А, откуда выводим, что А = А. Покажем, что А = А. Очевидно, что А с А. Пусть х0 Е А. Мы можем предполагать, не теряя общности, что х0 = 0. Пусть В — симметричная открытая окрестность точки х0, содержащаяся в А. Поскольку А = А,-то существует у £ A f] В и, так как — у Е А, то отсюда следует, что 0 Е А.
Напомним, что в векторном пространстве Е аффинным многообразием называется всякое подмножество /И, полученное из векторного подпространства V переносом начала координат (т. е. вида М = а + V, где а Е Е и V — векторное подпространство). Если V — гиперплоскость, то М называется аффинной гиперплоскостью.- Размерностью М называется размерность V.
Если А — произвольное непустое подмножество, то пересечение всех аффинных многообразий, содержащих А, есть аффинное многообразие, порожденное множеством А. Это множество k^.	k
состоит из всех точек вида х = S ^z*z> где S К = 1» & — про-z=i	z=i
извольно.
Если А — выпуклое множество, то будем называть размерностью множества А (обозначим ее через dim (А)) размерность аффинного многообразия, порожденного множеством.
Теорема 11. Пусть А — выпуклое множество в п-мерном векторном пространстве Е. Для того чтобы А 0, необходимо и достаточно, чтобы dim (А) = п.
Доказательство. Пусть dim (А) = п. Можно предположить без ограничения общности, что ОЕА. Тогда аффинное многообразие, порожденное множеством А, совпадает с векторным подпространством, порожденным множеством А. Так как это последнее имеет размерность и, то в А существует п линейно независимых векторов х19 . . ., хп и А содержит множество всех элементов вида
х = S Мь где М X К 1.
s	i — 1	Z
Отображение, которое величине X. = [Хъ . . hn]£Rn ставит п
в соответствие х = 2 является гомеоморфизмом из Rn на Е.
263
Множество
1=1 содержит внутри себя множество
xz > о, S < 1
1=1
Следовательно, множество всех элементов вида
X — s Кх1, где I X, > 0; 2 Xz < 1 1=1	I	1=1'
открыто и содержится в А. Итак А 0.
Если dim (Л) < п, то отсюда тривиальным образом получаем А = 0.
Определение. Пусть Е — конечномерное векторное пространство, А — непустое выпуклое множество в Е и М — аффинное, многообразие, порожденное множеством А. Говорят, что точка х множества А является внутренней, в широком смысле, точкой Л, если х — внутренняя точка Л по отношению к М. Множество внутренних, в широком смысле, точек называется внутренностью 1 множества Л; это — множество всех точек множества Л, внутрен-- них по отношению к М.
Заметим, что всегда имеет место int (Л) =£=0, что для-замкнутого Л справедливо Л = int (Л) и что для произвольного вьг . пуклого Л, Л cz int (Л).
Пример. Говорят, что k + 1 точек векторного пространства аффинно независимы, если аффинное многообразие, которое они порождают, имеет размер- • ность k. Симплексом размерности k называется выпуклая оболочка £+~1 аффинно независимых точек a±f . . ., а;+1. Всегда имеет место
> k = dim (Jj) dim (Е). .
Тогда внутренностью симплекса 2 является множество всех точек вида
Л-4-1	М-1
где = 1 и ^i>0.
/=1
3.	ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
На протяжении оставшейся части этой главы мы ограничимся конечномерными векторными пространствами2. Слово гипер-. плоскость будет пониматься в смысле аффинной гиперплоскости.
1 Внутренность множества А обозначается через int (Л) Прим, перев.
2 Некоторые сведения для случая бесконечномерных топологических пространств мы дадим в подстрочных примечаниях.
264
Пусть Н — гиперплоскость с уравнением и (х) = а. Замкнутыми полупространствами, определяемыми гиперплоскостью Я, называются множества, такие, что и (х) а и и (х) а. Открытыми полупространствами, определяемыми гиперплоскостью Я, называются множества, такие, что и (х) > а и и (х) < а. Заметим прежде всего, что если Я — гиперплоскость, А — выпуклое множество и Я П А = 0, то А располагается в одном из открытых полупространств, определяемых гиперплоскостью Я. В самом деле, если бы существовали в А две точки хх и х2 такие, что и (*i) <« и и (х2) > а, то существовал бы центр тяжести точек Xi и х2, принадлежащий Я.
Определение., Пусть А п В — два непустых множества в векторном пространстве Е и Я — гиперплоскость 1 в пространстве Е. Говорят, что А и В разделяются гиперплоскостью Я (соответственно строго разделяются гиперплоскостью Я), если А содержится в одном из замкнутых (соответственно открытых) полупространств, определяемых гиперплоскостью Я, а В — в другом замкнутом (соответственно открытом) полупространстве. Другими словами, А и В разделяются гиперплоскостью Я с уравнением и (х) = а, если
( и (х) а	дл я	х Е А;	[ и (х)	а	дл я	х £ А;
( и (х)	sC а	для	х Е В	( и (х)	а	для	х Е В.
Точно так же, А и В строго разделяются гиперплоскостью Я, если
( и (х) >а для х Е А; ( и (х) < а для х Е А;
<	или \
( и (х) < а для х Е В ( и (х) > а для х Е В.
Иногда вместо «разделяются» мы будем говорить «разделяются в широком смысле».
Теорема 12. Пусть Е — конечномерное векторное пространство, А — открытое выпуклое множество и М — аффинное многообразие, не-пересекающееся с А. Тогда существует гиперплоскость, проходящая через М и не пересекающаяся с А.
Доказательство. 1) Предположим, что dim (Я) = 2. Покажем, что если ОО, то существует прямая D, проходящая через 0 и не пересекающаяся с А. Пусть С — конус с вершиной О, порожденный множеством А. Тогда
С =
k > о
так как А — открыто, то и kA открыто для всякого k > 0, а значит и С тоже открыто. Кроме того, 0 $ С. Наконец, С — выпукло. В самом деле, пусть у1У у2£ С, причем
Ui = ki*i (&i >0, ххЕ А)
'	и у2 = k2x2 (k2 >0, х2 Е А).
1 В бесконечномерном случае «гиперплоскость» следовало бы заменить на «замкнутая гиперплоскость»,
265
Тогда для X Е Л2
^1У1 Ч~ X2I/2 ~ 'hik-jXi -р Х2^2-^2 “	"4~ Ц2Х2
= (Ш + Щ) (---------Х1 Н---V---Х%) ’
I г*2/у И1_[_р,2	1 1 Ц1 + Ц2 2/’
где
Ц1 =	М-2	^2^2>
поэтому
^1Z/1 “Г ^2У2 £ С,
Рассмотрим дополнение G множества {0}. Это множество не является выпуклым; следовательно, С ^G. Оно связано, поэтому существует граничная точка х множества С, отличная от 0. Пусть D прямая, проходящая через 0, порожденная точкой х. Положим
Dx = Dt[){0}{)D7,
где D~t — множество элементов kx при k >0 и Dx — множество элементов kx при k > 0. Так как х $ С, то Dt П С = 0. Кроме того, —х $ С, иначе было бы 0Е С (по теореме 10). Следовательно, Dx f] С = 0 и Dx (] А = 0.
2) Предположим, что dim (£) 35 2. Покажем, что если 0 $ Л, то существует прямая D, проходящая через 0 и не пересекающаяся с А. Пусть Q — плоскость, проходящая через 0. Если Q П П А = 0, то любая прямая в Q, проходящая через 0, удовлетворяет условию. В противном случае в Q существует прямая, не пересекающаяся с Q f] А. Эта прямая также удовлетворяет условию.
3) Пусть А — открытое выпуклое множество и М — аффинное многообразие, не пересекающееся с А. Можно предполагать, что 0 Е М. Пусть р — максимальная размерность векторных подпространств, проходящих через М и не пересекающихся с А. Мы должны показать, что р = dim (£) — 1. Пусть N — векторное подпространство размерности р, проходящее через М и не пересекающееся с Л, и пусть Р — прямое дополнение подпространства N. Спроецируем N и А на Р параллельно N: N спроеци-руется в 0, а Л — в открытое множество Л' подпространства Q, которому 0 не принадлежит. Если р < dim (£) — 1, то dim (Р)
2. Тогда в Р существует прямая D, проходящая через 0 и не пересекающаяся с Л'. Подпространства N и D порождают векторное подпространство размерности р + 1, не пересекающееся с Л, что противоречит определению р.
Доказательство теоремы тем самым закончено.
Следствие, Пусть Л — выпуклое множество, не содержащее 0. Существует линейная форма и такая, что и (х)	0 для
всякого х Е Л.
266
В самом деле, если dim (Л) < dim (£), то А содержится в некоторой аффинной гиперплоскости Я с уравнением и (х) = а. Можно предполагать, что а 0 (в противном случае можно положить и' = —и и переписать уравнение гиперплоскости Н в виде и' (х) = —ос). Следовательно, и (х)	0 для хЕ А. Кроме
того, если dim (Л) = dim (В), то существует гиперплоскость Я, проходящая через 0 и не пересекающаяся с А. Другими словами, существует линейная форма и такая, что и (х) > 0 для хЕ А, откуда следует: и (х) 5> 0 для всякого хЕ А = Л.
Теорема 13. Пусть А и В — два непересекающихся выпуклых множества. Существует гиперплоскость, разделяющая их \ Доказательство. Множество А—В (образованное из элементов вида z = х — у, где хЕ Л и у Е В) является выпуклым множеством, не содержащим 0. В силу предыдущего следствия существует линейная форма и такая, что и (z) 5> 0 для всякого
А —В, т. е. такая, что и (х) и (//), каковы бы ни были хе л, r/е в.
Положим а = inf и (х), тогда и (х) а для х Е А и и (х) а х £ А
для х Е В. Следовательно, гиперплоскость Я с уравнением и (х) разделяет А и В-
Следствие. Если Л и В — два выпуклых множества без общих внутренних, в широком смысле, точек, то существует гиперплоскость, разделяющая их.
В самом деле, внутренности множеств Л и В представляют собой два непересекающихся выпуклых множества. Тогда существует гиперплоскость Я, разделяющая их. Так как А и В содержатся в замыканиях своих внутренностей, то Я разделяет А и В-
Теорема 14. Пусть А — компактное, а В — замкнутое выпуклые множества. Если Л и В не пересекаются, то «существует гиперплоскость, строго разделяющая их 1 2.
Доказательство. Пусть х, у —> d (х, у) —эвклидово расстояние в Е. Положим
6 = inf d (х, у), j х £ а
Для любого х функция у d (х, у) достигает своей нижней грани d (х, В). Функция х —> d (х, В) непрерывна и, так как А компактно, достигает своей нижней грани. Следовательно, существуют х0 ё А и z/0 Е В такие, что 6 = d (х0, yQ). Так как Л и В не имеют общих точек, то 6 > 0. Рассмотрим теперь множество А ь образованное из z Е Е таких, что d (z, Л) 6/3, и множество В1? образованное из z£ Е таких, что d (z, В) 6/3.
1 Эта теорема для бесконечномерных пространств неверна.
2 Для некоторых бесконечномерных пространств, например для пространств Банаха и пространств Фреше, эта теорема верна.
267
Множество А х выпукло, так как оно состоит из всех элементов вида г = х + и, где х£ А, а и принадлежит замкнутому шару с радиусом 6/3 и центром 0.
Аналогично, Вг тоже выпукло. Непосредственно проверяется, что и Вг не имеют общих точек. Следовательно, существует гиперплоскость 77, разделяющая А± и Вг. Эта гиперплоскость строго разделяет А и В.
Замечание. Приведем пример замкнутых выпуклых множеств в которые не могут быть строго разделены гиперплоскостью: А определяется уравнением х~ 0, В определяется через {ху^О, х,.у^0}.
4. ОПОРНЫЕ ГИПЕРПЛОСКОСТИ И КРАЙНИЕ ТОЧКИ
Определение. Пусть А — выпуклое множество в конечномерном векторном пространстве. Гиперплоскость Н называется опорной гиперплоскостью множества А, если Н содержит по крайней мере одну точку из А и А содержится в одном из замкнутых полупространств, определяемых гиперплоскостью Н.
Замечание. Всякая гиперплоскость, содержащая Л, является опорной гиперплоскостью.
Теорема 15. Пусть А — выпуклое множество в векторном пространстве Е. Через всякую граничную точку множества А проходит некоторая опорная гиперплоскость Н.
Доказательство. Пусть х0 — граничная точка множества А. Если dim (A) <dim (Е), то в качестве Н достаточно взять гиперплоскость, содержащую А. Если dim (А) = dim (Е), то существует гиперплоскость, проходящая через х0 и не пересекающаяся с А. Так как А = А, то Н есть опорная гиперплоскость для А.
Теорема 16. Для всякого непустого компактного множества существуют одна или две опорных гиперплоскости, параллельных любой данной гиперплоскости.
Доказательство. Пусть и (х) = а — уравнение данной гиперплоскости Н. Если положить
т~ minu(x); М. •=. шах^(х), х^А - х^А
то гиперплоскости и (х) = т и и (х) = М будут опорными гиперплоскостями для А, параллельными Я (они могут совпасть, если А содержится в гиперплоскости, параллельной Н).
Определение. Говорят, что точка х выпуклого множества есть крайняя точка множества А, если х не является центром тяжести никаких двух различных точек из А.
Замечание. Всякая крайняя точка множества А принадлежит его границе.
Пример. Пусть дан замкнутый шар радиуса р в эвклидовой метрике. Любая его граничная точка является крайней точкой.
268
Теорема 17, Пусть А — компактное выпуклое множество в векторном пространстве Е. Всякая опорная гиперплоскость содержит по крайней мере одну крайнюю точку.
Доказательство, Мы проведем его индукцией по размерности А. Если dim (Л) = 0, то А' сводится к одной точке х0. Всякая опорная гиперплоскость содержит х0, которая является крайней. Предположим, что для dim(A)<p теорема верна. Тогда можно утверждать (по теореме 16), что всякое компактное выпуклое множество размерности < р обладает крайними точками.
Пусть теперь dim (Л) = р. Пусть Н — опорная гиперплоскость для Л. Тогда dim(?l Q 77)^dim(/l). Если dim (ЛИ 77) << < р, то A f] Н обладает крайней точкой, которая является также крайней точкой множества А. Если dim (Л Q Н) = р (т. е. A cz Н), рассмотрим в Н опорную гиперплоскость Но для А, Тогда dim (77 0) = dim (77) — 1.
Множество А П Но обладает крайней точкой, которая является крайней точкой и множества А.
5. ГРАНИ. АСИМПТОТИЧЕСКИЙ КОНУС
Обозначение. Пусть А — выпуклое множество в конечномерном векторном пространстве В, а х — некоторая точка из А. Через Gx (или Gx) мы будем обозначать множество, составленное из х и всех прямых D, проходящих через х, таких, что х является внутренней точкой для D f| А по отношению к D.
Пусть h£ Е. Для того чтобы прямая, проходящая через х в направлении h, принадлежала множеству Gx, необходимо и достаточно, чтобы существовало такое k > 0, что [х — kh, х + + kh] cz А.
Легко убедиться, что Gx выпукло. В самом деле, пусть hr и h2 таковы, что прямые, проходящие через х в направлениях hi и h2, принадлежат множеству Gx. Существуют такие положительные kr и /е2, что
[х — k-Ji^ х + cz А и [х — k2h2f х + cz А.
Пусть k = min (&ь k2). Тогда
[х — khly х + kh±] с А и [х — kh2, х + kh2} cz А.
Пусть X = (%i, %2) € Л2. Тогда
х — k (K1h1 + %2/i2) С Д
и x~j-^(Xi/ii~|~ %2/i2) G Aj следовательно,
[x — k (Xj/ij + %2/i2);
x + k (A^/ii + %2ft2)] cz A.
269
Таким образом, прямая, проходящая через х в направлении * X1h1 + Х2й2, принадлежит множеству Gx. Следовательно, Gx выпукло. Так как G— симметричный конус (с вершиной х), то Gx является аффинным многообразием.
Определение. Гранью Fx (или F^) элемента х множества А называется пересечение множества А с аффинным многообразием Gx (в ранее введенных обозначениях).
По построению, Fx является выпуклым множеством. Для того чтобы у Е Fx, необходимо и достаточно, чтобы у = х или х было центром тяжести точки у и некоторой точки а£ Д, отличной от х. В следующей теореме даются основные свойства граней.
Теорема 18. Пусть А — непустое выпуклое множество в конечномерном векторном пространстве и Fx — грань точки хЕ А.
1.	х — внутренняя, в широком смысле, точка грани Fx. Имеем
dim (Fx) = dim (Gx).
2.	Если х — внутренняя, в широком смысле, точка А, то Fx = = А, и наоборот.
3.	Если х — крайняя точка множества Д, то Fx = {х}, и наоборот.
4.	Fx есть максимальное из выпуклых множеств, содержащихся в А, для которых х является внутренней, в широком смысле, точкой.
5.	Если у Е Fx, то грань Fy точки у множества А совпадает с гранью точки у в множестве Fx (в частности, Fy cz FJ. Для того чтобы Fy = Fx, необходимо и достаточно, чтобы у было внутренней, в широком смысле, точкой для Fx. Для того чтобы у было крайней точкой множества Л, необходимо и достаточно, чтобы оно было крайней точкой для Fx.
Доказательство. 1. Всякая прямая, проходящая через х и содержащаяся в GXi пересекается с Л по сегменту, концы которого отличны от х и для которого х является внутренней, в широком смысле, точкой. Следовательно, х принадлежит множеству всех точек FXi внутренних по отношению к Gx. Значит, х — внутренняя, в широком смысле, точка Fx и dim (FJ = dim (GJ.
2.	Если х — внутренняя, в широком смысле, точка множества Л, то Gx есть аффинное многообразие, порожденное множеством Д, и Fx = Д. Обратно, если Fx = Д, то х — внутренняя, в широком смысле, точка Д, поскольку х — внутренняя, в широком смысле, точка для Fx.
3.	Если х — крайняя точка множества Д, то Gx = {х}, а значит и Fx = {х}. Обратно, если Fx — {х}, то Gx — {х}. Если бы х было центром тяжести двух точек х± и х2, отличных от х, то прямая, проходящая через хг и х2, принадлежала бы Gx, что ведет к противоречию. Следовательно, х — крайняя точка множества Д.
270
4.	Пусть В — выпуклое множество, содержащееся в Л, для которого х является внутренней, в широком смысле, точкой. Пусть Fx и Fx — грани точки х в А и В- Очевидно, что FBxaFAx. Поскольку х — внутренняя, в широком смысле, точка множества В, то Fax = В, откуда BcFx-
5.	Пусть z/Е Fx и zE Fy. Покажем, что zE Fx. Можно предположить, что у =F х и. z =F У, так как в противном случае доказываемое свойство тривиально. Но тогда существует такое аЕ А, что х = 'куа + Х2г/, где Х2 >0,	+ %2 = 1. Точно
так же существует такое ' b Е А, что у =	+ ji2z, где jlli,ji2 >
> 0,	+ jul2 = 1. Тогда
х =	+ Х2 + jli2z) ==,
= (^1 + ^2^1)
Так как (Хх + Х2|Л1) + Х2|ш2 = 1, то х есть центр тяжести с ненулевыми весами точки z и точки	'» принадлежа-
щей А. Следовательно, zE Fx.
Кроме того, Fy — максимальное содержащееся в А выпуклое множество, для которого у является внутренней, в широком смысле, точкой. Поскольку Fya Fx, то Fy есть также максимальное содержащееся в Fx выпуклое множество, для которого у является внутренней точкой. Другими словами, Fy совпадает с гранью точки у множества Fx.
Если Fy = FXi то у является внутренней, в широком смысле, точкой FXi ибо это—внутренняя, в широком смысле, точка Fy. Обратно, если у — внутренняя в широком смысле'точка Fx, то грань точки у в Fx совпадает с Fx. То же верно и для грани точки у в А.
Для того чтобы у была крайней точкой относительно Л, необходимо и достаточно, чтобы грань- Fy относительно А выродилась в {у}, т. е. чтобы грань точки у относительно множества Fx выродилась в {у}-, иначе говоря, чтобы у была крайней точкой относительно Fx. В следующей теореме даются основные соотношения между гранями и опорными гиперплоскостями.
Теорема 19. Пусть Н — опорная гиперплоскость для А и пусть %Е Н Г1 А. Тогда Fx с Я В А и Fx = Н А в том и только в том случае, если х — внутренняя, в широком смысле; точка Н В А.
Доказательство. Имеем Gx cz Я, откуда Fx cz Я В А. Если Fx = Я Q Л, то х — внутренняя, в широком смысле, точка множества Я В А, поскольку она является внутренней, в широком смысле, точкой множества Fx. Обратно, если х — внутренняя, в широком смысле, точка множества Н (] А, то Fx zd
Я fl Л, откуда F* = Я В Л.
271
Теорема 20 (Крейна—Мильмана). Всякое компактное выпуклое множество А является выпуклой оболочкой своих крайних точек \
Доказательство. Мы проведем его индукцией по размерности А. Предположим, что теорема верна, если dim (Л) р — 1, и положим теперь dim (Л) = р. Пусть хЕ А. Если Fx =k А, то х принадлежит выпуклой оболочке крайних точек множества Fx и тем более принадлежит выпуклой оболочке крайних точек множества А. Предположим теперь, что Fx = А. Пусть у — крайняя точка множества А. Прямая, проходящая через х и у, пересекается с Д по сегменту, одним из концов которого является у. Пусть z— другой конец. Тогда Fz 4= А. Следовательно, z принадлежит выпуклой оболочке крайних точек множества Fz и тем более принадлежит выпуклой оболочке крайних точек множества Л. Так как х — центр тяжести точек у и г, то тем самым теорема доказана.
Предложение 1 и определение. Пусть А — замкнутое выпуклое множество и х Е А. Множество всех элементов h, таких, что х + th Е Л при любом t 0, представляет собой замкнутый выпуклый конус, не зависящий от выбора х, называемый асимптотическим конусом множества Л.
Доказательство. Легко проверить, что рассматриваемое множество является выпуклым конусом. Для данного t О множество всех й, таких, что х + th^ Л, есть замкнутое множество. Рассматриваемый конус есть пересечение этих замкнутых, множеств. Следовательно, он замкнут. Пусть теперь у Е Л. Предположим, что х + th Е А для любого t 0. Множество Л замкнуто, выпукло и содержит у и полупрямую с началом в точке х и направлением, совпадающим с направлением h. Следовательно, А содержит- замкнутую выпуклую оболочку множества, состоящего из у и этой полупрямой. Но эта замкнутая выпуклая оболочка содержит полупрямую с началом в точке у, параллельную h. Значит, у 4- th Е Л для всякого t 0. Таким образом, рассматриваемый конус действительно не зависит от х.
Предложение 2. Пусть А — замкнутое выпуклое множество. Для того чтобы Л было ограничено, необходимо и достаточно, чтобы его асимптотический конус вырождался в 0.
Доказательство. Необходимость условия тривиальна. Покажем, что оно достаточно. Предположим, что Л не ограничено. Введем в пространство эвклидову норму. Пусть х0Е Л, a {xrt} — последовательность элементов множества Л такая, что lim || хп || =
= + оо. Положим хп = х0 + tnhn, где || hn || — 1, tn 0 и lim tn =
И->4-00
1 Для бесконечномерных пространств эта теорема неверна. Для некоторых бесконечномерных пространств, например пространства Банаха и пространства Фреше,, верна следующая более слдбая теорема: всякое компактное'выпуклое множество является замкнутой выпуклой оболочкой своих крайних точек. 27?	.
Так как сфера единичного радиуса компактна, то можно предполагать, что последовательность {hn\ сходится. Тогда положим h = lim hn. Пусть t 0. Для достаточно больших п имеем
М——|— со
tn t, откуда следует, что х0 + thn(z Л, и, переходя к пределу при п, стремящемся к +оо, получим х0 + th £ А. Таким образом, h принадлежит асимптотическому конусу множества А. Так.как \\h\\ = 1, то этот асимптотический конус не вырождается в 0.
Теорема 21. Пусть А — замкнутое выпуклое множество, не содержащее никакой прямой. Тогда всякий элемент х£ А имеет вид х =	+ х2, где хг принадлежит выпуклой оболочке
крайних точек множества Л, а х2 — асимптотическому конусу множества Л. Обратно, всякая точка такого вида принадлежит множеству Л.
Доказательство. Доказательство первой части мы проведем индукцией по размерности множества Л. При dim (Л) = 0 справедливость теоремы очевидна. Предположим, что теорема верна при dim (Л) р — 1. Пусть dim (Л) = р. Если Л ограничено, то результат следует из теоремы Крейна—Мильмана. Если Л не ограничено, то пусть h — ненулевой вектор асимптотического конуса. Рассмотрим прямую, проходящую через х и содержащую h. Она пересекается с Л по замкнутой полупрямой с началом в точке у. Так как у принадлежит границе множества Л, то dim <dim (Л). Имеем у = уг + у^ где У1 принадлежит выпуклой оболочке крайних точек множества (Fy) (выпуклой оболочке крайних точек множества Л), а у2 — асимптотическому конусу множества (Fy) (и, следовательно, асимптотическому конусу множества Л)/Имеем также х = у + th, где t 0. Если положить xi — Уъ х2== У2~\~ th, то получится искомое разложение х = + х2. Первая часть теоремы доказана. Вторая часть тривиальна.
6. ВЫПУКЛЫЕ ФУНКЦИИ
Определение. Действительная функция f, определенная на выпуклом множестве Л, называется выпуклой, если:
f (Mi + М2)	(*1) + KJ (M v xi, x2 e л и % e a2.
Она называется вогнутой, если выполняется обратное неравенство, т. е. если — / выпукла.
Замечание. Линейная функция является одновременно выпуклой и вогнутой.
Теорема 22. Для того чтобы функция f, определенная на выпуклом множестве Л, была выпуклой, необходимо и достаточно, чтобы множество Tf всех
ху елxr
таких,, что у f (х), было выпуклым.
18 Р. П^ллю де Да Барьер	?73
Доказательство. Необходимость. Предположим, что f выпукла. Пусть
_ Ih J ’ Тогда
х2
_#2_
£А х R, причем	у2^М2) и Х£А2.

Х1
L У1J
'2
XjXj ~Ь Х2Х2 _ У 2 J А1У1 ^2^2_
еть
ибо
“h ^2У2 ^lf (*1) ~'г ^2f (Хз) f (^А	^2^2)-
Достаточность. Предположим, что множество у f (х) выпукло. Пусть хь х2Е А и ХЕ Л2. Тогда


1Н-ч)]е7у
Следовательно,
A if (*i) ~Ь ^2/ (я2) •_ т. е.
W (*1) +	(*2) f (Mi + М2);
следовательно, /, выпукла.
Из этой теоремы легко вывести некоторые следствия.
Следствие 1. Если f выпукла, то k	\	k	'
s	XJ (xz) (vX£Aa, k — любое)
1=1	/	i=l
Следствие 2. Пусть {/4—семейство функций, определенных на некотором выпуклом множестве. Тогда функция sup 4 вы
пукла.
ГЛАВА J3
ЗАДАЧИ ПРОГРАММИРОВАНИЯ
1. ПОСТАНОВКА ЗАДАЧИ И ОБЩИЕ ОБОЗНАЧЕНИЯ
Задачей программирования или, проще, программой называют всякую задачу, состоящую в отыскании минимума (или максимума) некоторой функции f на множестве в определенном равенствами или неравенствами.
Дадим сейчас общую формулировку такой задачи, введя общие обозначения, на которые будем ссылаться в теоремах, содержащих основные результаты этой теории.
Пусть f — непрерывно дифференцируемая функция, определенная на открытом множестве й в Rm.
Пусть
ф1, . . ., ф', . . ., ф? — q непрерывно дифференцируемых функций, определенных на й;
ф1, . . ., ф\ . . ., фг— г непрерывно дифференцируемых функций, определенных на й;
а1, . . ., а', . . ., а? — q действительных чисел;
Р1, . . ., р*, . . ., Рг — г действительных чисел.
Будем называть допустимым множеством множество А, образованное из точек хЕ 7?т, удовлетворяющих условиям
' х Е Й
• ф/ (х) = а! (/ = 1......q);
.	(х)	(k = 1, . . г)
Будем говорить, что функция f имеет в точке хЕ А: нестрогий глобальный минимум, если f (х) f (х) для любого х Е А; строгий глобальный минимум, если f (х) > / (х) для любого х£А, отличного от х; нестрогий локальный минимум — если существует окрестность А точки х в Rm такая, что f (х) f (х) для любого xgA f) А; строгий локальный минимум — если существует окрестность А точки х в /?т такая, что / (х) > / (х) для любого хЕ А П Д, отличного от х. 1
Получим аналогичные определения, заменив минимум на максимум, а знаки и >» на и <.
18*	275
Положим, кроме того,
а/ = ф/ (х), р* =	(х);
Множества Д можно определить как пересечение множества й с множеством, определяемым условиями
Ф (х) = а; гр (х)	£
Заметим, что ф и гр являются непрерывно дифференцируемыми отображениями Rm в	соответственно.
Равенства <р/ (х) = а/ будут называться связями, а неравенства гр* (х) Р/г — ограничениями. Функция f будет называться целевой функцией.
Говорят, что в точке х ограничение гр* (х) р* насыщено, если гр* (х) — Р*. Мы будем обозначать через К (х) множество значений Этаких, что ограничение гр* (х) р* насыщено в точке х.
Определение. Пусть дана некоторая точка х£Д; говорят, что связи и ограничения регулярны в х, если производные
(<₽0' (к)	q), (^)' (X) (ke К (х))
линейно независимы.
Задача программирования линейна, если линейны функции ф/ (/ = 1, . . ., q), гр* (k = 1, . . ., г) и f.
Замечания.
I. Ограничение гр* (х) р* может быть заменено двумя условиями гр* (х) — д* — р*, 6*^ 0. Переменная д* называется свободной переменной.
II. Любое равенство <pz (х) — а1 может быть заменено группой из двух неравенств (ру (х)	(х) az. Однако такая замена может оказаться стесни-,
тельной при применении теорем.
2. УСЛОВИЯ ПЕРВОГО ПОРЯДКА
Условиями минимума первого порядка называют условия, выражающиеся при помощи первых производных функций Д ф/ и гр*. Если не делать дополнительных предположений, условия первого порядка являются только необходимыми, но не доста? точными.
276
Мы установим сказала теорему Фаркаша—Минковского (Тео-рема 1), основанную на следующей лемме.
Лемма 1. Пусть х0 — точка, а С — замкнутый выпуклый конус в конечномерном векторном пространстве. Если х0 С С, то существует линейная форма U такая, что
U (х0) < 0;
U (х)	0 . для х£ С.
Доказательство. По теореме 14 гл. 12 существует линейная форма U и действительное число у такие, что U (х0) < у и tf (х) > у для хЕ С.
Из второго условия вытекает (при подстановке х = 0): у < 0 и, значит, U (х0) <0. Кроме того, для х£ С
U (?х) - t U (х) > у (V 0) и, следовательно, £/(х)>у/£, откуда (устремляя t к +оо) U (х)	0.
Теорема 1 (Фаркаша—Минковского). Пусть дано р +1 линейных форм V1, . . ., Vp, W в конечномерном векторном пространстве Е. Для того чтобы были справедливы соотношения
' р- (х) > 0 (i = 1, . ., р) =) W (х)	0,
необходимо и достаточно, чтобы существовали неотрицательные числа vx, . . ., vp такйе, что
р W = S v£P. 1=1
Доказательство. Достаточность условия тривиальна. Покажем, что условие необходимо. Свойство
р
W = S v£V\
i=l
где
vi 0,
означает, что W принадлежит выпуклому конусу С, порождаемому элементами V1, . . ., Vp в пространстве Е', сопряженном к Е (этот конус замкнут). Предположим, что это не так. Тогда по лемме 1 существовал бы элемент х С Е такой, что W (х) < 0 и V (х)
0 (уЕёС). В частности, было бы Р' (х)	0 (i = 1, . . ., р),
что исключено по предположению.
Замечание. Если справедливость условия V1 (х)^ 0 (у/)—)W (%) ^ 0 установлена только для ]| х е (е> 0), то по-прежнему
р
W —	где 0.
277
л	IIII
В самом деле, = е и, следователь но, ИМ
V ‘ (X) о, (yi) => V‘- (Д)	0, (vO => w	О => Г (X)	0.
I
Следствие. Пусть даны q + г + 1 линейных форм 671, . .	У1, . . Уг, W в конечномерном векторном простран-
стве Е. Для того чтобы имело место
( Ui (х) = 0 (у/)
I Vk (х)	0 (уф
=)Г(х) ^0,
необходимо и достаточно, чтобы существовали числа р1? . .	р^,
Vi, . . ., vr такие, что
(уф;
W = ilfiiUi^ S vAV*. j=l	/e=l
Доказательство. Достаточность условия тривиальна. Покажем, что условие необходимо. Соотношение (*) можно пере-
писать в виде
t//(x)^0 (у/)
(-t7/)(x)^0 (у/)
V*(x)^0 (уф
=)Г(Х^0.
Существуют, следовательно, числа (/ =1, ... ., q), (/ = 1, . . ., q), Vk (k = 1, . . ., r)„ все неотрицательные и такие, что
ч	ч	г ,
w = s rfu1 + S н7 (- и1) + S /=1 /=1 1
Положим jiy = (Л/" — Получим
q	г
iy = S	S
}-=1	k=i
где vk 0 для всех k, что и требовалось доказать. Из следующей теоремы вытекает необходимое и достаточное условие оптимальности в линейном программировании.
Теорема 2. Предположим, что все функции /, ср' (/ = 1, . . ., q),	(& = 1, . . ., г) (в общих обозначениях) линейны.
Для того чтобы f достигала в х £ А нестрогого глобального минимума на А, необходимо и достаточно, чтобы существовали действительные числа jut, (/ = 1, . . ., q) и vk (k = 1, . . ., г) такие, что выполняются следующие условия:
(«) v^^O(v^),	= 0 для
q	г
(б) f = S н/Ф' + S /—1	k—1
278
Доказательство. Множество К (х) обозначается сокращенно через К.
Покажем, что условия необходимы. Пусть h С Rni таково, что
I ф/(Л) = о	(V/= I........?);
I (А)	0	(уА€ К).
Существует е > 0 такое, что || h || е —) х + А £ А. Тогда f (х + К) f (х), т. е. f (h)	0. Следовательно, существуют
числа fty (/ = 1, . . ., q), vk (А € Л) такие, что
f = S Руф' + S МА /=1	k(-K
v* ; ;; 0.
Положив vk = 0 для k ф К, получим условия (а) и (б). Покажем, что условия достаточны. Если (а) и (б) выполняются, то f (А)	0 для любого h, удовлетворяющего условиям
f ф'(А) = 0 (v/= 1,	, <7)1
(чьею j
Следовательно, f достигает в х нестрогого глобального минимума на множестве
<р'(х) = а/ (/= 1,.. .,<?);.
ф*(х)^> (k£K) W	/
и тем более на А.
Имея в виду установление необходимого условия оптимальности в нелинейном программировании, мы докажем сначала следующую лемму.
Лемма 2. Если (в общих обозначениях) связи и ограничения регулярны в точке х£ А, то для любого вектора h, удовлетворяющего условиям
| (ф<)'(х) (А) — о (v/= 1. •  •> <?);.
[ (ф*)'(х)(Л)^0 МСОД, существует дифференцируемая дуга кривой t —> | (/), определенная в интервале [0, Zo] (t0 > 0) такая, что
4(0) = %;
 Г (0) = А;
U0€A.
279
Доказательство. Мы всегда можем предполагать, что /<(х) — {1, , . г'}, а/ = 0 (/ = 1, . . q) и 0* = 0 (k = 1, .. г'). Положим
СО/ = ф/ (для j = 1, . . ., q)\ со^+/г = ф/г (для /г= 1, ..	г')
и для q + г' < i т выберем непрерывно дифференцируемые функции со* такие, чтобы производные (©9'(х) были линейно независимы для i = 1, . . ., т. Функции представляют собой ло
кальные координаты точки х в /?т. Другими словами, существует такая окрестность А точки %, что отображение
(О1 (х)
х —> X = со (х) =
_(ош(х)_
есть гомеоморфизм из А на некоторую окрестность 0 в дифференцируемый вместе со своим обратным.
Пусть Н = со' (х) (К). Тогда 'Н1 = 0	для i = 1, . . ., q\
HL 0 для i = q + 1, . . ., q + г'.
Положим
Имеем
8(0 =/Я.
S(0) = 0, S'(0) = tf
и, кроме того, существует t0 > 0 такое, что S(/)6 w (Л) для Ю, /01, а тогда S (?) € ® (Д)-
Если мы положим теперь
g(O=®-i(S(O) (для/ею,и).
то и получим
Ч(0€Д;	'
 1(0) = х;
I' (0) = h.
Теорема 3. Предположим (в- общих обозначениях параграфа 1), что связи и ограничения регулярны в точке хбД-280
Если / достигает в х локального минимума, то существуют действительные числа р,, (/ = 1, . . q) и vk (k = 1, . .	.г) такие,
что выполняются следующие условия:
(a)	v^O (yfe== 1, ..., г), v^==0 для
(б)	f (х) = S цДфО' (*) + S vk (W (х). /—1	k=l
Условие (а) можно переписать в таком виде:
(«1) v*>0(V& = l, • •Г), vfe[x|)fe(x) — Р4 = О или еще, положив -v = [vb . . ., vr], в виде
(я2) v 0, v [гр (х) —~jfJ] = 0.,
Условие (б) можно переписать, положив jut = [|лх, . . ., р^], так:
(бх) /'(х) = ц<р'(х) 4-уф'(х), или
<?	г	~
(б2)	dz= S l^jdai	-j-	Ij Vkdfik	в точке	х,
/=1	*=1
или
(б3)	dz = у da Ц- v dp в точке х, или, наконец, положив
<7	г
= f — Н/ф' — S = f — МФ —
/=1	k=i
так:
(б4)	Ф' (х) •= 0.
Доказательство. Пусть ЙЕ7?"1 удовлетворяет условиям
/ (<р/)'(х) (/I) =0	(/= 1, . . ., ?);
. (Ч>*)' (х) (й) 5s 0	,
Покажем, что f (х) (/г)	0.
В самом деле, существует (лемма 2) дифференцируемая дуга кривой £—»£(/), определенная для' /С Ю, t01 По > 0], такая, что
• 5(0) = х;
. 5'(0) = Л.
281
Положим теперь F (t) = f (g (/)). Тогда F (i) F (0) для всякого [0, t0] и, следовательно,
F' (0) = Г (x) (ft) 0.
По теореме 1 существуют числа jut, (/ = 1, . . q) и vk
С К (x)), такие, что
f W = S Н/ (<P')' <x) + s V* (a|>*)' (x) ;_1	k С К (x)
И
Vfe 2s 0.
Положив vk = 0 для k $ К (x), получаем условия (а) и (б).
Замечание, Предположение о регулярности связей и ограничений можно ослабить. Например, его можно заменить следующим: линейные формы (ср/) ' (х) независимы и существует вектор h такой, что
(ф'У (х) (Л) = 0 (/ = 1, . .	7);
(W (х) (h) > 0 (k е К (х))
(см. Abadie, Problemes d’optimisation. Institut Blaise Pascal, 1965).
Определение. Постоянные jut, и vk, введенные в теоремах 2 и 3, называют множителями, постоянные jut, — множителями Лагранжа, постоянные vk принято называть множителями Куна и Таккера в знак признания существенного вклада этих авторов в нелинейное программирование.
Напомним, что в случае г = 0, т. е. в том случае, когда задача сводится к классической задаче нахождения условного минимума, f называется стационарной в точке х£А,в которой связи регулярны, если выполнено условие (б). Это условие в данном случае сводится к
_ q	~
Г (*) = S мДф'У (к).
Соответствующее значение f называется стационарным значением.
3. ДОСТАТОЧНЫЕ УСЛОВИЯ В НЕЛИНЕЙНОМ ПРОГРАММИРОВАНИИ
Мы установим последовательно достаточные условия для глобального минимума, основанные на предположении о выпуклости (теорема 4), а затем достаточные условия для локального минимума, выраженные с помощью вторых производных (теорема 5). 282
Наконец, теорема 6 позволяет исследовать вариации минимума, достигаемого функцией при бесконечно малых приращениях параметров а' и (У2, определяющих связи и ограничения. Она является существенной для интерпретации множителей.
В следующем предложении устанавливается представляющее большой интерес взаимоотношение понятий опорной гиперплоскости и касательной гиперплоскости в том виде, как оно вводится в классическом дифференциальном исчислении.
Предложение 1. Пусть g— непрерывная выпуклая функция, дифференцируемая в точке х пространства Rm. Предположим, что g' (х) + 0. Тогда множество А в пространстве /?т, заданное неравенством g’(x)^g(x), выпукло и существует (и притом только одна) опорная гиперплоскость для Д, проходящая через х. Ее уравнение
g' (х) (х — х) = О (касательная гиперплоскость к гиперповерхности g (х) = g (х) в точке х).
Множество А располагается в полупространстве g' (х) (х — — х) 0.
Доказательство. Предположим, что х 0 и g (х) = 0. Пусть А — выпуклое множество, заданное неравенством g (х)	0. По-
кажем, что 0 есть граничная точка множества А. Пусть, в самом деле, A G R,n и g' (0) (h)	0. Тогда
(«) g (th) = +/g' (0) (/i) + 0(0. -
Следовательно, существуют сколь угодно близкие к 0 точки, в которых g (х) > 0.
Тдгда существует, по крайней мере, одна опорная гиперплоскость Н для А, проходящая через х. Если бы Н содержала вектор h такой, что g' (0) (h) = 0, то Н содержала бы (в силу соотношения (а)) точки х такие, что g (х) < 0, что невозможно, ибо такая точка является внутренней точкой для Д, а множество внутренних точек для А не пересекается с Н. Следовательно, гиперплоскость Н задается уравнением g' (0) (х) = 0. С другой стороны, если g' (0) (A) < 0, то существуют такие положительные значения t, что g (th) < 0. Следовательно, замкнутое полупространство, в котором расположено Д, есть полупространство, задаваемое неравенством g' (0) (х)	0.
Предложение 2. Пусть g — непрерывная выпуклая функция, дифференцируемая в точке х пространства Rm. Если gf (х) = = 0, то g достигает в х нестрогого минимума.
283
Доказательство. Можно предполагать, что х = 0 и g (х) = О Пусть z £ R. Пусть А — множество в Rm+\ задаваемое неравенством g (х)—г 0. По предложению 1, существует опорная гиперплоскость для Л, проходящая через 0 (и описываемая уравнением г = 0), и А расположено в полупространстве z 0. Таким образом, из неравенства g (х) — z 0 следует неравенство z 0. Подставляя z = g (х), получаем g (х)	0 для лю-
бого х£ Rm, что и требовалось доказать.
Теорема 4. Предположим (в общих обозначениях), что функция f выпукла, функции ф/ линейны, а функции ф^ вогнуты и в некоторой точке х£ Д существуют числа jut/ (/ = 1, . . q) и vk (k = 1, . . ., г) такие, что
(a)	vk ^0, vk = 0 для k $ Д (х);
_ q	~ г	~
(б)	f(*) = S h/(<pO'W + E Vfe(4*)' (х).
/=1	k—l
Тогда f достигает в точке х нестрогого глобального минимума на Д.
Доказательство. Предположим, для простоты, что aJ = 0 (у/) и Р = 0 (у&). Пусть
q	г
ф = f — S imp' — S М1*.
/=1	k=A
Функция Ф выпукла и, кроме того, Ф' (х) = 0. Следовательно, Ф достигает в х нестрогого глобального минимума. В точке х имеем Ф (х) = f (х) и для х£ Л : Ф (х)	/ (х). Следовательно,
f достигает в х нестрогого минимума на Д.
Начиная с этого момента, мы будем предполагать, что функции Д ф/ (/ = 1, . . ., ^), г|? (k = 1, . . ., г) дважды непрерывно дифференцируемы.
Теорема 5. Предположим (в общих обозначениях), что в некоторой точке х£Д:
(I)	связи и ограничения регулярны;
(II)	существуют числа Ц/ (/ = 1, . . ., q), vk (k = 1, . . ., г), удовлетворяющие условиям (а) и (б) теоремы 3;
(III)	обозначая через К' множество значений k таких, что № =£ О (k' С k (х)) и через 2R — векторное подпространство, образованное из векторов h, удовлетворяющих условиям
(ф'У (х) (А) = 0 для j = 1, ..., q\
(ф*У (х) (h) = 0 для k£ Д', имеем
Ф" (х) (/г) (Д) > 0 для любого ЭИ, =£0ч
284
Тогда f достигает в х строгого локального минимума на Д.
Доказательство. Можно предполагать для упрощения, что а/ = 0 и Р* = 0 (у/, k). Если / не достигает в х строгого локального минимума на Д, то существует последовательность {хд} точек /?т, удовлетворяющих следующим условиям:
С
. lim х„ = х\ п->,+со П
f (х„) f (х).
В силу компактности единичной сферы,{ можно сверх того, предположить, что выражение ' Хп ~х- стремится к некоторому
|| Хи — X ||
пределу h при п —> + оо. Тогда окончательно имеем
<Р' (х„) = О (V/ = 1, . .	7);
Ф* (хп) > о (V# = 1. • • •, 0;
lim х„ = х;
lim	= /г 0;
Zl^+co ||х„ — хЦ f (хп) < f (х).
По условию (б) теоремы 3 имеем
Г W (Л) = S И/ (ф')' W (h) + S Ук (Ф*)' (х) (h), /=1	k£K'
что сводится к условию
f(x)(h) = S vk(tf)'(х) (h).
к£К'
С другой стороны, из соотношения
Я’* (хп) 3= 0 (\М = 1......г)
вытекает, что ф* (х„) ф* (х)	для К (х).	Отсюда
(ф*)' (х) (/г) 5» 0 для k С К. (х) и, тем более, для k £ К'
1.	Предположим, что производные (ф*)' (х) (/г) для К' не все равны нулю. Тогда (поскольку t> 0 для k^. К') .' (х) (Л) > 0. Но имеет место следующее разложение:
- f (хп) = f (х) + f (х) (/г).|| х„ — х || + о d| х„ — х ||).
285
Мы получим, следовательно, f (хп) > f (я) для достаточно большого н, что противоречит предположению.
2.	Предположим теперь, что производные (i|?)' (я) (Ji) %ля
К' все равны нулю; другими словами, h^3Jl. Так как
Ф' (я) = 0, то можно написать следующее разложение:
Ф (яд) = Ф (я) + Ф" (я) (/г) (Ji) .|| хп - я II2 +
+ о (|| Хп — X II2).
Следовательно, для достаточно большого п
Ф (ял) > Ф (я).
Но Ф (я) f (я) для любого я С А и Ф (я) = f (я). Отсюда окончательно получаем: f (хп) > f (я) для достаточно большого п, что ведет к противоречию. Доказательство тем самым завершено:
Условие (III) предыдущей теоремы приводит к постановке следующей задачи: при каких условиях квадратичная форма, индуцированная в некотором векторном подпространстве квадратичной формой Q (я), является положительно определенной. Прежде чем исследовать эту задачу, дадим некоторые определения и свойства, относящиеся к квадратичным формам. Пусть Е — евклидово векторное пространство конечной размерности т и пусть Q — квадратичная форма в Е. Тогда существует симметрическое пре-5 образование А на В и притом одно, такое что
Q (я) = (я, Ах).
Собственные значения преобразования А называются тонами квадратичной формы Q. Если	— моды для Q и если S —
ортонормированный базис пространства Е, то
т
Q(x) = S М4)2.
Z=1
Для того чтобы Q была положительно определенной, необходимо и достаточно, чтобы моды для Q были строго положительны. В двух приводимых ниже леммах Rm рассматривается с естественной евклидовой метрикой.
Лемма 3. В пространстве Rm моды квадратичной формы Q (я) = хАх (где А = А) суть стационарные значения для Q (я) на сфере яя = 1.
Доказательство. Для того чтобы Q была стационарной на сфере хх ~ 1 в точке я, необходимо и достаточно, чтобы существовало % 6 R такое, что
Q' (я) dx — hd (яя),
286
т., е.
2хЛ dx = 2Хх dx, или
хА = кх, или, наконец, -
Ах = Хх.
Тогда
хАх = х (Хх) = кхх = X, чем завершается доказательство.
Лемма 4. Пусть в, пространстве /?т дана квадратичная форма Q (х) = хАх (где А = Л) и пусть В —. линейное преобразование из Rm в Rp ранга р (В есть матрица из п строк и р столбцов, строки которой линейно независимы). Модами сужения квадратичной формы на подпространство поу (В) служат решения уравнения
det [ -" Л ~| = О
QeLL в I О J
Доказательство. Положим
По лемме 3, искомые моды суть стационарные значения квадратичной формы Q на многообразии [хх =1, Вх = 0). Для того чтобы Q была стационарной в некоторой точке х этого многообразия, необходимо и достаточно существования X € R и р = = [рх, . . ., рр]С (Rp)' таких, что
Q' (х) dx = kd (хх) + 2рВ dx,
т. е.
(а) хА = Кх + рВ, или
Ах = Хх + Вр.
Предположим, что это условие выполнено; тогда
С(Х) [4-] =	= °-
Р
Следовательно, det С (X) = 0 и
Q (х) = хЛх = х (Хх + Bp) = X.'
287
Таким образом, любое стационарное значение квадратичной формы Q на многообразии [хх = 1, ^х = 0} является решением уравнения det С (X) = 0.
Обратно, предположим, что det С (X) = 0. Учитывая, что это уравнение могло бы априори иметь комплексные корни, будект рассматривать- С (X) в пространстве Ст. Для любой матрицы М через М будем обозначать матрицу такую, что (Л4)/ — М{. Тогда существуют х С Ст и р £ Ср такие, что
[4-]=?ьо и сш[4-] = о,
L м- J	L м J
откуда следует	/
( (X-Л)х +Вр^О;
(р)	1
.	I Вх = 0.
Если бы х — 0, то Вр = 0, откуда р = 0 (ибо из предположения rang (В) = р вытекает поу (В) = 0), что исключено. Значит, х =# 0. Умножим первое из равенств (0) слева на х. Получим
х (X — Л) х + хВр = 0, т. е.
Кхх = хАх. .
Так как величины хх и хАх действительны (напомним, что А = Л), то X действительно. Можно, следовательно, предполагать, что х и р действительны. Можно, кроме того, так выбрать х, чтобы хх =‘1. Тогда х принадлежит многообразию {хх = 1, Вх = 0}. Условие (а) выполнено, поэтому Q стационарно в точке х на этом многообразии. Кроме того,
Q (х) = хЛх = х (Хх + Bp) = X.
Таким образом, X—стационарное значение квадратичной формы Q на многообразии {хх = 1, Вх = 0), что завершает доказательство.
Следствие. Если.сужение квадратичной формы на подпространстве -поу (В) положительно определено, то
,,, Г А I в 1 . п ( [ в | о ] 0-
Будем теперь варьировать параметры a, 0, Допустимое множество мы будем • обозначать через А (а, 0). Для любого х£ А (а, 0) через К (х, 0) будем обозначать множество, определенное следующим образом:
, k е К (х, 0) <=) г|? (х) = 0fe.
288
Теорема 6. Предположим, что для частных значений а0, Ро параметров аир существует точка х£ Л (а0,_ р0) такая, что выполняются следующие условия:
(I) связи и ограничения регулярны в х0\
II) существуют числа р/ (/ = 1, . . ., q), v* (k = 1, . . ., л), удовлетворяющие условиям (а) и (б) теоремы 3;
(III) =£ 0 для всякого К (xQ, Ро);
(IV) выполняется условие (III) теоремы 5.
Тогда существуют открытые окрестности A, U, V точек х0, а0, Ро такие., что для а £ (/, PC V выполняются следующие условия:
(а)	сужение на А П А (а, Р) функции f достигает (единственного) строгого минимума в точке х = 0 (а, Р);
(б)	функция 0 непрерывно дифференцируема;
(в)	в точке х выполняются условия (I) — (IV) настоящей теоремы;
(г)	множество Д (х, Р) не изменяется;
(д)	множители Х7 и р/г являются непрерывно дифференцируемыми функциями от а и Р;
(е)	значение z = f (0 (а, Р)) минимума функции f является непрерывно дифференцируемой функцией от а, р и
_ q ~ г ~
dz=Yi Pjdai + /=i
т. e.
dz = p da + v d$.
Доказательство. Можно предполагать, что A, U, V выбраны таким образом, что для х£ А, U, P6V, Д (х0, р0) имеем ф* (х) > pfe. Следовательно, можно предполагать, произведя, если нужно, замену обозначений, что К (х0, ро) = {1, . . ., г). Предположим, кроме того, что А выбрано так, чтобы производные (<р/У (х) и (Ф^У (х) Для любого х£А были независимы. Тогда из условий (а) и (б) вытекают соотношения
(5)
0) Г (х) — нф' W —	(*) = 0;
(2) <р (х) = а;
(3)vfthH*)-₽*] = 0 (fc=l.......г).
19 р. Паллю де Ла Барьер
289
Продифференцируем эту систему в точке х0- Получим
(5')х
(Г) f" (х0) dx — ц°ф" (х0) dx— dp • <р' (х0) — v°ip" (x0) dx — — dv-ty' (х0) = 0;
(2')	ф' (x0) dx = da;
(3') v°k [Gl?)' (x0J dx - d$k] + [№ - >5] dvk = о
(v = 1, - - -, Г),
т. е.
(S')a
(Г) Ф" (х0) dx — du-ф' (х0) — dv г|/ (х0) = 0; (2')	<р' (х0) dx = da-,
(3') (ip)' (х0) d~x — df = 0 (у А = 1,	, г),
или еще (транспонируя, в частности, левую часть равенства (Г)):
(£')з
(Г) Ф" (х0) dx — <р' (х0) dfi —(х0) dv = 0;
(2') <р' (х0) dx — da;
(3') гр' (х0) dx = dp.
Эти соотношения имеют вид
($')<
где
dx dv
’О']
da
Н — симметрическая матрица, определенная следующим образом:
Ф" (х) (/ix) (/i2) = hyHhi т. е. матрица из элементов
Тогда
Ф" (х0) dx = Hdx. 290
Ho ff обратима (следствие леммы 4). Следовательно, существуют открытые окрестности Л, (7, V точек х0, а0, р0, удовлетворяющие предварительным соглашениям, изложенным в начале доказательства, и такие, что для х£ Л,а£ U, р£ V система (S) однозначно разрешима относительно неизвестных х, jut, v, т. е. эквивалентна соотношениям вида
х = 0 (а, Р);
fx = М (а, Р);
v = N (а, Р).
При этом функции О, Л4, N непрерывно дифференцируемы. Уменьшив в случае необходимости A, U, V, можно предполагать, что > 0 (у А = 1, . . ., п) (поскольку р,® > 0). Имеем, следовательно, <р* (х) == р* (у /г), что доказывает, в частности, что х С А (а, Р) и что никакое ограничение, насыщенное в х0, не перестает оставаться насыщенным, когда аир варьируются в U и V.
Наконец, можно предполагать, по-прежнему за счет возможного уменьшения Л, U, V, что условие (III) теоремы 5 выполняется в любой точке х. Следовательно, f достигает на Л П А (а, Р) единственного строгого минимума в точке х. Пусть 2 = f (х) этот минимум.
Умножая обе части (S')4 на [0|g°| v°], получим
(х) +	(х0)] dx — ц° da -j- v° dp,
т. e.
f' (x0) dx = |x°da + v°dp, или, наконец:	-	'
dz — g°da + v°dp.
Соотношение dz — jut da + доказанное для x0, остается справедливым в любой точке х = 6 (a, Р), поскольку в ней продолжают удовлетворяться все предположения настоящей теоремы. Таким образом, теорема доказана.
Дополнение. Теорема о седловой точке
Говорят, что функция от двух переменных х, у —> F (х, у), определенная для хЕ Л и у£ В, имеет седловую точку х, у, если выполняются неравенства
F (х, у) F (х, у) F (х, у) (ух£А, уе В) или обратные неравенства.
19*	291

По форме условия (а), содержащегося в ней, нижеследующую теорему часто называют теоремой о седловой точке. Онащает новый вид условий оптимальности в «выпуклом программировании» (нелинейном программировании при надлежащих предположениях о выпуклости). Мы приводим ее здесь потому, что на нее очень часто ссылаются в литературе. Для большего удобства мы откажемся от общих обозначений.
Теорема о седловой точке (Куна и Таккера). Пусть f— выпуклая функция, определенная на Rn со значениями в Л, gl 0’ = 1, . .	р), h*' (j = 1, . . ., q) — вогнутые функции,
определенные на Rn со значениями в R. Обозначим через А множество точек х Е Rn таких, что
(х)	0 (i = 1, . . . , р), h’ (х) > 0 (/ = 1, . .	q).
1. Предположим, что функции /, gl, h' непрерывно дифференцируемы, х£ А, ограничения регулярны в х и f достигает минимума на А в точке х. Тогда существует X = [Х1? . . ., Хр] О такая, что функция
Ф(х, X) = f(x)-SXfg‘(x)==f(x)-Xg(x)
Z=1
удовлетворяет следующему условию:
(а)
Ф (х, X) < Ф (х, X) < Ф (х, X)
для любого х, удовлетворяющего Ю (х)	0 (/ = 1, ..., <?),
и любого X >> 0.
2. Обратно, если (х)	0 (/ = 1, . . ., #) и условие (а)
выполнено, то х £ А и f достигает минимума на А в точке х.
Доказательство. 1. Для того чтобы f достигала в х минимума на А, необходимо, чтобы существовали X = [Хх, . . . , Хр] и М* =	• • • > такие, что
Г (х) = S К (gl) (х) + S У/ W (х);
I	i
X 5» 0, ц 5s 0; Xz = 0, если gl (х) > 0; = 0, если h! (х) >> 0.
Следовательно,
ФДх, X) =	(х).
292
По теореме 4 частичное отображение х —> Ф (х, X) достигает В х глобального минимума на множестве всех х таких, что h! (х) Зг 3s 0, откуда Ф (х, X) ==g Ф (х, X), V х> удовлетворяющих h' (х) 3s 3s 0 (/ = 1, . . ., <?).
С другой стороны,	*
Ф (х, X) — Ф (х, %) = S (X, - XJ g (х) = (X - X) g (х),
i где
g (х) Зэ 0 и Xg (х) = О, откуда
Ф (х, X) — Ф (х, X) 0 для X 3s 0.
Следовательно, условие (а) выполняется. -
2. Предположим, что условие (а) выполнено. Рассмотрим условие
Ф(х, X) — Ф(х, Х) = (Х — X)g(x)>0 v^O-
Устремляя ‘ki к +оо и полагая остальные компоненты X равными нулю, получаем g‘ (х) з= 0; следовательно, g (х) 33 0 и хС А. С другой стороны, полагая X = 0, получаем Xg (х) eg 0, откуда (поскольку X 0) Xg (х) = 0.
Тогда для всякого хЕ А
f (х) > Ф (х, X) > Ф (х, X) = f (х), что завершает доказательство.
Замечания I. Чаще всего эта теорема применяется в следующих двух случаях: a) q~ 0; б) q — п и неравенства h! (х)	0 имеют вид х 0 (j = 1, . .	п).
Тогда условие (а) выглядит так:
Ф(х, Х)^Ф(х, 1)^Ф(х, I)
для любого х 0 и любого %	0.
II. Во второй части теоремы о седловой точке предположения о дифференцируемости функций f, gl, h1 не используются. Аналогичные формулировки без предположения о дифференцируемости можно дать также и для первой части (см. например, работу [49], теорема (7—1—1)).
ГЛАВА 14
ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Мы ставим своей целью изучить некоторые свойства множеств, определяемых с помощью конечного числа линейных равенств и неравенств. Будем при этом пользоваться общими обозначениями предыдущей^ главы.
Обозначим через А множество в определяемое соотношениями
ф' (х) = а'	(/ = 1, . . . , q)\ ,
Ф*(х) >	(i = 1, . .	г),
где функции ср' и ф& — линейны. Крайние точки такого множества часто называют вершинами.
Предложение 1. Пусть х £ А и пусть К (х) — множество индексов k, для которых ф* (х) = 0*. Линейное многообразие G- , порожденное гранью F~ точки х, определяется соотношениями
X
<р'(х) = а' (/ = 1, . . ., <?);
ф*(х)=0*
Доказательство. Мы можем предполагать, что х = 0, а' = = 0(/ = 1, . . ., с?) и что, следовательно, р = 0 для k£ Д (х). Пусть D — прямая, проходящая через 0 параллельно вектору h + 0.
Если <р' (/г)	0, то D П А = {0}, откуда D $ G-.
’ Если ф* (/г) > 0 для k С Д (х), то ф* (th) < 0 для t < 0 и, значит, D (£ G-.
.	X
Если (/i) <0 для К (%), то аналогично D $ G-.
Таким образом, если D G G-, то обязательно
X
<p/ (h) = 0 (/ = 1, . . ., q) и Ф* (h) = 0 (k е К (х)).
294
Обратно, если, эти соотношения удовлетворяются, то
Ф/(/й) = 0(/ = 1.........9);
Я? (th) = 0 (k € К (х))
для любого t£R
и
т|? (th) р k $ К (х) для достаточно малых t.
-Следовательно, х — внутренняя, в широком смысле, точка множества A П D и D С G^,
Следствия. I. Для того чтобы точка х£ А была крайней, необходимо и достаточно, чтобы уравнения '
<р'(х) = 0 (j	q)
i|?(x) = 0 (k£K(x))
допускали только нулевое решение.
II.	Если х — крайняя точка для А, то существует, по крайней мере, т — q насыщенных ограничений.
III.	А обладает не более чем конечным числом крайних точек.
IV.	Выпуклая оболочка крайних точек компактна..
Предложение 2. Пусть Ао — выпуклая оболочка множества крайних точек для А и пусть f — линейная форма. Если А не содержит никакой прямой, то имеет место следующая альтернатива: или f не ограничена снизу (соответственно сверху), или же min f (х) = min f (х)
х£Д0 (соответственно max/ (х) = max / (х)). Х^Д0
Если Сд — асимптотический конус для А, то в первом случае существует h Е Сд такое, что f (h) <0 (соответственно / (h) >0); во втором случае f (h)	0 (соответственно f (h)	0)
для любого Zig Сд.
Доказательство. Заметим, что поскольку Ао компактно, то f ограничена на Ао и достигает своей нижней границы на Ао. Если существует такое h б Сд, что f (h) < 0, то для х Е А и t 0 х + th С А и f (х + th) = f (х) + tf (h), откуда выводим
lim f (х + th) = —оо/
Следовательно, f не ограничена, снизу на А.
Предположим теперь, что f (h)	0 для всякого /г^Сд.
Пусть х£А. Существует XjEAq.h h(z Сд такие, что х = = xt + h. Тогда f (х) = f (Xi) + f (h), а следовательно, f (x)^s f (Xi) И
inf f (x) min f (x) x Д x До
295
В силу тривиального обратного неравенства обе части равны, это доказывает, что f достигает своей нижней границы на Д и что эта нижняя граница равна минимуму функции f на До.
Следствие. Если Л не содержит прямой и если f ограничена снизу на Л, то существует крайняя точка, в которой f достигает своего минимума.
Замечание. Асимптотический конус множества А задается соотношениями ^/(/0=0 (/= 1,
0 (fi= 1, . . ., г).
2.	СИМПЛЕКС-МЕТОД
Мы изложим сейчас один классический метод решения задач линейного программирования, называемый симплекс-методом' Этот метод существует в нескольких вариантах. От него произошли многочисленные более усовершенствованные методы. Их изложения можно найти в специальной литературе.
Линейные программы часто представляют в одной из следующих форм.
Программа I. Максимизировать линейную форму их на множестве
( ах	Ь;
| х	0,
где
xGR'\ b£Rp, a£L(Rn, Rp) и «б (/?")'•
Программа II. Максимизировать линейную форму UX на множестве
АХ = Ь;
X 0,
где
X^Rn+p, b£Rp, A^L(R'l+p, Rp) и (Rn+p)'.
Форму I можно свести к форме II следующим образом: введем свободные переменные х1 = Ь1— а!х. Иначе говоря, положим
Тогда условие ах b -перейдет в / ^С.
296
Образуем матрицу А = fa| 1 ] и вектор-столбец (высоты и + р) X =	• Тогда, по определению,
( АХ = Ь;
( Х^О.
Положим U = [ц| 0] £ (/?га+р)'. Тогда UX = их. Следовательно, задача сведена к форме II.
Пример. Программу
Юх1 + 6х2 + Зх3 100;
2Х1 + Зх2 + 7х3	100;
х1, х2, х3 0
max х1 + х2 + х3
можно представить в виде
' ЮХ1 + 6Х2 + ЗХ3 + X4 = 100;
2Х1 + ЗХ2 + 7Х3 + Хб = 100;
X1, X2, X3, X4, Х5^ 0;
max' X1 + X2 + X3.
Заметим, что как в форме I, так и в форме II допустимое множество А не содержит прямой. Следовательно; применимо предложение 2.
Дадим условия оптимальности для программ в форме I и в форме II. Для этого достаточно применить теорему 2 гл. 13.
Условие оптимальности для программы I. Для того чтобы допустимая точка х была оптимальной, необходимо и достаточно, чтобы существовали (Rp)' п (Rn)' такие, что
и = va + w;
v(b— ах) — 0;
wx = 0;
иначе говоря, чтобы существовало v£ (Rp)' такое, что и — va < 0;
v 0;
v (Ь — ах) = 0;
. (и — va)x = 0.
297
Условие оптимальности для программы II. Для того чтобы допустимая точка X была оптимальной, необходимо и достаточно, чтобы существовали v£(RpY и wG(/?n+p)', такие, что
U = vA + w;
w 0;
(U — vA) X = 0;
иначе говоря, чтобы существовало v£ (/&>)' такое, что
U — vA ==£ 0;
(U — vA) X = 0.
Рассмотрим разбиение матрицы А вида
где Ау — обратимая матрица. Положим X = АХ = b перепишется в виде
L х* J
. Уравнение
A Xv + A Xv = Ь. v
Оно допускает частное решение
XV 1 _ Г
ХУ J “ [ 0
Если АуХЬ 0, это решение допустимо, т. е. принадлежит А. Кроме того, оно является вершиной допустимого множества, . ибо система
АХ = 0;
XV = 0 (откуда, следует AyXv = 0) допускает только нулевое решение.
Обратно, пусть X — вершина для А и пусть 6 — носитель для X (множество индексов i таких, что X1 =1= 0,) Известно, что 6 содержит самое большее р индексов. Система
0 допускает только нулевое решение; следовательно, столбцы Лб независимы. Значит, существует множество у из р индексов, такое, что 6 с у и что А — обратима. Так как ХУ = 0, то
о
Л7
298
Теперь заметим, что если К — обратимая матрица, то условие АХ = b эквивалентно условию КАХ = КЬ. Следовательно, программу II можно представить в виде
КАХ = КЬ; Х>0, max UX,
т, е.
А'Х = Ь';
Х>0;
max UX,
Мы будем говорить, что программа- представлена в' канонической форме, если
А = [Д7| Дт], где Ду = 1 и b 0.
С каждой канонической формой связана вершина
Пусть, отправляясь обратно от формы II, имеем А — [Д?| Д^], где Д? — обратима, А^Ь ^0 и
А*
’ ЛТ1* ’
L х* .
соответствующая вершина. Положив К = Ду \ придем к канонической форме
А'Х
II' А' 0, max UX,
где
Д' = [Ду|Д^= [1|Д7Ч]’ ь' = А^Ь.
Вершина X = шением.
по-прежнему является допустимым ре-
Каноническая форма называется вырожденной, если b содержит нулевые компоненты.
Мы будем теперь предполагать, что программа представлена в невырожденной канонической форме. Заметим, что если про-грамма^П была получена из программы I введением свободных переменных и если b 0, то она уже окажется в невырожденной канонической форме.
Проверим, является ли соответствующая вершина X оптимальной. Имеем
’ 3?

299
Применим общее условие оптимальности. Для того чтобы X было оптимальным, необходимо и достаточно, чтобы существовало v Е (7?р)' такое, что
( U — vA ==£ 0;
| (U — vA) X = 0.
Второе условие можно также записать как (U — щ4)у = 0, т. е. Uy — v = 0. Следовательно, необходимое и достаточное условие оптимальности записывается в виде
U — UyA^Q.
Оно, впрочем, сводится к виду — UyAy sg 0. Мы можем вывести его непосредственно. Уравнение АХ = b перепишем в виде
Xv + A-Xv = b, откуда
Xv b — Я-ХЪ
Тогда
X = UyXv + и-ХУ =
= v(&_x-xv) + t/-xv = = Uyb + (U- - UyAy) XV.
Но поскольку мы предположили b > 0, то решение X остается допустимым при достаточно малом Ху 0.
Если U- —	0, то UX Uyb, причем при X = X
имеет место равенство. Следовательно, X оптимально. Легко видеть, что максимум в X является строгим тогда и только тогда, когда
Щ - ЩА- « 0.
Если Uy —	0 не выполняется, то существует индекс
е^у такой, что
Ue — UyAe > 0.
Полагая X1 = 0 для i £ у и отличного от е и полагая Xе > 0 достаточно малым, чтобы еще выполнялось X7 0, получим UX > UУЬ, и X оказывается не оптимальным.
Итак, мы снова получили сформулированное ранее условие оптимальности. Кроме того, мы получили способ улучшения ре-300
шения. В самом деле рассмотрим индекс1 * е^у (называемый вводимым индексом) такой, что
Ue - UyAe > О,
и положим Xi = 0 для i £ 7, отличных от е. Получим
Xv = b — АеХ\
откуда
их = иуЬ +	— иуАе) X*.
Нам выгодно, следовательно, выбрать Xе возможно большим при условии; что будут выполняться неравенства Xv 55 0, т. е.
X7 (/) == Ь1 — ХеА!ё 0 для любого j = 1, ..р.
Если Ае «С 0, то это условие выполняется, каково бы ни было Xе 0; следовательно, UX не ограничено сверху на А. .Для любого j такого, что Ае > 0, должно иметь место Xе	Ь*/А{.
Пусть <т — значение /, для которого ЬЧА[ принимает свое наи-bG
меньшее положительное значение. Положим Xе = — и получим в результате X7 (<*) = 0. Индекс s = у (о) называется выводимым индексом. Пусть у' — множество индексов, полученное из у заменой s на е. Получаем новое решение
Х' =
= 0.
С ним можно связать новую каноническую форму
А'Х^ Ь'\
X 0; max UX,
где
Л' = КА; Ъ = КЬ-, К = А^; Л'=[1|Л^].
Очевидно, что
X7' = У.
Если выбранный индекс s является единственным индексом, для которого tf/ALe принимает свое наименьшее положительное значение, то bf 0 и новая каноническая форма будет невырожденной. В противном случае получается вырожденная каноническая форма. Применение симплекс-метода потребует тогда
1 На практике можно выбирать индекс е таким, чтобы Ue—U jAe было
максимальным. Но это правило ни в коей мере не является обязательным.
301
некоторого его усложнения, которое мы здесь'обсуждать не будем. Итак, мы предположим, что получена новая невырожденная каноническая форма. Применим к ней критерий оптимальности. Если X' оптимально, то процесс окончен. В противном! случае или UX не ограничена сверху, или X' может быть улучшено. Получаем последовательность вершин для А, причем вычисления заканчиваются, если получена оптимальная вершина, или если обнаружилось, что UX не ограничена сверху на А.
Разберем теперь последовательность вычислений и расположение промежуточных результатов. Матрица AV' отличается от матрицы 1 только одним столбцом. Нам потребуется поэтому следующее правило.
Правило. Пусть дана матрица
1
О
О
а^-1
aJ
= [81|.. • |ем|а\
1е/+11 • • • 18Р].
ар
/-й столбец
Тогда, если а}- =/= 0, то М обратима и
—cA/ai
—ар/а
Чтобы доказать это правило, достаточно проверить, что М~ХМ — 1. Эта проверка предоставляется читателю.
302
Опишем тейерь переход от одной канонической формы к следующей. Вычисления _ могут быть представлены схематически следующим образом: столбцы А (и U) разбиваются на две группы: группу столбцов, индекс которых принадлежит у, и группу столбцов, индекс которых принадлежит у. На практике эти две группы перемешаны. Чтобы их разделить, потребовалось бы при каждом шаге процесса много переписывать, что сильно увеличило бы вероятность появления ошибок. В группе столбцов, индекс которых принадлежит у, нужно различать столбец с индексом s, а в другой группе — столбец с индексом е.
Индексы столбцов:

I = у (/)
i =j= s
Ut
s = y(a) Us
i' <=?
ir e
Ui’-
e
ue ...];
Д = [... 18/|... |e°|... IAJ ... I Ae I.. .][&];
[(/?] UyA = [.;.. | Ut |... | Us |... |	|... | t/TA |...] [t/yB] = UX,
[/<] /<д = д' = [...|8/|...|Л|....|д;ф..|8О|...пП
где
— A\lAe
— Aae~4Ae
1/Л
8o+l

-APe/Ae
Каждая компонента Ar является произведением строки К, находящейся слева от нее, на столбец Л, находящийся над ней.
Пример. Решим с помощью симплекс-метода следующий очень простой пример:
10X1 + 6X2 + зхз +	100;
2X1 + ЗХ2 + 7Х3 + Хб 100 ;
Xi, X2, X3, X4, Х^0; max Xi + X2 + X3.
303
Последовательность вычислений будет такой:
Г 01
।
о
У= {4,5} Х = г 1 J 10 8
J 0 0_
10“
0 0
О
О
у" = {1,3} X"
- 6,24“
О
1 2 О
О
г" = 2, о=1,
Y'" = {2,3} X

s" = 1
“ 0 ~
12,11
9,09 О
_ О
X* оптимально
С/у = [0	0]
_ ’ 0,1	О'
.—0,2	1_
^==[1	0]
Г1 о,О47 Л =
.0	1,156
С7у- = [1	1]
•„/>94 О'
.—0,547 1.
t/Y"' = [l 1]
С/= [1 1		1 0 0]		
А =	'10	6	3	1
	.2	3	7	1
С/уД =	[0	0	0	0
. А' =	“1	0,6	0,3	0,1
	.0	1,8	6,4	—0,2
А' =	41	0,6	о,з	0,1
Л" =	”1	0,5155	0	0,1094
	_о	0,2820	1 	-0,0315
UrA" =	[I	0,7975	1	0,0779
А’" =	’1,940	1	0	0,2125
	.0,547	0	1 -	-0,0912
UrA"' =	[1,393	1	1	0,1213
0,047
0,156
—0,0912
0,1816.
0]	[10] = С/Х';
6,24
12,50.
0,109]	[18,74] = С/Х";
12,11
9,09.
= Ь\
0,0904]	[21,20] = С/Х'"

Замечания.
I. На первом этапе имеем Ue — UyAe — 1, каково бы ни было е £ у. Пра* вило «взять е^у такой, чтобы Ue—UyAe было максимально», не позволяет сделать выбор между различными возможными значениями е. Можно было бы выбрать е таким, чтобы Xе было возможно большим. Это было бы справедливо при е— 2. Читатель может убедиться, что оптимальная вершина достигается при этом за два шага вместо трех.
II. Рассмотрим программу, представленную в следующих двух эквивалентных формах:
' АХ=Ь\ ( (КА) Х -^ КЬ;
- Х^О; и <	Х>0;
max UX	max UX, 
где X — обратимая матрица.
Условие оптимальности X записывается для первой формы: существует v такое,, что	"
Г U — vA^Q,
{ (U — vA)X=0;
для второй формы: существует v такое, что
Г U — vf (КА) 0;
I (U — v'KA) X = 0.
Следовательно, соотношение v = vf К каждой форме V, удовлетворяющей первому условию, ставит в соответствие форму v', удовлетворяющую второму, и наоборот.
Предположим, что обе формы — канонические и невырожденные, причем
Д = £Ду| Ду^ , .4^	1
и	~
Д'- ГД |Д-/1, Д - 1.
L v I v J v
Мы знаем, что v' = U^,. Тогда vA = v'A', откуда
v = vAv = (vA\ = (v'X')v = (Ут-Л')у.
Применим этот результат к .рассмотренному примеру. Учитывая разницу’ в обозначениях, получим v = (U^,Af,r) , т. е. v— [0,12 0,09].
3.	ДВОЙСТВЕННОСТЬ
Теорема 1 (теорема двойственности). Пусть
Л G А (Яп, /?₽), xG Rn, b^Rp, ue (RnY-
, Рассмотрим две программы (называемые двойственными)
	ах ==£ Ь;	va^u\
(I) •	х 0;	(I*)	v 0;
	max их;	minyfe.
20 р. Паллю де Ла Барьер
305
id
Имеют место следующие свойства:	,	1'
1.	Если х и v — два допустимых решения программ (1)и (1*),	
то
их vb.
2.	Если программы (I) и (I*) обладают допустимыми решениями, то они обладают и оптимальными решениями.
3.	Если программа (I) обладает оптимальным решением, то это верно и для программы (I*), и обратно.
4.	Для того чтобы два допустимых решения х и v программ (I) и (I*) были оптимальными, необходимо и достаточно, чтобы
их = vb.
5.	Если х — оптимальное решение программы (I), то оптимальные решения программы (I*) суть допустимые решения и, удовлетворяющие уравнениям
(и — ш) х = 0;
v (Ь — ах) = 0.
6.	Если v — оптимальное решение программы (I*), то оптимальные решения программы (I) суть допустимые решения х, удовлетворяющие уравнениям
(и — va) х = 0;
v (Ь — ах) = 0.
Доказательство. 1. Пусть х и v — два допустимых решения программ (I) и (I*). Тогда
(а) их vax vb..
В самом деле, из неравенств и	va и х	0 следует их	vax-,
в то же время из неравенств ах	b и v	0 следует vax	vb.
2. Если программы (I) и (I*) обладают допустимыми решениями, то множество значений их для допустимых х ограничено сверху*; следовательно, их достигает максимума на допустимом множестве' программы (I).
Точно так же множество значений vb для допустимых v ограничено снизу и, следовательно, vb достигает минимума на допустимом множестве программы (I*).
3. Пусть х — оптимальное решение программы (I). Существует v 0 такое, что
и — va 0;
v (Ь — ах) = 0;
(и — va) х =0.
306
Тогда v — допустимое решение программы (I*), и неравенства (а) превращаются в равенства. Итак, их = vb. Отсюда следует, что v— оптимальное решение программы (I*). Мы видим, кроме того, что если программы (I) и (I*) обладают допустимыми решениями, то
max их = min vb.
(Р)	f ax^b	f va^u
I x>0	I u>0
С другой стороны, если программа (I*) имеет оптимальное решение v, то-существуют два множителя х С Rn и у С Rp такие, что
х 0; у у? 0; b = ах + у\
(и + va) х — 0; vy — 0.
Отсюда выводим
ах Ь\
у (Ь — ах) = 0.
Следовательно, х — оптимальное решение программы (I). Свойство 4 вытекает непосредственно из равенства (|3).
5. Пусть х — оптимальное решение программы (I). Для того чтобы допустимое решение v программы (I*) было оптимальным, необходимо и достаточно, чтобы их = vb, что можно записать, согласно условию (а), в виде
(и — va) х = 0; v (b — ах) — 0.
6. Доказательство аналогично доказательству свойства 5.
Следствие. Существует три возможных ситуации для программ (I) и (I*):
1.	Обе программы не имеют допустимых решений.
2.	Одна из программ имеет допустимые решения, но не имеет оптимального решения, в то время как другая программа не имеет1 допустимых решений.
3.	Обе программы имеют оптимальные решения.
Замечание. Предположим, что v — оптимальное решение программы (I*). По пункту 6 предыдущей теоремы, всякое допустимое решение х программы (I) должно удовлетворять условиям
х1 = 0, если щ — vat 0;
а'х — b, если У/ =£ 0.
20*
307
Вообще говоря, этих условий достаточно для определения х. В самом деле, в программе (I*) имеется: п ограничений вида
щ — va{ =f= 0; р ограничений вида V,-	0.
Пусть и р2 — числа насыщенных в v ограничений этих двух типов; предположим (что и имеет место в общем случае), что

Pi + р2 = Р- Тогда для определения хмы имеем: п — рг уравнений вида х/ = 0; Р — Ръ уравнений- вида aix='W, которые, вообще говоря, позволяют определить х.
1/2
//J
100 Ю0Уг= С
0,1	1/6
Рис. 39.
Пример. Рассмотрим программу
Юх1 + 6х2 + Зх3^ 100;
2Х1 + Зх2 + 7х3	100;
(I)
вид
max х1 + х2 + х3.
Двойственная программа имеет
10 vi + 2^2	1;
(I*)
3wi + 7у2^ 1;

к min 100ui + 100^2.
Ее можно решить графически (рис. 39). Получаем оптимальное решение ui = 0,12; V2 == 0,09.
Найдем оптимальные решения х программы (I). Имеем х1 = 0, ибо ограничение Ю01.+ 2и2^ 1 не насыщено;
Юх1 + бх2 + Зх3 = 100, ибо ограничение t/i 0 не насыщено;
2хт+Зх2+7х3= 100, ибо ограничение Уг^ О не насыщено, что приводит к системе 6х2 + Зх3 = 100;
Зх2 + 7Х3 = 100, из которой получаем х2 = 12,1; х3 = 9,1.
Введением свободных переменных рассматриваемая программа приводится к программе, рассмотренной в предыдущем параграфе в качестве примера на при-' менение симплекс-метода. Легко видеть, что найденные решения совпадают. 308
4.	ПАРАМЕТРИЗАЦИЯ
Рассмотрим линейную программу {в общих обозначениях гл. 1 Я)
<p‘ (x) = ai (/= 1.q);
' 'ф'Ф)>0* (k = 1....г);
minf(x).
Параметризацией называют исследование вариации оптимальной точки (если она единственна) и минимального значения целевой функции при изменениях а и 0. Эта проблема уже была решена для нелинейного программирования (гл. 13, теорема 6), но результаты имели локальный характер. В случае линейного программирования результаты могут быть улучшены и стать глобальными. В теоремах 2 и 3 используются общие обозначения гл. 13.
Теорема 2. Предположим, что для значений а0 и р0 переменных а и Р множество определяемое соотношениями {ф (*) = а, Ф (*) 5s Р, не пусто и что f ограничена на нем снизу. Тогда множество В всех пар (а, Р) таких, что не пусто, есть выпуклый конус, и если (а, Р) С В, то f ограничена снизу на Д~-р.
Если положить
0 (а, Р) = mm f (%) для (а, Р) € В,
X (2 д--
а, 3
то 6 — выпуклая функция.
Доказательство. Множество В есть множество пар (ф (х), Ф (*) — У), гДе х пробегает все Rm и у Е R+- Следовательно, это — выпуклый конус.
Асимптотический конус Д-'р определяется уравнениями
{ф (х) = 0; г|> (х) > 0};
он не зависит от а и 0.
Если f ограничена снизу на Д«о, то / (/1)5» 0 для любого h такого, что <р (й) = 0, гр (7i)	0. Следовательно, f будет огра-
ничена снизу на А— для любого (а, 0) С В-ос, р
Пусть тогда хг таково, что
f(x1)= min f(x), хСД~ ~ «и 31
309
и х2 таково, что	г
*	f (х2) — min f (х).
а2, р2
Пусть далее %	(^Х, ^2) С A-2J “ ^1^1 4“ ^2^2,
Р = ^1Р1 4~ ^2р2-
Тогда
- ф (%хХх 4~ ^2-^2) “ ^10&1 4“ А»2а2 ~
' ф (К1х1 + Х2х2Х= М (*1) +
4~ ^гФ Сч)	^1Р1 4“ ^гРг ~ Р-
Следовательно, ^*1Л1 4“ ^2-^2 А~ ОС, Р
Кроме того,
f (\l*i + ^2^2) = ^if Сч) + Сч) — (ai, Pi) 4- ^2^ (а2, Р2) и, следовательно,
0 (а, Р) < Хх0 (аь рО + М (а2, р2).
Таким образом, 0—выпуклая функция, что и требовалось доказать.
Теорема 3. Предположим, что для значений а0 и р0 переменных аир точка х0 является оптимальной для Д~ ~ . Пусть ОСо . Ро
Kq = К (х0, Ро)- Предположим еще, что формы <р' (/ = 1, . .
• • ?),	(^€ Ко) независимы и что число индексов, принадле-
жащих Ко, равно т—q.
Тогда точка х, удовлетворяющая соотношениям
ф/ (х) = ai (j = 1, . .	q);
^(х) = р* (k£K0), оптимальна на А— , если она допустима, что выполняется для " а, Р
(а, Р), принадлежащих замкнутому выпуклому многогранному конусу Лх0- Если р, € (R4)' и v G (RrY таковы, что
V 5s 0, Vk = О ДЛЯ k Ко.
<7
f = S н/Ф/ + S = рф + w|) /=1
310
то.
е (а, р) = р,а + Vp для (а, Р) £ ЛКо.
Доказательство. Условие оптимальности в х0 выглядит так: существуют р, и v такие, что
v 0, vk = 0 для k $ Ко, f =	+ vi|).
Это условие оптимальности удовлетворяется также и в точке х, которая будет, следовательно; оптимальной, если она допустима. Но х зависит линейно от а и р. Следовательно, множество Л^о, которое определяется неравенствами (х) р* (& $ /Со), есть замкнутый многогранный выпуклый конус (каждое из этих неравенств определяет замкнутое подпространство).
Наконец,
9 (а, Р) = f (х) = pep (х) + vip (х) = ра + v|3.
Мы уточним вид функции v в одном частном случае.
Теорема 4. Рассмотрим линейную программу
ах <; 6;
х 0;
max их. -’
Пусть В — множество всех Ь, таких, что множество Д&, задаваемое неравенствами ах b, х Q, не пусто. Предположим, что z/.для ЬЕ В. ограничена сверху на Д&.
Для b С В положим
0 (Ь) ~ max их.
(ах^Ь
1х>0
Пусть у1, . . ., vl, . . ., vL -— вершины множества,определяемого неравенствами
( va	и\
I v	0
(это множество является допустимым множеством двойственной линейной программы). Тогда
0 (b) = min vlbS
i	- .
Доказательство. Для b£B двойственная программа обладает оптимальными решениями (в общем случае одним) и среди них есть по крайней мере одна вершина. Значит min vb — min vlb.
ivA^u	I
По теореме двойственности (теорема 1) имеем 0 (6) = max их = min vb, (ax^b	Iva^u
откуда следует искомое соотношение.
311
ГЛАВА 15
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
1. СУЩНОСТЬ МЕТОДА
Мы излагаем здесь метод динамического программирования в случае, когда время является переменной, принимающей дискретные (например, целые) значения. Рассмотрим систему, описывающую рекуррентным соотношением
Хл+1 - f (X„, Unt п),	(6)
где Хп обозначает положение системы в момент n; Un — значение управления в момент п.
Обозначим через Н пространство состояний (ХДЕ Я), а через Хп (Хп) — множество допустимых значений Un в момент п, если система находится в состоянии Хп (Un Е Хп (Хд)). Если Хп (Хд) является фиксированным, то мы его обозначим через X. Последовательность UQ, Ulf . . ., Un (конечная или бесконечная) (где Un Е Хп (Хд)) называется управлением.
Зная управление и- начальное состояние системы, мы можем определить при помощи уравнения (6) ее последующие состояния. Последовательность Хо,	Хд . . . называется траекторией
системы, соответствующей управлению UQ, Uь . . ., Un, 4 . . Наоборот, любая последовательность Хо, Хь . . ., Хд, . . . называется допустимой траекторией, если она реализуется одной или несколькими управлениями. Число N рассматриваемых шагов будем называть горизонтом. Будем считать его конечным. Задача теперь заключается в том, чтобы для заданного начального состояния найти такое управление, которое реализовало бы максимум критерия вида
vo (%о, ^о) + vi (Хь ^i) + • • • + vn-i PGv-i, + Vn (^w)-
Когда указанная сумма состоит из одного последнего слагаемого, мы получаем критерий, зависящий от конечного состояния. Для простоты рассмотрим сначала случай системы, принимающий в каждый момент времени конечное число состояний. Тогда можно начертить график, вершины которого изображают возможные состояния системы, а прямые—допустимые пути перехода из одного состояния в другое (рис. 40). С каждым переходом, а также с каждым допустимым конечным состоянием связан некоторый выигрыш. Поэтому среди всех путей, выходящих из начального 312
состояния и приходящих в одно из конечных состояний, требуется найти тот, которому соответствует наибольший выигрыш. Рассмотрим далее различные возможные состояния в момент 2 и припишем им значение, равное максимальному выигрышу, с ко-
Рис. 40.
1орым продолжается дальнейшее движение. Для этого достаточно рассмотреть для каждого состояния полные выигрыши, относящиеся к различным допустимым путям (выигрыш, относящийся к пути, плюс выигрыш, относящийся к положению, которое фактически занимает этот путь) и взять наибольший из них. В то же время можно пометить стрел- ИЗ кой один или несколько путей, на которых максимум достигается. Тогда стрелки будут [/J] указывать оптимальные пути в каждом состоянии в момент 2 (рис. 41).
Рассмотрим теперь различ-	1—1
ные возможные состояния в момент 1. К каждому из этих состояний можно отнести некото
рое значение, равное макси-
мальному выигрышу, с которым продолжается дальнейшее движение. Для этого достаточно рассмотреть для каждого состояния полные выигрыши, которые относятся к различным возможным путям (выигрыш, относящийся к пути, плюс выигрыш, относящийся к состоянию, фактически занимаемому этим путем), и взять наибольший из них.
Укажем стрелкой один или несколько оптимальных путей. . Иначе говоря, для момента 1 повторим операции, проведенные для момента 2? заменяя конечные выигрыши значениями, относящи
313
мися к различным возможным состояниям в момент 2. Таким образом, эту операцию можно продолжить до момента 0. Этим методом можно: а) для каждого момента времени и для каждого состояния определить один или несколько оптимальных путей, которые позволяют при дальнейшем движении системы по этим путям получить максимальный выигрыш; б) для каждого момента времени и для каждого состояния определить максимальный выигрыш, который можно получить при дальнейшем движении си-
0	1	2	з
Рис. 42.
стемы; в) указать одну или несколько оптимальных траекторий, которые выходят из начального состояния.
Оптимальная траектория (единственная в рассматриваемом случае) указана полужирной стрелкой (рис. 42). Теперь мы можем вернуться к первоначальной задаче и дать формулировку общего принципа, называемого принципом оптимальности 1.
2. ПРИНЦИП ОПТИМАЛЬНОСТИ
Если управление U0, U19 . . ., UN_i является оптимальным, то оптимальным является также управление Upi . . ., для начального состояния Хр и критерия
+ vp+i (^p+i, Up+i) +	+^-i(^-i, fAv_i) + Vn PGv)-
Положим
Vv-1 (^JV-1) — max VN-1	&N-1) +
U N-l
и вообще
Vp (*P) = max vp (Xp, Up) + Vp+1 (Xp+1)
up	для p = 0, . . ., N— 1.
1 Этот термин принадлежит P. Веллману.
314
Предполагаем, что условия, прй которых этот максимум су- -шествует, выполнены. Приведенные выше уравнения будем называть уравнениями актуализации (equations d’actualisation) Ч Получаем следующий результат.
Теорема 1.
1)	Имеет место соотношение
Vp PQ = max vp Ц>) + • • • + (XN_lt UN_i) + VN (XN). Up.........UN-1
(2)	Для того чтобы управление UOi . . ., UN_i являлось максимальным, необходимо,и достаточно, чтобы выполнялись равенства
Vp(Хр) = vp(X, йр) + Vp+1 (Хр+1) (Vр = 0, ..N-1).
(3)	Если управление UOi . . ., UN_t является оптимальным, то управление UQ, . . ., (с тем же начальным состоянием) также является оптимальным для критерия
v0 (Хо, (/о) + • • • + ^-1 (Хр_п t/p_x) + Vp (Хр).
Обратно, если Uo, . . ., Up_r является оптимальным для этого критерия, то его можно продолжить так, чтобы оно стало оптимальным управлением для первоначального критерия.
Доказательство. Доказательство утверждения условия (1) проведем методом индукции от большего к меньшему. Формула справедлива для р = N — 1. Пусть она справедлива для значения р + 1:
Vp+i (Хр+1) = max (Хр+Ъ Up+1) + • • • + Up+1...........UN-1
+ VN-1 (XN_lf + VN (Хдг)}.
Тогда имеем
vp (XPi Up) + vp+1 (XP+1, Up+1) + • • • + (XN_U +
+ VN(XN) < vp (Xp, Up) (Xp+1) max {vp (Xp, Up) +
+ Vp+1{Xp+1)} = Vp(Xp).
Равенство достигается только в том случае, когда
vp+i (Xp+lf Up+1) + • : • + (XN_lt UN_T) -|-
+ Vn (Xn) = Vp+i (^p+1) и
 vP (Xp, Up) + Vp+1 (Xp+1) = Vp (Xp).
1	Эти уравнения были введены в связи с задачами по экономике в работе: Р. Masse. Les reserves et la regulation de 1’avenir dans la vie economique. I, II. Paris, Hermann, 1946.
315
’--Ж
Второе из этих неравенств определяет Up, а следовательно, - ? и Хр+1; первое неравенство показывает, что управление [/р+1 . .	является максимальным относительно критерия
ур+1 (xp+i, Ц?+1) + • • • +	+ vN (xN).
Следовательно, два неравенства совместны и позволяют получить
Vp (Хр) = max Vp (Хр, ЦО + • • • + VN-1 (Хдг_1, Un-1) + Vn (Хуу).
Up.....UN-l
В то же время мы показали, что
vp (Хр, йр) + vp+1 (хр+1) = vp (хр) для всех р == 0, . . ., N—1.
Обратно, если это соотношение справедливо для р = 0, . .
. . ., N — 1, то почленным сложением можно получить *
уо (Хо, ^о) + • • • + VN-1 (Xjy_i, UN-1) + VN (Xn) — Vo (Xo).
Из последнего соотношения следует, что управление является оптимальным. Первая часть утверждения (3) сразу следует из свойства максимального управления, данного в утверждении (2). Обратно, если (70, . . ., является максимальным для кри-терия v0 (Хо, U0) +j • • + Vi (Xp-i>	vp Wj. ™ СУ'
ществует Up, . . UN_r такое, что Vq (Xq) = vq (Xq, Uq) + + У7+1 (Х^+1) для всех q — р, . . ., N — 1; следовательно, управление t/0, . . ., UN_T является максимальным. Доказательство завершено.
Замечание. В случае, когда ищется минимум критерия, всюду max нужно заменить на min.
2	. Пример. Рассмотрим систему,'описываемую следующим рекуррентным соотношением:
Xrt+1 = АХп + Unh, где
хп е
А £ L j?m), где det (Л)	0;
he Rm\ .
uneR.
Задано начальное состояние Хо и определенный горизонт Требуется найти управление {£/„},' которое реализует минимум N
критерия S ИпГ. п=0
Сначала мы иселедуем следующую задачу оптимизации: в некоторый момент система находится в состоянии X и требуется найти минимум квадратичной формы YMY для последующего состояния
Y - АХ + uh.
316
Мы получим задачу, которую нужно решить й момент М — 1 (где М = 1) или в промежуточный момент, как это мы видели в процессе актуализации. Поэтому - нужно найти значение и, которое реализует минимум величины УМУ. Имеем УМУ = = (ХА + uh) М (АХ + uh) = ХАМАХ + 2uhMAX + ushMh.'
1	~ hMAX
Минимум достигается при и =---=—— и равен
hMh
hMh-ХАМ АХ ~ (hM АХ)2	Vvv
m (Л) =-------=-—b------— — XNX,
v 7	hMh
где
д; __ hMh-АМА —AMh-hMA “	hMh
Следует заметить, что N является положительно полуопределенной симметрической матрицей.
Полагаем далее
VN(XN) = ||ЗД = XNXN = XNMNXN (MN = 1); ' Гх_1(ЗД) = min [VN(XN) + ЦЗДЦ2];
UN-1
Vp (Xp) = min [ Vp+1 (Xp+1) + II Xp II2]. Up
Имеем
Vp (Xp) - xpmpxp, где
__ hMp+1h • AMp+1A — AMp+1h -hMp+1A .
P~	hMp+ih	Г
+ 1 = AMplA + 1 — A^p^^Mp^A-;
P+1	hMp+1h
здесь Mp — положительно определенная симметрическая матрица. В каждый момент р мы выбираем Up так, чтобы оно давало минимум величине Ур+1 (Хр+1).
Следовательно, существует единственное оптимальное управление
Тт /у \_ hMp+1AXp
Up(Xp)-~~hM^T
Заметим, что оптимальное управление в момент р является линейной формой от состояния Хр в этот момент; кроме того,
Vo(Xo) = ХйМ0Хй = min £||ЗД
^0...
317
и вообще
Vp (Хр) = ХрМрХр = min S И Хп И2.
UP..yW-ln=P
Мы можем теперь перейти к случаю, когда горизонт является бесконечным. Дадим сначала определение.
Определение. Система, описываемая рекуррентным соотношением
Хп+1 = АХп + Unh, где
Хпе Rm, Aeh(Rm,Rm) (det (Л)	0);
Une R', he Rm, называется управляемой, если, каково бы ни было начальное состояние Хо, существуют целое число N и последовательность J70, . . ., UN_r такие, что XN = 0 (тогда говорят, что система приведена в начало координат). Общая формула, по которой XN выражается через Хо и U0, . . ., UN_r, имеет вид
XN = AnX0 + U0AN~lh + t/И"-2 h H-----h UN-ih.
Следовательно, равенство XN = 0 можно записать в виде
Хо = — U0A~4i — UrA-2h —---------U^A-uh.
Теорема 2. Для того чтобы система была управляемой, необходимо и достаточно, чтобы наименьшее векторное подпространство, инвариантное относительно А и содержащее 7i, совпадало со всем пространством Дт.
Доказательству. Действительно, для того чтобы система была управляемой, необходимо и достаточно, чтобы всякий вектор X являлся линейной комбинацией векторов A~1h, A~2h, . . ., иначе говоря, чтобы векторное подпространство, порожденное векторами	. ., совпадало с пространством
или это подпространство являлось наименьшим векторным подпространством, инвариантным относительно А и содержащим /г.
Следствие. Для того чтобы система была управляемой, необходимо и достаточно, чтобы векторы Л-1/г, . . ., A~mh были независимы. В самом деле, если Л-1А, . . ., A~mh независимы, то они порождают пространство следовательно, условие достаточно. Обратно, если A~1hi . . ., A~mh зависимы, то один из них, например	является линейной комбинацией остальных:
A-ih = Н------------h K^A-^h.
Отсюда следует, что для любого k 0 имеем
A~i~kh = М“(1+Й)Л Н------F ^A-v-^h.
318
Полагая последовательно k = 1, 2, . . мы находим, что все векторы A~^+k} h (k = 0, 1, . . .) являются линейными комбинациями векторов Л-1 Л, . .	A-^h. Поэтому векторное под-
пространство, порожденное векторами A~2h, . . ., совпадает с векторным подпространством, порожденным векторами A~rh, A~~2h, . . ., A~l+2h. Следовательно, оно отлично от R,n.
Теорема 3. Если система управляема, то существует одна и только одна последовательность (70, • • Um такая, что Хт = 0.
Доказательство.' В самом деле, для того чтобы выполнялось равенство Хт = 0, необходимо и достаточно, чтобы имело место соотношение
Хо - — UQA~'h — U1A~2h —----------Om_1A~mh.
Иначе говоря, векторы Д-1Л, A~2ht . . ., A~mh образуют базис пространства Rtn. Отсюда следует доказательство теоремы.
Заметим, что Uo, . . ., являются линейными формами относительно Xq. Отсюда сразу следует, что для этого частного управления последовательные состояния Х19 . . Xm_i являются линейными относительно Хо. Мы можем положить
Р(Хо) = Но|Р + ||Х1||2+	+ЦХ»-1112.
Функция У представляет собой квадратичную форму (положительно определенную). Нам нужно теперь найти последователь-' оо
ность Ulf . . ., которая реализует минимум суммы 2 || ХЛ||2.
Предполагается, что система является управляемой. Положим
min [||XW||2+... +|M2I = Po....UN-1
I
= min	[|I^G||2 + • • • +	||2].
....
I 4=*
Мы видим, что V<N> является квадратичной формой. Кроме того, для N т имеем
у(") ®<У(|).
Следовательно, для любого g последовательность (g) является возрастающей и ограниченной, поэтому она имеет предел V (£), который представляет собой квадратичную форму от Исходя из уравнений актуализации, получим
V(A)(X„) = ||ХЯ|Р + min	.
3J9
(здесь индукция является прямой, т. е. от меньших значений к большим значениям, так как теперь мы имеем дело с индексацией по времени вместо индексации по горизонту).
Имеем (g) —	где — положительно опреде-
ленная симметрическая матрица, удовлетворяющая следующим рекуррентным соотношениям:
[ ММ = АМ^-^А + 1 —	А.
Л4(°> = 1.
Теорема 4. Пусть ЧХО = Хо, Х1( . . Хп— траектория такая, что
V(X„+1) = minV(Xn+1). .
U п
+ со
Тогда эта траектория реализует минимум критерия S ll^nll2,
. и наоборот. Справедливо равенство
V(x0) = S||XX n=0
Доказательство. Мы должны показать, что для некоторой траектории Хо =	• • •,	.. • справедливо неравенство
ОО	4"°°
S ||х„|р^ S ИХ л=0	п=0
Можно ограничиться случаем, когда limXn — 0. х	П->оо
Для любого k имеем
VM (Х„) = ||Хп F + min	^||X„II2 +	(Х„+1).
Un
При k + оо получим
V (Хп) II Х„ г + V (Хп+1),
поэтому (полагая в предыдущем неравенстве п = 0, 1, . . р и суммируя)
р
V(Xo)^ S ||Х„|Р + V(XP+1).
п=0
Полагая р —> + оо, хполучим
(а)	V (Хо) < S || Х„ ||2.
п==0
Мы имеем
VM (Х„) = II Хп II2 + min	(Xn+J)
320
откуда, полагая й—> + оо, находим
I
V(X„) = ||X„||24-minV(X„+1))
U п
т. е.
V(X„) = И»112 + V(X„+1).
Следовательно, _	р	~
V(Xo)= S||X„||2 + V.(XP+1).
Полагая р —* + оо, получим
(Р) V(X0)= S||X„||2.
n—Q
Из соотношения (а) и (0) следует
EilX< s” II *Х n=0	п=0
Наоборот, соотношение
V(X„+1) = min f ||ХР||2
ип+1  • • р=п4-1	/
показывает, что любая минимальная траектория удовлетворяет соотношению
v (Хп+1) = min V (Хп+1).
Un
J	_
Следствие. Если положить V (g) — gMg, то .мы получим Ър = сгХр, где в =-------Отображение g —> erg позволяет
получить управление как функцию от состояния системы. Тогда мы получаем некоторую стратегию. Эта стратегия является оптимальной в том смысле, что если ее применить к любому моменту, то полученная траектория будет оптимальной. Заметим, что, подчиняясь этой стратегии, система будет удовлетворять линейному рекуррентному соотношению
21 Р. Паллю де Ла Барьер	321
Числовой пример
Если
А =	“3 0 0 0“ 0 2 0 0 0 0 10 _0 0 1 1_	и h =	_г 1 1 _о_
то мы найдем
	“7	2	1	0~
1	2	3,666	0,666	0
=				
	1	0,666	2,666	1
	_0	0	1	2_
	~ 40	— 16	—7	—2
=	— 16	15	—2	—0,333
	—7	—2	7	2,833
	2	—0,333	2,666	2,833 _
	“ 144'2 —70,5 —19,91 —7,416 ~
	70,5	58	—5,5	—0,5
МО) =	
	— 19,91 —55	15,93	5,546
	_—7,416 —0,5	5,546	3,824
	~ 2446 —2365 437,0	69,77 “
Ж0» =	—2365 437,0	2381 —486,1	—486,1 124,1	—84,38 25,68
	_ 69,77	—84,38	25,68	7*,752 _
	~ 2454	—2373	438,7	70,07
М =	—2373 438,7	2389 —487,9	—487,9 124,4	—84,67 25,74 х
	_ 70,07	—84,67	25,74	7,762 _
о = [-	-52,60	39,36 -	-3,608 0,4648].	
322
ГЛАВА 16
УПРАВЛЯЕМЫЕ МАРКОВСКИЕ СИСТЕМЫ
В этой главе мы будем рассматривать системы с конечным числом состояний и дискретным временем. Систему обозначений используем ту же, что и в гл. 6. Для упрощения изложения будем считать, что у нас уже есть некоторое представление о рассматриваемом предмете и поэтому сразу перейдем к хорошо поставленной математической задаче.
1. МАРКОВСКИЕ СИСТЕМЫ С ВЫИГРЫШЕМ
Рассмотрим систему, которая может находиться в одном из п состояний. Пусть эти состояния связаны в нестационарную цепь Маркова, переходная матрица которой в момент времени t есть Р (/). Каждому переходу из состояния i в состояние/, происходящему между моментами времени / и t + 1, соответствует выигрыш d (О-
Рассмотрим эволюцию системы за время от 0 до Т и предположим, что каждому конечному состоянию i поставлен в соответствие выигрыш щ (Т). Пусть суммарный выигрыш, полученный за время эволюции системы, складывается из выигрыша за переходом и выигрыша vt (Т), получаемого, если в момент времени Т система находится в состоянии i.
Обозначим через vt (t) средний выигрыш, получаемый за оставшееся время в предположении, что движение системы начинается в момент t из состояния i. Обозначим также через q^t) средний выигрыш, полученный за переход, происходящий между моментами времени /и ?+ 1, при условии, что система находилась в момент t в состоянии i.
Тогда
/
Если система в момент t находится в состоянии г, то средний выигрыш, полученный после момента t + 1, равен
/
21
323
Следовательно, имеет место рекуррентное соотношение
М0=2М* + I)P{(0 + (О-/
Полагая
и (/) = ki (0, • • •> vn (Q];
q (0 =	(0. • • •> qn (01, •
это рекуррентное уравнение можно переписать в следующей матричной форме:.

Напомним, что v (Т) задано. Следовательно, для отыскания v (/) мы имеем рекуррентное уравнение, которое можно решить в обратном направлении (от Т до 0).
Теперь мы изучим асимптотическое поведение системы (при числе переходов, стремящемся к бесконечности), предполагая, что система стационарна. Обозначим через Р матрицу перехода и предположим, что. выигрыш соответствующий переходу из i > в /, не зависит от времени. Пусть в некоторый момент времени система находится в состоянии I. Средний выигрыш, полученный за один переход, не зависит от времени и равен
qi = S r'ipib
j	I
где мы положили q = ([qi,   qJ- 
I
Обозначим через vt (m) выигрыш, полученный в течение m | последовательных переходов в предположении, что система выходит из состояния Л Тогда имеет место рекуррентное соотноше- / ние
Vi (/и) = 2 О/ (m — 1) Pi + qi> . i	I
или, в матричной форме;
v (tri) = v(tn — V)P -|- q
где
v (tri) — [vx (tri), . . vn (m)], v (0) = 0.
Мы получили, таким образом, прямое рекуррентное уравнение для_о (tri).
324
Рассмотрим поведение v (m) при tn —» + оо. Имеем:
v (tri) = v (tn — 1) Р + q-, v (tn — 1) = v (tn — 2) P + q\
v (1) = v (0) P + q, v (0) = 0,
откуда
v (tri) — q (1 + P + • •. • + P)
Пусть — спектральный проектор, соответствующий собственному значению матрицы Р, равному 1. Тогда
гп->4-со ’
Полагая
§ = [gl, • • •, gj = <7«1,
имеем
т. е.
v (т) ~ mg
или
vt (ni) ~ т&.
Случай эргодической матрицы Р
Если Р — эргодическая матрица, то 1 является простым собственным значением и имеет ранг 1, Имеем
= [со | • • • | со],
где со — предельное распределение вероятностей. Тогда для любого i = 1, . . ., п имеем gt = ^со. Обозначая через у общее значение для g{, получаем
Vi(m) ^ту
Величина у называется средним асимптотическим выигрышем за период.
325
'Ж.
Случай примитивной матрицы Р	,(
Если Р — примитивная матрица, то 1 — единственное собственное значение, по модулю равное 1. Представим Р = лх + Q, где Q — матрица, собственные значения которой по модулю меньше 1, такая, что jtjQ =	— 0. Тогда
h	h
Р =	+ Q.
Отсюда
1 + Р + •••+"р1= 1 + Q+ ••• +mQ+(rn-1)	:
Поскольку матрица 1 — Q обратима, то
1 + Q + •••+V+ •••=(! — Q)-1’	'
и, следовательно х,
1+ Р+ ••• + ”₽ U(1+ С)-1-л1 + тл1.
Тем самым,
v (т) q [(1 — Q)-1 — rtjJ + mqnr,
где = g. Положим
W = [Гь . . Wn] = q [(1 - Q)-1 - nJ.
Тогда
v (m) & mg + W
или
vt (m) mgi + Wt.
Случай регулярной матрицы P
Если P — регулярная матрица, то она является и эргодической и примитивной. Тогда	4
vt (m)	ту + Wi-
Полагая т)=[1, ...» 1], перепишем это соотношение в виде
v (т) тут] + W .	(6)
Установим интересную связь между у и W, сравнивая последнее соотношение с рекуррентным уравнением
v (т) = v (т — 1) Р + q.
Из выражения (6) имеем
v (т — 1) «=! (т — 1) yq + W.
1	Символ означает, что разность между левой и правой частями стремится к 0 при т +оо.
326

Подставляя последнее соотношение в рекуррентное уравнение, находим
v (иг) [(иг — 1) ул + W] Р + q = (т — 1) ул + WP + q.
Наконец, сравнивая это выражение с формулой (6), получаем . WP + q — ут] = W или
W (1 - Р) + УЛ = q
Исследование уравнения X (1 — Р) + %л = q для случая эргодической матрицы Р
Будем считать, что Р и q заданы, а X и % неизвестны. Обозначим через со предельное распределение вероятностей. Заметим прежде всего, что уравнение X (1 — Р) = с имеет решение тогда и только тогда, когда q& = 0. Это вытекает из следующего классического утверждения: для' существования решения уравнения ах = b необходимо и достаточно, чтобы ub = 0 для всякого а такого, что иа = 0.
Следовательно, для существования решения уравнения X (1 — Р) + Хт] = <7 необходимо и достаточно, чтобы (q — Хт))со = — 0, т. е. q<& — % ~ 0 или % = у. Решение X определяется с точностью до решения уравнения X (1 — Р) = 0, т. е. с точностью до л- Если, более того, матрица Р регулярна, то среди решений X, полученных при % = у, находится W.
2	. УПРАВЛЯЕМЫЕ МАРКОВСКИЕ СИСТЕМЫ С ВЫИГРЫШЕМ
Будем рассматривать систему, принимающую п состояний, которые мы обозначим числами от 1 до п. Вероятность Р\ (t, k) того, что система, находясь в момент времени t в состоянии г, окажется в момент t + 1 в состоянии /, зависит от времени t и от параметра k, называемого управлением. .Параметр k будет принимать лишь конечное число значений1. Имеем
рц/, &)>о,	\
j ..
’ Выигрыш Н (/, k) соответствует переходу из состояния i в состояние j за время от t до t + 1, если в момент t использовалось управление k.
Стратегией назовем всякое отображение /, / —> сг (^, i), ставящее в.соответствие каждому моменту t и состоянию системы i некоторое
1 Управление k может априори зависеть от t и состояния системы /. Чтобы не загромождать изложение, мы в наших обозначениях не будем учитывать эту возможность.
327
w
управление. Будем считать, что если выбрана стратегия о, то эволюция системы описывается марковской цепью, в общем случае не стационарной, переходная матрица которой Р [ст] (/) имеет своими элементами
РИ<*](0==Ж	0).
Рассмотрим сначала случай, когда длительность наблюдения Т ограничена. Пусть vt (Т) — выигрыш в конечном состоянии i;
(/) — максимальный средний выигрыш, полученный между моментами t и Т (максимум берется по всем стратегиям, возможным । между моментами t и Т).
Положим,
k) = ^iPli(t, k) r't(t, k).
i
Эта величина представляет собой средний выигрыш, полученный за переход, который происходит между моментами t и t + 1, если система в момент времени t находилась в состоянии i и было использовано управление k. Имеет место следующее уравнение1:
Vi (f) = max ГЕ Vj (t -j- 1) P'i (t, k) + «у,- (t, k) . k L /
(7)
Это уравнение позволяет при известном vt (Т) вычислить vt (t). Если о (t, I) — одно из Значений управления k, для которого квадратная скобка в соотношении (7) достигает максимума, то о является оптимальной стратегией в следующем смысле: если о применяется в момент времени t к системе, находящейся в состоянии г, то она обеспечивает средний выигрыш, равный максимальному среднему выигрышу. Естественно, что могут существовать несколько оптимальных стратегий.
В дальнейшем мы будем предполагать, что система стационарна в следующем смысле: вероятности Р{ (t, И) не зависят от t (они будут обозначаться через Р\ (&)), выигрыши г{ (/, k) тоже не зависят от t (обозначаются через г\ (&)). Будем интересоваться только «стационарными» стратегиями ст, которые каждому состоянию i ставят в соответствие управление k = ст (t), используемое в случае, когда система находится в состоянии I.
Если применяется стратегия о, то эволюция системы будет описываться стационарной цепью Маркова с переходной матрицей Р [а], элементами которой являются
Я[а] = Р«(о(0).
Будем предполагать, что выполняется следующая гипотеза:
1 По поводу уравнения (7) (называемого уравнением Веллмана) и его вывода см., например, [3] (Прим, перев.).
328
какова бы ни была стратегия о, матрица Р [о] эргодическая х. С каждой стратегией о свяжем предельное распределение вероятностей со [ст]; выигрыши за переход г{ [о] = (от (7)); средние выигрыши за переход в предположении, что система выходит из состояния 7:
qi И = S r'i [a] P'i [а];
7
средний асимптотический выигрыш за период у la] = q [а] со [о],
где
q [а] = [qr [от], . . qn [а]].
Рассмотрим решение X [о] уравнения
X [о] (1 — Р [от.]) + цу [о] = cf [о].
Если Р [о] — регулярная матрица, то частным решением X [ст] является форма W [ст] такая, что средний выигрыш v [cr](m) за т шагов удовлетворяет соотношению
-у [ст] (т) ту [о] т] + IF [ст].
Предложение /. 1) Пусть о и о—две стратегии такие, что для всякого i
4i I®] + S Xf Io] P'i Io] Ss qi [o] + S X/ [а] Р\ [<r], i	i
Тогда
у Iff] V [a],
2) Если для всякого i
qi [a] + S X,- [a]P{ [a] qt [a] + £X,- [a] P{ [a], 7	7
TO
Y [a] у [a].
Точнее, если положить
и = q [о] — q [о] + XJor] P [or] — X [a] P [or],
t. e.
Ui = qi [a] + S Xj[or] P\ [a] — qt [cr] — £ X,- [a] P'i [a], 7 .	7
1 Случаи, когда эта гипотеза не выполняется, можно найти в книге Гнеденко «Курс теории вероятностей», М., Физматгиз, 1961.
329
то
7 [а] — 7 [а] = uco [or].
Доказательство, Имеем
X [or] + т]7 [or] = q [or] + X [or] P [or] и
X [о] + т]7 [о] = q [о] + X [ст] Р [от], откуда
и - IX [or] —X [а]] (1 — Р [от]) + л [7 [о] -7 [а]].
Умножая справа обе части на предельное относительно матрицы Р [ст] распределение вероятностей со [а], получим искомое соотношение
uco [от] =7 [от] — 7 [а].
Предыдущий результат можно переформулировать в виде следующего правила (под оптимальной стратегией будем понимать стратегию o', которая максимизирует 7 [ст]).
Правило, Если
qi [о] + S А’/ [о] Pl [о] = max q{ (k) + £ X/ [а] Р'( (k), j	k	j
то стратегия о — оптимальная.
Предположим, что I 4= 0, где I — множество индексов i таких, что предыдущее соотношение неверно. Если о (I) таково, что
max qt (k) + S X/ Й P{ (k) = qi (a (i)) + S X/ [a] (a (0), ft	i	I
то стратегия о удовлетворяет неравенству у [ст] у [о].
Если, более того, существует i (Е / такое, что [о] =р 0, то у [о] > у [о].
Это будет, в частности, тогда, когда матрица Р [ff ] неприводима, потому что в этом случае все компоненты со [о] строго положительны.
Пусть для всех стратегий о матрица Р [ст] неприводима. На приведенном выше правиле основан метод, с помощью которого можно разыскать стратегию о, максимизирующую у [сг].
Пусть о — некоторая стратегия. Вычисляем одновременно у [о] и частное решение X [о] уравнения
X [о] (1 — Р [о]) + я? I®] = <7 [<rL
330
Затем вычисляем для каждого i величину
max qt (k) + S xi [°1 pi (&)• k	j
1.	Если для k = cr (f) этот максимум достигается, то стратегия ст — оптимальная.
2.	Если нет, то возьмем стратегию a (i), на которой он достигается, и пересчитаем все, заменив а на ст.
Пример. В следующей системе k может принимать два значения: 1 и 2. Пусть есть два состояния. Таблицы для Pl (k) и (£) имеют следующий вид:
7,5 6=1
6,8	7,6
6=1	k~~-2
Рассмотрим, например, стратегию Oi такую, что Oi (1) = lr oi (2) = 1. Тогда
Решим уравнение
q [сп ] = [7,5 6,8].
X [oi] (1 — Р [(Til) +т]у [<Ti 1 = q [сГ1].
Полагая X [<Ti ] = [Xi, Хг] и у [oi] = у, находим -0,5X1 — 0,5Х2 + У = 7,5;
—0,2X1 + 0,2X2 + У = 6,8,
что дает у = 7 и, например, Xi = 1, Х2 = 0.
Для всякого i мы должны найти управление k, максимизирующее X [0i]Pi(k)+ q(k).
Для i = 1
max {X [Oi] Pi (k) + qt (£)} = max {0,5 + 7,5; 0,3 -|- 5,1} = 8 k
достигается при 02 (1) = 1.
331
Для i— 2
max {X [oi] P2 (k) + q2 (k)} = max {0,2 + 6,8; 0,6 + 7,6} = 8,2 k
достигается при a2 (2) = 2.
Для стратегии о2 имеем
q [а2]= [7,5 7,6].
Решим теперь уравнение
X [<72 ] (1 — Р [<72 ]) +	[<72 ] = q [<72 ].
Полагая
X [02] = [Х1, Х2] иу [а2] = у, находим
0,5X1 — 0,5Х2+ у = 7,5;
—0,6X1 + 0,6Х2 + У — 7,6,
что дает у = 7,5455 и, например, Xi = 0, Х2 = 1/11.
Для каждого i мы должны найти управление k, максимизирующее
X [а2]Р£(*) + q(k).
Для i — 1	’
max {X [<72] Р± (к) + Я1 (k)} = max Ж + 7,5;	+ 5,11 =	+ 7-5
k	I 1 1	11	J11
достигается при сг3 (1) = 1.
Для i = 2
max {X[<72]P2(£)+<72(*)}=max (4г + 6,8; -yr + 7>6) = +" + 7>6
k	I 1 1	I 1 1
достигается при а3 (2) = 2.
Находим, что сг3 = сг2. Следовательно, стратегия ог оптимальна. Тем самым, оптимальная стратегия о имеет вид а (1) = 1, ст (2) = 2 и у [сг2] = 7,5455.
3.	МАРКОВСКИЕ СИСТЕМЫ С ЦЕЛЬЮ И СО СТОИМОСТЯМИ ПЕРЕХОДОВ
Рассмотрим систему с N состояниями, подчиненную стационарной марковской цепи, переходная матрица которой есть Р. В множестве всех состояний рассмотрим подмножество £J, называемое целью. Дополнение к обозначим через А. Мы предположим, что А = {1, . . ., п] й S = {/Г+ 1, . . ., /V}. Будем интересоваться’лишь эволюцией, начинающейся с состояния, принадлежащего А, и продолжающейся до момента, когда состояние системы попадет в множество ^j. Без потери общности можно предположить, что S замкнуто и переходная подматрица на' 2 является 332
единичной, т. е. матрица Р распадается на части следующим образом:
п Г<2|0Т}А
Предложение 2. Следующие свойства являются эквивалентными:
1)	Для любого состояния i С А найдется путь, начинающийся в i и приводящий в
' 2) А есть объединение невозвратных классов.
з)|5||<1.
Доказательство. Заметим прежде всего, что каждое из состояний определяет предельный (финальный) класс, приводящий в это состояние. Следовательно, А есть объединение этих классов.
Предположим, что условие 1) выполнено. Тогда А .не содержит никакого предельного класса. Следовательно, А есть объединение невозвратных классов, т. е. из свойства 1) вытекает свойство 2), а из свойства 2) следует свойство 3) (см. гл. 6, доказательство предложения 8).
Предположим теперь, что условие 3) выполнено. Пусть а — множество тех состояний, выходя из которых нельзя достичь
Множество а по определению замкнуто; следовательно, если а не пусто, то
что приводит к противоречию.
Предложение 3. Если эквивалентные свойства в предложении 2 выполнены, то вероятность того, что, выходя из состояния i, можно достигнуть множества 2 не более чем за т шагов, стремите# к 1 при т —> +оо.
Доказательство. Вероятность того, что система, выходя из состояния i, будет в течение т шагов находиться в множестве А, равна (q)i-. Поскольку Q стремится к* 0 при т —* +оо, то эта . i вероятность стремится к 0.
Следствие. Вероятность того, что система, выходя из состояния Zg А, достигнет 2, равна 1.
Предположим теперь, что каждому переходу из состояния i в состояние / соответствует стоимость с{ при i = 1, . . ., п и j = = 1, . . ., N. Будем полагать с{ — 0 при Z6 2-
Пусть — средняя стоимость за р переходов, если система выходит из состояния i С А.
333
, '7^
Пусть далее q = [<?!, . . ., qn\, где
qt = 2 P'ic'i' i=i
Тогда мы имеем рекуррентное соотношение
п
z!” = S хГ"в! + 9<.
/=i
т. е.
x(p) = x(p~1)Q + ?
где %<°) = 0.
Лемма 1. Предположим, что ||q|| < 1. Пусть Т — отображение, определенное для X £ (ZJrt)' по формуле
Т (X) = XQ+ q.
Тогда отображение Т — сжимающее. Доказательство. Имеем
n	п п— 1 и—2
T(X) = XQ + qQ-}-qQ+...+q,
откуда
Т (Х) — Т (Y) = (X — Y)Q
и, следовательно,
цт(Х)-Т(У)ЫЙН~ П
Следствие. Отображение Т имеет одну и только одну неподвижную точку. Иначе говоря, уравнение ТХ — X имеет единственное решение. Каково бы ни было Х(0) € (/?”), последовательность Х(р>, где Х(р) = ТХ{Р~^, стремится к единственному решению уравнения ТХ = X.
В частности, можно сформулировать следующий результат.
Предложение 4. Предположим, что || Q|| <* 1. При р, стремящемся к +©о, х(р) стремится к пределу %, являющемуся единственным корнем уравнения
% = Х<2 + Я-
Лемма 2. Если уравнение X = XQ + г имеет решение X из (Rn)' при г > 0, то || Q || < 1.
334
Доказательство. Предположим противное. Тогда А содержало бы некоторый предельный класс 6 и существовало бы ® 6 Rn (с носителем 6) такое, что
®	0;
2<У = 1; j=i
Q® = ®.
Умножая справа на ® обе части уравнения X = XQ + г, получаем г® = 0, что несовместимо с гипотезой г 0.
4.	УПРАВЛЯЕМЫЕ МАРКОВСКИЕ СИСТЕМЫ С ЦЕЛЬЮ И СТОИМОСТЬЮ ПЕРЕХОДА
Предположим, что вероятность перехода системы за один шаг из состояния I (i = 1, . . ., ri) в состояние у (/' = 1, . . ., п, . . ., N) зависит от параметра k, называемого управлением и принимающего конечное число значений. Обозначим эти вероятности через Р\ (k). Для любого k имеем
P't (k) 0;
SW) = i.
/=1
Предположим еще, что если система находится в состоянии, принадлежащем 2х, то она там и остается. Это означает, что Р{ (k) = 0, если 2 и / =# h Pt (й) = 1, если г С 2- Назовем стратегией всякое отображение i —> ст (i), определенное для i С А. Эта функция зависит лишь от состояния системы.
Примем следующую гипотезу. Если выбрана стратегия ст, то система подчиняется стационарной марковской цепи с матрицей переходов Р [ст], где
Р/ [СТ] = р{ для I € А;
[ 1, если / = i,	„
P't — n ... для ig 2-
[ 0, если / =р I,	"
Можно, следовательно, представить Р [ст] в следующем виде:
I» [о] 11J 
Определение. Будем называть стратегию допустимой, если А есть объединение невозвратных классов.
Необходимое и достаточное условие для того, чтобы стратегия о ,	п
была допустимой, есть || Q [ст] || << 1.
335
С каждым переходом свяжем стоимость г{ (й), зависящую от управления k, применяемого в состоянии L Положим, далее
j=i
qt [ст] = qt (ст (i));
Я [o] = l<7i [o], . . ., qn [or]].
Будем придерживаться гипотезы, что qf (k) >> 0 для всякого k и всякого i £ А.
Для всякой допустимой стратегии а обозначим через % [ст] единственное решение уравнения
X [О] = X [о] Q k] + q [о].
Определим также для всякой допустимой стратегии о отображение Т [о] по формуле
т [or] X = XQ [ОТ] 4- q [or] для X g (/?")'.
Если Т [ст] имеет неподвижную точку, то ст—допустимая стратегия (лемма 2). Будем говорить, что допустимая стратегия ст лучше, чем допустимая стратегия а', если % [о] х [o'], т. е. X» [о] < Хс [o'] Для всякого ig Л-
Стратегия ст будет называться оптимальной, если она допустимая, и % (о) х (о), какова бы ни была допустимая стратегия ст.
Лемма 3. Для всякой стратегии ст имеет место соотношение
X Y Т [ст] (X) Т [от] (У); '
иначе говоря, отображение Т [ст] возрастающее.
Доказательство вытекает из свойства Q [о]	0.
Предложение 5. Пусть даны две допустимые стратегии о' и о". Тогда существует допустимая стратегия а лучшая, чем о' и ст", т. е. такая, что
X [о] inf (% [o'], %[ог"]).
Доказательство. Предположим’ состояния А перенумерованы так, что
X/ [o'] < X/ [о"] Для . X« [o'] > Хг [о''] для
Определим стратегию о вида
~	[ о' (Z) для
ст (i) = ( „ ,..
’ (о (t) для
O sC i h\ /i.< i n.
0	i	/i;
h<< i	n.
Положим
336
y(0) = inf (x [o'], x [o']),
т. е. пусть
1 I X, М Для л<п.
Определим
У(1) = Т [а] У<0) = YmQ [а] + q [а].
Тогда
У'1’ = YmQi [а] + qt Я
Если i «С h, то
У*1’ = YwQi [or'] + qt [or'] < % [o'] Qt [о/[o'] = Xt [o'] •
Если же i > /г, to
rP = Y^Qi [o'] + q'i [o'] X [o'] Qi [o'] + qt [o'] = x< [o"J.
Следовательно,
y(1)^inf(x[o']; х[о"]) = У(0).
Определим по индукции
Yw = T [o] y(ft-1).
Поскольку T [o] — возрастающее отображение и У(1)	У(0),
то
У(0)>У(1)> ••• ^y(ft)> •••
Последовательность У<А:) ограничена снизу нулем, поэтому она сходится. Пусть У = lim У(А). Тогда
Y = Т [5] Y = YQ [о] + q [о].
Следовательно, стратегия ст — допустимая и Y = % [о]. Более того,
X	[о] = У У(0) = inf (х[о'], хП']).
Следовательно, ст лучше, чем о' и ст".
Следствие. Если существуют допустимые стратегии, то существуют и оптимальные стратегии.
Предложение 6. Пусть о — допустимая стратегия. Для оптимальности ст необходимо и достаточно, чтобы
Xi	[or] = min lx [a] Qz (&) + ft (£)] V i = 1.«•
k
22 P. Паллю де Ла Барьер	'	337
Если это условие не выполняется, то всякая стратегия ст такая, что
min [X [ст] Qi (k) + q{ (&)] = х И Qi М + 4i М, k
лучше, чем ст.
Доказательство. Заметим прежде всего, что для всякой допустимой стратегии имеем
Xi [or] > min fx [or] Qi (k) + qt (£)]. k
1.	Необходимость. Положим
Xt = min [x [ст] Q( (k) + q{ (A)], k
и пусть crz такое, что
Xi = min [x [a] Qz (A) + ft (^)l = X И Qi (<* (0) + Qi (0)-k
Отображение су : f —> cr (f) определяет стратегию и
Xi = x M Qi [a] + qt [a], t. e.
X = X [a] Q [a] + q [or].
Имеем X<x[°l- Положим и = х[ст]— X. Тогда
X [of] = X HQ И + Я [o] + u,
где и 0,
откуда следует, что а есть допустимая стратегия (лемма 2). Далее
X М = Z [Of] Q [Of] + q [О] = х [Of] Q [Of] + X — X [of] Q [or]
X [Of] Q [Of] + x [°f] — X [Of] Q [Of], t. e.
’ (ХМ — Xfof])(l — Q[of])>0.
Умножим левую часть на (1 —Q [ст])-1. Поскольку
(1 - Q [a])’1 = 1 + Q [a] + •;  + Q [a] + •  • 0, TO
% [a] — % [a]	0.
338
Следовательно,
z	% [ст] = X + (х [а] —X [or]) Q [o'] X.
Если допустить, что X << х [<?], то тогда о не оптимальна. Следовательно, сформулированное в предложении 6 условие необходимо. (Заметим, что мы одновременно получили доказательство второй части теоремы.)
2.	Достаточность. Пусть ст — оптимальная, а ст — не оптимальная стратегии. Существует такое Z, что
х,- М > % М Qi М + 4t М.
Действительно, если это не так, то
х [<?] х [<?] Q [<?] + q fa], откуда
X [а] (1 — Q [о])^ q [а].
Умножая на (1 — Q [о])-1 обе части последнего неравенства, получим
X [tf ] q k] (1 — Q [а]);1 = х [а], что противоречит гипотезе «ст не оптимальна». Поэтому
Xi [о] > min [х [О] Qi (&) + qt (£)]. k
Таким образом, стратегия ст не удовлетворяет требуемому в " предложении условию.
Следствие I. Если X £ (Rn\ есть решение уравнения %i = min [XQi(k) + qt (k)], k
то всякая стратегия ст такая, что
min [XQi (k) + qt (k)] = XQt (o (i)) + qt (a (0), k
является оптимальной.
В самом деле, X = XQ [а] + q [а]. Следовательно, о является допустимой стратегией и X = х 1^1- Тогда, согласно доказанному выше, о оптимальна.
Следствие II. Уравнение
/ Xt = min[XQz (*) + ?/*)] k
имеет единственное решение.
Рассмотрим отображение U, определенное на (Rn\ формулой
k
, 22*
339
Лемма 4. Отображение U является возрастающим.
Доказательство. Предположим X X'. Для всякого /г имеем XQt (k) + qt (k) < X'Qi (k) + Qi (k), откуда
min (XQi (k) + qt (k)) < min (X’Q{ (k~) + qt (k)),
t. e. U (X) U (X'). •
Применение. Пусть о — оптимальная стратегия, Х<°> £(/?")', причем Х<°> «С х [о]. Определим последовательность Х<₽> формулой XW = U (X<p-D).
Предположим, что Х<0)<;Х<1). Тогда
lim Х<р> = % [а].
р->4~со
В самом деле, из соотношения Х<°>	Х(1) выводится, что
U (Х№)< U (X<D), т. е. Х<1)^Х<2> и по индукции Х<р> < Х<р+1>. Далее, шз соотношения Х<°> sC х [°1 следует неравенство U (X<°>)sg: U (х [о]), т. е. X (х> х 1^1 и, по индукции, Х<р) < х Й-
Таким образом, последовательность Х(р)—возрастающая й ограниченная (т. е. для всякого i £ А, Хг (р) есть возрастающая ограниченная числовая последовательность), поэтому она сходится. Положим
Х= lim Х<р>.
р->4-00
Тогда U (X) = X и, следовательно, X = х [с]. Аналогично, если Х<°) > х 1оГ и XCD < Х<°), то
limX(p) = х [о].
р->4-СО
Пример. Пусть k может принимать два значения 1 и 2. Имеется четыре состояния, из которых четвертое является целью (п = 3,	= 4).
Таблицы для Ql (k) и г1, (k) имеют вид:
/		 *	1		2		3	
	1	0,2	0,1	о,1	0,4	0,5	‘0,1
	2	о;4 •	0,3	0,2	0,2	0,4	0,3
	3	0,2	0,5	0,3	0,4	0,1	0
	4	0,2	0,1	0,4	0	0	0,6
		Aj==1	k=2	k=\	k=2	k=\	k=2
340
Вычислим qt (k)
t=l		i=2		1=3	
3 k=l	4,1 k==2	3,1 fc=l „	2,8 k=2	2,3 k==\	4,6 й=2
Используем рекуррентное соотношение
Х(р+1) = и (Х(р)) = min [Х(р) Qt (k) + qi (/г)] k
с начальным значением, например,
Х<°> = [1, 1, 1].
.Полагая Х(р) = [х(р), у^р\ z(p)], перепишем это уравнение в виде
х(р+1) _ min(o,2x(p) + 0,4yW + 0,2z(p) + 3;
0,1х(р) + 0,3j/(p> + 0,5z(p) + 4,1);
j,(p+1) = min(o,lx(p) + 0,2у(р) + 0,3z(p) +3,1;
0,4х(р) + 0,2j/(p) + 0,4z(p) + 2,8);
z(p+n = min(0,5x(p> + 0,4t/(p) + 0,lz(p) + 2,3;
0,lx(p) + 0,3t/(p)+4,6).
Обозначим через k = crp (i) значение, для которого достигается минимум. Вычислим
х'1' = min (3,8; 5,0) = 3,8;
z/(1) = min (3,7; 3,8) = 3,7;
z(1) = min (3,3; 5,0) = 3,3;
o0(l)= 1; o0(2)= 1; o0(3)= 1.
Вычислим теперь X<2\’
'	x<2) = min (5,9; 7,24) = 5,9;
y<2) = min (5,21; 6,38) = 5,21;
z<2) = min (6,61; 6,09) = 6,01;
^Oi (1) = 1; Oi (2) = 1; Oi (3) = 1.
341
Аналогично вычислим Х<3):
х(3) = min (8,466; 9,258) = 7,466;
у(3) = min (6,535; 8,606) = 6,535;
z(3) = min (7,935; 6,753) = 6,753;
cra (1) = 1; <т2 (2) = 1; a2 (3) = 2.
Вычислим X^:
x(4) = min (8,4578; 10,1836)'= 8,458;
yw = min (7,1795; 9,7946) = 7,180;
z(4> = min (9,3223; 7,3071) = 7,307;
03 (1) = 1; ^3 (2) = 1; a3 (3) = 2
и X(5):
x(5) = min (9,025; 10,7533) = 9,025; .
i/<5) = min (7,5759; 10,542) = 7,576;
z<5> = min (10,1317; 7,5998) = 7,6;
o4 (1) = 1; o4 (2) = 1; a4 (3) = 2.
Отсюда находим, что сгг = сг3 = сг4.
Проверим, не является ли найденная стратегия оптимальной. Положим
	7(1) =	1; <7(2) =	1; сГ[3) = 2.	
Тогда	~0,2 0,4	0,1 0,1 0,2 0,3	0 0	Г<3 Й о
	Р И = 0,2 0,2	0,3 0 0,4 0,6	0 1	[/ Й 1
q [а] = [3; 3,1; 2,3].
Решая уравнение
X [о] = X [о] Q [ст] + q [ст], находим
X [9,805 | 8,105 I 8,012].
Можно-записать:
tf(X [?])= [min (9,805; 11,518) | min (8,105; 11,548) | min (11,246; 8,012)] =
= [9,805 | 8,105 | 8,012] = х А- .
Следовательно, стратегия а является оптимальной.
ГЛАВА 17
УПРАВЛЕНИЕ ЛИНЕЙНЫМИ СИСТЕМАМИ ЗА МИНИМАЛЬНОЕ ВРЕМЯ
1. ДИСКРЕТНЫЕ СИСТЕМЫ
Вернемся к системе, описываемой рекуррентным соотношением ,	Хп+1 = АХп + Unh
и изученной в параграфе 2 гл. 15. Всюду в дальнейшем сделаем следующие предположения:
’ хп е /Г;
ЛЕ L(/T, /Г), где det (Д) + 0;
/ie/Г;
Будем ‘считать, что система является управляемой. Кроме того, будем предполагать, что наложено следующее ограничение: \Un\^K, X > 0. Заменяя h через пропорциональный ему вектор, можно добиться того, чтобы К = 1. Тогда ограничение записывается в виде | t/rt| 1.
Зададим Хо. Управление U будем называть оптимальным, если существует целое число N такое, что XN = 0, и не существует управление U> такое, что Хп = 0 для п <^N. Тогда говорят, что U приводит систему в начало координат за минимальное время.
Вспомним, что справедливо соотношение
XN = AnX. + ЦХ-1 h + UrAN-2 h Ч------1- UN_xh,
и, как следствие условия XN = 0, можно записать
Хо = — l^A-'h — UxA~2h--------U^A^h,
т. е.
XQ =	+ • • • +
где положено et = —A~-h.
Через MN обозначим множество состояний, приводимых в начало координат за время N.
Теорема J. Множество является симметричным выпуклым компактным множеством. Для N т точка 0 является внутренней для множества MN.
343
Доказательство. Множество элементов U = {U0, . . Nn_i} таких, что | Un \ «с 1 для всех п = 0, . . N — 1, является выпуклым множеством в RN. Множество MN является его образом при отображении
i/0, . .	Цу-1—»	’ + ^N-leN-
Следовательно, это множество является выпуклым компактным множеством. При N т векторы еъ . . ., еы порождают Rm,
- 4
М5
Рис. 43
откуда следует, что dim (M# ) = т. Так как MN является симметричным, то 0 является его внутренней точкой.
Замечания I. М//есть выпуклая оболочка 2Х векторов ± elf..., ± (рис. 43).
II.	Множество Мдг является таким, что Mn CZ Мдг+1. Допустим, что Хо £ и Хо $ М//_1, тогда состояние Хо является проводимым за время N ич не является проводимым за время N — 1. Следовательно, всякое управление U = = {Uo, . . ., I/yv-i} такое, что
Хо = Ц)е1+---+^_Аг;	n = 0,....N-l,
является оптимальным. Вообще говоря, ех, . . ., eN не являются независимыми, поэтому оптимальное управление не определяется однозначно.
Теорема 2. Если все собственные значения матрицы А по модулю строго меньше 1, To'UM;v = /?m.
344
Доказательство. Пусть	Применяем управление
Un = 0 (п = О, 1,2,.. .). Тогда lim Хп = 0. Так как Мт яв-ляется окрестностью нуля, то существует N такое, что XN С Мт. Отсюда следует, что Хо£ MN+m. Мы выберем для каждого некоторое частное оптимальное управление: n
ф(х0) = {t/0, и19 ..uN_19 о, о, .. 4 для xQ&MN-MN_lt
Полагаем cpz (Хо) = Функция ср определена при N т9 так как тогда векторы е19 . .. ., eN независимы. Допустим, что ср определена на MN_r; определим ср на MN — Прямая,
проходящая через Хо в направления ТИдг-х и разрезает его . по некоторому сегменту (рис. 44). На этой прямой существует точка %* € Mtf-i такая, что
]Г, Хо] (144^ = 0.
Иначе говоря, существуют и I—1, +U такие, что
х0 - Г +
Г 6 AW,
V 1 0, 1 ],	-f- QueN £ Л4дг —
Полагаем .
eNi встречает множество
<Р(Хо) = 1<Ро(Г), Ф1(Г), . . Флг-2 (Г), и, о, о .. 4.
Пусть Хо = Х09 Х19 ..., Хп, ... —траектория системы, соответствующая управлению ср (Хо). При помощи индукции можно показать, что имеет место формула
Хп = Unex + Un+1e2 + • • • + 0N_2e^h~i + ^N-ieN-n-
В самом деле, допуская, что эта формула справедлива для п, имеем (используя соотношения = —h и Аеь == ei_1 для i >2):	'
Хп+1 — АХп Unh — UnAer -|- t/„+14e2 + • • • +	+
+ UN_rAeN_n + Unh = — Unh- + U + • • • + UN_^eN_n_2 + 4“ UN-LeN-n-l 4" Unh = i/n+lel 4~ •   ^ZzV-2eAT-n-2 ~Ь U^-i^K-n-1-Пусть X'o, Xi, . . ., X'n, . . . —траектория системы, определяемая начальным состоянием Хо = у* 4- &ueN, 0 £ ] 0, 1 ] и соответствующая управлению
<р (Хо) = {фо (ф’),. Ф1 (у),   ., фЛГ-2 (/).	°> 0 . . .} =
= (й0, и1г . . ., UN_„ Ви, 0, 0. .
345
Имеем
An =	4“ ^n+1^2 4" • • • 4" ^eN-^N-n-l 4" в^ЛЛ-П-
Следовательно, Xn£ MN_n. Положим
Л* = Une1 4~ Un+1e2 4~. • • • 4" ^-2^-n-i-
Тогда можно записать
Ад = л* 4- UN_1eN_ni
где f G Мдг_д_1, и
\/6ё]0, 1],ХД = 'П +	MN_n — MN_n^.
(
Отсюда следует, что
ф(Х„) = Я, t>„+1......Ду_2; Ду_ч 0,0.. .},
т. е.	z
Фо(ХП) = Ф«(Хо), Ф1(Х„) = фп+1(Х0), ...
Мы получаем следующий результат.’
Теорема 3. Функция ср, определенная выше, связывает с каждым начальным состоянием А0С J MN оптимальное управ-
_ N
ление ф(А0) “	• • •» ^v, • • • }М, равное нулю,начиная
с некоторого момента времени. Значение управления Un, примененного в момент п, зависит только от состояния системы в этот момент:
Un “Фо (Ад),
где фо (£) — параметр управления, примененного в - момент 0, если система находится в начальном состоянии g.
По общему, определению, стратегией называется всякое отображение ст из Rm (пространство состояний) в R (пространство параметров'управления). Стратегия называется допустимой, если для всякого gg Rm имеет место о (£) £ [—1, 4~1]. Если к системе применить стратегию ст, то ее движение будет описываться рекуррентным соотношением
Ап+1 = ЛХп + а(Хп)й.
Мы видим, что если с каждым начальным состоянием Ао свя“ зано управление ф (Хо), то движение системы осуществляется применением стратегии ф0.
346
2. НЕПРЕРЫВНЫЕ СИСТЕМЫ
Рассмотрим динамическую систему, описываемую дифференциальным уравнением
^2 = ДХ(О + С/(ОЙ,	(8)
где
dim(tf) = m, A£L(H, Я),
Функция U называется управлением. Сначала мы рассмотрим случай, когда U является кусочно непрерывным; иначе говоря, на каждом ограниченном интервале функция U имеет только конечное-число разрывов и в каждой точке разрыва имеет правый и левый пределы. Функция t—> X (£), соответствующая управлению U, называется траекторией системы. Кроме того, X (t) называется состоянием системы в момент t. Через Н обозначим пространство состояний. Можно задать значение X (t) как функцию от X (0) и [/:
t
X(/) = etAX(0) + J AhU{r) dr.	(9)
о
Определение. Состояние | € И называется приводимым в начало координат (иди, короче, приводимым) за время Т, если существует управление U и момент времени Т > 0 такие, что для X (0) = g имеет место равенство X (Т) = 0. Заметим, что, принимая U (/) = 0 для t > Т, мы получим X (0 = 0 для / > Т. Следовательно, всякое состояние, приводимое за время Т, приводимо также за время t > Т.
Утверждение о том, что состояние g приведено за время Т при помощи управления U, можно записать в виде
т
еТА | + Jл hlT^dr = 0, о
т. е.
т
| = — \e~'AhU(r)dr.	(10)
о
Теорема 4. Множество состояний, приводимых за время Т ►> 0, не зависит от Т. Оно представляет собой наименьшее подпространство пространства Н, содержащее h и инвариантное относительно А.
Доказательство. Пусть Зйг — множество состояний, приводимых за время Т. Формула (10) показывает, что является векторным подпространством пространства Н. Пусть Н' — наименьшее подпространство пространства Н, содержащее h и инвариантное относительно А. Пусть g — состояние, приводимое за
347
время Т при помощи управления U. Для любого [О, Г] мы имеем е~хА h £ Н'\ следовательно, | С Н'. Тогда cz И’. Кроме того, всякое состояние вида
i
Y it) — е~хА hU (%) dx
-о
является для t Т состоянием, приводимым в начало координат за время t, и тем более принадлежит множеству Следовательно, мы имеем dY (t)/dt£ т. е.
e-tAhU(t)^T.
Поэтому при произвольном U (t) имеем e-iAh£$RT для любого [О, Т]. Вычисляя k-ю производную при t = 0, получим Akh£ ЯЛТ для любого k = 0, 1, 2, . . ., откуда следует включение Нг с: 9)?г.
Наконец, мы имеем Hf =	.
Определение. Система, описываемая уравнением (8), называется управляемой, если любое ее состояние является приводимым в начало координат.
Из теоремы 4 следует, что для того, чтобы система, описываемая уравнением (8), была управляемой, необходимо и достаточно, чтобы наименьшее инвариантное подпространство, содержащее h и инвариантное относительно А, совпадало со всем пространством ТУ. При дальнейшем изложении этого параграфа мы будем предполагать, что исследуемая система является управляемой.
Теорема 4 показывает, кроме того, что если в качестве допустимых управлений брать кусочно^ непрерывные управления, то задачу о приводимости за минимальное время в непрерывном случае ставить нельзя, так как тогда всякое приводимое состояние можно, приводить за произвольно малое время. Для того чтобы задача о приводимости за минимальное время имела смысл, мы должны изменить множество допустимых управлений.
В дальнейшем мы рассмотрим последовательность управлений, удовлетворяющих ограничению вида | U (t) | К (/С>0). Заменяя h ч^рез пропорциональный вектор, можно добиться того, чтобы К = 1/ Тогда ограничение записывается в виде \U (/)|	1.
Рассмотрим теперь пространство £°° измеримых по Лебегу и существенно ограниченных действительных функций на 7?+. Формула (9) сохраняет смысл для U £ Поэтому,-мы можем-заменить условие «U кусочно непрерывно» условием «U Е L™ ». Два управления Ur и U2 будем считать равными, если почти всюду Т/i (/) = U2 (/). Учитывая ограничение | U (£)[	1, мы можем
считать, что U принадлежит единичному шару пространства
Рассмотрим также пространство £°° [О, И существенно ограниченных измеримых функций на [0, £]• Через || U || обозначим 348
норму элемента U этого пространства. Обозначим через Mt множество состояний g £ Н, приводимых в начало координат за время t (t 0) при помощи управления U £ £°°, удовлетворяющего условию || U ||	1. Согласно соотношению (10) множество Mt
состоит из элементов вида
t
% = — J е~хА hU (т) dx, где || U ||	1.
о
Имеем Мо = {0}.
Теорема 5. Множество Mt является симметричным выпуклым компактным множеством.
Доказательство. Пусть t > 0, множество элементов U С £[о,/] таких, что || U ||	1Л образует единичный шар в пространстве
А[о, г]- Между тем, является сопряженным к пространству £[о, q измеримых интегрируемых на [0, t] функций. Следовательно, единичный шар.в £[о, н слабо компактный (т. е. компактный в топологии простой сходимости на L[o,fj).
Отображение
t
U-* I = — J hU (т) dr о
является непрерывным отображением из пространства £[о, q, снабженного слабой топологией, в Я. В самом деле, если предположить, что Н = Rm, то
t
= —\(e~'Ah)lU (x)dx	т).
о
Так как функция т —> (e~xAtyl непрерывна, то она принадлежит пространству £[0,q, и, следовательно/ отображение U —* является непрерывным отображением ,из пространства L™Qt /], снабженного слабой топологией, в Н. Тогда множество Mt является непрерывным образом компактного выпуклого множества. Поэтому оно является выпуклым и компактным.
Теорема 6. Для t > 0 множество Mt имеет размерность, равную размерности пространства Н.
Доказательство. При кусочно непрерывных 6/, удовлетворяющих ограничению	1, множество Mt содержит любой
элемент вида
t
Y(f$)== — \e-'AhU{x)dx. о
Векторное подпространство, порожденное^ множеством является ничем иным, как множеством, гомотетичным множеству
349
Mt (так как множество Mt является симметричным). Следовательно, при кусочно непрерывном U его подпространство содержит все элементы указанного выше вида. Поэтому оно совпадает с Н, поскольку исследуемая система, по предположению, является управляемой.
Следствие. Для любого £ > 0 множество Mt совпадает с замыканием его внутренности Л1/. Заметим, что если t' t, то Mr cz М,.
Теорема 7. Если действительные части всех собственных значений матрицы А отрицательны, то U — #•
t
Доказательство. Пусть X (0) С Н. Применим управление U (/) = 0. Тогда мы имеем lim X (/) = 0. Так как при произволь-ных 0 ►> 0 множество Мв является окрестностью нуля, то существует Т такое, что X (Т) Е Ме, откуда следует, что X (0) Е Е Мт+в. Снабдим пространство Н нормой, а. операторы Z на Н нормой
||Z|| = sup||Zx||.
Н4< 1
Нижеследующая лемма устанавливает свойство непрерывности множества Mt относительно t.
Лемма. Каковы бы ни были Т > 0 и 8 > 0, существует т] > 0 такое, что для всех /, f, g, удовлетворяющих условиям
'	0 < f	t < Т;
 t — t'	rj;
существует g Е Му, для которого справедливо неравенство Ь-ГКе.
Доказательство. Пусть 0 <Ztr t Т, £ г Mh U Е £[°о, q такие, что |] U ||	1 и
t
g = — J e~xAhU (r) dx.
Положим
г
= — j e~xAhU (r) dx. о Тогда t
VEAfr и l — l' = — \e-^AhU(x)d%, t'
откуда следует
Jg - I'llК (*- П UH гДе /C = sup||e-n tg[0, TJ
350
Для заданного s возьмем т] = к\\н\\ * ^ля всех Удовлет" воряющих неравенствам 0 <; t' t Т, t — tr г], для любого g Е Mt имеется связанный с ним элемент g' Е Mr такой, ЧТО III — £'||< 8.
Следствие. Имеет место соотношение Mt ~ (J Mr.
о<г</
В самом деле, для любых 8>0 и g 6 Mt существуют tr <^t и g' Е Mr такие, что ||g —Кроме того, существует g" Е Mr такое, что || g' — g" ||	-у- . Отсюда следует, что
||g—Vll^8- Поэтому g принадлежит замыканию множества U Mt. Следовательно, Mt принадлежит замыканию этого множества. Так как Mt, кроме того, является замыканием своей внутренности, то этим самым следствие доказано.
Множество приводимых состояний имеет вид UMZ. Это пред-t
ставляет собой~ выпуклое множество. Нижеследующая теорема утверждает, что для любого g 'Е U Mz существует время t0 такое, t
что g является приводимой за время /0 и неприводимой за время t <t0.
Теорема 8. Пусть g Е Ц Mz. Множество значений t таких, t
что g приводимо за время /, имеет минимум /0.
Доказательство. Пусть tQ — нижняя грань значений t таких, что g Е Мы докажем, что g Е Mto. Пусть g $ Mto и пусть 6 — расстояние от g до М;о. Так как Mf0 замкнуто, то 6 >> 0. Найдется t >* t0 такое, что для любого и Е Mt существует uq£ М/о, для которого || и —	Далее получим
н-м0 ii—1|«0—«||>б-4=4-
Отсюда следует, что g $ Mz. Это противоречит определению t0.
Теорема 9. Сохраняя обозначения из теоремы 8, мы утверждаем, что g является граничной точкой множества Mt.
Доказательство. Если бы имело место включение g Е то для g Е мы имели бы - (согласно следствию из леммы) t < /0, что противоречит определению tQ.
Рассмотрим теперь управления, приводящие систему в начало координат за минимальное время. Для лучшей, интерпретации нижеследующей теоремы мы будем считать два управления равными, если они почти всюду принимают одно и то же значение.
Теорема 10- Если g является приводимым состоянием, то существует единственное «оптимальное» управление (/, приводящее систему в начало координат за минимальное время, начиная 351
с начального состояния g. Существует линейная форма W такая, что почти всюду имеет место равенство
U (t) = sgn(We~tAh).
Функция ф (t) = We~tAh имеет на каждом ограниченном интервале только конечное число нулей.
Доказательство. Так как g—граничная точка множества Л4/о, то в точке £ существует опорная к М/о гиперплоскость. Поэтому существует не равная нулю линейная форма W такая, что для любого g' £ Mt0 справедливо неравенство W%'	W%. Пусть
t о
g = \e~xAhU(x)dx.
О
Любому U' £ £[о, /0] такому, что || U' || «С 1, соответствует элемент
t0
= — J e~xAhU (т) dx, о
принадлежащий множеству 2И<0.
Поэтому для любого U' С £[о, /0], удовлетворяющего условию ||U' ||=^1> мы получаем
о	t о
W1-' = — J We~xAhU' (т) dx — J We~xAhU (т) dx = Wt, о	о
т. е.
to	t0	'	.
J We~xAhU (r) dx J We~xAhU (?) dx.
0	0
Следовательно, почти всюду должно быть
U (х) = sgn(We~xAh).
Заметим, что для любой линейной формы W функция ф (т) = = WexA h является суммой экспоненциальных полиномов. В самом деле, обозначая через D оператор дифференцирования, для любого полинома Л
• Р (О) (WexAh) = WP (D) ехА h = WP (Л) exAh.
В частности, если PQ — характеристический полином матрицы Д, по теореме Кэли—Гамильтона получаем PQ (Д) = 0; следовательно,
Ро (О) (WexAh) = 0.
Поэтому для любой линейной формы W функция <р (т) = WexAh является решением дифференциального уравнения Ро (D) у — 0. 352
Это решение, если оно тождественно, не равно нулю, имеет на каждом ограниченном интервале только конечное число нулей. То же самое справедливо и для ср. Следовательно, если W не равно нулю, то ф не может тождественно равняться нулю. Иначе мы для любого t имели бы etAh£ поу (1^), откуда для любого t >* 0 следовало бы Mt cz поу (UP), что противоречит предположению об управляемости системы. Теорема доказана.
Мы видим, что условие U (t) = sgn (We~iA h) (почти всюду) определяет U единственным образом, если учесть, что мы рассматриваем равными два управления, принимающие почти всюду одинаковые значения.
В дальнейшем мы можем принять
U(t) = sgn (We~iAh)
для всех t, для которых правая часть равенства имеет смысл. В точках, где We~tAh = 0, мы условимся принимать в качестве значения U'(t) ее правый предел. Оптимальное управление, которое определяется единственным образом, является кусочно непрерывной функцией, принимающей значения ±1. Моменты, когда происходит, изменение знака, называются моментами переключения. Соответствующие состояния будем называть точками переключения.
Замечание. Если все собственные значения матрицы А действительны, то число нулей решения уравнения PQ (D) у = Q (Ро — характеристический полином матрицы Д) меньше, чем степень полинома Ро, т. е. размерности пространства. Следовательно, число моментов переключения меньше, чем размерность пространства Н,
Из каждой точки х пространства Н выходит единственная оптимальная траектория, и значение U (0) оптимального управления в момент t = 0 для начального состояния х является функцией о точки х, которая всегда равна +1 или —1 (если иметь в виду оговорки, сделанные выше). Для любой оптимальной траектории X, каково бы ни было ее начало, имеет место соотношение U (0) = о (X (0)). В самом деле, управление t —> U (/ + 0) является оптимальным для начального состояния X (0).
Функция о осуществляет отображение пространства Н в пространство параметров управления. Мы назовем эту функцию стратегией. Эта стратегия является оптимальной в том смысле, что все оптимальные траектории являются решениями дифференциального уравнения
=ЛХ.(0 + <т(Х(0)Л.
Пример. Рассмотрим дифференциальное уравнение
где b> 0; кроме того, на управление наложено ограничение | U (t) |	1.
23 р. Паллю де Ла Барьер	353
Полагая dXHdt = X2t мы получим систему дифференциальных уравнений
dX2(t) dt
ХЧО —2№ (/) + [/(/),
т. е.
где
dX(t) dt
- AX(t) + U(t)h,
X(0 = [;“W], L*2(OJ’
ГО 1 ‘
—1 —2d
О' 1
h =
Собственные значения матрицы А суть корни характеристического уравнения s2 + 2&s + 1 = О,
дискриминант которого равен 4 (Ь2 — 1). Мы исследуем два основных случая: 1 и 1.
Первый случай: b> 1. Собственные значения имеют вид
S1 = — Vb2 — i; s2 = — b — Vb2— 1. векторов можно взять ~д_ Кд2— Г
—1 J ’
В качестве соответствующих собственных 'Ь + /й2 — Г -1
Сделаем замену базисной матрицы:
—1
Ki =
и Л'2 =
K=;tKi//c2j =
ь — V ь2 — 1
—1
Тогда, полагая X (/) == KY (О, мы получим
dY1
^ = S1Yi + h4J(tyt
_==52У2 + ^(0.
где
h~ Г~] -	1 р—Кд2—Г
~ ~ h2J ~ 2Кд^=Л [—Ь - д2 - 1.
При U (0 = 0 траектории асимптотически стремятся к 0 (рис. 45). При U (0 = +1 (соответственно — 1) траектории (получаемые сдвигом предыдущих) асимптотически стремятся к точке (Bi =-- Г 1 (соответственно св_1 =
2/б2—1 L- 1J
__ j/ У ~ [ /])’ ^означим через i (соответственно ^_i) семейство этих траекторий. Рис. 46 вычерчен для случая д= 1,1 (si = —0,642 и S2 = = -1,558).
354
Через О проходит одна траектория из семейства <§Гг, часть этой траектории до точки О обозначим через yi. Часть до точки О траектории из проходящей через О, обозначим через y_i. Всякая оптимальная траектория оканчивается либо дугой кривой у1, либо дугой кривой у-i. Так как имеются еще точки переключения, то траектории, кроме кривых yi и у.г, содержат: дугу траектории из семейства имеющей концы на yi и следующей по дуге у г, дугу траектории, семейства ^_i, имеющей концы на y_i и следующей по дуге y_i.
Следовательно, yi[jY_i представляет собой геометрическое место точек переключения. Оптимальная стратегия ст в зависимости от положения точки х относительно yi [J y_i принимает значения о (х) = +1 или ст (х) — —1.
Второй случай: 6<$ 1. Сделаем замену базиса по формулам у1 = х1 + ЬхЬ у2 = ах2.
Тогда дифференциальная система принимает вид
rfY1 (П = _ bYi (t) + aY2 (0 + bU (t);
dY2 (Ci (0 - &У2 (0 + aU (/).
Траекториями при U (t) — 0 служат логарифмические спирали (рис. 47). Уравнения траектории Го, проходящей через точку при /= 0, в полярных координатах записываются в виде
( 0 = — t КТ^ь2;
| р — e~bi.
Другие траектории получаются из нее вращением на произвольный угол вокруг центра О. Заметим, что на интервале длины Д/ полярный угол меняется на — М — Ь2.
23*
355
В дальнейшем термин «дуга спирали» будем употреблять для дуги спирали, полученной из Г о некоторым перемещением (или, что эквивалентно этому, произвольным движением подобия), соответствующим изменению на л полярного угла относительно асимптотической точки.
Рис. 46
При U (0 — +1 (соответственно U (t) ~ —1) траекториями служат логарифмические спирали, которые получаются из Го 'перемещением и имеют асимптотические точки сох = (соответственно	\ Обозначим
через (соответственно ^_i) семейство этих спиралей. 356
Рассмотрим оптимальную траекторию X, соответствующую оптимальному управлению U. Согласно общей теории, получаем U (t) = sgn (ср (/)), где <р (0 — решение дифференциального уравнения
Z" — <2bZ' + Z = 0.
Тогда
Ф (t) = e+bi (с cos at + d sin a/), где
a = Kl — b2.
Следовательно,
(0 — sSn (c cos atd sin at).
Полагаем 0 — 2л/а. Находим, что моменты переключения образуют арифметическую прогрессию с разностью, равной
0 ___ л ____ л
2 “ a “	— Л»2 *
Между двумя последовательными моментами переключения точка описывает в отрицательном направлении дугу спирали (из семейства если [/ (0 =+1, и из семейства ^_х, если U (0 = —1). Через точку. О проходит траектория из семейства <^_х; дугу этой траектории до точки О обозначим через ух (рис. 48).
Через ту же точку О проходит траектория из семейства ^_х; дугу этой траектории до точки О обозначим через у_х. Всякая оптимальная траектория, не совпадающая с дугой кривой ух или кривой у_х, имеет последнюю точку переключения тх, расположенную либо на ух, либо на у_х. Если mx £ ух, то при U (0 — +1 траектория оканчивается дугой кривой ух. Если т1 £ у_х, то при U (0 = —1 траектория оканчивается дугой кривой у_х.
Рассмотрим, например, случай тх^ух. До перехода через /их точка перемещается по спирали из семейства <^_х и описывает (по крайней мере) некоторую дугу. Поэтому точка переключения т2, предшествующая точке тх, получается из тх при помощи гомотетического преобразования с центром в со_х и отношением — е&0/2. Продолжая эти рассуждения, можно постепенно построить участки рассматриваемого оптимального управления (рис. 49).
357
358
Заметим, что когда точка т1 пробегает уг, точка /п2 пробегает дугу спирали yj, полученной из у при помощи преобразования гомотетии с центром в (0_! и отношением —ebQt2. Таким образом, точка т3 пробегает дугу спирали у*, полученной из yj при помощи гомотетии с центром в о)х и отношением — еь^2.
Аналогично шаг за шагом можно найти геометрическое место точек переключения для траекторий, оканчивающихся дугой кривой ух.
Такую же конструкцию можно осуществить для оптимальных траекторий, оканчивающихся дугой кривой у.-р и получить картину, симметричную относительно точки О. На рис. 50 указано полностью геометрическое место точек переключения.
Таким же образом можно построить кривые, образующие границу множества Mt (для /, кратных 0/8). Эти кривые образуют геометрическое место точек, приводимых за минимальное время t. В зависимости от положения точки х относительно геометрического места точек переключений оптимальная стратегия о принимает значения ст (х) = Ч~1 или о (х) = —1.
ГЛАВА 18
ПРИНЦИП ПОНТРЯГИНА
1.	НЕКОТОРЫЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
Пусть дано линейное дифференциальное уравнение
^ = ф(0Х(/),
где X (t) — элемент пространства Банаха Я, а Ф (/) — непрерывный линейный оператор на Я, непрерывно зависящий от t относительно равномерной топологии пространства L (Н, Н).
Для любого tQ и произвольного g С Я существует единственное решение X (/) такое, что X (t0) = Значение функции X (t) в момент t зависит линейно и непрерывно от X (/0); Резольвентой уравнения называется оператор A (t, tQ) такой,.что
X (0 = A (t, f0) X (Q.
Имеем
А (/0, Q = 1;
Д (/2, ti) А (£ь t0) = A (t2, /о);
А (^, to) = A-^to, tj.
Кроме того,
/о) = Ф(О.Д(^, t0)
и это дифференциальное уравнение в пространстве L (Н, Н) имеет решение А (£, /0), принимающее начальное значение А (*0, *о) = 1.
Пусть теперь дано дифференциальное уравнение
где X (/) принадлежит пространству Банаха Я, а функция F : х, t —> F (х, t) непрерывна и имеет непрерывные частные производные Fx относительно первого аргумента Ч
1 Когда мы говор им, что функция от нескольких аргументов имеет непрерывную частную производную относительно одного из них, то мы подразумеваем, что эта производная существует и непрерывна относительно всех аргументов. 360
Пусть X — решение этого уравнения, определенное на отрезке [/0, tr]. Для g, принадлежащего окрестности точки X (/0), существует' решение X (/), определенное на [t0, /Ди удовлетворяющее начальному условию X (t0) = g. Отображение X (70) —> —> X (t) является дифференцируемым и его производная в точке X (tQ) равна резольвенте А (/, /0) линейного однородного уравнения (называемого линеаризированным уравнением):

Это свойство обобщается на случай, где F является кусочно непрерывной относительно t в следующем смысле: для каждого интервала [/0, /Д существует конечное число точек 90 = /0, 9Ь . . 9р = tr таких, что 9t_r <9Z, и функций FFp таких, что Ft определены и непрерывны на Я X [9,_х, 9Д; последние допускают непрерывные частные производные (Fi)x относительно первого из аргументов и удовлетворяют соотношению/7 (х, /) =• = F; (х, t) для /£ ] 6/_1, 6/ Ь
В этом случае под решением уравнения
=	t),
определенным на отрезке [/0, /Д, подразумевается непрерывное отображение /—>%(/), удовлетворяющее соотношению
=	/) для / е]9._ь од.
Сформулируем теперь следующее утверждение.
Предложение 1. Пусть заданы два линейных дифференциальных уравнения
^р_ = Ф(0Х(0;

первое в пространстве Банаха Я, второе в пространстве Н', сопряженном к Н. Через Ф* (/) обозначим оператор, сопряженный к оператору Ф (/). Отображение tФ (/) предполагается кусочно непрерывным. Тогда А (/0, /х) и В (/0, /1), которые обозначают резольвенты этих двух уравнений, удовлетворяют соотношению
Доказательство. Имеем
в (tQ, /,) = д* (/п /0).

= <Ф(/)Х(0, P^-{Xit\ o*(0^(0> = o,
361
откуда
<X(t0), Р(10)) = (Х(У, Р(4», т. е.
{X Цй\ В (t0> fx) Р (Q) = {А (/х, t0) X (Q, Р (t,))
(каковы бы ни были X (Zo) £ Н и Р (Zx) £ Н').
Следовательно,
в (;0, G) = л* (G, /о).
2.	ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Пусть Н — пространство Банаха, К — топологическое пространство, I — интервал из R (конечный или бесконечный). Рассмотрим систему, движение которой описывается следующим уравнением:
^> = НХ(0,	t).	(li)
Состояние X (f) системы в момент времени t есть элемент пространства Н. Отображение f : х, и, t—> f (х, и, f) представляет собой отображение из пространства Н X К X I в Н. Функция U : t —» U (7), называемая управлением, является отображением из отрезка Uo, cz I в К. При заданном управлении система описывается обыкновенным дифференциальным уравнением.
В этой главе мы будем предполагать следующее:
a)	f есть непрерывное отображение, допускающее производную f'x относительно первого аргумента, и f' непрерывна на И X К X /;
б)	рассматриваемые управления, называемые допустимыми, кусочно непрерывны; иначе говоря, на любом конечном интервале они имеют только конечное число точек разрыва.и в каждой точке разрыва существуют левые и правые производные.
Если допустимое управление U уже выбрано, то отображение х, t —> f (х, U (i), t) становится кусочно непрерывным относительно t (см. параграф 1 этой главы).
При любом начальном значении X (х0) = х0 уравнение (11) имеет единственное решение х : t —> X (£), определенное на отрезке По, t0 + 6]. Это решение X мы будем называть траекторией, соответствующей управлению U. Задачей об управлении называется всякая задача о нахождении управления, оптимизирующего некоторый критерий вдоль траектории.
Различают:
задачи с фиксированным горизонтом, в которых нужно найти управление, определенное на фиксированном интервале, например [О, Т], для которого соответствующая траектория (при заданном начальном значении) определена на том же интервале; 362
задачи с неопределенным горизонтом, среди которых можно упомянуть задачу о быстродействии, изученную в предыдущем параграфе.
По форме критерия . различаются:
задачи об управлении конечным состоянием, в которых критерий выражается в виде функции от конечного состояния системы;
задачи с интегральным критерием, в которых критерий имеет вид
t0+Q
( g (X (t), и (0, t) dt.
to
Наконец, мы различаем два случая, в которых конечное состояние системы свободно или стеснено ограничениями. В действительности, некоторые из этих задач при помощи подходящих преобразований можно исключить. Иногда некоторые различия в этих задачах можно исключить при помощи подходящим образом выбранного преобразования, изменяющего формулировку задачи. Наоборот, другие различия сохраняются, и в некоторых случаях мы вынуждены делать дополнительные предположения..
3.	СЛУЧАЙ, КОГДА ГОРИЗОНТ ЯВЛЯЕТСЯ ФИКСИРОВАННЫМ, А КОНЕЧНОЕ СОСТОЯНИЕ СВОБОДНЫМ
Рассмотрим наиболее простой случай, который можно было бы рассмотреть как частный случай задачи об управлении конечным состоянием с ограничениями, однако ввиду его важности мы исследуем его отдельно.
Рассматриваемый случай не требует дополнительных ограничений и удобен для различных обобщений. Следовательно, его исследование может служить хорошим введением для задач, рассматриваемых в следующих параграфах.
Рассмотрим систему, описываемую уравнением
*£-=f(X(t),U(t),t)
с начальным условием X (0) = х0- Фиксируем интервал изменения времени [0, Т]. Рассмотрим управление U такое, что соответствующая траектория определена на [0, Т]. Пусть функция g, называемая критерием на конце, дифференцируема в Н. Управление U будем называть максимальным (для заданных х0 и g), если g (X (Т)) (которая является функцией от 6/, определенной на множестве допустимых управлений) имеет абсолютный максимум при U ~ U. Требуется найти необходимые условия, при выполнении которых управление являлось бы максимальным. В дальнейшем мы будем предполагать, что g' (X (Т)) =£ 0. Заметим, что g' (X (Т)) есть элемент топологически сопряженного, пространства Н' к Н. Элемент g' (X (Т)) будем называть линеаризированным кри-363
терием на конце. Если не считать случая, когда g является линейной, функция g' (X (Т)) зависит от конечного состояния X (Г).
Линеаризованное однородное уравнение (И) в окрестности траектории X записывается в виде
=	U(t), t)8X(t).	(11')
Присоединим к нему уравнение
^- = -fx(X(t), U(t), t)P(t),	(12)
называемое сопряженным уравнением, с условием на конце
Р (Т) = s’ (X (Т)); здесь Р (/) 6 Н'. .
Уравнение (12) представляет собой линейное однородное уравнение; его решения принадлежат пространству Н'. Функция t —-> Р (t) определена на [О, Т], ее значения принадлежат пространству Н\ она кусочно дифференцируема допускает разрывы только в точках, в которых претерпевает разрыв функция Оу Если критерий на конце является линейной формой w, то Р (/) определяется из системы-
=	U(t), t)P(ty
P(T) = w.
Теорема 1 (принцип Понтрягина, первая формулировка). Для того чтобы управление U являлось максимальным, необходимо, чтобы в каждый момент /,(при котором U является непрерывным, выполнялось соотношение
</(ЗД, 0(t\ ty Р (ty (%(/), ut ty P(ty. (13)
Доказательство, а) Пусть tQ £ ]0, T] такое, что 0 является непрерывной в точке t0. Заменим управление 0 через управление UXi зависящее от параметра т 0, и исследуем соответствующее изменение конечного состояния системы. Пусть и £ К. Определим управление Ux таким образом:
для	^ol;
т( lt/(Z) ДЛЯ /е [0, t0-т[ и [^0, П
При этом мы предполагаем т достаточно малым, чтобы U оставалось непрерывным на отрезке [/0 — т, /0]. При т = 0 мы имеем Ux = о.
364
Покажем, что при достаточно малом т можно определить соответствующую траекторию Хх, принимающую начальное значение Хх (0) = х0. Для этого возьмем 8 > 0 такое, что уравнение
имеет решение, принимающее'начальное значение X (/0) = X (Zo) и определенное на отрезке Ио —	/0Ь Так как
limX(/0-T) = X(/0), т->о
то при достаточно малом т 8 уравнение допускает решение на отрезке Ио— s, /0L принимающее начальное значение X (t0 — — т) = X — т).
Иначе говоря, для достаточно малого т функция Хх определена при любом [0, /0]. Кроме того, мы получаем
lim Хх (*0) = X (Q„
т->0
откуда следует, что для достаточно малого т функция Хх определена также на отрезке Ио, Т].
б)	Исследуем Хх (/<>)• При т = 0 мы получаем Хх (/0) = X (/0)-Вычислим производную функции Хх (/0) по т при т = 0 (вычисление позволяет установить одновременно и существование этой производной).
Имеем
to
XT(Q = X(/0-T)+ J f(Xx(Q), и, 0)d9.
to—т
Между тем
X (t0 - T) = X (/0) - t(-^ + 01 (T) =
= X(/o)-Tf(X(Q, U(t0), /«j + oxW
И
10
J	u> 6) dQ = if (X (t0), и, /0) -T o2 (t),
to—T
где
lim.JI- WI =iim I“ Wl =0 t->0 T	r->0 T
365
Следовательно,
хх (U = X (U +
+ т [f (X (Q, и,(X (*0), U (/0), Q] + о (т), где
Пт1£Ж = о.
Т->0 т
х Отсюда следует, что производная функции Хх (Zo) при т = О имеет вид
[_^ol.]^0 = Z(X(/o)j /0)-f(X(Q, U(t0), t0).
в)	На интервале Uo, Т] применяется управление (7, поэтому для исследования Хх (Т] можно использовать резольвенту уравнения (1Г), которую мы будем обозначать через А (•,•). Таким образом, мы имеем
[-^1Г1]г=э = Л<7’- ^о) [f(X(/е), «, M-f(X(M, U«o), QI.
г)	Выразим теперь аналитически условие, при выполнении которого U является максимальным.
Мы имеем
[48Лт)]„0<о,
т. е.
([тгЪ
или
/Г dA*(r)..l , р(Т)\=^о,
\L	J т=0 ’ v 7 /
откуда последовательно получаем
(Д(Т, *„) [/(X(Q, и, t0)-f(X (Zo), UJ, Р(Т))<0;
(f (X (t0), и, t0) - f (X (Q, U (t0), i0), Д* (T, t0) P (T)) < 0..
При помощи предложения 1 мы получаем, наконец:
(/ (X (/0), и, /0) - f (X (Zo), U (Zo), /0), Р (/0))	0,
т. е.
</(X(f0), и, t0), р (t0)) ^<f(x (/0), u(t0), t0),~p(t0)),yueK.
366
Отсюда следует доказательство теоремы при /0 ¥= 0. Для доказательства теоремы при t0 = 0 достаточно в предыдущем неравенстве устремить t0 к нулю. Приведенное доказательство мы можем " интерпретировать при помощи понятия континжана.
Определение. Пусть Е — часть векторного пространства Н и х 6 Е. Дугой с началом в точке х, проведенной в Е, называется непрерывное отображение т —> gt интервала [0, т0] в £, удовлетворяющее условию go — х и дифференцируемое при т = 0. Его производную при т = 0 будем называть вектором касательной. Векторным континжаном пространства Е в точке х называется множество векторов, касательных в точке х к дуге с началом в х> проведенной в В.
Векторный континжан пространства Е в точке х есть конус,, содержащий 0.
Обозначения. Через Г (t) (t £ [0, 74) мы обозначаем множество состояний X (£), где X — некоторая траектория системы, удовлетворяющая начальному условию X (tQ) = х0. Элементы множества Г (/) будем называть достижимыми состояниями за время t (начиная от начального состояния х0). Для всякой траектории X, очевидно, справедливо включение X (/) Е Г (/)_Пункт б) приведенного выше доказательства позволяет установить справедливость следующего утверждения: пусть U — управление,. X — соответствующая траектория, t0 — точка, в которой U непрерывна. Тогда все векторы вида
. f (X (t0), и, t0) — f (Х(/о), С7 (^0), t0), где и £ К принадлежат векторному континжану множества Г (t6) в точке X (/0).
Поскольку U — управление, X — соответствующая траектория, t0 — некоторый момент времени € [0, Т], вектор h принадлежит векторному континжану множества Г в X (t0)', то вектор А (Т, /0) принадлежит векторному континжану множества. Г (Т) в X (Т).
В . самом деле, пусть h =	где €-Г (/0). Применим
управление U на интервале [£0, Т]. Пусть Хх — соответствующая, траектория, удовлетворяющая начальному условию Хх (t0) = = |х.При достаточно малом т эта траектория определена на интервале [/о, У], и мы получаем
Хх(Т)£Г (Т);
. = А (Т, t0)	1	= А (Т, t0)h.
ах J т=о 4 L	J т=о v
367
Пункт в) приведенного выше доказательства позволяет приме-нитьэто замечание к вектору
h = f(X (U и, /0) - f (X U (Zo), /0).
Наконец, из пункта г) следует, что если U является оптимальным, то всякий вектор k векторного континжана множества Г (Т) в X (Т) удовлетворяет соотношению
(й, g' (X Т)))^0.
Иначе говоря, векторный континжан множества Г (Т) в X (Т) содержится в одном из замкнутых полупространств, определенных линейной формой g' (X (Т)).
Замечания. I. Интерпретация, которую мы дали выше, показывает, что в доказательстве теоремы 1 предположение о максимальности можно заменить менее сильным предположением. В самом деле, можно использовать то обстоятельство, что для всякого вектора k, принадлежащего векторному континжану множества Г (Т) в X (Т), справедливо неравенство
<*, g' (X (Т))>	0.
. Если мы условимся выражать это условие по-другому, а именно, g является квази-максимальной на Г (Т) в X (Т), то мы сможем формулировать теорему 1 в следующей весьма сильной форме: если U — управление такое, что g является квази-максимальной на Г (Г) в X (Т), то во всех точках, в которых U непрерывна, справедливо соотношение
*
</(Х(0, О, Р(/)>=тах</(Х(/), и, t), Р (t)), и
где Р (/) определяется из системы
.	=—/=;* (х (о. u(t),
Р (Г) = g' (* (Г)).
II. Доказательство, данное для случая, когда /7 является пространством Банаха, в основном сохраняется и в случае, когда /7 — абстрактное дифференцируемое многообразие класса С2. Критерий g на конце всегда является дифференцируемой функцией на /7, а линеаризированный критерий g' (X (Т)) есть элемент кокасательного пространства к Н в точке X (Т). Аналогично Р (t) есть элемент кокасательного пространства к 77 в точке X (/).
Для интерпретации уравнения (12) можно рассмотреть конечное число листов, образы которых покрывают геометрическое место точек X (/) для ££ [0, Т]. На каждом из этих листов уравнение (12) записывается в виде системы обыкновенных дифференциальных уравнений.
368
4. СЛУЧАЙ КРИТЕРИЯ НА КОНЦЕ С ФИКСИРОВАННЫМ ГОРИЗОНТОМ И ОГРАНИЧЕНИЯМИ НА КОНЕЧНОЕ СОСТОЯНИЕ
Рассмотрим систему
^ == f (X (t), U (t), t)
и фиксируем интервал изменения времени [О, Т].
Предложение 2. Пусть UQ, . . ., ир_± суть р допустимых управлений, t19 . . ., 1Р_Г (0	tp_r Т) — р 1
момент, где UQ, . . ., ир_± непрерывны. Положим tQ = 0, . . ., tp = Т. \ Определим управление U (t) = Ut (t) для t^] t., /Z+1L Предполагаем, что для частных значений . . ., /р_1 переменных к, . . ., /p_i и для начального состояния Х°(0) определена траектория Х° на [О, Т]. Тогда существуют 8 > 0 и окрестность V точки Х° (0) такие, что для |	| е
и X (0) € V траектория X определена на [0, Т] -и непрерывно зависит от tlf . . ., tp^ X (0) в топологии равномерной сходимости.
Доказательство.. Покажем, что для любого k = 1, . . ., р и любого положительного числа существуют 8fe > 0 и окрестность V точки Х° (0) такие, что
X определено на [0, tk] и |
I ti — t°i I — 8a j (/=],...,£) =-> x(0)ev
Это утверждение справедливо для k — 1. Допустим, что оно справедливо для некоторого k, и докажем, что это имеет место для k + 1. Пусть pa+i > 0. Существуют e.'k и pfe > 0 такие, что
\tk	8а
| ^А+1-^А+1 | 8а
ЛХ(*а)-Х°(/аЖра.
• X определено на [tk, ^a+i! и 1 .||Х(0-Х0(/Жра+1,У^Па, *a+i]|
Пусть ёа и V соответствуют числам рй. Положим 8А+1 = = min (efc, 8а). Тогда мы имеем
[	8A-pl
(j= 1,.. .,' k+ 1)
X(0)€ V
X определено на [0, ^a+iI .h | .||Х(0-Х°(0Кра+ь V*€[0, *A+1]j
Доказательство завершено. Заметим, что оно сохраняет силу и в том случае, когда некоторые из чисел t°{ переставлены местами.
Будем обозначать в дальнейшем через U допустимое управление, определенное на [0, Т] и такое, что соответствующая тра-24 р. Паллю де Ла Барьер	369
^(0 =
ектория X, удовлетворяющая начальному условию X (0) — х0, определена на [0, 74. Через А (•,•) обозначим резольвенту уравнения
Мы исследуем изменение конечного состояния при «малом» изменении U, начиная от (7, и займемся более подробно, чем в предыдущем параграфе, векторным континжаном множества Г (Г) в X (Т).
Теорема 2. Пусть Л € Н\ т 0; .е (/)—функция с значениями в Н такая что lim е (т) — 0;	0, иъ . .
т->0
. . ., Uj Е К\ t0 € ] 0, Т] —точка, в которой U является непрерывным. Полагаем А/ = М + • • • + А/, Ао — 0.
Рассмотрим управление Л7Х, определенное на [0, /0]:
tbj для t Е [/0 * Аут, to * Ay—it[
U для других значений t
и траекторию Хт, соответствующую этому управлению и удовлетворяющую начальному условию
Хх (0) = X (0) + т/i + Т8 (т).
Для достаточно малого т траектория Хх определена на [0, и справедливо соотношение
j
Хх (/о) X (/0) + ТА (t0, 0) h + т 2 К [/ (% (<о), «/, /о) -/=1
-f (X (/0), й (t0), Q] +т81(т),
где lim 81 (т) = 0.
т~>0
Если предположить, что параметры Ау удовлетворяют условию j
2 \	1, вектор h изменяется в ограниченном множестве, а функ-
/=1
ция 8 равномерно стремится к нулю при стремлении т к нулю, то функция 8Х равномерно стремится к нулю'при стремлении т к нулю.
Доказательство. Существование Хх на [0, при достаточно малом т следует из предложения 2. Рассмотрим далее дифференциальное уравнение
Пусть <р — отображение, которое паре g, 0 приводит в соответствие значение X (0) решения X, удовлетворяющего условию 370
X (0) = 5- Очевидно, что ф является непрерывно дифференцируемым отображением, и мы получаем
Ф^(Х(О)Ло) = Л0о, 0);
Фе(Х (0) Jo) - Ж (*о),
Следовательно,
Xt (t0 — А-л) = <р (X (0) + xh + те (т), t0 — Kjx) =
= X (t0) + tA (t0, O)h — Kjxf(X(to), U (to), to) 4- t82 (t), где e2 (т) —> 0 при т —> 0.
Кроме того,
to ,
Ат (h) = Ат (to - Хл) 4-	J f (Хт (t), Ux (t), t) dt =
J Z0“X/-lT
= Хт(^о-%л)4-,2 J f(xx(t),uht)dt.
1=1 '(Hf
Между тем при т —> 0 и t —> t0 функция Хт (t) стремится к X (/о). Следовательно,
*0-^/—1Т
J f (Хт (t), и„ t) dt = Kfcf (X (to), «/, to) 4- T83, i (T), f0~x/x
где e3 у (т) —> 0 при т —> 0. Отсюда мы получаем
XT (to) = Хт (to -ф- A,jt) + т 2 hif (X (to), ttj, to) -j- T63 (r), /=1
где j	'
e3(r) = S e3|/ (т), e3(т)-> 0 при 0.
/=1
Подставляя полученное значение для Хт (to — %}т), мы получим формулу, приведенную в формулировке теоремы, где == = 82 + 83-
Для доказательства второй части теоремы мы покажем, что при сделанных предположениях е2 и 83>/ равномерно стремятся к нулю. Для е2 это вытекает из следующего свойства рассмотренной выше функции ф: пусть ф — непрерывно дифференцируемое отображение; тогда имеет место формула
Ф (г0 + т/г + те (т)) = ф (z0) + тф' (z0) (/г) + тех (т),
24*
371
где 8i стремится равномерно к нулю, когда h принимает значения из ограниченного множества, а 8 стремится равномерно к нулю при стремлении т к нулю.
Кроме того, имеем
|| е3 , (т).||	sup || / (Хт (О, р/, t0) - f (X (/0), fxz„ t0) ||.
\-1т]
' Из предложения 2 следует, что Хх (f) стремится к X (/) равномерно относительно /, h и 8. Отсюда легко видеть что правая часть неравенства равномерно относительно 8 и h стремится к нулю при стремлении т к нулю.
Доказательство, таким образом, завершено.
Теорема 3. Пусть . ., th . . .,	6]0, Т] — возрас-
тающая последовательность точек, в которых функция U непрерывна, и пусть для любого i имеем
ut/€tf(/=l,	Л);
к/>0,
Где
t. /
Положим
/
~ 2 k, 0 = 0.
k=A
Пусть Ux — управление, определяемое равенствами f j Я t \t$	i , j—1*^]»
(0 — | для других значений /.
Тогда: 1) существует Tj, такое, что для т sC тх соответствующая траектория, определяемая начальным условием Хх (0) — X (0), имеет вид
Хх (Т) = X (Т) + т 2 V ,А (Т, h) [f (X (ti), Щ' j, t{) -i, J
-f iXft,), U(tt), ^)]+T8(T),
где 8 (т) стремится к нулю;
2) если, кроме того, параметры изменяются (при этом точки и элементы uLj остаются без изменения), то 8 (т) равномерно стремится к нулю.
Доказательство. Можно 'всегда предположить, что tj = Т (в противном случае мы могли бы добавить tf+1 = Т и%/+1;- = 0). 372
Существование Хх на ГО, Т ] при х ^ х} (-14 не зависит от чисел z) следует из предложения 2. Методом индукции докажем, что
(₽)
Хх (4) = X (tk) + х S к, Л (h, ti) Ifx (tt), uit i, tt) -i^k
<=l......Ji
-f&iQ, U^),
где 8ft' (т) стремится к нулю.
, При k — 1 доказательство вытекает из теоремы 2. Если оно 'вернодля k, то из теоремы 2 следует, что для достаточно малого х функция Хх определена на [^, 4+11 и имеем
Хх (h+1) = X (^+1) + хА (tk+1, tk) S %t- jA (tk, ti) X j<=.k
/=1....Л
X [/(X(tz), uh h tz)-f (X(tz), U&), tj] 4-
4~ Zj ^k+i, i [f (^+i)> ^+1, /, ^+1)
/=1, .... jk+1
f (X (tk+i), U (^л+i), ^+i)] + T8&+i (T),
где 8£+1 (t) стремится к нулю, т. е. мы получили соотношение ф), в котором k заменено на k + 1. Утверждение 1) теоремы доказано.
Для доказательства утверждения 2) достаточно показать (при помощи индукции, основанной на второй части теоремы 2), что при стремлении т к нулю zk равномерно стремится к нулю. Как и раньше, через Г (Т) обозначим множество достижимых конечных состояний из начального состояния X (0). С другой стороны, через LT мы обозначим выпуклую оболочку множества векторов вида
А (Т, t0) [f (X (t0), и, tQ) - f (X (t0), U (to), t0)], .
где t0 — точка, в которой функция U непрерывна, и и б К. Всякое g Е LT допускает представление вида (*)
(*)	? = 2М(^>	Щ.Ь ti)-f(X(ti), U(t{), tt)],
i, j
где
tzE] 0, T] (t = 1, .	Z);
К (/“h-- •, Л), непрерывна в точке tz;
/
Наконец, через Кт мы обозначим конус, порожденный множеством LT. Тогда из теоремы 3 вытекает следствие.
Следствие. Конус Кт содержится в векторном континжане множества Г (Т) в X (Т).
373
Предложение 3. Пусть г dim (Кг). Пусть xlf . . ., хг суть г независимых векторов, принадлежащих конусу Кт.
r	I
Пусть | = 2 ИЛ*— линейная комбинация векторов	О,
г ' \
2 Hi = 1 • Тогда для любого g существует семейство траекторий i=l	/
Xg, Т) определенных для [0, тх] таких, что
XgjT = X для т = 0;
Хв,т (0) = X (0);
Xg,t(T) = X(T) + ^+Teg(T),
где функция 8^ (т) стремится к нулю при т —> 0 равномерно относительно когда £ описывает выпуклую оболочку 2 векторов
Доказательство, а) Предположим, что хъ : . LT. Любой xk (k = 1, . . ., г) допускает представление вида (*). Обозначения можно изменить так, чтобы точки являлись одними и теми же для хь . . ., хг. Для tt точки uit соответствующие различным xk, объединяем в одно семейство. Тогда мы получим
xk = ^^}A(T, ti){f(X(ti), и^, ti)-f(X(ti), U(ti), /,)], I, I
где ti суть точки, в которых U непрерывна и 0, v^==i, г.
i,	j
Пусть, далее,
k=l __ • / Положим
= 2
Согласно теореме 3, каждому ц соответствует траектория X^t т, определенная для т С [0, тх]. Мы имеем
хв, t (Т) = X (Т) + т S (Т, ti) [f (X (ti), Ui. h ti) - . i
- f (X (ti), U (ti), /<)] + T8g (t) = X (T) + Tg + T8g (T),	-
где eg (т) равномерно стремится к нулю, когда g описывает 2-374
б) Допустим, что xlt . . ., хг£ Кт. Существует р > 0 такое, что рх19 . . ., pxrC LT. Отсюда следует, что pg С Lt- Следовательно, достаточно положить
т = ХР£, т/р.
Теорема 4. Пусть г < dim (Кг). Пусть xlf . . ., хг суть г независимых векторов, принадлежащих конусу Допустим, что 2—выпуклая оболочка множества векторов xz. Существуют т0 > 0 и для тС ] 0, т0] непрерывное отображение фг из множества 2 в Н такое, что:
1) при т, стремящемся к нулю, отображение фт равномерно стремится к тождественному отображению множества 2;
2) луч с началом в X (Т)-и направлением фх (g) встречает множество Г (Т) в точке, отличной от X (Т).
г
Доказательство. Каждому g = 2 соответствует траекто-рия т, определенная согласно предложению 3. Следовательно, достаточно положить
Для дальнейшего изложения нам нужен следующий результат из алгебраической топологии.
Лемма 1. Пусть в аффинном пространстве Р размерности п заданы симплекс 2 размерности п и семейство непрерывных отображений Фт (0 <Ст<;т0) симплекса 2 в стремящихся при т —> 0 равномерно к тождественному отображению. Тогда для любого g, лежащего внутри 2, существует т] > 0 такое, что'
gCval^t).
Следствие. Пусть Е-— векторное пространство размерности п, М — аффинное многообразие размерности р, 2 — симплекс размерности р, заданный в М. Пусть V — аффинное многообразие такое, что не существует никакой гиперплоскости, содержащей V и 7И, и что V содержит внутреннюю точку симплекса 2- Пусть далее задано семейство непрерывных отображений фг (0 << т т0) симплекса 2 в стремящихся при т —> 0 равномерно к тождественному отображению.
Тогда существует п >> 0 такое, что
П Фт(2)¥=0.
Доказательство. Сдвигом можно добиться, чтобы О С V П 2 и чтобы 0 являлся внутренней точкой симплекса 2-
а)	Допустим, что dim (/И) + dim (V) = п. Тогда М и V являются двумя взаимно дополнительными векторными подпространствами. Пусть Р — проектор на Л4, параллельный V. Отображение Рофт является непрерывным отображением из 2 в М, кото-
375
рый при т —♦ 0 равномерно стремится к тождественному отображению. Тогда существует и > 0 такое, что для т г] справедливо 0 6 (^°фг)(2), т. е. ОСР (фг (£))• Отсюда следует, что у П Фт (S) ¥= 0-
б)	Допустим, что dim (Л4) + dim (7) > п. Пусть — подпространство, дополнительное к М и содержащееся в V. Тогда существует т] >> 0 такое, что для т трсправедливо 71f| срт (2) =h 0, откуда следует V П Фт (S) + 0-
Предложение 4. Допустим, что dim (//) = dim (/Сг) = п. Пусть Д — луч с началом в 0, расположенный внутри Кт. Тогда луч X (Т) +- Д пересекает Г (Т).
Доказательство. Пусть | С Д (£ находится внутри КТ). Существует п независимых векторов х19 . . ., хп, принадлежащих Кт и таких, что g находится внутри симплекса 2, порожденного векторами х15 . . ., хп. Рассмотрим семейство срт отображений, определенных в теореме 4. Согласно следствию леммы 1, существует т >> 0 такое, что X (Т) + Д пересекает (2) в точке у. Тогда существует р > 0 такое, что X (Т) + ру 6 Г (Т).
Предложение 4 доказано.
Теперь мы используем приведенные выше результаты для исследования условий оптимальности в случае, когда' конечное состояние X (Т) принадлежит некоторому аффинному многообразию Нq пространства Н.
Пусть Нq определено равенствами вида
(х, 1^)=^, А=1, х, vk£H'.
Пусть Н'. Предположим, что vu . . ., vH, w независимы. Управление U будем называть максимальным, если соответствующая траектория X определена на [0, Т] и удовлетворяет условию X (Т) 6 и если для любого допустимого управления U такого, что X определена на [0, Т ] и удовлетворяет условию X (Т) 6 HQi справедливо неравенство
(Х(Т), йУ)<<Х(Т), w).	.
Обозначим через Н+ пересечение многообразия HQ с полупространством, определяемым уравнением
(х,	w).
. Если U является максимальным, то Q Г (Т) — 0, и наоборот.
Пусть Vo — векторное подпространство, параллельное многообразию Яо, и 7^ — пересечение подпространства 70 с полупространством, определяемым неравенством <х, w) 0. Мы имеем 376
Но = Vo + X (Т) и = V(f + x (T). Подпространство % определяется уравнениями {x,	= 0 (& = 1, . .	x), a Vq”— при-
веденными выше уравнениями и неравенством (х, w) > 0. Предполагается, что пространство // имеет конечную размерность.
Теорема 5 (принцип Понтрягина, вторая формулировка)'. Пусть U — максимальное управление с учетом ограничения X (Г) £ Но. Обозначения и предположения были даны выше. Тогда существуют v0 0 и v1; ..., С Р такие, что если Р (f) является решением уравнений
= -f'* (% (0, u(t\ t) P (0;
P (Л = voay + 2 vk^k, k=l
то в любой точке t, в которой U является непрерывной функцией, справедливо соотношение
шах (/(%(/), u, t), P(t)) = (f(X(t)i U(t), 0, ^)>.
Доказательство, а) Покажем, что существует гиперплоскость, разделяющая V^" и Кт- Заметим, что если dim (Кг) = dim (Я), то доказательство сразу следует из предложения 4, поскольку тогда мы имеем Vo" Q Кт = 0. Представим доказательство, независимое от приведенного выше предположения.
Если Кт и Vo расположены, на одной гиперплоскости, то доказательство утверждения тривиально. Предположим, что Кт и Vo не лежат на одной гиперплоскости; покажем от противного, что Кт и Vo" не имеют общей внутренней точки, т. е. никакая внутренняя точка множества Кт не может принадлежать множеству Vo". Пусть а € Vo"— внутренняя точка множества Кт- Пусть р = = dim (Кт)- Рассмотрим р независимых векторов . ., хр, принадлежащих множеству Кт и таких, что а находится внутри симплекса 2, являющегося выпуклой оболочкой векторов х19 . . . . . ., хр. Тогда 2 'й Vo не будут лежать на одной гиперплоскости (гиперплоскость, содержащая 2» содержала бы и Кт)- Рассмотрим отображение <pt, определенное в теореме 4. Существует т] такое, что для т sc г] имеем фх (2) Q Vo =/= 0, а следовательно, и <Рт (5) П Vo+ ¥= 0- Пусть, далее у € срг (2) Г) Vf и не равно нулю. Существует- р > 0 такое, что X (Т) + ру Е Г (Т). Отсюда следует
Х(Т) + ру€Г(Т) Г)#о", что противоречит сделанному нами предположению.
377
Так как Кт и Vo~ не имеют общей внутренней точки, то существует гиперплоскость, которая разделяет их в большом (см. гл. 12, следствие из теоремы 13).
б) Пусть Р (Т) € Н' такое, что гиперплоскость с уравнением (х, Р (Т)) — 0 разделяет К (Т) и Vo1" в большом. Мож!но предположить, что
х£ХгЦ{х, Р(Т))^0,
откуда, в частности, следует, что для любого и € К и в любой точке /, в которой 0 является непрерывным, справедливо соотношение
{А (Т, о If (X ( О, U, t)-f (X (0, и (0, 01, Р I Л)	0.
Пусть Р (0 — решение сопряженного уравнения для выбранного значения Р (Т) на конце. Так как
Р (/) = л* (Т, 0 Р (Т),	' ;
то мы получаем
(X (0, и, t)-f (х, (0, и (0, 0, р (0) < о,
т. е. мы доказали последнее утверждение теоремы. Кроме того имеем
(х, vk) = 0	)
(х, ^о^1’ •••’ *)} ^Х’
поэтому (см. гл. 13, следствие из теоремы 1)
х
Р (Т) = vow + 2 vkVkj где v0 > 0 и /?. k=i
Теорема полностью доказана.
Замечание. Обозначим через (х, р> значение формы р £ Н’ в точке х £ Н’п Его можно обозначить также через рх. Это имеет место, в частности, когда Н — R
Г х1
и в этом случае х представляет собой столбец с п компонентами: х =
L<_
а р является строчкой с п компонентами: р = [pi, . . ., рп]. Сопряженное уравнение	‘ >
4г = -/;*(% (о, й <о, ор(о
записывается в виде dP ~,~~ =	U(t), t).
378
Эти обозначения особенно удобны в случае, когда Я представляет собой произведение нескольких пространств. По этой причине мы их будем, применять в последующих параграфах.
5. ПАРАМЕТРИЧЕСКИЙ МЕТОД. СЛУЧАЙ, КОГДА ГОРИЗОНТ ЯВЛЯЕТСЯ НЕОПРЕДЕЛЕННЫМ
Любую траекторию х = X (t) можно записать в параметрической форме
x = X(^(s))|
* = V(s)
где s — параметр, принимающий значения между 0 и 1, а <р — дифференцируемая возрастающая функция, такая, что val (<р) — [О, Т]. Например, можно предположить
q>'(s)>0, Vsc[0, 1].
Полагая X (<р (s)) = X (s), U (<р (s)) = U (s), <p' (s) = U0 (s), мы можем уравнение движения системы записать в виде
^=f,(X(s), 47 (s), ф(5))4Ш;
х t
где пара
обозначает новое положение системы.
Чтобы использовать результаты предыдущего параграфа, мы предполагаем, что функция f непрерывно дифференцируема по
переменным х, t. Линеаризируем уравнение движения. Получаем
= f'(X(s), U(s), ф (s)) Uo (s) 6X(s) + f' (X (s), U (s),
d6q>(s) _п ds ~
Ч> (s)) U0 (s)	(S);
Сопряженное уравнение записывается в виде (где Р (s) С Я', Po(s)6/?):
^ = -P(s)f’x(X(s). U(s), ^(s))tf0(S);
= - P(s) ft (X(s), U (s), (s)) Uo (s).
379
Предположим, что траектория является максимальной относительно критерия на конце: [^| йУ0] (t^€ Н', wQ Тогда суще-. ствует не равное нулю решение s—> [Р (s) | Р0(s)] сопряженного уравнения такое, что для любого s, при котором U (s) является непрерывным, справедливо соотношение
f P(s) / (X.(s), и (s), ф (s)) + Ро (s) 1 tfo (S) =
= max [P (s) f (X (s), u, <p (s)) + Po (s)] u0.
w0>0
В правой части сделаем замену и = U (s), найдем максимум по и и положим и о — f/o (s). Тогда мы получим следующие два соотношения:
Р (s) f (X (s), и (s), <р (s)) + р0 (s) = 0;
P(s)f(X(s), U(s), <р (s)) == max Р (s) f (X (s), и, <p(s)). u£K
Первое из этих соотношений показывает,, что Р (s) ¥= 0. В противном случае мы имели бы P0(s) = 0, а следовательно, и IP (з)|Ро (s)] = 0. Наоборот, иногда возможно PQ (s) = 0. Значения Р (1), Ро (1) зависят от ограничений, наложенных на конечное состояние.
Рассмотрим несколько примеров (во всех этих примерах формы vk предполагаются линейно независимыми).
1.	Горизонт не определен. На X (1) наложены ограничения вида vkX (1) — ck (k = 1, . . ., х), w 0 ” не зависит от vk\ wQ = 0. Тогда мы получаем
lp(l) = votiy + SvftVft=#O (v0>0, vft€P);
1Ро(1) = 0. k	' .
2.	Горизонт не определен. На X (1) наложены ограничения вида vkX (1) = ck (k = 1, . . ., х); w = 0; &у0 = —1- Тогда мы . получаем задачу о минимальном времени. Имеем
P(l) = S^ft¥=0;
k
Ро (1) = —Vo (v0	0).
3.	Горизонт определен. На X (1) наложены ограничения вида vk X (1) = Q, == 0, w 4= 0 не зависит от vk. Тогда мы получаем
Р (1) = 2 ^kVk + voay ¥=0 (v0 > 0, vk Е R); k
Ро (1) может принять произвольное значение.
380
Если первоначальная система стационарна, т. е. f не зависит от t, то мы имеем, кроме того,
dP0(s) __п d s ’
Тогда PQ (s) равно постоянной величине — а\ следовательно,
Р	U (s)) = а,
где ( а = 0 в случае 1;
| а 0 в случае 2.
Теперь мы изменим формулировку полученных результатов применительно к первоначальной системе. Достаточно положить Р (I) = Р (ср-1 (0) и сопряженное уравнение принимает вид
Теорема 6 (принцип Понтрягина, третья формулировка). Пусть задана система
=	U(t), t).
Пусть t—*U (t)—максимальное допустимое управление [0, Т]) для одного из следующих критериев:
1)	линейной формы w от конечного состояния X (Т), где Т принимает произвольное значение;
2)	—Т (задача о быстродействии);
3)	линейной формы w от X (Т) с фиксированным временем Т и с ограничениями вида
vkX(T) = ck (k= 1, . .	и).
Предполагается, что в случае 2) величины	линейно
независимы, а в случаях 1) и 3) величины . . ., vHt w линейно .независимы. В случае 2), кроме того, предполагаем, что и = 0.
Тогда существует отличное от нуля решение сопряженного уравнения
такое, что в каждой точке в которой функция U непрерывна, справедливо соотношение
Р (0 f (X (0, U (0, 0 = max Р (t) f (X (0, и, t),
381
а Также выполняются условий
Р(Т)= VfeUA (vfe€/?) (случай 2);
k—1
,Р(Т)= 2 'VfeUfe+t’o^ (v*€/?, vo^O) (случаи 1 и 3). k=l
Если система стационарна, то имеем, кроме того,
P(0f(X(0, U (t)) = а,
где а — некоторая постоянная. В случае 1) имеем а = 0, а в случае 2) имеем а 0.
. Пример. Дана линейная система
^=AX(t) + U(t)h,
где
 х (о е Rn->
A£L (R", Rny, h^Rn;
. uwei-u +n.
Пусть U — управление, приводящее систему за минимальное время из начального состояния X (0) в точку 0. Пусть X — оптимальная траектория.
Используем матричные обозначения. Существует Р (t) такое, что
4=-р(ол
и в каждой точке, в которой U является непрерывным, справедливо соотношение
Р (t) [АХ (t) + U (t)h\ = max Р (0 [АХ (/) + uh], ,	-1^ WS-J-j-1
т. е.
U (t) P(t)h = max иР (t) h, где
и (0 = sgn (P (0 h).
Кроме того,
P(t) = P(0)e-iA,
382
откуда мы получаем
(/(/) = sgn (Р (0) e~tAh).
-Мы снова установили свойства оптимального управления, данные в гл. 17.
6. СЛУЧАЙ, КОГДА КРИТЕРИЙ ВЫРАЖАЕТСЯ ИНТЕГРАЛОМ
В этом параграфе мы исследуем случай, когда критерий, для которого находится максимум, имеет вид
т
u(t), t) dt
О
(горизонт Т может быть фиксированным или произвольным), где отображение х, и, t —> g (х, и, I) является непрерывным и непрерывно дифференцируемым относительно переменных х, t. Этот случай можно свести к случаю управления конечным состоянием, полагая
t
Y(t) = \g(X (т), U (т), т) dr.
О
Если принять. (/) 1 как новое состояние в момент t, то урав-LK(/) J
нение движения системы записывается в виде.
=	U(t), ty
^=g(.X(t),U(t\ty
где
г x (0) = x0;
t У (0) = о.
Критерий, для которого находится максимум, принимает вид У (Т). Следовательно, рассматриваемая задача сведена к задаче об управлении конечным состоянием. Теперь мы применим этот прием к классической задаче вариационного исчисления. Пусть требуется установить свойства отображения t—>X (t) отрезка [0, Т] в Н, реализующего максимум интеграла
о
где g — дважды непрерывно дифференцируемая функция.
383
Фиксируем начальное значение: X (0) = х0, а конечное значение X (Т) подчиним ограничениям
vkX(T) = ck (k = 1, . . . , и).
Положим
= Y(i) = jg(x(r),^,T)dT. Ut	J	\	V	]
о
Тогда мы получим систему
at	4
-^-=g(x(0, П(0, t)>
где X (0) = х0, Y (0) = 0.
Требуется найти максимум критерия Y (Т).
Управление представляет собой функцию t (t), где U (0 E E H. Если X, Y — оптимальная траектория, то существует не равное нулю отображение t—> [jP (£) | Q (£) ] отрезка [0, Т] в Н' X R такое, что
(Х(0, U(t), ty,
dQ (0 _ n dt ’
где
P (T) = S Q CO = Vo > 0,
И что
(a) - P(t) U(f) + Q(t)g(X(t), U(t), t) =
= max [P (0 u + Q (0 g (X (f), u, t)].
u(zH
Необходимо, чтобы Q (0 равнялось постоянной величине: Q (0 = Q 0. Из соотношения (а) следует, что функция
a -> Р (0 « + Qg (X (0, м, 0
имеет при u = U (f) первую производную, равную нулю, и отрицательно полуопр ед елейную вторую производную, т. е.
|f(0 + Qg«_(X(0, U(t), о = °;	(₽)
I Qgu2(X (0, U (t), t) — отрицательно полуопределенна.	(у)
384
Из соотношения ([3) следует, что Q =f= 0 (в противном случае мы имели бы Р(/) = 0 и отображение t—> [Р (0|Q (01 тождественно равнялось бы нулю.
Из формулы (Р) следует соотношение
ё’х (X (0, и (t), t)-±g’u (X (0, и (О,0 = 0.
У
где U (t) = которое представляет собой уравнение Эйлера.
Из соотношения (у) следует, что gu* (X (/), U (/), t) является отрицательно полуопределенной. Это условие известно под названием условия Лежандра.
Если g не зависит от /, то по теореме 6 получаем
P(t) U(f) + Qg (X (t)9 U(t))=a,
где a — некоторая постоянная. Учитывая соотношение (|3), мы можем переписать это выражение в виде
g'u (X (0, и (0) и (0 - g (X (0, и (0) = с,
Гт /j.\ dX (t)	— ci
где и (0 = -	' нс — -3- .
at	Q
Таким образом, мы нашли первый интеграл уравнения Эйлера, который совпадает с интегралом, полученным по теореме Нётер \
Дополнение. Доказательство леммы 1
Мы даем здесь два доказательства леммы 1, в которых Используются понятия и результаты, не приведенные в данной книге. Заметим прежде всего, что в формулировке леммы слово «симплекс» можно заменить на «замкнутый шар».
Требуемый результат без труда можно получить из следующего утверждения. Пусть В — единичный шар в конечномерном нормированном векторном пространстве Е. Пусть f — непрерывное отображение из В в Е такое, что ||/ (х) — х|| л для любого х G В, Тогда любой элемент г/. £ Е такой, что 1 —л, принадлежит множеству f (В).
Первое доказательство 1 2 основано на теореме о неподвижной точке Брауэра. Нужно доказать, что каков бы ни был элемент у, удовлетворяющий соотношению ||у||^ 1 —Л, существует эле-
1 См., например, И. М. Гельфанд и С. В.Фомин. Вариационное исчисление. Гл. 4. М. Физматгиз, 1961.
2 Здесь мы используем доказательство утверждения 9.1, данного Халкиным в его работе: Н. Halkin. On the necessary condition for optimal control of nonlinear systems. Journal d' Analyse Matematique, vol. XII, 1964, 1—82.
25 p. Паллю де Ла Барьер	385
мент х € В такой, что f (х) = у. Последнее соотношение можно записать в виде
х — f (х) + у = х.
Так как
IIX — f (х) + у II sC II х — f (х) II +1| у ||	Т] + (1 __ Л) = 1,
то отображение х —> х — f (%) + у непрерывно отображает В в В. По теореме Брауэра оно имеет неподвижную точку, что доказывает наше утверждение.
Теперь дадим второе доказательство \ основанное на некоторых результатах из теории гомотопий. Пусть h — сужение отображения f на границе В шара В. Отображение h гомотопно тождественному отображению на кольцевой области точек х 6 Е таких, что 1 —т) ||х||^ 1*+ Л- Чтобы убедиться в этом, достаточно рассмотреть семейство отображений х —* 'кх + (1 — X) h (х) для X Е [0, 1 ]. Кроме того, h является гомотопной на f (В) постоянному отображению. Это можно показать, рассматривая семейство отображений х —> f (Хх) для X € 10,1].
Следовательно, тождественное отображение сферы В гомотопно постоянному отображению на CUf (В). Между прочим, известно, что если z лежит внутри В, то тождественное отображение сферы В не гомотопно постоянному отображению на С {z}. Отсюда следует, что множество / (В) содержит шар с радиусом 1 — тр
1 Это доказательство-мне сообщил Серф (J. Cerf.).
386
. (
БИБЛИОГРАФИЯ1
1.	А н г о Андре. Математика для электро- и радиоинженеров. Пер. с франц. М., «Наука», 1965, 779 с.
2.	Б а р т л е т М. С. Введение в теорию случайных процессов. Пер. с англ. Б. А. Севастьянова. М., Изд. иностр, лит., 1958, 384 с.
3.	Веллман Ричард. Динамическое программирование. Пер. с англ. М., Изд. иностр, лит., 1960, 400 с.
4.	Веллман Ричард. Процессы регулирования с адаптацией. Перев с англ.М.»«Наука», 1964, 359 с.
5.	Веллман Ричард, Дрейфус Стюарт. Прикладные задачи динамического программирования. Пер. с англ. М., «Наука», 1965, 458 с.
6.	Берж Клод. Теория графов и ее применение. Пер. с франц. Зыкова А. А., М., Изд. иностр, лит., 1962, 319 с.
7.	Бурбаки Н. Элементы математики. Ч. I, кн. 5. Топологические векторные пространства. Пер. с франц. Райкова Д. А. М., Физматгиз, 1959, 410 с.
8.	Гасс С. И. Линейное программирование (Методы и приложения). Пер. с англ. М.,Физматгиз, 1961,303 с.
9.	Гельфанд И.М., Виленкин Н. Я. Некоторые применения гармонического анализа. Оснащение гильбертова пространства. М., Физматгиз, 1961, 472 с.
10.	Г е л ь ф а н д И. М., Ш й -лов Г. Е. Основные пространства и обобщенные функции. М., Фйзматгиз, 1958, 307 с.
11.	Гельфанд И. М., Ши
1 Для книг, переведенных на •русский язык, даются библиографические описания только русских изданий. Прим. ред.
25*
лов Г. Е. Обобщенные функции и действия над ними. М., Физматгиз, 1959, 439 с.
12.	Г е л ь ф а н д И. М., Ф о -минС. В. Вариационное исчисление. М., Физматгиз, 1961, 228 с.
13.	Г н е д е н к о Б. В. Курс теории вероятностей. М., Физматгиз, 1961, 406 с.
14.	Гнеденко Б. В., Хин-чин А. Я. Элементарное введение в теорию вероятностей. 5-е изд. М., Физматгиз, 1961, 144 с.
15.	Д у б Дж. Л. Вероятностные процессы. Пер. с. англ. М., Изд. иностр, лит., 1956, 605 с.
16.	Д ы н к и н Е. Б. Основы теории марковских процессов. >М., Физматгиз, 1959, 227 с.
17.	И т о К и ё с и. Вероятностные процессы. Вып. 1—2. Пер. с. японск. М., Изд. иностр, лит., 1960—1963, 133 с., 135 с.
18.	К а л м а н Р. Е. Об общей теории систем управления. Труды I Международного конгресса Международной федерации по автоматическому управлению. М., Изд-во АН СССР, 1961, с. 521—546.
19.	К а р л и н С. Математические методы в теории игр, программировании и экономике. Пер. с англ. М., «Мир» 1964, 838 с.
20.	К ю н ц и Г. П. и К р е л л е В. Нелинейное программирование. Пер. с нем. М., «Советское радио», 1965, 303 с.
21.	Лоэв Мишель. Теория вероятностей. Пер. с англ. М., Изд. иностр, лит. 1962, 719 с.
22.	Лэнинг Дж. X. и Бэтти н Р. Г. Случайные процессы в задачах автоматического управления. Пер. с англ. М., Изд. иностр, лит. 1958, 387 с.
387
23.	Н е в ё Ж. Математические основы теории вероятностей. Пер. сфранц. М.» «Мир», 1969, 309 с.
24.	П о н т р я г и н Л. С., Болтянский В. Г., Гамкрелид-з е Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз, 1961, 384 с.
25.	Прикладная комбинаторная математика. Сборник статей. Под ред. Беккенбаха Э. Ф. Пер. с англ. М., «Мир», 1968, 362 с.
26.	П у г а ч е в В. С. Теория случайных функций и ее применение к задачам автоматического управления. М., Физматгиз, 1960, 883 с.
27.	Р о з а н о в Ю. А. Стационарные случайные процессы. М., Физматгиз, 1963, 284 с.
28.	Современная математика для инженеров. Под ред. Э. Ф. Беккенбаха. Т. 1. Пер. с англ. М., Изд. иностр, лит., 1958, 500 с.
29.	Ф е л л е р В. Введение в теорию вероятностей и ее приложения. Пер. с англ. М., «Мир», 1964, 498 с.
30.	X е д л и Дж. Нелинейное и динамическое программирование. Пер. с англ. М., «Мир», 1967, 506 с.
31.	Ховард Р. А. Динамическое программирование и марковские процессы. Пер. с англ. Рыкова В. В. М., «Советское радио», 1964, 189 с.
.	32. Ч ж у н К а й - л а й. Однородные цепи Маркова. Пер. с англ. М., «Мир», 1964, 425 с.
33.	Ш в а р ц Лоран. Математические методы для физических наук. Пер. с франц. Широкова Ф. В. М., «Мир», 1965, 412 с.
34.	Я г л о м А. М. Введение в теорию стационарных случайных функций. Успехи матем. наук. т. 7, № 5 (51), 1952, с. 3—168.
35.	Я г л о м А. М., Я г л о м И. М. Вероятность и информация. М., Гос-техиздат, 1957, 160 с.
36.	Arrow К. J., Н u г v i с z L., U s a w а Н. Studies in linear and non-linear programming. California, Stanford University press, 1958.
37.	A г s a c J. Transformation de Fourier et theorie des distributions. Paris, Dunod, 1961.
38.	В a s s J. Elements de calcul des probabilites. Paris, Masson 1962.
39.	В e c k e n b a c h E. F. Modern mathematics for the engineers. Vol. 2, New York, Me Graw-Hill, 1961.
388
40.	Berge C. Espaces topologi-ques et fonctions multivoques. 2е edition. Paris, Dunod, 1965.
41.	В e г g e C., Ghouila-Ho-u r i A. Programmes, jeux et reseaux de transport. Paris, Dunod, 1962.
42.	В 1 anc-Lap irre A., For-t e t R. Theorie des fonctions aleatoires. Paris, Masson, 1953.
43.	C h о q u e t G. Cours d'Analyse. Tome 11: Topologie. Paris, Masson, 1964.
44.	Decaulne P., G i 1 1 e J. C., Pelegri n M. Problemes d'asser-vissements. Paris, Dunod, 1958.
45.	D e s с о m b-e s R. Cours d'analyse pour le certificat de Mathematiques I. Paris, Vuibert, 1962.
46.	Dorfman R. Samuelson P. A. Solow R. M. Linear programming and economic analysis. New York, Me Graw-Hill, 1958.
47.	Eaton J. H., Zadeh L. A. Optimal pursuit strategies in discretestate probabilistic systems. Jour. Bas. Eng. vol. 84, serie D, March, 1962.
48.	F e г g u s о n R. O., Sargent L. F. Linear programming fundamentals and applications. New York, McGraw-Hill, 1958.
49.	Garsoux J. Espaces vecto-riels topologiques et distributions. Paris, Dunod, 1963.
50.	G i 1 1 e J. C., Decaul-пе P., Pel egrin M. Theorie et calcul des asservissements. 3e edition. Paris, Dunod, 1963.
51.	G i 1 1 e J. C., D e с a u 1 n e P. Pele grin M. Methodes modernes d'etudes des systemes asservis. Paris, Dunod 1960.
52.	G о r d о n P. Theorie des chalnes de Markov finies et ses applications. Paris, Dunod, 1965.
53.	Greenwald D. U. Linear programming, an explanation of the simplex algorithm. New York, Ronfld Press, 1957.
54.	Hadley G. Linear programming. Reading, Mass. Addison Wesley, 1962.
55.	Hennequiii P. L. To r-trat A., Theorie des probabilites et quelques applications. Paris, Masson, 1965.
56.	H о 1 b г о о k J. G. Laplace transforms. Oxford, Pergamon Presse, 1959.
57.	J о k s c h H. C. Lineares Pro-grammieren. Tiibingen, Mohr, 1962.
58.	J и г у E. T. Sampled-data con- . trol systems, New York, Wiley, 1958.
59.	Kaufmann A. Cruon R., La programmation dynamique. Paris-, Dunod, 1965.
60.	К e m e n у J. G., S n e 11 S. L. Finite Markov chains.- Princeton, Van Nostrand, 1960.
61.	P a p о u 1 i s A. Probability, random variables and Stochastic process. New York, Me Graw-Hill, 1965.
62.	P a r z e n E. Stochastic processes. San Francisco, Holden Day, 1961.
63.	R a g a z z i n i J. R., Franklin G. F. Sampled-data control systems. New York, Me Graw-Hill, 1958.
64.	S a a t у T., В r a m J. Nonlinear mathematics. New York, ~ Me Graw-Hill, 1958.
65.	S c h w a r t z L. Theorie des distributions. Tomes I et 11. Paris, Hermann, 1957—1959.
66.	S i m о n n a r d M. Programmation lineaire. Paris, Dunod, 1962.
67.	S о u r i a u J.—M. Calcul line
aire. _ Paris, Presses Universftaires de France, 1959.
68.	T а к a c s L. Stochastic processes. Problems and solutions. New York, Wiley, 1962.
69.	T о r t r a t A. Calcul des pro-babilites. Paris. Masson, 1963.
70.	Той I. T. Modern control theory. New York, Me Graw-Hill, 1964.
71.	Treves F. Elements de la theorie des expaces topologiques. Paris, Centre de Documentation Universitaire, 1959.
72.	V a j d a S. Readings in mathematical programming. London, Pitman, 1958.
73.	W i d d e r D. V. The Laplace transforms. Princeton, Princeton University Press, 1941.
74.	Wiener N. Extrapolation, interpolation and smoothing of stati onary time-series. Harvard. The Technology Press of the M. I. T., 1957.
75.	Z a d e h L., Deso er C. Linear system theory. New York, Me Graw-Hill, 1963.
АЛФАВИТНО-ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
А '
Абсолютно непрерывное распределение 105
Абсцисса абсолютной сходимости 81
—	интегрируемости 81
Автокорреляция процесса 173
Автокорреляционная функция 163
Актуализации уравнения 315
Алгебра свертки 53
Асимптотический конус 272
Аффинное многообразие 263
Б
Банаха пространство 9
—	теорема 11
Бернуллиева случайная величина 109
Бесселя—Парсеваля теорема 220
Биективное отображение, биекция 7
Блокирование 256
Бохнера теорема 151, 244
В
Вводимый индекс (линейное программирование) 301
Вектор касательной 367
Векторный континжан (367
Вершина (в линейном программировании) 294
Вероятность события 104
Вероятностное пространство 104
Вершина, точка графа 134
Взаимокорреляционная функция 163
Взаимнооднозначное отображение 7
Винера—Хопфа уравнение 207
Внутренность множества 264
Входная величина 180
Выводимый индекс 301
Выборка функции 234
Выпуклая оболочка 260
— замкнутая 261
Выходная величина 180
390
' Г
Гауссово распределение 105, 115
Гауссова случайная величина 115
Глобальный минимум, максимум 275
Гильбертово пространство 11
Гиперплоскость аффинная 263
—	опорная 268
Горизонт 312
Грама детерминат' 14, 104
—	матрица 14
Грань 270
Граф ориентированный 134
Д
Двойственности теорема 305
Двусторонняя последовательность 215 ’
Действительная, мнимая часть меры 18
Децибел 194
Динамическое программирование 312
Дискретное распределение 115
Дисперсия 111
Дирака мера 27
Дифференцируемое отображение 24
Дифференцируемый процесс 170
Дополнительный базис 13
Допустимая стратегия • 335
Достижимая вершина графа 135
Допустимое множество 275
Дуга графа 134
Е
Единичная обратная связь 189
Единичный скачок 181
--- скорости 197
--- ускорения 197
3
Замкнутая система 188
Запас устойчивости по усилению 194
Звено (автоматическое регулирование) 180
—	линейное 180
—	допускающее к интегрирований 186
—	с запаздыванием 187
и
Измеримая функция 18
— множество 19
— отображение 19'
Импульсная переходная функция 180
Инволюция (над обобщенными функциями) 47
Интегрируемая функция 19
Интегрируемое множество 19
Инъективное, взаимно однозначное, отображение, инъекция 7 •
К
Каноническая форма 299
----вырожденная 299
Каратеодори теорема 260
Квадратичная форма 14
Квазиустойчивое звено 191
Квазимаксимальное управление 368
Ковариация 118, 120
Ковариаций матрица 119
Коррекция чисто интегральным управлением 201
Коэффициент корреляции 118
----полный 122
—	усиления 196
Крейна—Мильмана теорема 272
Критерий интегральный 363, 383
----на конце 363, 369
Конечный, финальный класс 135
Конец дуги, пути 134
Контур (теория графов) 134
Корректирующее звено 188
Крайняя точка 268
Кумулятивная функция меры 41 ----или функция распределения слу-
чайной величины НО
Куна—Таккера множители 282
—	теорема 292
Кэли—Гамильтона теорема 15
Кэмпбелла теорема 176
Л
Лагранжа множители 282
Лапласа преобразование 79
Лебега мера 18
—	теорема 21
Лежандра условие 385
Линеаризированное уравнение 361
Линейное программирование 294
Локально выпуклое метризуемое пространство 10 — интегрируемая функция 21 Локальный минимум, максимум 275
М
Максимум 275
Максимальный элемент 8
Маргинальное распределение 115
Маркова цепь 132
Марковские системы с выигрышем 323
Матрица 12
— транспонированная 13
Медленного роста обобщенная функция 67
Мера 17
Минимум 275
— функции нестрогий глобальный 275
-------локальный 275
----строгий локальный 275
-------глобальный 275
Множество выпуклое 258
—	замкнутое 135
Множители Лагранжа 282
—	Куна—Таккера 282
Моды квадратичной формы 286
Момент случайной величины 111
Мультипликаторы 17
Мультипликативное произведение обо' • щенной функции на функцию 46
Н
Найквиста годограф 185
—	контур 191
Насыщенное ограничение 276
Начало дуги, пути 134
Невозможное событие 104
Независимые случайные величины, с -бытия 107
Непрерывно дифференцируемое от- -бражение 24
Непрерывный процесс 170
Неприводимая стохастическая матрица 139
Несовместимые события 104
Неустойчивое звено 191
Нильпотентный оператор 15
Норма 8
Нормированная (стандартная) случайная величина 112
Носитель меры 21
—	обобщенной функции 37
—	элемента 138
О
Обобщенная функция 27
---- порядка т 28
•---векторная 54
----с положительным носителем 38
Образ меры 23
Обращение свертки 53
Обратной связи звено 188
Ограничения 276
Ограниченная мера 20
Ограниченное сверху или снизу множество 38
Окрестность множества 37
Опережения звено 200
391
Основной входной сигнал 204
Отклонение нормированное 112 — стандартное (среднее квадратичное) 112
Отношение порядка 7
----на 8
П
Параметризация 309
Парсеваля—Бесселя теорема 222
Передаточная функция 181
Переключения точки, моменты 355
Переход от одного базиса к другому (матрицы) 13
Переходный (невозвратный) класс 135 Период неприводимой стохастической матрицы 141-
Периодизация меры 231
Петля 134
Планшереля теорема 63, 65
Плотность распределения вероятностей 104, НО
—	одной меры относительно другой 21 Подматрица 16, 332 .
Подкласс неприводимой матрицы 141
Полная масса меры 20
Полной вероятности теорема 106
Положительная, отрицательная части меры 18
—	обобщенная функция 36
Положительно определенная матрица 14 , ---- квадратичная форма 15
Положительно полуопределейная матрица 14
---- квадратичная форма 15
Положительная мера 18
Положительного типа последователь-• ности 244
Полунорма 8 ‘
—	менее тонкая 9
—	более тонкая 9
Полуторалинейное отображение 11
Понтрягина принцип 364, 377, 381
Почти всюду равные функции 19
Предсказание 205
Предгильбертово пространство 11
Предел в смысле Фейера 148
Предельная теорема 129
Предпорядок 8
Пренебрежимое множество 19
Преобразование по z (последовательности) 238
Приведение периодической меры 230
Приведение, приводимое в начало координат 318, 347
Примитивная функция меры 41
—	. стохастическая матрица 145
Принцип оптимальности 314
Программа 275
392
Производная обобщенной функции 39, 225
—	отображения 24
Процесс-обобщенная функция медлен-
ного роста 172
Прямое произведение двух мер 22
Прямое произведение двух обобщенных
функций 46
Пуассона процесс 176
—	формула суммирования 237
Пуассоновская случайная величина 114
Путь (теория графов) 134
Р
Равномерное распределение 105
Радона оператор 154, 246
Разбиение матрицы 16
Разделяемые гиперплоскостью множества 265
Разложение меры или обобщенной
функции 233
Разложение функции 230
Размерность аффинного многообразия
263
Разомкнутая система 188
Распределение вероятностей 104
Реакция на гармоническое воздействие 182
Резольвента 360
Регрессия 121
Регрессии прямая, плоскость 122
Регулярная стохастическая матрица 145
Регулярные связи и ограничения 276
С
Свертка двух обобщенных функций 47
—	двух мер 23
—	двух последовательностей 227
Свертыватель 53
Свободная переменная 276
Связи (линейное программирование)
276
Сегмент 258
Седловая точка 292
Симметрическая матрица 15
Симплекс-метод 296
Симплекс 375
Сильно связный граф 135
Система управления или регулирования 188
Случайная величина 107
Случайный процесс 159
Сложения вероятностей теорема 106
Событие 104
—	противоположное 104
—	почти достоверное 107
—	невозможное 104
—	несовместимые 104
—	элементарное 105
Совершенное отношение порядка 8
Сопряженное уравнение 364
Спектральная плотность 173
Спектральная мера 154
Спектральный проектор 16
Спектральное подпространство 16
Спектральная плотность мощности ве-
личины 164
Спектрального разложения теорема 15 .
Среднее значение, математическое
ожидание случайной величины 108 Среднее процесс-обобщенной функции 173
—	процесса 160
Средний асимптотический выигрыш за
период 325
Стратегия 335, 347, 353
Стационарная точка 282
Стационарное звено 180
Стационарный 2-го порядка случайный
процесс 159
—	процесс-обобщенная функция 173
Степенные ряды (формальные) 229
Строгий минимум, максимум 275
Стохастическая матрица 132
Сумма двух событий 104
Существенно ограниченная функция 19
Сходимость по вероятности 131
—	почти наверно 131
—	по распределению 129
Сюрьективное отображение, сюрьек-ция 7
Т
Тахометрическая обратная связь 202
—	опережение 202
Теорема о замкнутом графике 11
Тонкость полунормы 9
Топология слабая 10, 58
—	сильная 156
—	узкая 58
—	широкая 57
Топологическое векторное простран-
ство 8
Тор 7
Траектория 362
Точность (автоматическое регулирова-
ние) 197
У
Укладка ограниченной меры 232
Унитарное представление 152
Упорядоченное множество 8
Управление 347, 362
Управляемая система 318
Условное распределение вероятностей 107	'	.
Устойчивое звено 191
Ф
Фаркаша—Минковского теорема 277
Фильтрация 205
Фреше пространство 10
Фробениуса теорема 142
Фубини теорема 22
Функция выпуклая 273
— вогнутая 273
— положительно определенная 150
Фурье преобразование 56
Хана—Банаха теорема 11
Характеристическая функция случайной величины 112
Хевисайда функция 41
ц
Целевая функция 276
Цель 332
Центр тяжести (системы элементов) 258
Центрированная случайная величина 109
Центрированный процесс 159
Центрирование 118
Ш
Шум 204, 205
Шум белый 178
Э
Эвклидово пространство 14
Эйлера уравнение 365
Эквивалентные полунормы 9
Эквивалентные семейства полунорм 10
Элементарное решение 97
Элементарный путь (теория графов) 134
Эргодическая стохастическая матрица 145
Эрмитова матрица 18
— транспонированная матрица 13
Эрмитово пространство 14

ОГЛАВЛЕНИЕ
Предисловие к русскому переводу.................................... 5
Предисловие........................................................ 6
Глава 1.	Предварительные сведения ................................ 7
1.	Теория множеств........................................ 7
2.	Топологические векторные	пространства.................. 8
3.	Меры ................................................. 17
4.	Дифференцируемые	функции.............................. 24
Глава 2.	Теория обобщенных функций............................... 27
1.	Определение обобщенной функции........................ 27
2.	Исследование некоторых функциональных пространств . .	28
3.	Дифференцирование обобщенных	функций ................. 39
4.	Прямое произведение. Мультипликативное произведение . .	44
5.	Инволюция и свертка................................... 47
6.	Дополнительные сведения............................... 54
у
Глава 3.	Преобразование Фурье.................................... 56
1.	Дополнительные сведения из теории меры................ 56
2.	Преобразование Фурье ограниченных мер ................ 60
3.	Дифференцируемость преобразования Фурье .............. 60
4.	Преобразование Фурье производной от функции .......... 61
5.	Теорема Планшереля.................................... 62
6.	Продолжение преобразования Фурье на I2 ............... 65
7.	Преобразование Фурье бесконечно дифференцируемых функций с быстрым убыванием.................................. 66
8.	Обобщенные функции медленного роста................... 67
9.	Дифференцирование обобщенных функций медленного роста 68
10.	Преобразование Фурье обобщенных функций медленного роста............................................... 69
11.	Мультипликаторы в S	и	S'...................... 71
12.	Инволюции и свертка............................ 72
13.	Применение к преобразованию	Фурье ограниченной	меры	75
14.	Преобразование Фурье	с	несколькими переменными	...	77
394
Глава 4. Преобразование Лапласа....................................... 79	.
1.	Преобразование Лапласа мер с положительными носителями 79
2.	Преобразование Лапласа обобщенных функций.............. 86
3.	Формулы обращения ..................................... 88
4.	Теоремы о начальном и конечном значениях..............  91
5.	Применения преобразования Лапласа....................... 96
6.	Преобразование Лапласа векторных функций............... 100
Глава 5. Элементы теории вероятностей............................... 103
1.	Меры на векторных пространствах........................ 103
2.	Распределение вероятностей............................ 104
3.	Случайные величины	  107
4.	Характеристики распределений вероятностей.............. ПО
5.	Геометрическое изучение скалярных случайных	величин	117
6.	Стохастическая независимость случайных величин	....	122
7.	Сходимость распределения вероятностей и случайных величин ...................................................  129
Глава 6.	Цепи Маркова............................................. 132
1.	Определение цепей Маркова. Понятия теории графов . . .	132
2.	Спектральный анализ	стохастических	матриц............. 136
3.	Асимптотическое поведение ............................ 145
> Глава 7.	Стационарные случайные	процессы	второго	порядка..........,149
1.	Положительно определенные функции. Теорема Бохнера 149
2.	Унитарные представления R в гильбертовом пространстве	152
3.	Стационарные случайные процессы второго порядка ...	159
4.	Свертки для стационарных процессов второго порядка . .	164
5.	Дальнейшее изучение свертки............................ 166
6.	Обобщения. Пуассоновский процесс ...................... 171
Глава 8. Линейные системы автоматического управления................ 180
1.	Описание линейных стандартных звеньев.................. 180
2.	Звенья управления......................‘............... 187
3.	Устойчивость........................................... 190
4.	Выбор коэффициента усиления ........................... 196
5.	Коррекция и опережение................................. 200
Глава 9. Фильтрация. Предсказание. Опережение...................?.	203
1.	Системы со случайными входными сигналами............... 203
2.	Фильтрация и предсказание. Уравнение Винера—Хопфа	205
3.	Решение уравнения Винера—Хопфа........................ 207
4.	Опережение ..........................................  214
395

Глава 10. Дискретные системы ....................................... 215	; ;
1.	Определения и обозначения............................... 215	*
2.	Преобразование Фурье .................................. 219
3.	Дифференцирование свертки. Инволюция................... 225
4.	Связь между гармоническим анализом на R и гармоническим анализом на Т или Z........................................ 230
Г лава 11. Дискретные системы. (Продолжение)........................ 238	» .
1.	Преобразование Лапласа односторонней последовательности 238
2.	Последовательность положительного типа ............... 244
3.	Унитарные представления кольца Z в пространстве Гильберта ....................................................  245
4.	Стационарные случайные процессы второго порядка	. . .	248
5.	Дискретные системы автоматического регулирования . . .	251
6.	Выборка. Блокирование.................................. 254
Г лава 12. Выпуклые множества...................................... 258
1.	Определения и элементарные свойства.................... 258
2.	Выпуклые множества в топологических и векторных пространствах ................................................ 261
3.	Отделимость выпуклых множеств ......................... 264
4.	Опорные гиперплоскости	и крайние точкой . .	. . . . .	268
5.	Грани. Асимптотический	конус .......................... 269
6.	Выпуклые функции................\	................ 273’
Глава 13. Задачи программирования . . .	........................ 275
<	1. Постановка задачи и общие обозначения............... 275
2. Условия первого порядка................................ 276
3. Достаточные условия в нелинейном программировании 282
Глава 14. Линейное программирование................................ 294
1.	Предварительные	сведения .............................. 294
2.	Симплекс-метод......................................... 296
3.	Двойственность........................................  305
4.	Параметризация	..................................  309
Глава 15. Динамическое программирование............................ 312
1. Сущность метода	................................... 312
2. Принцип оптимальности.................................. 314
Г лава 16. Управляемые марковские системы.......................... 323
1.	Марковские системы с выигрышем......................... 323
2.	Управляемые марковские системы с выигрышем............ 327
3.	Марковские системы с целью и со стоимостями переходов . .	332
4.	Управляемые марковские системы с целью и стоимостью перехода................................................... 335
396	j
Глава 17. Управление линейными системами за минимальное время . .	343
1. Дискретные системы ................................... 343
2. Непрерывные системы .................................  347
Глава 18. Принцип Понтрягина .................................... 360
1.	Некоторые сведения из теории дифференциальных уравнений .................................................... 360
2.	Задачи оптимального управления ...................... 362
3.	Случай, когда горизонт является фиксированным, а конечное состояние свободным ................................ 363
4.	Случай критерия на конце с фиксированным горизонтом и ограничениями на конечное	состояние.................... 369
5.	Параметрический метод. Случай, когда горизонт является неопределенным . -...................................... 379
6.	Случай, когда критерий	выражается интегралом......... 383
Библиография ...................................................  387
Алфавитно-предметный указатель .................................. 390
Р. Паллю де Ла Барьер
КУРС ТЕОРИИ АВТОМАТИЧЕСКОГО
УПРАВЛЕНИЯ
Редактор издательства инж.
Е. В. Григорий-Рябова Технический редактор Л. П. Гордеева Корректор А. Е. Мишина Художник А. Я- Михайлов
Сдано в набор 24/11 1972 г.
Подписано к печати 10/VII 1973 г.
Формат 60X90/16 Бумага № 3 Печ. л. 25,0 Уч.-изд. л. 20,8 Тираж 15000 экз. Заказ 1803
Цена 1 р. 67 коп.
Издательство «МАШИНОСТРОЕНИЕ».
Москва, Б-78, 1-й Басманный пер., 3
Ленинградская тип. № 6 Союз пол играфпрома при Государственном комитете
Совета Министров СССР по делам издательств, полиграфии и книжной торговли.
193144, Ленинград, ул. Моисеенко, 10
Издательство «Машиностроение» выпустит в 1973 году НОВЫЕ КНИГИ
Бежанов Б. Б., Бушу нов В. Т. Производственные машины-автоматы. Изд. 2-е. 30 л. Цена 3 р. 25 к.
Вальков В. М., Вершин В. Е. Автоматизированные системы управления технологическими процессами. 15 л. Цена 1 р.
Говоров И. Д. Механизация и автоматизация технологических операций обработки деталей из реактопластов. 12 л. Цена 80 к.
Добролюбов А. И., Акунович С. И. Автоматизация проектирования систем управления технологическими машинами. 13 л. Цена 1 р. 05 к.
Невельсон М. С. Автоматическое управление точностью металлообработки. 10 л. Цена 70 к.
Опарин В. И., Ткаченко Г. П., Лукьянов В. П. Механизация и автоматизация производства химической и нефтяной, аппаратуры. 15 л. Цена 75 к.
Розенберг И. А. Анализ уровня механизации и автоматизации труда. Изд. 2-е. Под ред. Б. И. Майданчика. 4 л. Цена 25 к.
Скиженок В. Ф., Лебедев Н. Ф., Ковзель Н. И. Автоматизация и механизация протяжных работ. 14 л. Цена 90 к.
Сорочкин Б. М., Богданов Э. О. Автоматизация многодиапазонной сортировки. 12 л. Цена 80 к.
Шакалис В. В. Моделирование технологических процессов. 10 л. Цена 65 к.
Шаумян Г. А. Комплексная автоматизация производственных процессов. 50 л. Цена 4 р. 55 к.
Шестихин О. Ф., Энгель Р. В. Машинные методы проектирования систем автоматического управления. 20 л. Цена 1 р. 25 к.
Шибанов Г. П. Распознавание в системах автоконтроля. 30 л. Цена 3 р. 25 к.
ИМЕЮТСЯ В ПРОДАЖЕ
Теория автоматического регулирования. Кн. 3. Теория нестационарных, нелинейных и самонастраивающихся систем автоматического регулирования. Ч. I. 1969, 608 с. (Техническая кибернетика. Серия инженерных монографий. Под ред. В. В. Солодовникова). 2 р. 50 к.
Основы теории нестационарных систем при детерминированных и при случайных воздействиях. Методы анализа и синтеза этого класса систем, основанные на понятии обобщенных (ортогональных) спектров. Приближенные методы анализа нелинейных систем. Примеры расчета конкретных систем автоматического регулирования.
Теория автоматического регулирования. Кн. 3. Теория нестационарных нелинейных и самонастраивающихся систем автоматического регулирования. Ч. II. 1969, 368 с. (Техническая кибернетика. Серия инженерных монографий. Под ред. В. В. Солодовникова). 1 р. 60 к.
Основы, теории релейных, экстремальных и самонастраивающихся систем автоматического регулирования. Теория систем, оптимальных по быстродействию. Статистическая динамика нелинейЦых систем. Методы анализа и синтеза нелинейных систем, основанные на применении рядов Вольтерра и ортогональных спектров. Теория двух классов адаптивных систем: поисковых и аналитически самонастраивающихся.
Для научных работников и инженеров, занимающихся вопросами автоматического регулирования и управления.