Автор: Аграчев А.А. Сачков Ю.Л.
Теги: дифференциальные, интегральные и другие функциональные уравнения конечные разности вариационное исчисление функциональный анализ математический анализ математика прикладная математика издательство физматлит физико математическая литература геометрическая теория конечные системы
ISBN: 5-9221-0532-9
Год: 2005
А.А. Аграчев, Ю.Л. Сачков
Геометрическая теория
управления
УДК 517.977
ББК 22.161.8
А 25
А грач ев А. А., Сачков Ю.Л. Геометрическая теория управления. —
М.: ФИЗМАТЛИТ, 2005. - 392 с. - ISBN 5-9221-0532-9.
Первый учебник на русском языке по геометрической теории управления.
Рассматриваются задачи управляемости и оптимального управления для глад-
гладких конечномерных систем, а также эквивалентность систем по отношению
к естественным группам преобразований. Изложение теории сопровождается
подробным исследованием конкретных модельных задач из механики и геомет-
геометрии.
Для студентов и аспирантов вузов, обучающихся по специальностям «Ма-
«Математика» и «Прикладная математика», а также для научных работников
физико-математических специальностей.
Ил. 52. Библиогр. 149 назв.
© ФИЗМАТЛИТ, 2005
ISBN 5-9221-0532-9 © А. А. Аграчев, Ю.Л. Сачков, 2005
ОГЛАВЛЕНИЕ
Предисловие 8
Глава 1. Векторные поля и управляемые системы на глад-
гладких многообразиях 13
1.1. Гладкие многообразия 13
1.2. Векторные поля на гладких многообразиях 16
1.3. Обыкновенные дифференциальные уравнения и потоки ... 18
1.4. Управляемые системы 22
Глава 2. Элементы хронологического исчисления 30
2.1. Точки, диффеоморфизмы и векторные поля 30
2.2. Полунормы и С°°(М)-топология 34
2.3. Семейства функционалов и операторов 35
2.4. Хронологическая экспонента 37
2.4.1. Дифференциальные уравнения с разрывной правой
частью C7). 2.4.2. Определение правой хронологической
экспоненты C8). 2.4.3. Разложение в формальный ряд C8).
2.4.4. Оценки и сходимость ряда C9). 2.4.5. Левая хронологи-
хронологическая экспонента D2). 2.4.6. Единственность для функцио-
функциональных и операторных уравнений D3). 2.4.7. Автономные
векторные поля D4).
2.5. Действие диффеоморфизмов на векторные поля 45
2.6. Коммутирование полей 49
2.7. Формула вариаций 50
2.8. Производная потока по параметру 52
Глава 3. Линейные системы 55
3.1. Формула Коши для линейных систем 55
3.2. Управляемость линейных систем 57
Глава 4. Линеаризация нелинейных систем по состоянию . 60
4.1. Локальная линеаризуемость 60
4.2. Глобальная линеаризуемость 63
Глава 5. Теорема об орбите и ее приложения 69
5.1. Формулировка теоремы об орбите 69
5.2. Погруженные подмногообразия 70
5.3. Следствия теоремы об орбите 72
Оглавление
5.4. Доказательство теоремы об орбите 73
5.5. Аналитический случай 77
5.6. Теорема Фробениуса 79
5.7. Эквивалентность управляемых систем по состоянию 81
Глава 6. Вращение твердого тела 86
6.1. Пространство состояний 86
6.2. Уравнения Эйлера 89
6.3. Фазовый портрет 92
6.4. Управляемое твердое тело: орбиты 94
6.4.1. Орбиты 3-мерной системы (95). 6.4.2. Орбиты 6-мерной
системы (97).
Глава 7. Управление конфигурациями 100
7.1. Модель 100
7.2. Две свободные точки 103
7.3. Три свободные точки 104
7.4. Ломаная 107
Глава 8. Множества достижимости 110
8.1. Множества достижимости систем полного ранга 110
8.2. Совместимые векторные поля и релаксации 113
8.3. Устойчивость по Пуассону 116
8.4. Управляемое твердое тело: множества достижимости 118
Глава 9. Эквивалентность управляемых систем по состоя-
состоянию и обратной связи 120
9.1. Эквивалентность по обратной связи 120
9.2. Линейные системы 121
9.2.1. Линейные системы со скалярным управлением A22).
9.2.2. Линейные системы с векторным управлением A24).
9.3. Линеаризуемость по состоянию и обратной связи 129
Глава 10. Задача оптимального управления 135
10.1. Постановка задачи 135
10.2. Редукция к исследованию множеств достижимости 136
10.3. Компактность множеств достижимости 138
10.4. Задача быстродействия 141
10.5. Релаксации 141
Глава 11. Дифференциальные формы и симплектическая
геометрия 143
11.1. Дифференциальные 1-формы 143
11.1.1. Линейные формы A43). 11.1.2. Кокасательное рас-
расслоение A43). 11.1.3. Дифференциальные 1-формы A44).
11.2. Дифференциальные fc-формы 145
Оглавление
11.2.1. Внешние &-формы A45). 11.2.2. Дифференциальные
&-формы A47).
11.3. Внешний дифференциал 149
11.4. Производная Ли дифференциальных форм 151
11.5. Элементы симплектической геометрии 154
11.5.1. Форма Лиувилля и симплектическая форма A54).
11.5.2. Гамильтоновы векторные поля A56). 11.5.3. Лагран-
жевы подпространства A62).
Глава 12. Принцип максимума Понтрягина 164
12.1. Геометрическая постановка и обсуждение принципа макси-
максимума 164
12.2. Доказательство принципа максимума Понтрягина 168
12.3. Геометрическая формулировка ПМП для задачи со свобод-
свободным временем 173
12.4. ПМП для задач оптимального управления 175
12.5. ПМП для задач с общими граничными условиями 178
Глава 13. Примеры задач оптимального управления 185
13.1. Скорейшая остановка поезда на станции 185
13.2. Управление линейным осциллятором 188
13.3. Наиболее экономная остановка поезда 191
13.4. Управление линейным осциллятором с критерием качества 193
13.5. Машина Дубинса 194
Глава 14. Гамильтоновы системы с выпуклыми гамильто-
гамильтонианами 200
Глава 15. Линейная задача быстродействия 203
15.1. Постановка задачи 203
15.2. Геометрия многогранников 204
15.3. Теорема о релейном управлении 204
15.4. Единственность оптимальных управлений и экстремалей . . 206
15.5. Переключения оптимального управления 209
Глава 16. Линейно-квадратичная задача 215
16.1. Постановка задачи 215
16.2. Существование оптимального управления 215
16.3. Экстремали 219
16.4. Сопряженные точки 221
Глава 17. Достаточные условия оптимальности, уравнение
Гамильтона—Якоби и динамическое программирование 227
17.1. Достаточные условия оптимальности 227
17.1.1. Интегральный инвариант B27). 17.1.2. Задача с за-
закрепленным временем B29). 17.1.3. Задача со свободным
временем B32).
6 Оглавление
17.2. Уравнение Гамильтона-Якоби 234
17.3. Динамическое программирование 235
Глава 18. Гамильтоновы системы для геометрических задач
оптимального управления 238
18.1. Гамильтоновы системы на тривиализованном кокасательном
расслоении 238
18.1.1. Мотивация B38). 18.1.2. Тривиализация Т*М B39).
18.1.3. Симплектическая форма наЕхМ B40). 18.1.4. Га-
мильтонова система на^хМ B41).
18.2. Группы Ли 245
18.2.1. Примеры групп Ли B46). 18.2.2. Теорема Ли для
линейных групп Ли B47). 18.2.3. Абстрактные группы
Ли B49).
18.3. Гамильтоновы системы на группах Ли 250
18.3.1. Тривиализация кокасательного расслоения группы
Ли B50). 18.3.2. Гамильтонова система на М* х М B50).
18.3.3. Компактные группы Ли B52).
Глава 19. Примеры задач оптимального управления на ком-
компактных группах Ли 254
19.1. Риманова задача 254
19.2. Субриманова задача 256
19.3. Управление квантовыми системами 260
19.3.1. Исключение сноса B62). 19.3.2. Подъем задач на
группы Ли B64). 19.3.3. Управляемость B67). 19.3.4. Экст-
Экстремали B67). 19.3.5. Условия трансверсальности B67).
19.3.6. Оптимальные геодезические наверху и внизу B69).
19.4. Задача быстродействия на SOC) 272
Глава 20. Условия оптимальности второго порядка 279
20.1. Гессиан 279
20.2. Локальная открытость отображений 282
20.2.1. Критические точки коранга один B82). 20.2.2. Кри-
Критические точки произвольного коранга B85).
20.3. Дифференцирование отображения в конец 289
20.4. Необходимые условия оптимальности 293
20.4.1. Условие Лежандра B93). 20.4.2. Регулярные экстре-
экстремали B95). 20.4.3. Особые экстремали B97). 20.4.4. Необхо-
Необходимые условия C02).
20.5. Приложения 303
20.5.1. Анормальные субримановы геодезические C03).
20.5.2. Локальная управляемость билинейных систем C05).
20.6. Системы со скалярным управлением 306
Глава 21. Уравнение Якоби 316
21.1. Регулярный случай: вывод уравнения Якоби 317
21.2. Особый случай: вывод уравнения Якоби 321
Оглавление
21.3. Необходимые условия оптимальности 325
21.4. Регулярный случай: преобразование уравнения Якоби . . . 326
21.5. Достаточные условия оптимальности 329
Глава 22. Редукция 338
22.1. Редукция 338
22.2. Управление твердым телом 341
22.3. Управление угловой скоростью 342
Глава 23. Кривизна 345
23.1. Кривизна двумерных систем 345
23.1.1. Подвижный репер C46). 23.1.2. Уравнение Якоби в
подвижном репере C50).
23.2. Кривизна трехмерных аффинных по управлению систем . . 355
Глава 24. Качение тел 359
24.1. Геометрическая модель 359
24.2. Двумерная риманова геометрия 361
24.2.1. Римановы геодезические C61). 24.2.2. Связность Ле-
ви—Чивита C62).
24.3. Допустимые скорости 364
24.4. Управляемость 365
24.5. Задача минимизации длины 368
24.5.1. Постановка задачи C68). 24.5.2. Принцип мак-
максимума C69). 24.5.3. Анормальные экстремали C69).
24.5.4. Нормальные экстремали C71).
Приложение 373
1. Гомоморфизмы и операторы в С°°(М) 373
2. Остаточный член хронологической экспоненты 375
Список литературы 379
Список обозначений 388
Предметный указатель 389
Как-нибудь управимся ...
ПРЕДИСЛОВИЕ
Перед Вами — учебник по математической теории управления,
представленной с геометрической точки зрения. В основу книги легли
курсы лекций, прочитанные старшим из соавторов в 2000-2001 гг. в
Международной школе высших исследований в г. Триест (Италия).
Предварительные знания, необходимые для чтения книги, сводятся
к стандартным курсам математического анализа, линейной алгебры
и обыкновенных дифференциальных уравнений, а также к некото-
некоторым начальным сведениям из теории функций действительного пере-
переменного и функционального анализа; не требуется предварительного
знакомства ни с теорией управления, ни с дифференциальной геомет-
геометрией.
О чем же эта книга? Детерминированный мир классической фи-
физики описывается гладкими динамическими системами. Будущее в
такой системе полностью определено начальными условиями; более
того, близкое будущее меняется гладко, если гладко менять началь-
начальные условия. Оставляя место для свободной воли (не для случая,
а именно для свободной воли) в этой мрачноватой картине полной
предопределенности, мы получаем управляемую систему. Мы просто
разрешаем менять некоторые параметры системы: менять в извест-
известных пределах, но в любое время, когда вздумается. Собственно, это
то, что мы постоянно проделываем со своим телом, автомобилями,
летательными аппаратами, технологическими процессами и т. д. Мы
управляем всеми этими динамическими системами!
Гладкие динамические системы описываются дифференциальны-
дифференциальными уравнениями. В этой книге мы имеем дело только с конечно-
конечномерными системами: они описываются обыкновенными дифферен-
дифференциальными уравнениями на конечномерных гладких многообразиях.
Управляемая система — это семейство обыкновенных дифференци-
дифференциальных уравнений. Семейство параметризовано управляющими пара-
параметрами. Все уравнения данного семейства определены на одном и
том же многообразии, которое называется пространством состояний
системы. Разрешается выбирать любые доступные значения управ-
управляющих параметров (т. е. любую динамическую систему из семейст-
семейства), а также менять эти значения в произвольный момент време-
времени. Таким образом, выбранные параметры, вообще говоря, зависят
от времени. Эта зависимость называется управлением или функцией
управления.
Выбрав управление, мы превращаем управляемую систему в неав-
неавтономное дифференциальное уравнение. Решение такого уравнения
Предисловие 9
однозначно определяется начальными условиями и называется допу-
допустимой траекторией системы, отвечающей данному управлению.
Таким образом, допустимая траектория — это некоторая кривая в
пространстве состояний. Начальные условия — это начальная точка
кривой, называемая также начальным состоянием. Разным управле-
управлениям отвечают, вообще говоря, разные допустимые траектории, на-
начинающиеся в одной и той лее точке. Все эти траектории заполняют
множество достижимости.
Одна из главных задач теории управления — задача управляе-
управляемости — состоит в распознавании состояний, достижимых из данного
начального. Впрочем, как правило, этого недостаточно. Выяснив, до
каких состояний можно добраться, мы пытаемся найти наилучший
путь. Пути можно сравнивать по времени перехода, длине допусти-
допустимой траектории, затраченной энергии или значению какого-то другого
функционала. Наилучшим считается путь, доставляющий минимум
заранее выбранному функционалу. Поиск таких путей составляет
предмет задачи оптимального управления. Две важные задачи —
управляемости и оптимального управления — служат нам маяками
на протяжении всей книги.
При чем здесь геометрия? Правая часть обыкновенного диффе-
дифференциального уравнения есть векторное поле, а соответствующая ди-
динамическая система — поток, порожденный этим векторным полем.
Таким образом, управляемая система — это семейство векторных по-
полей. Интересующие нас свойства систем сохраняются при гладких за-
заменах переменных в пространстве состояний. Кроме того, допускается
обширный класс преобразований, перепараметризующих семейство
полей; они называются преобразованиями обратной связи в теории
управления и калибровочными преобразованиями в геометрии и мате-
математической физике. Наличие всех этих преобразований есть внешнее
формальное основание для применения геометрических методов и
бескоординатного геометрического языка в теории управления.
Имеется и более глубокое основание. Как уже отмечалось, динами-
динамическая система — это поток (т. е. однопараметрическая группа преоб-
преобразований пространства состояний), порожденный векторным полем.
Допустимая траектория, отвечающая постоянному управлению, есть
траектория соответствующего потока. Траектория, отвечающая ку-
кусочно постоянному управлению, строится при помощи суперпозиции
подходящих элементов потоков, соответствующих значениям функ-
функции управления. Произвольное управление можно сколь угодно хо-
хорошо приблизить кусочно постоянными. Следовательно, допустимые
траектории и множества достижимости теснейшим образом связаны
с группой преобразований, порожденной динамическими системами,
из которых состоит изучаемая управляемая. В свою очередь группы
преобразований — это сердце геометрии.
Какое же место предназначено языку, методам и образам теории
управления в геометрии и, более общим образом, в изучении основ-
основных структур окружающего нас мира? Чтобы понять это, полезно
10 Предисловие
рассмотреть множества допустимых скоростей — первоначальный на-
наивный способ описания множеств достижимости «в бесконечно ма-
малом». Множество допустимых скоростей в заданной точке состоит
из скоростей всех допустимых траекторий, проходящих через эту
точку. Как правило, у интересных управляемых систем размерность
множеств достижимости намного больше, чем размерность множеств
допустимых скоростей. Например, типичная пара векторных полей
на n-мерном многообразии порождает n-мерные множества достижи-
достижимости при сколь угодно большом п. Иными словами, ограничения на
скорости, вообще говоря, не влекут ограничений на состояния. Такого
рода ограничения на скорости обычно называют неголономными. Тео-
Теория управления — это дисциплина, занимающаяся систематическим
изучением возможных типов поведения при неголономных ограниче-
ограничениях и, в частности, исследованием вариационных задач с неголоном-
неголономными ограничениями, решения которых можно интерпретировать как
«оптимальное поведение».
Глава 1 книги носит вводный характер: мы напоминаем, что такое
гладкие многообразия и обыкновенные дифференциальные уравне-
уравнения на гладких многообразиях, после чего определяем управляемые
системы.
Глава 2 посвящена формальному исчислению, сильно облегчаю-
облегчающему работу с нелинейными управляемыми системами.
В главе 3 вводится простой и чрезвычайно распространенный в
приложениях класс линейных систем, а в главе 4 эффективно описаны
системы, которые можно превратить в линейные гладкими преобра-
преобразованиями пространства состояний.
Главы 5-7 посвящены фундаментальной теореме об орбите Нага-
но и Суссмана и ее приложениям. Теорема об орбите утверждает,
что любая орбита группы, порожденной семейством потоков, есть
погруженное подмногообразие. При этом сама группа может быть
совершенно необозримой.
Глава 8 содержит общие факты о структуре множеств достижи-
достижимости, начиная с простого условия, гарантирующего их полномер-
ность.
В главе 9 вводятся преобразования обратной связи, дана класси-
классификация линейных систем по отношению к этим преобразованиям,
а также эффективно описаны системы, которые можно превратить
в линейные, если наряду с гладкими заменами переменных в прост-
пространстве состояний использовать преобразования обратной связи.
Остальная часть книги в основном посвящена оптимальному
управлению.
В главе 10 мы ставим задачу оптимального управления, даем ее
геометрическую интерпретацию и обсуждаем вопрос о существовании
решения.
Глава 11 содержит начальные сведения о дифференциальных фор-
формах и гамильтоновых системах, необходимые для квалифицированно-
квалифицированного исследования задач оптимального управления.
Предисловие 11
Глава 12 посвящена геометрической бескоординатной формули-
формулировке и детальному доказательству принципа максимума Понтряги-
на — ключевого результата теории оптимального управления.
Главы 13—16 содержат многочисленные приложения принципа
максимума, включая одно любопытное свойство гамильтоновых сис-
систем с выпуклыми гамильтонианами и достаточно полные теории ли-
линейных задач быстродействия и регулярных линейно-квадратичных
задач с конечным горизонтом.
В главе 17 обсуждается гамильтонова версия теории полей экс-
экстремалей, хорошо приспособленная для приложений к задачам опти-
оптимального управления, и вводится уравнение Гамильтона—Якоби.
Главы 18 и 19 посвящены методу подвижных реперов и задачам
на группах Ли. Определение и необходимые сведения о группах Ли
приведены в главе 18; все они легко выводятся из результатов о се-
семействах векторных полей, полученных в предыдущих главах.
В главах 20 и 21 подробно изучается вторая вариация в задачах
оптимального управления и выводятся необходимые и достаточные
условия оптимальности второго порядка как для регулярных, так и
для особых экстремалей.
В короткой главе 22 описана полезная процедура редукции, уста-
устанавливающая связь между особыми и регулярными экстремалями.
В главе 23 вводится и вычисляется (в простейших маломерных си-
ситуациях) кривизна задачи оптимального управления: замечательный
инвариант, обобщающий гауссову кривизну поверхности.
Наконец, в главе 24 обсуждается управление классической неголо-
номной системой: одно тело катится по другому без проскальзываний
и прокручиваний. В добавление отнесены доказательства некоторых
результатов, сформулированных в главе 2.
Таково, кратко, содержание книги. В каждой главе мы стараемся
оставаться на уровне учебника, т. е. приводить только первые до-
достаточно простые результаты и некоторые приложения. Темы почти
каждой главы уже получили серьезное развитие, и тому, кто желает
изучить предмет глубже, придется после ознакомления с нашей кни-
книгой обратиться к журнальным статьям.
Геометрическая теория управления — весьма многогранный пред-
предмет, и многие важные темы в данной книге даже не упомянуты.
Например, мы не рассматриваем важную задачу стабилизации при
помощи обратной связи и не касаемся обширной теории управляемых
систем «с выходом», включающей фундаментальные понятия наблю-
наблюдаемости и реализации. Сведения по этим и другим темам можно
найти в книгах по теории управления, приведенных в списке литера-
литературы.
Мы хотим поблагодарить наших учителей Реваза Валериановича
Гамкрелидзе и Алексея Федоровича Филиппова за щедро переданное
нам понимание математики и теории управления, а также за постоян-
постоянную поддержку при работе над книгой.
12 Предисловие
Мы выражаем благодарность за поддержку этого проекта со
стороны Международной школы высших исследований (г. Триест,
Италия), Математического института им. В.А. Стеклова (г. Москва),
а также Института программных систем РАН (г. Переславль-За-
лесский).
Мы благодарны участникам семинара по геометрической тео-
теории управления в Международной школе высших исследований в
г. Триест, особенно Улиссу Серру, Игорю Зеленко и Сержио Родри-
гесу, за ценные замечания, позволившие улучшить изложение.
Наконец, мы не смогли бы написать эту книгу без тепла и заботы
наших жен Ирины и Елены.
Москва - Переславль-Залесский - Триест А. А. Аграчев,
Октябрь 2003 г. Ю.Л. Сачков
Глава 1
ВЕКТОРНЫЕ ПОЛЯ И УПРАВЛЯЕМЫЕ
СИСТЕМЫ НА ГЛАДКИХ МНОГООБРАЗИЯХ
1.1. Гладкие многообразия
Этот параграф посвящен краткому обзору простейших понятий,
связанных с гладкими многообразиями. Для их систематического изу-
изучения читатель может обратиться к вводной главе любого учебника
по анализу на многообразиях, например [148].
В дальнейшем под гладкостью (многообразия, отображения, век-
векторного поля и т.д.) мы подразумеваем С°°-гладкость.
Определение 1.1. Подмножество М С Мп называется глад-
гладким k-мерным подмногообразием Мп, к ^ п, если для любой точки
х Е М существует окрестность ОжвМп,в которой М задается одним
из следующих способов:
1) существует гладкая вектор-функция
F: Ox
rank —
dx
= п — к
такая, что
ОХПМ = F~1@);
2) существует гладкая вектор-функция
: Vq —t К.
из окрестности начала координат О G Vq С
такая, что
/@) = х,
rank У-
= к,
причем
и/: Уо —> ОХПМ — гомеоморфизм;
3) существует гладкая вектор-функция
Ф: Ох -+ О0 С W1
на окрестность начала координат 0 G Oq С Мп такая, что
причем
rank —— = n,
dx x
Ф(ОХПМ) =RkH(
Упражнение 1.1. Докаж:ите, что способы 1)—3) локального
описания гладких подмногообразий взаимно эквивалентны.
Замечания. A) Существуют два топологически различных од-
одномерных многообразия: прямая М1 и окружность S1. Сфера ?2 и тор
14
Гл. 1. Векторные поля и управляемые системы
Т2 = S1 x S1 — двумерные многообразия. Тор молено представлять
как сферу с ручкой. Любое компактное ориентируемое двумерное
многообразие топологически эквивалентно сфере с р ручками, р =
= 0,1,2,...
B) Гладкие многообразия естественно возникают в простейших
задачах анализа. Например, окружность б4 и тор Т2 — области
определения соответственно периодических и дважды периодических
функций. Однородные функции трех переменных естественно огра-
ограничивать на сферу S2.
Итак, гладкое подмногообразие есть подмножество в Мп, которое
локально может быть задано регулярной системой гладких уравнений
или регулярной гладкой параметризацией.
Несмотря на то, что интуитивно важно представлять многообра-
многообразия как подмножества евклидова пространства, часто удобно рассмат-
рассматривать многообразия независимо от какого бы то ни было вложения
в Мп. Абстрактное многообразие определяется следующим образом.
Определение 1.2. Гладким к-мерным многообразием М на-
называется хаусдорфово паракомпактное топологическое пространство
с заданной на нем гладкой структурой: М покрыто системой откры-
открытых подмножеств
U
называемых координатными окрестностями, в каждой из которых
определен гомеоморфизм
называемый локальной системой координат, так что все композиции
Ф^оФ: Фа(ОаПО0) cRk ^ Ф0(ОаПОр) СМ."
суть диффеоморфизмы (рис. 1.1).
Рис. 1.1. Система координат на гладком многообразии М
1.1. Гладкие многообразия 15
Как правило, мы будем обозначать точку гладкого многообразия
через д, а ее координатное представление в локальной системе коор-
координат — через х:
qeM, <$>a:Oa^Rk, х = Ф(д) G Rk.
Гладкое подмногообразие в Мп удовлетворяет определению абст-
абстрактного многообразия. Обратно, любое связное гладкое абстракт-
абстрактное многообразие можно рассматривать как гладкое подмногообразие
в W1. Для того чтобы сформулировать точно это утверждение, дадим
два определения.
Определение 1.3. Пусть М и N — соответственно к- и /-мер-
/-мерные гладкие многообразия. Непрерывное отображение
/: М ^N
называется гладким, если оно гладко в координатах. А именно, пусть
М = U Оа и N = U V13 — покрытия М и N координатными окрест-
ностями и
— соответствующие координатные отображения. Тогда для гладкос-
гладкости / все композиции
Ф^о/оФ: Фа(Оа П r\Vp)) cRk ^ ^!3{f{Oa) П Vp) С Rl
должны быть гладкими.
Определение 1.4. Гладкое многообразие М называется диф-
феоморфным гладкому многообразию АГ, если существует гомеомор-
гомеоморфизм
f:M^N
такой, что как /, так и его обращение /-1 — гладкие отображения.
Такое отображение / называется диффеоморфизмом.
Множество всех диффеоморфизмов /': М —>• М гладкого многооб-
многообразия М будем обозначать Diff M.
Гладкое отображение /: М —>> N называется вложением многооб-
многообразия М в 7V, если отображение на образ /: М —>• f(M) есть диффео-
диффеоморфизм. Отображение / : М —>• N называется собственным, если
прообраз f~1{K) компактен для любого компакта К (е N (обозначе-
(обозначение К (е N означает, что К есть компактное подмножество множест-
множества 7V).
Теорема 1.1 (Уитни). Любое гладкое связное k-мерное много-
многообразие имеет собственное вложение в M2fe+1.
Итак, можно сказать, что гладкое многообразие — это пространст-
пространство, выглядящее локально как линейное, но без фиксированной линей-
линейной структуры, так что все гладкие системы координат равноправны.
Именно язык многообразий, а не линейных пространств, является
естественным языком современного нелинейного анализа.
16
Гл. 1. Векторные поля и управляемые системы
1.2. Векторные поля на гладких многообразиях
Касательное пространство гладкого многообразия в точке — это
линейное приближение многообразия в окрестности этой точки.
Определение 1.5. Пусть М — гладкое /с-мерное подмногооб-
подмногообразие в!п и х Е М — его точка. Касательным пространством к М
в точке х называется /с-мерное линейное подпространство
которое в случаях 1)-3) определения 1.1 задается следующим обра-
образом:
1) ТХМ = Кег — ;
dx х
2) ТХМ = Im 4^
dx
-1
Замечание. Касательное пространство не зависит от коорди-
координат, так как гладкие замены переменных порождают линейные пре-
преобразования касательного пространства.
Касательное пространство абстрактного многообразия в точке
определяется как множество векторов скорости всех гладких кривых
на многообразии, выходящих из этой точки.
Определение 1.6. Пусть 7@ — гладкая кривая на многооб-
многообразии М, выходящая из точки q G М:
гу: (—е,е) —>• М — гладкое отображение, 7@) = Я.-
Касательным вектором
dt
t=o
= 7@)
кривой 7(-) в точке q называется класс эквивалентности всех гладких
кривых в М, выходящих из q и имеющих такой же многочлен Тейлора
порядка 1, как 7@? в любой системе координат в окрестности точки q
(рис. 1.2).
Определение 1.7. Касательным пространством гладкого
многообразия М в точке q G М называется множ:ество всех касатель-
Рис. 1.2. Касательный вектор
7@)
Рис. 1.3. Касательное пространство TqM
1.2. Векторные поля на гладких многообразиях
17
ных векторов всех гладких кривых в М, выходящих из q:
*=о
7: (—?,?) —^ М гладкая, 7@) = ч
(рис. 1.3).
Упражнение 1.2. Пусть М — гладкое /с-мерное многообразие
и q E М. Покажите, что касательное пространство TqM имеет естест-
естественную структуру /с-мерного ли-
линейного пространства.
Определение 1.8. Глад-
Гладким векторным полем на глад-
гладком многообразии М называется
гладкое отображение
qeM i-> V{q) E TqM,
сопоставляющее любой точке q E
Е М касательный вектор V(q) в
этой точке.
Мы будем обозначать мно-
множество всех гладких векторных
полей на гладком многообра-
многообразии М через Vec M.
Определение 1.9. Гладкой динамической системой или обык-
обыкновенным дифференциальным уравнением (ОДУ) на гладком много-
многообразии М называется уравнение вида
Рис. 1.4. Решение ОДУ q = V(q)
или, что то же самое,
q = V(q), qeM,
где V(q) — гладкое векторное поле на М. Гешением этой системы
называется гладкое отображение
7: I ^ М
интервала / С Ш в многообразие М такое, что
(см. рис. 1.4).
Определение 1.10. Пусть Ф: М —>• N — гладкое отображение
между гладкими многообразиями М и N. Дифференциалом Ф в точ-
точке q G М называется линейное отображение
Dq<f>: TqM
которое определяется следующим образом:
2 А.А. Аграчев, Ю.Л. Сачков
18
Гл. 1. Векторные поля и управляемые системы
Рис. 1.5. Дифференциал Dq<$> отображения Ф
для любой гладкой кривой в М, выходящей из д,
7: (-М)СКЧМ, 7@) = G
(рис. 1.5).
Изучим действие гладких отображений на векторные поля. Пусть
V Е Vec М — векторное поле на М, и пусть
Q=V(q) A.1)
есть соответствующее дифференциальное уравнение. Чтобы найти
образ векторного поля V(q) под действием диффеоморфизма
Ф: М —)> 7V, Ф: g ^ ж = Ф(д),
возьмем решение д(?) уравнения A.1) и найдем уравнение, которому
удовлетворяет образ решения x(t) = (())
Итак, искомое уравнение имеет вид
±=(?>ф-1(г)Ф)^(ф-1(а:)). A.2)
В правой части этого уравнения стоит векторное поле на JV, поролс-
денное диффеоморфизмом Ф:
(*.V)(x) ^ A>ф-1(х)Ф) ^(Ф-1^)).
Символ Ф*д используется наряду с Dq<§> для обозначения дифферен-
дифференциала отображения Ф в точке q.
Замечание. Вообще говоря, гладкое отображение Ф порождает
отображение касательных векторов, а не векторных полей. Для того
чтобы ИФ отображал векторные поля в векторные поля, Ф должно
быть диффеоморфизмом.
1.3. Обыкновенные дифференциальные уравнения
и потоки
Теорема 1.2. Рассмотрим гладкое дифференциальное урав-
q = V(q), qeMcRn, A.3)
1.3. Дифференциальные уравнения и потоки 19
на гладком многообразии М в W1. Для любой начальной точки до ?
Е М существует единственное решение
д(?, до), t е (а,Ь), а < 0 < Ъ,
уравнения A.3) с начальным значением
tf@,tfo) = до,
определенное на достаточно малом интервале (а,Ь). Отображение
(t,q0) ^ q(t,q0)
гладкое. В частности, область определения (а, Ъ) решения д(-,до)
может быть выбрана гладко зависящей от точки до-
Доказательство. Мы докажем эту теорему, сводя ее к клас-
классическому аналогу в W1. Утверждение теоремы локально. Выпрямим
подмногообразие М в окрестности точки д0:
Ф: Oqo CW1 -^Оо СГ,
Рассмотрим ограничение (р = Ф|м- Кривая q(t) в М есть решение
уравнения A.3) тогда и только тогда, когда ее образ x(i) = (p(q(i))
в Mfe — решение индуцированной системы
поэтому утверж:дение теоремы следует из аналогичной теоремы для
дифференциальных уравнений в евклидовом пространстве. ?
Теорема 1.3. Пусть М С Мп — гладкое подмногообразие, а сис-
система дифференциальных уравнений в W1
q = V(q), деГ, A.4)
удовлетворяет условию
V(q) в TqM для всех q G М.
Тогда для любой начальной точки qo E M соответствующее ре-
решение q(t, go) уравнения A.4) с начальным условием д@, до) = до при-
принадлежит М для всех достаточно малых \t\.
Доказательство. Рассмотрим ограничение векторного поля
f = v\M.
По теореме существования для М система
я = /(?), «ем,
имеет решение g(?,go), где g(O,go) = go такое, что
q(t,qo) G М при малых \t\. A-5)
С другой стороны, кривая q(t,qo) есть решение уравнения A.4) с тем
же начальным условием. Поэтому включение A.5) завершает доказа-
доказательство теоремы. ?
2*
20 Гл. 1. Векторные поля и управляемые системы
Определение 1.11. Векторное поле V G VecM называется
полным, если для любой точки q0 G М решение q(t,qo) задачи Коши
q = V(q), g@,go) = 4o A.6)
определено для всех t G R.
Пример 1.1. Векторное поле V(х) = х полно на всей прямой М,
а также на ее подмножествах М\ {0}, (—оо,0), @,+оо) и {0}, но не
полно ни на каких других подмногообразиях прямой. Векторное поле
V{x) = х2 не полно ни на каких подмногообразиях прямой, кроме {0}.
Предложение 1.1. Пусть существует такое е > 0, что для
любого qo Е М решение q(t,qo) задачи Коши A.6) определено при t G
G (—?, е). Тогда векторное поле V(q) полно.
Замечание. В этом утверждении требуется, чтобы существо-
существовало е > 0, общее для всех начальных точек qo Е М. Вообще говоря, е
может быть не отделено от нуля для всех q0 G М. Например, для
векторного поля W(x) = х2 г —>- 0 при xq —>- ос.
Доказательство. Пусть условие предложения выполняется.
Тогда можно определить следующее семейство отображений на М:
Pf: М -+ М, te (-e,e),
Здесь Pt(qo) — сдвиг точки qo G М вдоль траектории векторного
поля V(q) за время t. По теореме 1.2 все отображения Pt гладкие.
Более того, {Рг\ t G (—е,е)} есть гладкое семейство отображений.
Очень важ:ное свойство этого семейства состоит в том, что оно
образует однопараметрическую группу, т. е.
qeM, t,s,t + se(-s,e)
Действительно, обе кривые в М:
удовлетворяют уравнению q = V(q) с одним и тем же начальным усло-
условием P°(Ps(q)) = P°+S(q) = Ps(q). В силу единственности P\Ps(q)) =
_ p*+s(^g). Равенство для Ps(Pt(q)) получается перестановкой t и s.
Поэтому выполнены следующие локальные групповые свойства се-
семейства Рь:
ptoPs = psoPt ^ ,,
Р° = Id,
Р"* о Р* = Р* о Р"* = Id, te (-e, e),
Р-* = (Р*), *Е (-е,е).
В частности, все Р* суть диффеоморфизмы.
1.3. Дифференциальные уравнения и потоки
21
Определим семейство Р1 для всех значений t G М. Любое t E
можно представить в виде
Положим
pt def рТ
= 0, ±1, ±2,...
± =
\К\ раз
Тогда кривая
есть решение задачи Коши A.6). П
Определение 1.12. Для полного векторного поля V G VecM
отображение
t^ P\ teR,
называется потоком, порожденным полем V.
Замечание. Полезно представлять векторное поле V G VecM
как поле скоростей жидкости, движущейся по М. Поток Р1 переносит
Рис. 1.6. Поток Рг векторного поля V
за время t Е М любую частицу из положения q G М в положе-
положение Pl{q) Е М (рис. 1.6).
Простые достаточные условия полноты векторного поля можно
сформулировать в терминах компактности.
Предложение 1.2. Пусть К (е М — компактное подмно-
подмножество, и пусть V G VecM. Тогда существует Ек > 0 такое, что
для любого qo G К решение q(t,qo) задачи Коши A.6) определено при
всех t G (-ек,?к)-
Доказательство. По теореме 1.2 область определения реше-
решения q(t,qo) может быть выбрана непрерывно зависящей от q0. Диа-
Диаметр области определения имеет положительную нижнюю грань
для qo, принадлежащих компакту К. ?
22 Гл. 1. Векторные поля и управляемые системы
Следствие 1.1. Любое векторное поле V G Vec M на компакт-
компактном многообразии М полно.
Следствие 1.2. Предположим, что векторное поле V G Vec M
имеет компактный носитель, т. е.
def
¦с
aei с -. /г\
= {qeM\
компактен. Тогда поле V полно.
Доказательство. Действительно, согласно предложению 1.2
существует е > 0 такое, что все траектории поля V, начинающиеся в
suppF, определены для t G (—?, е). Но V\m\suppV = 0> поэтому все
траектории поля V, начинающиеся вне suppV, постоянны, следова-
следовательно, определены для всех t G М. В силу предложения 1.1, векторное
поле V полно. ?
Замечание. Если мы интересуемся поведением (траекторий)
векторного поля V G Vec М в компактном подмножестве К (е М, мож-
можно считать, что V полно. Действительно, возьмем открытую окрест-
окрестность О к подмножества К с компактным замыканием О к- Найдем
функцию a G С°°{М) такую, что
rl, qeK,
[О, qeM\OK.
Тогда векторное поле a(q)V(q) G VecAf полно, так как оно имеет
компактный носитель. С другой стороны, векторные поля a(q)V(q) и
V(q) совпадают в К, поэтому они имеют одни и те же траектории в
этом подмножестве.
1.4. Управляемые системы
Для динамических систем их будущее состояние q(t,qo), t > 0,
полностью определяется настоящим состоянием go = ^(О>^о)- Закон
преобразования q$ i—>- q(t,qo) — это поток Р1, поэтому динамика сис-
системы
q = V(q), q G M, A.7)
определяется одним векторным полем V(q).
Для того чтобы влиять на динамику, управлять ею, введем се-
семейство динамических систем
q = Vu(q), qeM, и G U, A.8)
где семейство векторных полей Vu параметризовано параметром
и ? U. Система вида A.8) называется управляемой системой.
Переменная и называется управляющим параметром, а множест-
множество t/ — пространством управляющих параметров. Априори никакие
ограничения на множество U не накладываются, это произвольное
множество, однако обычно U будет подмножеством гладкого много-
многообразия. Переменная q называется состоянием, а многообразие М —
пространством состояний управляемой системы A.8).
1.4- Управляемые системы 23
В теории управления мы изменяем динамику управляемой систе-
системы A.8) в любой момент времени, изменяя значения управления и G
G U. Для любого и G U соответствующее векторное поле Vu G Vec M
порождает поток, который обозначается через Р^.
Типичная задача теории управления состоит в нахождении мно-
множества точек, достижимых из начальной точки q$ Е М благодаря
выбору всевозможных значений и G U и переключению между этими
значениями в разные моменты времени (для динамической систе-
системы A.7) такое множество достижимости есть просто положительная
полутраектория q(t,qo) = Pt(qo), t ^ 0).
Пусть мы выходим из точки qo G М и применяем следующую
стратегию управления для системы A.8): сначала выбираем некоторое
значение управляющего параметра и\ G С/, а затем переключаемся на
другое значение и*} G U. Какие точки в М достижимы с помощью
такой стратегии? С помощью управляющего параметра щ можно
попасть в точки вида
а все множество достижимых точек имеет вид
т. е. это кусок 2-мерной поверхности:
Естественно задать следующий вопрос: какие точки достижимы
из go c помощью любых возможных стратегий управления?
Мы вернемся к этому вопросу ниже, а сейчас рассмотрим пример
управляемой системы — упрощенной модели автомобиля.
Пример 1.2. Мы считаем, что состояние машины определяется
положением ее центра масс ж = (^i,^) G М2 и углом ориентации
в Е S1 относительно положительного направления оси х\. Поэтому
пространство состояний системы есть нетривиальное 3-мерное много-
многообразие — полноторий
М = {q= (х,в)\х GM2, в eS1} = R2 х S1.
Будем предполагать, что возможны движения двух видов: можно
ехать вперед и назад с некоторой постоянной линейной скоростью и\ G
G R, и можно поворачивать машину вокруг центра масс с постоянной
24 Гл. 1. Векторные поля и управляемые системы
угловой скоростью и2 G М. Более того, эти способы движения можно
комбинировать некоторым допустимым образом.
Динамическая система, описывающая движение по прямой со ско-
скоростью U\ G М, имеет вид
Х\ = U\ COS#,
х2 = u\ sin#, A.9)
"' = 0.
Вращение с угловой скоростью и2 G Ш. описывается системой
xi = 0,
х2 = 0, A.10)
= и2.
Управляющий параметр и = (u\,U2) мож:ет принимать значения в
некотором заданном подмнож:естве [/СМ2. Запишем уравнения A.9)
и A.10) в векторной форме:
q = u1V1{q), q = u2V2{q),
где
/cos в\ /0\
^(д)= sinfl , V2{q)= 0 A.11)
V о у Vv
суть векторные поля на многообразии М. Тогда наша модель имеет
вид
V{) V{) V{), q G М, и G U.
Эту модель мож:но записать в комплексной форме:
z = х\ + г^2 G С,
= V>2,
Замечание. Управляемую систему A.8) часто записывают в
другом виде:
q = /(g5 и), q G М, и G U.
Мы предпочитаем обозначение Vu{q), подчеркивающее, что при фик-
фиксированном и G U Vu есть единый объект — векторное поле на М.
Вернемся к изучению множества точек, достижимых вдоль траек-
траекторий управляемой системы из начальной точки.
Определение 1.13. Множество достижимости управляе-
управляемой системы A.8) с кусочно постоянными управлениями из точки
go G М за время t ^ 0 определяется следующим образом:
t-{Prko оРгг Т>о Тт -t и eu ken]
1.4- Управляемые системы
25
Множество достижимости из до
за любое неотрицательное время дви-
движения имеет вид
(рис. 1.7).
Для простоты рассмотрим снача-
сначала наименьшее нетривиальное прост-
пространство управлений, состоящее из
двух индексов:
U = {1,2}
(даже этот простой случай позволя-
позволяет увидеть характерные особенности
задачи). Тогда множество достижимости за любое неотрицательное
время можно представить в следующем виде:
Ао = {Р? ° Р?-1 о.-.оР^о рр- (qo) | Ti 2 0, к е Щ.
Это выражение подсказывает, что множество достижимости Лдо
должно существенно зависеть от коммутационных свойств потоков
Р{ и Р|.
Сначала рассмотрим тривиальный коммутативный случай, т. е.
предположим, что потоки перестановочны:
Р[ о Р* = Р* о Р*
Рис. 1.7. Множество достижи-
достижимости Адо
Vf,sGt
Тогда множество достижимости может быть вычислено точно: так
как
~""' оКк~± о ...о F~z о.
то получаем
Ао = {Pi °Pi(qo) \t, о о}.
Поэтому в коммутативном случае множ:ество достиж:имости с по-
помощью двух управляющих параметров есть кусок двумерной поверх-
поверхности, быть может, с особенностями. Легко видеть, что если коли-
количество управляющих параметров равно к ^ 2 и соответствующие
потоки P11,...,P^fe коммутируют, то множество достижимости Лдо
есть, вообще говоря, кусок fc-мерного многообразия, и, в частности,
dim.v4g0 ^ к. Но этот коммутативный случай является исключитель-
исключительным и почти никогда не встречается в реальных управляемых сис-
системах.
Пример 1.3. В построенной выше модели машины динамика
управления определяется двумя векторными полями A.11) на трех-
трехмерном многообразии
2 j
Очевидно, что мы можем перевести машину из любой начальной кон-
конфигурации q0 Е М в любую конечную конфигурацию q\ G М, попе-
26
Гл. 1. Векторные поля и управляемые системы
Рис. 1.8. Начальная и конеч-
конечная конфигурации машины
Рис. 1.9. Перевод машины из до в д\
ременно совершая поступательные движения и вращения (с постоян-
постоянной скоростью); рис. 1.8, 1.9.
Поэтому любая точка трехмерного многообразия М достижима
из любой другой точки с помощью двух векторных полей Vi, V<i-
Это возможно благодаря некоммутативности этих полей (т. е. их по-
потоков).
Как можно определить коммутационные свойства пары векторных
полей Vi, V2 E Vec Af, не находя явно их потоки Pf, Р|, т. е. не интег-
интегрируя дифференциальные уравнения q = Vi(g), q = l^(^)?
Если потоки Р*, Р| коммутируют, то кривая
= Pf
A.12)
не зависит от t. Естественно предположить, что за коммутацион-
коммутационные свойства потоков векторных полей Vi, V2 в точке q отвечает
некоторый член малого порядка тейлоровского разложения отобра-
отображения A.12) при t = s = 0. Очевидно, что производные первых по-
порядков
dt
s=t=O
д s
s=t=O
здесь бесполезны так же, как и чистые производные второго порядка
= 0 ——
' Л 2
S = t = O
s=t=O
д_
ds
s=0
Искомой производной долж:на быть смешанная вторая производная
dtds
s=t=O
Оказывается, что эта производная задает некоторый касательный
вектор к М. Он называется скобкой Ли векторных полей Vi, V2 в
точке q и обозначается [Vi,
Pf*oP|oP*(g)GTgM.
A.13)
t=s=O
1.4- Управляемые системы
27
Векторное поле [Vi, V2] G VecAf определяет коммутационные соот-
соотношения полей Fi и У2, его часто называют коммутатором вектор-
векторных полей Vi, V2.
Эффективная формула для вычисления скобки Ли векторных
полей в локальных координатах дается в следующем предложении.
Предложение 1.3. Пусть Vi, V2 — векторные поля на W1.
Тогда
\УьШ*) = -ПУ1{х)--^У2[х). A-14)
Доказательство предоставляется читателю как упражнение.
Скобку Ли векторных полей V\, V2 можно определить по-другому,
рассматривая кривую
pt
(рис. 1.10).
Упражнение 1.3. Покажи-
Покажите, что в локальных координатах
Рис. 1.10. Скобка Ли векторных
полей Vi, V2
т.е. [Vi,V2](#) — вектор скорости
G1-кривой 7(v^)- В частности,
отсюда следует, что [Vi,l^](a:)
есть действительно касательный
вектор к М:
[VuV2]{x)?TxM.
В следующей главе мы построим эффективное алгебраическое ис-
исчисление для выполнения подобных вычислений без использования
координат.
В коммутативном случае множество достижимости системы из
двух полей Vi, V2 не зависит от количества переключений страте-
стратегии управления. В общем некоммутативном случае картина иная:
чем больше количество переключений, тем больше точек дости-
достижимо.
Пусть мы можем двигаться вдоль векторных полей ±Vi и ±1^.
Тогда инфинитезимально допустимо движение в новом направлении
d=[V^., T^], которое, вообще говоря, линейно не зависит от исходных
направлений ±Vi, ±1^. Используя ту же стратегию переключения для
полей ±Vi и ±[Vi,V2], мы добавляем еще одно инфинитезимальное
направление движения =b[Vi, [Vi, V2]]. Аналогично можно получить
±[V2, [Vi, V2]]. Повторяя эту процедуру с новыми векторными поля-
полями, полученными на предыдущих шагах, можно получить скобку
Ли сколь угодно высокого порядка в качестве инфинитезимально-
го направления движения для достаточно большого числа переклю-
переключений.
28 Гл. 1. Векторные поля и управляемые системы
Пример 1.4. Вычислим скобку Ли векторных полей
/cos0\ /0\ /хЛ
V1(q)=ism0l V2(q)=i0l q = f x2 \ G R2XuX2 X S],
возникающих в модели машины. Напомним, что поле V\ порождает
движение вперед, а поле V2 — поворот машины против часовой
стрелки.
Согласно A.14) получаем
/О 0 -sin0\ /0\ / sin0\
= - 0 0 cos0 0 = -cos0 .
\0 О О J \lj \ О J
Векторное поле [Vi, V2] порождает движение машины в направлении,
перпендикулярном ее ориентации. Это типичный маневр при парков-
Рис. 1.11. Реализация скобки Ли маневром машины
ке автомобиля: последовательность четырех движений с одной и той
же малой амплитудой вида
движение вперед —>- поворот против часовой стрелки —>•
—>- движ:ение назад —>- поворот по часовой стрелке
приводит к движ:ению вправо (в главном члене); рис. 1.11. Покажем
это явно, вычисляя скобку Ли [Vi, V2], как в примере 1.3:
\\ ( + ?(cos в — cosF + t))
f о Pf* о Р* о Р* ( х2 ) = \ х2 + ^(sin(9 - sinF> + t))\ =
OJ \ )
1.4- Управляемые системы 29
Опять получаем
/ sin0\
[VuV2](q)= -cos0 . A.15)
V 0 )
Конечно, эту скобку Ли можно вычислить и по определению, как
в A.13):
/хЛ (х\ + t{cos в ~ cos(# + s))
РГ* ° Pi о Pj* ж2 I = ж2 + t(sm0 - sin@ + s)) =
\oj \ e+s )
(XA /°\ / \
= \X2 \+s 0 +is -cos6»
V^y \i/ V о )
и коммутатор A.15) получен еще раз.
Глава 2
ЭЛЕМЕНТЫ ХРОНОЛОГИЧЕСКОГО
ИСЧИСЛЕНИЯ
В этой главе мы построим операторное исчисление, с помощью
которого можно работать с нелинейными системами и потоками как
с линейными, по крайней мере на формальном уровне. Идея состо-
состоит в том, чтобы заменить нелинейный объект — гладкое многооб-
многообразие М — линейным, хотя и бесконечномерным — коммутативной
алгеброй гладких функций на М. Более подробное изложение этих во-
вопросов читатель может найти в работах [20, 23]. Для изучения началь-
начальных определений и фактов функционального анализа, использую-
использующихся в этой главе, можно обратиться, например, к учебнику [146].
2.1. Точки, диффеоморфизмы и векторные поля
В этом параграфе мы отождествляем точки, диффеоморфизмы и
векторные поля на многообразии М с некоторыми функционалами
и операторами в алгебре С°°(М) всех гладких вещественнозначных
функций на М.
Сложение, произведение и умножение на константы определяются
в алгебре G°°(М), как обычно, поточечно: если а,Ь ? С°°(М), q G М,
а G R, то
(a-a)(q) = a-a(q).
Любая точка q G M определяет линейный функционал
q: С°°{М) -+ М, qa = a(q), a G С°°(М).
Функционалы д^суть гомоморфизмы из алгебры С°°(М) в М:
q(a + b) = qa + qb, а,Ъ G С°°(М),
q{a • Ъ) = {qa) • (qb), а, Ъ G С°°(М),
q(oL-a) = OL-qa, а G М, ае С°°(М).
Поэтому любой точке q G М соответствует нетривиальный гомомор-
гомоморфизм алгебр q: C°°(M) —)> KL Оказывается, что это соответствие об-
обратимо.
Предложение 2.1. Пусть (р: С°°(М) —>• R — нетривиальный
гомоморфизм алгебр. Тогда существует такая точка q G М, что
(f = q.
Мы докажем это утверждение в приложении.
Замечание. Алгебра С°°(М) определяет М не только как мно-
множество точек. Топология на М восстанавливается по слабой тополо-
2.1. Точки, диффеоморфизмы и векторные поля 31
гии на пространстве функционалов на С°°(М):
lim qn = q О lim qna = qa Va G G°°(М).
n—>-oo n—>-oo
Более того, гладкую структуру на Af также молено восстановить по
С°°{М) фактически «по определению»: вещественнозначная функция
на множестве {q\ q G M} является гладкой тогда и только тогда, когда
она имеет вид q\-^qa для некоторого a G С°°{М).
Любой диффеоморфизм Р: М —>• М определяет автоморфизм ал-
алгебры С()
Р: С°°(М) -> С°°(М), Р G Aut(C°°(M)),
(Ра)((/) = а(Р(д)), (/ G М, ае С°°{М),
т.е. Р действует на функцию а как замена переменных. Обратно
любой автоморфизм алгебры С°°(М) имеет такой вид.
Предложение 2.2. Любой автоморфизм
А: СОО{М)^СОО{М)
имеет вид Р для некоторого Р G DifT M.
Доказательство. Пусть A G Aut(C°°(M)). Возьмем любую
точку q G М. Тогда композиция
go A: C°°{M) -+ R
есть нетривиальный гомоморфизм алгебр, поэтому она имеет вид gi
для некоторого q\ G М. Обозначим q\ = P(q). Тогда
т. е.
А = Р,
и Р — искомый диффеоморфизм. ?
Теперь мы опишем касательные векторы к М как функционалы
на С°°(М). Касательные векторы к М суть векторы скорости кривых
в М, а точки М отождествляются с линейными функционалами на
С°°{М)\ поэтому мы должны получить линейные функционалы на
G°°(Af), отличные от гомоморфизмов в Ж. Чтобы понять, какие имен-
именно функционалы на С°°(М) соответствуют касательным векторам
к М, возьмем гладкую кривую q(t) из точек М. Тогда соответствую-
соответствующая кривая из функционалов q{t) = q(t) на С°°(М) удовлетворяет
мультипликативному закону
q(t)(a • Ъ) = q{t)a • q(t)b, a,b G C°°(M).
Продифференцировав это равенство при t = 0, получаем, что вектор
скорости кривой из функционалов
^d= ft\t=0' ?-С
32 Гл. 2. Элементы хронологического исчисления
удовлетворяет правилу Лейбница
Значит, каждому касательному вектору v G TqM мы должны со-
сопоставить линейный функционал
f: C°°(M) ^R
такой, что
a,beC°°(M). B.1)
Но имеется линейный функционал ? = v, естественно соответствую-
соответствующий любому касательному вектору v G TqM, — производная по на-
направлению V.
va =
d_
dt
t=o
a(q(t)), q@) = q, q@) = v,
и этот функционал удовлетворяет правилу Лейбница B.1).
Покажем, что это правило в точности характеризует производные
по направлению.
Предложение 2.3. Пусть ?: С°° (М) —>• Ш — линейный функ-
функционал, удовлетворяющий правилу Лейбница B.1) для некоторой
точки q G М. Тогда ? = v для некоторого касательного вектора
v е TqM.
Доказательство. Заметим сначала, что любой функцио-
функционал ?, удовлетворяющий правилу Лейбница B.1), локален, т.е. зави-
зависит только от значений функций в сколь угодно малой окрестности Oq
точки q:
a\Q = а\о =^ ?S = ?a, a,a G С°°(М).
Действительно, возьмем функцию срезки Ъ G С°°{М) такую, что
Ь\М\О = 1 и b(q) = 0. Тогда (а — а)Ъ = И — а, следовательно,
?(а - а) = ?((а - а)Ъ) = ?(а - a) b(q) + (а - a)(q) ?Ъ = 0.
Поэтому наше утверж:дение локально, и мы докажем его в коорди-
координатах.
Выберем локальные координаты (^i,..., хп) на М, центрирован-
центрированные в точке q. Требуется доказать, что существуют ai,...,an G М.
такие, что
г=1
Во-первых,
поэтому ?A) = 0. В силу линейности ? (const) = 0.
2.1. Точки, диффеоморфизмы и векторные поля 33
Во-вторых, чтобы вычислить действие ? на произвольной гладкой
функции, разложим ее по лемме Адамара:
*=1 о i=l
где
о
суть гладкие функции. Тогда
где мы обозначили щ = ^xi и воспользовались равенством ЬДО) =
Итак, касательные векторы v ETqM отождествляются с производ-
производными по направлению г^: С°°(М) —>- R, т.е. с линейными функциона-
функционалами, удовлетворяющими правилу Лейбница B.1).
Теперь мы охарактеризуем векторные поля на М. Гладкое вектор-
векторное поле на М есть семейство касательных векторов vq G TqM, q G M,
такое, что для любого a G С°°(М) отображение q \-> vqa, q G М, есть
гладкая функция на М.
Гладкому векторному полю V G VecM соответствует линейный
оператор
V: С
удовлетворяющий правилу Лейбница
V(ab) = {Va)b + a(Vb), a,b G
это — производная по направлению поля У, производная Ли.
Линейный оператор в алгебре, удовлетворяющий правилу Лейбни-
Лейбница, называется дифференцированием алгебры, т. е. производная Ли V
есть дифференцирование алгебры С°°(М). Покажем, что соответст-
соответствие между гладкими векторными полями на М и дифференцирова-
дифференцированиями алгебры С°°(М) обратимо.
Предложение 2.4. Любое дифференцирование алгебры С°°(М)
есть производная по направлению некоторого гладкого векторного
поля на М.
Доказательство. Пусть D: С°° (М) —» С°° (М) — дифферен-
дифференцирование. Возьмем любую точку q G М. Покажем, что линейный
функционал
dqd= qoD: C
3 А.А. Аграчев, Ю.Л. Сачков
34 Гл. 2. Элементы хронологического исчисления
есть производная по направлению в точке д, т. е. удовлетворяет пра-
правилу Лейбница B.1):
dq(ab) = q{D(ab)) = q({Da)b + a(Db)) = q(Da)b(q) + a(q)q(Db) =
= (dqa)b{q) + a(q)(dqb), a, b G C°°(M). ?
Итак, мы можем отождествить точки q G Af, диффеоморфиз-
диффеоморфизмы P G DiffM и векторные поля V G VecM соответственно с
нетривиальными гомоморфизмами q: C°°(M) —>> М, автоморфизма-
автоморфизмами Р: С°°(М) -+ С°°(М) и дифференцированиями V: С°°(М) ->>
С{)
{)
Например, точку P(q) молено записать в операторных обозначе-
обозначениях как qo Р. Более того, мы будем опускать крышки и писать q о Р.
Это не приведет к двусмысленности: если q стоит справа от Р, то q —
точка, Р — диффеоморфизм, а P(q) — значение диффеоморфизма Р в
точке q. А если q стоит слева от Р, то q — гомоморфизм, Р — автомор-
автоморфизм, а до? - гомоморфизм алгебры С°°{М). Аналогично V(q) G
G TqM есть значение векторного поля V в точке д, а q oV: C°°(M) —)>
—>- R — производная по направлению вектора V(q).
2.2. Полунормы и С°°(М)-топология
Определим полунормы и топологию в пространстве С°°(М).
По теореме Уитни гладкое многообразие М является собственным
подмногообразием евклидова пространства M,N для достаточно боль-
большого N. Обозначим через hi, г = 1,...,7V, гладкое векторное поле
на М, являющееся ортогональной проекцией из M.N на М постоян-
постоянного векторного поля —— G Vec(MiV). Получаем N векторных полей
и х%
/ii,..., /гдг G VecM, поролсдающих касательное пространство TqM в
любой точке q G М.
Определим семейство полунорм || • \\s,k на пространстве С°°(М)
следующим образом:
||а||8|к = sup{|ftiz о...о/г^а(д)| \ q в К, 1 ^ гь ..., ц ^ 7V, 0 ^ / ^ s},
аеС°°(М), s^O, К(ёМ.
Это семейство полунорм определяет топологию на С°°(М). База этой
топологии задается подмножествами
где Kn, n G N, есть вложенная система компактов, покрывающая М:
Кп С Kn+i, U Кп = М.
п=1
Эта топология на С°°{М) не зависит от вложения М в М^. Она
называется топологией равномерной сходимости со всеми производ-
производными на компактах или просто С°° {М)-топологией. В этой топо-
2.3. Семейства функционалов и операторов 35
логии С°°(М) — пространство Фреше (полное метризуемое локально
выпуклое топологическое векторное пространство).
Последовательность функций ak G С°°(М) сходится к функции
а G С°°(М) при к —>• оо тогда и только тогда, когда
lim \\ак - a\\s,K = О V О 0, К (ё М.
к —>-оо
Для векторных полей У G Vec Af определим полунормы вида
\\V\\StK =sup{\\Va\\StK\\\a\\s+1,K = 1}, О 0, ifeM. B.2)
Можно доказать, что любое векторное поле V G Vec M имеет конеч-
конечные полунормы ||У||8,к и что справедлива оценка действия диффео-
диффеоморфизма Р G DifTМ на функцию a G С°°(М):
\\Ра\\а,к <: Cs,p ||а||в>рда, О 0, КёМ. B.3)
Поэтому векторные поля и диффеоморфизмы — линейные непрерыв-
непрерывные операторы на топологическом векторном пространстве С°°(М).
2.3. Семейства функционалов и операторов
В дальнейшем мы часто будем рассматривать однопараметри-
ческие семейства точек, диффеоморфизмов и векторных полей,
удовлетворяющих различным свойствам регулярности (например,
дифференцируемости или абсолютной непрерывности) относительно
параметра. Так как мы отождествляем точки с функционалами, а
диффеоморфизмы и векторные поля — операторами на С°°(М), то
свойства регулярности для них мы можем определить в слабом смыс-
смысле, через соответствующие свойства однопараметрических семейств
функций
Поэтому сначала дадим определения для семейств функций.
Непрерывность и дифференцируемость семейства функций at по
параметру t определяются стандартным образом, так как С°°(М) —
топологическое векторное пространство. Семейство at называется из-
измеримым по ?, если функция t i—)> at(q) измерима для любого q G М.
Измеримое семейство at называется локально интегрируемым, если
\\at\\s,к dt < оо V s ^ 0, К (е М, ^0,^1^^-
to
Семейство at называется абсолютно непрерывным по ?, если
t
= at0 "+
to
для некоторого локально интегрируемого семейства функций bt. Се-
Семейство at называется липшицевым по ?, если
IK ~ат\\з,к ^ CSjK\t-r\ Vs ^ 0, К (ё М, t,reR,
t
/ &r
36 Гл. 2. Элементы хронологического исчисления
и локально ограниченным по t, если
где CSjk и CSiK,i — некоторые константы, зависящие от 5 Д и /.
Теперь мы можем определить свойства регулярности семейств
функционалов и операторов на С°°(М). Семейство линейных функ-
функционалов на С°°(М)
t^ At, fGl,
удовлетворяет некоторому свойству регулярности (т. е. является
непрерывным, дифференцируемым, измеримым, локально интегри-
интегрируемым, абсолютно непрерывным, липшицевым, локально ограни-
ограниченным по i), если семейство
t ^ Ata, t e R,
удовлетворяет этому свойству для любого a Е С°°(М).
Локально ограниченное по t семейство векторных полей
t^Vt, VteYecM, teR,
называется неавтономным векторным полем или просто векторным
полем на М. Абсолютно непрерывное по t семейство диффеомор-
диффеоморфизмов
называется потоком на М. Для любого неавтономного векторно-
векторного поля Vt семейство функций t i—)> Vta локально интегрируемо для
любого a G С°°(М). Аналогично, для любого потока Р1 семейство
функций (Рга)(а) = а(Рг(д)) абсолютно непрерывно по t для любого
аеС°°{М).
Интегралы измеримых локально интегрируемых семейств и про-
производные дифференцируемых семейств определяются также в слабом
смысле:
t± ti
Г Atdt: а^ Г (Ata) dt, a G С°°(М),
to t0
j-tAt:a^j-t(Ata), a € С°°(М).
Можно показать, что если At и Bt — непрерывные семейства,
дифференцируемые в точке to, то семейство At о Bt непрерывно, диф-
дифференцируемо в to л удовлетворяет правилу Лейбница:
доказательство приведено в приложении.
Если семейства At и Bt операторов абсолютно непрерывны, то
композиция At о Bt также абсолютно непрерывна; то же самое спра-
справедливо для композиции функционалов и операторов. Для любого
абсолютно непрерывного семейства функций at семейство Atat также
абсолютно непрерывно, и правило Лейбница также справедливо.
2.4- Хронологическая экспонента 37
2.4. Хронологическая экспонента
В этом параграфе мы рассмотрим неавтономное дифференциаль-
дифференциальное уравнение вида
q = Vt(q), g@) = q0, B.4)
где Vt — неавтономное векторное поле наМ, и изучим поток, опреде-
определяемый этим полем. Через д, как обычно, обозначается производная
dq/dt, т.е. уравнение B.4) в развернутой форме записывается как
^f = Vt(q(t)).
2.4.1. Дифференциальные уравнения с разрывной правой
частью. Построим локальные решения задачи Копей B.4) на мно-
многообразии М, сводя ее к задаче Коши в евклидовом пространст-
пространстве. Подробное изложение теории неавтономных дифференциальных
уравнений в W1 с правой частью, разрывной по ?, читатель может
найти, например, в [140].
Выберем локальные координаты х = (ж1,..., хп) в окрестности Oqo
точки до:
Ф: OqoCM^OXoCRn, Ф: q^x,
В этих координатах поле Vt имеет вид
&tVt)(x) = Vt(x) = J2vi(t,x)-^, xeOX0, t€R, B.5)
и задача B.4) преобразуется в следующую:
х = Щх), я@) = я0, xeOX0cRn. B.6)
В силу локальной ограниченности неавтономного векторного по-
поля Vt G VecAf компоненты Vi(t,x), г = 1,...,п, его координатного
представления B.5) являются:
1) измеримыми и локально ограниченными по t для любого фик-
фиксированного х G Ожо;
2) гладкими по х для любого фиксированного tGl;
3) дифференцируемыми по ж с локально ограниченными частными
производными:
В силу классической теоремы Каратеодори (см., например, [8]),
задача Коши B.6) имеет единственное решение, т. е. вектор-функ-
вектор-функцию x(t,xo), липшицеву по ?, гладкую по xq и такую, что:
1) дифференциальное уравнение B.6) удовлетворяется для почти
всех t\
2) выполняется начальное условие ж(О,жо) = xq.
38 Гл. 2. Элементы хронологического исчисления
Тогда перенос этого решения из Rn на М
q(t,qo) = Ф~ (ж(^?жо))?
есть решение задачи B.4) на М. Отображение q(t,qo) липшицево по t
и гладко по до ? оно удовлетворяет почти всюду ОДУ и начальному
условию в B.4).
Для любого q$ Е М решение q(t,qo) задачи Коши B.4) может
быть продолжено на максимальный интервал t Е Jqo С R, содержащий
начало координат и зависящий от q$.
Мы будем предполагать, что решения q(t,qo) определены для всех
доЕМи всех tEt, т. е. Jqo = R для любых qo Е М. Тогда неавтоном-
неавтономное поле Vt называется полным. Это имеет место, например, когда
все поля Vt, t G 1, равны нулю вне общего компакта в М (в этом
случае будем говорить, что неавтономное векторное поле Vt имеет
компактный носитель).
2.4.2. Определение правой хронологической экспоненты.
Уравнение B.4), записанное как линейное уравнение для липшицевых
по t семейств функционалов на С°°(М):
№ = q(t) о Vt, q@) = q0, B.7)
удовлетворяется для построенного в предыдущем пункте семейства
функционалов
q(t, go): С°°{М) ->> К, q0 E M, tER.
Ниже мы покажем, что эта задача Коши не имеет других решений
(см. предложение 2.5). Поэтому поток, определяемый равенством
Pt . (а. \ /Г) О\
: go ^ q\Piq§)i l^-^J
есть единственное решение операторной задачи Коши
(где Id обозначает единичный оператор), в классе липшицевых пото-
потоков на М. Поток Р*, определенный в B.8), называется правой хроно-
хронологической экспонентой поля Vt и обозначается через
t
Р1 = ехр [ VT dr.
о
Ниже мы построим асимптотический ряд для хронологической
экспоненты, оправдывающий такое обозначение.
2.4.3. Разложение в формальный ряд. Перепишем диффе-
дифференциальное уравнение B.7) как интегральное:
t
q(r)oVTdr= B.10)
о
t
J
2.4- Хронологическая экспонента 39
(затем подставим это выражение для q(t) в правую часть)
= Qo + / (Qo + / q(r2) о VT2 dr2 ) о VTl dn =
0 0
( f \ ff/\
= qo о I Id + / VT dt I + / / 4\j2) ° Vr2 ° Утг dr2 dr\.
y j j j j
Многократно повторим эту процедуру, и получим разложение:
( f ff
q(t) = go ° I Id + / VT dr + / / V^-2 о V^--. dr2 dri + ...
V J JJ
0 A2(t)
... + J ... J VTn о ... о VT1 drn ... dn j +
+ /•••/ tffo+l) о УГгг+1 о . . . о УГ1 ^rn+1 . . . dn. B.11)
An+i(t)
Здесь
An W =
An W = {(n, ...,rn)Gr|0^rn^...^r1^t}
обозначает п-мерный симплекс. Чисто формально переходя в B.11) к
пределу п —>• оо, получаем формальный ряд для решения q(t) зада-
задачи B.7)
q0o(ld+jrfJ...JvTno...oVTldTn...dT1\
n=1 An(t) У
а потому и для решения Рь задачи B.9)
00 г г
Id + Y, J • • • J Угп о ... о VT1 drn ... drx. B.12)
n=1 An(t)
Упражнение 2.1. Предыдущее разложение в ряд получено
при условии t > 0, хотя хронологическая экспонента определена при
всех значениях t. Покажите, что поток exp J VT dr при t < 0 имеет
о
разложение
°° Г
...j(-VTri)o...o(-VTl)drn...dr1.
n=1 An(-t)
Этот
чимся
ряд аналогичен ряду B.12), поэтому в дальнейшем мы ограни-
ххх^^л изучением случая t > 0.
2.4.4. Оценки и сходимость ряда. К сожалению, полученные
ряды никогда не сходятся на С°°(М) в слабом смысле (при Vt ф. 0):
40
Гл. 2. Элементы хронологического исчисления
всегда существует гладкая функция на М, на которой они расходятся.
Но молено показать, что ряд B.12) является асимптотическим для
t
хронологической экспоненты Рг = exp J Vr dr. Справедлива следую-
о
тая оценка остаточного члена: обозначим т-ю частичную сумму ря-
ряда B.12) через
Sm(t) =
гп-1
n=1
J • • • J Vrn ° • • • ° Vn drn • • • dri;
тогда для любых a G C°°(M), s ^ О, К <е М
^ Сехр
fexp [Vrdr- Sm{t))a
V о J
\c f \\УТ\\а,к>
l о
dr\ x
x — ( / \\Vr\Urn-i,K'dr) \\a\\s+m,K,=O(tm), t^O, B.13)
где К' (e M — некоторый компакт, содержащий К. Мы докажем
оценку B.13) в приложении. Из оценки B.13) следует, что
= O(em), e -)¦ 0,
где S^(t) обозначает m-ю частичную сумму ряда B.12) для поля eVt.
Поэтому получаем следующее разложение в асимптотический ряд:
ехр
/ Vr
°° Г Г
Yl I ••• / VTno...oVTldrn ...
n1
B.14)
An(t)
Мы будем использовать члены этого ряда порядков нуль, один
и два:
TdT+ Г Г VT2 о VT1 dr2 dn + ...
0 0 0<t2<ti<?
Докажем, что асимптотический ряд сходится к хронологической
экспоненте на любом нормированном подпространстве L С G°°(Af),
на котором Vt определено и ограничено:
VtLcL, ||Vi||=sup{||V;a|||aeL, ||a|| < 1} < оо. B.15)
Применим операторный ряд B.14) к любой функции a G L и оценим
члены полученного ряда:
a + ^ / ... / Kn ° • • • ° VTl a drn ... dr\.
П=1 д ( + \
B.16)
2.4- Хронологическая экспонента 41
Имеем
/ ... / VTri о ... о УГ1 a drn ...
dr\
^
(используем симметрию относительно перестановок индексов а: {1,...
... ,п} ->> {1,... ,п})
(переходим к интегралу по кубу)
= 11... IHKJI • • • • • ||^ II drn... drx ¦ \\a\\ =
n!
0 0
t
1
о
Итак, ряд B.16) мажорируется экспоненциальным рядом, поэтому
операторный ряд B.14) сходится на L.
Ряд B.16) можно почленно дифференцировать, поэтому он удов-
удовлетворяет тому же дифференциальному уравнению, что и функ-
функция Рга:
&t = Vtat, a0 = а.
Следовательно,
Р1а = а + ^ / ... / УГгг о ... о VT1 adrn ... dr±.
n1
n=1
Итак, в случае B.15) асимптотический ряд сходится, более того,
справедлива оценка
\\Рга\\ ^expj /||K|
ii *ii I 11 11 '
о
Можно показать, что оценка и сходимость имеют место не только
для локально ограниченных, но и для интегрируемых на [0, t] вектор-
векторных полей:
f\Wr
о
B.15) ]
ном 1^-инвариантном подпространстве L С С°°(МП). В частности, это
dr < ос.
о
Заметим, что условия B.15) выполняются на любом конечномер-
42 Гл. 2. Элементы хронологического исчисления
имеет место, когда М = W1, L есть пространство линейных векторных
полей, a Vt — линейное поле на Мп.
Если М, Vt и а вещественно аналитические, то ряд B.16) сходится
при достаточно малых t\ доказательство этого см. в [20].
2.4.5. Левая хронологическая экспонента. Рассмотрим об-
обратный оператор Q1 = (Р*) к правой хронологической экспоненте
t
Pl = exp JVTdr. Найдем ОДУ для Q*, дифференцируя тождество
Р* о Q* = Id .
По правилу Лейбница получаем
PtoQt + PtoQt = 0,
поэтому, учитывая уравнение B.9) для потока Р*, имеем
P(oF(oQ4P'oQ' = 0.
Умножая это равенство слева на Qf, получаем
VtoQt + Q* = 0.
То есть поток Q1 есть решение задачи Копей
L Q* = -Vt о Q\ Q° = Id, B.17)
двойственной к задаче Копей B.9) для правой хронологической экспо-
экспоненты Р*. Поток Q1 называется левой хронологической экспонентной
и обозначается t
{-VT)dr.
о
Найдем асимптотический ряд для левой хронологической экспо-
экспоненты так же, как для правой, многократной подстановкой в правую
часть:
t
f{
Qt = Id + J{-VT) o QTdr =
t
(-VT) dr + ffi-Vr,) о (-VT2) о (у* dr2 dn = ...
0 A2(t)
rn-1
t
f
n=1
ч -VTl)o...o{-\
Am(t)
2.4- Хронологическая экспонента 43
Для левой хронологической экспоненты справедлива оценка остаточ-
остаточного члена, аналогичная оценке B.13) для правой экспоненты, и по-
полученный ряд является асимптотическим:
I °° Г Г
ехр J (-VT) drnld + Y,] •••} (~V^) ° ''' ° (~У^) drn-- dTi-
О ™=1 An(t)
Замечания. A) Обратная стрелка в левой хронологической
экспоненте ехр соответствует обратному порядку операторов
(-VTl)o...o(-VTn), rn^...^n.
B) Правая и левая хронологические экспоненты удовлетворяют
уравнениям
t t
— ехр / VT dr = ехр / VT dr oVt,
dt J J
о
t
Направление стрелок согласуется с направлением появления операто-
операторов Vt, — Vt в правой части этих уравнений.
C) Если начальное значение задается в момент времени ?q Ф 0, то
нижний предел интегралов в хронологических экспонентах полагает-
полагается равным ?о-
D) Справедливо очевидное правило композиции потоков
*i t2 t2
ехр / VT dr о ехр VT dr = ехр / Vr dr.
to t\ to
Упражнение 2.2. Докажите, что
t\ to _i to
exp fvrdr= fexp f VT dr) = exp f\-VT) dr. B.18)
t0 t\ t\
2.4.6. Единственность для функциональных и оператор-
операторных уравнений. Мы видели, что дифференциальное уравнение B.7)
для липшицевых семейств функционалов имеет решение
t
q(t) = q0 о ехр / Vr dr.
Теперь мы можем доказать, что это уравнение других решений не
имеет.
44 Гл. 2. Элементы хронологического исчисления
Предложение 2.5. Пусть Vt — полное неавтономное вектор-
векторное поле на М. Тогда задача Коши B.7) имеет единственное решение
в классе липшицевых семейств функционалов на С°°(М).
Доказательство. Пусть липшицево семейство функциона-
функционалов qt есть решение задачи B.7). Тогда
j-t (qt о (Р*)-1) = j-t(qt° Q*) =qtoVtoQt-qtoVtoQt=0,
поэтому qt о Ql = const. Ho Qo = Id, следовательно, qt о Qf = g0; значит,
t
qt = q0o Pf = q0o exp / Vr dr
о
есть единственное решение задачи Коши B.7). ?
Аналогично, оба операторных уравнения
не имеют других решений кроме хронологических экспонент.
2.4.7. Автономные векторные поля. В случае автономного
векторного поля
Vt = V e VecM
поток полного поля называется экспонентой и обозначается через
etv (иногда мы будем писать ex.p(tV)). Асимптотический ряд для
экспоненты принимает форму
п=0
т. е. это обычный экспоненциальный ряд.
Экспонента автономного векторного поля удовлетворяет диффе-
дифференциальным уравнениям
— е-ео-ое, е t=Q - .
Используем асимптотический ряд для экспоненты для вычисления
скобки Ли автономных векторных полей У, W Е Vec M. Вычислим
первый непостоянный член в асимптотическом разложении следую-
следующей кривой в точке t = 0:
q(t) = qoetv oetw oe~tv oe~tw =
= q о (id + t V + у V2 + ...) о (id + t W + у W2 + ...) о
о (id - t V + у V2 + ...) о (id - t W + у W2 + ...) =
2.5. Действие диффеоморфизмов на векторные поля
45
= q о (id + t (V + W) + l- {V2 + 2У о W + W2) + ...) о
о (id - t {V + W) + ^- (F2 + 2V о W + W2) + ...) =
= q о (Id + t2 (V о W - W о V) + .. .)•
Итак, скобка Ли векторных полей как операторов (производных
по направлению) в С°°(М) имеет вид
[V, W] = V о W - W о V.
Отсюда следует формула в локальных координатах: если
г=1
г=1
ТО
Аналогично,
oesWc
= q o (Id + tV
qoetvoesWoe-tv =
dxj
.) о (Id + sW + ...) о (Id - tV
= q о (Id + sW +
qoetv oesW oe-t
..) =
, W] + ...),
2.5. Действие диффеоморфизмов на векторные поля
Мы уже нашли аналоги точек, диффеоморфизмов и векторных по-
полей среди функционалов и операторов на С°°{М). Теперь рассмотрим
действие диффеоморфизмов на векторные поля.
Возьмем касательный вектор v G TqM и диффеоморфизм Р G
G DiffM. Касательный вектор P*v G ТР^М есть вектор скорости
образа кривой, выходящей из q со скоростью v. Мы утверждаем, что
P^v = VoP, veTqM, PGDifTM,
как функционалы на С°°(М). Возьмем кривую
B.19)
тогда
p*va=Tt
q(t)EM, q(O) = q, jr, q(t) = v;
at t=0
a(P{q(t)))= (?- q{t))oPa =
46
Гл. 2. Элементы хронологического исчисления
Теперь найдем выражение для Р*У, V Е VecM, как дифференциро-
дифференцирования алгебры С°°{М). Имеем
q о Р о P#V = P{q)
поэтому
т. e.
= P*{V{q)) =
= V(q) oP = qo
PeDifTM, VeVecM.
M,
Итак, диффеоморфизмы действуют на векторные поля как подо-
подобия. В частности, диффеоморфизмы сохраняют композиции:
P*(F oW)=P~1o(VoW)oP= (P-1 oV oP)o (P-1 oWoP) =
а потому — и скобки Ли векторных полей:
Если В: С°°{М) —>• C°°(M) — автоморфизм, то соответствующее
подобие обычно обозначается через Ad В:
(AdB)V d= В
В этих терминах
Теперь вычислим инфинитезимальную версию оператора Ad.
Пусть Р1 есть поток поля V:
р° = ы,
Тогда
поэтому
dt
dt
t=0
р* =
VecM.
t=0
dt
t=o
(Ad P*)W = — {PfoW
dt to
dt
t=o
Обозначим
= VoW-WoV=[V,W], W e VecM.
t->/\ def d
PM = —
o / at
t=o
тогда
2.5. Действие диффеоморфизмов на векторные поля 47
Дифференцируя тождество
Ad Рь [X, У] = [Ad Р* X, Ad P* У] X, У е Vec M,
в момент t = О, получаем тождество Якоби для скобки Ли векторных
полей
(adF)[X,y] = [(adF)X,y] + [X,(adV)Y],
которое молено также записать в виде
[V, [X, Y}] = [[V, X},Y] + [X, [V, Y]}, V,X,Y€ Vec M,
или, в симметричной форме,
[X, [Y, Z}} + [У, [Z, X}} + [Z, [X, Y}} =0, X, Y, Z e Vec M. B.20)
Множество VecM является линейным пространством с допол-
дополнительной операцией — скобкой Ли, удовлетворяющей следующим
свойствам:
1) билинейность —
[аХ + /ЗУ, Z] = а[Х, Z] + /3[У, Z],
[X,aY + /3Z]=a[X,Y]+l3[X,Z],
X,Y,Z eVecM, a,f3eR;
2) кососимметричность —
[X,Y] = -[Y,X], X,Y e VecM;
3) тождество Якоби B.20).
Иными словами, множество Vec M всех гладких векторных полей
на гладком многообразии М образует алгебру Ли.
t
Рассмотрим поток Рг = exp J Vr dr неавтономного векторного по-
0
ля Vf. Найдем дифференциальное уравнение для семейства операто-
операторов AdP* = (P*)^1 в алгебре Ли VecM:
= Р* о Vt о X о {Р1)'1 - Р1 о X о Vt о (Р*) =
= {AdPl)[VuX] = (AdP^adVtX, X e VecM.
Итак, семейство операторов AdP* удовлетворяет уравнению
A Ad Р* = (Ad P*) о ad Vt B.21)
с начальным условием
AdP° = Id. B.22)
Семейство Ad Pl — обратимое решение задачи Коши
48 Гл. 2. Элементы хронологического исчисления
для операторов At: Vec M —)> Vec M. Можно повторить схему выво-
вывода асимптотической формулы для решения задачи B.9) и получить
асимптотическое разложение
AdP*
ГaAVTdr + ...
о
... + Г... Г ad VTn о ... о ad VTl drn ... drx + ..., B.23)
AnW
затем доказать единственность решения и оправдать следующее обо-
обозначение:
Г ( Г \
ёхр / adK dr d= AdP* = Ad( eip / VT dr I.
о v о 7
Аналогичные тождества для левой хронологической экспоненты
имеют вид
ехр / 8id{-VT)dr d= Adf «ф h-VT)dr) «
о о
°° Г Г
« Ы+ ^ у ... у (- adУп) о ... о (- adУТп) drn ...
1
Для асимптотического ряда B.23) справедлива оценка остаточного
члена, аналогичная оценке B.13) для потока Р1. Обозначим частич-
частичную сумму
тп-1
^ у ... у adKn о ... о adFri ^гп ... dn.
n=1 An(t)
Тогда для любых X Е Vec M, s ^ О, К (е М
fvTdr-Tm)x
о У
), t^O, B.24)
где i^; (s M — некоторый компакт, содерж:ащий К.
Для автономных векторных полей введем обозначение
2.6. Коммутирование полей 49
Иными словами, семейство операторов ef ad v : Vec M —>> Vec M есть
единственное решение задачи
At = At о ad У, Ло = Id.
Справедливо асимптотическое разложение
tadv « Id + tsidV + у ad2 V + ...
Упражнение 2.3. Пусть Р Е DifTM, и пусть Vt — неавтоном-
неавтономное векторное поле на М. Покажите, что
t t
Р о exp Г VT dr о Р-1 = exp / (Ad Р Уг) dr. B.25)
о о
2.6. Коммутирование полей
Пусть Т^ G VecM — неавтономное векторное поле, и пусть Р* =
t
= exp J VT dr — его поток. Выясним, при каких условиях поток Рь
о
сохраняет векторное поле W G Vec M:
или, что то же самое, когда выполняется тождество
(Pt)~1W = W V?.
Предложение 2.6.
p\w = w \/t <^ [т^, w] = о vt.
Доказательство. Имеем
= f ехр / adVTdToadVT\W= f exp / Sid VT dr\[Vt,W] =
Поэтому (Pt)^1W = W тогда и только тогда, когда [Vi,W] = 0. П
Вообще говоря, потоки не коммутируют ни для неавтономных
векторных полей V$, Wt'.
ti t2 t2 t\
exp / VT dr о exp / WT dr ф exp / WT dr о exp / VT dr,
0 0 0 0
ни для автономных векторных полей У, W:
etiv o et2w ф et2w o
4 А.А. Аграчев, Ю.Л. Сачков
50 Гл. 2. Элементы хронологического исчисления
В автономном случае коммутирование потоков равносильно комму-
коммутированию векторных полей:
e*i^oe**v" = e*2Woe*lV, h,t2eR & [V,W] = 0.
Мы уже показали необходимость коммутирования векторных по-
полей для коммутирования их потоков, сейчас докажем достаточность.
Имеем
(AdetlV)W = etl&dvW = W.
Учитывая равенство B.25), получаем
о е~^у = exp{t2
2.7. Формула вариаций
Рассмотрим дифференциальное уравнение вида
q = Vt(q) + Wt(q). B.26)
Будем считать Vt исходным векторным полем, a Wt — его возмуще-
возмущением. Найдем формулу для потока Q1 нового поля Vt + Wt как воз-
t
мущение потока Рг = exp J VT dr исходного поля Vt- Иными словами,
о
мы хотим получить разложение вида
t
Ql = exp f(VT + WT) dr = Cto Pl.
о
Действуем, как в методе вариации постоянных, т. е. подставляем это
разложение в уравнение B.26):
±Qt = Q*o (Vt + Wt) = Ct ° РЬ + Ct о P* о Vt = Ct о P* + Q* о Vi,
сокращаем общий член Qt о Vt:
QtoWt=Ct°Pt,
и записываем уравнение для неизвестного потока С*:
Ct = Q* о Wt о (Р*) = Ct о Р* о Wt о (Р*) =
= Cto (AdP*) Wt = Ct о hEp ^ ad VT dA Wt,
Это — операторная задача Копей вида B.9), потому она имеет единст-
единственное решение
t
Ct = exp /(exp f adVe dOjWr dr.
о о
2.7. Формула вариаций 51
Итак, мы получили искомое разложение возмущенного потока
? ? г ?
exp f(VT + Wr) dr = exp Г (exp / ad V# d0 ) Wr dr о exp / К dr.
0 0 0 0
B.27)
Это равенство называется формулой вариаций. Ее молено записать в
следующем виде:
t t
йф /(К + Wr) dr = йф / (AdPr) Wr dr о р*.
о о
То есть возмущенный поток равен композиции исходного потока Р1 с
потоком возмущения И^, подкрученного потоком Р*.
Получим другую версию формулы вариаций с потоком Р* слева
от подкрученного потока. Имеем
t t
exp f(VT + Wr) dr = exp / (AdPr) Wr dr о Р* =
о о
= P*o (Pt)oexp f (AdPr)WTdr о Pf =
о
?
= P* о exp /(Ad(Pt) о AdPr)Wr dr =
о
?
= P* о exp /(Ad((Pt) о Pr))Wr dr.
о
Поскольку r
(Pt)oPr =exp /v^de,
то получаем
?
exp [(VT + WT)dT = P*oexp /(exp Г adVe de}WT dr =
О 0 ?
?
= exp / Уг dr о exp / (exp /" ad V^ d0 J Wr dr. B.28)
0 0 ?
Для автономных векторных полей V,W ? Vec Af формулы вариа-
вариаций B.27), B.28) принимают следующую форму:
? ?
et(V+W) =
f ет ad V w dr Q е?У = е?У Q ^ Г e(r-?) ad У ^ ^ B
о о
4*
52 Гл. 2. Элементы хронологического исчисления
В частности, при t = 1 получаем
1
ov+w _
= ехр feradvWdroev.
о
2.8. Производная потока по параметру
Пусть Vt(s) — неавтономное векторное поле, гладко зависящее от
вещественного параметра s. Исследуем зависимость потока поля Vt(s)
от параметра s.
Запишем
t t
exp fvT(s + e) dr = йф [ (Vr(s) + 5ут(«^)) dr B-30)
о о
с возмущением 5vT{s,s) = Fr(s + е) — VT(s). По формуле вариа-
вариаций B.27) выпЕеприведенный поток равен
At t
exp / did Vq(s) dO ) 5vT(s,s) dr o exp / VT(s) dr.
о о о
Разложим по ?:
WT(s,e) = lexp adVo(s)de NvT(s,e) =
V о J
0
поэтому
t t
exp Г WT{s,e)dr = Id+ I*WT(s,e) dr + 0{e2) =
о о
exp / ad Vq(s) d6 ) -^- VT(s) dr
J
и о
Наконец, получаем
exp
0
/ Fr(s + s) dr =
t t t
= exp / WSiT{?) dr о exp / VT(s) dr = exp / VT(s) dr
2.8. Производная потока 53
t , т t
\ Q у Г 2
exp / ad Ve(s) d6 ^—VT(s) dr о exp / VT(s) dr + O(e ),
J I ds J
о N о о
т. e.
t t , т ч t
r\ П n/ p \ r\ p
-7— exp / VT(s) dr = / ( exp / ad Ve(s) dO ) ^—Vr(s) dr о exp / VT(s) dr.
os J J V J J ds J
0 0 0 0
B.31)
Аналогично по формуле вариаций B.28) получаем равенство
t t t , т
/Г ( у Г \ Q
VT(s)dro / exp / ad Vq(s) dO }^—VT(s) dr.
J \ J Jds
0 0 0*
B.32)
Для автономного векторного поля V(s), зависящего от параметра,
формула B.31) принимает форму
JL etv(s) =
о
а при t = 1
d_pV(s)_ f radV(s) ЗУ
ds J ds"' ~~
0
Предложение 2.7. Предположим, что
t
Тогда
Vr dr, Vt\=0 Ш. B.34)
exp VT dr = exp < Vr dr
t
r r ^
\/t.
о ч о
Иными словами, в предположении условия коммутативности B.34)
t
хронологическая экспонента exp J VT dr совпадает с потоком
о
t
о
задающимся условиями
Ql = Q\,
ds
о
54 Гл. 2. Элементы хронологического исчисления
Доказательство. Покажем, что экспонента в правой части
удовлетворяет тому же уравнению, что и хронологическая экспонента
в левой части. В силу B.33) имеем
j- expf fvTdrJ = /expjrad f Ve de\ Vt dr о exp i fvrdr\.
Ввиду равенства B.34)
VT dr\ = Vt о ехр j j VT dr\.
поэтому
j-t exp 11VT dr\ = Vt о ехр j
В силу равенства B.34) можно также поменять местами операторы в
правой части:
о о
Заметим, что выполняется начальное условие
ехр( fvTdr\ =Id.
о
Теперь утверждение следует из того, что задача Копей для потоков
имеет единственное решение:
At = exp i /Vr dr 1 = ёзф Г VT dr. D
Глава 3
ЛИНЕЙНЫЕ СИСТЕМЫ
В этой главе мы рассмотрим простейший класс управляемых сис-
систем — линейные системы
т
х = Ах + с + ^2щЬ{, xeW1, й=(иь...,ит)бГ, C.1)
г=1
где А — постоянная вещественная матрица порядка п, а с, fei, ...
..., Ьш — постоянные векторы в Мп.
3.1. Формула Коши для линейных систем
Пусть u(t) = {u\(t),..., um(t)) — локально интегрируемые функ-
функции. Тогда решение системы C.1), соответствующее этому управле-
управлению и удовлетворяющее начальному условию
х@,хо) = х0,
дается формулой Коши
x(t,x0) = etA(x0+ е~тА( ^щ{т)Ъг +cdr\ V t G R.
Мы используем здесь обозначение для матричной экспоненты
etA = Id + tA + | A2 + ... + ? An + ...
Формула Коши проверяется дифференцированием. В силу единствен-
единственности она дает решение задачи Копей.
Линейная система C.1) — частный случай аффинной по управле-
управлению системы:
( ) C-2)
Чтобы получить систему C.1) из C.2), достаточно положить
/о (ж) = Ах + с, fi(x) = bi, г = 1,...,?тг. C.3)
Предложение 3.1. Формула Коши для линейных систем сле-
следует из формулы вариаций.
Доказательство. Приведем доказательство только в слу-
случае с = 0.
56 Гл. 3. Линейные системы
Формула вариаций для системы C.2) имеет вид
АГП х
/о + $^гц(т)/Л dr =
о i=i У
= ехр / ( ( ехр / ad /0 dO 1 о ^ щ(т)^ 1 dr о exp fodr =
о VV о У i=i У о
[(j2dfAToetf°. C.4)
о
Мы предполагаем, что с = 0, т. е. /о (х) = Ах. Тогда
х о etfo = etAx. C.5)
Далее, так как (ad/o)/i = [/о? Л] = [^, Ь^] = —Abi, то
erad/0/. = ^ + r(ad/o)/. + l! (ad/oJ/; + ... + ^ (ad/o)n/i + ... =
- г-Т * + ^[(~ ) i + '" + 7)I^~ ^ i + ...-e i.
Чтобы вычислить левый поток в C.4), напомним, что кривая
х0 о ехр / I 53 Mi(r)eTad^0/i I dr = х0 о ехр / I 53 щ(т)е~тАЬ1 I rfr
C.6)
есть решение задачи Коши
r(t\ — \ Л ii(f]p~tAh- т@) — тп
г=1
поэтому C.6) равно
t
ж(^) = xq + / ( е гА У^1Лг(г)Ьг ) ^т-
о
Учитывая C.5), получаем формулу Копей:
/о + 5Z^tM
= ж0 -
3.2. Управляемость линейных систем 57
Заметим, что в общем случае (с ф 0) формулу Коши можно запи-
записать в виде
x(t, x0) = etAx0 + etA Г e~rA JT щ(т)Ь dr + e*A | e-rAcdr =
о i=1 о
/m^ tA _ ji
e~rA^iZi(r)b»dTH c, C.7)
i=l
где
^ ^^ I _. -L *-\s | . -i J- V-' | ••• | . -i J- «_^ | ....
3.2. Управляемость линейных систем
Из формулы Коши C.7) следует, что отображение
и Н> x(t,u, жо),
переводящее локально интегрируемое управление и = и(-) в конечную
точку соответствующей траектории, является аффинным. Поэтому
множество достижимости AXo{t) линейной системы C.1) за фиксиро-
фиксированное время t > 0 есть аффинное подпространство в Мп.
Определение 3.1. Управляемая система в пространстве со-
состояний М называется вполне управляемой за время t > 0, если
^хоУ1) = ш vx0 ^ IVl.
Полная управляемость означает, что для любой пары точек
жо,жх G М существует такое управление и, что соответствующее
решение ж(-, и, жо) управляемой системы переводит xq в х\ за время t:
Исследование полной управляемости линейных систем облегчает-
облегчается благодаря следующему наблюдению. Аффинное отображение
tA ^ m
и -> etAx0 + ^—^ с + etA у е-гА ^ ^{т)Ъг dr
сюръективно тогда и только тогда, когда сюръективна его линейная
часть
* m
е~тА Y^ Ui{r)bi dr. C.8)
о *=i
58 Гл. 3. Линейные системы
В свою очередь сюръективность отображения C.8) равносильна сюръ-
ективности следующего отображения:
e~rA
и^ e~rA Y^ Щ (г)Ы dr. C.9)
о *=i
Теорема 3.1. Линейная система C.1) вполне управляема за
время t > 0 тогда и только тогда, когда
sp<m{Ajbi\ j = 0,...,n-l, г = l,...,m} = Mn. C.10)
Доказательство. Необходимость. Предположим от
противного, что условие C.10) не выполняется. Тогда существует
ковектор р G Мп*, р Ф 0, такой, что
pAjbi = 0, j = 0, ...,п- 1, г = 1,...,ш. C.11)
По теореме Кэли
для некоторых вещественных чисел ао, • • • ? c^n-i- Поэтому
п-1
Ak = ^2C*Aj
3=0
для любого к G N и некоторых /3^ G М. Тогда из C.11) получаем
п-1
рАкЪг = ^2f3^pAjbi = 0, к = 0,1,..., г = 1,... ,т.
Поэтому
ре-гАЬ^ = 0,
и, значит,
t
р jе-тА^щ{т)Ь^т = j ^2щ(т)ре-тАЬц1т = 0,
о i=1 о i=1
т. е. отображение C.9) не сюръективно. Полученное противоречие до-
доказывает необходимость.
Достаточность. Пусть, от противного, отображение C.9) не
сюръективно. Тогда существует ковектор р G Мп*, р Ф 0, такой, что
= М-),-••,«*.(•))• C-12)
о <=1
Возьмем управление
3.2. Управляемость линейных систем 59
где единственная отличная от нуля г-я компонента имеет вид
Тогда из равенства C.12) следует, что
S
р Гe-rAbidr = 0, sGR, г = 1,...,т.
о
Поэтому
pe~sAbi = 0, sGM, г = 1,...,га.
Последовательно дифференцируя это тождество при s = 0, получаем
pAfc6i = О, А; = 0,1,..., г = 1,...,ш,
что противоречит C.10). Достаточность доказана. ?
Таким образом, если линейная система вполне управляема за
какое-то время t > 0, то она вполне управляема и за любое другое
положительное время. В этом случае линейная система называется
управляемой.
Глава 4
ЛИНЕАРИЗАЦИЯ НЕЛИНЕЙНЫХ СИСТЕМ
ПО СОСТОЯНИЮ
Цель данной главы состоит в том, чтобы охарактеризовать нели-
нелинейные системы
т
q = Ш) + Y, и*Ш> и = Ы, ¦¦¦,%)еГ, дем, D.1)
являющиеся локально или глобально эквивалентными управляемым
линейным системам. Иными словами, мы хотим найти условия на век-
векторные поля /о, /i, ..., fm, обеспечивающие существование диффео-
диффеоморфизма (глобального Ф: М —>> W1 или локального Ф: Oqo CM4
—>- Oq С Мп), переводящего нелинейную систему D.1) в некоторую
управляемую линейную систему C.1).
4.1. Локальная линеаризуемость
Начнем с локальной задачи. Условия локальной линеаризуемости
естественно формулировать в терминах скобок Ли, так как они сохра-
сохраняются при диффеоморфизмах:
Ф#[У, W] = [Ф„У, Ф„ИЧ, V,W e VecM.
Условие управляемости C.10) легко записывается в терминах ско-
скобок Ли: для векторных полей C.3) имеем
{-А)% = (ad/„)'/« = [/оЛ---Л/о; fi] •••]].
j раз
поэтому критерий управляемости для линейных систем C.10) имеет
вид
span{x0 о (ad/0)J'/i| j = 0,... ,n - 1, г = 1,... ,m} = TXoRn.
Далее, очевидно, что для линейных векторных полей C.3) выполня-
выполняется следующее условие:
0 ^ л, J2, 1 ^ Н, г2 ^ т.
Оказывается, что указанные два условия локально характеризуют
управляемые линейные системы.
Теорема 4.1. Пусть М — гладкое п-мерное многообразие, /о,
/ъ • • • 1 fm ? VecM и qo G М. Диффеоморфизм
Ф: Oqo^OQ
4-1. Локальная линеаризуемостъ 61
некоторой окрестности Oqo С М точки до в некоторую окрест-
окрестность О о С W1 начала координат О G Мп такой, что
(Ф*/о)(я) = Ах + с, же О0,
(Ф*/*)(ж) = 6», ж G О0, г = 1,...,т,
для некоторых (п х п)-матрицы А и векторов с,Ъ\,... ,ЪШ G Мп,
удовлетворяющих условию управляемости C.10), существует тогда
и только тогда, когда выполняются следующие условия:
span{д0 о (ad/0)j/i| j = 0,... ,n - 1, г = 1,... ,m} = ГдоМ, D.2)
2]0,
д G Одо, 0 ^ ji, j2 ^ гс, 1 ^ гь г2 ^ т.
Замечание. Иными словами, диффеоморфизм Ф в формули-
формулировке теоремы переводит нелинейную систему D.1) в линейную C.1).
Прежде чем доказывать теорему, рассмотрим следующее предло-
предложение, которое понадобится нам ниже.
Лемма 4.1. Пусть М — гладкое п-мерное многообразие, и пусть
Yi, ..., Y& G VecM. Диффеоморфизм
Ф: O0^Oq0
окрестности Oq CW1 в окрестность Oqo С М, qo E M такой, что
4k)
существует тогда и только тогда, когда векторные поля Y\,..., Y&
коммутируют:
[УьУ,-]=0, г, j = l,...,k,
и линейно независимы:
dimspan(g0 оУг,... ,q0 oYk) = k.
Доказательство. Необходимость очевидна, так как скобка
Ли и линейная независимость сохраняются при диффеоморфизмах.
Достаточность. Выберем поля Yj^+i,..., Yn G Vec M, допол-
дополняющие Yi,..., Yfe до базиса:
span(g oY1,...,qoYn)= TqM, q G Oqo.
Отображение
Ф( .., sn) = g0 о eSnYn о ... о eSlYl
определено в достаточно малой окрестности начала координат в
Имеем
д
д
go o eeYi = g0 ¦
? = 0
Поэтому дифференциал Ф*|5=о сюрьективен, и по теореме о неявной
функции Ф — диффеоморфизм из некоторой окрестности точки 0
в W1 на некоторую окрестность точки д0 в М.
62 Гл. 4- Линеаризация нелинейных систем по состоянию
Теперь докажем, что Ф выпрямляет векторные поля Yi,..., У&. Во-
первых, заметим, что так как эти поля коммутируют, то коммутируют
и их потоки, поэтому
/ к
eSkYk о ... о eSlYl = ехр ( ^
^ i=i
и / к
Ф(<^1,..., sn) = qo о eSn п о ... о cSkJrl fe+1o ехр I у
^ i=i
Тогда для г = 1,..., к
- ) = 7Г ф(^ъ ..., ^ +?,..., sn) =
Si/ 1фE) OS e=0
/ fc \
M^fc+i о expf ^^ sjYj ) ° e?Yi =
\i=1 /
к
О ... О i
? = 0
= go ° e°nln о ... о esk+iYk+i o expj
Теперь мы можем доказать теорему 4.1 о локальной эквивалент-
эквивалентности нелинейных систем линейным.
Доказательство. Необходимость очевидна, так как скобки
Ли инвариантны относительно диффеоморфизмов, а для управляе-
управляемых линейных систем условия D.2), D.3) выполняются.
Достаточность. Выберем базис пространства TqoM из век-
векторов вида go ° (ad/o)-7'/*1
— f qл Т/-\ I•*^ т• r\i — 1 Ф1 (\ <С^ 1 <сГ' Ф1 1 1 <С^ 1 <сГ' тп
ОС V ^-*^- / О / / % } ^-^ _L«****/t/* \J -^v^ y q/ ^ч^- fv -L • _L -^v^ t/ q/ **n^ lib*
span(g0 о У1?..., go ° ^n) = TqoM.
По лемме 4.1 существует выпрямляющий диффеоморфизм:
5жа
Покажем, что диффеоморфизм Ф искомый.
A) Проверим сначала, что векторные поля Ф*/г, i = l,...,m, по-
постоянны, т. е. покажем, что в разложении
а=1
функции Рга(х) постоянны. Имеем
а = 1
4-2. Глобальная линеаризуемостъ 63
С другой стороны,
fo)iafia,fi] = 0 D.5)
по условию D.3). Сравнивая D.4) и D.5), получаем
-^-^ -—=0 => /Зга = const, г = 1,...т, а = 1,...,п,
U Xj О Х(х
т. е. Ф*/г, г = 1,...,7тг, суть постоянные векторные поля, которые мы
и обозначим через Ъ{, г = 1,..., т.
B) Теперь покажем, что векторное поле Ф*/о линейно. Докажем,
что в разложении п
i=l г
все функции Pi (ж), г = 1,..., п, линейны. Действительно,
Ед2/3г д _ [_д_ [_д_ ,11_
дхадхр ~dx~i ~ VdxZ' Vdx~^ */0JJ ~
а=1
= [Ф,Уа, [Ф,У^,Ф,/0]] = Ф.[Уа, \Yp,f0]] =
/о)^Л0, [/о, (ad
л'аЛа, (ad/o)^+1/ij =0,
по условию D.3). Поэтому
d2Cj д =() { а й = 1
ХЗ dX
т.е. Ф*/о — линейное векторное поле, которое мы обозначим Ах + с.
т
Для линейной системы х = Ах + с + J^ щЬ{ из предположе-
предположения D.2) следует условие управляемости C.10). Теорема доказана. ?
4.2. Глобальная линеаризуемость
Теперь докажем следующее предложение о глобальной эквива-
эквивалентности.
Теорема 4.2. Пусть М — связное гладкое п-мерное многообра-
многообразие, и пусть /о, /i,..., fm ? Vec M. Диффеоморфизм
Ф: М -^Tk xRn~k
многообразия М на произведение к-мерного тора Тк и пространства
Шп~к для некоторого k $J n такой, что
(Ф*/о)(ж) = Ах + с, х е Тк х Mn-fe,
64 Гл. 4- Линеаризация нелинейных систем по состоянию
для некоторой (п х п)-матрицы А с нулевыми первыми к столб-
столбцами:
Aei = 0, z = l,...,fe, D.6)
и векторами с, Ъ\,..., Ъш G Мп, удовлетворяющими условию управ-
управляемости C.10), существует тогда и только тогда, когда выпол-
выполняются следующие условия:
(ad/о)-7/г суть полные векторные поля,
j = 0,1,...,тг- 1, г = 1,...,т, D.7)
spanjg о (ad/0)j/i| j = 0,... ,n - 1, г = 1,... ,m} = Т^М, D.8)
g о [(ad/o^/ix, (ad/оГЛ,] =0, q G M,
g
0 ^ ji, J2 ^ n, 1 ^ гь г2 ^ m.
Замечания. A) Если вдобавок многообразие М односвязно, то
оно диффеоморфно Мп, т. е. к = 0.
B) Если лее многообразие М компактно, т. е. диффеоморфно Т™,
и т < п, то на М не существует глобально линеаризуемых систем.
Действительно, тогда А = 0, и условие управляемости C.10) нару-
нарушается.
Докажем теорему 4.2.
Доказательство. Достаточность. Зафиксируем про-
произвольную точку q0 G М и выберем в TqoM базис из векторов вида
span(g0 оУь...,д0оУп)= TqoM.
A) Сначала покажем, что векторные поля У1?..., Yn линейно неза-
независимы всюду на М. Очевидно, что множество
0 = {qeM\ span(qoY1,...,qoYn) = TqM}
открыто. Покажем, что оно замкнуто. На этом множестве справедли-
справедливо разложение
qo(adfo)jfi = qo^2a%Ya, q G О,
a=l ^ ' '
j = 0, ...,п- 1, г = 1,...,ттг,
для некоторых функций a^ G G°°(О). Докаж:ем, что на самом деле
все alj постоянны. Имеем
а=1
(применяем правило Лейбница [X, aY] = (Xa)Y + a[X, У])
п
а=1 а=1
4-2. Глобальная линеаризуемость 65
п
поэтому
Ypa1^ = О => al? Q = const,
Это означает, что равенство D.10) справедливо в замыкании О. Сле-
Следовательно, векторные поля Yi,..., Yn линейно независимы в О (если
это не так, то все семейство (ad /ор/ь j ^ О,...,гг — 1, г = 1,..., т,
линейно зависимо в О). Итак, множество О замкнуто. Так как оно
одновременно открыто, а М связно, то
т. е. векторные поля Yi,..., Yn линейно независимы в М.
B) Определим «обращение» Ф искомого диффеоморфизма сле-
следующим образом:
Ф(ж1,..., хп) = q0 о eXlYl о ... о eXnYn =
(учитываем, что векторные поля Ya коммутируют)
= q0 о expf ^^xaYa I, x = (жь ..., жп) G Мп.
C) Покажем, что гладкое отображение Ф: Мп —>• М регулярно, т. е.
его дифференциал сюръективен. Действительно,
go ° ехр У xqYq + sYa ) = q0 о ехр > ждYq ) oYa =
= Ф(ж) о Ya, a = 1,..., n,
поэтому
Итак, отображ:ение Ф регулярно, потому локально диффеоморфно. В
частности, его образ Ф(МП) открыт.
D) Докажем, что множество Ф(МП) замкнуто. Возьмем любую точ-
точку q G Ф(МП). Так как векторные поля Yi,..., Yn линейно независимы,
образ отображения
) ехр [ >^ уаУа ], у =
5 А.А. Аграчев, Ю.Л. Сачков
66 Гл. 4- Линеаризация нелинейных систем по состоянию
содержит окрестность точки д. Поэтому существует такое у Е W1, что
т. е.
, п х , п
qoex.pl ^2 У^уос ) = Qo о exp( ^ xaYa
для некоторого ж = (жх,..., хп) Gln. Тогда
q = g0 о exp ( ^ жаУа j о ехр I - ^ уаУа j =
f ^ j Ф(ж - у).
Иными словами, g G Ф(МП).
Поэтому множество Ф(МП) замкнуто. Так как оно открыто и М
связно, то
П) = М.
E) Легко видеть, что прообраз
Ф(ао) = {^еК"|ФИ = <7о}
есть подгруппа абелевой группы W1. Действительно, пусть
/ п \ / п \
Ф(ж) = до о expf ^ жаУа j = ФB/) = д0 ° expf ^ уаУа J = д0.
Тогда
Ф(ж + у) = до о expf
= go о ехр ( у j xaYa ) о ехр ( } j yaYa ) = g0.
Аналогично, если
Ф(ж) = до о ехр I у j xaYa J = д0,
то
/
\1/1 qn \ — г* _ q луп [ X qc У I — rtp.
^ \ *Ь) I/O СЛ-JJ I 7 ъЬа± а I I/O •
Наконец,
Ф@) = до-
4-2. Глобальная линеаризуемость 67
F) Далее, Go = Ф-1(до) — дискретная подгруппа вМп,т. е. малая
окрестность начала координат в Мп не содержит ненулевых элементов
прообраза Ф-1(до), так как Ф — локальный диффеоморфизм.
G) Отображение Ф корректно определено на факторе M^/Go-
Действительно, пусть у Е Go- Тогда
/ " \
Ф(ж + у) = до о ехр УДжа + ya)Ya =
= до о exp f ^2 Уосусх ) о ехр I ^2 x<*Yol ) = go ° exp
Поэтому определено отображение
Ф: Rn/G0 -+М. D.11)
(8) Отображ:ение D.11) взаимно однозначно: если
то
q0 о ехр f ^ xaYa J = g0 ° exp
поэтому
до о exp
т.е. ж — г/ G Со-
(9) Из доказанного следует, что отображение D.11) — диффео-
диффеоморфизм. По лемме 4.2, приведенной ниже, дискретная подгруппа Gq
группы Мп является решеткой:
ъ-{±„\^}.
поэтому фактор по ней — цилиндр:
/Сто = Я X К.
Итак, мы построили диффеоморфизм
ф = ф: М ^Тк xRn~k.
Равенства D.8) и D.9) доказываются в точности, как в теореме 4.1.
Векторное поле Ф*/о = Ах + с корректно определено на факторе
Тк х Mn~fe, поэтому справедливы равенства D.6). Достаточность до-
доказана.
Необходимость. Очевидно, что условия D.7) и D.9) выпол-
выполняются для любой линейной системы на цилиндре Тк х М71"^. Если
линейная система управляема на цилиндре, то она управляема и
на Мп, поэтому условие управляемости D.8) также выполняется. ?
5*
68
Гл. 4- Линеаризация нелинейных систем по состоянию
Докажем следующее общее предложение, которым мы воспользо-
воспользовались выше.
Лемма 4.2. Пусть Г — диск-
дискретная подгруппа в W1. Тогда она яв-
является решеткой, т. е. существуют
линейно независимые векторы е\,...
..., efc G Mn такие, что
= I
г=1
Рис. 4.1. Решетка, порожден-
порожденная векторами ei, е<±
Доказательство. Будем до-
доказывать индукцией по размернос-
размерности п объемлющей группы Мп.
A) Пусть п = 1. Так как подгруп-
подгруппа Г С R дискретна, в ней существует
ближайший к началу координат О G Ж
элемент е± ф 0. По групповому свойству все кратные ±ех =Ь е± ± ...
... ± е\ = ±nei, n = 0,1, 2,..., также содержатся в Г. Докажем, что Г
не содержит других элементов.
От противного: предположим, что существует элемент х G Г та-
такой, что пе\ < х < (п + l)ei, n G Z. Тогда элемент у = х — пе\ G Г
содержится в интервале @,ei) С R. Но тогда у ф 0 ближе к началу
координат, чем ei, что противоречит предположению. Следовательно,
Г = Zei = {nei | n G Z}, что и требовалось доказать.
B) Докажем шаг индукции: предположим, что утверждение лем-
леммы доказано для некоторого п — 1 G N, и докажем его для следующего
номера п.
Выберем ближайший к началу координат 0 G W1 элемент е\ G Г,
d ф 0. Обозначим через / прямую Rei, а через 1\ решетку Zei С Г.
Предположим, что Г ф 1\ (в противном случае все доказано).
Покажем, что существует ближайший к / элемент в2 G Г \ Гх:
dist(e2, /) = min {dist(x, /) | х G Г \ /}.
D.12)
Возьмем любой отрезок / = [пех,(п+ 1)ех] С / и обозначим через
тг: Мп —>- / ортогональную проекцию из Мп на /. В силу компактно-
компактности отрезка / и дискретности подгруппы Г n-мерная полоса тг~1(/)
содержит ближайший к / элемент е^ G Г \ /:
dist(e2,/) =min{dist(x,/)| хе (Г \ /) Птг^)}.
Тогда элемент е2 искомый: он удовлетворяет равенству D.12), так как
любой элемент из Г можно перенести в полосу тг~1(/) элементами
решетки Гх-
Поэтому достаточно малая окрестность прямой / не содержит эле-
элементов из дополнения Г \ Гх. Следовательно, факторгруппа Г/Гх есть
дискретная подгруппа в W1 /I = Мп-1. По предположению индукции
Г/Гх — решетка, значит, Г — также решетка. ?
Глава 5
ТЕОРЕМА ОБ ОРБИТЕ И ЕЕ ПРИЛОЖЕНИЯ
5.1. Формулировка теоремы об орбите
Пусть Т С Vec M — любое множество гладких векторных полей.
Для упрощения формулировок будем предполагать, что все поля в Т
полны. Впрочем, все определения и результаты, приводимые ниже,
легко обобщаются на случай неполных полей (оставляем эти обобще-
обобщения читателю в виде упражнения).
Мы возвращаемся к изучению множеств достижимости: исследуем
структуру множеств достижимости системы Т с помощью кусочно
постоянных управлений
Ло =
etlf
l о ... о e
tkfk
, fee Щ, q0 G M.
Но сначала рассмотрим большее множество — орбиту семейства Т
из некоторой точки q0:
Oqo = {g0 о etlfl о ... о e
etkfk
G T, ke N}, q0 G M.
В орбите Oqo можно двигаться вдоль векторных полей fi как вперед,
h
Рис. 5.1. Множество достижимос-
достижимости Aqo
Рис. 5.2. Орбита Oq
так и назад, в то время как во множестве достижимости Aqo возможно
только движение вперед (рис. 5.1, 5.2).
Впрочем, если семейство Т симметрично: Т = — Т (т. е. / G
G Т =4> — / G JF), то множества достижимости совпадают с орбитами:
о*> = Ао> ^о ем.
Вообще говоря, орбиты имеют более простую структуру, чем мно-
множества достижимости. Она описывается в следующем важнейшем
предложении.
70 Гл. 5. Теорема об орбите и ее приложения
Теорема 5.1 (теорема об орбите, Нагано-Суссманн). Пусть
Т — семейство векторных полей и qo — точка в М. Тогда:
1) орбита Oqo есть связное погруженное подмногообразие много-
многообразия М\
2) TqOqo = span{g о (AdP)/| P € V, / G F}, q€Ogo.
Здесь мы обозначаем через V группу диффеоморфизмов многооб-
многообразия М, порожденную потоками полей из Т\
V = {etlfl о ... о etkfk \ueR, UeT, кеЩ с Diff M.
Мы определим и обсудим понятие погруженного многообразия в
следующем параграфе.
5.2. Погруженные подмногообразия
Определение 5.1. Подмножество W гладкого п-мерного
многообразия называется погруженным к-мерным подмногообра-
подмногообразием многообразия Af, к ^ п, если существует взаимно однозначное
погружение
гладкого /с-мерного многообразия N такое, что
W = Ф(А0-
Замечание. Погруженное подмногообразие W многообра-
многообразия М можно также определить как многообразие, содержащееся
в М, такое, что отображение включения
г: W —» М, г: q \-^ g,
есть погруж:ение.
Достаточно малые окрестности Oq в погруженном подмногообра-
подмногообразии W многообразия М являются подмногообразиями в М, но все W
может и не быть подмногообразием
в М в смысле определения 1.1. Вооб-
Вообще говоря, топология W может быть
сильнее, чем топология, индуциро-
индуцированная на W топологией М.
Пример 5.1. Пусть Ф : R —>>
—)> М2 — взаимно однозначное погру-
погружение прямой в плоскость такое, что
lim ФШ = Ф@). Тогда W = Ф(Щ —
t—^ + оо
Рис. 5.3. Погруженное много- погруженное одномерное подмного-
подмногообразие образие W1 (рис. 5.3). Топология W,
унаследованная от R, сильнее, чем
топология, индуцированная М2. Интервалы Ф(—?,е) при достаточно
малых е > 0 в первой топологии открыты, а во второй нет.
5.2. Погруженные подмногообразия 71
Понятие погруженного подмногообразия неизбежно возникает при
описании орбит семейств векторных полей. Уже орбита одного вектор-
векторного поля (т. е. его траектория) есть погруженное подмногообразие и
может не быть подмногообразием в смысле определения 1.1.
Пример 5.2. Осциллятор с двумя степенями свободы описыва-
описывается уравнениями
х + а2х = О, xGl,
В комплексных переменных
z = х — ix/a, w = у — iy//3
эти уравнения имеют вид
z = iaz, zeC,
w = i/3w, w G C, { }
поэтому они имеют решения
z(t) = eiatz@),
w(t) = eil3tw@).
Любое решение (z(t),w(t)) уравнений E.1) принадлежит некоторому
инвариантному тору
Т2 = {(z,w) G С2 | \z\ = const, \w\ = const}.
Любой такой тор параметризуется аргументами чисел z, w по моду-
модулю 2тг, поэтому он является группой: Т2 ~ ]R2/BttZJ.
Введем новый параметр т = at. Тогда траектории (z,w) становятся
образами прямой {(г, (/3/а)т)\ т еЩ при погружении
г, —г Н> t + 2ttZ, — t + 2ttZ GK /(zttZ) ,
a J \ a J
а поэтому — погруженными подмногообразиями тора.
Если отношение /3/а иррационально, то траектории всюду плотны
в торе: они образуют иррациональную обмотку тора. В этом случае
траектории, т. е. орбиты соответствующего векторного поля, являют-
являются не подмногообразиями, а всего лишь погруженными подмногообра-
подмногообразиями.
Замечание. Погруженные подмногообразия наследуют мно-
многие локальные свойства подмногообразий. В частности, касательное
пространство погруженного подмногообразия W = Im Ф С М, где Ф —
погружение, задается как
T4q)W = 1шФ^.
Далее, легко доказать следующее свойство произвольного векторного
поля V G Vec M:
V(q) G TqW V qeW => q о etv e W V q E W,
для всех ?, достаточно близких к 0.
72 Гл. 5. Теорема об орбите и ее приложения
5.3. Следствия теоремы об орбите
Перед тем как доказать теорему об орбите, мы получим несколько
следствий из нее.
Пусть Oqo — орбита семейства Т С VecM.
Во-первых, если / G Т, то f(q) G TqOqo для всех q G Oqo. Действи-
Действительно, траектория q о е^ принадлежит орбите Oqo, поэтому ее каса-
касательный вектор f(q) содержится в касательном пространстве TqOqo.
Далее, если /ь/2 G Т, то [/i,/2](g) G TgOgo для всех q E Oqo. Это
следует из того, что вектор [Д, /г](^) касается траектории
t^qo etfl о eth о e~tfl о e~th G Oqo.
Аналогично, для трех векторных полей /ь/2,/3 ^ F имеем
[/ь[/2,/з]](д) е TqOqo, q G Oqo. Действительно, так как [/2,/з](д) G
G TqOqo, q G (9g0, то все траектории поля [/2,/з]? начинающиеся в
погруженном подмногообразии Oqo, не покидают его. Затем повто-
повторяем рассуждение, приведенное в предыдущем абзаце.
Можно продолжать таким образом и далее и получить скобки Ли
сколь угодно высокого порядка
[ЫЫ •••.[/*-!» fk] ..•]]](?)
как касательные векторы к (9qo при fi G ^г. Эти рассуж:дения есте-
естественно суммируются в терминах алгебры Ли векторных полей, по-
порожденной семейством Т\
Lie^ = span {[/1, [..., [fk-U fk].. .]]| fi G T, кеЩ С VecM,
и пространства, образованного значениями этих векторных полей в
точке q G М:
LieqT={qoV\ V G Lie^7} cTqM.
Получаем следующее предложение.
Следствие 5.1. Для любой точки q G Oqo
LieqT С TqOqo. E.2)
Замечание. Мы покажем вскоре, что во многих важных слу-
случаях включение E.2) обращается в равенство. В общем случае полу-
получаем оценку сверху
dim Lieg T ^ dim Oqo, qE Oqo.
Из теоремы об орбите также вытекает следующее предложение,
часто использующееся в теории управления.
Теорема 5.2 (Рашевский-Чжоу). Пусть М — связное гладкое
многообразие, и пусть Т С VecM. Если семейство Т вполне неголо-
номно:
Ueq T = TqM VqeM, E.3)
mo
Oqo=M Vqoe M. E.4)
5.4- Доказательство теоремы об орбите 73
Определение 5.2. Семейство Т С VecМ, удовлетворяющее
свойству E.3), называется вполне неголономным или семейством пол-
полного ранга.
Докажем теорему 5.2.
Доказательство. По следствию 5.1 равенство E.3) означает,
что любая орбита Oqo — открытое подмножество М.
Далее, рассмотрим следующее отношение эквивалентности в М:
qi ~ #2 ^ ^2 е Oqi, qi,q2 ? М. E.5)
Многообразие М есть объединение взаимно непересекающихся клас-
классов эквивалентности. Любой класс является открытым подмножест-
подмножеством многообразия М. Но М связно, поэтому существует лишь один
непустой класс эквивалентности, т. е. М совпадает с единственной
орбитой Oqo. ?
Для симметричных семейств множества достижимости совпадают
с орбитами, поэтому получаем следующее предложение.
Следствие 5.2. Симметричное вполне неголономное семейст-
семейство векторных полей на связном многообразии вполне управляемо.
5.4. Доказательство теоремы об орбите
Введем обозначение
(AdV)Td= {(Ad P)f\ P eV, /G^jcVecM
и рассмотрим следующее подпространство в TqM:
Uqd= span{qo (AdV)T}.
Это пространство — кандидат на роль касательного пространст-
ваГд0до.
Лемма 5.1. dimllg = dimllgo для всех q G Oqo, qo G M.
Доказательство. Отметим, что если q G Oqo, то q = go ° Q
для некоторого диффеоморфизма Q G V.
Возьмем произвольный элемент qo о (AdP)/ G Пдо, где Р G V, f G
G Т. Тогда
Q*(g0 о (AdP)/) = q0 о (AdP)f о Q = q0 о Р о f о Р-1 о Q =
= {qo о Q) о (Q-1 oPofop-1oQ)=qo Ad(Q~1 о Р)/ G Пд
в силу того, что Q oPgP.
Имеем Q*nqo С Пд, поэтому dimllgo $J dimllg. Но qo и q можно
поменять местами, следовательно, dimllg ^ dimllgo. Итак, dimllg =
= dim IV П
Теперь докаж:ем теорему об орбите.
Доказательство. Многообразие М распадается в объеди-
объединение взаимно непересекающихся классов эквивалентности отноше-
74 Гл. 5. Теорема об орбите и ее приложения
ния E.5) — орбит Oq. Введем на М новую «сильную» топологию, в
которой все орбиты суть связные компоненты.
Для любой точки q G М обозначим т = dim Tlq и выберем элемен-
элементы Vi,..., Vm G (AdV)J7 так, чтобы
span(Vi(g),..., Vm(q)) = Tlq. E-6)
Определим отображение
fi ( i I \ tl Vi tm Vm J. s— ТП)
Имеем
dGq
В t% Q
поэтому в достаточно малой окрестности Oq начала координат О G
G Кт векторы , ..., ——- линейно независимы, т.е. Gq\o —
погружение. m
Множ:ества вида Gq(Oo), q G Af, являются кандидатами на роль
элементов базы топологии на М. Докажем несколько соответствую-
соответствующих свойств этих множеств.
A) Так как отображения Gq регулярны, то множества Gq(Oq) —
?77,-мерные подмногообразия многообразия М, быть может, для мень-
меньших окрестностей Oq.
B) Покажем, что Gq(Oo) С Oq. Любой элемент базиса E.6) имеет
вид Vi = (Ad Pi) fu Pi eV, fiE Т. Тогда
JVi _ t(AdPi)fi _ tPiofioPr1 _ p tfi p-1 G <p
поэтому
Gq(t) = qoetVi eOq, te O0.
C) Покажем, что G*t(TtIRm) = nGW, t G Oq. Так как rank G*t\Qo =
= m и dim П
= 772, то остается доказать, что
/^. I I L> * IV/ WV/±U)V/-LV/yi ^^-LWAVCJjvJCAJ -L U • X J. W _^
ДЛЯ
t e Oq. Имеем
q q t у t у
В ti В ti
= q о etlVl о ... о etiVi о Vi о etl+1 "г+1 о ... о <
= q о е х 1о...оег гое г~^1 г~'~1 о ... о е m m о
ос m m о ... о с г+1 г~"~о у/V о 6 о , . , о б m тгг —
(введем обозначение Q = е^+1У*+1 о ... о etmVrn G Р)
= Gq(t) oQ-1oVioQ = Gq(t) о AdQ^ G nGg(t).
D) Докажем, что множества вида Gq(Oo), q G M, образуют базу
топологии на М. Достаточно показать, что любое непустое пересе-
пересечение Gq(Oo) П Gq(Oo) содержит подмножество вида G^(Oo)? т- е- эт0
пересечение устроено, как на рис. 5.4, а, а не на рис. Б Л, б.
5.4- Доказательство теоремы об орбите 75
Рис. 5.4
Пусть точка q принадлежит множеству Gq(Oo). Тогда dimn^ =
= dim Hq = т. Рассмотрим отображение
Gq\ (tu...,tm) н^ qoetlVl o ...oetrnVrn,
span(g о Уь..., q о Vm) = Щ.
Достаточно показать, что при малых (?i,..., ?m)
тогда можно заменить Gq(Oo) на Gq(Oo). Проведем доказательство
шаг за шагом. Рассмотрим кривую t\ \-> q о etlVl. По свойству C)
выше, Vi(qf) G Пд/ для q' G Gq(Oo) и достаточно близких к q. Так
как Gq(Oo) — подмногообразие в М и Hq = TqGq(Oo), то кривая
qo etlVl принадлеж:ит Gq(Oo) для достаточно малых \ti\. Повторив
это рассуж:дение, получаем, что
при малых |^11, l^l- Продолж:ая этот процесс, получаем включение
(qo etlVl о ... о e^-iVm_i>j o etmVm e Gq(Oo)
для (?i,..., tm), достаточно близких к О G Mm.
Свойство D) доказано, и множества Gq(Oo), q G М, образуют базу
топологии на М. Обозначим через МТ полученное топологическое
пространство, т. е. множество М с только что введенной на нем «силь-
«сильной» топологией.
E) Покажем, что для любого qo Е М орбита Oqo связна, открыта
и замкнута в «сильной» топологии.
Связность: все отображения t H> q о е^, / G Т, непрерывны в
«сильной» топологии, поэтому любую точку q G Oqo можно соединить
с qo непрерывной кривой в Мт.
Открытость: для любого q G Oqo множество вида Gq(Oo) С Oqo —
окрестность точки q в Мт.
Замкнутость: любая орбита является дополнением к объединению
открытых множеств (орбит), поэтому она замкнута.
Итак, любая орбита Oqo есть компонента связности топологичес-
топологического пространства Мт.
76 Гл. 5. Теорема об орбите и ее приложения
F) Определим гладкую структуру на каждой орбите Oqo, выбрав
Gq(Oo) в качестве координатных окрестностей и G'Z1 в качестве коор-
координатных отображений. Так как все G4\Oq суть погружения, то любая
орбита Oqo — погруженное подмногообразие в М. Заметим, что эти
подмногообразия могут иметь разные размерности для разных до-
G) По свойству C) имеем TqOqo = Пд, q G Oqo.
Теорема об орбите полностью доказана. ?
Описание касательного пространства к орбите, которое дает эта
теорема: ВД» = spanfoo (А<1*>)П
не очень конструктивно, так как группа V имеет довольно сложную
структуру. Впрочем, мы уже получили из теоремы об орбите оценку
снизу:
Lieg T С span(g о (А&Т)Т). E-7)
Отметим, что это включение несложно доказать непосредственно. Ис-
Используем асимптотическое разложение поля Ade^/ = etadf f. Возь-
Возьмем любой элемент ad/i о ... о adД/ G LieJF, /^,/ G Т. Имеем
Ad(etl/l о ... о etkfk)f e (AdV)T, поэтому
дк
о
(etiadfl о ...oetkadfk)f =
... dtk
)/ =
= qo
...dtk
= goad/i o...oad/fc /g span(<? о (AdV)J7).
Теперь рассмотрим ситуацию, когда включение E.7) становится
строгим.
Пример 5.3. Пусть М = М2, Т =
, д г д , 1ч д Л
±-^-^г = < -. а(х ) >. где
> G С°°(М), а ф 0, имеет компактный но-
носитель.
Легко видеть, что для любой точ-
< •Х° ки х G М2 орбита Ох совпадает со
¦ ^ всей плоскостью М2. Действительно,
дх1 1 семейство Т U (—JF) вполне управляемо
>д^ на плоскости. Каковы бы ни были на-
х± чальная точка xq = (xq,Xq) и конечная
точка х\ = (ж}, ж2), можно перевести
Рис. 5.5. Полная управляв- х0 в х\\ сначала идем из х0 вдоль
мость семейства Т \ д t~\ 2\ (~i\ -A
дх1 ~ °
Ф 0, затем движемся вдоль поля zba(x1) ——- до точки (ж1, ж2) и,
наконец, попадаем в (ж},ж2) вдоль =Ь^-^ (рис. 5.5).
5.5. Аналитический случай 77
С другой стороны,
То есть х о (AdV)T = TXR2 ф 1леж Т при х1 ? supp a.
Однако этот пример существенно неаналитический. В аналитиче-
аналитическом случае включение E.7) превращается в равенство. Мы докажем
это в следующем параграфе.
5.5. Аналитический случай
Множество Vec М не просто алгебра Ли (т. е. линейное прост-
пространство, замкнутое относительно скобки Ли), но также и модуль над
С°°{М)\ любое поле V G VecM можно умножить на функцию a G
G С°°(М) и получить векторное поле aV G VecM. Если рассматри-
рассматривать векторные поля как дифференцирования алгебры С°°(М), то
произведение функции а и поля V есть поле
(aV)b = a-(Vb), ЪеС°°(М).
В локальных координатах любая компонента V в точке q G М умно-
умножается на a(q).
Упражнение 5.1. Пусть Х,У G VecM, a G C°°(M), P G Diff M.
Докажите равенства
(ad X)(aY) = (Xa)Y + a(adX)Y,
(AdР){аХ) = (Ра) AdPX.
Подмодуль V С VecM называется конечно порожденным над
С°°(М), если в нем существует конечный глобальный базис вектор-
векторных полей:
3Vu...,Vk G VecM такие, что V =
аг G С°°(М)
г=1
Лемма 5.2. Пусть V С VecM — конечно порожденный подмо-
подмодуль над С°°(М). Предположим, что для некоторого векторного
поля X G Vec M
(adX)V = {(8idX)V\ V G V} С V.
Тогда
(Adetx)V = V.
Доказательство. Пусть поля V\,..., Т4 образуют базис V.
По условию леммы
к
E.8)
для некоторых функций а^ G G°°(М). Нужно доказать, что вектор-
векторные поля
tx tAX t G R,
78 Гл. 5. Теорема об орбите и ее приложения
являются линейными комбинациями полей V{ с коэффициентами
из С°°(М).
Найдем дифференциальное уравнение для Vi(i):
Vi(t) = *х ^х^
Для фиксированного q G M определим следующую матрицу поряд-
порядка к:
A(t) = (aij(t)), aij{t)=etxaih i,j = l,...,k.
Получаем линейную систему ОДУ
к
E.9)
Введем фундаментальную матрицу Г этой системы
t = A(t)T, Г@)=1с1.
Так как A(t) гладко зависит от д, матрица Г также гладко зависит
от q:
Г(*) = (ЪзШ 1Ф) е С°°(М), г, j = 1,..., fc, teR.
Теперь решения линейной системы E.9) можно записать в виде
Но поля V^@) = Vi — порождающие модуля, т. е. мы получили искомое
разложение полей V%(i) по порождающим. ?
Подмодуль V С Vec M называется локально конечно порожденным
над С°°(М), если для любой точки q G М существует окрестность
О С М, сужение на которую Т\о конечно порождено над С°°(О), т. е.
имеет базис векторных полей.
Теорема 5.3. Пусть Т С VecM. Предположим, что модуль
LieJF локально конечно порожден над С°°(М). Тогда
TqOqo =Lie,^, qeOqo, E.10)
для любой орбиты Oqo, go ? М, семейства Т.
Мы докаж:ем эту теорему ниже, а сейчас выведем из нее важное
предложение.
Следствие 5.3. Если М и Т вещественно аналитичны, то
справедливо равенство E.10).
Доказательство. В аналитическом случае модуль LieT ло-
локально конечно порожден. Действительно, любой модуль, порож-
порожденный аналитическими векторными полями, локально конечно по-
порожден. Это — нётерово свойство кольца ростков аналитических
функций; см. [142]. ?
5.6. Теорема Фробениуса 79
Теперь докажем теорему 5.3.
Доказательство. В силу теоремы об орбите
TqOqo =span{goAd(etl/lo...oetfe/fe)/|/b/G^ tk G К, кеЩ.
E.11)
По определению алгебры Ли Lie^7
(ad/)Lie^cLieJ^ V / G Т.
Применяя лемму 5.2 к локально конечно порожденному С°° (М)-мо-
дулю V = Lie T, получаем
(Ad etf) Lie Т С Lie Т V / G .F.
Следовательно,
Kd{etlh o...oetkfk)f=Adetlfl о ... о Ade*fe/fe/ G Lie^7
для любых /i, / G .T7, tk Gl Ввиду равенства E.11)
T^ С Lieq .F.
А обратное включение E.7) уже было получено. Итак, TqOqo = Lieg T.
Другое доказательство этой теоремы можно получить, используя
локальную сходимость экспоненциального ряда в аналитическом слу-
случае. ?
5.6. Теорема Фробениуса
Выведем из теоремы об орбите классическую теорему Фробениуса.
Определение 5.3. Распределением А С ТМ на гладком мно-
многообразии М называется любое семейство линейных подпространств
Ад С TqM', гладко зависящее от точки q G М. Размерность под-
подпространств Ag, q G М, предполагается постоянной.
Геометрически, распределение есть поле касательных подпрост-
подпространств на М.
Определение 5.4. Распределение А на многообразии М на-
называется интегрируемым, если для любой точки q G М существует
погруженное подмногообразие Nq С М, q G Nq, такое, что
Подмногообразие Nq называется интегральным многообразием
распределения А, проходящим через точку q (рис. 5.6).
Иными словами, интегрируемость распределения А С ТМ озна-
означает, что через любую точку q G М можно провести подмногообра-
подмногообразие JVg, касательные пространства которого — элементы распределе-
распределения А.
Замечание. Если dimAq = 1, то распределение А интегрируе-
интегрируемо по теореме 1.2 о существовании и единственности решений ОДУ.
Действительно, в окрестности любой точки М можно выбрать базис
80
Гл. 5. Теорема об орбите и ее приложения
Рис. 5.6. Интегральное многообразие Nq распределения А
распределения А, т.е. векторное поле V G VecM, такое, что Aq =
= span(V(g)), q G M. Но тогда траектории ОДУ q = V(q) суть одно-
одномерные подмногообразия с касательными пространствами Aq.
Однако в общем случае (dim Aq > 1) распределение А может быть
неинтегрируемым. Действительно, рассмотрим семейство векторных
полей, касающихся А:
Д = {V G VecM| V(q) G Aq V q в М}.
Предположим, что распределение А интегрируемо. Любое векторное
поле из семейства А касается интегральных многообразий Nq, по-
поэтому орбита Oq семейства А, ограниченного на достаточно малую
окрестность точки д, содержится в интегральном многообразии Nq.
Более того, так как dimOq ^ dim Aq = dimTVg, то локально Oq = Nq:
можно двигаться в Nq в любом направлении вдоль полей семейства А.
По теореме об орбите, TqOq D Lieq А, поэтому
Lie^A = Aq.
Это означает, что
[vuv2]eA \/vuv2eA. E.12)
Пусть dim Aq = к. Выберем базис распределения А в окрестнос-
окрестности Oqo точки qo Е М:
Aq = span(/i(g),..., fk{q)) V q G Oqo.
Тогда включение E.12) записывается как условие Фробениуса
к
E.13)
1=1
Мы показали, что из интегрируемости распределения следует
условие Фробениуса для его базиса.
Обратно, если условие E.13) выполняется в окрестности любой
точки qo G М, то Lie (А) = А. Поэтому Lie(A) — локально конечно
порожденный модуль над С°°(М). По теореме 5.3
TqOqo =Lie,A,
yqo-
5.7. Эквивалентность управляемых систем по состоянию 81
Поэтому ТО -А а€О
т. е. орбита Oqo есть интегральное многообразие распределения А,
проходящее через точку до- Мы доказали следующее предложение.
Теорема 5.4 (Фробениус). Распределение А С ТМ интегрируе-
интегрируемо тогда и только тогда, когда условие Фробениуса E.13) выпол-
выполняется для любого базиса А в окрестности любой точки qo ? М.
Замечания. A) По правилу Лейбница
[f,ag] = (fa)g + a[f,g], f,g € VecM, а&С°°{М),
условие Фробениуса не зависит от выбора базиса Д,..., Д: если оно
выполняется в каком-нибудь одном базисе, то выполняется и в любом
другом.
B) Можно рассматривать также гладкие распределения А с пере-
переменным рангом dim Aq. Такое распределение определяется как ло-
локально конечно порожденный над С°°{М) подмодуль А С VecM.
Для таких распределений из условия Фробениуса следует интегри-
интегрируемость; но размерность интегральных многообразий становится в
общем случае переменной, хотя и остается постоянной вдоль орбит А.
Это — обобщение фазового портрета векторного поля. Заметим еще
раз, однако, что в общем случае распределения с dim Aq > 1 неинтег-
рируемы.
5.7. Эквивалентность управляемых систем
по состоянию
В этом параграфе мы рассмотрим еще одно приложение теоремы
об орбите — к задаче эквивалентности управляемых систем (или се-
семейств векторных полей).
Пусть U — произвольное индексное множество. Рассмотрим два
семейства векторных полей на гладких многообразиях М и JV, пара-
параметризованных одним и тем же множеством U:
9и = {9и\ ueU} С VecTV.
Возьмем любую пару точек хо G M, yo G N и предположим, что
семейства Д/, ди имеют полный ранг:
Lie,0 Дг = ТХ0М, Lieyo Зи = TyoN.
Определение 5.5. Семейства Дг и ди называются локально
эквивалентными по состоянию, если существует диффеоморфизм
окрестностей
Ф: 0XoCM^OyoCN,
Ф: х0 ь^у0,
переводящий одно семейство в другое:
Ф*Д = 9и V и eU.
Обозначение: (Дг,жо) — {ди,Уо)-
6 А.А. Аграчев, Ю.Л. Сачков
82 Гл. 5. Теорема об орбите и ее приложения
Замечание. Мы рассматриваем здесь только гладкие преобра-
преобразования состояния х Н> т/, в то время как управления и не меняются.
Поэтому такая эквивалентность называется эквивалентностью по сос-
состоянию. Ранее мы уже рассматривали эквивалентность по состоянию
нелинейных и линейных систем как локальную, так и глобальную (см.
гл. 4).
Сначала попытаемся найти необходимые условия локальной экви-
эквивалентности систем fjj и gjj. Пусть
(fu,x0) ~ {ди,Уо)-
В силу инвариантности скобки Ли имеем
ф*[/т,Л2] = [Ф*/г*1,Ф*/и2] = [gUl,gu2}, иъи2 е и,
т. е. соотношения между скобками Ли векторных полей эквивалент-
эквивалентных семейств fu и ди должны сохраняться. Рассмотрим все соотно-
соотношения между этими скобками Ли в одной точке. Определим системы
касательных векторов:
r]Ul...uk = [ди1Л---,9ик]---]Ы) ?TyoN.
Для этих систем имеем равенство
Ф*\хо?и1...ик =riui...uk, ии...,икеи, кеК
Теперь можно сформулировать необходимое условие локальной эк-
эквивалентности семейств fu и ди в терминах линейного изоморфизма
Ф*\Х0=А: TxoM^TyoN.
Если (/(у,жо) — (<?G;2/o); то существует линейный изоморфизм
А: ТХ0М ^TyoN,
отображающий систему векторов {?,Ul...Uk} в систему {TjUl...Uk}. Ока-
Оказывается, что в аналитическом случае это условие достаточно для
локальной эквивалентности по состоянию. То есть в аналитическом
случае комбинации частных производных векторных полей /п, и G
G U, входящие в {?Ul...uk}i образуют полную систему инвариантов
семейства fu для эквивалентности по состоянию.
Теорема 5.5. Пусть fu и ди — вещественно аналитические
семейства векторных полей полного ранга на вещественно анали-
аналитических многообразиях М и N соответственно. Пусть xq Е М,
2/о eN.
Тогда (fu,xo) ~ {ди,Уо) в том и только том случае, когда су-
существует линейный изоморфизм
A: TXoM^TyoN
такой, что
-.uk} = {vUl...Uk} Vuu...,ukeU, keK E.14)
5.7. Эквивалентность управляемых систем по состоянию 83
Замечание. Если вдобавок М, N односвязны и все поля /и, ди
полны, то имеет место глобальная эквивалентность.
Перед тем как доказывать теорему 5.5, сформулируем усло-
условие E.14) по-другому и укажем метод его проверки.
Пусть семейство fu имеет полный ранг:
span{fUl...wJ U!,...,uk eU, кеЩ =ТХ0М.
Выберем базис:
span^,...,^) =TXoM, ai = (ulu...,uki), г = 1,...,п,
E.15)
и выразим все векторы семейства ? через базисные векторы:
п
?Ul...u*=5>«i-«*6i<- E.16)
г=1
Если существует линейный изоморфизм А: ТХоМ <-} TyoN со свойст-
свойством E.14), то векторы 77^, г = 1,... ,п, должны образовывать базис
пространства TyoN:
spanG7a15...,f7an) = TyoN, E.17)
а все векторы семейства rj долж:ны выражаться через базисные век-
векторы с теми же коэффициентами, что и семейство ? (см. E.16)):
rjUl...uk =^сги1.икт]^. E.18)
г=1
Легко получить обратную импликацию: если можно выбрать бази-
базисы в ТХоМ и TyoN из семейств ? и 77, как в E.15) и E.17), чтобы имели
место разложения E.16) и E.18) с одними и теми же коэффициентами
ci*i nfc5 T0 существует линейный изоморфизм А со свойством E.14).
Действительно, в этом случае можно определить изоморфизм на ба-
базисных векторах:
А: Ыг ^ ^i, г = 1,...,п.
Можно получить еще одну переформулировку, введя следующую
терминологию. Конфигурации {?и1...ик} и {Ли-i...uk} называются эк-
эквивалентными, если множества соотношений K(fu) и К(ди) между
элементами этих конфигураций совпадают: K(fu) = К(ди)- Здесь мы
обозначаем через K(fu) множество всех наборов коэффициентов, для
которых соответствующие линейные комбинации равны нулю:
K{fu) =
Тогда теорему 5.5 можно выразить следующим образом.
Принцип Нагано. Вся локальная информация о семействах
аналитических векторных полей полного ранга содержится в скоб-
скобках Ли.
6*
84 Гл. 5. Теорема об орбите и ее приложения
Впрочем, заметим, что конфигурация ?Ul...Uk и система соотноше-
соотношений K(fu), вообще говоря, необозримы и не могут быть описаны прос-
просто. Поэтому обычно принцип Нагано неприменим непосредственно к
описанию свойств управляемых систем, но это важный направляю-
направляющий принцип.
Теперь докажем теорему 5.5.
Доказательство. Необходимость уже доказана. Докажем
достаточность с помощью теоремы об орбите. Для этого построим
вспомогательную систему на декартовом произведении
М х N = {(ж, у) | х G М, у G N}.
Для векторных полей / G Vec М и д G Vec N определим их прямое
произведение / х д G Vec(M x N) как дифференцирование
(fx9)a\(x,y)=(fal)\x+(gal)\y, aeC°°(MxN), E.19)
где семейства функций a* G C°°(M), ах G C°°(N) определяются сле-
следующим образом:
aj:^4 а(х, у), а2х: у н-» а(х, у), х G М, у G N.
Поэтому проекция поля / х д на М равна /, а проекция на N равна д.
Наконец, определим прямое произведение систем fu и ди как
fu xgu = {fuXgu\ueU} С Vec(M х N).
Предположим, что существует линейный изоморфизм А: ТХоМ <-$-
О TyoN, отображающий конфигурацию ? в т\ как в E.14), и построим
локальную эквивалентность (/с/,жо) — {ди,Уо)-
В силу определения E.19) скобка Ли в семействе fu x #?/ вычис-
вычисляется следующим образом:
[fUl X 9m,fи2 Х #п2] = [/щ,Л2] X [#М1,#п2], UUU2 G С/,
поэтому
[/щ х gUl,[...JUk х gUk]...](x0,y0) =
= [fu1,[--">fuk]---](xo) x \9и1Л--ч9ик]---]Ы) =?и1...ик х rjUl...Uk =
= €Ul...uk x A?Ul_Uk, иъ...,ик eU, к G N.
Следовательно,
dimLie(a,O5yo)(/^ x gv) = п,
где п = dimM. По аналитической версии теоремы об орбите (следст-
(следствие 5.3) для семейства fu x ди С Vec(M x N) орбита О системы fu x
х ди, проходящая через точку (жо?2/о)? есть n-мерное погруж:енное
подмногообразие (поэтому локально подмногообразие) в М х N. Ка-
Касательное пространство к орбите имеет вид
..^ х A?Ul...Uk) =
^ х Av\ v G Txo} С T{xom)M xN = TXoM x TyoN,
5.7. Эквивалентность управляемых систем по состоянию 85
т. е. это график линейного изоморфизма А. Рассмотрим канонические
проекции на сомножители:
7Г1: М х N —)> М, 7Ti(x, у) = ж,
тг2: MxTV^TV, тг2(ж,2/) = у.
Ограничения ttiI^, ^2\q суть локальные диффеоморфизмы, так как
дифференциалы
г;, veTX0M,
(ачы/о) ^^ veTX0M,
взаимно однозначны.
Тогда Ф = 7Г2 о (ttiI^)" — локальный диффеоморфизм из М в N
с графиком О и
Ф* =тг2* о (Trilp): /n ь^^м, гл G t/.
Следовательно, (fu,x0) ~ (ди,Уо)- П
Глава б
ВРАЩЕНИЕ ТВЕРДОГО ТЕЛА
В этой главе мы рассматриваем вращения твердого тела вокруг
неподвижной точки. То есть изучаются такие движения тела в трех-
трехмерном пространстве, что:
— расстояние между любыми точками тела остается неизменным;
— в теле существует точка, остающаяся неподвижной при движе-
движении тела.
Мы будем рассматривать как свободные движения (в отсутствии
внешних сил), так и управляемые движения (когда к телу прилагают-
прилагаются внешние силы, чтобы перевести его в желаемое положение).
Эта система — очень упрощенная модель космического спутника,
вращающегося вокруг своего центра масс.
Дополнительные сведения о дифференциальных уравнениях, опи-
описывающих вращения твердого тела, можно найти в книге [137].
6.1. Пространство состояний
Состояние твердого тела определяется его положением и ско-
скоростью. Выберем ортонормированный
репер, закрепленный в теле в непо-
неподвижной точке (подвижный репер),
и ортонормированный репер, закреп-
закрепленный в окружающем пространстве
в неподвижной точке (неподвижный
репер); рис. 6.1. Множество положе-
положений твердого тела есть множество
всех ортонормированных положи-
положительно ориентированных реперов в
трехмерном пространстве. Это мно-
множество естественно отождествляется
с SOC) — группой линейных орто-
ортогональных преобразований М3, сохра-
сохраняющих ориентацию, или, что равносильно, с группой ортогональных
унимодулярных матриц порядка 3:
{x,y), detQ = l} =
= {Q: R3 ^ M3 | QQ*= Id, detQ = l}.
Отображение Q : M3 —>• M3 переводит координатное представление
точки в подвижном репере в ее координатное представление в непод-
неподвижном репере.
Замечание. Мы обозначаем скалярное произведение в евкли-
евклидовом пространстве М3 через (•, •). Для векторов ж, у Е М3 с коорди-
i
i
i
Рис. 6.1. Неподвижный и под-
подвижный реперы
SOC) =
6.1. Пространство состояний 87
натами х = (ж1,Ж2,^з), у = B/1,2/2,Уз) в некотором ортонормирован-
ном базисе имеем (ж, г/) = х\у\ + ^22/2 + ^зУз-
Отметим, что множество положений твердого тела SOC) не ли-
линейное пространство, а нетривиальное гладкое многообразие.
Теперь опишем скорости твердого тела. Обозначим через Qt G
G SOC) положение тела в момент времени t. Операторы Qt: М3 —>• М3
ортогональны, т. е.
Дифференцируя это тождество по t, получаем
(Qtx,Qty) + (Qtx,Qty) = O. F.1)
Матрица
fit = QilQt
называется угловой скоростью в теле. Так как
Qt = QtSk,
то равенство F.1) молено записать в виде
(Qtutx,Qty) + (Qtx,Qtuty) = 0,
откуда в силу ортогональности получаем
т. е.
п; = -пи
и матрица Qt кососимметрична. Поэтому скорости твердого тела
имеют вид
Qt = Q&, fit* = -fit-
Иными словами, мы нашли касательное пространство
TQ SOC) = {Q^l ft* = -ft}, Q G SOC).
Пространство кососимметрических матриц порядка 3 обозначается
через soC). Оно является касательным пространством к группе SOC)
в единице:
soC) = {ft: М3 ^М3| ft* = -ft} = TidS0C).
Пространство soC) есть алгебра Ли группы Ли SOC).
Каждой кососимметрической матрице ft G soC) можно сопоста-
сопоставить вектор и: G М3:
(О —ojz uj2\ Л^Л
^з 0 -o;i , оо = \uj2 I. F.2)
—UJ OJi 0 / \^3/
Тогда действие оператора ft на вектор х G М3 задается с помощью
векторного произведения в М3:
ftx = wxx, x G M3.
Гл. 6. Вращение твердого тела
Пусть х — некоторая точка твердого тела. Ее положение в прост-
пространстве М3 есть Qtx. Далее, скорость этой точки равна
Qtx = Qt^tx = Qt(wt х х)-
Вектор щ есть вектор угловой скорости точки х в подвижном репере:
если зафиксировать подвижный репер Qt в один момент времени ?,
то мгновенная скорость точки х в момент t в подвижном репере
равна Q^1Qt% = Qtx = ujt x x, т.е. точка х вращается вокруг оси,
направленной вдоль вектора ujt, с угловой скоростью \\ojt\\.
Введем скалярное произведение матриц Q = (f^j) G soC) следую-
следующим образом:
(п\&) = -itr^tf) = \ ?
Это произведение согласуется с отождествлением F.2) кососимметри-
ческих матриц порядка 3 и 3-мерных векторов:
п*~ш\ ^GsoC), ^GR3, г = 1,2.
Более того, это произведение инвариантно в следующем смысле:
((AdQ)fi1,(AdQ)fi2) = (f21,f22), QeSOC), п\п2 е soC),
F.3)
т.е. AdQ: soC) —)¦ soC) — ортогональное преобразование относитель-
относительно скалярного произведения (•, •}. Действительно,
в силу инвариантности следа матрицы.
Выведем инфинитезимальную версию свойства инвариантнос-
инвариантности F.3). Возьмем произвольную матрицу f? G soC) и рассмотрим
гладкую кривую Qt G SOC), выходящую из единицы со скоростью Q:
Тогда
at о
и, дифференцируя F.3) по t при ? = 0, получаем тождество
((а(Ш)^\^2) + (П1, (асШ)^2) = 0, fi,^1,^2 G soC), F.4)
т.е. отображение adil: soC) —>- soC) кососимметрично относительно
скалярного произведения (•, •).
Вектор uj\ х a;2 G М3 соответствует матрице [Г^1,Г22] G soC) в силу
изоморфизма F.2), поэтому тождество F.4) можно записать с по-
помощью векторного произведения:
(си х uj1^2) + (ио1^ х иJ) = 0, cj, cj1, uj2 G M3.
6.2. Уравнения Эйлера 89
6.2. Уравнения Эйлера
Выведем уравнения движения твердого тела из принципа наи-
наименьшего действия.
Пусть распределение массы твердого тела имеет плотность р(х),
где р: М3 —>• IR+ — неотрицательная интегрируемая функция с ком-
компактным носителем. Пусть Qt Е SOC) есть положение, a f^ E soC) —
угловая скорость тела, так что
Qt = Qt^t- F.5)
Выберем произвольную точку тела х. Положение этой точки в прост-
пространстве есть QtX, а ее скорость равна Qtx. Распределение кинетичес-
кинетической энергии в теле имеет плотность - p(x)(QtX, Qtx), поэтому полная
кинетическая энергия тела в момент времени t равна
j(ut) = 2 / p{x){Qtutx,Qtutx)dx = - / p(x)(utx,utx)dx;
это квадратичная форма j = j(?lt) на пространстве soC). Соответст-
Соответствующую билинейную форму мож:но записать в виде
/
dx = (Ап\ п2}, п\ п2 е soC),
для некоторого линейного симметрического оператора
A: soC) -^soC), А = А* > О,
который называется тензором инерции твердого тела. Наконец,
функционал действия имеет вид
=\ J(AUU Ut) dt,
о
где 0 и t\ — начальный и конечный моменты движ:ения.
Пусть Qo и Qtx — начальное и конечное положения движущегося
тела. Согласно принципу наименьшего действия движение тела Qt,
t G [0,?i], должно быть экстремалью следующей задачи:
Qt = Qt^t, Qo, Qt! фиксированы.
Найдем эти экстремали.
Пусть Г^ есть угловая скорость вдоль выбранной траектории Qi\
тогда
90 Гл. 6. Вращение твердого тела
Рассмотрим произвольное малое возмущение угловой скорости
Для того чтобы такое возмущение было допустимым, начало и конец
соответствующей траектории не должны зависеть от е:
J (nt + eUt + 0{e2)) dt,
поэтому
nt+eUt + O(e2)) dt. F.7)
? = O
?=0
О
По формуле B.31) производной потока по параметру выражение в
правой части F.7) равно
0 0
/ Ad I exp uTdr) Ut dt о exp Qtdt =
0 0
tl tl
= I Ad(Q0 о Qt)Ut dt о Q-1 о Qtl = Q-1 [ Ad QtUt dt о Qtl.
о о
Поэтому равенство F.7) можно записать в виде
о
Обозначим
Г AdQtUtdt = O.
t
Vt = J AdQrUrdr. F.8)
о
Тогда условие допустимости вариации Ut принимает вид
Vo = Vtl = 0. F.9)
Найдем экстремали задачи F.6):
«1
0=|- J(fi.e)= f(AUt,Ut)dt =
os ?=o J
о
(в силу F.3))
= J\(AdQt)AUt, (AdQt)Ut) dt =
6.2. Уравнения Эйлера 91
(используем F.8))
= J((AdQt)AQuVt)dt =
о
(интегрируем по частям с условием допустимости F.9))
= - J\±-t{AdQt)AUuVt) dt.
о
Вышеприведенный интеграл равен нулю на любом допустимом опе-
операторе Vt, следовательно,
Отсюда
поэтому
Aut = [Aut,ut], te [0,ti]. F.10)
Введем оператор
Mt = Апи
который называется кинетическим моментом тела, и обозначим
В = А~\
Комбинируя равенства F.10) и F.5), получаем уравнения Эйлера вра-
вращения свободного твердого тела
(Mt = [Mt,BMt], Mteso{3),
\Qt = QtBMt, Qt G SOC).
Замечание. Описанный способ вывода уравнений Эйлера мож-
можно применить к кривым на группе SO(n) ортогональных унимодуляр-
ных матриц порядка п для любого п > 0. Таким образом получаются
уравнения вращения обобщенного n-мерного твердого тела.
Теперь перепишем уравнения Эйлера, используя изоморфизм F.2)
пространств soC) и М3, существенно трехмерный и не обобщающийся
на высшие размерности. Напомним, что кососимметрической матрице
/ 0 -/13 М2\
М = /i3 0 -/11 е soC)
\-/12 Mi 0 /
соответствует вектор /iGM3 вида
92 Гл. 6. Вращение твердого тела
В этих терминах уравнения Эйлера принимают вид
(flt =fltX PfJLt, i^t^K3,
\Qt = Qtfou Q* eS0C),
где f3\ M3 —> M3 и /3: M3 —>• soC) — операторы, соответствующие отоб-
отображению 5: soC) —>• soC) в силу изоморфизма soC) О М3 F.2).
Собственные векторы симметрического положительно определен-
определенного оператора /3 : М? —>> М3 называются главными осями инерции
твердого тела. Мы предполагаем в дальнейшем, что твердое тело
асимметрично, т. е. оператор /3 имеет три разных собственных зна-
значения Ai, Аг, Аз- Упорядочим собственные значения /3:
и выберем ортонормированный базис в1,е2,ез из соответствующих
собственных векторов, т.е. главных осей инерции. В базисе e,\,e,2ies
оператор C становится диагональным:
/i2 = A2/i2 ,
а уравнение fit = fit x j3fit приобретает вид
/ii = (A3 - A2)/i2/i3,
A2 = (Ai - A3)/ii/i3, F.11)
^3 = (A2 - Ai)/ii/i2-
6.3. Фазовый портрет
Опишем фазовый портрет первого из уравнений Эйлера
in = fit x/3fit, fiteR3. F.12)
Это уравнение имеет два интеграла: энергию
(fit, fit) = const
и кинетический момент
(fit, /3fit) = const.
Действительно,
— (/it,/it) = 2(fit x /3fit, fit) = -A3fit, fit x /it) = 0,
— (fluPfJLt) = (»t X PVuPfJLt) + (VtiPiVt X /3/J*)) = 2(/it X CflU Cfit) =
= -2(/it,/3/it x/3/it) = 0
в силу инвариантности скалярного произведения F.4) и симметрич-
симметричности C.
6.3. Фазовый портрет
93
Потому все траектории fit уравнения F.12) удовлетворяют огра-
ограничениям
f»l+t4 + t4 = const,
т. е. принадлежат пересечениям сфер с эллипсоидами. Учитывая од-
однородность системы F.12), изобразим ее траектории на одной сфере —
единичной:
/х? + /х1+/х1 = 1, F.14)
все остальные траектории получаются с помощью гомотетий.
Пересечения единичной сферы с главными осями инерции, т. е.
точки iei, =Ье2, =Ьез, являются положениями равновесия, и других
равновесий нет; см. уравнения F.11).
Далее, положения равновесия iei, =Ьез, соответствующие наи-
наибольшему и наименьшему собственным значениям А1,Аз, устойчивы
(это центры), а равновесия =Ье2, соответствующие А2, неустойчивы
(седла). Это определяется геометрией пересечений единичной сферы
с эллипсоидами
Действительно, при С < Аз эллипсоиды содержатся внутри сфе-
сферы и не пересекаются с ней. При
С = Аз эллипсоид касается еди- е3
ничной сферы изнутри в точках
±ез- Далее, при С > Аз и близ-
близких к Аз эллипсоиды пересекают
единичную сферу по двум замкну-
замкнутым кривым, окружающим соот-
соответственно ез и — ез- Аналогич-
Аналогично устроены пересечения вблизи
С = Х\. При С > Ai эллипсоиды
слишком велики и не пересекают
единичную сферу; при С = Х± ма-
малая полуось эллипсоида становит-
становится равной радиусу сферы, и он ка-
касается сферы снаружи в ±ei; a
при С < Ai и близких к Ai пе-
пересечение состоит из двух кри-
кривых, окружающих ±ei. При G =
= А2 эллипсоид касается сферы в
концах средних полуосей =Ье2, и в
окрестности каждой из точек в2, — e<i пересечение состоит из четырех
ветвей сепаратрис, стремящихся к этой точке. Уравнения сепаратрис
выводятся из системы
Рис. 6.2. Фазовый портрет систе-
системы F.12)
= A2.
94 Гл. 6. Вращение твердого тела
Умножим первое уравнение на Л2 и вычтем из второго:
(Ai - \2)ц\ - (Л2 - A3)/i| = 0.
Следовательно, сепаратрисы принадлежат пересечению единичной
сферы с двумя плоскостями
П± = {(/ib /i2, Мз) е R3 | у/\г - А2 iii = ±\Л2 - A3/i3},
т. е. это дуги больших окружностей.
Оказывается, что из траекторий системы только сепаратрисы и
положения равновесия принадлежат двумерным плоскостям. Более
того, все остальные траектории удовлетворяют следующему условию:
/1 ? П±, II ф Re{ ^/iA/iA/i/O, F.15)
т. е. векторы /i, A и jl линейно независимы.
Действительно, возьмем любую траекторию fit на единичной сфе-
сфере. Все траектории, гомотетичные данной, образуют конус вида
С{ii\ + lil + ii%) = Ai/i? + X2f4 + A3//!, A3 ^ С ^ Ai. F.16)
Но квадратичный конус в М3 является либо вырожденным, либо эл-
эллиптическим. Условия /i ^ П±, /i ^ Ме^ означают, что С ф А^, г = 1, 2, 3,
т.е. конус F.16) эллиптический. Теперь неравенство F.15) вытекает
из следующих двух фактов. Во-первых, /i Л /i ф 0, т. е. траектория /i^
не касается порождающей конуса. Во-вторых, пересечение эллипти-
эллиптического конуса с плоскостью, не содержащей порождающей конуса,
есть эллипс — сильно выпуклая кривая.
В силу уравнения F.12) условие выпуклости F.15) для конуса,
порожденного траекторией, переписывается в следующим образом:
II ? П±, II ? Rei =^> /1Л (fix Cfi) Л ((fi x /3fi) x Cfi + fix /3(fi x /3/i)) ф 0.
F.17)
Плоские сепаратрисы на фазовом портрете являются регулярными
кривыми на сфере, поэтому
/1 G П±, /1<^Ме2 => /iA/i/0,
или, в силу уравнения F.12),
fi е П±, /i ^ Ме2 => II Л (/i х fifi) ф 0. F.18)
6.4. Управляемое твердое тело: орбиты
Предполож:им, что мы можем управлять вращениями твердого
тела, прилагая момент силы вдоль фиксированной прямой в теле.
Можно менять направление момента силы на противоположное в
любой момент времени.
Запишем управляемую систему для угловой скорости:
fit = fit x f3fit ± /, lit е М3, F.19)
6.4- Управляемое твердое тело: орбиты 95
тогда полная система для управляемого твердого тела имеет вид
(fit = [it x Pfj,t ± z, /i* е м3, 2о
\& = <А*, Q*g SOC),
где / / 0 — фиксированный вектор вдоль выбранной прямой.
Мы опишем орбиты и множества достижимости 6-мерной систе-
системы F.20). Но сначала изучим орбиты 3-мерной системы F.19).
6.4.1. Орбиты 3-мерной системы. Система F.19) аналитична,
поэтому размерность орбиты через точку /iGl3 равна размерности
пространства
Lie^(/i х f3/i ± I) = Lie^/i x /3/х, I).
Введем обозначения для векторных полей:
и вычислим несколько скобок Ли:
\ [[g, [g, /]], [5, /]]Ы = ix/3(ix /30 + (г х /зг) х /зг.
Используя свойство F.17) с / = /1, получаем три постоянных вектор-
векторных поля д, [#,/], [[#?[#? /]]>[#?/]]> которые линейно независимы:
= I AI х /31 А ((I х /31) х /31 + I х /3A х pi)) ф 0
при / ^ П±, I фШе{.
В случае общего положения получаем следующее утверждение.
Случай 1. Z ^ П±, Z ^ Ме^.
Предложение 6.1. Пусть I ф П±, / ^ Re^. Тогда Lie^(f,g) =
= М3 ^лл любого \i Gl3. Система F.19) имеет одну 3-мерную орби-
орбиту — пространство М3.
Рассмотрим специальные случаи расположения вектора /.
Случай 2. Пусть / G П+, / ^ Ме2- Так как плоскость П+ ин-
инвариантна для свободного тела F.12) и / G П+, то плоскость П+
инвариантна такж:е и для управляемого тела F.19), т. е. орбита через
любую точку плоскости П+ содержится в П+. С другой стороны, из
свойства F.18) получаем
1АAхР1)ф 0.
Но векторы / = g(/i) и / х /3/ = - [g, [g, /]](/i) образуют базис плос-
плоскости П+, поэтому П+ является орбитой через любую точку \± G П+.
Итак, плоскость П+ есть орбита системы F.19). Если начальная точка
fiQ ? П_|_, то траектория fit системы F.19) через fio не плоская; поэтому
(fit х pfit) AlA(lxpi)^0.
96
Гл. 6. Вращение твердого тела
Итак, орбита через {1q трехмерна. Мы доказали следующее
утверждение.
Предложение 6.2. Пусть I G П+ \ Ме2. Тогда система F.19)
имеет одну 2-мерную орбиту — плоскость П+, и две 3-мерные орби-
орбиты — связные компоненты М3 \ П+.
Случай / G П_ \ Ме2 полностью аналогичен рассмотренному, и
справедливо аналогичное утверждение с П_ вместо П+.
Случай 3. Пусть теперь / G Rei \ {0}, т. е. / = cei, с ф 0. Во-
первых, прямая Rei — орбита. Действительно, если \± G Rei, то f(fi) =
= 0, и g{jj) = / также касается прямой Rei.
Чтобы найти остальные орбиты, построим интеграл управляемой
системы F.19) из двух интегралов F.13) свободного тела. Так как
g(/i) = / = cei, мы ищем линейную комбинацию интегралов F.13), не
зависящую от /ii. Умножим первый интеграл на Ai, вычтем из не-
него второй интеграл, и получим ин-
интеграл управляемого твердого тела:
(Ai - A2)/i2 + (Ai - A3)/i3 = С.
F.21)
Так как Ai > A2 > A3, то это — эл-
эллиптический цилиндр в М3.
Поэтому любая орбита систе-
системы F.19) содержится в некотором
цилиндре F.21). С другой стороны,
орбита через любую точку /iq G
El3 \ Rei должна быть по меньшей
мере 2-мерной. Действительно, если
/1о ^ Ме2 U Мез ? т0 свободное тело
имеет траектории, не касающиеся
поля д\ а если /iq G Ме2 или Мез, то этого можно достичь малым
смещением точки /iq вдоль поля д. Поэтому все орбиты вне прямой
Rei — эллиптические цилиндры F.21).
Предложение 6.3. Пусть I G Rei \ {0}. Тогда все орбиты
системы F.19) имеют вид F.21): имеется одна 1-мерная орбита —
прямая Rei (G = 0), и бесконечное количество 2-мерных орбит —
эллиптических цилиндров F.21) при С > 0.
Случай / G Мез \ {0} полностью аналогичен случаю 3.
Предложение 6.4. Пусть I G Мез \ {0}- Тогда система F.19)
имеет одну 1-мерную орбиту — прямую Мез, и бесконечное коли-
количество 2-мерных орбит — эллиптических цилиндров
Рис. 6.3. Орбиты в случае / G
G Mei \ {0}
- A3)/i? + (А2 - А3)/х1 =
О 0.
Случай 4. Рассмотрим последний случай: пусть / G I
Как и выше, найдем интеграл управляемой системы F.19):
(\ \\2 /\ \\2 r~i
\А\ — A2j/ii — (А2 ~~ Аз]/^з = ^-
22\{0}.
F.22)
6.4- Управляемое твердое тело: орбиты
97
2 \ {0}. Тогда существует
и бесконечное количество
При С ф 0 это уравнение задает гиперболический цилиндр. С по-
помощью рассуждения, аналогичного использованному в случае 3, полу-
получаем следующее описание орбит.
Предложение 6.5. Пусть I G
одна 1-мерная орбита — прямая Же
2-мерных орбит следующего вида:
1) связные компоненты гипербо-
гиперболических цилиндров F.22) при С ф
2) полуплоскости — связные ком-
компоненты множества
(П+иП_)\Ме2.
Итак, мы рассмотрели все воз-
возможные положения вектора / G
G М3 \ {0} и во всех случаях описали
орбиты 3-мерной системы F.19). Те-
Теперь изучим орбиты полной 6-мер-
6-мерной системы F.20).
6.4.2. Орбиты 6-мерной системы. Векторные поля в правой
части 6-мерной системы F.20) суть
/гл\
(Q,/i) G SOC) хЁ3.
Отметим правило коммутирования векторных полей специального
вида, возникающих в нашей задаче:
рИс. 6.4. Орбиты в случае / G
G Ме2 \ {0}
v2
да да
Вычислим сначала те же скобки Ли, что и в 3-мерном случае
l X PfJL + fj, X /31) '
1 ГГ Г Л1 Г *П - ( ° ^
2 Ш У9, /JJ, [9, /JJ - [i х рц х pi) + {i х pi) x j3l)¦
Далее, для любого векторного поля X ? Vec(SOC) x К3) вида
X =
х — постоянное векторное поле в
F.23)
7 А.А. Аграчев, Ю.Л. Сачков
98 Гл. 6. Вращение твердого тела
имеем
F.24)
Чтобы изучить орбиты 6-мерной системы F.20) через точку
(Q,/i) Е SOC) х М3, рассмотрим различные случаи из п. 6.4.1 для
3-мерной системы F.19).
Случай 1. I ? П±, I ? Ме{. Можно выбрать три линейно неза-
независимых векторных поля в Lie(/, g) вида F.23):
Xi=g, X2 = \ [g, [g, /]], Х3 = \ [[g, [g, /], [g, /]].
Используя правило коммутирования F.24), получаем шесть линейно
независимых векторов в Lie(QjjLt)(/,g):
Х1ЛХ2ЛХ3/\ [Xuf] Л [Х2, /] Л [Х3, /] ф 0.
Поэтому орбита, проходящая через точку (Q,/i), 6-мерна.
Случай 2. I e П±\Ме2.
Случай 2.1. jj, <? П±. Во-первых, Lie(/, g) содерлсит два линейно
независимых поля вида F.23):
*i=5, X2 = \\g,\g,f\].
Так как траектория свободного тела в М3 через /i не плоская, можно
считать, что вектор v = /i x (З/i линейно независим от I к I x /31. Мы
покажем ниже, что Lie(/, g) содерж:ит два векторных поля вида
. М1ЛМ2^0, F.25)
где векторные поля v± и г>2 равны нулю в точке /х. Из этого будет
следовать, что Lie(gjAt)(/, #) содерж:ит шесть линейно независимых
векторов:
X!(Q,n), X2(Q,im),
и потому орбита, проходящая через точку (Q,/i), 6-мерна.
Найдем два векторных поля вида F.25) в алгебре Ли Lie(/, g).
Выбирая подходящие линейные комбинации с полями Х\, Х2, спро-
спроецируем вторую компоненту полей [g, f] и - [/, [д, [д, /]] на прямую Mv.
В результате получим векторные поля
6.4- Управляемое твердое тело: орбиты 99
Если к\ и &2 равны нулю в точке /i, то эти векторные поля можно
взять в качестве Yi, Y2 в F.25). Если же к\ или /с2 не равно нулю в /х,
то такие векторные поля Yi, Y2 можно построить, подбирая линейные
комбинации полей F.26) и / с полями g, [g, [g, /]].
Поэтому в случае 2.1 орбита 6-мерна.
Случай 2.2. /1 Е П±. Имеется пять линейно независимых век-
векторов в 1ле( ()
Орбита в М3 2-мерна, поэтому орбита в SOC) х М3 5-мерна.
Случай 3. / GMei \ {0}.
Случай 3.1. /i ^ Mei. Рассуждаем так же, как в случае 2.1. Мо-
Можем считать, что векторы / и v = /i x /5/х линейно независимы. Орбита
в М3 2-мерна, а ее касательное пространство порождается векторами /
и v, поэтому в алгебре Ли Lie(/, g) можно найти векторные поля вида
y2 = [уь /] = (
для некоторых функций С^, г = 1,..., 4. Итак, мы нашли пять линейно
независимых векторов в пространстве Lie^g,^)(/, g)'-
д, /, Уь У2, [УЬУ2].
Поэтому орбита 6-мерной системы F.20) 5-мерна (она не может быть
6-мерной, так как 3-мерная система F.19) имеет 2-мерную орбиту).
Случай 3.2. /i G Rei. Векторы
линейно независимы, поэтому
dimLie(Qj/i)(/,0) = dim span(/,^)|(Q)/i) = 2.
Следовательно, орбита 2-мерна.
Случаи / G Ме^ \ {0}, г = 1,2, аналогичны случаю 3.
Подведем итоги нашего исследования орбит управляемого твердо-
твердого тела F.20).
Предложение 6.6. Пусть (Q,/i) — точка в SOC) х М3. Если
орбита О 3-мерной системы F.19) через точку \± 3- или 2-мерна, то
орбита 6-мерной системы F.20) через точку (Q,ij) есть SOC) x О,
т. е. соответственно 6- или 5-мерна. Если dim О = 1, то 6-мерная
система имеет 2-мерную орбиту.
Мы опишем множества достижимости этой системы в парагра-
параграфе 8.4 после знакомства с некоторыми общими фактами о множест-
множествах достижимости.
7*
Глава 7
УПРАВЛЕНИЕ КОНФИГУРАЦИЯМИ
В этой главе мы рассмотрим приложения теоремы об орбите к
системам, управляемым с помощью изменения их конфигурации, т. е.
взаимного расположения частей системы. Хорошо известный пример
такой системы — падающая кошка. Если кошка оказывается без опо-
опоры над землей (например, падает с дерева или ее бросают), то она
начинает вращать хвостом и изгибать свое тело так, чтобы призем-
приземлиться точно на лапы независимо от первоначальной ориентации над
землей. Менее гибкие механические системы (например, собака или
просто твердое тело) так вести себя не могут. Вероятно, именно управ-
управление с помощью изменения конфигурации играет ключевую роль
в феномене падающей кошки. Мы рассматриваем простую модель
систем, управляемых таким образом, и исследуем орбиты в некоторых
простейших примерах.
7.1. Модель
Система материальных точек, т. е. распределение массы в W1, опи-
описывается неотрицательной мерой fi на W1. Мы ограничимся мера-
мерами с компактным носителем. Например, система точек xi,...,Xk G
ЕМ" с массами /ii,...,/!^ > 0 моделируется атомарной мерой fi =
к
= ^2 №г$хц где SXi — функция Дирака, сосредоточенная в точке Х{.
Можно считать точки Х{ свободными или связанными некоторыми
ограничениями в W1. Более общо, масса может быть распределена
вдоль отрезков или поверхностей различных размерностей. Поэтому
пространством состояний М систем, которые мы будем рассматри-
рассматривать, будет некоторый разумный класс мер на Мп.
Предполагается, что управляющий субъект находится внутри
конструкции и изменяет ее конфигурацию. Система консервативна,
т. е. импульс и кинетический момент сохраняются. Исследуем орбиты
систем, подчиненных таким связям.
С математической точки зрения механическая система имеет за-
законы сохранения из-за того, что у нее есть симметрии. Кинетическая
энергия рассматриваемой системы равна
L = - \х\2 dfi, G.1)
к
в частности, для атомарной меры /х = У^ Мг^ж,
к
1=1
7.1. Модель 101
Согласно теореме Нётер (см., например, [137]), если поток векторного
поля V Е VecIRn сохраняет функцию Лагранжа L, то система имеет
первый интеграл вида
—— V(x) = const.
ox
В нашем случае лагранжиан G.1) инвариантен относительно изомет-
рий евклидова пространства, т. е. трансляций и вращений в W1.
Трансляции в W1 порождаются постоянными векторными полями
V(x) = аеМп,
поэтому наша система имеет законы сохранения
(ж, a) dji = const V a G W1.
Иными словами,
х d/i = const,
т. е. центр масс системы движется с постоянной скоростью (полный
импульс сохраняется). Выберем инерциальную систему отсчета, в ко-
которой центр масс неподвижен:
/
xdji = 0.
к
Для атомарной меры /i = ^ А^ж; это равенство имеет вид
У j fiiXi = const
г=1
и сводится заменой координат вМпк закону сохранения
к
^2fiiXi = 0.
г=1
Теперь рассмотрим вращения в Мп. Пусть векторное поле
V(x) = Ax, хеЖ1,
сохраняет евклидову структуру в Мп, т. е. его поток
etv(x) = etAx
сохраняет скалярное произведение:
(etAx,etAy) = (x,y), x,yeRn.
Дифференцируя это равенство при t = 0, получаем
т. е. матрица А кососимметрична:
А* = -А.
102 Гл. 7. Управление конфигурациями
Обратно, если выполнено предыдущее равенство, то
(etA)* = etA' = e~tA = (е"),
т. е. матрица etA ортогональна. Мы доказали, что поток etA сохраняет
евклидову структуру в W1 тогда и только тогда, когда А* = —А. Ана-
Аналогично 3-мерному случаю, рассмотренному в параграфе 6.1, группа
сохраняющих ориентацию линейных ортогональных преобразований
евклидова пространства MJ1 обозначается через SO(n), а соответст-
соответствующая алгебра Ли кососимметрических преобразований W1 обозна-
обозначается через so(n). Таким образом, мы доказали, что
etA e SO(n) & А е so(n).
Вернемся к выводу законов сохранения нашей системы матери-
материальных точек. Лагранжиан L = - J \х\2 d/i инвариантен относительно
вращений в W1, поэтому из теоремы Нётер получаем интегралы вида
—— V(x) = / (ж, Ах) dfi = const, A E so(n).
OX J
к
Для атомарной меры fi = J^ fJ>i5Xi имеем
i=l
i(xi, Ax{) = const, A e so(n), G.2)
и в дальнейпгем мы ограничимся простейшим случаем, когда констан-
константа в правой части равна нулю.
Итак, имеем следующие законы сохранения для системы матери-
материальных точек ж1?..., Xk EW1 с массами /х1?..., /х&:
к
^2^iXi = 0, G.3)
к
^2fjii(xi,Axi) = 0, Aeso(n). G.4)
г=1
Пространством состояний системы является подмножество
С_ \К X ... X 1К ,
к
а допустимые траектории — гладкие кривые в М, удовлетворяю-
удовлетворяющие связям G.3), G.4). Первое равенство G.3) задает подмногооб-
подмногообразие в М\ конечно, это равенство разрешается относительно лю-
любой переменной х^ и от него можно легко избавиться, уменьшая
размерность М. Второе равенство G.4) — линейное ограничение
на скорости Х{, оно задает распределение на М. Поэтому условия
допустимости G.3), G.4) задают линейную по управлениям, пото-
потому симметричную управляемую систему на М. Отметим, что более
7.2. Две свободные точки 103
общее условие G.2) задает «аффинное распределение», а управляемая
система G.3), G.2) аффинна по управлениям, потому, вообще говоря,
не симметрична.
Мы рассмотрим только симметричный случай G.3), G.4). Тогда
орбиты совпадают со множествами достижимости. Найдем орбиты
для следующих простых систем:
1) две свободные точки: к = 2;
2) три свободные точки: к = 3;
3) ломаная с тремя звеньями в М2.
7.2. Две свободные точки
Имеем к = 2, и первое условие допустимости G.3) принимает вид
fiixi + {12X2 = 0, х±,х2 G Rn.
Исключим вторую точку:
Х\ = Ж, Х2 = — — Ж,
и запретим столкновение точек:
Тогда пространство состояний системы есть
М = W1 \ {0}.
Второе условие допустимости G.4)
fjLi(xi,Axi) + {12(х2,Ах2) = 0, A G so(n),
переписывается как
(/ii + ц\/n2) (ж, Аг) = 0, Л G so(n),
Т'6' (
= 0, А е so(n). G.5)
Это уравнение легко разрешается благодаря следующему предло-
предложению.
Упражнение 7.1. Если A G so(n), то (Ах, х) = 0 для всех х G
G Мп. Более того, для любого вектора х G W1 \ {0} пространство
{Ах\ A G so(n)} совпадает со всем ортогональным дополнением х1- =
= {l/eR»|(l/,a:> = 0}.
Поэтому ограничение G.5) означает, что
ж Л ж = 0,
т. е. скорость допустимой кривой пропорциональна вектору состояния.
Это условие задает одномерное, потому интегрируемое распределе-
распределение. Поэтому допустимые кривые имеют вид
x(t) = a(t)x@), a(t) > 0.
Орбита и множество достижимости через любую точку х G Mn \ {0}
есть луч
Ох =М+ж = {ах\ а > 0}.
104 Гл. 7. Управление конфигурациями
Точки х\, ж 2 могут двигаться вдоль неподвижной прямой в Мп,
и ориентация системы не может изменяться. Чтобы получить менее
тривиальное поведение, необходимо рассмотреть более сложные сис-
системы.
7.3. Три свободные точки
Теперь к = 3, и мы исключаем третью точку с помощью первого
условия допустимости G.3):
X = \±\Х\, у = /i2^2,
х3 = (х + у).
Чтобы запретить вырожденные конфигурации, в которых точки жх,
^2, х3 коллинеарны, будем считать, что векторы ж, у линейно незави-
независимы. Поэтому пространство состояний есть
М = {(ж, у) е Ж1 х Ж11 х А у ф 0}.
Введем обозначение
Pi = —, г = 1,2,3.
Тогда второе условие допустимости G.4) принимает форму
(ж, А((Р1 + р3)х + рз2/)) + (у, ^4((р2 + Рз)у + рз^)) = 0, А е so(n).
Оказывается, что при этом условии допустимые скорости ж, у
должны принадлеж:ать плоскости span(x,y). Это вытекает из следу-
следующего предложения.
Лемма 7.1. Пусть векторы v^w^^r] E Мп удовлетворяют ус-
условию
vAwy^O, span(i>, u>,?, 77) ф span(v,K;).
Тогда существует A G so(n) такое, что
Доказательство. Во-первых, мож:но предполож:ить, что
(v,w) = Q. G.6)
Действительно, выберем такой вектор w G span(i>, гу), что (v,w) = 0.
Тогда и> = й; + av и
(Av, 0 + {Aw, rj) = (Av, ^ + ату) + {Aw, r/),
поэтому мож:но заменить w на й.
Во-вторых, можно нормировать векторы v, w и предполож:ить, что
v| = И = 1. G.7)
Наконец, в силу симметричности условий леммы по ?, г\ можно
считать, что ? 0 span(t>,K;). Тогда
? = av + f3w + /
7.3. Три свободные точки 105
для некоторого вектора
/ _L span(i>, w).
Выберем оператор А Е so(n) такой, что
Aw = 0,
A: span(i>,/) —>• span(i>,/) обратим.
Тогда
(Av,?) + (Aw,r,) = (Av,l)^0,
т. е. оператор А искомый. ?
Эта лемма означает, что для любой пары начальных точек
(х,у) Е М все допустимые кривые Xf и у^ принадлежат плоскости
span(x,y) С W1. Поэтому мы рассматриваем ограничение нашей
системы на такую плоскость и считаем, что ж, у Е М2.
Итак, получаем следующую систему, описывающую движение
трех свободных точек:
(х, А((Р1 + Рз)х + р3у)} + (у, А((р2 + рз)у + Рзя)) = 0, Л G soB),
G.8)
(ж, у) е М = {(v, w) е М2 х R2 \ v Л w ф 0}.
Следовательно,
0
= const • I _i
V
и равенство G.8) определяет одно линейное уравнение на скорости,
т. е. распределение ранга 3 на 4-мерном многообразии М. Используя
упражнение 7.1, легко видеть, что это распределение порождено сле-
следующими тремя линейными векторными полями:
V, = ((рх + Р,)х + РЗУ) §-х = ((^ + Pf
v2 = ((Р2 + Рз)у + РзХ) JL = ^х + {°р2 + р^ = в2
где
_(Р1+Рз Рз\ п„_@ 0 ^ 1Л_A О
Для упрощения формул будем записывать 4-мерные векторы как
2-мерные столбцы. Например,
(Pi
т/ _ [ (Pi + Рз)х + РзУ \ _ \{р1 )
1 о J-^ о
106
Гл. 7. Управление конфигурациями
где
х =
= Г
У2
Наше распределение ранга 3 может иметь орбиты размерности 3
или 4. Чтобы выяснить, какая из этих возможностей реализуется,
вычислим скобку Ли:
[VI, V2\ = l-Dl,-t>2\ I
\В В 1 — I ^3 Р2 + Рз
Легко проверяется, что
Vi ЛУ2ЛУ3Л [УЬУ2] /0 ^ В1АВ2А1&А[ВъВ2]фЪ.
Мы записываем матрицы порядка 2 как векторы в стандартном базисе
пространства glB):
Тогда
det(Id, ВиВ2,[ВиВ2]) =
Следовательно, поля
Pi+Рз
рз
0
0
V3,
О
0
р3
р2 + рз
= 2р3(р1р2
р3
р2 + рз
-(pi+Рз)
-рз
р1рз
0.
^] линейно независимы всюду
на М, т. е. наша управляемая система имеет лишь 4-мерные орбиты.
Поэтому орбиты совпадают с компонентами связности пространства
состояний. Многообразие М распадается на две связные компоненты,
соответствующие положительной и отрицательной ориентации репе-
репера (х,у):
м = м+им_,
М± = {(ж, у) G R2 х R2 | det(x, у) ^ 0}.
Итак, система на М имеет две орбиты, поэтому два множест-
множества достижимости: М+ и Af_. Из любой пары линейно независимых
векторов (ж, у) G М2 х М2 достижима любая невырожденная конфи-
конфигурация (ж, у) G М2 х М2, для которой х,у Е span(x,y) и репер (ж, у)
ориентирован так же, как (ж, у).
Возвращаясь к исходной задаче для трех точек Х1,х2,хз G Мп,
получаем, что 2-мерная линейная плоскость треугольника (жх,Ж2,жз)
должна сохраняться так же, как центр масс и ориентация треугольни-
треугольника. Помимо этого, треугольник (жх,Ж2,жз) может вращаться, дефор-
деформироваться и растягиваться как угодно.
Конфигурации из трех точек, лежащие в разных 2-мерных плос-
плоскостях (или задающие противоположные ориентации в одной и той
7.4- Ломаная
107
же 2-мерной плоскости), недостижимы друг для друга: множества
достижимости из этих конфигураций взаимно не пересекаются. Впро-
Впрочем, если две конфигурации лежат в 2-мерных плоскостях, имеющих
общую прямую, то пересечение замыканий множеств достижимости
непусто: оно состоит из ко л линеарных троек, лежащих на одной пря-
прямой. Теоретически можно представить движение, переводящее одну
конфигурацию в другую: сначала три точки делаются коллинеарны-
ми в исходной 2-мерной плоскости, а затем эта коллинеарная кон-
конфигурация переводится в конечную конфигурацию в терминальной
2-мерной плоскости.
7.4. Ломаная
Рассмотрим систему из четырех материальных точек, расположен-
расположенных в вершинах трехзвенной ломаной на дву-
двумерной плоскости. Мы изучим наиболее сим- Хз
метричный случай, когда все массы единичны
и все звенья ломаной имеют единичную длину
(рис. 7.1).
Голономные ограничения для точек
яо,Я1,Ж2,яз ER2 =С
\xj -Xj-xl =
j = 1,2,3.
имеют вид
з
^2xj=0,
j=o
Поэтому
x. - Xj_x = e«i, в3 е S\ j = 1,2,3.
Положение системы определяется тремя углами (#ь#25#з)> и прост-
пространство состояний есть 3-мерный тор:
М = S1 х S1 х S1 = Т3 = {(вив2,в3)\ 0j e S1, j = 1,2,3}.
Неголономные ограничения на скорости сводятся к равенству
з
^2(ixj,Xj) = 0.
з=о
Чтобы выразить это равенство через координаты 0j, сначала обоз-
обозyj = Xj -Xj-U j = 1,2,3.
начим
Учитывая условие J^ Xj =0, получаем
з=о
УЗ
_ 2/1 _ т _ №
1 " 4 2 4 '
108 Гл. 7. Управление конфигурациями
Теперь вычислим дифференциальную форму:
з
и; =
++ d) + V4 У1 + 2 У2 + 4
V4 У1 + 2
Так как (iyj,dyk) = (егОэ,егвкс16к) = cos@j - 6k)d0k, имеем
= (| + | cos((92 - 0x) + i cos((93 -
cos((9i - 02) + 1 + i cosF>3 -
Следовательно, наша система задает распределение А = Кего;
ранга 2 на 3-мерном многообразии М = Т3. Орбиты могут быть 2-мер-
2-мерными или 3-мерными. Чтобы различить эти два случая, можно посту-
поступить, как в предыдущем параграфе: найти базис из векторных полей и
вычислить скобки Ли. Но сейчас легче исследовать интегрируемость
распределения А двойственным образом, с помощью дифференциаль-
дифференциальных форм.
Предположим, что распределение А имеет 2-мерное интегральное
многообразие N С М. Тогда
следовательно,
поэтому
0= du>q\Aq = duq\Kercjq, qeN.
В терминах внешнего произведения дифференциальных форм
(и Л duo)q = 0, q G N.
Вычислим дифференциал и внешнее произведение:
duo = sin((92 - 6>i) d01 Л d02 + sinF>3 - 62) d02 A d03 +
+ ism(e3-0i)d0
uj A duj = i (sinF>2 - 6>i) + sinF>3 - 62)) ddx Л d02 A d63.
Поэтому uo A duo = 0 тогда и только тогда, когда
Т'6' 0з = 01 G.10)
7.4- Ломаная 109
или
@1 " 02) + @3 " 02) = 7Г, G.11)
см. рис. 7.2, 7.3.
Конфигурации G.10) и G.11) трудны для управления: если ни одно
из этих равенств не выполняется, то со Л duo ф 0, т. е. система имеет
Рис. 7.2. Трудная для управ- Рис. 7.3. Трудная для управления кон-
ления конфигурация: Q\ = #2 фигурация: (#i — 62) + @з — 02) = тг
3-мерные орбиты. Если выбрать базис из векторных полей Х\, Х^ в
распределении А, то уже первая скобка [Xi,X2] линейно не зависит
от Xi, X2 в точках, где нарушаются оба равенства G.10), G.11).
Остается исследовать интегрируемость распределения А в точках
поверхностей G.10), G.11). Здесь [Х1? X2](g) Е Aq, но можно получить
неинтегрируемость А благодаря скобкам более высокого порядка.
Сначала рассмотрим двумерную поверхность
Если орбита через точку q G Р 2-мерна, то распределение А должно
касаться Р в окрестности q. Но легко видеть, что, например,
д
ТпРЭ
OV2 q
Поэтому система имеет 3-мерные орбиты через любую точку поверх-
поверхности Р.
Аналогично легко показать, что орбиты через точки второй по-
поверхности G.11) также 3-мерны.
Пространство состояний М связно, поэтому имеется единственная
орбита (и множество достижимости) — все многообразие М. Система
вполне управляема.
Глава 8
МНОЖЕСТВА ДОСТИЖИМОСТИ
В этой главе мы изучим некоторые общие свойства множеств дос-
достижимости. Мы будем рассматривать семейства векторных полей Т
на гладком многообразии М, удовлетворяющие свойству
UeqT = TqM VqeM. (8.1)
В этом случае говорят, что система Т имеет полный ранг на М 1).
Согласно аналитической версии теоремы об орбите (следствие 5.3)
орбиты систем полного ранга являются открытыми подмножествами
пространства состояний М.
Если семейство Т С VecM не имеет полного ранга, а М и Т
вещественно аналитические, то можно перейти от Т к семейству пол-
полного ранга T\q, где О — орбита Т. Поэтому в аналитическом случае
условие полного ранга (8.1) не слишком ограничительно.
8.1. Множества достижимости систем полного ранга
У систем полного ранга не только орбиты, но и множества дос-
достижимости имеют полную размерность. Более того, справедливо сле-
следующее важное утверждение.
Теорема 8.1 (Кренер). Пусть Т С VecM — система полного
ранга. Тогда ЛЧо С hit Aqo для любой точки qo Е М.
Замечание. В частности, множества достижимости за произ-
произвольное время имеют непустую внутренность:
intAqo Ф 0.
Множества достижимости могут быть:
— открытыми множествами (рис. 8.1);
— многообразиями с гладкой границей (рис. 8.2);
— многообразиями с границей, имеющей особенности — угловые
точки или точки возврата (рис. 8.3, 8.4).
Легко построить соответствующие примеры управляемых систем
(например, на плоскости).
С другой стороны, теорема Кренера запрещает следующие воз-
возможности для множеств достижимости Aqo систем полного ранга:
— подмножество М неполной размерности (рис. 8.5);
— множество, имеющее граничные точки, изолированные от внут-
внутренних точек (рис. 8.6).
г) В англоязычной литературе используется также термин bracket-gene-
bracket-generating system.
8.1. Системы полного ранга
111
Рис. 8.1. Множество достижи-
достижимости — открытое множество
..-¦¦¦¦¦¦" ;/
/¦'
! 8
-¦1-.'.
,-¦¦¦'¦'"' ]
м
Рис. 8.2. Множество достижи-
достижимости — многообразие с глад-
гладкой границей
Рис. 8.3. Множество достижи-
достижимости — многообразие с неглад-
негладкой границей
Чо
/
Л-..
м
Рис. 8.4. Множ:ество достиж:и-
мости — многообразие с неглад-
негладкой границей
Рис. 8.5. Запрещенное множест-
множество достижимости — подмножест-
подмножество неполной размерности
Рис. 8.6. Запрещенное множест-
множество достижимости — множество
с изолированными граничными
точками
Докажем теорему Кренера.
Доказательство. Зафиксируем произвольную точку
выберем любую точку q' G Aqo и покажем, что
intA
qo.
Е М,
(8.2)
112 Гл. 8. Множества достижимости
A) Существует такое векторное поле Д G Т, что fi(qf) ф 0; в
противном случае Lieg/(JF) = 0 и dimM = 0. Кривая
Sl^q'oeSlf\ siG@,ei), (8.3)
образует одномерное подмногообразие М при достаточно малых
?! > 0.
Если dimM = 1, то q' о е81*1 G int Лдо для малых s± > 0, и вклю-
включение (8.2) доказано.
B) Пусть dimM > 1. Тогда можно найти поле /2Gf и близкую
к q' точку qi на кривой (8.3) такие, что вектор /2(^1) не касается
кривой (8.3):
qx = q' о е*1-^1, t\ достаточно мало, (qi о Д) Л (gi о /2) / 0.
В противном случае dim Lieg JF = 1 в точках g, лежащих на кри-
кривой (8.3) при достаточно малых si. Тогда отображение
(si, s2) >-> q о eSl/l о eS2/2, ^ < si < ^ + еи 0 < s2 < e2, (8.4)
есть погрулсение вблизи начала координат в М^ S2, поэтому его об-
образ — двумерное подмногообразие М.
Если dimM = 2, то включение (8.2) доказано.
C) Предположим, что dim М > 2. Тогда можно найти вектор /з(д),
/з G Т, не касающийся поверхности (8.4) достаточно близко к q':
существуют t\,t\ > 0 и /3 G Т такие, что векторное поле /з не касается
поверхности (8.4) в некоторой точке q<i = q' о е*2-^1 о е*2^2. В противном
случае семейство Т не имеет полного ранга.
Отображение
(si,s2,s3) ^ q' oeSlfl о eS2h ое8з/з,
t\ < si < t\ + ег, t\<s2<t\+ s2, 0 < s3 < ?3,
есть погружение в малой окрестности начала координат в М^ S2 ,
поэтому его образ — гладкое трехмерное подмногообразие М.
Если dimM = 3, то включение (8.2) доказано. В противном случае
продолжаем рассуждение.
D) По индукции для dim M = п находим точку
(Л «2 ,п —1\ ?- тгрп — 1 ii ^ rj
(rn_1,tn_1,. . .,tn_1J G К , tn-1 > U,
и поля Д,..., fn G Т такие, что отображ:ение
(si,... ,sn) н->> g; oeSl/l о ... oeSnfn,
t%n_x < Si < t%n_x + ei, i = 1,..., n - 1, 0 < sn < en,
есть погруж:ение. Образ этого погруж:ения — n-мерное подмногообра-
подмногообразие М, т. е. открытое множество. Это открытое множество содержится
в Дд0, и его можно выбрать сколь угодно близким к точке qf. Вклю-
Включение (8.2) и теорема доказаны. ?
Из теоремы Кренера получаем следующее предложение.
8.2. Совместимые векторные поля и релаксации 113
Следствие 8.1. Пусть Т С VecM — система полного ранга.
Если АЧо(Т) = М для некоторой точки qo G М, то Aqo{T) = М.
Доказательство. Возьмем произвольную точку дЕМи по-
покажем, что она принадлежит множеству достижимости Aqo{T).
Рассмотрим систему
-jF={_y| у е F}C VecM.
Эта система имеет полный ранг, поэтому по теореме 8.1
Л(-Я с iatAqi-F) Vg e M.
Возьмем любую точку q ? int Дд(—JT) и окрестность этой точки
О§- С Лд(—J"). Так как ЛЯо{Т) плотно в М, имеем
Поэтому AqQ{T) П Aq{—Т) Ф 0, т.е. существует точка
q' eAqo{T)f\Aq(-T).
Иными словами, точку q' мож:но представить двумя способами:
qf = qooetlfl o...oetkf\ f{ G T, U > О,
qf = qo e~Sl91 о ... о е~8191, g{ G T, s{ > 0.
Умножая оба разложения справа на eSl91 о ... о е8191, получаем
q = q0o etlfl о ... о etkfk о es^z о ... о е8191 G Лдо(^),
что и требовалось доказать. П
Следствие 8.1 означает, что при исследовании управляемости мож-
можно заменять множество достижимости системы полного ранга его
замыканием. В следующем параграфе мы покажем, как можно до-
добавлять к управляемой системе новые векторные поля, не увеличивая
при этом замыкания множества достижимости.
8.2. Совместимые векторные поля и релаксации
Определение 8.1. Векторное поле / G Vec M называется сов-
совместимым с системой Т С Vec M, если
Простое условие совместимости дается в следующем утверждении.
Предложение 8.1. Пусть Т С Vec M. Для любых векторных
полей /i, /2 G Т и любых функций а\,а<2 G G°°(M), ai, a^ ^ 0, вектор-
векторное поле ai/i + 6I2/2 совместимо с системой Т.
Отсюда, учитывая следствие 5.2, получаем полезное предложение.
Следствие 8.2. Если Т С Vec M — система полного ранга та-
такая, что порожденный ею положительный конус
Г k 1
сопе(^) = < ^cufi fi еТ, аге С°°(М), а{^ 0, k G N \ С VecM
симметричен, то система Т вполне управляема.
8 А.А. Аграчев, Ю.Л. Сачков
114
Гл. 8. Множества достижимости
Предложение 8.1 вытекает из следующего сильного общего ут-
утверждения.
Теорема 8.2. Пусть неавтономные векторные поля ХТ, Уг, т G
[
, имеют компактный носитель. Пусть функция а: [0,
измерима.
Тогда существует последовательность неавтономных вектор-
векторных полей Z™ G {XT,YT}, т.е. Z™ = ХТ или YT для любых тип,
такая, что
t t
ехр [ Z^dr -> ехр Г(а(т)ХТ + A - а(
о о
равномерно по (t, q) G [0, t\]x M и равномерно со всеми производными
по q G М.
Отсюда следует предлож:ение 8.1. В случае a\(q) + a2(q) = 1 оно
получается из теоремы 8.2. Действительно, легко показать, что кри-
ос,
вые q(t) =
a2{r)f2) dr, a^t) =
= ai(q(t)), совпадают друг с другом (указание: докажите, что кри-
t
вая qo о е*(О1^1+а2^2) о exp J(—ai(r)/i — ot2{r)f2) dr постоянна). В слу-
о
чае cii(g), a2{q) > 0 мы умножаем управляющие параметры на про-
произвольную положительную функ-
функцию (это не влияет на множест-
множество достижимости за произвольное
неотрицательное время), а случай
ai(q), a2(q) ^ 0 получается пре-
предельным переходом.
Замечание. Если поля Хг,
YT кусочно непрерывны по г, то
аппроксимирующие поля Z™ в
теореме 8.2 могут быть выбраны
кусочно постоянными.
Теорема 8.2 следует из двух
Рис. 8.7. Аппроксимация потока, лемм' приведенных ниже.
теорема 8.2 Лемма 8.1. Если выполнены
условия теоремы 8.2, то сущест-
существует последовательность неавтономных векторных полей Z™ G
G {ХГ,УГ} такая, что
t t
(a(r)Xr + A - a{r))YT) dr
о о
равномерно no (t, q) G [0, ti] x M и равномерно со всеми производными
по q Е М.
t
8.2. Совместимые векторные поля и релаксации 115
Доказательство. Зафиксируем произвольное натуральное
число п. Молено выбрать такое покрытие отрезка [0, ti] подмножест-
подмножествами N
что для любых г = 1,...,7V существуют X^Yi G VecM такие, что
где К — компактный носитель полей Хт, YT. Действительно, поля
Хт, YT ограничены в норме || • ||п+1,к, поэтому они образуют пред-
компактное множество в топологии, индуцированной || • ||п,к-
Разделим множества Ei на п подмножеств равной меры:
|П| 1
Ei=U Eih \ЕЛ = -\ЕА, ij = 1,...,п.
В каждом Eij выберем подмножество Fij такое, что
Fij С Е^, \Fij\ = Г a(r)dr.
Наконец, определим следующие векторные поля:
Z™ =
(хт, т е Fi:j,
т \YT, TGEijXFij.
Тогда легко видеть, что последовательность полей Z™ искомая. ?
Теперь докажем вторую часть теоремы 8.2.
Лемма 8.2. Пусть неавтономные векторные поля Z™, п =
= 1,2,..., и ZT, r G [0,?i], ограничены по г и имеют компактный
носитель. Если
t t
то
Z™ dr —)> ZT dr, n -^ oc,
о о
exp / Z™ dr —> exp / ZT dr, n —>
где оба предельных перехода равномерны по (t,q) G [0, ti] x M и рав-
равномерны со всеми производными по q G М.
Доказательство. A) Сначала докажем утверждение в слу-
случае ZT = 0. Обозначим поток
t
116 Гл. 8. Множества достижимости
Тогда f
Ptn=Id+ f P?oZ?dr =
о
(интегрируем по частям)
= Id+Ptno fz?dr- f(p?oZ?o ГZ%
о о о
t
Так как J Z™ dr —> О, последние два члена в предыдущем разложении
о
стремятся к нулю, поэтому
Рр -> И,
что доказывает утверждение леммы в случае ZT = 0.
B) Рассмотрим общий случай. Разложим векторные поля после-
последовательности:
Z? = Zr + V;n, /Vrndr->>0, n^oc.
о
t
Обозначим Р™ = exp / V™ dr. Из формулы вариаций получаем
о
t t t
^dr = ^ [ (Frn + ZT) dr = exp Г AdPrn ZT dr о Р/\
exp
0 0 0
По части A) этого доказательства Р™ —>- Id, следовательно, Ad Ptn
->> Id, откуда ^ ^
exp / Z™ dr ^ exp / Zr c/r,
о о
что и требовалось доказать. ?
Итак, мы доказали теорему 8.2, а потому и предложение 8.1.
8.3. Устойчивость по Пуассону
Определение 8.2. Пусть / G Vec M — полное векторное поле.
Точка q G М называется устойчивой по Пуассону для поля /, если
для любого t > 0 и любой окрестности Oq точки q существуют точка
q' G Oq и момент времени t' > t такие, что qf о ef f E Oq.
То есть все траектории не могут навсегда покинуть окрестность
устойчивой по Пуассону точки, некоторые из них обязаны возвра-
возвращаться в эту окрестность в сколь угодно далеком будущем.
Замечание. Если траектория q о ег? периодическая, то точ-
точка q устойчива по Пуассону для поля /.
8.3. Устойчивость по Пуассону 117
Определение 8.3. Полное векторное поле / G VecM назы-
называется устойчивым по Пуассону, если все точки многообразия М
устойчивы по Пуассону для /.
Условие устойчивости по Пуассону кажется довольно ограничи-
ограничительным, но тем не менее в приложениях оно часто выполняется (см.
ниже теорему Пуанкаре).
Выясним, что означает устойчивость по Пуассону для задачи уп-
управляемости.
Предложение 8.2. Пусть Т С Vec M — система полного ран-
ранга. Если векторное поле f G Т устойчиво по Пуассону, то поле — /
совместимо с системой Т.
Доказательство. Зафиксируем произвольную точку go G М
и момент времени t > 0. Чтобы доказать предложение, аппроксими-
аппроксимируем точку д0 °е~^ достижимыми точками.
Так как система Т имеет полный ранг, можно выбрать открытое
множество W С int Aqo (J7) сколь угодно близко к до • Тогда множество
W о е~1? будет близким к точке до о е~*Л
В силу устойчивости по Пуассону существует tf > t такое, что
0 ф (W о e~tf) о et>f П W о e~tf = Wo e^-t)f П W о e~tf.
Но W о e^'-^f С AqQ{T), поэтому
Aqo{T)C\W oe~tf ф0.
Итак, в любой окрестности точки go ° е~^ имеются точки мно-
множества достижимости Aqo{T), т.е. до ° е~^ ^ Aqo{T). ?
Теорема 8.3 (Пуанкаре). Пусть М — гладкое многообразие с
формой объема Vol. Пусть векторное поле f G VecM полно, а его
поток е1^ сохраняет объем. Пусть W С М, W С int W, есть под-
подмножество конечной меры, инвариантное относительно /:
Yo\(W) < oo, W о etf С W Ш > 0.
Тогда все точки множества W устойчивы по Пуассону для
поля f.
Доказательство. Возьмем любую точку д G W и любую ее
окрестность О С М конечного объема. Множество V = W П О содер-
содержит непустое открытое подмножество int W П О, поэтому Vol(V) > 0.
Чтобы доказать теорему, мы покажем,что
V о е* * HV ф 0 для некоторых больших ?'.
Зафиксируем любое t > 0. Все множества У о entf, п = 0,1,2,...,
имеют один и тот же положительный объем, поэтому некоторые из
них должны пересекаться. Действительно, если бы
V о entf П У о emt/ = 0 Vn, га = 0,1, 2,...,
118 Гл. 8. Множества достижимости
то Vol(W) = оо, так как все эти множества содержатся в W. Следова-
Следовательно, существуют неотрицательные целые числа п > т такие, что
V о entf П V о emtf ф0.
Умножая это неравенство справа на e~mtf, получаем
Поэтому точка q устойчива по Пуассону для /, и теорема доказа-
доказана. ?
Векторное поле называется консервативным, если его поток со-
сохраняет объем.
Напомним, что векторное поле на W1 = {(#i,..., хп)} консерватив-
консервативно, т. е. сохраняет стандартный объем Уо1(У) = J dx\ ... dxn тогда и
только тогда, когда это оно бездивергентно:
г=1 г=1
8.4. Управляемое твердое тело: мнолсества
достилсимости
Применим полученные общие результаты к управляемой систе-
системе F.20), описывающей вращения твердого тела:
), (Q,M)eSOC)xK3, (8.5)
По предложению 8.1, векторное поле / = -(/ + д) Н— (/ — д) совмес-
совместимо с системой (8.5). Покажем, что это поле устойчиво по Пуассону
на SOC) xM3.
Сначала рассмотрим векторное поле /(Q,/i) на большем прост-
пространстве Mq х М3 где Mq — пространство всех матриц порядка 3.
Имеем div(g5At) / = 0, поэтому поле / консервативно на Мд х М3 .
Далее, так как первая компонента поля / линейна по Q, она удов-
удовлетворяет следующему свойству левоинвариантности по Q:
К) \ц J \ih у (8.6)
В силу этого свойства поле / имеет компактные инвариантные мно-
множества в Мд х М3 вида
W = (SOC)K) х {(fi,fi) ^ С}, Кш Щ, К с ЫК, С > 0,
8.4¦ Управляемое твердое тело: множества достижимости 119
так что W С int W. По теореме Пуанкаре поле / устойчиво по Пуассо-
Пуассону на всех этих множествах W, а потому и на Mg x М3. Ввиду свойства
инвариантности (8.6), поле / устойчиво по Пуассону и на SOC) x ~М?.
Так как поле / совместимо с системой (8.5), противоположное
поле — / также с ней совместимо. Следовательно, и векторные поля
±g=(f±g)-f
совместимы с этой системой.
Итак, все векторные поля симметричной системы
совместимы с исходной системой. Поэтому замыкания множеств дос-
достижимости исходной системы (8.5) и расширенной системы span(/, g)
совпадают.
Пусть исходная система имеет полный ранг. Тогда и симметричная
система span(/, g) имеет полный ранг, следовательно, является вполне
управляемой. Поэтому в случае пол-
полного ранга исходная система (8.5)
вполне управляема.
В случае неполного ранга множест-
множества достижимости имеют более слож-
сложную структуру. Если / совпадает с
главной осью инерции, то орбиты сис-
системы (8.5) совпадают со множествами
достижимости. В случае / Е П± \ Ме2
это уже не так. Это легко видеть по
фазовому портрету векторного поля
/(/i) =/ix /3/jL в плоскости П±: пря-
прямая Ме2 состоит из положений равно-
равновесия /, а в полуплоскостях U± \ Me 2
траектории / — полуокружности с
центром в начале координат (рис. 8.8).
Поле / неустойчиво по Пуассону в
плоскостях П±. Случай / Е П± \ Me 2 отличается от случая полного
ранга из-за того, что под действием поля / 3-мерный объем в М3
сохраняется, а 2-мерный объем в инвариантных плоскостях П± — нет.
Подробный анализ задачи управляемости в случае неполного ран-
ранга проведен в работе [65].
Рис. 8.8. Фазовый портрет по-
поля /|п при I Е П± \ Мв2
Глава 9
ЭКВИВАЛЕНТНОСТЬ УПРАВЛЯЕМЫХ
СИСТЕМ ПО СОСТОЯНИЮ И ОБРАТНОЙ
СВЯЗИ
9.1. Эквивалентность по обратной связи
Рассмотрим управляемую систему
q = f(q,u), qeM, и G U. (9.1)
Будем предполагать, что не только М, но и U есть гладкое много-
многообразие. От правой части системы будем требовать, чтобы для всех
фиксированных и EU правая часть f(q,u) была гладким векторным
полем на М, а отображение
(u,q) ^ f(q,u)
было гладким. В качестве допустимых управлений будем брать изме-
измеримые локально ограниченные отображения
t ^ u(t) G U,
для простоты можно также рассматривать кусочно непрерывные
управления. При подстановке такого управления u(t) в управляемую
систему (9.1) получается неавтономное дифференциальное уравнение
q = f(q,u(t)) (9.2)
с правой частью гладкой по q и измеримой, локально ограниченной
по t. Для таких ОДУ справедлива стандартная теорема существова-
существования и единственности решений, по крайней мере локальная. Реше-
Решения д(-) дифференциального уравнения (9.2) липшицевы кривые в М
(см. п. 2.4.1).
В параграфе 5.7 мы уже рассматривали преобразования состояния
управляемых систем, т. е. диффеоморфизмы М. Преобразования со-
состояния отображают траектории управляемых систем в траектории, с
тем же управлением. Сейчас мы рассмотрим новый класс преобразо-
преобразований обратной связи, также переводящий траектории в траектории,
но, возможно, с новым управлением.
Обозначим пространство новых управляющих параметров через U
и будем предполагать, что это гладкое многообразие.
Определение 9.1. Пусть (р: М х U —>- U есть гладкое отобра-
отображение. Преобразование вида
f(q,u)\-+ f(q,<f(q,u)), q G M, и G U, ueU,
называется преобразованием обратной связи.
Замечание. Преобразование обратной связи перепараметризу-
перепараметризует управление и некоторым способом, зависящим от состояния q.
Легко видеть, что любая допустимая траектория д(-) новой сис-
системы q = f(q,(p(q,u)), соответствующая управлению й(-), является
9.2. Линейные системы 121
также допустимой и для исходной системы q = /(g, и) с управлени-
управлением и(-) = (p(q(-),u(-)), хотя обратное, вообще говоря, неверно.
Чтобы получить обратное соответствие, будем рассматривать об-
обратимые преобразования обратной связи, для которых
U = U, <p\qxUeDiSU.
Такие отображения <р: М х U —> U порождают преобразования об-
обратной связи
f(q,u) ^ f(q,<p(q,u)).
Соответствующие управляемые системы
Q = f(Q,u) и q = f(q,<p(q,u))
называются эквивалентными по обратной связи.
При работе с управляемой системой естественно пытаться упрос-
упростить ее преобразованиями состояния и обратной связи.
Замечание. В математической физике преобразования обрат-
обратной связи называются калибровочными преобразованиями.
Далее в этой главе будем рассматривать только аффинные по
управлению системы
к
я = /(<?) + X) имк)> и = К' ...,uk)eR\ qeM. (9.3)
г=1
К таким системам естественно применять преобразования обратной
связи, аффинные по управлению:
y> = (pi,...,pfc): MxRk ^R\
к
<Pi(q,u) = ci(q) + ^2dij(q)uj, i = l,...,fc. (9.4)
i=i
Поставим себе задачу охарактеризовать аффинные по управле-
управлению системы (9.3), локально эквивалентные линейным управляемым
системам относительно преобразований состояния и обратной свя-
связи (9.4), и классифицировать их относительно этого класса преоб-
преобразований.
9.2. Линейные системы
Рассмотрим сначала линейные управляемые системы
к
х = Ах + ^щЪи xeRn, u=(uu...,uk)eRk, (9.5)
где А — матрица порядка п, аб^, г = 1,. ..,&, — векторы в Rn. Будем
предполагать, что векторы fei,..., b^ линейно независимы:
dimspan(fei,..., Ь^) = &,
122 Гл. 9. Эквивалентность по состоянию и обратной связи
этого всегда можно добиться исключением некоторых векторов Ь{.
Найдем нормальные формы линейных систем относительно преобра-
преобразований состояния и обратной связи.
К линейным системам (9.5) применяем преобразования обратной
связи, которые имеют вид (9.4) и, более того, сохраняют линейную
структуру:
Обозначим через D: span(&i,..., bk) —>- span(&i, ...,&&) линейный опе-
оператор с матрицей (dij) в базисе &i, ...,&&. Линейные преобразования
обратной связи (9.4), (9.6) действуют на векторные поля в правой
части линейной системы (9.5) следующим образом:
{Ах, Ъи ..., bk) ^ I Ах + ^(ci, x)bi, Dbu...,Dbk\. (9.7)
Это отображение должно быть обратимым, поэтому будем предпола-
предполагать оператор D обратимым.
Линейные преобразования состояния действуют на линейные сис-
системы следующим образом:
{Ах, &ь..., Ък) н> {САС~хх, СЬЪ ..., СЬк) , (9.8)
где С: W1 —>• W1 — обратимый линейный оператор. Эквивалентность
линейных систем по состоянию означает, что эти системы имеют оди-
одинаковые координатные представления в подходящих базисах в прост-
пространстве состояний W1.
9.2.1. Линейные системы со скалярным управлением. Рас-
Рассмотрим простую модельную линейную систему
п-1
т(п) JL \ Л п/.Т(*) — 7/ 7/ G- 1R тСЦ (Q п\
где ao,... ,an-i Gl. Перепишем эту систему в стандартной форме в
переменных Х{ = х^г~1\ г = 1,..., п:
dj\ — dj2i
xn_i = хп и G Ш х = (х\ ... хп) G W1. (9.10)
п-1
г=0
п-1
Если взять — J2 <%iXi+i + и в качестве нового управления, т. е.
применить преобразование обратной связи (9.4), (9.6) с
к = 1, с= (-ао,...,-ап-1), d=l,
9.2. Линейные системы 123
то система (9.10) перейдет в систему
! = ж2,
'''-' ие^ х= (Хи...,хп) eW1, (9.11)
п — \ — %гп
< хп и,
которая в скалярном виде записывается как
ж(п) =щ ueR, х е R. (9.12)
Итак, система (9.10) эквивалентна системе (9.11) по обратной
связи.
Оказывается, что простые системы (9.10) и (9.11) являются соот-
соответственно нормальными формами управляемых линейных систем
относительно преобразований состояния и преобразований состояния
и обратной связи.
Предложение 9.1. Любая управляемая линейная система со
скалярным управлением
x = Ax + ub, ueR, xeW1, (9.13)
span^,^,...,^-1^ =Mn, (9.14)
эквивалентна по состоянию системе (9.10), а потому эквивалентна
по состоянию и обратной связи системе (9.11).
Доказательство. Отыщем базис е\,..., еп в W1, в котором
система (9.13) записывается в виде (9.10). Координаты yi,..., уп точ-
точки х G Мп в базисе ei,..., еп находятся из разложения
Исходя из требуемого вида системы (9.10) получаем, что вектор Ъ
должен иметь координаты Ъ = @,..., 0,1)*; поэтому базисный вектор
с номером п определен однозначно:
еп = Ъ.
Найдем остальные базисные векторы ei,..., en_i. Нашу линейную
систему (9.13) можно переписать в виде
х = Ах (тос
Тогда в координатах получаем
п
^ Aei (m0
г=1 г=1
поэтому
J п-1 п-1
V^ у{е{ = V^ yi+^Aei+i (modIR6).
г=1 г=0
Требуемые дифференциальные уравнения
& = 2/*+ъ г = 1,...,гг- 1,
124 Гл. 9. Эквивалентность по состоянию и обратной связи
выполняются в некотором базисе ei,..., еп тогда и только тогда, когда
справедливы равенства
Aei+i = ei + fab, г = 1,..., п — 1, (9.15)
Аех = /30Ь (9.16)
для некоторых чисел /Зо,..., Pn-i Е М.
Остается показать, что можно подобрать базисные векторы ei,...
... ,en_i, удовлетворяющие равенствам (9.15), (9.16). Перепишем ра-
равенство (9.15) в виде
d = Aei+1 - Cib, i = l,...,n-l, (9.17)
откуда последовательно получаем
еп = Ь,
en_i = АЬ - )Sn_i6,
еп-2 = АЧ - pn-tAb - /Зп_26, (9.18)
ei = An~Lb - ft_iAu-^ -
Итак, из равенства (9.16) следует, что
Aei = Anb - Pn_iAn~1b — ... ¦
Равенство п_1
Anb = ^^ PiAlb (9.19)
г=0
удовлетворяется на единственном наборе (Д), • • • ,/3n_i), так как век-
векторы 6, АЬ,..., Ап~1Ь образуют базис W1 (на самом деле Д — коэф-
коэффициенты характеристического многочлена оператора А).
Векторы ei,...,en, построенные по равенствам (9.18) с этими
коэффициентами Д, образуют искомый базис. Действительно, ра-
равенства (9.15), (9.16) выполняются по построению. Векторы ei,..., еп
линейно независимы по условию управляемости (9.14). ?
Замечание. Базис ei,..., еп, построенный в предыдущем до-
доказательстве, единствен, поэтому преобразование состояния, приво-
приводящее управляемую линейную систему со скалярным управлени-
управлением (9.13) в нормальную форму (9.10), также единственно.
9.2.2. Линейные системы с векторным управлением. Те-
Теперь рассмотрим управляемые линейные системы с векторным управ-
управлением
i=i
Напомним, что векторы &!,...,&& предполагаются линейно независи-
независимыми.
В случае к = 1 все управляемые линейные системы в Мп экви-
эквивалентны по состоянию и обратной связи нормальной форме (9.11),
9.2. Линейные системы 125
поэтому при фиксированной размерности п инвариантов по состоя-
состоянию и обратной связи нет. В случае к > 1 это не так, и мы начнем с
описания инвариантов по состоянию и обратной связи.
1. Индексы Кронекера. Рассмотрим следующие подпространства
BRn:
Dm = span {Ajbi | j = 0,..., m - 1, i = 1,..., k}, m = 1,..., n.
(9.22)
Обратимые линейные преобразования состояния (9.8) сохраняют раз-
размерности этих подпространств, поэтому числа
dimL>m, m = l,...,n,
являются инвариантами по состоянию.
Теперь покажем, что обратимые линейные преобразования обрат-
обратной связи (9.7) сохраняют пространства D171. Любое такое преобразо-
преобразование можно разложить на два преобразования обратной связи вида
{Ах, Ъъ ..., Ък) н-> ( Ах + ^(ъ, х)Ьи Ъъ ..., Ьк ), (9.23)
^ г=1 ^
{Ах, Ъъ ..., Ък) -> {Ах, Dbu..., Dbk). (9.24)
Очевидно, что преобразования (9.24), т. е. замены ^, сохраняют прост-
пространства D171. Рассмотрим преобразования (9.23). Обозначим новую
матрицу:
Ах = Ах + ^(ci, x)bi.
г=1
Имеем ^
Ajx = Ajx (modDj), j = 1,... ,n - 1.
Ho Dm~1 С Dm, 7?г = 2,..., n, следовательно, преобразования обрат-
обратной связи (9.23) сохраняют пространства Dm, т = 1,..., п.
Итак, пространства D171, т = 1,... ,гг, инвариантны относительно
преобразований обратной связи, а их размерности — инварианты пре-
преобразований состояния и обратной связи.
Выразим числа dimDm, т = 1,..., п, через другие — так назы-
называемые индексы Кронекера. Построим следующую (п х /с)-матрицу,
элементы которой суть n-мерные векторы:
Ъг ... Ък
Ah:::Abk
4i ...A"J
Заменим каждый вектор A3bi, j = 0,..., п — 1, г = 1,..., к, в этой
матрице символом (крестиком х или ноликом о) по следующему пра-
правилу. Будем двигаться в матрице (9.25) по строкам, т. е. упорядочим
ее элементы следующим образом:
h, ..., Ьк, Ah, • ¦ •, АЬк, ..., Ап~1Ъъ ..., Ап~Чк. (9.26)
126 Гл. 9. Эквивалентность по состоянию и обратной связи
Вектор А3Ь{ в матрице (9.25) заменяем крестиком, если он линейно
независим от предыдущих векторов в цепочке (9.26), в противном слу-
случае заменяем этот вектор ноликом. После этой процедуры получаем
матрицу вида
'X X X X ... Х\
X о X X ... о
Е = I X о о X ... о
о о X ... о/
Отметим, что имеются некоторые ограничения на появление крести-
крестиков и ноликов в матрице Е. Общее количество крестиков в этой мат-
матрице равно п (по условию управляемости (9.21)), и вся первая строка
заполнена только крестиками (так как &]_,...,&& линейно независимы).
Далее, если столбец матрицы Е содержит нолик, то все элементы
ниже его также нолики. Действительно, если вектор А3Ь{ в (9.25)
заменяется ноликом в Е, то
A3hi e span {A3ba \ a < г} + span {A^ba \ /3 < j, a = 1,..., k].
Но тогда аналогичные включения справедливы для всех векторов
А?+1^, ..., An~1bi, т. е. ниже нолика стоят только нолики. Итак, каж-
каждый столбец матрицы Е состоит из столбца крестиков над столбцом
ноликов (столбец ноликов может отсутствовать).
Обозначим через п\ высоту самого высокого столбца крестиков
в матрице Е, через n<i высоту второго по высоте столбца крестиков
и т. д., наконец, через пк обозначим высоту самого низкого столбца
крестиков в Е. Полученные натуральные числа
п\ ^ п2 ^ ... ^ пк
называются индексами Кронекера линейной системы (9.20). Так как
общее количество крестиков в матрице Е равно размерности прост-
пространства состояний, получаем равенство
Более того, по построению имеем
span(bi, Abu ¦ ¦ ¦, А^-Чг- ... ; Ьк, АЬк,..., АПк-гЪк) = Rn. (9.27)
Покажем, что индексы Кронекера щ выражаются через размер-
размерности diimD1. Имеем
1 = к = числу крестиков в первой строке Е,
dimZ) = числу крестиков в первых двух строках Е,
= числу крестиков в первых г строках Е,
9.2. Линейные системы 127
так что
Д(г) и= dimD* — dimD* = числу крестиков в г-й строке Е.
Переставим столбцы матрицы Е: поставим самый высокий столбец
на первое место, второй по высоте столбец на второе место и т.д.
Получаем (п х /с)-матрицу в блочно-треугольной форме. Эта матрица,
повернутая на угол тг/2, есть подграфик функции А: {1,...,п} —>•
—>• {1,..., к}. Легко видеть, что величины индексов Кронекера равны
точкам скачков функции А, а количество этих индексов для каждой
величины равно высоте соответствующего скачка А.
Итак, индексы Кронекера выражаются через dimZ)*, г = 1,..., к,
поэтому они являются инвариантами по состоянию и обратной связи.
2. Нормальная форма Бруновского. Найдем нормальные формы
линейных систем под действием преобразований состояния, а так-
также состояния и обратной связи. В частности, покажем, что индексы
Кронекера образуют полный набор инвариантов линейных систем по
состоянию и обратной связи.
Теорема 9.1. Любая управляемая линейная система (9.20),
(9.21) с к управляющими параметрами эквивалентна по состоянию
системе вида
7\i _ 7Д
У\ — У2->
1
1—1 Уп\ '
1 -- Е
Ук 1 = Ук ,
„',к — \ ~.к 3
Z^ "*J
<*iiVi+i
Упг =
°^nj~1 - — ' (9.28)
где ^-^ . .
х= V у)е), (9.29)
и эквивалентна по состоянию и обратной связи системе вида
(9.30)
где щ, г = 1,..., /с, суть индексы Кронекера системы (9.20).
Система (9.30) называется нормальной формой Бруновского ли-
линейной системы (9.20).
Доказательство. Покажем сначала, что любую управляе-
управляемую линейную систему (9.20) можно записать в подходящем базисе
в ^П 1 1 . . к к
в канонической форме (9.28).
128 Гл. 9. Эквивалентность по состоянию и обратной связи
Действуем в точности, как в случае скалярного управления
(п. 9.2.1). Требуемая каноническая форма (9.28) однозначно опре-
определяет последние базисные векторы во всех к группах:
<=ЬЬ ..., екПк=Ьк. (9.32)
Обозначим пространство В = spanFi,...,&&). Тогда наша система
х = Ах (mod В)
записывается в координатах как
i= Е уН= Е у)Ае) (
Учитывая требуемые уравнения
У) = 2/J+i' 1
Е Унг4= Е 2/Й4
имеем
или, что равносильно
Е !/je E
!/jei-i= E y^ei (modВ).
Итак, искомые базисные векторы обязаны удовлетворять следую-
следующим соотношениям:
Ае) = е)_1 (modS), 1 ^ г ^ к, 2 ^ j <: щ, (9.33)
Ае[ = 0 (modS), 1 ^ г ^ к. (9.34)
Будем последовательно разрешать уравнения (9.33), начиная с (9.32),
для всех г = 1,..., к:
7=1
к
7=1 7=1
7=1 7=1
в то время как из (9.34) следует, что
к
7=1
9.3. Линеаризуемостъ по состоянию и обратной связи 129
для некоторых чисел /3^-, 1 ^ i ^ к, 0 ^ j ^ щ, 1^7^^- Получаем
уравнение
ап% = ?/з7П(_ип*-ч + ¦¦¦+Е^7-
7=1 7=1
имеющее единственное решение относительно 0J ¦ в силу усло-
условия (9.27).
Итак, мы доказали, что существует единственное линейное пре-
преобразование состояния, приводящее управляемую линейную систе-
систему (9.20) к каноническому виду (9.28).
Выбирая в качестве новых управлений функции
- Yl alijVi+i+uii 1 = 1,...,к,
видим, что каждая из к подсистем в (9.28) эквивалентна по обратной
связи системе вида (9.11), или, что то же самое, системе вида (9.12).
Поэтому вся система (9.20) эквивалентна по состоянию и обратной
связи нормальной форме Бруновского (9.30). ?
9.3. Линеаризуемость по состоянию и обратной связи
Рассмотрим аффинную по управлениям нелинейную систему
к
Q = f@) + ^Щ9э{я)> и = (ии ... ,ик) в Rk, q G M. (9.35)
Для нелинейных систем естественно задать локальный вопрос: при
каких условиях система (9.35) локально эквивалентна по состоянию
и обратной связи управляемой линейной системе?
Определение 9.2. Система (9.35) называется локально экви-
эквивалентной по состоянию и обратной связи линейной системе (9.20)
в окрестности точки qo G М, если существуют преобразование состоя-
состояния — диффеоморфизм
Ф: Oqo -+ 6 С W1
из окрестности Oqo точки до в М на открытое подмножество О С Мп,
и преобразование обратной связи
<р: Oqo xRk -^Rk,
/ai(g)\
<p(q,u)= ••• +D{q)u, (9.36)
\ak{q)J
с обратимой и гладко зависящей от q матрицей
D(q) = (dij(q)), ij = 1,..., fc,
9 А.А. Аграчев, Ю.Л. Сачков
130 Гл. 9. Эквивалентность по состоянию и обратной связи
такие, что преобразование состояния и обратной связи (Ф, if) перево-
переводит систему (9.35), ограниченную на Oqo, в линейную систему (9.20),
ограниченную на О.
Конструкция подпространств D171 (9.22) выдерживает обобщение
на случай нелинейных систем (9.35): достаточно рассмотреть семейст-
семейства подпространств
Г>™ = span {(ad f)Jgi(q) | j = 0,..., т - 1, г = 1,..., к} С TqM.
Заметим, что, вообще говоря, dimD™ ф const, поэтому семейство D171
может не быть распределением.
Отметим, что в случае управляемой линейной системы (9.20) се-
семейство D™ = Dm, xGRn, обладает следующими свойствами:
1) dimL>™ = const;
2) D^ = TxRn-
3) распределения Dm, m = 1,...,п, интегрируемы (так как они
порождаются постоянными векторными полями AJhi).
Перед тем как сформулировать условия линеаризуемости нелиней-
нелинейных систем по состоянию и обратной связи в терминах семейств D™,
докажем следующие свойства этих семейств.
Лемма 9.1. Если семейства Dm, т = 1,..., п, инволютивны,
то они инвариантны относительно преобразований обратной связи.
Доказательство. Отметим сначала, что преобразования об-
обратной связи (9.36) можно представить как композицию преобразова-
преобразований двух типов:
(f,gi,...,gk) ^ (/ + ^^-,^1,...,^), (9.37)
(/,31, ...,дк)^ (f,Dgu .. .,Dgk), (9.38)
где D(q) = (dij(q)), i,j = 1, ...,&, обратимы и гладко зависят от q. A
теперь докажем лемму индукцией по т.
Пусть т = 1. Очевидно, что семейство
D1 = span{^| г = l,...,fc}
сохраняется обоими типами преобразований (9.37) и (9.38).
Шаг индукции: предположим, что утверждение доказано для т —
— 1, и докажем его для т. Семейство
Dm = {[/, X] | X е D™'1} + D™'1
сохраняется преобразованиями (9.38). Рассмотрим преобразование ви-
вида (9.37). Имеем
[f + aj9j,X] = [f,X] - [X,ajgj] = [f,X] - (Xaj)9j - aj[X,9j].
Далее,
ХеГ =*> [f,X] GDm,
(xaj)gj eD'c Dm,
X e Dm~\ gj e D1 С Dm~l =Ф [X,gj] G Dm~l С Dm,
9.3. Линеаризуемостъ по состоянию и обратной связи 131
поэтому
[/ + ajgj, X] е Dm V X е Dm-\
Итак, семейство D171 сохраняется преобразованиями обратной свя-
связи вида (9.37). П
Теорема 9.2. Система (9.35) локально эквивалентна по сос-
состоянию и обратной связи управляемой линейной системе (9.20) тог-
тогда и только тогда, когда:
1) dimD™, т = 1,..., п, не зависит от q, т. е. семейства Dm —
распределения;
2) Dnq = TqM-
3) распределения Dm, m = 1,... ,п, инволютивны.
Условия 1)-3) необходимы для локальной эквивалентности по сос-
состоянию и обратной связи, это следует из рассуждения перед лем-
леммой 9.1.
Мы докажем достаточность в теореме 9.3 ниже только в случае
скалярного управления. Для к = 1 получаем систему
q = f(q) + ug(q), we к, чем, (9.39)
и соответствующие семейства подпространств
D™ = span{(ad/)^(g)| г = 0,1,..., т - 1}, т = l,...,n, q G М.
Оказывается, что в этом случае из инволютивности Dn~1 следует
инволютивность D171 для меньших т.
Теорема 9.3. Система (9.39) локально эквивалентна по сос-
состоянию и обратной связи управляемой линейной системе (9.13)
тогда и только тогда, когда:
1) ?>J = TqM-
2) распределение Dn~1 инволютивно.
Сначала докажем следующее предложение, имеющее самостоя-
самостоятельное общее значение: интегральные многообразия интегрируемых
распределений допускают гладкую параметризацию.
Лемма 9.2. Пусть А = span {Xl, ..., Xj~} — интегрируемое рас-
распределение на гладком п-мерном многообразии М, dim Aq = k.
Тогда для любой точки qo Е М существуют окрестность до ?
G Oqo С М и гладкая вектор-функция (р: Oqo —>• Wn~k такие, что:
1) rank^ = п- k, q e Oqo;
2) (р~г(у) есть интегральное многообразие А для любого у G
G (f(Oqo), или, что равносильно,
2') ker^q = Aq, qeOqo.
Доказательство. Дополним векторные поля Х\,..., Х^ до
базиса:
span {Yi,..., yn_fe, Хь ..., Xk} = Vec Ogo
132 Гл. 9. Эквивалентность по состоянию и обратной связи
в достаточно малой окрестности до ? Oqo С М. Рассмотрим отобра-
отображение
ф: (t,s) ^ q0 о etlYl о ... о егп-кУп-к о esi^i о ... о eSfeXfe,
*=(*!,..., tn_fc) G Mn-fc, e = (8i,...,8fe)eRfc.
Имеем
о
7 — 1 П — h
поэтому ^ — локальный диффеоморфизм в окрестности О G Mn.
Далее, при фиксированном t = t множество
есть интегральное многообразие А.
Наконец, по теореме о неявной функции локально определено
гладкое отображение
(р: i/j(t, s) \-> t.
Это и есть искомая вектор-функция. ?
Докажем теорему 9.3.
Доказательство. Необходимость уже показана а рассужде-
рассуждении перед леммой 9.1: для управляемых линейных систем выполняют-
выполняются оба условия 1), 2).
Чтобы доказать достаточность, построим координаты, в которых
наша система (9.39) принимает простую форму, а затем применим
преобразование обратной связи, приводящее эту систему к нормаль-
нормальной форме (9.11).
В силу интегрируемости распределения Dn~1 из леммы 9.2 следует
существование гладкой функции
<рг: Oqo -+ R
такой, что
<*,?! ^ 0, (dq<p1,D%-1)=0, qeOqo. (9.40)
Определим следующие функции в окрестности Oqo:
V2 = fipi = (d<puf),
•n-1,
(повторные производные по направлению векторного поля /).
Мы утверждаем, что функции <^i,... ,<^п (которые и будут ко-
координатами, в которых система (9.39) упрощается) удовлетворяют
9.3. Линеаризуемостъ по состоянию и обратной связи 133
равенствам
fo, j + 1 < гс,
0 1 I / Y1
Во-первых, заметим, что Ъ = (ad /) #<?iU ф 0. Действительно,
имеем
D^1 = span {g(q),..., (ad/)"^)},
TqM = span {g(q),..., (ad /Г^)} = span {?>J-\ (ad /Г
поэтому равенство (ad/)n~1^(^i(g) = 0 несовместно со свойства-
свойствами (9.40).
Теперь докажем (9.41) индукцией по /. В случае 1 = 1 доказывать
нечего.
Предположим, что равенство (9.41) доказано для 1-1 и докажем
его для L Имеем
= ((ad/)'fl о / - / о (ad/Уд + / о
= (-[/, (ad/Уд] + / о (ad/)
= (-(ad/y+1g +/о (ad/У
Если j + / ^ п, то j + / — 1 < п, и (ad /)•?gpi-i = 0 по предположению
индукции. Поэтому
(ckdfKg(pi = -(ad/)-^1^/-! при j + / ^ п,
и равенство (9.41) для / следует из этого же равенства для 1 — 1.
Итак, равенство (9.41) доказано для всех /. Так как векторы
g(q), • • •, (aJdf)n~1g(q) порождают касательное пространство TqM при
q G Ogo, отображение
\4>п)
есть локальный диффеоморфизм: дифференциалы dq(pi,..., б/д(^п об-
образуют базис в Т*М, двойственный к g(q),..., (ad/)n-1^(g) G TgM.
Возьмем Ф в качестве координатного отображения, тогда точка
q G М имеет координаты
xi = <fi(q), / = 1,...,п.
Запишем нашу систему q = f(q) + ад(д) в этих координатах, для этого
продифференцируем ж/ в силу этой системы.
— xi = — <pi(q(t)) = (/ + ug)(fi = f(fi +
134 Гл. 9. Эквивалентность по состоянию и обратной связи
Если / < п, то g(pi = 0 в силу равенства (9.41), поэтому
= 1,..., п - 1.
Если лее / = п, то
j~txn = f<Pn
Итак, в координатах xi,... ,хп наша система (9.39) записывается
в виде
n = iVn =Ь izb, 6 = д(рп ф 0.
Хп = f(fn ±ub.
Теперь рассмотрим преобразование обратной связи
После этого преобразования n-я компонента нашей системы превра-
превращается в уравнение
Хп = f<fn ± (Т b~U) Ь = f<Pn ~ f<Pn +U = U,
т. е. вся система имеет форму (9.11). ?
Глава 10
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
10.1. Постановка задачи
Мы будем рассматривать управляемую систему вида
q = fu{q), qeM, ueUcR171. A0.1)
Как обычно, М — гладкое многообразие, at/ — произвольное подмно-
подмножество Мт. На правую часть управляемой системы наложим следую-
следующие требования:
Q •—^ fu(q) — гладкое векторное поле на М
при любом фиксированном и Е С/, A0.2)
(q,u) H> fu(q) — непрерывное отображение для q Е М, и Е ?/, A0.3)
и кроме того, в любых локальных координатах на М
(q,u) Н> -д{о) ~ непрерывное отображ:ение
q npnqe M,ueU. A0.4)
Допустимые управления — измеримые локально ограниченные
отображения
и: t\-> u(t) e U.
Подставляя такое управление и = u(t) вместо управляющего пара-
параметра в систему A0.1), получаем неавтономное дифференциальное
уравнение q = fu{q)- П° классической теореме Каратеодори для любой
точки qo Е М задача Копей
q = U(q), q{O) = qo, A0.5)
имеет единственное решение (см. п. 2.4.1). Часто мы будем фикси-
фиксировать начальную точку до и обозначать соответствующее решение
задачи A0.5) просто через qu(i).
Чтобы сравнивать допустимые управления на отрезке [0, ?i] друг
с другом, введем функционал качества:
J(u) = J <p(qu(t),u(t))dt, A0.6)
о
подынтегральная функция которого
удовлетворяет тем же условиям регулярности, что и правая часть /;
см. A0.2)-A0.4).
136 Гл. 10. Задача оптимального управления
Возьмем любую пару точек q$,qi G М. Мы будем рассматривать
следующую задачу оптимального управления.
Задача. Минимизировать функционал J на множестве всех
допустимых управлений и = u(i), t G [0, ?i], для которых соответст-
соответствующее решение qu(t) задачи Коши A0.5) удовлетворяет краевому
УСМвиЮ qu{h) = qi. (Ю.7)
Эту задачу молено также записать следующим образом:
<i = fu{q), qeM, ueUcR171, A0.8)
qo, q{ti) = qi, (Ю.9)
J(u) = Г <p(q(t), u(t)) dt -+ min. A0.10)
о
Мы будем изучать два типа задач — с закрепленным конечным
временем t\ и свободным t\. Решение и такой задачи называется
оптимальным управлением, а соответствующая кривая qu(i) — оп-
оптимальной траекторией.
Таким образом, задача оптимального управления — это задача ми-
минимизации функционала J{u) с ограничениями на управление щ ко-
которые задаются управляемой системой и краевыми условиями A0.5),
A0.7). Обычно эти связи невозможно разрешить относительно щ по-
поэтому для решения задач оптимального управления требуются специ-
специальные методы.
10.2. Редукция к исследованию множеств
достижимости
Зафиксируем начальную точку q0 G М. Множество достижи-
достижимости управляемой системы A0.1) за время t ^ 0 из точки q0 с по-
помощью измеримых локально ограниченных управлений определяется
следующим образом:
Aqo(t) = {qu(t)\ueL°°([0,t],U)}.
Аналогично можно рассматривать множества достижимости за время
не больше t: , ,
и за произвольное неотрицательное время:
Ло= U Ачо{т).
0^г<оо
Оказывается, задачи оптимального управления на пространстве
состояний М по существу мож:но свести к исследованию множеств
достижимости некоторых вспомогательных управляемых систем на
расширенном пространстве состояний
M = Rx M = {q= (y,q)\ у G M, q G М}.
10.2. Редукция к исследованию множеств достижимости 137
А именно, рассмотрим следующую расширенную управляемую систе-
систему на М: dq 7 /-\
qeM,
A0.11)
с правой частью
Ш) Г
q e м, и еи,
где if — подынтегральная функция функционала качества J; см. A0.6).
Обозначим через qu(t) решение расширенной системы A0.11) с
начальными условиями
<7о
Предложение 10.1. Пусть quit), t? [0,?i], есть оптималь-
оптимальная траектория в задаче A0.8)—A0.10) с закрепленным конечным
временем t\.
Тогда соответствующая траектория quit) расширенной систе-
системы A0.11) приходит на границу множества достижимости этой
системы: ^ и \ я7 и \ пп ю\
qu\H) t uA(Q,qQ)\t-\_). (lU.lZj
Доказательство. Решения qu(t) расширенной системы вы-
выражаются через решения qu(t) исходной системы A0.1) как
где
Jt(u) = / (p(qu(r),u(r))dr.
Поэтому множества достижимости расширенной системы A0.11) из
точки @, до) имеют вид
л 2/
ueL°°([0,t},U)}.
Множество *4(o,go)(?i) не может у\..
пересекаться с лучом
{(y,Qi) eM\y< Jtl(u)}
(рис. 10.1).
Действительно, предположим,
что существует точка
4\
Рис. 10.1. Траектория quit) опти-
оптимальна
Тогда траектория qu{i) расширенной системы, переводящая @,до)
()
9i/'
138 Гл. 10. Задача оптимального управления
проецируется в траекторию qu(i), qu@) = qo, qu(ti) = #1, с меньшим
значением функционала качества:
Jtl(u) = у < JtlB),
что противоречит оптимальности траектории qu(i). Включение A0.12)
доказано. ?
Итак, оптимальные траектории (точнее, их поднятия на расши-
расширенное пространство состояний М) должны приходить на границу
множества достижимости *A(o,go)(^i)- Чтобы найти оптимальные тра-
траектории, мы найдем траектории, приходящие на границу *A(o,go)(^i)> a
затем выберем из них оптимальные. Первый шаг гораздо важнее вто-
второго, поэтому решение задач оптимального управления по существу
сводится к исследованию динамики множеств достижимости.
10.3. Компактность множеств достижимости
Благодаря сведению задач оптимального управления к исследова-
исследованию множеств достижимости существование оптимальных решений
сводится к компактности множеств достижимости.
В следующем предложении даются достаточные условия ком-
компактности множеств достижимости для управляемой системы A0.1):
Aqo (t) за время t и Aqo за время не больше t.
Теорема 10.1 (А.Ф.Филиппов). Пусть пространство управ-
управляющих параметров U (e Mm компактно. Пусть существует ком-
компакт К (е М такой, что fu(q) = 0 при q ^ К, и Е U. Предположим
также, что множества допустимых скоростей
fu(q) = {/„(«) \ueU}G TqM, q в M,
выпуклы.
Тогда множества достижимости Aqo(t) и Aqo компактны для
всех qo G M, t > 0.
Замечание. Условие выпуклости множества допустимых ско-
скоростей fu(q) естественно ввиду теоремы 8.2: поток уравнения
й = «(*)/«! (i) + A - "(<))/«, (<?), 0 ^ a(t) ^ 1,
аппроксимируется потоками систем вида
ч = Ш), v(t)e{Ul{t),u2{t)}.
Приведем эскиз доказательства теоремы 10.1.
Доказательство. Во-первых, заметим, что все неавтоном-
неавтономные векторные поля fu(q) с допустимыми управлениями и имеют
компактный общий носитель, поэтому полны. Далее, в условиях тео-
теоремы скорости fu(q), q Е М, и G U, равномерно ограничены, поэтому
все траектории q(t) управляемой системы A0.1), выходящие из qo,
липшицевы с одной и той же константой Липшица. Поэтому множест-
множество допустимых траекторий предкомпактно в топологии равномерной
10.3. Компактность множеств достижимости 139
сходимости. (Можно вложить многообразие М в евклидово прост-
пространство M,N, тогда пространство непрерывных кривых q(t) наследует
равномерную топологию непрерывных отображений из [0, ?i] в M.N.)
Любая последовательность qn(t) допустимых траекторий
qn{t) = /иЛЯпШ (К t ^ *i, qn@) = go,
содержит равномерно сходящуюся подпоследовательность, сохраним
за ней обозначение qn{t)'-
Qn(') ~^ q(') b С[0, ?i] при п —>> ос.
Покажем, что q(t) — допустимая траектория управляемой систе-
системы A0.1).
Зафиксируем достаточно малое е > 0. Тогда в локальных коорди-
координатах
t+e
е) - qn(t)) = \ J /„п(G„(г)) dr G
t
е conv U fu(qn(r)) С conv U fu(q),
re[t,t+e] qeOq(t)(c?)
где с — удвоенная константа ЛиппЕица допустимых траекторий. Пе-
Переходя к пределу при п —> оо, получаем
U fu(q).
q{t)(c?)
Теперь пусть е —>• 0. Если t — точка дифференцируемости q(t), то
q(t) e fu(q)
так как fu{q) компактно.
Чтобы показать, что q(t) — допустимая траектория управляемой
системы A0.1), мы должны найти измеримый селектор u(i) G U, по-
рож:дающий q(i). Это мож:но сделать, используя лексикографический
порядок на множестве U = {(г^,..., иш)} С Мт.
Множество
Vt = {v e C
является компактным подмножеством ?/, а потому и Мт. Существу-
Существует вектор vmin(i) G Vi, минимальный в смысле лексикографического
порядка. Чтобы найти vmin(t), сначала минимизируем первую коор-
координату на Vt:
затем минимизируем вторую координату на компактном множестве,
полученном на первом шаге:
vfn = min {«2 | v = (vfn, v2,...,vm)G Vt},
140 Гл. 10. Задача оптимального управления
и так далее,
<СП = min {vm | v = «n, • • •, v^uvm) G Vt}.
Управление уШ1П(г) = (г?™^),..., v™in(t)) измеримо, поэтому q(t) есть
допустимая траектория системы A0.1), порожденная этим управле-
управлением.
Мы доказали компактность множества достижимости Aqo (i). Ком-
Компактность Л* доказывается аналогичным рассуждением. ?
Замечание. Условие общего компактного носителя векторных
полей в правой части существенно в теореме Филиппова для обеспе-
обеспечения равномерной ограниченности скоростей и полноты векторных
полей. На многообразии достаточные условия полноты векторного
поля невозможно дать в терминах ограниченности векторного по-
поля и его производных: даже постоянное векторное поле неполно в
ограниченной области в Мп. Однако во многих случаях компактность
множеств достижимости можно доказать и без предположения ком-
компактного общего носителя. Если имеются априорные оценки решений
управляемой системы, можно умножить правую часть на функцию
срезки и получить систему с векторными полями, имеющими общий
компактный носитель. К новой системе теорема Филиппова уже при-
применима. Но исходная и новая системы имеют одни и те же траек-
траектории в рассматриваемой области, поэтому исходная система имеет
компактные множества достижимости.
Для систем на М = W1 имеется хорошо известное достаточное
условие полноты векторных полей: если правая часть растет на бес-
бесконечности не быстрее линейного поля, т. е.
\fu(x)\ ^СA + |ж|), xeW1, ueu, A0.13)
для некоторой константы С, то неавтономные поля fu(x) полны (здесь
х\ = у' х\ + ... + х\ — норма точки х = (жх,..., жп) Eln).
Это условие дает и априорную оценку решений: любое реше-
решение x(i) управляемой системы
x = fu(x), xGRn, ueU, A0.14)
с правой частью, удовлетворяющей неравенству A0.13), допускает
оценку
\x(t)\ ^e2Ct(|x@)| + l), t^0.
Поэтому теорема Филиппова и предшествующее замечание дают
следующее достаточное условие компактности множеств достижимос-
достижимости для систем в W1.
Следствие 10.1. Пусть система A0.14) имеет компактное
пространство управляющих параметров U (e Mm и выпуклые мно-
множества скоростей fu{x), x G Мп. Предположим таксисе, что правая
часть системы удовлетворяет оценке вида A0.13).
Тогда множества достижимости AXo(t) и ЛгХо компактны для
любых х0 е Mn, t > 0.
10.4- Задача быстродействия 141
10.4. Задача быстродействия
Выберем пару точек q0 Е М и q\ Е Aqo. Цель задачи быстро-
быстродействия состоит в том, чтобы попасть из точки g0 B точку q\ вдоль
траекторий управляемой системы A0.1) наискорейшим образом:
mm {t1\qu(t1)=q1}. A0.15)
U
То есть мы рассматриваем задачу оптимального управления, опи-
описанную в п. 10.1 с интегрантом (p(q,u) = 1 и свободным конечным
временем t\.
Редуцируя эту задачу к исследованию множеств достижимости и
применяя теорему Филиппова, получаем следующий результат.
Следствие 10.2. В условиях теоремы 10.1 задача быстро-
быстродействия A0.1), A0.15) имеет решение для любых точек qo Е М,
Qi € Ло •
10.5. Релаксации
Рассмотрим управляемую систему A0.1) с компактным множест-
множеством управляющих параметров U. Существует стандартная процедура
релаксации управляемой системы A0.1), расширяющая множество
скоростей fu{o) этой системы до его выпуклой оболочки conv fu{q)-
Напомним, что выпуклая оболочка conv S подмножества S линей-
линейного пространства — это наименьшее выпуклое множество, содержа-
содержащее S. Конструктивное описание выпуклой оболочки дается в сле-
следующем классическом утверждении: любая точка выпуклой оболочки
множества S в n-мерном линейном пространстве есть выпуклая ком-
комбинация некоторого набора из п + 1 точек в S.
Лемма 10.1 (Каратеодори). Для любого подмножества S dW1
его выпуклая оболочка может быть представлена в виде
СОПУ S = < > OljX
/ j
0, > а{ = 1
/ J
г=0 г=0
Доказательство этой леммы приведено, например, в [145].
Релаксация (ослабление) управляемой системы A0.1) строится
следующим образом. Пусть п = dim M есть размерность пространства
состояний. Множество управляющих параметров новой системы име-
имеет вид
V = Ап х Ux...xUj
n+l раз
где
0, V ац = 1 \ С
г=0 >
п = < (
Ап =
142 Гл. 10. Задача оптимального управления
есть стандартный n-мерный симплекс. То есть новый управляющий
параметр имеет вид
v = (а, и0, • • •, ип) G V, а = (а0, • • •, <*п) ? Дп5 ^ G 17.
Если U компактно, то V также компактно.
Ослабленная система имеет вид
OLifUi{q), 1/ = (а,«о,...,«п)^, q G М. A0.16)
г=0
По лемме Каратеодори множество скоростей ду{ч) системы A0.16)
выпукло, более того,
gv(q) =con-vfu(q).
Если все векторные поля в правой части A0.16) имеют общий
компактный носитель, из теоремы Филиппова следует компактность
множеств достижимости ослабленной системы. По теореме 8.2 любую
траекторию ослабленной системы A0.16) можно равномерно прибли-
приблизить семействами траекторий исходной системы A0.1). Поэтому мно-
множества достижимости ослабленной системы совпадают с замыкания-
замыканиями множеств достижимости исходной системы.
Глава 11
ДИФФЕРЕНЦИАЛЬНЫЕ ФОРМЫ
И СИМПЛЕКТИЧЕСКАЯ ГЕОМЕТРИЯ
Необходимое условие оптимальности для задач оптимального
управления на гладких многообразиях — принцип максимума Понт-
рягина (см. гл. 12) — формулируется в терминах симплектической
геометрии. В этой главе мы приводим соответствующие определения
и необходимые факты. Перед этим напомним некоторые начальные
сведения о дифференциальных формах на многообразиях. Цель
этой главы — разъяснить основные понятия, а не систематически
изложить весь материал, и она не может заменить стандартный
учебник. В качестве таких учебников мы можем рекомендовать,
например, [137, 139, 148].
11.1. Дифференциальные 1-формы
11.1.1. Линейные формы. Пусть Е — вещественное линейное
пространство конечной размерности п. Множество линейных форм
на Е, т.е. линейных отображений ? : Е —>> М, имеет естественную
структуру линейного пространства, которое называется сопряжен-
сопряженным пространством к Е и обозначается через Е*. Если векто-
векторы ei,...,en образуют базис Е, то соответствующий двойственный
базис Е* образован ковекторами е*,..., е* такими, что
(e*,ej) = 5ij, ij = l,...,n
(мы используем угловые скобки для записи значения линейной фор-
формы ? Е Е* на векторе v Е Е: (?,г>) = ?(г>)). Поэтому сопряженное
пространство имеет ту же размерность, что и исходное:
dimE* = п = dim .Б.
11.1.2. Кокасательное расслоение. Пусть М — гладкое мно-
многообразие, a TqM — его касательное пространство в точке q Е М.
Пространство линейных форм на TqM, т. е. сопряженное пространство
(TqM)* к TqM, называется кокасательным пространством многооб-
многообразия М в точке q и обозначается через Т*М. Объединение всех ко-
касательных пространств называется кокасателъным расслоением М:
T*Md= U т*м
qEM q
(кокасательные пространства в разных точках не пересекаются). Мно-
Множество Т* М имеет естественную структуру гладкого многообразия
размерности 2п, где п = dimM. Локальные координаты на Т*М по-
получаются из локальных координат на М.
Пусь О С М — координатная окрестность, а
144 Гл. 11. Дифференциальные формы и симплектическая геометрия
есть локальная система координат. Дифференциалы координатных
функции dXi\qeT*M, z = l,...,n, q G О,
образуют базис в кокасательном пространстве Т*М. Двойственный
базис в касательном пространстве TqM образован векторами
eTqM, г = 1,...,тг, qeO,
0 X j
ij = l,...,n.
Любую линейную форму ? G T*M можно разложить по базисным
формам:
г=1
Поэтому любой ковектор ? ? Т*М характеризуется п координата-
координатами (ж1?..., хп) точки q G М, где приложен ковектор ?, и п координа-
координатами (^i,..., ?п) линейной формы ^ в базисе б/xi,..., с/жп. Отображ:е-
ния вида
? ^ (^ь---^п; хъ...,хп)
задают локальные координаты в кокасате льном расслоении. Поэто-
Поэтому Т*М есть 2п-мерное многообразие. Координаты вида (?,ж) назы-
называются каноническими координатами на Т*М.
Если F: М —>- TV есть гладкое отображение между гладкими мно-
многообразиями, то дифференциал
имеет сопряженное отображение
F*d^(Fty:
которое задается следующим образом:
(F*Z,v) = (Z,F.v), v&TqM.
Вектор v ? TqM переносится вперед дифференциалом F* в век-
вектор F*v G TF(q^N, а ковектор ? G Tp, ^N переносится назад в ковектор
F*? G Т*М. Поэтому гладкое отображение F: М —>> 7V меж:ду много-
многообразиями порож:дает гладкое отображение F* : T*7V —>> Т*М между
их кокасательными расслоениями.
11.1.3. Дифференциальные 1-формы. Дифференциальная
1-форма на М есть гладкое отображение
q\-+uqe Т*М, qe М,
т.е. семейство о; = {cjg} линейных форм на касательных пространст-
пространствах TqM, гладко зависящее от точки q G М. Множ:ество всех диффе-
11.2. Дифференциальные к-формы 145
ренциальных 1-форм на М имеет естественную структуру бесконеч-
бесконечномерного линейного пространства, которое обозначается через АгМ.
Подобно тому, как линейные формы на линейном пространстве
являются двойственными объектами к векторам этого пространства,
дифференциальные формы на многообразии — двойственные объекты
к гладким кривым на многообразии. Спаривание задается интег-
интегралом дифференциальной 1-формы и: Е Л1М по ориентированной
гладкой кривой j : [?o,?i] —>- М, который определяется следующим
образом: t
Интеграл 1-формы по кривой не зависит от сохраняющих ориен-
ориентацию гладких перепараметризаций кривой и меняет знак при замене
ориентации.
11.2. Дифференциальные /с-формы
Дифференциальная fc-форма на М — это объект, который дол-
должен интегрироваться по /с-мерным поверхностям в М. Инфините-
зимально ^-мерная поверхность представляется своим касательным
пространством, т. е. некоторым /с-мерным подпространством в TqM.
Таким образом, нам нужен объект, двойственный ко множеству к-мер-
к-мерных подпространств линейного пространства. Зафиксируем линейное
пространство Е. Любое /с-мерное подпространство определяется сво-
своим базисом г?!,..., iJfc Е Е. Двойственные объекты должны задаваться
отображениями
(vi,...,Vfc) ^ Lu(v!,...,Vk) Е R
такими, что cj(vi, ..., v^) зависит только от линейной оболочки век-
векторов span{?;i,..., ук} и ориентированного объема /с-мерного парал-
параллелепипеда, порожденного векторами vi,..., Vk- Более того, эта зави-
зависимость должна быть линейной. Напомним, что отношение объемов
параллелепипедов, порожденных векторами
к
и векторами vi,...,Vfc, равно det(a^)^J=1, и что определитель мат-
матрицы порядка к есть полилинейная кососимметрическая форма от
столбцов матрицы. Поэтому следующее определение двойственных
объектов вполне естественно.
11.2.1. Внешние fc-формы. Пусть Е — конечномерное вещест-
вещественное линейное пространство, dim.E = n, и пусть к G N. Внешней
к-формой на Е называется отображение
ио: Е х ... х Е -)> М,
к раз
10 А.А. Аграчев, Ю.Л. Сачков
146 Гл. 11. Дифференциальные формы и симплектическая геометрия
являющееся полилинейным:
i, ...,v},...,vk) + <*2u(vu ¦ ¦ ¦ > ^ ¦ ¦ ¦ > vk), аъа2 G M,
и кососимметрическим:
о;(^1,...,^,...,^-,...,^) =
= -u(vi,... ,Vj,... ,Vi,... ,Vk), i,j = 1,. •. ,fc.
Множество всех внешних /с-форм на i? обозначается через АкЕ. В
силу кососимметричности любая внешняя форма степени к > п равна
нулю, т. е. АкЕ = {0} при к > п.
Внешние формы можно умножать на вещественные числа, а внеш-
внешние формы одной степени к можно складывать между собой, поэтому
все АкЕ суть линейные пространства. Мы сможем построить базис
АкЕ после того как рассмотрим еще одну операцию между внешними
формами — внешнее произведение. Внешнее произведение двух форм
и)\ G AklE, L02 G Ak2E есть внешняя форма uj\ Л си2 степени к\ + к2.
Для линейных 1-форм 0Ji,0J2 G Л1^ имеется естественное (тензор-
(тензорное) произведение
в результате которого получается билинейная, но не кососимметрич-
ная форма. Внешнее произведение есть антисимметризация тензор-
тензорного:
UJlAUJ2- (г>1, V2) •->• U\(V\)OJ2(V2) — ^1(^2)^2(^1), Vi,V2 (z Е.
Аналогично, тензорное и внешнее произведения форм uji G AklE и
0J2 G Ак<2Е — это следующие формы степени к\ + к2'.
12
A1.1)
где сумма берется по всем перестановкам а порядка к\ + /с2, a z/(a) —
четность перестановки а. Множитель вводится для нормировки
fc! /C'
суммы в A1.1), так как она содерж:ит fci!^! одинаковых слагаемых:
например, если перестановка а не перемешивает первые к\ и послед-
последние &2 аргумента, то все члены вида
равны
11.2. Дифференциальные к-формы 147
Этот множитель обеспечивает ассоциативность внешнего произве-
произведения: 7
cji Л (о;2 Л о;з) = (cji Л CJ2J Л о;з, ^ G Л гЕ,
Более того, внешнее произведение косокоммутативно:
Uj2/\Uj1 = (-l)*1*2^ Л uj2, ил G AkiE.
Пусть ei,..., еп — базис пространства Е, а е*,..., е* — соответст-
соответствующий двойственный базис Е*. Если 1 ^ к $J п, то следующие С^
элементов образуют базис пространства АкЕ:
< А ... Л e*fc, I ^ ii < г2 < ... < гк ^ п.
Из равенств
(e*iA...Ae*J(eil,...,eiJ = l,
(е*х Л...Ле^)(е^,...,е^) = 0, если (zi,...,zfe) / (jb ..., jk),
при 1 ^ i\ < %2 < • • • < ik ^ n следует, что любая /г-форма оо G AkE
единственным образом представляется в виде
Упражнение 11.1. Покажите, что для любых 1-форм o;i,...
...,иОр G Л1^ и любых векторов vi,... ,vp E E выполняется равенство
(ал Л ... Л wp)(t;i,. ..,vp) = det ((w<, ^))fj=1. A1.2)
Заметим, что пространство n-форм на n-мерном пространстве Е
одномерно. Любая ненулевая n-форма на Е является формой объема.
Например, значение стандартной формы объема е* Л ... Л е* на набо-
наборе из п векторов (vi,..., vn) равно
(е{ Л ... Л е* )(vb ...,vn) = det ((e*,Vj))"j=1 ,
это ориентированный объем параллелепипеда, порожденного векто-
векторами vi, ..., vn.
11.2.2. Дифференциальные Aj-формы. Дифференциальная
к-форма на М есть отображение
6J: q^ujq e AkTqM, qe M,
гладкое по g G М. Множество всех дифференциальных /с-форм на М
обозначается через АкМ. Естественно гладкие функции на М считать
0-формами, поэтому Л°М = С°°(М).
В локальных координатах (ж1,...,жп) на области О d M любая
дифференциальная /с-форма cj G Л^М единственным образом пред-
представляется в виде
сох = 2_^ aii...ik(x)dxil Л ... Л dxik, xeO, ail...ik e С°°(О).
10*
148 Гл. 11. Дифференциальные формы и симплектическая геометрия
Любое гладкое отображение
F: М ^ N
порождает перенос дифференциальных форм
F: AkN ^AkM
следующим образом: для любой дифференциальной к-формы ио G
G KkN fc-форма Fuj G КкМ определяется как
(Fw)q(vu...,vk) = ujF{q)(F^vu...,F^vk), qeM, v{ eTqM.
Для 0-форм перенос есть просто замена переменных:
Fa(q) = aoF(q), aeC°°(M), q G М.
Отображение F линейно относительно форм и сохраняет внешнее
произведение:
F(u)i A UJ2) = Fuji A Fuj2-
Упражнение 11.2. Докаж:ите правило композиции для пере-
переноса дифференциальных форм
F^7f1=F1oF2, A1.4)
где F\: Mi —>• М2 и F2: М2 —> М3 — гладкие отображения.
Отметим, что в операторных обозначениях (когда точки пишутся
слева от отображений как q о F) крышка ^ не изменяет порядка
отображений F\, F2 в композиции, в отличие от классического обо-
обозначения F(q).
Теперь мы мож:ем определить интеграл к-формы по ориентиро-
ориентированной ^-мерной поверхности. Пусть П С М,к есть ^-мерная открытая
ориентированная область и
Ф: П^Ф(П) С М
есть диффеоморфизм. Тогда интеграл /с-формы ои Е АкМ по к-мер-
ной ориентированной поверхности Ф(П) определяется следующим об-
образом:
f def f ж
uj = Фо;;
Ф(П) П
остается только определить интеграл по П в правой части. Так как
Феи G Ак (М.к) есть fc-форма на М.к, она выражается через стандартную
форму объема dx\ А ... Л dxk G Л^М^:
[Фси)х = а(х) dx\ Л ... Л dxk, x G П.
Мы определим
/ Феи = / а(х) dx\ ...
п п
как обычный кратный интеграл.
11.3. Внешний дифференциал 149
Интеграл J со определен корректно относительно сохраняющих
Ф(П)
ориентацию перепараметризаций поверхности Ф(П). При изменении
ориентации интеграл меняет знак.
Понятие интеграла распространяется на произвольные подмного-
подмногообразия следующим образом. Пусть N С М есть /с-мерное подмного-
подмногообразие, и пусть ио G АкМ. Рассмотрим покрытие N координатными
окрестностями О{ С М:
N =
Возьмем разбиение единицы, подчиненное этому покрытию:
щеС°°(М), suppose О*, 0^а»^1,
f def ^ f
J и = 2^ J aiUJ.
i
N
Определенный таким образом интеграл не зависит от выбора разбие-
разбиения единицы.
Замечание. Другой возможный подход к определению интег-
интеграла дифференциальной формы по подмногообразию основан на три-
триангуляции подмногообразия.
11.3. Внешний дифференциал
Внешний дифференциал функции (т. е. 0-формы) есть 1-форма:
если a G С°°(М) = Л°М, то ее дифференциал
dqa e Т*М
есть функционал (производная по направлению)
(dqa, v) = va, v G TqM- A1.5)
поэтому Л
da G AXM.
По формуле Ньютона-Лейбница, если j С М — ориентированная
гладкая кривая, соединяющая до ? М с q± G М, то
da = a{qi) - a(q0).
7
При этом правую часть можно рассматривать как интеграл функ-
функции а по ориентированной границе кривой: д^у = q\ — go, поэтому
Г da= Га. A1.6)
150 Гл. 11. Дифференциальные формы и симплектическая геометрия
В нашем изложении формула Ньютона—Лейбница A1.6) является
следствием определения A1.5) дифференциала функции. Но можно
пойти и обратным путем: если мы постулируем формулу Ньютона-
Лейбница A1.6) для любой гладкой кривой 7 С М и перейдем к преде-
пределу q\ —>> go 5 т0 необходимо получим определение A1.5) дифференциала
функции.
Этот подход можно использовать для определения дифференциа-
дифференциала форм высших степеней. Пусть uj G AkM. Мы определим внешний
дифференциал
как дифференциальную (к + 1)-форму, для которой выполняется
формула Стокса
[ duo = Г uj A1.7)
TV ON
для (к + 1)-мерных подмногообразий с границей N С М (для просто-
простоты можно здесь считать N диффеоморфным образом (к + 1)-мерно-
1)-мерного многогранника). Граница dN ориентируется репером касательных
векторов ei,... efc G Tq(dN) так, чтобы репер en, ei,..., е& G TqN за-
задавал положительную ориентацию на JV, где еп — внешний вектор
нормали к N в q.
Существование формы с/а;, удовлетворяющей формуле Сток-
Стокса A1.7), следует из аддитивности отображения N \-> J uj относи-
8N
тельно области: если N = JVi U N2, N± П N2 = dN± П dN2, то
dN dNx dN2
(ориентация границ согласована: в точках пересечения dNi и dN2
имеют противополож:ные ориентации). Поэтому интеграл J uj явля-
dN
ется разновидностью меры относительно 7V, и значение (duj)q можно
восстановить, переходя к пределу в формуле Стокса A1.7), когда
подмногообразие N стягивается в точку q.
Напомним некоторые основные свойства внешнего дифференциа-
дифференциала. Во-первых, из формулы Стокса следует линейность оператора
d: АкМ —)> Afe+1M. Далее, если F: М —>> N — диффеоморфизм, то
dFuu = Fduj, uj G AkN. A1.8)
Действительно, если W С М, то
/ uj = Fa;, uj G AkN,
F(W) W
11.4- Производная Ли дифференциальных форм 151
поэтому
fdFuj= Г Fw= Г uj= Г uj = Г du; = ГFduj,
W dW F(dW) dF(W) F(W) W
и равенство A1.8) доказано.
Еще одно фундаментальное свойство внешнего дифференциала
выражается равенством
dod = 0,
следующим из того, что d(dN) = 0 для любого подмногообразия с
границей N С М.
Внешний дифференциал является антидифференцированием:
d(uji А ио2) = {dwi) Л 002 + (-l)*^! Л dou2, ^% G AkiM,
это двойственная формула к формуле границы d(N-\_ x N2).
Внешний дифференциал вычисляется в локальных координатах
следующим образом: если
ТО
^^ (dah...ik) Adxh Л ... Adxik-
эта формула следует из приведенных выше свойств дифференциаль-
дифференциальных форм.
11.4. Производная Ли дифференциальных форм
Построим инфинитезимальную версию переноса Р дифференци-
дифференциальных форм потоком Р.
Производная Ли дифференциальной формы из G АкМ вдоль век-
векторного поля / G Vec М — это дифференциальная форма LfUj G ^
которая определяется следующим образом:
f 4
J ds ?=0
Так как
ff ( A uj2) = e1^uj\ А
то производная Ли Lf является дифференцированием алгебры диф-
дифференциальных форм:
Lf(wi A uj2) = (LfUJi) A uj2 + uj\ A LfUj2.
Далее,
etf о d = d о e?f,
поэтому
Lf о d = do Lf.
152 Гл. 11. Дифференциальные формы и симплектическая геометрия
Производная Ли 0-форм есть обычная производная по направ-
направлению:
fa, aeC°°(M),
так как
effa = ег* а
есть замена переменных.
Выведем полезную формулу для действия производной Ли на диф-
дифференциальные формы любой степени.
Рассмотрим наряду с внешним дифференциалом
d: AkM ->> Ak+1M
внутреннее произведение дифференциальной формы uj и векторного
поля / Е Vec M:
vu...,vk-1) d= u(f,vu...,vk-1), uj e AkM, v{ eTqM,
действующее как подстановка / вместо первого аргумента в из. По
определению для форм нулевого порядка
if а = 0, а е А°М.
Внутреннее произведение является антидифференцированием, как и
внешний дифференциал:
if (ил А со2) = (if ил) Л uj2 + (-l)felcji Л г/о;2, ^ G AkiM.
Докажем, что производную Ли дифференциальной формы любой
степени можно вычислить по следующей формуле:
Lf = do if +г/ od, A1.10)
которая называется формулой Картана, сокращенно «L = di + id».
Во-первых, заметим, что правая часть A1.10) имеет нужную степень:
do if + if о d: Л^М ->> Л^М.
Далее, оператор d о if -\- if о d является дифференцированием, так
как он получен из двух антидифференцирований. Более того, это
дифференцирование коммутирует с дифференциалом:
do (do if -\-if о d) = d о if о d,
(d о if -\- if о d) о d = d о if о d.
Теперь проверим формулу A1.10) на 0-формах: если a G Л°М, то
(d о if)a = 0,
(if о d)a = (da, /) = fa = Ь/a.
Итак, равенство A1.10) выполняется на 0-формах. Но установлен-
установленные выше свойства отображений Lf и d о if -\- if о d и координатное
11.4- Производная Ли дифференциальных форм
153
представление A1.3) сводят общий случай /с-форм к случаю 0-форм.
Формула A1.10) доказана.
Дифференциальное определение A1.9) производной Ли можно
проинтегрировать, т.е. справедливо равенство операторов на АкМ:
I exp fTdr\ = ехр / LfT dr, A1.11)
о о
в следующем смысле. Обозначим поток
to
Семейство операторов на дифференциальных формах
Р*: АкМ -+ АкМ
есть единственное решение задачи Коши
= Id, A1-12)
d
It
t=0
аналогичной задачам Коши для потока Рд B-9) и для семейства опе-
операторов AcIPq B.21), B.22). Это решение обозначается как
—> [ т Й def (-^ [ г , \
ехр / Lfr dr = I exp / fT dr 1 .
J \ J J
о о
Чтобы проверить дифференциальное уравнение в A1.12), докажем
сначала следующее равенство для операторов на формах:
de
= L*
? = 0
e Акм.
A1.13)
Это равенство очевидно для форм нулевого порядка:
Is
Р*+еа = f
е=о de
? = 0
еа = fta = Lfta, a G
Далее, оба оператора -—
de
е=0
Pt и Lft коммутируют с d и удовле-
удовлетворяют правилу Лейбница относительно произведения функции и
дифференциальной формы. Тогда равенство A1.13) следует для форм
любой степени, как и в доказательстве формулы Картана.
Теперь уравнение в A1.12) легко проверяется:
de
? = 0
Те
? = 0
154 Гл. 11. Дифференциальные формы и симплектическая геометрия
(по правилу композиции A1.4))
d
е=0
Р
d_
Is
е=0
Упражнение 11.3. Докажите единственность решения зада-
задачи A1.12).
Для автономного поля / G VecM равенство A1.11) принимает вид
tff =etLf.
Отметим, что производные Ли дифференциальных форм Lf и век-
векторных полей (—ad/) в некотором смысле двойственны друг другу;
см. равенство A1.14) ниже. То есть функция
(со,Х): ди (uq,X(q)), q G М,
задает спаривание Л1М и VecM над С°°(М). Тогда равенство
(Рш,Х) = P(w,P*X), PGDiffM, XGVecM, со G Л*М,
имеет инфинитезимальную версию вида
(LYco,X) = Y(co,X}- (u,(adY)X), X,Y G VecM, со eKxM.
A1.14)
Учитывая формулу Картана, легко получаем следующее важное
равенство:
du,(Y, X) = Y(со, X) - Х(ш, Y) - (со, [У, X]),
шеА1М ^ ' }
11.5. Элементы симплектической геометрии
Как мы видели выше, кокасательное расслоение Т*М = U Т*М
qEM ч
n-мерного многообразия М является 2п-мерным многообразием. Лю-
Любые локальные координаты х = (жх,..., хп) на М определяют канони-
канонические локальные координаты на Т*М вида (?, х) = (^i,..., ?п; жх, • • •
..., жп), в которых любой ковектор Л G T*QM раскладывается как Л =
11.5.1. Форма Лиувилля и симплектическая форма. «Тав-
«Тавтологическая» 1-форма (или 1-форма Лиувилля) на кокасательном
пространстве .
sGA:(T*M)
определяется следующим образом. Пусть Л G Т*М — точка кокаса-
тельного расслоения, a w G Т\(Т*М) — касательный вектор к Т*М в
точке Л. Обозначим через тг каноническую проекцию из Т*М на М:
тг: Г*М^М,
тг: Аи g, A G Т*М.
11.5. Элементы симплектической геометрии 155
Дифференциал проекции тг есть линейное отображение
Тавтологическая 1-форма s в точке Л действует на касательный век-
вектор w следующим образом:
/ \ def / Л \
{s\,w) = (А,7г*гу).
То есть мы проецируем вектор w Е Т\(Т*М) в вектор n*w Е TqM, a
затем действуем ковектором A Е Т*М. Таким образом,
def л
S\ = А ОТГ*.
Название «тавтологическая» объясняется координатным пред-
представлением формы s. В канонических координатах (?, ж) на Т*М
имеем
г=1
w =
г=1
В локальных координатах проекция
тг: (?, ж)
становится линейным отображ:ением, и ее дифференциал действует
следующим образом:
7Г*1^г)=^' ^(л— =^—> г = 1,...,п.
Ч^^г/ \dxiJ dxi
Поэтому
г=1
следовательно,
г=1
Но f3i = (с^Жг, гу), поэтому форма s имеет в координатах (^, ж) в точно-
точности то же выражение
г=1
что и ковектор А; см. A1.16). Впрочем, определение формы s не
зависит от координат.
Замечание. В механике форма Лиувилля s обозначается че-
через р dq.
156 Гл. 11. Дифференциальные формы и симплектическая геометрия
Рассмотрим внешний дифференциал 1-формы s
def ,
а = ds.
Дифференциальная 2-форма a Е А2(Т*М) называется канониче-
канонической симплектической структурой на Т*М. В канонических коор-
координатах получаем из A1.17)
а =
A1.18)
г=1
Отсюда видно, что форма а невырождена, т. е. билинейная кососим-
метрическая форма
ах: ТХ{Т*М) х ГЛ(Т*М) -^ М
не имеет ядра:
<т(ги,-) = О => гу = О, weTx{T*M).
В базисе касательного пространства Т\(Т*М)
дд дд
форма ад имеет блочную матрицу
/01 \
-1 0
О 1
-1 О/
Форма а замкнута:
так как она точна: а = ds, а б/ о а7 = 0.
Замечания. A) Замкнутая невырожденная дифференциаль-
дифференциальная 2-форма на 2п-мерном многообразии называется симплектпи-
ческой структурой. Многообразие с симплектической структурой
называется симплектическим многообразием. Кокасательное рас-
расслоение Т*М с канонической симплектической структурой а — наи-
наиболее важный пример симплектического многообразия.
B) В механике 2-форма а известна как форма dp A dq.
11.5.2. Гамильтоновы векторные поля. С помощью симплек-
симплектической структуры a G A2(T*Af) можно построить гамильтонов фор-
формализм на Т*М. Гамильтониан — это произвольная гладкая функ-
функция на кокасательном расслоении:
heC°°(T*M).
Каждому гамильтониану h можно сопоставить гамильтоново вектор-
векторное поле
h e Vec(T*M)
11.5. Элементы симплектической геометрии 157
по следующему правилу:
<тА(., К) = dxh, A G Т*М. A1.19)
В терминах внутреннего произведения ivcj(-,-) = о;(г>, •) гамильтоново
поле — это векторное поле /г, удовлетворяющее равенству
г^сг = — dh.
Так как симплектическая форма а невырождена, отображение
w и-» (T\(-,w)
есть линейный изоморфизм
ТХ{Т*М)^Т{{Т*М),
поэтому гамильтоново векторное поле h в A1.19) существует и единст-
единственным образом определяется функцией Гамильтона h.
В канонических координатах (?,ж) на Т*М имеем
поэтому в силу A1.18)
h = Y(—— -——). (П-20)
i = l
Следовательно, гамильтонова система ОДУ, соответствующая /г,
A = ft(A), A G Г М,
имеет в канонических координатах следующий вид:
Можно рассматривать функции Гамильтона, зависящие от пара-
параметра: /г,?, t G М. В этом случае неавтономное гамильтоново векторное
поле /it, t G I, определяется так же, как в автономном случае.
Поток гамильтоновой системы сохраняет симплектическую фор-
форму а.
Предложение 11.1. Пусть ht есть неавтономное гамильто-
гамильтоново векторное поле на Т*М. Тогда
t
exp hT dr I a = а.
158 Гл. 11. Дифференциальные формы и симплектическая геометрия
Доказательство. В силу равенства A1.11) имеем
( exp hT dr I = exp / L^ dr,
\ J I J T
о о
поэтому утверждение данного предложения можно переписать как
LKta = 0.
Но производная Ли легко вычисляется по формуле Картана:
L? а = i? о da -\-do i-* a = — d о dh+ = 0. ?
ht ht ч^^ ht
= -dht
Более того, локально справедливо обратное утверждение: если по-
поток сохраняет а, то он локально гамильтонов. Действительно,
I exp frdr\ a = a <^> Lfta = 0,
далее,
Lfta = ift о da -\-d о ifta,
=о
поэтому
Если форма ifta замкнута, то она локально точна (лемма Пуанка-
Пуанкаре), т.е. существует гамильтониан ht, для которого локально ft = ht.
По существу только гамильтоновы потоки сохраняют а (глобально
могут возникать «многозначные гамильтонианы»). Если многообра-
многообразие М односвязно, то справедливо глобальное утверждение: поток
на Т* М гамильтонов тогда и только тогда, когда он сохраняет сим-
плектическую структуру.
Скобка Пуассона гамильтонианов а,Ь Е С°°(Т*М) — это гамиль-
который определяется любым из следующих эквивалентных способов:
{a, b} = ab = (db, а) = а (а, Ь) = —а(Ь, а) = —Ъа.
Очевидно, что скобка Пуассона билинейна и кососимметрична:
{а, Ь} = -{Ь,а}.
В канонических координатах (?, ж) на Т*М
{а,6}=> ^— —-к-г)' A1.21)
^-^\d^i dXi dXi d?i/
1=1
Правило Лейбница для скобки Пуассона легко следует из опреде-
ТТРН1Т9Т *
{a, be} = {а, Ь} с + Ъ {а, с}
(здесь be — обычное поточечное произведение функций b и с).
11.5. Элементы симплектической геометрии 159
Симплектоморфизмы кокасательного расслоения сохраняют га-
мильтоновы векторные поля; действие симплектоморфизма Р Е
Е Diff(T*M), Ра = а, на гамильтоново векторное поле h сводится
к действию Р на гамильтониан как замена переменных:
AdPh=Ph.
Это следует из цепочки
a(X,AdPh) = Pa(X,AdPh) = Pa(AdP~1 X, К) =
= P(dh,AdP~1X) =X(Ph), X E Vec(T*M).
В частности, гамильтонов поток переводит гамильтоново поле в га-
гамильтоново:
t
AdPfbt =P%, Pl = exp fardr. A1.22)
о
Инфинитезимальная версия из этого равенства — тождество Яко-
би для скобки Пуассона.
Предложение 11.2.
{а, {Ъ, с}} + {Ъ, {с, а}} + {с, {а, Ъ}} = 0, а,Ъ,се С°°(Т*М). A1.23)
Доказательство. Любой симплектоморфизм Р G Diff (Т*М),
Ра = а, сохраняет скобку Пуассона:
Р{Ъ, с} = Ра{Ъ, c) = Pa(AdPb,AdPc) = а{РЪ, ~Рс) = {РЪ, Рс}.
Полагая Р = eta и дифференцируя при t = 0, получаем тождество
ЯК°бИ {а,{Ъ,с}} = {{а,Ъ},с} + {Ъ,{а,с}}. ?
Итак, пространство всех гамильтонианов G°°(Т*М) образует ал-
алгебру Ли, произведение в которой задается скобкой Пуассона. Соот-
ветствие fl ^ _, aeC~{T*M)j A1.24)
есть гомоморфизм из алгебры Ли гамильтонианов в алгебру Ли га-
мильтоновых векторных полей на М. Это вытекает из следующего
утверждения.
Следствие 11.1. {а, 6} = [а, Ь] для любых гамильтонианов
С°°(Т*М)
льство. Тождество Якоби мож
{{а, Ъ}, с} = {а, {Ъ, с}} - {6, {а, с}},
Доказательство. Тождество Якоби можно переписать в
т. е.
{аД} с = аоЪс-Ъоас= [а,Ъ]с, сеС°°{Т*М). ?
160 Гл. 11. Дифференциальные формы и симплектическая геометрия
Из координатного представления A1.20) легко видеть, что ядро
отображения а \—ь- а состоит из постоянных функций, т. е. это изо-
изоморфизм с точностью до констант. С другой стороны, образ это-
этого гомоморфизма содержит далеко не все векторные поля на Т*М.
Действительно, векторное поле общего вида на Т*М определяется
локально произвольными 2п гладкими функциями от 2п переменных,
в то время как гамильтоново векторное поле определяется всего одной
функцией от 2п переменных — гамильтонианом.
Теорема 11.1 (Нётер). Функция a G С°°(Т*М) является пер-
первым интегралом гамилътоновой системы
А = ft(A), A G Т*М, A1.25)
т. е.
etha = a fGl,
тогда и только тогда, когда она коммутирует по Пуассону с га-
гамильтонианом: Г 7 Т гл
\а,п\ = 0.
Доказательство. Тождество etha = а равносильно равенст-
равенству 0 = ha = {/г, а}. ?
Следствие 11.2. Справедливо равенство ethh = /г, т. е. любой
гамильтониан h G С°°(Т*М) есть интеграл соответствующей га-
мильтоновой системы A1.25).
Из тождества Якоби для скобки Пуассона следует также, что мно-
множество первых интегралов гамильтоновой системы A1.25) образует
алгебру Ли относительно скобки Пуассона.
Следствие 11.3. Если {/г, а} = {/г, Ь} = 0, то {/г, {а, Ь}} = 0.
Замечание. Построенный гамильтонов формализм обобщается
на произвольные симплектические многообразия.
А сейчас мы рассмотрим конструкцию, работающую только на
Т*М. Возьмем векторное поле X G VecM и определим функцию
Гамильтона ^ ? Соо(т*м))
линейную на слоях Т*М, следующим образом:
X*(\) = (\,X(q)), \GT*M, q = n(X).
В канонических координатах (?, ж) на Т*М имеем
г=1
Из этого координатного представления следует, что
{Х*,У*} = [Х,У]*, Х,У G VecM,
11.5. Элементы симплектической геометрии 161
т.е. скобка Пуассона гамильтонианов, линейных на слоях в Т*М,
содержит обычную скобку Ли векторных полей на М.
Гамильтоново векторное поле Х*Е Vec(T*M), соответствующее
гамильтониану X*, называется гамилыпоновым лифтом векторно-
векторного поля X Е VecM. Из координатных представлений A1.26), A1.20)
видно, что —у
Перейдем к неавтономным полям. Пусть Xf — неавтономное век-
векторное поле, a f
r xedo
есть соответствующий поток на М. Поток Р = PT,t действует на М:
Р: М^М, Р: qo^qu
его дифференциал переносит касательные векторы вперед:
а сопряженное к нему отображение Р* переносит ковекторы назад:
Имеем поток на ковекторах (т.е. точках кокасательного расслоения):
Р*у. Т*М ^Т*М.
Обозначим через Vt неавтономное векторное поле на Т*М, порож-
порождающее поток P*t:
р*
Тогда
d „,
dt r'* de
? = 0
е=0 М+?-
? = 0
?;tt = vt°p;tt.
Поэтому поток Р* t является репгением задачи Копей
т. е. это левая хронологическая экспонента:
t
Оказывается, имеется простая связь между неавтономным по-
полем Vt и гамильтонианом Х?:
Vt = -X*. A1.27)
Действительно, поток P*t сохраняет тавтологическую форму s, по-
поэтому
LVts = 0.
11 А.А. Аграчев, Ю.Л. Сачков
162 Гл. 11. Дифференциальные формы и симплектическая геометрия
По формуле Картана
Що- = -d{s,Vt),
т. е. поле Vt гамильтоново:
Но 7r*Vt = — Xt, следовательно,
и равенство A1.27) доказано. Учитывая соотношение B.18) между
левой и правой хронологическими экспонентами, получаем
* г
P*t = ехр / — Xq dO = ехр / Х$ dO.
J J
Т t
Доказано следующее утверждение.
Предложение 11.3. Пусть Xt — полное неавтономное поле
на М. Тогда
(ехр I Хв do) = ехр Г JQ dO.
V J J J
t
В частности, для автономных векторных полей X G Vec M
11.5.3. Лагран^севы подпространства. Линейное пространст-
пространство Е, на котором задана невырож:денная билинейная кососимметрич-
ная форма а, называется симплектическим пространством. Напри-
Например, Е = Т\(Т*М) с канонической симплектической формой а = а\
является симплектическим пространством.
Любое подпространство L симплектического пространства Е име-
имеет косоортогональное дополнение
Lz = {x e ?| a(x,L) = 0}.
Подпространство L С Е называется изотропным, если
LcLz.
В силу невырожденности симплектической формы а имеем
dimLz = codimL.
В частности, если подпространство L изотропно, то
dimL ^ - dimE.
Изотропные подпространства максимальной размерности:
L С Lz, dimL = -dimE О L = LZ,
называются лагранжевыми подпространствами.
11.5. Элементы симплектической геометрии 163
Например, в канонических координатах (р, q) на X вертикальное
подпространство {q = 0} и горизонтальное подпространство {р = 0}
лагранжевы.
Существует стандартный способ построения лагранжева подпрост-
подпространства, содержащего любое заданное изотропное подпространство.
Пусть Г С X) — изотропное, а Л С X) — лагранжево подпространство.
Тогда подпространство
Лг d= Л П Tz + Г = (Л + Г) П Tz A1.28)
лагранжево (проверьте). Ясно, что
АгэГ.
В частности, любая прямая в X содержится в некотором лагранжевом
подпространстве.
11*
Гл а в а 12
ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
В этой главе мы докажем фундаментальное необходимое усло-
условие оптимальности для задач оптимального управления — принцип
максимума Понтрягина (ПМП). Чтобы получить бескоординатную
формулировку принципа максимума, мы используем технику сим-
плектической геометрии, изложенную в предыдущей главе. Первая
классическая версия ПМП была получена Л. С. Понтрягиным и его
сотрудниками [15] для задач оптимального управления в евклидовом
пространстве.
12.1. Геометрическая постановка и обсуждение
принципа максимума
Рассмотрим задачу оптимального управления, поставленную в па-
параграфе 10.1 для управляемой системы
<i = fu(q), qeM, ueUcW71, A2.1)
с начальным условием (г\\ — fio 9"i
Определим семейство функций Гамильтона:
А«(А) = (A,/u(g)>, \ет;м, дем, иеи.
В терминах предыдущей главы
ма) = /;(а).
Зафиксируем произвольный момент времени t\ > 0.
В параграфе 10.2 задача оптимального управления была сведена
к исследованию границы множеств достижимости. Сформулируем
необходимое условие оптимальности в этой геометрической поста-
постановке.
Теорема 12.1 (ПМП). Пусть u(t), t G [0,?i], есть допустимое
управление, a q(t) = qu(i) — соответствующее решение задачи Ко-
Коти A2.1), A2.2). Если
q(h)edAqo(ti),
то существует такая липшицева кривая в кокасательном расслое-
нии \ е Ti(t)M, о < t < h,
Xt Ф 0, A2.3)
At = Лад (А*), A2.4)
^«(t) (АО — тахЛ„(А0 A2.5)
для почти всех t ? [0,ti].
12.1. Геометрическая постановка и обсуждение ИМИ 165
Если u(t) — допустимое управление, а А^ — липшицева кривая
в Т*М, для которой выполняются условия A2.3)—A2.5), то говорят,
что пара (u(i),Xt) удовлетворяет ПМП. В этом случае кривая А^ на-
называется экстремалью, а ее проекция q(t) = тг(Л^) — экстремальной
траекторией.
Замечание. Если пара (u(t), Xf) удовлетворяет принципу мак-
максимума, то
= const, te [0,*i]. A2.6)
Действительно, так как допустимое управление u(t) ограниче-
ограничено, максимум в правой части A2.5) молено брать по компакту
{й(?)| t Е [0, ?i]} = U. Далее, функция
<р(Х) = max/in(A)
иеи
липшицева по Л G Т*М. Покажем, что производная этой функции
равна нулю. Для любого допустимого управления u(t)
^ /in(r)(At), <p(XT) = hu{r)(XT),
поэтому
. ^ . , г ^ т.
t—т t—r
Следовательно,
-77 ^(At) ^ {К{т),К(т)} = О,
at t=r
если функция (f(Xt) дифференцируема в точке т. Аналогично,
т)
t—r t—r
поэтому
ip{Xt) ^ 0.
t=r
dt
Итак,
~dt
и тождество A2.6) доказано.
Гамильтонова система принципа максимума
А*=ЛиD)(А4) A2.7)
является расширением исходной системы A2.1) на кокасательное
пространство. Действительно, в канонических координатах А =
= (?, х) Е Т*М из гамильтоновой системы получаем
166
Гл. 12. Принцип максимума Понтрягина
То есть решение Л^ системы A2.7)
есть гамильтонов лифт решения q(t)
системы A2.1):
тг(А*) = qu{t).
Прежде чем доказать принцип
максимума Понтрягина, обсудим это
у тверждение.
Дадим эвристическое объясне-
объяснение того, что кривая ковекторов А^
естественно возникает при изучении
траекторий, приходящих на границу
множества достижимости. Пусть
q1=q(t1)edAqo{t1). A2.8)
Идея состоит в том, чтобы рассмот-
рассмотреть нормальный ковектор ко множе-
множеству достижимости Aqo(ti) вблизи gi,
более точно — нормальный ковектор
к некоторому выпуклому касательно-
касательному конусу к Aqo (ti) в qi. В силу вклю-
включения A2.8) этот выпуклый конус должен быть собственным. Поэто-
Поэтому он имеет опорную гиперплоскость, т. е. линейную гиперплоскость
в TqiM, которая ограничивает полупространство, содержащее этот
конус. Далее, эта опорная гиперплоскость есть ядро некоторого нор-
нормального ковектора Xtl G Т*гМ, Xtl ф 0 (рис. 12.1). Ковектор А^1 —
аналог множителей Лагранжа.
Чтобы построить всю кривую А^, t G [0,?i], рассмотрим поток,
порожденный управлением и(-):
Рис. 12.1. Опорная гиперплос-
гиперплоскость и нормальный ковектор
ко множеству достижимости
Aqo (ti) в точке qi
Легко видеть, что
Pf
te [(Mi].
te [o,*i].
Действительно, если точка q G Aqo (t) достижима из q$ вдоль управле-
управления и(т), т G [0, ?], то точка Ptjtl (q) достижима из до вдоль управления
/ ч \и(т), т G ГО, ^1,
v(r) = < J) ( -,
v } \и(т), г G [t.tx].
Далее, диффеоморфизм Р*,^: М —>• М удовлетворяет условию
Поэтому если q(i) G mtAqo(i), то gi G int H.go(^i). От противного из
включения A2.8) следует, что
q(t)edAqo(t), *e[O,ti].
12.1. Геометрическая постановка и обсуждение ПМП 167
Касательный конус к Aqo(t) в точке q(t) = Ptl:t(qi) имеет нормальный
ковектор Xt = Ptti(\tl). По предложению 11.3 кривая А^, t G [0, ?i],
есть траектория гамильтонова векторного поля /г^), т. е. гамильто-
новой системы ПМП.
Несложно получить и условие максимума ПМП. Касательный ко-
конус к A.qQ(t\) в qi должен содержать инфинитезимальное множество
достижимости из точки (ft:
fu(Qi) ~ hit^iQi),
т. е. множество векторов, получаемых вариациями управления и вбли-
вблизи t\. Поэтому ковектор Xtl до лжет задавать опорную гиперплоскость
к этому множеству:
(А<1,/«-/й(«1))<0, ueU,
т. е.
К{^г) = (А*15 fu) ^ (Atl, /n(ti)) = 'i2(t1)(At1), ueU.
Перенося ковектор Xtl потоком P?tl, получаем условие максимума
K{x) ^h(A) U te
Следующее утверждение демонстрирует силу принципа макси-
максимума.
Предложение 12.1. Предположим, что максимизированный
гамильтониан принципа максимума
Н(Х) = тах/гм(Л), Л G Т*М,
uEU
определен и С2-гладок на Т*М \ {X = 0}.
Если пара (u(t),Xt), t G [0, ?i], удовлетворяет принципу максиму-
максимума, то _,,
А«=Я(А0, *G[O,ti]. A2.9)
Обратно: если липшицева кривая Xt Ф 0 является решением га-
милътоновой системы A2.9), то можно подобрать допустимое
управление u(t), t G [0,?i], так, чтобы пара (u(t),Xt) удовлетворяла
ПМП.
Иными словами, в благоприятном случае, когда максимизирован-
максимизированный гамильтониан Н является С2-гладким, принцип максимума сво-
сводит задачу к исследованию решений всего одной гамильтоновой сис-
системы A2.9). С точки зрения размерности это — лучшее, чего можно
ожидать. Действительно, для полномерного множества достижимос-
достижимости (dimAqo(ti) = п) имеем dimdAqo{t\) = п — 1, т.е. нам требуется
(п — 1)-параметрическое семейство кривых для описания границы
dAqo(ti). С другой стороны, семейство решений гамильтоновой сис-
системы A2.9) с начальным условием тг(Ао) = qo является п-мерным.
Учитывая однородность гамильтониана Н:
Н(сХ) = сЯ(А), О 0,
168 Гл. 12. Принцип максимума Понтрягина
е*Й(с\0) = се^(Ло), тг о е*Й(с\0) = тг о е^(А0),
получаем искомое (п — 1)-мерное семейство кривых.
Докажем предложение 12.1.
Доказательство. Покажем, что если допустимое управле-
управление u(t) удовлетворяет условию максимума A2.5), то
, *e[O,ti]. A2.10)
По определению максимизированного гамильтониана Н
я(А)-А5D)(А)^о \ет*м, te[o,ti].
С другой стороны, в силу условия максимума ПМП A2.5) вдоль экс-
экстремали Xt это неравенство обращается в равенство:
tf(At)-Asw(At) = O, *e[0,«i].
Поэтому
d\tH = d\thu{t)i t e [0,?i].
Но гамильтоново векторное поле получается из дифференциала га-
гамильтониана стандартным линейным преобразованием, поэтому ра-
равенство A2.10) доказано.
Обратно: пусть Xt ф 0 есть траектория гамильтоновой системы
А^ = H(\f). Так лее, как в доказательстве теоремы Филиппова, вы-
выберем допустимое управление u(i), на котором достигается максимум
вдоль А^:
H(Xt) = hu(t)(Xt) = max hu(\t).
Мы показали выше, что тогда выполняется равенство A2.10). Поэто-
Поэтому пара (u(i),Xt) удовлетворяет принципу максимума. ?
12.2. Доказательство принципа максимума Понтрягина
Начнем с двух вспомогательных утверждений.
Обозначим положительный ортант в Мт через
К? = {(хъ ..., хт) в Шт\ Xi > 0, i = 1,.. •, т}.
Лемма 12.1. Пусть вектор-функция F: Мт —>> W1 липшицева,
F@) = 0, и дифференцируема в 0:
dx
Предположим, что
F^(W^) =Rn.
Тогда для любой окрестности начала координат Oq С Мт имеем
Замечание. Утверждение предыдущей леммы остается в силе,
если заменить ортант WV; на произвольный выпуклый конус С С Мт.
12.2. Доказательство принципа максимума Понтрягина 169
Приведенное ниже доказательство проходит в этом случае без изме-
изменений.
Доказательство. Выберем любые точки yQ,..., уп Gln, по-
порождающие n-мерный симплекс с центром в нуле:
г=0
Из сюръективности отображения Fq : М™ —>> W1 и выпуклости поло-
положительного ортанта WL™ легко следует, что ограничение на внутрен-
ность
о
intRm также сюръективно:
3 Vi Е int W? такие, что F^Vi = y^ i = 0,..., п.
Точки г/о •> • • • •> Уп аффинно независимы в W1, поэтому их прообразы vq ,
..., vn также аффинно независимы в Мт. Среднее арифметическое
1
V =
n+l
г=0
принадлежит int W± и удовлетворяет равенству
F& = 0.
Далее, подпространство
W = span {vi - v | i = 0,..., n} С Rm
n-мерно. В силу включения v G intM!p можно найти n-мерный шар
В$ С W достаточно малого радиуса 5 с центром в нуле такой, что
v + Bs С
Так как F^{vi — v) = i7^, имеем FqVF = Мп, т. е. линейное отображе-
отображение F^ : W -)> Mn обратимо.
Рассмотрим следующее семейство отображений:
Ga:Bs->Rn, ае[0,ао),
Ga(w) = -F(a(v + w)), а>0,
G0(w) = F^w.
По условию предлож:ения
поэтому
GaH = F> + o(l), а^О, WG4 A2.11)
В силу липшицевости отображения F все отображения Ga также
липшицевы с общей константой. Следовательно, семейство Ga рав-
равностепенно непрерывно. Равенство A2.11) означает, что
Ga -^Go, a^ 0,
поточечно, поэтому равномерно.
170 Гл. 12. Принцип максимума Понтрягина
Следовательно, непрерывное отображение Ga о Gq1 : Gq(B$) —>> W1
равномерно близко к тождественному отображению, а разность Id —
— Ga о Gq1 равномерно близка к нулевому отображению. Для любого
х Е Мп, достаточно близкого к началу координат, непрерывное отоб-
отображение
Id-GaoG^+x
переводит множество Go(Bs) в себя. По теореме Брауэра о неподвиж-
неподвижной точке у этого отображения существует неподвижная точка х Е
е Go(Bs):
х — Ga о Gq1(x) + x = ж,
т. е.
GaoG^ix) =х.
Получаем включение int Ga о Gq1(Bs) Э 0, следовательно, int F(aB$) Э
Э 0 для малых а > 0. ?
Начнем построение выпуклой аппроксимации множества достижи-
достижимости Aqo(ti) в точке q\ = q(t\). Возьмем любое допустимое управле-
управление u(i) и выразим конечную точку соответствующей траектории по
формуле вариаций B.28):
Qu(ti) = Qo ° ехр / /n(r) dr = q0oexp /й(г) + (/n(r) - /й(г)) dr =
о о
= до о ехру /5(r) dr о ехру (Р*1)^ (/м(т) - /ад) ^г =
о о
*1
= (/! о ехр | (Р^1) # (/„(г) - /й(г)) dr.
о
Введем следующее векторное поле, зависящее от двух параметров:
gT,u = {Pl1)Mu-k(T)), repMi], «ее/. A2.12)
Мы показали, что
*i
^n(^i) = gi о ехр / ^Г5М(Г) dr. A2.13)
о
Заметим, что _ п ^ \п + ^
Лемма 12.2. Пусть Т С [0, ?i] естъ множество точек Лебега
управления и(-). Если
TqiM = cone{#r,n(gi)| r eT, ueU},
mo
gi e int Aqcih).
12.2. Доказательство принципа максимума Понтрягина 171
Замечание. Множество cone {gT,u(Qi) I T ? Т, и G [/} С Т?1М
и есть локальная выпуклая аппроксимация множества достижимос-
достижимости Aqo(ti) в точке qi.
Напомним, что точка г G [0, ?i] называется точкой Лебега функ-
функции и G Z/1 [0, ti], если
t
lim —Ц [ \и(в) - u(r)\dO = 0.
t-*T \t — T\ J
T
t
В точках Лебега функции и интеграл J и(в) dO дифференцируем и
Множество точек Лебега имеет полную меру в области определе-
определения [0, ti]. Подробное изложение этого вопроса читатель может найти,
например, в [147].
Докажем лемму 12.2.
Доказательство. Можно выбрать векторы
так, чтобы они порождали как положительный выпуклый конус все
касательное пространство:
i)| г = 1,...,&} = TqiM,
и чтобы при этом точки Ti были различными: Т{ф т^, г ф j. Действи-
Действительно, если Т{ = Tj для некоторых г ф j, то можно подобрать доста-
достаточно близкую точку Лебега rj ф Tj так, чтобы разность gT'.,uj(Qi) ~
— gTj,uj(Qi) была сколь угодно малой. Это возможно, так как для
любых г G Т и любых е > 0
—!— meas {t; G [r, t] \ \u(t') - и{т) \ ^ е} -+ 1 при t -^ г.
г ~~ т
Будем считать, что т\ < t<i < ... < т&.
Определим семейство вариаций управления, совпадающее вблизи
точек Ti с щ, & вдали от этих точек — с управлением и(-) (такие
вариации называются игольчатыми).
А именно, для любых s = (si,..., s^) G M^ рассмотрим управление
вида
{, t G [ri,Ti + Sj],
/с A2.14)
й(^) ^и[ + ]
При малых s отрезки [r^, Ti + s^] не пересекаются, так как ^ ф Tj, i ф j.
По формуле A2.13) конец траектории, соответствующей построенно-
172 Гл. 12. Принцип максимума Понтрягина
му управлению, выражается следующим образом:
Qua(ti) = go ° ехр / fUa(t) dt =
о
Tl+Sl T2+S2 Tfc+Sfc
= gi о ехр / 9ttUl dt о ёзф / #t?n2 dt о ... о exp / gtiUk dt.
Отобралсение
F: s = (si,...,sfe) ь^ gWe(ti)
липшицево, дифференцируемо при s = 0 и
О Si s=q
По лемме 12.1
F@) = qi G ir
для любой окрестности Oq Clfe. Но кривая qUs{t), t G [0, ?1], является
допустимой траекторией при малых s G М+, поэтому ,Р(ОоПМ+) С
Теперь мы можем доказать принцип максимума Понтрягина в
геометрической формулировке — теорему 12.1.
Доказательство. Предположим, что конец траектории
q1 = q(t1)€dAgo(t1).
По лемме 12.2 начало координат 0 G TqiM принадлежит границе вы-
выпуклого множества cone{gt,u(qi)\ t G X, и G ?/}, следовательно, это
множество имеет опорную гиперплоскость в нуле: существует
АAег;д \tlJL0,
такое, что
(Ati^ufai)) ^ ° Vn.B.t G [0,ti], iz G 17.
Учитывая определение A2.12) поля g^w, перепишем это неравенство
в следующем виде:
Действие потока Р\х на ковекторы определяет кривую в кокасатель-
кокасательном пространстве:
At d= (P}1 )*Atl e T${t)M, t e [о,h].
12.3. ПМП для задачи со свободным временем 173
Используя эту кривую ковекторов, приведенное выше неравенство
можно переписать как
Поэтому вдоль выбранной траектории выполняется условие максиму-
максимума ПМП A2.5):
К{М) ^ Лад (Л*) VueU, Vn.B.tG [(Mi].
По предложению 11.3 кривая Л^ есть траектория неавтономного га-
мильтонова потока с функцией Гамильтона f~rt\ = ^n(t):
(^ ? V - г-
Xt = Xtl о I ехр / /й@) dO I = Xtl о ехр / ft5@) d9,
поэтому она удовлетворяет гамильтоновой системе принципа макси-
максимума A2.4)
Xt = hu(t)(Xt). ?
12.3. Геометрическая формулировка ПМП для задачи
со свободным временем
В предыдущем параграфе был доказан принцип максимума Понт-
рягина для задачи с закрепленным конечным временем t\. Теперь
рассмотрим случай свободного t±.
Теорема 12.2. Пусть и(-) — допустимое управление систе-
системы A2.1) такое, что
для некоторых t\ > 0 и г G @,?i).
Тогда существует такая липшицева кривая
xt?T^t)M, Xt /0, (K*^
что
() = O A2.15)
для почти всех t G [0, ti].
Замечание. В задачах со свободным временем появляется до-
дополнительная переменная — конечное время t\. Для исключения этой
переменной добавляется одно условие — равенство A2.15). Это ра-
равенство задает одно скалярное ограничение, так как из предыдущих
двух следует, что hu(t)(Xt) = const; см. замечание после теоремы 12.1.
174 Гл. 12. Принцип максимума Понтрягина
Доказательство. Сведем случай свободного времени к слу-
случаю закрепленного времени, расширяя управляемую систему с по-
помощью замены времени. Допустимыми траекториями расширенной
системы будут перепараметризации траекторий исходной системы
(с сохранением направления траекторий).
Возьмем в качестве нового времени гладкую функцию
(р: М^М, ф>0.
Выведем дифференциальное уравнение для перепараметризованной
траектории:
т. е. искомое уравнение есть
Теперь рассмотрим наряду с исходной управляемой системой
Q = fu(q), ueU,
также расширенную систему вида
q = vfu(q), ueU, \v - 1| < 5, A2.16)
где 5 = ejt\ G @,1). Допустимые управления новой системы суть
а управлению й(-) исходной системы соответствует управление рас-
расширенной системы
«к<) = A, «(<))•
Легко видеть, что включение q(t±) E 9 U *Aqo(t)) означает, что
\|t-ti|<e /
траектория новой системы через точку q0, соответствующая управле-
управлению й(-), попадает в момент t\ на границу множ:ества достилсимости
новой системы за время t\. Следовательно, управление w(t) удовлет-
удовлетворяет принципу максимума с закрепленным временем. Применим
теорему 12.1 к новой системе A2.16). Эта система имеет гамильто-
гамильтониан vhu(X). Условие максимума A2.5) записывается как
1 • hu(t\(\t) = max vhu(Xt).
uEU, \v — l\<8
При ограничении и = u(t) это условие дает
hu{t)(h) = 0,
а при ограничении v = 1 получаем
hu(t)(*t) =maxhu(\t).
Гамильтоновы системы вдоль w(-) и и(-) совпадают между собой, и
теорема доказана. ?
12.4- ПМП для задач оптимального управления 175
12.4. ПМП для задач оптимального управления
Применим принцип максимума в геометрической форме к задачам
оптимального управления, начиная с задач с закрепленным временем.
Для управляемой системы
q = fu(q), q&M, и G U, A2.17)
с граничными условиями
<?@) = Qo, q(ti) = <7ъ Qo,qi € М фиксированы, A2.18)
ti > 0 закреплено, A2.19)
и функционалом
t),u(t))dt A2.20)
о
рассмотрим задачу оптимального управления
J(u) ->> min. A2.21)
Преобразуем эту задачу, как в параграфе 10.2. Расширим прост-
пространство состояний:
q= (fj eRxM,
определим расширенное векторное поле fu G Vec (М х М):
и получим новую управляемую систему
с граничными условиями
Если управление и(-) оптимально для задачи A2.17)—A2.21), то
траектория qu(i) расширенной системы A2.22), начинающаяся в §о,
удовлетворяет условию
где Aqo(ti) — множество достилсимости системы A2.22) из точки q$
за время t\. Поэтому применима теорема 12.1.
Однако принцип максимума в геометрической форме для рас-
расширенной системы A2.22) не различает минимумов и максимумов
функционала J(u). Чтобы получить условия, справедливые только
176 Гл. 12. Принцип максимума Понтрягина
для минимума, введем новый управляющий параметр v и рассмотрим
новую систему
? ^) + т;' о О, ueU. A2.23)
Траектория системы A2.23), соответствующая управлениям v(i) = О,
и{?), попадает на границу множества достижимости этой системы за
время t\. Применим теорему 12.1 к системе A2.23). Имеем
Гамильтониан системы A2.23) имеет вид
а гамильтонова система принципа максимума записывается как
dh n
A2-24)
Здесь hu(i/, A) — гамильтоново поле с гамильтонианом
hu{v,\) = (X,fu) + "P-
Первое из уравнений A2.24) означает, что v = const вдоль оптималь-
оптимальной траектории.
Условие максимума имеет вид
(At, hit)) + v<p(q(t), u(t)) = max ((Xu fu) + vy{q{t),u) + i/v).
ueu, v^o
Так как этот максимум достигается, имеем
i/^O,
поэтому можно положить г; = 0 в правой части условия максимума:
(At, h{t)) + v<p(q(t),u(t)) = max ((Xu fu) + vtp{q{t), u)).
Итак, доказано следующее утверждение.
Теорема 12.3. Пусть управление u(i), t G [0,?i], оптимально
для задачи A2.17)-A2.21):
J(u) = min{J(^)| quih) = q±}.
Определим гамильтониан
K(\) = (\,fu) + v<p(q,u), \ет*м, иеи, v еж.
Тогда существует нетривиальная пара
12.4- ПМП для задач оптимального управления 177
для которой выполняются следующие условия:
= max h?u{\t) Vn.e.te [(Mi],
uEU
v ^ 0.
Замечания. A) Если вместо задачи на минимум A2.21) рас-
рассматривается задача на максимум, то предыдущее неравенство для v
нужно обратить:
v ^ 0.
B) Для задачи со свободным временем t\\ A2.17), A2.18), A2.20),
A2.21), необходимые условия оптимальности ПМП такие лее, как
в теореме 12.3, плюс одно дополнительное скалярное равенство
/г~/^(Аг) = 0 (упражнение).
Для постоянного параметра v в теореме 12.3 имеются две возмож-
возможности:
а) если v ф 0, то кривая Л^ называется нормальной экстремалью.
Так как пару (z^, At) можно умножить на любое положительное число,
мы можем нормировать v < 0 и считать, что в нормальном случае v =
= -i;
б) если v = 0, то Xt есть анормальная экстремаль.
Итак, можно всегда считать, что v = — 1 или v = 0.
Теперь рассмотрим задачу быстродействия:
q = fu{q)> qeM, ueu,
<?@) = 9o, q{h) = <7i, qo,qi фиксированы,
ti
ti = / 1 dt —>- min.
о
Принцип максимума Понтрягина для задачи быстродействия име-
имеет следующую форму.
Следствие 12.1. Пусть управление u(t), t G [0, ?i], оптималь-
оптимально no быстродействию. Определим гамильтониан
л„(А) = (А,/„). Ает;м, иеи.
Тогда существует липшицева кривая
\teT*M, \t /о, te[o,ti],
для которой выполняются следующие условия для почти всех t G
[]
= max hu(\t),
uEU
()^O. A2.25)
12 А.А. Аграчев, Ю.Л. Сачков
178 Гл. 12. Принцип максимума Понтрягина
Доказательство. Применим теорему 12.3 и второе замеча-
замечание после нее, полагая <р = 1. Отсюда сразу получаем гамильтонову
систему и условие максимума для задачи быстродействия. Неравенст-
Неравенство A2.25) равносильно условиям hu(t)(^t) +^ = 0иг/^0.
Наконец, неравенство А^ ф 0 получаем следующим рассуждением:
если Xt = 0, то hu(t)(\t) = 0, поэтому v = 0. Но пара (г/, Л^) должна
быть нетривиальной, следовательно, Л^ ф 0. П
12.5. ПМП для задач с общими граничными условиями
В этом параграфе мы докажем версии принципа максимума Понт-
Понтрягина для задач оптимального управления, в которых граничные
точки траекторий принадлежат заданным многообразиям.
Сначала рассмотрим следующую задачу:
q = fu{q), Q&M, u?UcRm, A2.26)
«@) е No, q(h) e Nu A2.27)
t\ > 0 закреплено, A2.28)
*i
J(u) = Г ip(q(t),u(t)) dt -> min. A2.29)
о
Здесь Nq и Ni — заданные погруж:енные подмногообразия прост-
пространства состояний М. То есть граничные точки д@) и q(t\) больше не
закреплены, как раньше, а принадлежат соответственно подмногооб-
подмногообразиям Nq и JVi.
Если траектория q(t) оптимальна в этой задаче, то она оптимальна
и в задаче с закрепленными граничными точками <f@), <f(?i), рас-
рассмотренной в параграфе 12.4. Следовательно, для траектории q(t)
долж:но выполняться утверждение теоремы 12.3. Однако теперь тре-
требуются дополнительные условия, позволяющие выбрать граничные
точки (f@) G TVo и (f(^i) ^ ^i- Естественно ож:идать, что такие условия
должны определяться (dim Nq + dim Ni) скалярными условиями. И
эти условия можно легко сформулировать в гамильтоновых терми-
терминах, они называются условиями трансверсальности, см. A2.34) ниже.
Теорема 12.4. Пусть управление u(t), t G [0, ?i], оптимально в
задаче A2.26)-A2.29). Определим семейство гамильтонианов:
<(А) = (A, fu{q)) + v<p(q, и), A G T^M, q G M, ueR, ueU.
Тогда существуют липшицева кривая Xt G T~,t^M, t G [0,?i], и
число v G R такие, что:
A* =K{t) (At), A2.30)
h$w(\t)=WBxh»(\t), A2.31)
(\t,v)?@,0), te[O,h], A2.32)
v ^ 0, A2.33)
12.5. ИМИ для задач с общими граничными условиями
179
Xt
A2.34)
Замечания. A) Любой линейный функционал на линейном
пространстве естественно ограничивается на любое подпространство,
поэтому условия трансверсальности A2.34) расшифровываются соот-
соответственно так:
(Ao,v} = 0, veTmN0,
(\tl,w) = О, we Tq^Nx.
B) Задача со свободным вре-
временем A2.26), A2.27), A2.29), сво-
сводится к случаю закрепленного t\
так же, как в параграфе 12.4,
поэтому для такой задачи спра-
справедлива предшествующая теоре-
теорема с дополнительным условием
h~ (Xt) = 0. Рис. 12.2. Условия трансверсаль-
и^ ' ности A2.34)
Докажем теорему 12.4.
Доказательство. Схема доказательства ПМП, использован-
использованная нами для теорем 12.1, 12.3, применима после соответствующих мо-
модификаций к гораздо более общим задачам. Ниже мы только укажем,
как нужно изменить доказательства этих теорем, чтобы охватить
новые граничные условия g@) G TVo, q(t\) G N\.
Сначала рассмотрим частный случай, когда начальная точка за-
закреплена: пусть
n0 = Ш
для некоторой точки q0 G М.
Как и при доказательстве теоремы 12.3, введем расширенную си-
систему на R х М:
--(У
хМ,
ш -
\ Ш
g@) = go =
у = <p(q,u)
4 = fu(q),
(Г
A2.35)
qo
Далее, в случае закрепленной конечной точки q{t\), необходимое
условие оптимальности траектории qu(i) было следующим:
$i edA$0(ti). A2.36)
Здесь Л — множ:ество достиж:имости расп1иренной системы A2.35) и
41 = Ы*!)-
12*
180 Гл. 12. Принцип максимума Понтрягина
Теперь, когда конечное многообразие JVi больше не является точ-
точкой, нужно изменить рассуждения. В некотором смысле мы сведем
конечное многообразие к точке, задавая его локально уравнением Ф =
= 0. Выберем такую субмерсию
ф: °ди(Ч)^ЖР> P = dimM-dimJVb
малой окрестности Oq~,t С М, что
ф-1@) = ЛГ1ПОдЕ(A).
Далее, расширим субмерсию: определим отображение
Так как управление u(t) оптимально в нашей задаче A2.26)-A2.29),
то
$(&) е дФ^М). A2.37)
Поэтому мы заменяем необходимое условие оптимальности A2.36)
на A2.37) и возвращаемся к схеме доказательства теорем 12.1, 12.3.
Возьмем любое k Е N и любую игольчатую вариацию A2.14) опти-
оптимального управления:
Определим отображения
ti
G: Rk чМх М, G(s) = qUs(ti) = qo о ехр Г fUs{t) dt, A2.38)
о
F(s) = $(G(s)) = q0 о exp [fUaWdto$. A2.39)
о
Из включения A2.37) следует, что
Ф(д1) = F@) G dF(Rk+). A2.40)
По лемме 12.1
поэтому существует опорная плоскость, т. е.
такое, что
(I ^Z. Wo, г = 1,...,/с. A2.41)
\ dsi о/
Вычисляем эту производную по правилу цепочки:
^ =Ф*§^ , A2-42)
12.5. ИМИ для задач с общими граничными условиями 181
и переписываем неравенства A2.41) в следующем виде:
dG
*' dsi
— [р Ф
dG
д Si
A2.43)
Затем обозначаем ковектор
Atl = Ф*? = ( { ) e Tft(R x M) A2.44)
и получаем условия A2.30)-A2.33) в точности, как в теореме 12.3.
Единственное отличие — в том, что теперь ковектор А^ не может
быть произвольным: из равенства A2.44) следует второе из условий
трансверсальности A2.34). Действительно, имеем
Atl = ФЧ, ? 6 {W)\
поэтому
=0.
=0
Первое из условий трансверсальности A2.34) сейчас тривиально вы-
выполняется, и теорема в случае АГ0 = {до} доказана.
Теперь пусть начальное многообразие Nq является произвольным
погруженным многообразием в М. Построенную выше схему доказа-
доказательства можно модифицировать, чтобы покрыть и этот случай. Так
как теперь начальная точка q@) не фиксирована, нужно добавить
вариации q@).
Вместо отображений A2.38), A2.39) рассмотрим следующие:
ti
G: No х Rk ->> R x M, G(g, s) = q о ёхр Г fUs{t) dt,
о
*i
F: 7V0 XRk ^M1+p, F(q,s) = ^(G(q,s)) = q о ёщ> J fUs{t) dt оф,
о
где g^ = @, g) G R x M. Тогда необходимое условие оптимальнос-
оптимальности A2.40) заменяется включением
F(q@),0) e dF{No х R\). A2.45)
Применим лемму 12.1 к ограничению отображения F на пространство
Rm ~ Одг@) х Mfe, m = l + k, / = dim7V0,
где Од(о) ^ -^о — малая окрестность точки д@). Согласно замечанию
после леммы 12.1 из включения A2.45) следует, что
182 Гл. 12. Принцип максимума Понтрягина
т. е. существует ковектор
ее(к1+р)*, IV о, f=
для которого
A2.46)
В первом неравенстве v принадлежит линейному пространству, по-
поэтому оно обращается в равенство:
v ? TmN0. A2.47)
По правилу Лейбница вычислим производную
OF
dq
Имеем
О
у е TmN0.
При вычислении производной мы применили формулу B.19) к потоку
о
Теперь условия A2.47), A2.46) записываются в виде
(?, Ф+Р^у) =0, v e TmN0, A2.48)
" П „* — 1 L,
- U, I — ±, . . . , Гь.
Определим, как и раньше, ковектор А^х = (z/, Л^х) равенством
A2.44), тогда утверждения A2.30)-A2.33) данной теоремы и второе
из условий трансверсальности A2.34) будут доказаны.
Первое условие трансверсальности также выполняется: равенст-
равенство A2.48) можно переписать в виде
<Atl,P*1t;) = 0, veTmN0.
Но Ло = Pt* Atl, поэтому
(Ао,v) = (Рг\К,v)=0, vG TmN0.
Теорема полностью доказана. ?
12.5. ИМИ для задач с общими граничными условиями 183
Рассмотрим еще более общую задачу — задачу со смешанными
ограничениями (включение A2.50) ниже). Принцип максимума Понт-
рягина обобщается и на этот случай, как по формулировке, так и по
доказательству.
Изучим задачу оптимального управления вида
q = fu{q), qeM, иеисм™, A2.49)
(<?@), q(h)) e N С М x M, A2.50)
t\ > 0 закреплено, A2.51)
ti
J(u) = Г (p(q(t),u(t)) dt -+ min, A2.52)
о
где N — гладкое погруженное подмногообразие в М х М.
Теорема 12.5. Пусть управление и оптимально в зада-
задаче A2.49)-A2.52). Тогда выполняются все утверждения теоре-
теоремы 12.4, кроме ее условий трансверсальности A2.34), которые
теперь заменяются условием
{-\0,\tl) ±T{mjitl))N. A2.53)
Замечания. A) Мы отождествляем
поэтому условие трансверсальности A2.53) имеет смысл.
B) Важный частный случай смешанных граничных усло-
условий A2.50) есть случай периодических траекторий:
q(h) = g@). A2.54)
Действительно, в этом случае
N = Ad={(q,q)\q?M}cMxM A2.55)
есть диагональ квадрата М х М. Тогда условие трансверсально-
трансверсальности A2.53) имеет вид
((-A0,Ati), («,«)> = ~(Xo,v) + (Xtl,v) = 0, v e Tq@)M = Tq{tl)M,
т. е.
Иными словами, оптимальная траектория в задаче с периодически-
периодическими граничными условиями A2.54) имеет периодический гамильтонов
лифт (экстремаль).
Докажем теорему 12.5.
Доказательство. Сведем нашу задачу к случаю раздельных
граничных условий, вводя вспомогательную задачу на М х М:
х = 0
. _ ' . (x,q) е М х М, ueU,
184 Гл. 12. Принцип максимума Понтрягина
(аг@),<7@))еД, Hfi),g(ii))G7V
(диагональ А определена в A2.55) выше),
J{u) = / (p(q(t),u(t)) dt
p(q(),()) min.
о
Очевидно, что эта задача эквивалентна нангей задаче A2.49)—A2.52).
Применим одну из версий ПМП (теорему 12.4) ко вспомогательной
задаче. Гамильтониан такой же, как и для исходной задачи:
K(v, А) = К(\) = (А, Ш) + Мд, и), (v, Л) е т*м © т*м.
Соответствующая гамильтонова система есть
(* ^ A2.56)
Vt =K(t) (\t).
Все утверждения ПМП для задачи со смешанными граничными усло-
условиями получаются непосредственно, нужно только проверить условия
трансверсальности.
В начальный момент t = 0 первое из условий A2.34) имеет вид
((ту0, Ао), (v, v)) = G70, v) + (Ао, v)=0, v G 7~@)M,
т. e.
^0 + Ao = 0,
или, с учетом первого из уравнений A2.56),
Vt! = -Ао-
А в конечный момент t = t\
(rjtl,\tl) ±T@(tl>}fi(tlftN,
т. е.
(-Ao, Xtl) _L T(g(OMg(tl)OV,
что совпадает с условием трансверсальности A2.53). ?
Замечания. A) Разумеется, если конечное время t\ свободно,
то к утверждениям теоремы 12.5 добавляется условие ^-^(А^) = 0.
B) Принцип максимума Понтрягина выдерживает и дальнейшие
обобщения для более широких классов функционалов и граничных
условий. После некоторой модификации рассуждений общая схема
дает необходимые условия оптимальности для более общих задач.
Глава 13
ПРИМЕРЫ ЗАДАЧ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ
В этой главе мы применим принцип максимума Понтрягина для
решения конкретных задач оптимального управления.
13.1. Скорейшая остановка поезда на станции
Рассмотрим поезд, движущийся по железной дороге. Задача со-
состоит в том, чтобы привести поезд на станцию и остановить его там
за кратчайшее время.
Положение поезда описывается действительной координатой х\\
начало отсчета О Е М. соответствует станции. Будем считать, что поезд
движется без трения, а мы управляем ускорением поезда, приклады-
прикладывая ограниченную по модулю силу. Подберем единицы измерения так,
чтобы максимальное по модулю ускорение было единичным.
Получаем управляемую систему
х\ = и, х\ Е R, \и\ ^ 1,
или, в стандартной форме,
} = х* х=(х1)еш2, н<1. A3.1)
х2 = и, Vе2/
Для этой системы имеем задачу быстродействия
х@)=х°, ж(*1) = 0, A3.2)
*i ->> min. A3.3)
Покажем, что теорема Филиппова гарантирует существование оп-
оптимальных управлений. Пространство управляющих параметров U =
= [—1,1] компактно, векторные поля в правой части
линейны, а множество допустимых скоростей в точке
f(x,U) = {f{x,u)\ \u\ <1}
выпукло. По следствию 10.2 задача быстродействия имеет решение,
если начало координат 0 G М2 достижимо из начальной точки х°. Мы
покажем ниже, что любую точку жЕМ2 можно соединить с началом
координат некоторой экстремальной кривой.
186 Гл. 13. Примеры задач оптимального управления
Применим принцип максимума Понтрягина. Введем канонические
координаты на кокасательном расслоении:
х= h
Зависящий от управления гамильтониан ПМП равен
а соответствующая гамильтонова система имеет вид
dhu
В координатах эта система распадается на две независимые подсис-
подсистемы:
A3.4)
Согласно принципу максимума, если управление и(-) оптимально по
быстродействию, то гамильтонова система имеет нетривиальное ре-
решение (?(?), ж(?)), ?(?) ф 0, для которого
'At)) > 0.
Из условия максимума заключаем, что если ?г(?) / 05 т0
u(t) = sgn6W-
Заметим, что максимизированный гамильтониан
негладок. Поэтому предлолсение 12.1 неприменимо, но мы сможем
описать оптимальные управления непосредственно из принципа мак-
максимума, без предварительной максимизации гамильтониана.
Так как
?2 = 0,
то функция ?2 линейна:
?2(t) = a + /3t, a, /3 = const,
поэтому оптимальное управление имеет вид
u(t) = sgn(a + /3?).
Следовательно, u(t) кусочно постоянно, принимает только экстре-
экстремальные значения ±1 и имеет не более одного переключения (точки
разрыва).
13.1. Скорейшая остановка поезда на станции
187
Отыщем все траектории х{?), соответствующие таким управле-
управлениям и приходящие в нуль. Для управлений и = =Ы первая из подсис-
подсистем A3.4) принимает форму
Траектории этой системы удовлетворяют уравнению
это параболы вида
= ±— + С, С = const.
Найдем сначала траектории из этого семейства, приходящие в
нуль без переключений: это две полу параболы
ffi =
2 '
Х\ = -
2 '
х2 < 0, х2 > О,
Ж2 > О, Х2 < О,
A3.5)
A3.6)
для и = +1 и и = —1 соответственно.
Теперь отыщем все экстремальные траектории с одним переклю-
переключением. Пусть (xis,X2s) ? ^2 есть точка переключения любой из
кривых A3.5), A3.6). Тогда экстремальные траектории с одним пе-
-4\
I -2\
и= 1
СО
Рис. 13.1. Оптимальный синтез в задаче A3.1)-A3.3)
188 Гл. 13. Примеры задач оптимального управления
реключением, приходящие в начало координат, имеют вид
?2 < О,
#2/2, 0 > х2 > x2s, x2 > О,
A3.7)
{xl/2xls/2 + xls, x2<x2s, x2 > О,
A3.8)
/2 0 < < x2s, x2 < 0.
Легко видеть, что через любую точку (хi,x2) плоскости проходит
единственная кривая вида A3.5)—A3.8). Итак, для любой точки плос-
плоскости существует единственная экстремальная траектория, переводя-
переводящая эту точку в нуль. Так как оптимальные траектории существуют,
заключаем, что найденные решения оптимальны. Общий вид опти-
оптимального синтеза изображен на рис. 13.1.
13.2. Управление линейным осциллятором
Рассмотрим линейный осциллятор, движением которого можно
управлять с помощью ограниченной по величине силы. Соответст-
Соответствующая управляемая система (после выбора подходящих единиц из-
измерения) есть
х\ + х\ = и, \и\ ^1, х\ G R,
или, в канонической форме,
х2 = -хг+щ
Рассмотрим для этой системы задачу быстродействия
х@) = ж0, x(h) = 0, A3.10)
*i -^ min. A3.11)
По теореме Филиппова, оптимальные управления существуют.
Как и в предыдущей задаче, применим принцип максимума: функция
Гамильтона есть
а гамильтонова система записывается как
[х2 = —х\ + и,
Из условия максимума ИМИ получаем
поэтому оптимальные управления удовлетворяют условию
Для переменной ^2 имеем уравнение
б = -6,
13.2. Управление линейным осциллятором 189
следовательно,
?2 = asm.(t + /3), а,/3 = const.
Заметим, что а ф 0. Действительно, если ?2 = 0, т0 ?i = ~^ciif) = 0,
поэтому ?(?) = (?i(?),?2(?)) = 0, чт0 противоречит принципу максиму-
максимума. Следовательно, _
u(t) = sgn(a sin(? + /3)).
Из этого равенства получаем полное описание возможной структу-
структуры оптимального управления. Интервал между последовательными
моментами переключения управления u{t) имеет длину тг. Пусть т G
G [0, тг) — первая точка переключения u(t). Тогда
te [0,г)и[г + 7г,г + 27г)и[г + 37г,г + 4тг)и...,
Ч)~ \-sgn2@), te [г,г + 7г)и[г + 2тг,г + 37г)и...
То есть u(t) параметризовано двумя числами: первым моментом пе-
переключения г G [0, тг) и начальным знаком sgniif(O) G {=Ы}.
Оптимальное управление u(t) принимает только экстремальные
значения ±1. Поэтому оптимальные траектории (xi(i),X2(i)) состоят
из кусков, удовлетворяющих системе
^=Ж2' ,Л A3.12)
х2 = —х\ ±1,
т. е. из дуг окружностей
{х\ ± IJ + х\ = G, G = const,
проходимых по часовой стрелке.
Опишем все оптимальные траектории, приходящие в начало коор-
координат. Пусть 7 — любая такая траектория. Если 7 не имеет переклю-
переключений, то это — дуга, содержащаяся в одной из полуокружностей
{х1-1J + х\ = \, ж2^0, A3.13)
(я1 + 1J + ж! = 1, х2 ^0, A3.14)
и проходящая через нуль. Если у 7 есть переключения, то последнее
переключение может произойти в любой точке этих полуокружностей,
кроме нуля. Предположим, что 7 имеет последнее переключение на
полуокружности A3.13). Тогда часть 7 между последним и предпос-
предпоследним переключениями есть половина окружности [х\ + IJ + ж| =
= G, проходящая через последнюю точку переключения. Предпослед-
Предпоследнее переключение 7 происходит на кривой, получающейся вращением
ПОЛуОКруЖНОСТИ A3.13) ВОКруГ ТОЧКИ ( — 1,0) В ПЛОСКОСТИ (Ж1,Ж2) на
угол тг, т. е. на полуокружности
(ж1 + 3J + ж| = 1, ж2^0. A3.15)
Для получения геометрического места точек предыдущего переклю-
переключения 7 необходимо повернуть полуокружность A3.15) вокруг точ-
точки A,0) на угол тг; получаем полуокружность
(ж1 - 5J + Ж2, = 1, х2 ^ 0.
190
Гл. 13. Примеры задач оптимального управления
Предыдущее переключение 7 происходит на полуокружности
(гг. _|_ 7"\2 J_ т»2 1 т» "> П
^«^1 ~\~ I j ~\~ «^2 — J-5 •*/2 ^ ^5
И Т.Д.
Случай, когда последнее переключение 7 происходит на полу-
полуокружности A3.14), получается из только что рассмотренного слу-
случая центральной симметрией плоскости {х\,х2) относительно нуля:
(xi,x2) Н> (—а?1, — х2). Последовательные переключения 7 (в обратном
порядке, начиная с конца) происходят на полуокружностях
(гр _|_ I Л*1 I гр^1 1 гр ^> Г)
I JU \ \^ л.) \^ *^2 -L j «^2 ^ ^5
(Ж^ ~\ О) п~ *^2 — 5 Х2 ^ U,
^ 7\^ -L о-2 1 т* <^ П
^«ь^ / j ~т~ Jb2 — J-5 •*/2 ^ ^5
и т. д. Мы получили кривую переключения в плоскости
(xi — Bк — I)J + #2 = 1, ^2 ^ 0, /с G N,
A3.16)
=
Эта кривая переключения делит плоскость (a?i, Ж2) на две части. Лю-
Любая экстремальная траектория (xi(t),x2(t)) в верхней части плоскос-
плоскости является решением уравнения A3.12) с —1 во втором уравнении,
-6 1 (-4
тг ffi
и = 1
Рис. 13.2. Оптимальный синтез в задаче A3.9)—A3.11)
13.3. Наиболее экономная остановка поезда 191
а в нижней части — решением уравнения A3.12) с +1. Для любой
точки плоскости (ж1,Ж2) существует в точности одна кривая это-
этого семейства, приходящая в начало координат (она имеет форму
«спирали» с конечным числом переключений). Так как оптимальные
траектории существуют, построенные экстремальные траектории оп-
оптимальны.
Задача быстродействия решена: в части плоскости (#1,2:2) выше
кривой переключения A3.16) оптимальное управление есть и = — 1,
а ниже этой кривой и = +1. Через любую точку плоскости проходит
единственная оптимальная траектория, соответствующая этому пра-
правилу оптимального управления. После конечного числа переключений
любая оптимальная траектория попадает в начало координат. Общий
вид оптимального синтеза изображен на рис. 13.2.
Теперь мы рассмотрим задачи оптимального управления с той
же динамикой, что и в предыдущих двух параграфах, но с другим
функционалом.
13.3. Наиболее экономная остановка поезда
Как и в параграфе 13.1, мы управляем движением поезда. Теперь
наша цель — в том, чтобы остановить поезд в заданный момент
времени с минимальным расходом энергии, которая предполагается
пропорциональной интегралу от квадрата ускорения.
Получаем задачу оптимального управления:
2 = Щ
x(fi) = ж0, x(t\) = 0, t\ закреплены,
- и2 dt —>• min.
о
Теорема Филиппова напрямую неприменима, так как правая
часть системы некомпактна. Впрочем, если выбрать новое время
t \—> — J и2(т) dr + С, можно получить ограниченную правую часть,
2 о
затем компактифицировать и применить теорему Филиппова. Таким
образом можно доказать существование оптимального управления.
Общую теорию задач этого класса (линейно-квадратичных) мы
построим в гл. 16.
Используем принцип максимума для нахождения оптимального
управления. Функция Гамильтона есть
hu(?ix) = ?i^2 + ?2^ Н— и2, (?,ж) G М2* х М2.
Вдоль оптимальных траекторий
у ^ 0, v = const.
192 Гл. 13. Примеры задач оптимального управления
Из гамильтоновой системы принципа максимума получаем
[f = % A3-17)
Сначала рассмотрим случай анормальных экстремалей:
i/ = 0.
Тройка (^1,^2?^) должна быть ненулевой, поэтому
Ы<) ^ о-
Но из условия максимума ПМП следует, что
u{t)i2{t) = тахг^О). A3.18)
Так как ?г(?) ф 0, то максимум выше не достигается. Следовательно,
анормальных экстремалей нет.
Рассмотрим нормальный случай: v ф О, молено положить у = — 1.
Нормальный гамильтониан равен
hu(€,x) = ft^,^) = ^ix2 +6^- 2 ^2-
Условие максимума ПМП равносильно тождеству = 0, поэтому
«(*) = б(<)
вдоль оптимальных траекторий. Учитывая систему A3.17), заключа-
заключаем, что оптимальное управление линейно:
u(t) = at + f3, a, C = const.
Максимизированный гамильтониан
- f!
гладок. Поэтому оптимальные траектории удовлетворяют гамильто-
гамильтоновой системе
6=0,
Для переменной ж^ получаем граничную задачу
х<Р = 0,
Ж1@) = ж?, ii@) = ^, zi(*i) = 0, iri(ti) = 0. A3.19)
Для любых (^5,^2) существует в точности одно решение x\(t) этой
задачи — кубический сплайн. Функция X2(i) находится из уравне-
уравнения Х2 = Х\.
Итак, через любую начальную точку х° G М2 проходит единствен-
единственная экстремальная траектория, попадающая в начало координат. Это
13.4- Управление линейным осциллятором с критерием качества 193
кривая (xi(t),X2(i)), t G [0,?i], где xi(t) — кубический многочлен,
удовлетворяющий граничным условиям A3.19), a X2(i) = x\(t). В силу
существования эта траектория оптимальна.
13.4. Управление линейным осциллятором
с критерием качества
Мы управляем линейным осциллятором, например, маятником с
малой амплитудой, неограниченной силой и, но учитываем расход
энергии, которая измеряется интегралом - J u2(t) dt. Задача опти-
оптимального управления записывается как
(хг = х2
\х2 = -^
ж@) = ж0, x{t\) = 0, t\ закреплены,
2 о
«= ? 6R», «6R,
1? \X2j
- / и2 dt —>• min.
Существование оптимального управления можно доказать так же,
как в предыдущем параграфе.
Гамильтониан принципа максимума равен
Из соответствующей гамильтоновой системы получаем
Hi = 6,
Так же, как в предыдущем параграфе, показываем, что анормаль-
анормальных экстремалей нет, поэтому можно положить v = — 1. Из условия
максимума следует, что
ад = &(*)•
В частности, оптимальное управление есть гармоника:
u(t) = asin(t + /3), а,/5 = const.
Система уравнений для экстремальных траекторий
XI = Х2,
Х2 = —х\ + a sm(t + /5)
допускает явное решение:
#i(?) = —— tcos(t + yS) + asin(t + 6),
a a A3-20)
X2(t) = -tsm(t + C) - -cos(^ + /3) + (^ + 6) beR
13 А.А. Аграчев, Ю.Л. Сачков
194 Гл. 13. Примеры задач оптимального управления
Упражнение 13.1. Покажите, что граничным условиям удов-
удовлетворяет единственная экстремальная траектория вида A3.20).
Оптимальное управление существует, следовательно, эти экстре-
экстремальные траектории оптимальны.
13.5. Машина Дубинса
В этом параграфе мы изучим задачу быстродействия для системы,
которая называется машиной Дубинса, см. уравнения A3.21) ниже.
Первым эту систему рассматривал А.А. Марков в 1887 году [109].
Рассмотрим машину, движущуюся по плоскости. Машина может
ехать вперед с постоянной линейной скоростью и одновременно по-
поворачиваться с ограниченной угловой скоростью. Выберем начальное
и конечное положение и ориентацию машины на плоскости. Задача
состоит в том, чтобы перевести машину из начальной конфигурации
в конечную за минимальное время.
Допустимые траектории машины — плоские кривые ограниченной
кривизны. Параметризуя кривые длиной дуги, можно поставить дан-
данную задачу геометрически. Зафиксируем две точки на плоскости и
два единичных вектора, приложенных соответственно в этих точках.
Требуется найти кривую на плоскости, выходящую из первой точки
с первым вектором скорости и входящую во вторую точку со вторым
вектором скорости, имеющую кривизну, ограниченную сверху задан-
заданной константой, и кратчайшую среди всех таких кривых.
Замечание. Аналогичная задача с неограниченной кривизной,
вообще говоря, не имеет решений. Действительно, точная нижняя
грань длин всех кривых, удовлетворяющих граничным условиям без
ограничения на кривизну, равна расстоянию между начальной и ко-
конечной точками: соединяющий эти точки отрезок можно приблизить
гладкими кривыми, удовлетворяющими граничным условиям. Но эта
нижняя грань не достигается, если граничные векторы скорости не
сонаправлены вектору, соединяющему граничные точки.
После выбора подходящих единиц измерения получаем задачу
быстродействия для нелинейной системы
'Х\ = COS0,
2 = sin(9, A3.21)
= и,
х = (хих2) еМ2, вев1, \и\^1,
ж@), 0@), x(ti), 6(ti) закреплены,
t\ —>> min.
Существование решений следует из теоремы Филиппова. Приме-
Применяем принцип максимума Понтрягина.
13.5. Машина Дубинса 195
Имеем {хъх2,О) G М = М^ х^1, обозначим через (?ъ?2,аО соот-
соответствующие координаты присоединенного вектора. Тогда
и зависящий от управления гамильтониан равен
hu (А) = ?1 cos # + ?2 sin 0 + /ш.
Из гамильтоновой системы принципа максимума следует, что
? = О, A3.22)
fi = & sin 0 - ?2 cos 0, A3.23)
а условия максимума записываются как
H{t)u{t) = max n{t)u. A3.24)
|n|^l
Уравнение A3.22) означает, что ? постоянно вдоль оптимальных тра-
траекторий, поэтому правую часть A3.23) молено переписать как
?1 sin# — ?2 cos# = asin(# + /3), а,/3 = const, a
A3.25)
Итак, из гамильтоновой системы ИМИ A3.21)—A3.23) получена сис-
система
\в = и.
Из условия максимума A3.24) следует, что
u(t) = sgn/i(t) при n{t) ф 0. A3.26)
Если а = 0, то (?i, ?2) = 0 и /i = const ^ 0, поэтому ?i = const = =Ы.
Следовательно, кривая x(t) есть дуга окрулености радиуса 1.
Пусть а ф 0, тогда из A3.25) получаем а > 0. Условия A3.22)-
A3.24) сохраняются при умножении присоединенного вектора (?,/i)
на любое положительное число. Можно подобрать (?, /i) так, что а =
= Vsi+й = 1- Поэтому далее будем считать, что
а = 1.
Условие A3.26) означает, что поведение знака функции /i(t) имеет
решающее значение для структуры оптимального управления. Рас-
Рассмотрим несколько возможностей для fi(t).
@) Если функция n(t) не обращается в нуль на отрезке [0,?i], то
оптимальное управление постоянно:
u(i) = const = =Ы, t G [0,*i], A3.27)
а оптимальная траектория x(t), t G [0, ?1], есть дуга окружности.
Отметим, что оптимальная траектория не может содержать полной
окружности: окружность можно исключить, при этом полученная
траектория удовлетворяет граничным условиям и короче исходной.
Поэтому управление A3.27) оптимально только при t\ < 2тг.
13*
196 Гл. 13. Примеры задач оптимального управления
Далее можно предполагать, что множество
М = {т€[О,и]\(х(т)фО}
отлично от всего отрезка [0, ?i]. Так как N открыто, оно является
объединением открытых интервалов на [0, t-\\ плюс, быть может, по-
полуоткрытые интервалы вида [0, ti), (t2,?i].
A) Предположим, что множество N содержит интервал вида
{тът2) С [(Mi], n <т2. A3.28)
Можно считать, что интервал (ti,T2) максимален по включению:
Mri) = /х(т2) = О, М|(Г1,Г2) Ф 0.
Из принципа максимума получаем неравенство
^(t)(A(t)) = cos@(*) + P) + fi(t)u{t) > 0.
Поэтому
cos((9(n)+/3) ^0.
Это неравенство означает, что угол
удовлетворяет включению
Рассмотрим сначала случай
Тогда /i(ri) = sin# > 0, поэтому в момент т\ управление переключа-
переключается с —1 на +1, поэтому
u(t) = i, *е(тьт2).
Вычислим расстояние т2 — т\. Так как
Т1
= / sinF> + т - Ti) dr = 0,
имеем Г2 — т\ = 2(тг — 0), поэтому
Т2-Т1 G [тг,2тг). A3.29)
В случае
U [f ,2.)
включение A3.29) доказывается аналогично, а в случае в = 0 опти-
оптимальных управлений нет (кривая x(t) содержит полную окружность,
которую можно удалить).
Включение A3.29) означает, что последовательные корни ti, t2
функции n(t) не могут быть сколь угодно близки между собой. Более
13.5. Машина Дубинса
197
того, вышеприведенное рассуждение показывает, что в такие момен-
моменты ^ оптимальное управление переключается с одного экстремаль-
экстремального значения на другое, и вдоль любой оптимальной траектории
расстояние между последовательными переключениями т^, т^+х одно
и то же.
Итак, в случае A) оптимальное управление может быть только
следующего вида:
A3.30)
-П= const G [тг, 2тг), г = 1,..., п - 1, A3.31)
П G @,2тг).
Здесь не указаны значения г/, на интервалах до первого переклю-
переключения, t G @,ti), и после последнего
переключения, t G (rn,?i). На таких
траекториях управление принимает
только экстремальные значения ±1,
и количество переключений конечно
на любом компактном отрезке вре-
времени. Такое управление называется
релейным.
Управления u(t) вида A3.30),
A3.31) удовлетворяют принципу мак-
максимума для сколь угодно больших ?,
но они неоптимальны, если количест-
количество переключений п > 3. Действитель-
Действительно, допустим, что такое управление
имеет по крайней мере 4 переклю-
переключения. Тогда кусок траектории x(i),
t G [ti , Т4], есть конкатенация трех
дуг окружностей, соответствующих отрезкам времени
[т3,т4], причем
Т4 — Тз = Тз — Т2 = Т2 —
Проведем отрезок
~\- Т2 Тз + Т4
Рис. 13.3. Исключение четы-
четырех переключений
[тг, 2тг).
te
dx
= 1,
общую касательную к первой и третьей окружностям через точки
х ((ti + т2)/2) и х ((т3 + т4)/2) (рис. 13.3). Тогда кривая
ti [(ti+t2)/2, (т3 + т4)/2],
6 t \уТ\ ~г T2J/Z, ^Тз -+- T4j/^J,
есть допустимая траектория, более короткая, чем x(t). Мы доказали,
что оптимальное релейное управление не может иметь более трех
переключений.
198 Гл. 13. Примеры задач оптимального управления
B) Осталось рассмотреть случай, когда множество N не содержит
интервалов вида A3.28). Тогда N состоит из не более двух полуот-
полуоткрытых интервалов
где один или оба интервала могут отсутствовать. Если т\ = т2, то
функция fi(t) имеет единственный корень на отрезке [0, ?i], и соот-
соответствующее оптимальное управление определяется условием A3.26).
Если же
то
В этом случае условие максимума ПМП A3.26) не определяет одно-
однозначно оптимальное управление u(t), так как максимум достигается
для более чем одного значения управляющего параметра и. Такое
управление называется особым. Тем не менее, особое управление в
этой задаче можно определить из принципа максимума. Действитель-
Действительно, на интервале (ti,T2) выполняются следующие тождества:
fi = sinF> + /3) = О => 6 + C = ттк => 0 = const => и = 0.
Следовательно, если оптимальная траектория x(t) имеет особый
участок — прямолинейный отрезок, то оптимальное управление пере-
переключается только в моменты т\ и т2. Тогда
^1@,п) = C0I1St = ±:L> ^I(r2,ti) = C0I1St = ^
и вся траектория x(t), t G [0,^i], есть конкатенация дуги окруж:ности
радиуса 1
x(t), u(t) = ±l, tG[0,n],
прямой
x(t), u(t) = 0, tG[ri,r2],
и еще одной дуги окружности радиуса 1
x(t), u(t) = ±l, *G[r2,ti].
Итак, оптимальные траектории в данной задаче имеют могут быть
одного из следующих двух типов:
A) конкатенация релейного участка (дуга окружности, и = =Ы),
особого участка (отрезок прямой, и = 0) и релейного участка;
B) конкатенация релейных участков с не более чем тремя пе-
переключениями, причем дуги окружностей между переключениями
имеют один и тот же центральный угол G [тг, 2тг).
Если граничные точки ж@), x{t\) достаточно далеки друг от друга,
то их можно соединить только траекториями с особым участком. Для
таких граничных точек получаем простой алгоритм построения опти-
оптимальной траектории. Через каждую из точек ж@) и x{t\) проведем
пару окружностей радиуса 1, касающихся соответственно векторов
скорости х@) = (cos 6@), sin 6@)) и x(t\) = (cos0(?i),sin0(?i)). Затем
13.5. Машина Дубинса
199
проведем общие касательные к окружностям в ж@) и x(t\) соответст-
соответственно так, чтобы направление движения по этим касательным было
совместимым с направлением вращения на окружностях, определен-
определенРис. 13.4. Нахождение кратчайшей кривой для далеких граничных точек
ным граничными касательными векторами ж@) и x(t\) (рис. 13.4).
Наконец, выберем из построенных кривых кратчайшую. Эта кривая
и будет оптимальной траекторией.
Глава 14
ГАМИЛЬТОНОВЫ СИСТЕМЫ
С ВЫПУКЛЫМИ ГАМИЛЬТОНИАНАМИ
Хорошо известна теорема о том, что если поверхность уровня
гамильтониана выпукла, то она содержит периодическую траекторию
соответствующей гамильтоновой системы [144, 149]. В этой главе мы
докажем более общий результат с помощью теории оптимального
управления для линейных систем.
Теорема 14.1. Пусть S есть сильно выпуклое компактное под-
подмножество Mn, n четно, и пусть граница множества S является
поверхностью уровня гамильтониана Н G С°°(МП).
Тогда для любого v G Mn существует параллельная вектору v
хорда в S, через концы которой проходит некоторая траектория
гамильтоновой системы х = Н(х).
Мы считаем, что на пространстве Мп задана стандартная симплек-
тическая структура
т. е. гамильтоново векторное поле, соответствующее гамильтониа-
гамильтониану Н, имеет вид Н = J grad H.
Теорема о периодических траекториях гамильтоновых систем есть
частный случай приведенной выше теоремы при v = 0. Докажем тео-
теорему 14.1.
Доказательство. Не теряя общности, будем считать, что 0 G
G int S.
Рассмотрим поляру множества S:
S° =
Из теоремы отделимости следует, что
(S ) = S, О G int S ,
a S° есть сильно выпуклое компактное подмножество Мп.
Введем следующую линейную задачу оптимального управления:
ж@) = а, жA) = 6,
с, Ju) dt —>• min. A4.1)
Здесь а и Ъ — любые точки в 6ю, достаточно близкие к нулю и
такие, что вектор J(b — а) параллелен v. По теореме Филиппова эта
Гл. 14- Гамилътоновы системы с выпуклыми гамильтонианами 201
задача имеет оптимальные решения. Мы используем эти решения для
построения искомой траектории гамильтоновой системы на 8S.
Зависящий от управления гамильтониан принципа максимума
имеет вид
hvu{p, х) = ри + v(x, Ju).
Покажем сначала, что анормальные траектории не могут быть
оптимальными. Пусть v = 0. Тогда присоединенное уравнение есть
р = 0, поэтому
р = р0 = const.
Условие максимума ПМП записывается как
pou(i) =
В силу сильной выпуклости поляры S° имеем
u(t) = const, u(t) E dS°.
Следовательно, анормальные траектории суть прямые со скоростями,
отделенными от нуля. Если взять точки а, Ъ достаточно близкими к
нулю, то анормальные траектории не смогут удовлетворить гранич-
граничным условиям.
Поэтому оптимальные траектории нормальны, и можно положить
v = — 1. Нормальный гамильтониан равен
hu(p, х) = ри— (ж, Ju),
а соответствующая гамильтонова система имеет вид
(р = Ju,
\х = и.
Нормальный гамильтониан можно записать как
hu(p,x) = (у, и),
у =р + Jx,
где вектор у удовлетворяет уравнению
у = 2Ju.
Вдоль нормальной траектории
K(t)(p(t),x(t)) = {y(t),u(t)) = max(|/(t),«> =C = const ^ 0. A4.2)
v G *Ь
Рассмотрим сначала случай С > 0. Тогда
z(t) =
т. е. z(t) G S. Более того, z(t) G dS, а вектор u(t) есть нормаль к 8S в
точке z(t). Следовательно, кривая z(t) с точностью до перепарамет-
перепараметризации является траекторией гамильтонова поля Н = J grad H.
202 Гл. 14- Гамилътоновы системы с выпуклыми гамильтонианами
Граничные условия выполняются:
p(l)-p@) = J(s(l)-a;@)),
- 2/@) = 2J(x(l) - х@)) = 2J{b - a),
z(l)z@) =
Поэтому z(i) есть искомая траектория: хорда z(l) — z@) параллельна
вектору v.
Для завершения доказательства покажем, что случай G = 0
в A4.2) невозможен. Действительно, если С = 0, то y(t) = 0, поэтому
u(t) = 0. Если а ф Ь, то не выполняются граничные условия для х.
Если же а = 6, то пара (u(t),x(i)) = @, 0) не реализует минимум функ-
функционала A4.1), который может принимать отрицательные значения:
для любой допустимой 1-периодической траектории x(i) траектория
x(t) = х{1 — i) периодична и имеет критерий качества
1 1
/ (ж, Jx) dx = — / (ж, Ju) dx.
П
Глава 15
ЛИНЕЙНАЯ ЗАДАЧА БЫСТРОДЕЙСТВИЯ
15.1. Постановка задачи
В этой главе мы изучим следующую задачу оптимального управ-
управления:
х = Ах + Вщ xeRn, ueUcR171, A5.1)
х@) = жо, x{t\) = жх, жо,Ж1 Е W1 закреплены, A5.2)
t\ —>• min, A5.3)
где С/ — компактный выпуклый многогранник в Mm, a i и Б -
постоянные матрицы порядка п х п и п х т соответственно. Зада-
Задача A5.1)—A5.3) называется линейной задачей быстродействия.
Многогранник U есть выпуклая оболочка конечного числа точек
аъ...,аквШп:
U = conv{ab... ,afc}.
Будем считать, что любая точка а^ не принадлежит выпуклой обо-
оболочке остальных точек a^, j ф г, т.е. каждая точка а^ — вершина
многогранника U.
Будем далее предполагать, что выполнено следующее условие об-
общего положения:
для любого ребра [a^ay] многогранника U вектор е^- = aj — ai
удовлетворяет равенству
spcm(Beij,ABeij,...,An~1Beij) =Rn. A5.4)
Это условие означает, что ни один вектор Beij не принадлежит
собственному инвариантному подпространству матрицы А. По теоре-
теореме 3.1 это равносильно управляемости линейной системы
х = Ах + Ви
с пространством управляющих параметров и G Ме^-. Выполнения
условия A5.4) всегда можно добиться малым шевелением матриц А
ж В.
Мы рассматривали примеры линейных задач быстродействия в па-
параграфах 13.1, 13.2. Здесь мы изучим структуру оптимального управ-
управления, докажем его единственность, оценим количество переклю-
переключений.
Существование оптимального управления для любых точек хо, х\
таких, что х\ G »Д(жо), следует из теоремы Филиппова. Заметим, что
аналогичная задача с неограниченным пространством управляющих
параметров может не иметь оптимального управления; это легко по-
показать, используя линейность системы.
Перед началом изучения линейной задачи быстродействия напом-
напомним некоторые начальные сведения о многогранниках.
204
Гл. 15. Линейная задача быстродействия
15.2. Геометрия многогранников
Выпуклой оболочкой конечного числа точек
вается множество
-г т г т def ^
назы-
к к
~^ i aj ^ О, У^ ctj = 1
г=1 г=1
Аффинная гиперплоскость в Мт есть множ:ество вида
П = {и е IRm | (?, и) = с}, | G Rm* \ {0}, сеМ.
Опорной гиперплоскостью многогранника U называется такая гипер-
гиперплоскость П, что
(?, и) ^ с \/и Е U
для ковектора ^ и числа с, определяющих П, причем это нера-
неравенство должно обращаться в равенство в некоторой точке и G dU,
т.е.ПП[//0.
С Пересечение любого много-
многогранника U = conv {ai,..., afc} с
любой его опорной гиперплос-
гиперплоскостью П = {и\ (?,и) = с} дает
другой многогранник:
U П П = conv {a^,..., пц },
а3
с,
Рис. 15.1. Многогранник U с опор-
опорной гиперплоскостью П
Такие многогранники U П П на-
называются гранями многогранни-
многогранника U. Нульмерные и одномерные
грани называются соответственно
вершинами и ребрами. Много-
Многогранник имеет конечное число
граней, каждая из которых есть
выпуклая оболочка конечного числа вершин. Грань любой грани есть
грань исходного многогранника. Граница многогранника является
объединением всех его граней. Это непосредственно следует из
теоремы отделимости (или теоремы Хана—Банаха).
15.3. Теорема о релейном управлении
Оптимальное управление в линейной задаче быстродействия ре-
лейно, т. е. кусочно постоянно и принимает значения в вершинах мно-
многогранника U.
Теорема 15.1. Пусть управление u(t), 0 $J t $J ?i, оптимально
для линейной задачи быстродействия A5.1)-A5.3).
Тогда существует конечное подмножество
Та [0,*i], #T<oo,
15.3. Теорема о релейном управлении 205
такое, что /#\ ^- г i j. ,- m j. i \ т~ /1СС\
u(t)e{au...,ak}, tG[0,ti]\T, A5.5)
и ограничение u(i)\tevQ tl]\j- локально постоянно.
Доказательство. Применим принцип максимума Понтряги-
на к линейной задаче быстродействия A5.1)—A5.3). Вектор состояния
и сопряженный вектор суть
(Х1
\хп
а точка сопряженного пространства есть
Л — (^, XJ t М. ХМ — 1 ж.
Зависящий от управления гамильтониан равен
(мы умножаем строки на столбцы). Гамильтонова система и условие
максимума ПМП имеют вид
(х = Ах + i??i,
U = -ед
?{t)Bu(t) = max ?(t)Bu. A5.6)
Из гамильтоновой системы следует, что присоединенный вектор
№ = me-tA, Ф) ф 0, A5.7)
аналитичен вдоль оптимальной траектории.
Введем в рассмотрение множество индексов, соответствующих
вершинам, в которых достигается максимум A5.6):
J(t) = (l ^ j ^ k\
В любой момент t линейная функция ?(i)B достигает максимума в
вершинах многогранника U. Докажем, что в каждый момент, за ис-
исключением конечного их числа, этот максимум принимается в единст-
единственной вершине.
Определим множество
T={te[0,ti]|#J(t)>i}.
От противного: предположим, что Т бесконечно, т. е. существует по-
последовательность разных моментов
{ть...,тп,...} С Т.
Так как имеется лишь конечное число возможностей для подмножест-
подмножества J(rn) с{1,...,/с},то можно предположить, не теряя общности, что
J(Tl) = J(T2) = ... = J(Tn) = ...
Обозначим J = J(ri).
206 Гл. 15. Линейная задача быстродействия
Далее, так как выпуклая оболочка
conv {ctj | j G J}
является гранью С/, то существуют такие индексы ji,j2 ? «/, что от-
отрезок [dj1,cij2] есть ребро С/. Имеем
i{ri)Bah =?(Ti)BaJ2, г = 1,2,...
Для вектора е = aj2 — a^ получаем
?(т;)Бе = 0, г = 1,2,...
Но ?(т"г) = ?@)е~г*А в силу A5.7), поэтому аналитическая функция
t
имеет бесконечное число нулей на отрезке [0, ?i], т. е. она тождественно
равна нулю:
= 0.
Последовательно дифференцируя это тождество при t = 0, получаем
?@)Бе = 0, ?{0)АВе = 0, ..., f (OJA"^ = 0.
По условию общего положения A5.4) имеем ?@) = 0, что противоре-
противоречит условию A5.7). Поэтому множество 7~ конечно.
Вне множества Т функция ?(i)B достигает максимума на U
в единственной вершине а^(ф {j{t)} = J{t)i поэтому оптимальное
управление u(t) принимает значение в вершине a>j{t)- Включение A5.5)
доказано. Далее,
i ф j(
Но все функции t \-> ?(t)Bai непрерывны, поэтому предшествующее
неравенство сохраняется для моментов времени, близких к t. Функ-
Функция t H> j(i) локально постоянна на [0,^i] \ T, следовательно, опти-
оптимальное управление u(t) такж:е локально постоянно на [0, t\] \ Т. ?
Далее нам понадобится следующее утверждение, доказанное в рас-
рассуждении выше.
Следствие 15.1. Пусть функция ?(?), t G [0,ti], есть ненуле-
ненулевое решение присоединенного уравнения ? = —?,А.
Тогда всюду на отрезке [0, ?i], за исключением конечного числа
точек, существует единственное управление u(t) G U такое, что
)
иеи
15.4. Единственность оптимальных управлений
и экстремалей
Теорема 15.2. Пусть конечная точка х\ достижима из на-
начальной точки хо: А, Л
х\ е А{хо).
Тогда линейная задача быстродействия A5.1)-A5.3) имеет
единственное решение.
15.4- Единственность оптимальных управлений и экстремалей 207
Доказательство. Как мы уже отметили, существование оп-
оптимального управления следует из теоремы Филиппова.
Предположим, что существует два оптимальных управления:
ui(t), U2(t), t G [0,^i]. По формуле Коши
/ п
xfa) = etlA lx0 + / e~tABu(t) dt
V о
получаем
о
поэтому
f e-tABUl(t)dt) =etlA(x0+ f e-tABu2(t)dt\
tl
Г e-tABUl(t)dt= I e-tABu2(t)dt. A5.8)
о о
Пусть ?i(?) = ?i@)e~^ есть присоединенный вектор, соответствую-
соответствующий по принципу максимума управлению u\{t). Тогда равенство A5.8)
можно переписать в виде
ti ti
I?1(t)Bu1(t)dt= fCi(t)Bu2(t)dt. A5.9)
о о
По условию максимума ПМП
поэтому
Но это неравенство вместе с равенством A5.9) означает, что почти
всюду на [0, ii]
По следствию 15.1
ui(t) = u2(i)
почти всюду на [0, ti]. D
Итак, в линейной задаче быстродействия оптимальное управление
единственно. Обычно, чтобы найти оптимальное управление для за-
заданной пары граничных точек жо, #i, ищут все экстремали (?(?), x(t)),
переводящие xq в ж1? а затем из них выбирают наилучшую. В приме-
примерах, рассмотренных в параграфах 13.1, 13.2, существовала единствен-
единственная экстремаль для любой пары жо, х\ при х\ = 0. Докажем, что это —
общее свойство линейных задач быстродействия.
Теорема 15.3. Пусть х\ = 0 G A(xq) и 0 G U \ {ai,..., a^}.
Тогда существует единственное управление u(t), переводящее xq
в 0 и удовлетворяющее принципу максимума.
208 Гл. 15. Линейная задача быстродействия
Доказательство. Предположим, что существуют два управ-
управления:
и\(?), t G [0,?i], u2(t), t G [0,^2]?
переводящие xq в 0 и удовлетворяющие принципу максимума.
Если t\ = t2, то из доказательства предыдущей теоремы видно,
что U\(t) = u2(t) почти всюду, поэтому можно считать, что
t\ > t2.
Из формулы Коши получаем
etlA(x0+ Г e-tABUl(t)dt\ =0,
t2
поэтому
/ e-tABu2(t) dt\ =0,
*1 t2
Г e-tABUl(t)dt= Г e-tABu2{t)dt. A5.10)
Согласно ПМП существует присоединенный вектор ?i(?), t G [0, ti]
такой, что
?i(*)=?i@)e-*A, 6@)/0, A5.11)
A5.12)
Так как 0 G С/, имеем
^(t)BUl(t) ^ 0, t G [0,ti]. A5.13)
Равенство A5.10) можно переписать как
Г ?>1(t)Bu1(t)dt= [ i1{t)Bu2{t)dt. A5.14)
о о
Принимая во внимание A5.13), получаем
[ix^Bu^t) dt ^ [ix^Bu^dt. A5.15)
о о
Но из условия максимума A5.12) следует, что
?i(*)Bui(t) > 6(f)SM2(i), «G [0,t2]. A5-16)
Поэтому неравенства A5.15) и A5.16) совместимы, только когда
t е [0,t2],
15.5. Переключения оптимального управления 209
следовательно, неравенство A5.15) должно обращаться в равенство.
Ввиду A5.14) имеем
t2
Г
?1(i)Bu1(t)dt = 0.
Но подынтегральная функция неотрицательна (см. A5.13)), поэтому
она тождественно равна нулю:
?i{t)BUl(t) = o, te[tut2].
Из доказательства теоремы 15.1 следует, что управление u\(t) релей-
но, поэтому существует интервал / С [^ъ^] такой, что
Следовательно,
= 0, tel.
Но ?,i(tH = 0, что противоречит единственности управления, на кото-
котором достигается максимум в ПМП; см. следствие 15.1. ?
15.5. Переключения оптимального управления
Оценим количество переключений оптимального управления в ли-
линейных задачах быстродействия. В примерах параграфов 13.1, 13.2
мы получили соответственно одно переключение и сколь угодно боль-
большое число переключений, хотя и конечное на любом отрезке. Оказы-
Оказывается, в общем случае возможны два типа поведения оптимального
управления: неосциллирующий и осциллирующий, в зависимости от
того, имеет матрица А вещественный спектр или нет. Напомним, что в
примере с одним переключением в параграфе 13.1 мы имели матрицу
а в примере со сколь угодно большим числом переключений в пара-
параграфе 13.2
(
Л=(-1 о
Мы ограничимся системами со скалярным управлением:
х = Ах + иЬ, и е U= [a, f5] С М, х G Мп,
удовлетворяющими условию общего положения
span{b,Ab,...,An-1b) = Rn.
Множество достижимости такой системы за сколь угодно малое время
полномерно. Оценим минимальное число переключений, необходимое
для заполнения полномерной области. Оптимальное управление ку-
кусочно постоянно со значениями во множестве {а, /3}. Предположим,
14 А.А. Аграчев, Ю.Л. Сачков
210 Гл. 15. Линейная задача быстродействия
что траектория выходит из начальной точки xq с управлением а. Без
переключений можно заполнить дугу 1-мерной кривой е^Аж+аЬ^жо,
с одним переключением заполняется кусок 2-мерной поверхности
e(Ax+/3b)t2 o e(Ax+ab)tlx^^ с дВуМЯ переключениями можно достичь то-
точек на 3-мерной поверхности и т. п. Поэтому для заполнения п-мерной
области необходимо как минимум п — 1 переключение.
Докажем, что в неосциллирующем случае п — 1 переключение оп-
оптимального управления всегда достаточно.
Теорема 15.4. Предположим, что матрица А имеет только
вещественные собственные значения:
Sp(A) С R.
Тогда любое оптимальное управление в линейной задаче быстро-
быстродействия A5.1)-A5.3) имеет не более чем п — 1 переключение.
Доказательство. Пусть u(t) — оптимальное управление, а
?(?) = ?@)е~ — соответствующее решение сопряженного уравнения
? = — ?А Условие максимума ПМП записывается как
?(t)bu(t) = max ?(t)bu,
поэтому
\а при
Следовательно, число переключений управления u(i), t G [0, ti], равно
количеству перемен знака функции
y(t) = i(t)b, te[o,h].
Покаж:ем, что y(t) имеет не более п — 1 корня.
Вычислим производные сопряженного вектора:
По теореме Кэли матрица А удовлетворяет своему характеристичес-
характеристическому уравнению
где
det(t Id -A) = tn + С1Г + ... + cn,
поэтому
(-А)" - ci(-A)—J + ... + (-l)ncn Id = 0.
Следовательно, функция у(?) удовлетворяет дифференциальному
уравнению n-го порядка
y{n\t) - сц/"-1^) + • ¦ • + ("l)ncn2/(i) = 0. A5.17)
15.5. Переключения оптимального управления 211
Как хорошо известно (см., например, [138]), любое решение этого
уравнения есть квазимногочлен
к
Pi(t) многочлен,
Х{ ф Xj при г ф j,
где Л^ — собственные значения матрицы А, а степень каждого мно-
многочлена Pi меньше кратности соответствующего собственного значе-
значения Л^, поэтому
1=1
Теперь утверждение данной теоремы следует из приведенной ниже
общей леммы. ?
Лемма 15.1. Квазимногочлен
к к
y(t) = 2_^eXitPi{t), ^JdegPi$Jn — к, A5.18)
Xi ф Xj при i ф j,
имеет не более п — 1 вещественных корней.
Доказательство. Применим индукцию по к. Если к = 1, то
квазимногочлен
= extP(t),
имеет не более п — 1 корней.
Докажем шаг индукции для к > 1. Обозначим
щ = deg Pi, г = 1,..., к.
Пусть квазимногочлен y(t) имеет п вещественных корней. Запишем
уравнение
1=1
в следующем виде:
к-1
Y^ e^Xi-Xk)tPi{t) + Pk{t) = 0. A5.19)
Квазимногочлен в левой части имеет п корней. Продифференцируем
этот квазимногочлен п^ + 1 раз, чтобы многочлен Pk(t) исчез. После
rik + 1 дифференцирований получаем квазимногочлен
к-1
J2e{Xi-Xk)tQi{t), degQi ^ degPu
/ j
14*
212 Гл. 15. Линейная задача быстродействия
имеющий по теореме Ролля п — п^ — 1 вещественных корней. Но по
предположению индукции максимально возможное число корней это-
этого квазимногочлена равно
fc-i
En . \ Ь, 9^г) г) т 1
/t/? \~ гь Li \ IL '^к
1 = 1
Полученное противоречие и доказывает данную лемму. ?
Теорема 15.4 полностью доказана: в неосциллирующем случае оп-
оптимальное управление имеет не более п — 1 переключений на своей
области определения (напомним, что п — 1 переключение всегда необ-
необходимы даже на малых временных отрезках, так как множества дос-
достижимости Aqo(t) полномерны для всех t > 0).
Для произвольной матрицы А можно получить п — 1 как оценку
сверху для числа переключений на достаточно малых отрезках вре-
времени.
Теорема 15.5. Рассмотрим характеристический многочлен
матрицы А
det(t Id -A) = tn + at"-1 + ... + cn,
и пусть
с = max с.
Тогда для любого оптимального по быстродействию управления
u(t) и любого I G R отрезок
содержит не более п — 1 переключений оптимального управле-
управления u(i).
При доказательстве этой теоремы мы воспользуемся следующим
общим предложением, которое мы узнали от С. Яковенко.
Лемма 15.2. Рассмотрим дифференциальное уравнение
с измеримыми и ограниченными коэффициентами,
С{ = max |с^(?)|.
te[t,t+5]
Если п
5>?<1, A5.20)
г=1
то любое ненулевое решение y(t) этого уравнения имеет не более
п — 1 корней на отрезке t G [?, i -\- 5].
Доказательство. От противного: предположим, что функ-
функция y(t) имеет по меньшей мере п корней на отрезке t G [?,? + ?]. По
15.5. Переключения оптимального управления 213
теореме Ролля производная y(t) имеет не менее п — 1 корней и т.д.
Тогда г/(п-1) имеет корень tn-\ Е [?, i + S]. Поэтому
Пусть tn-2 E [t, И S] есть корень y(n~2\t); тогда
tn-2
Продоллсим эту процедуру: проинтегрируем y^n~lJrl\t) от корня
tn-i E [i, I -\- S] функции y(n~l\t) и получим
t n
n
y(n-i){t)= j dTi I dr2... f у(п
tn-i
Следовательно, справедлива оценка
dr\ \ dr2 • • •
tn-i *„-*+! tn-l
i+S n т*_1
f f f
^ J T1 J T2 '" J
t t t
Тогда
^ sup |
l- te[t,t+6]
т. е.
г=1 tb[t,t-\-o\
что противоречит условию A5.20). Лемма доказана. ?
Теперь докажем теорему 15.5.
Доказательство. Как было показано при доказательстве
теоремы 15.4, число переключений u(t) не больше числа корней
функции y(t) = i(t)h, удовлетворяющей дифференциальному уравне-
уравнению A5.17).
214 Гл. 15. Линейная задача быстродействия
Имеем
г=1
По лемме 15.2, если
c(es - 1) ^ 1, A5.21)
то функция y(t) имеет не более п — 1 вещественных корней на любом
отрезке длины 5. Но неравенство A5.21) равносильно следующему:
поэтому y(i) имеет не более п — 1 корней на любом отрезке длины
1( 1/с). ?
Глава 16
ЛИНЕЙНО-КВАДРАТИЧНАЯ ЗАДАЧА
16.1. Постановка задачи
В этой главе мы рассмотрим чрезвычайно популярный в приложе-
приложениях класс задач оптимального управления — линейно-квадратичные
задачи. Такая задача задается линейной системой с квадратичным
функционалом качества:
х = Ах + Вщ xeRn, ueR171, A6.1)
ж@) = жо, x(t\) = жх, жо,Ж1,^1 закреплены,
Ь1
J{u) = i f(Ru(t),u(t)) + (Px(t),u(t)) + (Qz(?), я(*)) dt
mm.
Здесь А, В, R, P, Q — постоянные матрицы соответствующих разме-
размеров, R и Q симметричны:
R* = д, Q* = Q,
а угловые скобки ( • , • ) обозначают стандартное скалярное произве-
произведение вГ иГ.
Нетрудно показать, что условие R ^ 0 необходимо для существо-
существования оптимального управления. Мы не будем здесь касаться случаев
вырождения R и предположим, что R > 0. Замена переменных и Н>
I—>. v = R}'2u переводит функционал «/(?/) в функционал того же вида
с единичной матрицей вместо R. Поэтому будем далее предполагать,
что R = Id. Линейное преобразование обратной связи обнуляет мат-
матрицу Р (найдите это преобразование). Поэтому функционал качества
можно записать следующим образом:
J{u) = \ I \u(t)\2 + (Qx(t),x(t)) dt.
о
Что касается динамики задачи, будем предполагать, что линейная
система управляема:
rank (Б, АВ,..., А71'1 В) = п. A6.2)
16.2. Существование оптимального управления
Из-за того, что множество управляющих параметров U = Мт
некомпактно, теорема Филиппова неприменима, поэтому существо-
существование оптимальных управлений в линейно-квадратичной задаче —
нетривиальная задача.
216 Гл. 16. Линейно-квадратичная задача
В этой главе в качестве допустимых управлений будем брать ин-
интегрируемые с квадратом вектор-функции
и использовать для управлений норму пространства L™
* * 1/2
N1 = ( ) J
Рассмотрим множество всех допустимых управлений, переводя-
переводящих начальную точку в конечную
Мы обозначаем через ж(^, г/, жо) траекторию системы A6.1), соответст-
соответствующую допустимому управлению и G L™ и выходящую из точки xq E
Gtn. В силу формулы Коши отображение в конец
b щ х0) = etlAx0 + Г e{tl-r)ABu(r) dr
есть аффинное отобралсение из L^[0,^i] в W1. Управляемость линей-
линейной системы A6.1) означает, что для любых хо G W1 и t\ > 0 образ
отображения в конец совпадает со всем W1. Подпространство
^) с l^[(Mi]
аффинно, а подпространство
W@,0) cL^[0,ti]
линейно; более того,
U(xo, х\) = г/ + ZY(O, 0) для любого i^
Естественно ожидать, что существование оптимальных управлений
тесно связано с поведением функционала качества J(u) на линейном
подпространстве ZY(O, 0).
Предложение 16.1. A) Если существуют такие точки
жо,жх Gln, что
inf J(iz) > -ос, A6.3)
uEU(xo,xi)
то
B) Обратно, если
J{u) >o
mo минимум достигается:
3 min
16.2. Существование оптимального управления 217
Замечание. Предыдущее предложение означает, что нера-
неравенство
необходимо для существования оптимальных управлений хотя бы для
одной пары (ж(ьж1.)? а строгое неравенство
достаточно для существования оптимальных управлений для всех
пар (xo,xi).
Для доказательства предложения 16.1 нам понадобится следую-
следующее вспомогательное утверждение.
Лемма 16.1. Если J(v) > 0 для всех v G U@, 0) \ 0, то
J(v) ^ ск||г;||2 для некоторого а > 0 и всех v G
, что то же самое,
inf{J(v) | ||v|| = 1, v G W@, 0)} > 0.
Доказательство. Пусть vn — минимизирующая последо-
последовательность функционала J(v) на пространстве {\\v\\ = l}nZY(O,O).
Замкнутые шары в гильбертовом пространстве слабо компактны, по-
поэтому существует подпоследовательность, слабо сходящаяся в единич-
единичном шаре. Сохраняя обозначение vn для членов этой последователь-
последовательности, получаем
vn —>• v слабо при п —>• оо, \\v\\ ^ 1, ^GZY(O,O),
J(vn) -+ mi{J(v) | |H| = 1, v G W@, 0)}, n -^ oo. A6.4)
Функционал на последовательности равен
о
Так как управления сходятся слабо, соответствующие траектории схо-
сходятся сильно:
хп{') —> xv{'), п ~^ °°5
поэтому
1 If
2 2 J
о
В силу A6.4) исследуемая нижняя грань равна
1 / ON
~)х^(т) х^(т)) &т = — A — \\v ) + J[v) > 0. П
2 v /
о
Докажем предложение 16.1.
218 Гл. 16. Линейно-квадратичная задача
Доказательство. A) От противного: предположим, что су-
существует такое v G ^@, 0), что J(v) < 0. Возьмем любое и G U(xq, a?i),
тогда и + sv G U(xo, х\) для любого s G М.
Пусть y(t), ? G [0, ti], есть решение задачи Коши
у = Ay + Bv, i/@) = 0,
и пусть
*1
, v) = \ J(u(t),v(t)) + (Qx(t), y(r)) dr.
Тогда квадратичный функционал J на семействе управлений и + sv,
s G R, имеет следующий вид:
J(u + sv) = J(iz) + 2s J(iz, v) + s2 J(v).
Так как J(v) < 0, то J{u + sv) —>- —ос при s —> oo. Полученное
противоречие с условием A6.3) завершает доказательство пункта A).
B) Напомним, что функционал качества равен
о
Норма \\u\\ полунепрерывна снизу в слабой топологии на L™, а функ-
ti
ционал J(Qx(t), x{t)) dr слабо непрерывен на L™. Поэтому J(u) слабо
о
полунепрерывен снизу на L™. Так как шары слабо компактны в L™
и аффинное подпространство слабо компактно, достаточно показать,
что J(u) —>- ос при и —>- ос, и G U(xo, Xi).
Зафиксируем произвольное управление iz G U(xq,xi). Тогда любое
управление из U(xq,xi) имеет вид и-\- v для некоторого v G ZY(O,O).
Преобразуем функционал:
J{u + v) = J(w) + 2||v||
Обозначим J(iz) = Co. Далее,
J[u, -Г7—Г7 ) ^ C\ = const
для всех v G W@, 0) \ 0. Наконец, по лемме 16.1 J(v) ^ а||г>||2, а > 0,
для всех г> G W@, 0) \ 0. Следовательно,
J(u + v) ^ Co - 2||v||Ci +a||^||2 -^ oc, v -)> oo, v gM@,0).
Пункт B) данного предложения доказан. ?
Итак, вопрос существования оптимальных управлений в линейно-
квадратичной задаче сведен к исследованию ограничения J\ur0 0\. Мы
изучим это ограничение подробнее в параграфе 16.4.
16.3. Экстремали 219
16.3. Экстремали
Мы не можем напрямую применить принцип максимума Понтря-
гина к линейно-квадратичной задаче, так как условия существования
оптимальных управлений доказаны нами в LJ1, в то время как прин-
принцип максимума получен только в L™. Однако предположим на время,
что ПМП применим к линейно-квадратичной задаче. Легко записать
уравнения для оптимальных управлений и траекторий, вытекающие
из ПМП, более того, естественно ожидать, что эти уравнения должны
выполняться. Сейчас мы выведем эти уравнения, а после этого обос-
обоснуем их.
Итак, выпишем принцип максимума для линейно-квадратичной
задачи. Зависящий от управления гамильтониан равен
Сначала рассмотрим анормальный случай v = 0. Согласно ПМП
присоединенный вектор вдоль анормальной экстремали удовлетворя-
удовлетворяет уравнению ? = — ?А, поэтому ?(t) = ?)@)e~tA. Из условия максиму-
максимума следует, что 0 = ?(i)B = ^@)e~tAB. Дифференцируя это равенство
п — 1 раз и учитывая условие управляемости A6.2), получаем ?@) =
= 0. Это противоречит ПМП, поэтому анормальных траекторий не
может быть.
В нормальном случае можно предположить г/ = 1. Тогда завися-
зависящий от управления гамильтониан равен
Зависящее от и слагаемое ?Ви \и\2 имеет единственный максимум
по и G Mm в точке, где
^bt = ?В - и* = 0,
ди
поэтому
и = В*?*. A6.5)
Следовательно, максимизированный гамильтониан равен
Я(?,х) = max hu(t,x) = ?Ax-\ (Qx, х) + \ \B*f 2
Функция Гамильтона Н(?,х) гладкая, поэтому нормальные экстрема-
экстремали суть решения соответствующей гамильтоновой системы
х = Ах + ВВ*?*, A6.6)
? = x*Q-?A. A6.7)
220 Гл. 16. Линейно-квадратичная задача
Покажем теперь, что оптимальные управления и траектории в
линейно-квадратичной задаче действительно удовлетворяют уравне-
уравнениям A6.5)—A6.7). Рассмотрим расширенную систему
х = Ах + Ви,
и соответствующее отображение в конец:
F: u^ (x(tuu,x0), y(tuu,Q)), F: L?[0,*i] -^Mnxi
Благодаря формуле Коши это отображение можно выписать в явном
виде:
x(tuu, х0) = etlA (х0 + Гe~tABu(t) dtj , A6.8)
t±
y(tuu, 0) = i I \u(t)\2 + (Qx(t), x{t)) dt. A6.9)
о
Пусть и(-) есть оптимальное управление, а х(-) = x(-,u,xq) — соот-
соответствующая оптимальная траектория. Тогда
F(u) EdlmF.
По теореме о неявной функции дифференциал
LJ^r : _L2 [U, tij —r \K k& К
не сюръективен, т.е. существует такой ковектор (а,/5) G Мп* фМ*,
C)^
(a,f3) ± D^Fv, vEL?[O,?i]. A6.10)
Дифференциал отображения в конец находится из явных фор-
формул A6.8), A6.9):
( } { \ } I } * \\
DuFv = f / e{tl~t)ABv{t) dt, I (u(t) + / B*e{r~t)A Qx(r) dr, v(t)) dtj.
Тогда условие ортогональности A6.10) записывается в следующем
виде:
r/B*e{tl~t)A*a + 0u(t) +0 ГB*e(T-t)A*Qx(r) dr, v(t)\ dt = 0,
г; EL?[0,*i],
т. e.
f B*eiT-t'>A'Qx(T)dT = 0, t€ [0,h].
* A6.11)
16.4- Сопряженные точки 221
Случай /3 = 0 невозможен из-за условия A6.2). Обозначим 7 = —осЦЗ;
тогда равенство A6.11) принимает вид
где
()А [)Qe(T-t)Adt. A6.12)
[
Итак, равенства A6.5), A6.6) доказаны. Дифференцируя A6.12),
получаем последнее требуемое равенство A6.7).
Итак, мы доказали, что оптимальные траектории в линейно-квад-
линейно-квадратичной задаче суть проекции нормальных экстремалей принципа
максимума A6.6), A6.7), а оптимальные управления удовлетворяют
уравнению A6.5). В частности, оптимальные траектории и управле-
управления аналитичны.
16.4. Сопряженные точки
В этом параграфе мы получим условия существования и единст-
единственности оптимальных управлений в зависимости от конечного вре-
времени. Поэтому будем записывать минимизируемый функционал в сле-
следующем виде:
.W = \j Нг)\2 + (Qx(t), х{т)) dr.
о
Обозначим
Wt@,0) = {ue L?[O,t]\ x(t,u,x0) = хг},
fi(t) d= m?{Jt(u) | и G Ut@, 0), ||u|| = 1}. A6.13)
Мы показали в предложении 16.1, что при jj,(i) > 0 задача имеет
решение для любых граничных условиях, а при fi(t) < 0 решений нет
ни для каких граничных условий. Случай /i(t) = 0 неопределенный.
Исследуем подробнее свойства функции //(?).
Предложение 16.2. A) Функция t H> fi(i) невозрастпающая и
непрерывная.
B) Для любых t > 0 справедливы неравенства
1>2^)>1-|е2*11А11||Б||2||д||. A6.14)
C) Если 1 > 2/х(?), то нижняя грань в A6.13) достигается, т. е.
это — минимум.
Доказательство. C) Обозначим
t
222 Гл. 16. Линейно-квадратичная задача
функционал It (и) слабо непрерывен на L™. Заметим, что
Jt(u) = —Ь It(u) на сфере \\u\\ = 1.
2
Возьмем минимизирующую последовательность функционала It (и)
на сфере {\\u\\ = 1} П%@, 0). В силу слабой компактности шара
{\\u\\ ^ 1} из этой последовательности молено выбрать слабо сходя-
сходящуюся подпоследовательность
ип —> и слабо при п —>• оо, ||й|| ^ 1, uEUt@,0),
It(un)^It(u)=M{It(u)\ \\u\\ = 1, uGMt@,0)}, n^oc.
Если и = 0, то It (и) = 0, поэтому jj,(t) = -, что противоречит предпо-
А
лолсению пункта C).
Следовательно, и ф 0, It (и) <0и/Л -г-^-г) ^ It (и)- Поэтому \\u\\ =
V \\u\\ /
= 1, и Jt(u) достигает минимума на сфере {\\u\\ = 1} П^@,0) в точ-
точке и.
B) Пусть \\u\\ = 1 и жо = 0. По формуле Коши
x(t) = [ e^-T)ABu(r)dr,
о
поэтому
о
(по неравенству Коши-Буняковского)
1/2
1/2
0
Подставляя эту оценку x(t) в J^, получаем второе неравенство
в A6.14).
Первое неравенство в A6.14) получается, если рассмотреть слабо
сходящуюся последовательность ип —>- 0, п —>- оо, на сфере ||^n|| = 15
wnGWt@,0).
A) Монотонность ji(t). Возьмем любое t > t. Пространство Ut(O, 0)
допускает изометрическое вложение в ZY^(O,O) за счет продолжения
управлений и G ^@,0) нулем:
ueut(o,o) => иеЩ(о,о),
16.4- Сопряженные точки 223
Более того,
Jt(u) = Jt(u).
Поэтому
li{t) = mf{Jt(u)\ ueUt@,0),\\u\\ = 1} ^
^ inf {Jt(u)\ и e Wf @,0), \\u\\ = 1} = /i(?).
Непрерывность //(?): докажем отдельно непрерывность справа и
слева.
Непрерывность справа. Пусть tn\t. Можно считать, что /х(?п) <
< 1/2 (в противном случае fi(tn) = jjb(t) = 1/2), поэтому минимум
в A6.13) достигается:
fi{tn) = |+ItnK), UnGMtn@,0), К|| = 1.
Продолжим функции ип G L^[0,^n] на отрезок [0, ti] нулем. Выбирая
слабо сходящуюся подпоследовательность в единичном шаре, можно
предполагать, что
ип —>• и слабо при п —>- ос, wG ^t@5 0)? ll^ll ^ 1?
поэтому
Itn{un) ->> /t(w) ^ inf {Jt(v) | v G Mt@,0), ||^|| = 1}, tn \ t.
Тогда
о + ,lini/tn(^n) = Hm /i(tn).
В силу монотонности
fi(t) = lim
и непрерывность справа доказана.
Непрерывность слева. Можно считать, что /i(t) < 1/2 (иначе
уь(г) = n(t) = 1/2 при т <t). Поэтому минимум в A6.13) достигается:
±+It(u), иеЩ0,0), \\u\\ =
Для траектории
х(т) = ж(т, й, 0)
получаем
т
ж(г)= fe^-^
о
Обозначим
и заметим, что
а(е) -^ 0, е ->> 0.
224 Гл. 16. Линейно-квадратичная задача
Обозначим шар
В6 = {и е L™ | ||и|| ^ 5, и е W@,0)}.
Очевидно,
х(е,Ва(е),0) Э х(е).
Отображение и и- ж(г, и, 0) из L™ в W1 линейно, а система х = Ах +
+ Ви управляема, поэтому х(е, Ва^, 0) есть такое выпуклое полно-
полномерное мнолсество в Мп, что пололсительный конус, поролсденный
этим множеством, совпадает со всем W1. Поэтому
я(е,2Ба(е),0) = 2ж(е,Ба(е),0) D Оя.(е,Ва(е)>0)
для некоторой окрестности Ож(е,ва(е),о) множества ж(е, 5а(е), 0). Да-
Далее, существует такой момент t? > e, что
2(te)Gar(e,25a(e),0);
следовательно,
Молено считать, что t? —>- 0 при ? —)> 0. Рассмотрим следующее се-
семейство управлений, аппроксимирующее и:
Получаем
tteGMHe-te@,0),
||й — и?\\ —>- 0, е —>• 0.
Но ? + ? — t? < t л функция [1 невозрастающая, поэтому она непре-
непрерывна слева.
Непрерывность справа доказана выше, следовательно, /х непре-
непрерывна. ?
Докажем, что функция \± не может иметь более одного корня.
Предложение 16.3. Если jjb(t) = 0 для некоторого t > 0, то
/i(r) < 0 для всех т > t.
Доказательство. Пусть fi(t) = 0, t > 0. По предложению 16.2
нижняя грань в A6.13) достигается на некотором управлении и G
GWt@,0), \\u\\ = 1:
fi(t) = mm{Jt(u)\ ueUt{0,0), \\u\\ = 1} = Jt(u) = 0.
Тогда
Jt(u) ^ Jt(u) = 0 VwGWt@,0),
т. е. управление и оптимально, следовательно, удовлетворяет принци-
принципу максимума. Существует решение (?(т),ж(т)), т G [0,^], гамильто-
новой системы
i
16.4- Сопряженные точки
225
с граничными условиями
х@) = x(t) = О
и(т) = в*С(т), те [о,*].
Мы доказали, что для любого корня t функции /i любое управле-
управление и EUt@, 0), \\u\\ = 1, для которого Jt(u) = 0, удовлетворяет ПМП.
Докажем, что /i(r) < 0 для всех г > t. От противного: предполо-
предположим, что функция /л обращается в нуль в некоторый момент t' > t. В
силу монотонности /1
Следовательно, управление
удовлетворяет условиям
Jt>(u') =
Поэтому и' удовлетворяет ПМП, т. е.
L
re[o,t'},
,i = 0, поэтому г^; = 0, что про-
проесть аналитическая функция. Но г/
тиворечит равенству \\и'\\ = 1. П
Было бы ж:елательно получить способ решения уравнения fi(t) =
= 0, не требующий процедуры минимизации в A6.13). Это возможно
в терминах следующего понятия.
Определение 16.1. Точка t > 0 называется сопряженной точ-
точке 0 для рассматриваемой линейно-квадратичной задачи, если су-
существует такое нетривиальное решение (?(т),ж(т)) гамильтоновой
системы
что х@) = x{t) = 0.
Предложение 16.4. Функция \± обращается в нуль в точке
t > 0 тогда и только тогда, когда t есть ближайшая к 0 сопряжен-
сопряженная точка.
Доказательство. Пусть fi(t) = 0, t > 0. Во-первых, t есть
сопряженная точка, это было показано в доказательстве предложе-
предложения 16.3.
15 А.А. Аграчев, Ю.Л. Сачков
226 Гл. 16. Линейно-квадратичная задача
Пусть t' > 0 есть сопряженная точка. Вычислим функционал
на соответствующем управлении и (г) = ,В*?*(т), г Е [0, ?']:
= | j{BB*i*{r), Z*(t)) + (Qx(t), x(t)) dr =
О
t' t'
= о-
Итак, fi(tf) ^ J^/ ( г:—77) = 0. Теперь утверлсдение следует из того,
V \\u\\ J
что функция /л невозрастающая. П
Первая (ближайшая к нулю) сопряженная точка определяет су-
существование и единственность оптимального управления в линейно-
квадратичной задаче.
До первой сопряженной точки оптимальное управление сущест-
существует и единственно для любых граничных условий (если бы суще-
существовало два оптимальных управления, то их разность порождала бы
сопряженную точку).
В первой сопряженной точке получаем существование и неединст-
неединственность для некоторых граничных условий и несуществование для
других граничных условий.
А после первой сопряженной точки задача не имеет оптимальных
решений ни для каких граничных условий.
Глава 17
ДОСТАТОЧНЫЕ УСЛОВИЯ
ОПТИМАЛЬНОСТИ, УРАВНЕНИЕ
ГАМИЛЬТОНА-ЯКОБИ И ДИНАМИЧЕСКОЕ
ПРОГРАММИРОВАНИЕ
17.1. Достаточные условия оптимальности
Принцип максимума Понтрягина — универсальное и сильное необ-
необходимое условие оптимальности, однако теория достаточных условий
оптимальности далеко не так полна. В этой главе мы рассмотрим
подход к достаточным условиям оптимальности, обобщающий поля
экстремалей классического вариационного исчисления.
Рассмотрим следующую задачу оптимального управления:
q = fu(q), q?M, ueU, A7.1)
<?@) = 9о, q{h) = <7ъ qo,qi,h закреплены, A7.2)
?1
<p(q(i), u(t)) dt ->> min. A7.3)
о
Зависящий от управления гамильтониан принципа максимума в нор-
нормальном случае равен
hu(X) = (A, fu(q)} - <p(q, и), A G T*M, q = тг(Л) Е М, и G U.
Предположим, что максимизированный гамильтониан
Я(Л) =max/in(A) A7.4)
uEU
определен и гладок на Т*М. Можно предполагать гладкость Н не
всюду, а только на открытой области О С Т*М, и соответственно
модифицировать полученные далее результаты. Но для упрощения
изложения мы будем считать, что О = Т*М. Тогда траектории га-
мильтоновой системы • -+
А = Н[л)
суть экстремали задачи A7.1)—A7.3). Будем предполагать, что га-
мильтоново поле Н полно.
17.1.1. Интегральный инвариант. Рассмотрим сначала общую
конструкцию, которая сыграет ключевую роль при доказательстве
достаточных условий оптимальности.
Зафиксируем произвольную гладкую функцию
аеС°°(М).
График дифференциала da есть гладкое подмногообразие в Т*М:
Со = {dqa\ qeM} С Т*М,
dim?0 = dimM = п.
228 Гл. 17. Достаточные условия оптимальности
Трансляции jCq с помощью потока гамильтонова поля
Ct = etM(C0)
суть гладкие n-мерные подмногообразия в Т*М, а график отображе-
отображения t\-±Ct,
С = {(A, t)\\eCu O^t^U} С Т*М х R
есть гладкое (п + 1)-мерное подмногообразие в Г*М х I.
Рассмотрим 1-форму
s-HdteA1(T*MxR).
Напомним, что s — это тавтологическая 1-форма на Т*М, s\ = Л о тг*,
а ее дифференциал есть каноническая симплектическая структура
на Т*М, ds = а. В механике форма s — Н dt = pdq — Н dt называет-
называется интегральным инвариантом Пуанкаре-Картана на расширенном
фазовом пространстве Т*М х R.
Предложение 17.1. Форма (s — Нdt)\c точна.
Доказательство. Докажем сначала, что эта форма замк-
замкнута:
0= d(s-Hdt)\c = (a-dH Adt)\c. A7.5)
A) Зафиксируем Ct = С П {t = const} и рассмотрим ограничение
формы а — dH A dt на Ct • Имеем
(a -dH Adt)\Ct = a\Ct ,
так как dt\^ =0. Напомним, что etH a = а, поэтому
Но s\g = б/(аотг)|? , следовательно,
ds\c = do d(a о тг)\с =0,
поэтому а\с = 0. Мы доказали, что (а — dH A dt)\c = 0.
B) Многообразие С есть образ гладкого отображения
поэтому касательный вектор к С, трансверсальный многообразию Ct,
есть
Я(А) + |^ е T(A,t)?.
Поэтому
T(A)t)? = T(A,t) А © R (Я(А) + |^) .
— /-)
Для завершения доказательства подставим вектор Н(Х) + — в
0 V
качестве первого аргумента в а — dH A dt и покажем, что результат
17.1. Достаточные условия оптимальности 229
равен нулю. Получаем
iga = -dH, id/dto- = О,
ig(dH A dt) = (igdH) Adt-dH A (igdt) = 0,
=o =o
id/dt(dH A dt) = (id/dtdH) Adt - dH A (id/dtdt) = -dH,
=o =i
следовательно,
~ dH Л dt) = ~dH + dH = °-
Мы доказали, что форма (s — Нdt)\c замкнута.
C) Покажем, что эта форма точна, т. е.
/¦
s-Hdt = O A7.6)
7
для любой замкнутой кривой
7 : т^(А(т),*(т))е?, те [0,1].
Кривая 7 гомотопна кривой
7о : ги(А(т),0)е?о, те [0,1].
Так как форма (s — Нdt)\c точна, то по формуле Стокса получаем
Г s-Hdt= Г s-Hdt.
7 7о
Но интеграл по замкнутой кривой 7о С Cq вычисляется просто:
Г s- Hdt= Г s= I d(a о тг) = 0.
70 70 70
Равенство A7.6) доказано, т.е. форма (s — Нdt)\c точна. ?
17.1.2. Задача с закрепленным временем. Докажем доста-
достаточные условия оптимальности для задачи A7.1)—A7.3).
Теорема 17.1. Предположим, что ограничение проекции тг|?
является диффеоморфизмом для всех t G [0, ?i].
Тогда для любого Aq G Со нормальная экстремальная траектория
i
реализует строгий минимум функционала качества J (p(q(t), u(t)) dt
о
среди всех допустимых траекторий q(t), 0 ^ t ^ ti, системы A7.1)
с теми же граничными условиями
<z@) = g@), q(h) = q(h). A7.7)
230 Гл. 17. Достаточные условия оптимальности
Замечания. A) В условиях теоремы не требуется проверка
существования оптимального управления.
B) Если все предположения (гладкость Н, продолжаемость траек-
траекторий поля Н на весь временной отрезок [0,?i], диффеоморфность
ограничения тг^ ) выполняются в собственной открытой области
О С Т* М, то утверждение теоремы 17.1 можно модифицировать и по-
получить локальную оптимальность траектории q(-) в тг(О). Мы остав-
оставляем эти модификации читателю в качестве упражнения.
Докажем теорему 17.1.
Доказательство. Кривая q(t) есть проекция нормальной
экстремали _
А*=еш(А0).
Пусть u(t) — допустимое управление, максимизирующее гамильтони-
гамильтониан вдоль этой экстремали:
H(Xt) = ^гх(*)(А*)-
С другой стороны, пусть q(t) — допустимая траектория систе-
системы A7.1), порожденная каким-нибудь управлением u(t) и удовлетво-
удовлетворяющая граничным условиям A7.7). Сравним значение функционала
качества на парах (J, и) и (д, и).
Так как тг: ?t —>• М есть диффеоморфизм, траекторию {q(t)\ 0 ^
^ t ^ t\\ С М мож:но поднять до гладкой кривой {А(?)| 0 ^ t ^
^ *i} С Т*М:
V t в [0, h] 3! X(t) e Ct такое, что тг(А(*)) = q(t).
Тогда
= f(mJu(t)(q(t)))-hu{t)(\(t))dt^
о
Щ - H(X(t)) dt = f(sx{t),X(t)) - H(X(t)) dt =
о о
= Г s-Hdt, A7.8)
7
где
7: t 1—>- (A(?),?) G i2, t G [0,^i].
По предлож:ению 17.1 форма (s — Hdt)\c точна. Поэтому интеграл
формы (s — Нdt)\^ по кривой зависит только от конечных точек этой
кривой. Кривые 7 и
7: *•->&,*) еС, At = et#(A0), *G [0,*i],
17.1. Достаточные условия оптимальности
231
М
Рис. 17.1. Доказательство теоремы 17.1
имеют одни и те же граничные точки (рис. 17.1), поэтому
Г s-Hdt= Г s-Hdt= f(Xuq{t))-H(Xt)dt =
7°
ti
-h^t)(Xt)dt= / <p(q(t),u(t))dt.
J
о
Следовательно,
f
f
т. е. траектория q(t) оптимальна.
Осталось доказать, что пара (q(t),u(t)) доставляет строгий мини-
минимум, т. е. что неравенство A7.9) строгое.
Для фиксированной точки q G М будем записывать кокасательные
векторы как Л = (р, q), где р суть координаты ковектора Л в Т*М.
Гамильтонианы hu(p, q) аффинно зависят от р, поэтому их максимум
(, q) является выпуклым по р. Любой вектор ? G TqM такой, что
uEU
определяет опорную гиперплоскость к надграфику отображения р н>
|—>- H(p,q). В силу гладкости Н по р эта опорная гиперплоскость
единственна, и максимум в A7.4) достигается на единственном ка-
касательном векторе. Если q(t) ф q(t), то неравенство A7.8) становится
строгим так же, как и неравенство A7.9). Теорема доказана. ?
232 Гл. 17. Достаточные условия оптимальности
Достаточные условия оптимальности теоремы 17.1 даются в тер-
терминах многообразий С,и которые в свою очередь определяются функ-
функцией а и потоком гамильтонова поля Н. Оптимальность нормальной
экстремальной траектории q(t), t G [0, ti], будет доказана, если удастся
подобрать функцию a G С°°(М), для которой проекции тг: Ct —>• М,
t G [0, ti], суть диффеоморфизмы.
При t = 0 проекция тг: jCq —>• М является диффеоморфизмом.
Поэтому при малых ? > О любая функция a G С°°(М) порождает
многообразия ?t, диффеоморфно проецирующиеся на М по крайней
мере в пределах любого компакта К (е М. Таким образом получаем
достаточные условия оптимальности для малых дуг экстремальных
траекторий.
Следствие 17.1. Для любого компакта К (е М, содержащего
нормальную экстремальную траекторию
существует такое t[ G @, ?i], что дуга
q{t), O^t^ti,
оптимальна относительно всех траекторий, содержащихся в К и
удовлетворяющих таким же граничным условиям.
Во многих задачах молено подобрать достаточно большой компакт
К D q так, чтобы функционал J был отделен от нуля снизу на всех
траекториях, покидающих К (так будет, например, если (p(q,u) > 0).
Тогда малые дуги траекторий q оптимальны глобально.
17.1.3. Задача со свободным временем. Для задач с интег-
интегральным критерием и свободным конечным временем t\ справедливо
достаточное условие оптимальности, аналогичное теореме 17.1; см.
ниже теорему 17.2.
Напомним, что все нормальные экстремали в задаче со свободным
временем лежат на поверхности нулевого уровня Н~1@) максими-
максимизированного гамильтониана Н. Докажем сначала вспомогательное
утверждение.
Предложение 17.2. Предположим, что 0 есть регуляр-
регулярное значение ограничения Н\с , т. е. d\ Н\Т с ^0 для всех X G
1
Тогда отображение
Ф: ГоПЯ-^О) xR^T*M,
является погружением, а Фв — точной формой.
Доказательство. Во-первых, регулярность нулевого значе-
значения отображения Н\^ означает, что CqD Н~1@) есть гладкое мно-
многообразие. Тогда точность формы Фз легко следует из предложе-
предложения 17.1. Чтобы доказать, что Ф — погружение, достаточно показать,
<9Ф -*
что вектор -^— (Ао,?) = H(Xt), Xt = Ф(Ао,?), не касается образа пе-
17.1. Достаточные условия оптимальности 233
ресечения ?0 П Я-1@) при диффеоморфизме etH: Т*М —» Т*М для
всех Ло G ?0 П Я"! @). Заметим, что etS (?0 П Я"х @)) = CtHH'1 @).
Мы докажем немного больше, чем требуется, а именно, что Я(Л^) не
касается многообразия ?t.
Из предложения 17.1 следует, что <j\ct = ds\ct = 0. Поэтому доста-
достаточно показать, что форма {i^cr)\ct не обращается в нуль в точке А^.
Напомним, что гамильтонов поток etH сохраняет как а, так и Я. В
частности,
7^
cQ
Отображение etH обратимо. Поэтому достаточно показать, что dH
не обращается в нуль в точке До. Но это утверждение — условие нашей
теоремы. ?
Теперь получим достаточные условия оптимальности для задачи
со свободным временем.
Теорема 17.2. Пусть W — такая область е?оП Я-1@) х М,
что ограничение
тг о
W —)> М
является диффеоморфизмом W на область в М, и пусть
есть такая нормальная экстремаль, что (Ао,?) G W для всех t G
G[O,ti].
Тогда экстремальная траектория q(t) = тг(А^) (вместе с соот-
соответствующим управлением u(t)) реализует строгий минимум функ-
Т
ционала J (p(q(t),u(t)) dt среди таких допустимых траекторий, что
о
q(t) Е тг о ф(И0 для всех t G [0, r], q@) = g@), q(r) = g(ti), t > 0.
Доказательство. Положим С = Ф(И^), тогда отображ:ение
тг: С —> тг(?) есть диффеоморфизм, а форма s\c точна. Пусть q(i), t G
G [0, г], есть допустимая траектория, порожденная управлением u(t),
содерж:ащаяся в тт(С) и удовлетворяющая граничным условиям д@) =
= g@), q(r) = q(h). Тогда q(t) = тг(А(*)), 0 ^J ^ г, где t ^ A(t) - такая
гладкая кривая в С, что А@) = Ао, А(т) = А^^
Получаем J s = J s. Далее,
А(-) А.
s = f{\u Щ) dt = j(\u fmШ)) dt = J <p(q(t),u(t)) dt.
А. о ° °
Последнее равенство следует из того, что
),/ад(«(*))> " ?>(«(*),«(*)) = ff(A(*)) = 0.
234 Гл. 17. Достаточные условия оптимальности
С другой стороны,
Т Т Т
J s = J(\(t), q(t)) dt = J hu{t)(X(t)) dt + J <p(q(t), u{t)) dt <
Г
f ip{q(t),u{t))dt.
A(-)
Последнее неравенство следует из цепочки max hu(X(t)) = H(X(t)) = 0.
uEU
Более того, это неравенство становится строгим, если кривая t H> X(i)
не является решением уравнения Л = Н(Х), т. е. если она не совпадает
с X(t). Итак, ti
J <p(q(t), u(t)) dt^ J <p(q(t), u(t)) dt,
о о
причем это неравенство строгое, если q отлично от q. ?
17.2. Уравнение Гамильтона—Якоби
Будем предполагать, что условия теоремы 17.1 выполняются. Как
было показано при доказательстве этой теоремы, форма (s — Нdt)\^
точна, поэтому она равна дифференциалу некоторой функции:
(s-Hdt)\c = dg, g: С^Ж. A7.10)
В силу взаимной однозначности проекции тг: ?t —>- М молено отож-
отождествить (Л, t) G Ct x R С С с (g, t) G M x R и определить д как
функцию на М х R:
Чтобы выяснить смысл функции ^ в нашей задаче оптимального
управления, рассмотрим экстремаль
и кривую ~
так же, как в теореме 17.1. Тогда
f s-Hdt = f v{q{r),u{T))dr, A7.11)
7
О
где ^(t) = тг(Л^) — экстремальная траектория, a u(i) — управление,
максимизирующее гамильтониан hu(X) вдоль Л^. Равенства A7.10)
и A7.11) означают, что
9Ш, t) = g(q0, 0) + J <р(д(т), п(т)) dr,
17.3. Динамическое программирование 235
т. е. g(q,t) — g(qo,O) есть оптимальное качество движения между точ-
точками q0 и q за время t. Начальное значение для д можно выбрать в
g(qo,0) = a(q0), q0 6 M. A7.12)
Действительно, при t = 0 определение A7.11) функции д записывается
как
d9\t=o = (s ~ Hdt)\c0 = s\c0 = da'
что совместимо с A7.12).
Уравнение A7.10) можно переписать как уравнение в частных
производных для д. В локальных координатах на М и Т*М получаем
п — i* (^- 7\/Г Л — (у т* i С^- Т 7\/Г п — п(пг ~t I
Тогда уравнение A7.10) записывается как
т. е.
Эту систему можно объединить в одно нелинейное уравнение в част-
частных производных первого порядка:
|f + Я (|f,,)-0, A7.13,
которое называется уравнением Гамильтона-Якоби. Итак, опти-
оптимальное качество g(x,t) удовлетворяет уравнению Гамильтона-
Якоби A7.13) с начальным условием A7.12).
Характеристическая система для уравнения в частных производ-
производных A7.13) имеет вид
. дН
i - дН
Kj-tg(x(t),t) = & - Н.
Первые два уравнения образуют гамильтонову систему Л = Н(Х)
для нормальных экстремалей. То есть решение задачи оптимального
управления A7.1)—A7.3) приводит к методу характеристик для урав-
уравнения Гамильтона-Якоби для оптимального качества.
17.3. Динамическое программирование
Уравнение Гамильтона-Якоби для оптимального качества можно
вывести и непосредственно, минуя принцип максимума Понтрягина
благодаря идее, восходящей еще к Гюйгенсу и составляющее основу
236 Гл. 17. Достаточные условия оптимальности
метода динамического программирования Беллмана; см. [3]. Для это-
этого необходимо предположить, что оптимальное качество g(q,t) су-
существует и С1 -гладко.
Пусть оптимальная траектория переводит точку g0 B точку q за
время t. Применим постоянное управление и на временном отрезке
[t, t + St] и обозначим траекторию, выходящую из точки д, через qu(r),
г Е [t, t + St]. Так как qu(t + St) — конечная точка допустимой траек-
траектории, начинающейся в до? т0 выполняется следующее неравенство
для оптимального качества:
t+8t
ip(qu(r),u) dr.
t
Разделим на St:
t+6t
jt (g(qu(t + 5t),t + 6t) - g(q,t))<j-tf Ч>Ыт),и) dr,
t
и перейдем к пределу при St —> 0:
Получаем неравенство
mj^O, ueU. A7.14)
Пусть теперь (q(t),u(t)) есть оптимальная пара. Пусть t > 0 —
точка Лебега управления и. Возьмем любое St G @, t). Любой участок
оптимальной траектории оптимален, поэтому q(t — St) есть конечная
точка оптимальной траектории, так лее, как и q(t). Поэтому оптималь-
оптимальное качество д удовлетворяет равенству
t
g(q(t), t) = g(q(t - St), t - St) + J <р(д(т), и(т)) dr.
t-St
Повторяем наши рассуждения:
t
jt (9(q(t), t) - g(q(t - St), t - St)) = 1 I <p(q(r), u(r)) dr,
t-St
переходим к пределу St —>• 0:
М§Я°- A7Л5)
Это равенство вместе с неравенством A7.14) означает, что
17.3. Динамическое программирование 237
Обозначим
и запишем A7.15) как уравнение Гамильтона-Якоби:
тт да
Получаем, что производная оптимального качества -^- равна импуль-
импульсу ? вдоль оптимальной траектории q(i).
Мы не касаемся здесь обширной теории обобщенных негладких
решений уравнения Гамильтона—Якоби для гладких и негладких га-
гамильтонианов .
Глава 18
ГАМИЛЬТОНОВЫ СИСТЕМЫ
ДЛЯ ГЕОМЕТРИЧЕСКИХ ЗАДАЧ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
18.1. Гамильтоновы системы на тривиализованном
кокасательном расслоении
18.1.1. Мотивация. Рассмотрим управляемую систему, которая
описывается конечным набором векторных полей на многообразии М:
q = fu(q), ttG{l,...,t}, qeM. A8.1)
Построим параметризацию кокасательного расслоения Т*М, согла-
согласованную с этой системой. Сначала выберем базис в касательных
пространствах TqM из полей fu(q) и их повторных скобок Ли:
предполагая, что система имеет полный ранг. Получаем специальные
координаты в касательных пространствах
(&,...,?„) eR".
Поэтому любой касательный вектор к М представляется набором
(&,•••,&,;«), (<?ъ...,<?„) еМ", деМ,
т. е. получена своего рода параметризация касательного расслоения
ТМ = U TqM. Можно построить координаты на ТМ, выбирая ло-
qEM
кальные координаты в М, но такой выбор будет внешним по отно-
отношению к нашей системе, и мы будем работать на М без каких-либо
координат.
Имея в виду гамильтонову систему принципа максимума, перей-
перейдем к кокасательному расслоению. Построим двойственный базис
в Т* М: выберем такие дифференциальные формы
что
(ui,fj) = 6ij, i, j = 1,.. .,n.
Тогда в кокасательных пространствах возникают специальные коор-
координаты
18.1. Тривиализованное кокасапгелъное расслоение 239
Получаем параметризацию кокасательного расслоения:
Аи (т/ь...,т/п;д), G7i,...,77n) GMn, gGM.
В обозначениях параграфа 11.5
есть линейный на слоях гамильтониан, соответствующий полю fi.
Канонические координаты на Т*М возникают точно так же из ком-
коммутирующих векторных полей fi = ——, г = 1,...,п,
щих локальным координатам (жх,...,жп) на М. Следовательно, в
(единственно интересном для теории управления) случае некомму-
тирующих полей fi «координаты» G71,..., r]n\ q) на Т*М не являются
каноническими.
Наша цель — записать гамильтонову систему в этих нестандарт-
нестандартных координатах на Т*М или в каких-нибудь других естественных
координатах, согласованных с изучаемой управляемой системой.
18.1.2. Тривиализация Т*М. Пусть М — гладкое многообра-
многообразие размерности п, и пусть Е — n-мерное векторное пространство.
Предположим, что задана тривиализация кокасательного расслое-
расслоения Т*М, т. е. такой диффеоморфизм
Ф: ЕхМ ^Г*М,
что:
1) диаграмма
ЕхМ Ф ) Т*М
1-
М ^^= М
коммутативна, т. е.
тг о Ф(е, q) = g, e G E, q G М;
2) для любых q Е М отображ:ение
енФ(е,д), евЕ,
есть линейный изоморфизм векторных пространств
Пространство ?? отождествляется с любым слоем Т*М, т.е. оно
является типичным слоем кокасательного расслоения Т*М.
Фиксируя вектор е G Е, получаем дифференциальную форму
на М
Фе=? Ф(е,-) GA*M.
240 Гл. 18. Геометрические задачи оптимального управления
В предыдущем параграфе мы имели
г=1
но сейчас мы не фиксируем базис в Е.
18.1.3. Симплектическая форма на Е х М. Чтобы записать
гамильтонову систему на Е х М ~ Т*М, вычислим симплектическую
форму Фа на Е х М. Начнем с формы Лиувилля
8 G А1(Т*М)
и вычислим ее перенос
Фв G Л1(?^ х М).
Касательные и кокасательные пространства естественно отождеств-
отождествляются с прямыми произведениями:
T(e,q) (Е X М) ~ ТеЕ 0 TqM ~ Е 0 TqM,
Т(е q) (Е Х М) - ТеЕ ® Tq М - Е* ® Tq M'
Любое векторное поле V G Vec(i? x M) есть сумма вертикальной и
горизонтальной частей:
V = VV + Vh, Vv(e, q) e E, Vh(e, q) G TqM.
Аналогично, любая дифференциальная форма
ио еА1(Ех М)
есть сумма вертикальной и горизонтальной частей:
.^ _ 771* ?— ГТ1* 1\/Г
Вертикальная часть uov равна нулю на горизонтальных касательных
векторах, а горизонтальная часть со^ — на вертикальных касательных
векторах.
В частности, векторные поля и дифференциальные формы на М
(быть может, зависящие от е G Е) можно рассматривать как гори-
горизонтальные векторные поля и дифференциальные формы на Е х М:
TqM = 00 TqM С T{e^q) (Ex М),
Т*М = 00 Т*М С T^q)(E х М).
Вычислим значение формы Фз на касательном векторе (?, v) G
G ТеЕ 0 TqM:
Поэтому ^
(Ф5)(е,9) = Ф(е,д), A8.2)
где Ф — правая часть A8.2), рассматриваемая как горизонтальная
форма на Е х М.
18.1. Тривиализованное кокасапгелъное расслоение 241
Далее, вычислим перенос стандартной симплектической формы:
Фсг = Фс/s = с/Фз = с/Ф.
Напомним, что дифференциал формы ш Е Л1 (JV) может быть вычис-
вычислен по формуле A1.15):
dcu(WuW2) = W^w, W2) - W2{uj, W±) - (u>, [Wu W2}),
WUW2 e VecTV. ^ • ^
В нашем случае N = E x M выберем пробные векторы вида
i = 1,2,
где & = const E E — постоянные векторные поля и V{ G VecM —
горизонтальные векторные поля. В силу A8.3)
так как [(^i, Vx), F, V2)] = [Fb V2]. Далее,
(F,^1)<Ф(-,-),^»(е,.) = F(Ф(-,-),^
(учитывем, что Ф линейно по е)
= (Ф6,у2) + ^(Фе
Следовательно,
Обозначим два первые слагаемые через
ШъУМЬМ)) = (Ф€1,^2> - (ФСа, Vi>,
и применим формулу A8.3) к горизонтальной форме Фе:
В результате получаем выражение для переноса симплектической
формы
Фа(е,.)(F, V,), F, F2)) = Ф((|ь Fi), F, ^2)) + с/Фе(^ь V2), A8.4)
т. е. ^ _
ФG(е?.) = Ф + б/Фе.
Замечание. В случае канонических координат молено взять
пробные векторные поля Vi = -—, тогда получаем с/Фе = 0.
18.1.4. Гамильтонова система на Е х М. Формула A8.4) опи-
описывает симплектическую структуру Фсг на Е х М. Вычислим теперь
гамильтоново векторное поле, соответствующее гамильтониану
heC°°(ExM).
16 А.А. Аграчев, Ю.Л. Сачков
242 Гл. 18. Геометрические задачи оптимального управления
Молено рассматривать h как семейство функций на М, параметризо-
параметризованное векторами из Е:
ееЕ.
Разложим искомое гамильтоново векторное поле в сумму вертикаль-
вертикальной и горизонтальной частей:
h = X + У,
X = X(e,q)eE,
Y = Y{e,q)GTqM.
По определению гамильтонова поля
гх+уФсг = -dh. A8.5)
Преобразуем обе части этого равенства:
,, dh „
—dh = — — dhe ,
де ч^^/
ет*м еЕ* ет*м
Приравняем друг другу вертикальные части A8.5):
<Ф.,У> = §?, A8.6)
из этого уравнения молено найти горизонтальную часть Y гамильто-
гамильтонова поля h. Действительно, у линейного изоморфизма
Ф(-,<?): Е^Т*М
существует двойственное отображение
Ф*( •,<?): TqM^E*.
Тогда уравнение A8.6) молено записать как
а затем разрешить относительно Y:
г = Ф*-г—.
д е
Чтобы найти вертикальную часть X поля /г, приравняем друг
другу горизонтальные части A8.5):
Фх + iyd^e = —dhe,
перепишем как
Фх = —iyd^e — dhe
18.1. Тривиализованное кокасапгелъное расслоение 243
и решим это уравнение относительно X:
X = -^(lYd^e+dhe).
Следовательно, гамильтонова система на Е х М, соответствующая
гамильтониану /г, имеет вид
{. _ ф*_1$/г
Q~ ~dl' A8.7)
ё = -Ф 1(iqd$e + dhe).
Запишем теперь эту систему с использованием координат в кока-
сательных и касательных пространствах (координаты на М мы не
используем).
Выберем базис в Е:
Е = span(ei,...,en),
тогда векторы и Е Е представляются как
и =
г=1
Получаем
/ п \ п
где
суть базисные 1-формы на М. Далее, внешние произведения
uji Л ujj е Л2(М), 1 ^ г < j ^ гг,
образуют базис в пространстве 2-форм на М. Разложим дифферен-
дифференциалы в этом базисе:
п
dujk = Y^ cij "i Л шз = Yl 2 Сг^' ^ Л ^'
где коэффициенты суть гладкие функции
с% eC°°(M), i,j,k =
кососимметрические по нижним индексам:
Коэффициенты с^- называются структурными константами (хо-
(хотя они, вообще говоря, и непостоянны). Мы проясним этот термин и
дадим простой рецепт их вычисления ниже, в предложении 18.1.
Выберем репер в TqM, двойственный реперу c^i,..., иоп:
16*
244 Гл. 18. Геометрические задачи оптимального управления
Запишем нашу гамильтонову систему A8.7) во введенных координа-
координатах. Функция Гамильтона есть
he C°°{Rn x М),
h = h(uu...,un,q), (uu...,un) eMn, qE M.
В силу того, что
получаем
\о/
где единственная единица — г-я компонента. Следовательно, гори-
горизонтальная часть поля h раскладывается по горизонтальным полям
следующим образом:
v Аалт/
V — \ Л/.
Рассмотрим вертикальную часть поля h:
Второе слагаемое легко вычислить, так как
dhu =
это разлолсение проверяется на базисных векторных полях V{. А пер-
первое слагаемое имеет вид
-Ф li
1 k ( dh^ _д д]ъ_ _д_
2 lJ\duj дщ дщ ди-
(мы оставляем его проверку читателю в качестве упражнения).
Итак, гамильтонова система в подвижных реперах (Vi,..., Vn) и
(c^i,..., о;п) записывается следующим образом:
\~^ дh тт
Q = > V;.
щ = -Vihu +
dh
г =
Замечание. Эта система становится особенно простой (тре-
(треугольной), если гамильтониан не зависит от точек на базе:
18.2. Группы Ли 245
Вертикальная подсистема упрощается еще больше, когда
с^. = const, г, j, к = 1,..., п.
Оба эти условия выполняются для инвариантных задач на группах
Ли, которые мы рассмотрим в следующих параграфах.
Структурные константы с^- легко выражаются в терминах скобок
Ли базисных векторных полей.
Предложение 18.1. Пусть векторные поля Vi,...,Vn G
G VecM образуют двойственный репер к реперу 1-форм c^i,... ,cjn G
еА1(М):
(u>i,Vj) = 6ij, ij = l,...,n.
Равенство
n
dujk= ^ - ck{j uJiAujj, k = 1,..., n,
имеет место тогда и только тогда, когда
Доказательство. Равенство для dui^ мож:но переписать в
следующем виде:
(du}k,(Vi,Vj)) = с^, i,j, k = l,...,n.
Левая часть вычисляется по формуле A8.3):
<dwfc, (Уь ^-)> = Vi(uk, V-) - Vj(ujk, Vi) -{u>k, [Vi, Vj\),
=0 =0
и утверждение доказано. ?
Если коэффициенты с^ постоянны, то пространство, натянутое
на векторные поля Vi,...,V^, образует конечномерную алгебру Ли,
и числа с\- называются структурными константами этой алгебры
Ли. Как было отмечено выше, для векторных полей общего вида с\- ф
t
= const.
18.2. Группы Ли
Пространства состояний многих интересных задач в геометрии,
механике и приложениях часто являются не просто гладкими мно-
многообразиями, а группами Ли, в частности группами преобразований.
Многообразие с групповой структурой называется группой Ли, если
групповые операции гладкие. Кокасательное расслоение группы Ли
имеет естественную тривиализацию. Мы развиваем подход преды-
предыдущего параграфа и изучаем задачи оптимального управления на
группах Ли.
246 Гл. 18. Геометрические задачи оптимального управления
18.2.1. Примеры групп Ли. Наиболее важные примеры групп
Ли — это группы линейных преобразований конечномерных вектор-
векторных пространств.
Группа всех невырожденных линейных преобразований W1 назы-
называется общей линейной группой:
GL(rc) = {X: W1 -+ Rn | det X ф 0}.
Линейные преобразования Мп, сохраняющие объем, образуют специ-
специальную линейную группу
SL(ra) = {X: W1 ^Rn\ detX = 1}.
Для этих групп используются также обозначения GL(Mn) и SL(Mn)
соответственно. Ортогональная группа состоит из всех линейных пре-
преобразований, сохраняющих евклидову структуру:
KjyTlj — -[Л. . ж. —г ж. | Л. Л. — 1QJ-,
а ортогональные преобразования, сохраняющие ориентацию, образу-
образуют специальную ортогональную группу
SO(n) = {X: W1 -> W11 Х*Х = Id, det X = 1}.
Можно также рассматривать комплексную и эрмитову версии этих
групп:
GL(Cn), SL(Cn), U(n), SU(n),
для этого в приведенных выше определениях нужно заменить Ш\п
на Сп. Каж:дая из этих групп реализуется как подгруппа соответст-
соответствующей вещественной или ортогональной группы. А именно, общую
линейную группу GL(Cn) и унитарную группу \](п) можно рассмат-
рассматривать соответственно как подгруппы GL(R ) и ОBп), коммутирую-
коммутирующие с умножением на мнимую единицу:
GL(Cn) = | (^в ^) | А, В: W1 -+ К", det2Л + det2B ф о| С
С GL(K2n),
п) = )[-В A
* = о|
АА* + ББ* = Id, В А* - АВ* = о| С GL(Cn) П ОBп).
Специальная линейная группа SL(Cn) и специальная унитарная
группа SU(n) реализуются следующим образом:
A,B: W1 ^Mn, det(A + гБ) = l| С SL(M
2n)
18.2. Группы Ли 247
suwhu^ BA
А, В: W1 -^W1, ЛА*+ББ* = Id,
В А* - АВ* = О, det(A + iB) = l\= Ц(п) П SL(Cn) С SOBrc).
Группы Ли линейных преобразований называются линейными
группами Ли. Эти группы часто возникают в качестве пространств
состояний управляемых систем: например, SO(n) возникает при ис-
исследовании вращающихся конфигураций. Для таких систем можно
рассматривать, как обычно, задачи управляемости и оптимального
управления.
18.2.2. Теорема Ли для линейных групп Ли. Рассмотрим
управляемую систему вида
Х = ХА, X еМ = GL(iV), AeAcgl{N), A8.8)
где А — произвольное подмножество gl(iV) пространства всех вещест-
вещественных (N х 7У)-матриц. Вычислим орбиты этой системы. Системы
вида A8.8) называются левоинвариантными: они сохраняются при
умножении слева на любую постоянную матрицу Y G GL(AT).
Отметим, что решение дифференциального уравнения с постоян-
постоянной матрицей А
X = ХА
задается матричной экспонентой:
X(t) = X{Q)etA.
Скобка Ли левоинвариантных векторных полей левоинвариантна:
[ХА,ХВ] = Х[А,В], A8.9)
это следует из координатного представления коммутатора (упраж-
(упражнение).
Замечание. Вместо левоинвариантных систем X = ХА можно
рассматривать правоинвариантные системы X = СХ. Эти формы
эквивалентны и переводятся одна в другую переходом к обратным
матрицам. Однако скобка Ли правоинвариантных векторных полей
имеет вид
[CX,DX] = [D,C]X,
эта формула менее удобна, чем A8.9).
Вернемся к управляемой системе A8.8). По теореме об орбите
проходящая через единицу орбита О\& (А) есть погруженное подмного-
подмногообразие в GL(iV). Более того, по определению орбита представляется
с помощью композиции потоков
= {И oetlAl о ... о etkAk \UGR, At е А, к е N} =
(поэтому и через произведение матричных экспонент)
= {etlAl ¦ ... ¦ etkAk | U G К, Ai g A, k& Щ.
248 Гл. 18. Геометрические задачи оптимального управления
Следовательно, орбита Оы{А) — подгруппа в GL(iV). Далее, в до-
доказательстве теоремы об орбите мы показали, что точка q о е*1 х о ...
... о etkAk зависит от (?]_,..., ?&) непрерывно в «сильной» топологии
орбиты, а потому и гладко.
Подведем итоги. Мы показали, что орбита, проходящая через еди-
единицу, удовлетворяет следующим свойствам:
1) Оы (Л) есть погруженное подмногообразие GLGV);
2) Оы(А) есть подгруппа в GLGV);
3) групповые операции (X, Y) \-> XY, X \-± Х~г в Оы{Л) гладкие.
Иными словами, орбита Оы(А) являются подгруппой Ли группы
GLGV).
Касательные пространства к орбите легко легко вычисляются с
помощью аналитической версии теоремы об орбите (система A8.8)
вещественно аналитична):
A8.10)
Орбита левоинвариантной системы A8.8), проходящая через лю-
любую точку X Е GL(iV), получается левыми сдвигами орбиты, прохо-
проходящей через единицу:
ОХ(Л) = {XetlAl... etkAk\ ueR, А{ е Л, кеЩ = ХОЫ(А).
Выше мы рассматривали систему A8.8), заданную произвольным
подмножеством Л С gl(iV). Если ограничиться подалгебрами Ли
А = Lie(A) С gl(JV),
то легко видеть, что доказано следующее предложение: каждой по-
подалгебре Ли Л С gl(-^V) соответствует такая связная подгруппа Ли
М С GL(iV), что TiaM = Л. Здесь М = ОыА. Покажем теперь, что
это соответствие обратимо.
Пусть М есть связная подгруппа Ли группы GL(AT), т. е.:
1) М есть связное погруженное подмногообразие GLGV);
2) М образует группу относительно матричного произведения;
3) групповые операции (X, Y) ь-)> XY, X i—>- X суть гладкие отоб-
отображения в М.
Тогда Id G М. Рассмотрим касательное пространство
ТЫМ =\А= ¦%- Tt\ Tt е М, Tt гладкая, Го = Id).
I at t=o )
Так как М С GLGV) С gl(iV), то получаем
ТЫМ С gl(JV).
Далее,
А е тым, х ем => ХАе тхм,
так как вектор
А
XTt
dt
t=o
18.2. Группы Ли 249
есть скорость кривой XTt, где А = Г о- Следовательно, для любого A G
G Т\&М векторное поле ХА тождественно касается многообразия М.
Поэтому на М корректно определена следующая управляемая сис-
система:
х = ха, х е м, А е тым.
Эта система имеет полный ранг. Пространство состояний М связно,
поэтому оно совпадает с орбитой О\& этой системы, проходящей че-
через единицу. Но касательное пространство к орбите уже вычислено
(см. A8.10)), поэтому
ТиМ = rid(Oid) = Ые(ГиМ).
То есть TiaM — подалгебра Ли алгебры gl(iV).
Мы доказали следующее классическое предложение.
Теорема 18.1 (Ли). Существует такое взаимно однозначное
соответствие между подалгебрами Ли А С gl(iV) и связными под-
подгруппами Ли М С GL(AT), что ТЫМ = А.
Мы показали, что теорема Ли для линейных алгебр и групп Ли
следует из теоремы об орбите: связные группы Ли суть орбиты ле-
воинвариантных систем, задающихся подалгебрами Ли, а подалгебры
Ли суть касательные пространства к подгруппам Ли в единице.
18.2.3. Абстрактные группы Ли. Абстрактная группа Ли есть
абстрактное гладкое многообразие (не вложенное ни в какое объем-
объемлющее пространство), одновременно являющееся группой с гладкими
групповыми операциями. Справедлива теорема Адо [141], согласно
которой любая конечномерная алгебра Ли изоморфна подалгебре Ли
алгебры gl(JV). Аналогичное утверждение для групп Ли неверно: лю-
любая группа Ли может быть представлена как подгруппа Ли группы
GLGV) только локально, но, вообще говоря, не глобально. Однако
важнейшие свойства линейных групп Ли обобщаются на абстрактные
группы Ли.
А именно, пусть М есть группа Ли. Для любой точки q G М,
умножение слева на q:
q: M ->> М, q{x) = qx, x G М,
есть диффеоморфизм многообразия М. Любой касательный вектор
v Е ТЫМ
можно перенести в любую точку q G М левым сдвигом q:
V{q) = q*v G TqM, q G M,
в результате чего возникает левоинвариантное векторное поле на М:
FGVecM, q*V = V, q G M.
Имеется взаимно однозначное соответствие между левоинвариант-
ными векторными полями на М и касательными векторами к М в
единице:
V ^ У (Id) = v.
250 Гл. 18. Геометрические задачи оптимального управления
Левые сдвиги на М сохраняют потоки левоинвариантных векторных
полей на М, а потому и потоки их коммутаторов. Следовательно,
левоинвариантные векторные поля на группе Ли М образуют алгеб-
алгебру Ли, которая называется алгеброй Ли группы Ли М. Поэтому и
касательное пространство Т\&М есть алгебра Ли.
Так лее, как в линейном случае, молено доказать теорему Ли о
взаимно однозначном соответствии между подгруппами Ли группы
Ли М и подалгебрами Ли ее алгебры Ли Л.
18.3. Гамильтоновы системы на группах Ли
18.3.1. Тривиализация ко касательного расслоения группы
Ли. Пусть М С GLGV) — подгруппа Ли. Обозначим через М. соот-
соответствующую подалгебру Ли:
М = ТЫМ С glGV).
Кокасательное расслоение группы Ли М имеет тривиализацию вида
Ф: М* х М^Г*М,
где Ai* есть сопряженное пространство алгебры Ли Л4. Сначала опи-
опишем сопряженное отображение
Ф* : ТМ ^Мх М.
Напомним, что TqM = qT\&M = qM, для любого q G М. Положим
Ф*: qa^f (a,q), a G M, q G M, qaeTqM. A8.11)
То есть значение левоинвариантного векторного поля qa в точке q
отображается в пару, состоящую из значения этого поля в единице и
точки q. Сама же тривиализация Ф имеет вид
<S>:(x,q)^xq, xeM\ q G M, xqeT*M, A8.12)
где х — левоинвариантная 1-форма на М, в единице совпадающая с х:
I— \ def / \
{xq,qa) = (х,а).
18.3.2. Гамильтонова система на Ai* x M. Гамильтонова сис-
система, соответствующая функции Гамильтона
h = h(x,q) G С°°(Л4* хМ)
была вычислена в параграфе 18.1 (см. A8.7)):
ф-!*^
дх' A8.13)
-Ф~1(б//гж + iqd^x).
Учитывая определение A8.11) отображения Ф*, первое уравнение
можно переписать в следующем виде:
dh
18.3. Гамильтоновы системы на группах Ли 251
Здесь dh/dx — вертикальная часть формы dh G Л1(Л4* х М), т.е.
— {xiQ) ? (.М*)* = .Л/f, {ХH) ? Af* х Af.
Чтобы найти ж, вычислим действие дифференциала с?ж = с/Фж на
левоинвариантных векторных полях по формуле A1.15):
dx(qa, qb) = (qa) (ж, b) —(qb) (ж, а) —(ж, [a, 6]) = —(ж, [a, b]).
=const =const
Тогда
Ф~"ЧдС/Фж = ^~1iqQiliQxdx = — /ж, —, • ) = — /ж, fad — J • \ =
// , dh\* \ ( , dh\*
= -( I ad — ) ж, • ) = - ad -- ж.
\\ dx) I \ dx)
Поэтому гамильтонова система A8.13) принимает следующую форму:
dh,
fdXdh\* _ A8'14)
x=(ad — J x — ^~xdhx.
\ ox/
Напомним, что dhx есть горизонтальная часть формы dh, поэтому
(dhx)qGT*M, (x,q)€M*xM
Система A8.14) описывает гамильтонову систему для произвольной
группы Ли и любой функции Гамильтона h.
В случае коммутативных групп Ли (возникающем в тривиализа-
ции Т* М, порожденной локальными координатами на М) первое сла-
слагаемое во втором уравнении A8.14) исчезает, и мы получаем обычную
форму гамильтоновой системы в канонических координатах
dh
В случае левоинвариантного гамильтониана:
h = h(x),
гамильтонова система A8.14) становится треугольной:
dh
dh\*
d x )
х.
Здесь второе уравнение не содержит q. Поэтому в левоинвариант-
левоинвариантных задачах управления, где гамильтониан принципа максимума h
252 Гл. 18. Геометрические задачи оптимального управления
левоинвариантен, молено сначала независимо решать уравнение для
вертикальных координат ж, а затем переходить к горизонтальному
уравнению для q.
18.3.3. Компактные группы Ли. Гамильтонова система A8.15)
упрощается еще более в случае компактных групп Ли.
Пусть М есть компактная подгруппа Ли группы GLGV). Тогда М
можно рассматривать как подгруппу Ли ортогональной группы O(N).
Действительно, молено выбрать евклидову структуру (•,•) на M.N,
инвариантную относительно всех преобразований из М:
(Av,Aw) = (v,w), v,weRN, AeM cGL(N).
Такую структуру молено получить из любой евклидовой структуры
д( •, •) на M.N усреднением по A G М с помощью формы объема uj\ А ...
...Ло;п, где uoi суть базисные левоинвариантные формы на М:
(v,w) = / ~fv,w ^i Л...Л^П,
м
7v,w{A) = g(Av,Aw), AeM.
Поэтому будем предполагать, что все элементы М суть ортогональ-
ортогональные (N х 7У)-матрицы, а касательное пространство к М в единице
состоит из кососимметрических матриц:
М = ТЫМ С Ты O(N) = so(N) = {a: RN -> RN \ a* + а = 0}.
Ha soGV) имеется инвариантное скалярное произведение, которое
определяется следующим образом:
(а,6) = —tra6, a, 6 G so (TV).
Инвариантность этого произведения означает, что
(etadca,etadcb) = (a, 6), а, Ъ, с G so(JV), fGl, A8.16)
т. е. оператор
Adetc = etadc: so(N) -+ so (N)
ортогонален относительно этого произведения. Равенство A8.16) есть
следствие инвариантности следа:
(etadca,etadcb) = ((Adetc)a,{Adetc)b) = {etcae~tc, etcbe~tc} =
= -tr(etcae-tcetcbe-tc) = - tr(etcаЬе~гс) = - tr(ab) = (a, b).
Знак минус в определении инвариантного скалярного произведения
на soGV) обеспечивает положительную определенность произведения.
Это легко видеть в координатах: если
а= (aij), b= (bij) Gso(TV),
TO N N
-tr(ab) = -
18.3. Гамильтоновы системы на группах Ли 253
Норма на soGV) определяется естественным образом:
\а
,а), aeso(N).
Инфинитезимальная версия свойства инвариантности A8.16) лег-
легко получается дифференцированием при t = 0:
([с, а], Ъ) + (а, [с, Ъ}) = 0, а,Ъ,се so(JV). A8.17)
То есть все операторы
ad с: soGV) ->> so(iV), с G so(iV),
кососимметричны относительно инвариантного скалярного произве-
произведения. Равенство A8.17) есть многомерное обобщение свойства век-
векторного и скалярного произведения вМ3 ~ soC).
Так как Л4 С so(iV), то инвариантное скалярное произведение
определено и на алгебре Ли Л4. Тогда сопряженное пространство
Л4* молено отождествить с алгеброй Ли М. с помощью скалярного
произведения (•,•):
М ->> Л4*, a i->> (а,-).
В терминах этого отождествления оператор (ada)*, a G Л4, прини-
принимает вид
(adа)*: М ->> Л4, (adа)* = -adа.
В случае компактной группы Ли М гамильтонова система A8.15)
для инвариантного гамильтониана h = h(а) определена на Л4 х М
и записывается как
а = а, -г— .
. L да]
Мы применим эту формулу в следующей главе для решения
нескольких геометрических задач оптимального управления.
Глава 19
ПРИМЕРЫ ЗАДАЧ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
НА КОМПАКТНЫХ ГРУППАХ ЛИ
19.1. Риманова задача
Пусть М — компактная группа Ли. Инвариантное скалярное про-
произведение (•, •) на алгебре Ли Ai = Т\&М определяет левоинвариант-
ную риманову структуру на М:
(qu,qv)q = (u,v),
u,v E M, q G M, qu, qv G TqM.
Поэтому в каждом касательном пространстве TqM имеется скалярное
произведение (•, • }q. Для любой липшицевой кривой
q: [0,1]->М
ее риманова длина определяется как интеграл скорости:
1
= J\q(t)\dt,
О
Задача состоит в том, чтобы для любой заданной пары точек qo,qi G
G М найти кратчайшую кривую в М, соединяющую go c qi-
Соответствующая задача оптимального управления ставится сле-
следующим образом:
q = qu, qe М, и G М, A9.1)
G@) = Gо, GA) = Gi, A9-2)
qo,qi G М закреплены, A9.3)
1
1(и) = [ \u(t)\dt
mm.
о
Сначала докалсем существование оптимальных управлений. Па-
Параметризуя траектории управляемой системы A9.1) длиной дуги,
мы видим, что задача с неограниченным управлением и G Л4 на
фиксированном отрезке t G [0,1] эквивалентна задаче с компактным
пространством управляющих параметров ?/ = {|г?| = 1}и свободным
конечным временем. После этого молено расширить пространство
управляющих параметров до U = {\и\ ^ 1}, чтобы множество допу-
допустимых скоростей fu{q) стало выпуклым. Тогда из теоремы Филип-
Филиппова следует существование оптимальных управлений в полученной,
а потому и в исходной задаче.
19.1. Риманова задача 255
По неравенству Коши—Буняковского
2
(l(u)J=(J\u(t)\dtj ^J\u(t)\2dt,
о о
более того, равенство имеет место только при \u(i)\ = const. Следова-
Следовательно, риманова задача / —>- min эквивалентна задаче
1
J(u) = i Г \u(t)\2 dt -+ min. A9.4)
о
Функционал J удобнее, чем /, так как J гладок и его экстремали —
автоматически кривые с постоянной скоростью. Далее будем рассмат-
рассматривать задачу с функционалом J: A9.1)—A9.4). Гамильтониан прин-
принципа максимума для этой задачи равен
К(а>0) = {uqiQV) + | \и\2 = (а, и) + | \и\2.
Условие максимума ПМП имеет вид
hl{t)(a(t),q(t)) = тах((а(*),«> + \ И2), v < 0.
A) Анормальный случай: v = 0.
Из условия максимума следует, что a(t) = 0. Это противоречит
ПМП, так как пара (ту, а) должна быть отличной от нуля. Поэтому
анормальных экстремалей в данной задаче нет.
B) Нормальный случай: v = — 1.
Условие максимума дает u(t) = a(i), поэтому максимизированный
гамильтониан гладок:
Я(а) = ±|а|2.
Заметим, что гамильтониан Н инвариантен (не зависит от q), что
является следствием левоинвариантности задачи.
Оптимальное траектории суть проекции решений гамильтоновой
системы, соответствующей Н. Эта гамильтонова система имеет вид
(см. A8.18))
(q = qa,
\а = [а, а] = 0.
Поэтому оптимальные траектории — левые сдвиги однопараметричес-
ких подгрупп в М:
q(t) = qoeta, a G М.
Напомним, что оптимальные решения существуют. В частности, для
случая g0 = Id получаем, что любая точка q\ G М может быть пред-
представлена в виде
q1 = еа, а G М.
То есть любой элемент q\ компактной алгебры Ли М имеет лога-
логарифм а в алгебре Ли ЛЛ.
256 Гл. 19. Задачи на компактных группах Ли
19.2. Субриманова задача
Модифицируем предыдущую задачу. Как и раньше, будем искать
кратчайшую кривую между фиксированными точками go> Qi B ком-
компактной группе Ли М. Но теперь допустимые скорости q несвободны:
они должны касаться левоинвариантного распределения (коранга 1)
на М. То есть мы зададим левоинвариантное поле касательных ги-
гиперплоскостей на Af, и скорость q(t) должна принадлежать гипер-
гиперплоскости, приложенной в точке q(t). Задача нахождения кратчайшей
Рис. 19.1. Субриманова задача
кривой, касающейся данного распределения, называется субримано-
вой задачей, см. рис. 19.1.
Чтобы сформулировать соответствующую задачу оптимального
управления, выберем любой элемент Ъ G Л4, \Ь\ = 1. Тогда множество
допустимых скоростей в единице есть гиперплоскость
U = Ь± = {и G М| (щЬ) = 0}.
Замечание. В случае М = SOC), это ограничение на скорости
означает, что мы фиксируем прямую Ъ в твердом теле и разрешаем
только вращения тела вокруг любой оси и, ортогональной прямой Ъ.
Задача оптимального управления ставится следующим образом:
q = qu, q G M, и G С/,
l
= [ \u{t)\
G М закреплены,
1
/1 dt —>- min.
о
Так же, как в римановой задаче, теорема Филиппова обеспечивает
существование оптимальных управлений, и задача минимизации дли-
длины эквивалентна задаче
1
J{u) = \f\u{t)\2dt
min.
о
Гамильтониан принципа максимума такой же, как в предыдущей
задаче:
19.2. Субриманова задача 257
но условие максимума отличается, так как теперь множество U мень-
меньше, чем раньше:
h"u{t)(a(t),q(t)) = max({a(t),v) + V-
Рассмотрим сначала нормальный случай: v = — 1. Из правила мно-
множителей Лагранжа получаем, что максимум
max h~x (a, q)
veb±
достигается на векторе
^тах = а- (а,Ь)Ь,
ортогональной проекции вектора а на [/ = б1. Максимизированный
гамильтониан гладок:
Н(а) = \(\а\2-(а,ЬJ),
и гамильтонова система для нормальных экстремалей имеет вид
q = q(a- (а,Ь)Ь),
[а = (а, Ь)[6, а].
Второе уравнение имеет первый интеграл
(а, Ъ) = const,
что легко проверить дифференцированием в силу этого уравнения:
j-t{a,b) = {a,b){[b,a],b) =
(по инвариантности скалярного произведения)
Следовательно, уравнение для а можно переписать как
а = (ао,Ь)[Ь,а] = ad((ao,b)b)a,
где ао = а@). Это линейное дифференциальное уравнение легко ре-
решается:
aW=etad«ao,6N)aOi
Теперь рассмотрим уравнение для q:
A9.5)
Это уравнение можно проинтегрировать с помощью формулы вариа-
вариации. Действительно, по формуле B.29) получаем
t
et(f+g) = е^р feTadfgdr о etf
feTadfgd
17 А.А. Аграчев, Ю.Л. Сачков
258 Гл. 19. Задачи на компактных группах Ли
т.е. t
exp Г eT ad fg dr = et(/+^ o e~tf A9.6)
о
для любых векторных полей / и д. Полагая
/ = (а0, Ъ)Ъ, д = а0 - (а0, Ь)Ь,
решаем уравнение A9.5):
q(t) = qoetaQe-^ao^b. A9.7)
Следовательно, нормальные траектории суть произведения двух од-
нопараметрических групп.
Рассмотрим анормальный случай: v = 0. Гамильтониан
hl(a,q) = (а, и), и ± Ъ,
достигает максимума, только если
a(t) = a(t)b, a(t) G R. A9.8)
Но второе уравнение гамильтоновой системы записывается как
а=[а,и], A9.9)
поэтому
(а, а) = ([а, и], а) = -(щ [а, а]) = 0,
т. е. a J_ а. В сочетании с A9.8) это означает, что
a(t) = const = ab, а ф 0, a G R A9.10)
Отметим, что а ^ 0, так как пара (y,a(t)) должна быть отличной
от нуля. Из равенств A9.9) и A9.10) следует, что анормальные экс-
экстремальные управления u(t) удовлетворяют соотношению
[u(t),b] =0.
То есть u(i) принадлежит подалгебре Ли
нь = {сеМ\ [c,b] = o}cM.
Для векторов Ъ G М. общего полож:ения подалгебра Н^ есть по-
подалгебра Картана в .М, поэтому Щ абелева. В этом случае первое
уравнение гамильтоновой системы
q = qu
содерж:ит только взаимно коммутирующие управления:
и(т) еНь => [iz(ri), и(т2)} = 0,
и это уравнение легко решается:
q(t) = qoexp(Ju(r) dr). A9.11)
19.2. Субриманова задача 259
Обратно: все траектории вида A9.11) с и(т) G Щ, т G [0, ?], анор-
анормальны, так как они являются проекциями анормальных экстремалей
(#(?), Q>{t)) с a(t) = ab для любых а ^ 0.
Приведем элементарное объяснение рассуждения с подалгеброй
Картана в случае М, = so(n). Любую кососимметрическую матрицу
6 G so(n) можно привести заменой переменных к диагональной форме
\
— IOL\
WL2
-га2
\
A9.12)
для некоторого Т G GL(n, С). Но замены переменных (далее комплекс-
комплексные) не влияют на коммутативность:
[с, Ъ] =0 ^ [ГсГ-1,ГЬГ-1] = 0,
поэтому подалгебру Щ молено вычислить, используя новые коорди-
координаты:
Щ = Т HTbT-iT.
Кососимметрические матрицы Ъ G so(n) общего положения имеют раз-
разные собственные значения, поэтому для матриц Ь общего положения
диагональная матрица A9.12) имеет разные диагональные элементы.
Для таких Ъ алгебру Ли HTbT-i легко найти. Действительно, комму-
коммутатор диагональной матрицы
/ft \
ч -. ,
с любой матрицей с = (с^) вычисляется следующим образом:
(adb) с =((&-&)*;)•
Если диагональная матрица Ъ имеет простой спектр:
А - ^ф 0, гф j,
то алгебра Ли Щ состоит из диагональных матриц вида A9.12), сле-
следовательно, Щ абелева.
Итак, для матрицы Ъ G so(n) с разными собственными значениями
(т.е. для матрицы Ъ G so(n) общего положения) алгебра Ли HTbT-i
абелева, поэтому Нь такж:е абелева.
Возвращаясь к нашей субримановой задаче, подведем итоги: мы
вычислили все нормальные экстремальные кривые A9.7) и описали
анормальные экстремальные кривые A9.11) для элементов Ъ G Ai
общего положения.
Упражнение 19.1. Рассмотрим более общую субриманову за-
задачу, которая ставится так же, как изученная в этом параграфе, но
17*
260 Гл. 19. Задачи на компактных группах Ли
теперь пространством управляющих параметров U С Л4 будет любое
линейное подпространство, ортогональное дополнение которого U^~
относительно инвариантного скалярного произведения есть подалгеб-
подалгебра Ли:
[U^,U^] С U±. A9.13)
Докажите, что нормальные экстремали в этой задаче суть про-
произведения двух однопараметрических групп (как и в рассмотренном
выше случае коранга один):
а± = const, A9.14)
= e*ada^4, 4=«e/@), A9.15)
q(t) = qoetae-ta±, A9.16)
где а = аи + a± есть разложение вектора a Е .М, соответствующее
разбиению М. = U ф U1-. Мы используем это утверждение при реше-
решении следующей задачи.
19.3. Управление квантовыми системами
Этот параграф основан на работе У. Боскаина, Т. Шамбриона и
Ж.-П. Готье [104].
Рассмотрим трехуровневую квантовую систему, которая описыва-
описывается уравнением Шрёдингера (в системе единиц с h = 1)
гф = Щ, A9.17)
где ф: Ш —>• С3, ф = (^1,^2,^3I есть волновая функция и
[г пг 0
Н = fii ^2 ^2 A9.18)
есть гамильтониан. Здесь Е\ < Е2 < Е% — постоянные уровни энер-
энергии системы и f^ : R —>- С — управления, описывающие воздействие
внешнего поля. Управления связаны с физическими параметрами
уравнениями Q.j(t) = /ijJrj(t)/2, j = 1, 2, где Tj — внешнее поле, a jij —
спаривания (внутренние свойства квантовой системы), о которых мы
предполагаем что спариваются только уровни j и j + 1.
Эту конечномерную задачу можно рассматривать как редукцию
бесконечномерной задачи. А именно, начнем с гамильтониана, равно-
равного сумме сноса Hq и потенциала V(t) (соответствующего управляю-
управляющим лазерам). Снос предполагается диагональным с собственными
значениями (уровнями энергии) Е\ < Е2 < Е3 < ... В этом спек-
спектральном разрешении Hq мы считаем, что управление V{t) спаривает
только уровни энергии Е-\_, Е2 и Е2, Е%. Задача, спроецированная на
собственные пространства, соответствующие Е\, Е2, Е%, полностью
расщепляется и описывается гамильтонианом A9.18).
19.3. Управление квантовыми системами 261
Задача оптимального управления ставится следующим образом.
Предположим, что в начальный момент t = 0 состояние системы при-
принадлежит собственному пространству, соответствующему нижнему
уровню энергии Е\. Требуется определить управления f^i, f^ пере-
переводящие систему в конечный момент времени t = t\ в собственное
пространство, соответствующее Е%, с минимальным значением функ-
функционала (энергии в дальнейшем):
С физической точки зрения эту задачу можно рассматривать ли-
либо с произвольными управлениями f^(?) Е С, либо с управлениями
«в резонансе»:
Sld{t) = ^фе^+Ч ud = Е3+1 - Е3, A9.19)
Uji R^ M, aj е [-тг,7г], j = 1, 2. A9.20)
В дальнейшем мы называем вторую задачу минимизации энер-
энергии J, которая в этом случае сводится к
f
dt, A9.21)
вещественно-резонансной задачей. Первую задачу (с произвольными
комплексными управлениями) будем называть общей комплексной
задачей.
Так как гамильтониан A9.18) самосопряжен: Н* = Н, уравнение
Шрёдингера A9.17) корректно определено на единичной сфере
5С = S5 = {ф = (ФиМз) е <С3| |V|2 = Ы2 + Ш2 + Ш2 = 1} •
Источник и цель, т. е. начальное и конечное многообразия в общей
комплексной задаче, суть соответственно окружности
si = {(е^,о,о)| у е к}, Т? = {(о,о,е^)| <р е Щ.
Смысл метки (d) мы разъясним ниже.
Итак, общая комплексная задача ставится следующим образом:
где гамильтониан Н задается уравнением A9.18).
262 Гл. 19. Задачи на компактных группах Ли
Для вещественно-резонансного случая имеем управляемую сис-
систему A9.17) с гамильтонианом A9.18), допустимыми управления-
управлениями A9.19), A9.20) и функционалом A9.21). Естественные пространст-
пространство состояний, источник и цель для этой задачи мы определим ниже.
19.3.1. Исключение сноса. Выполним замену переменных, пре-
преобразующую аффинную по управлению систему A9.17), A9.18) в ли-
линейную по управлению систему, как в общем комплексном, так и в
вещественно-резонансном случае.
Для f? G С обозначим через Mj(Q) и Nj(Q) матрицы порядка п:
-6j+lik,6jtlU, A9.22)
J = 1,2,
где 5 — символ Кронекера: 5ij = 1 при i = j, 5{j = 0 при i ф j.
Пусть A = diag(?^i, E2, E3), ujj = Ej+1 - Ej, j = 1, 2. Мы рассмот-
рассмотрим последовательно общую комплексную задачу
2
гф = Щ, Н = А + ^Mjiuj), uj e С,
i=i
и вещественно-резонансную задачу
2
1ф = Нф, Н = А
В обоих случаях сначала применим замену переменных ф = e~lt Л
и получим
2 2
Источник <S и цель 7^ сохраняются этой первой заменой переменных.
1. Общий комплексный случай. В этом случае выполняем зави-
зависящую от времени и сохраняющую функционал замену управлений
После этого задача приобретает форму (с заменой обозначений Л
->> ^, fij -)> Uj)
A9.23)
min, A9.24)
о
G <Sc, ip(h) G Tc, A9.25)
19.3. Управление квантовыми системами 263
() О \
О u2(t)\. A9.26)
-u2(t) о /
Отметим, что матрицы JVj(l), Nj(i) порождают suC) как алгебру
Ли. Функционал и связь между управлениями до и после исключения
сноса суть следующие:
ti
| Л, A9.27)
\ A9.28)
^W = игфе^з-^+тг/Ч. A9.29)
2. Вещественно-резонансный случай. В этом случае
и мы получаем
2
i=i
Выполним еще одну диагональную линейную замену переменных
Л = е1Ьф, L = diag(Ab Л2, Л3), Л^- G М,
после которой получаем:
Выберем такие параметры Aj, что е*^5'"*"^"^^ = г, тогда уравнение
переписывается в виде
2
ф = J2Nj(uj№, uj e R. A9.30)
Источник и цель также сохраняются этой заменой переменных. От-
Отметим, что матрицы A^i(l), N2(l) в A9.30) порождают soC) как ал-
алгебру Ли. Поэтому орбита системы A9.30), проходящая через точ-
точки (±1,0,0), есть вещественная сфера ?2. Следовательно (используя
умножение справа на ег??), заключаем, что орбита, проходящая че-
через точки (±ег??, 0, 0), есть множество S2el(-p. Поэтому (после замены
обозначения ф —)> ф) вещественно-резонансная задача корректно опре-
определена на вещественной сфере
Sm = S2 = {ф = {фифъФз) е М3| \Щ2 = ф* + ф* + ф1 = 1}
264 Гл. 19. Задачи на компактных группах Ли
следующим образом:
2
t±
{u\ + u\) dt -+ min, A9.32)
о
Ф(о) e {(±i,o,o)}, v(*i) e {(о,о, ±i)}, A9.33)
где
/ 0 Mi(i) 0 \
Як= -ui(t) 0 U2(t) • A9.34)
V 0 -u2(t) 0 /
Функционал, как и раньше, задается формулой A9.27), а соотно-
соотношение между управлениями до и после устранения сноса имеет вид
Uj(t) = Uj{t) е*ш**+**\ luj = Ej+1 - Eh
uj: R^R, с^е[-7г,тг], j = 1, 2.
Мы будем далее использовать метки с и R Для обозначения соот-
соответственно общей комплексной и вещественно-резонансной задач. Ес-
Если эти метки в формуле опущены, это означает, что формула справед-
справедлива как для общей комплексной, так и для вещественно-резонансной
задач. В этих обозначениях
Sg = {(e*,O,O)}, Tcd = {@,0,e^)},
S| = {(±1,0,0)}, T^f = {@,0,±1)}.
19.3.2. Подъем задач на группы Ли. Задачи A9.23)-A9.25)
и A9.31)—A9.33) на сферах Sc = ?5 и Sr = S2 естественно подни-
поднимаются до правоинвариантных задач на группах Ли Me = SUC) и
М]& = SOC) соответственно. Поднятая задача имеет вид
q = Hq, qe M. A9.35)
Обозначим проекции
тгс: SUC) -^ Sb, ttr : SOC) -^ S2,
которые обе определяются как
т. е. матрица переводится в свой первый столбец. Будем называть
задачи A9.35) на группах Ли М задачами наверху, а задачи A9.23),
A9.31) на сферах S — задачами внизу. Мы обозначаем задачу на-
наверху (upstairs) меткой и параллельно с меткой d для задач внизу
(downstairs).
19.3. Управление квантовыми системами 265
Вычислим теперь граничные условия для задач наверху. Обозна-
Обозначим соответствующие источники и цели:
Источник S^ состоит из матриц q Е SUC) с первым столбцом в
а
О
О
, 4GUB), detq=l.
Обозначим подгруппу в SUC), состоящую из таких матриц, через
S(UA) х UB)). То есть цель наверху в общей комплексной задаче есть
подгруппа
Далее, матрица
/О 1 0\
q= 0 0 1
\1 О О
отображает S^ на 7^, поэтому
Аналогично, в вещественном случае источник наверху есть
<Sj{ = S(OA) х 0B)),
подгруппа в S0C), состоящая из матриц
а
О
л j, — _ „^ ^_ /1 — -- v^ у — j I Licit/ ±,
а цель есть
Итак, мы можем сформулировать задачи наверху. Вещественная
задача наверху имеет вид
+ u2X2)q, gESOC), uuu2eR, A9.36)
q@) G 5g, q{h) G 7^,
/ (izj + 1^2)
—> mm,
j
о
где
/ 0 1 0\ /0 0 0\
Xi = -1 0 0 , X2 = 0 0 1 . A9.37)
V 0 0 0/ \0 -1 0/
Заметим, что вещественная задача наверху есть правоинвариант-
ная субриманова задача на компактной группе Ли SOC) с пространст-
пространством управляющих параметров U С soC) коранга один; такую задачу
266 Гл. 19. Задачи на компактных группах Ли
мы рассматривали в параграфе 19.2. В нашей вещественной задаче
/ 0 0 1\
C/ = span(XbX2), U1- = span(X3), Х3 = 0 0 0 .
V-1 О О/
Более того, репер A9.37) ортонормален относительно инвариантного
скалярного произведения
(X,Y) = ~ti(XY), X,YesoC).
Комплексная задача наверху ставится следующим образом:
q = Hcq= (u1X1 + и2Х2 + u3Y1 + u4Y2) q, A9.38)
q e SUC), ^ G M,
G 5g, G(*i) G 7?,
Ь1
(и\ + и\ + и\ + г/|) rft —» mm.
о
Здесь Xi и Х2 задаются формулами A9.37) и
/О г 0\ /0 0 0\
Ух = г 0 0 , У2 = 0 0 г .
\о оо/ \о * о/
Пространство управляющих параметров есть
0
0
г
0
0
0
0
0
0
0
г
0
Л
0
оУ
0
0
—г
Отметим, что его ортогональное дополнение равно
U = span(Zi, Z2, Z3, Z4),
где /оо i\
Zl = 0 0 0 , Z2 :
V-i о о/
/г 0 0\
Z3 = 0 -г 0 , Z4
\о о о/
причем легко проверить, что С/" — подалгебра Ли. Итак, общая
комплексная задача имеет форму, рассмотренную в упражнении 19.1.
Распределение правоинвариантно, а репер (Xl, X2, Yi, У2) ортонорма-
лен в метрике
/ V v"\ 4-г*/' \^"VЛ^ V V а слл(еХ\
\Л., I I — ьТуЛ. 1 ), ^*-5-^ ^ SU^OJ.
Задачи наверху и внизу связаны между собой следующим образом.
Для любой траектории наверху q(t) G М, удовлетворяющей гранич-
граничным условиям в М, ее проекция V>(?) = тг(q(t)) G *5 есть траектория
19.3. Управление квантовыми системами 267
системы внизу, удовлетворяющая граничным условиям в S. И обратно
любую траекторию внизу ф(г) с граничными условиями можно под-
поднять до траектории наверху q(t) с соответствующими граничными
условиями (эта q(t) есть фундаментальная матрица системы внизу).
Задачи наверху и внизу имеют один и тот же функционал качества.
Поэтому решения задачи оптимального управления внизу суть проек-
проекции решений наверху.
19.3.3. Управляемость. Множество управляющих парамет-
параметров U в обеих задачах наверху A9.38), A9.36) удовлетворяет свойст-
свойству [?/, U] = U±, поэтому
U+[U,U]=M = ТЫМ. A9.39)
Системы наверху имеют полный ранг и симметричны, поэтому они
вполне управляемы на соответствующих группах Ли SUC), SOC).
Переходя к проекциям тг, получаем, что обе задачи внизу A9.23),
A9.31) вполне управляемы на соответствующих сферах ?5, S2.
19.3.4. Экстремали. Задачи наверху имеют форму, рассмотрен-
рассмотренную в параграфе 19.2 и упр. 19.1, только они правоинвариантны, а не
левоинвариантны. Поэтому нормальные экстремали задаются форму-
формулами A9.14)—A9.16), в которых умножение слева заменено умножени-
умножением справа:
а± = const,
au(t) = e-tada^a°u, аои = пи@),
q(t) = e~ta± eta q0 A9.40)
для любых а± Е С/-1, а^ Е U. Геодезические параметризуются длиной
дуги тогда и только тогда, когда
D,4) = 1. A9.41)
Равенство A9.39) означает, что в задачах наверху векторные по-
поля в правой части и их скобки Ли первого порядка заполняют все
касательное пространство. Такие управляемые системы называются
2-порождающими. В гл. 20 мы докажем, что в таких задачах строго
анормальные геодезические (т. е. траектории, являющиеся проекци-
проекциями анормальных экстремалей, но не проекциями нормальных экс-
экстремалей) не оптимальны (см. рассуждение перед примером 20.1).
Поэтому далее мы не рассматриваем анормальные экстремали.
19.3.5. Условия трансверсальности. Для того чтобы отобрать
геодезические, удовлетворяющие граничным условиям, проанализи-
проанализируем условия трансверсальности наверху.
Условия трансверсальности принципа максимума на Т*М, соот-
соответствующие граничным условиям
q@)eS, q(h)eT, <S,TcM,
имеют следующий вид:
(Ao,Tg(O)<S) = (Xtl,Tq{tl)T) = 0. A9.42)
268 Гл. 19. Задачи на компактных группах Ли
Используя тривиализацию A8.12) кокасательного расслоения Т*М,
перепишем условия трансверсальности A9.42) для экстремали
(x(t),q(t)) G М* х М в форме
(х(ои(о)-г Tms) = (xihUiti)-1?^) = о.
Здесь угловые скобки (•, •) обозначают действие ковектора на век-
вектор. Условия трансверсальности для экстремали (a(t),q(t)) G М. х М
имеют вид
(а@), qiO)-1 Tg{0)S ) = (a(h), q(h)-x Tq(tl)T) = 0,
где угловые скобки обозначают инвариантное скалярное произведе-
произведение в Ai.
Для правоинвариантной задачи условия трансверсальности запи-
записываются в терминах правых сдвигов:
<а@), (Т,@M) q(O)-1 ) = (a(h), (Tg(tl)T) g(ti)) = 0. A9.43)
Следующие особенности условий трансверсальности для рассмат-
рассматриваемых задач наверху облегчают их анализ.
Лемма 19.1. A) Условия трансверсальности в источнике тре-
требуются только в единице.
B) Из условий трансверсальности в источнике следуют условия
трансверсальности в цели.
Доказательство. Пункт A) следует из того, что задача пра-
воинвариантна и источник Su есть подгруппа.
Пункт B). Пусть А^ G T*,t^M есть такая нормальная экстремаль
для задачи наверху, что q@) = Id. Пусть выполняются условия транс-
трансверсальности в источнике:
<Ao,TId<SM)=0.
Докажем условия трансверсальности в цели:
(\tl,Tq(tl)Tu)=0. A9.44)
Отметим прежде всего, что в силу включения ^(^i) G Ти = qSu полу-
получаем q^1q{t\) G Su и
V = qSu = q(q-1q{t1))Su = д(Ь)&>.
Условия трансверсальности в цели A9.44) записываются в виде
(Xtl,Tq(tl)(q(t1)Sn))=O.
Для завершения доказательства покажем, что функция
= (Xt,Tqit)(q(t)Su)), tepMx],
19.3. Управление квантовыми системами 269
постоянна. Обозначим касательное пространство S = Ti&Su. Полу-
Получаем
= (\t,q(t)S) = (x
= (x(t), (Adq(t))S) = (a(t), (Adq(t))S) =
(по инвариантности скалярного произведения)
= (a@),(Ade-*a@)M) = ((Ade-*a(o))a@),S) = (a@),S) =
То есть I(t) = const, и пункт B) данной леммы доказан. ?
19.3.6. Оптимальные геодезические наверху и внизу. По
аналогии с iVi, ЛГ2 (см. формулу A9.22)) определим N\^ следующим
образом:
ДМазе*3) = 0
Положим в вещественно-резонансном случае
пц = aiTVi(l) + a27V2(l), a± = а3А^1,зA)-
В общем комплексном случае положим
Здесь (ц Е R и Si G [-тг,тг].
1. Вещественно-резонансный случай.
Предложение 19.1. Б вещественно-резонансном случае усло-
условие трансверсальности в единице в источнике {a^Ti^S^} = 0 озна-
означает, что а2 = 0.
Доказательство. В силу того, что
0
0
0
0
0
р
0
-Р
0
уравнение (a, Ti^S^) = 0 удовлетворяется для всех /3 G М. тогда и толь-
только тогда, когда а2 = 0. ?
Из предложения 19.1 и условия A9.41) получаем ковекторы, кото-
которые нужно использовать в формуле A9.40):
0 ±1 аЛ
0 0 . A9.45)
0 0/
Предложение 19.2. Геодезические A9.40) с начальным усло-
условием q@) = Id и матрицей а вида A9.45) достигают цели 7^ за
270
Гл. 19. Задачи на компактных группах Ли
кратчайшее время {равное длине пути) \t\ тогда и только тогда,
когда а% = ±1/\/3. Более того, четыре геодезические {соответству-
{соответствующие а± и знакам ± еаз) имеют одну и ту же длину и достигают
цели за время Г
j. _ V 3 _
Доказательство. Вычисляя q{t) = е~а±1е^а±
рицы а, заданной формулой A9.45), и вспоминая, что
для мат-
матполучаем квадрат третьей компоненты волновой функции:
/ / лл\2 _ (cos(ta3) sin(t7) а>з 7 — cos{tj) sin(ta3O2J
W3\t)) — 7 >
7
7= ^l + a§.
Доказательство данного предложения завершает следующая
лемма. ?
Лемма 19.2. Если
fa = cos{ta) si
— cos(^v 1 + а2 ) sin(ta),
то \fa\ ^ 1- Более того, |/о| = 1 тогда и только тогда, когда
1 ъ^п + к7Т и
1? А^ ^? (J ut= - В частности, наимень-
1
2к к
шее \t\ получается при к = ±1, а = ±—^=, ^ = •
V3 2
Доказательство. Положим А =
fa(t) = Acos(A6>) sin((9) - cosF>) sin(A6>) =
= ((Acos(A6>),sin(A(9)),(sin((9),-cosF>))) = (vuv2).
Оба vi, v2, имеют норму ^ 1, и |/о| ^ 1. Поэтому для \fa\ = 1 необхо-
необходимо, чтобы \v\ | = |г?21 = 15 ^i = i^2- Получаем cos(A#) = 0 и cos(^) =
7Г Ik'
= ±1. Поэтому # = /стг, А^ = — + к'-к, А = — + —. Следовательно,
1
к'
1 к
—г + —
= A < 1. Обратно: выберем к, к', удовлетворяющие этому
условию, и в = /стг. Тогда cos(#) = ±1, sin(A#) = =Ы, fa(t) = ±1. Имеем
к7Г I, 7I1/7
, причем наименьшее \t\ получается для к = ±1 (если к =
= 0, то в = 0 и fa{t) = 0). Более того,
V
2к
< 1 возможно только
19.3. Управление квантовыми системами 271
для (&,&'), равных A,0) или A,-1) или (—1,0) или (—1,-1). Во всех
I Л I 1 | 1 , | ТГЛ/З ,—.
случаях |А| = -, а = ±—= и t = ± . U
2 уЗ 2
Зафиксируем для определенности знак минус в A9.45) и аз =
= +1/\/3. Получаем следующие выражения для трех компонент вол-
волновой функции:
i п\ ( М3 / лл л/3 .
^W C04J ^W s1
Отметим, что эта кривая не является окружностью на S2.
Управления можно найти из следующих выражений:
Получаем
Из условий A9.19)—A9.20) (гипотеза резонанса) получаем внешние
поля
Отметим, что фазы ql\, а2 произвольны.
2. Общий комплексный случай.
Предложение 19.3. Для общей комплексной задачи условия
трансверсальности в единице в источнике (a, Ti^S^) = 0 означают,
что а2 = «4 = а$ = 0.
Доказательство. В силу того, что
0
% G
уравнение (a^Ti^S^) = 0 удовлетворяется для всех OL\,a2, f3\, f32 G M
тогда и только тогда, когда а2 = а4 = a5 = 0. ?
Поэтому в формуле A9.40) нужно использовать ковектор
A9.47)
Предложение 19.4. Геодезические A9.40) с q@) = Id, для ко-
которых а задается формулой A9.47), достигают цели Т? за крат-
кратчайшее время (совпадающее с длиной дуги) \t\ тогда и только тогда,
272 Гл. 19. Задачи на компактных группах Ли
когда а% = ±1/\/3. Более того, все геодезические двухпараметричес-
кого семейства, соответствующего 61,63 Е [—тг,тг], имеют одну и
ту же длину
Доказательство. Явное выражение для \фз\2 дается пра-
правой частью формулы A9.46). Утверждение доказывается так же, как
предложение 19.2. ?
Три компоненты волновой функции и оптимальное управление
выражаются следующим образом:
Ul(t) = cos(J=)e^, u2(t) = -Sm(-^)e<(9»-^).
Отметим, что все геодезические семейства, описанного в предло-
предложении 19.4, имеют ту же длину, что и 4 геодезические, описанные в
предложении 19.2. Отсюда следует, что использование комплексных
гамильтонианов A9.26) вместо вещественных A9.34) не позволяет
уменьшить функционал A9.27). Доказано следующее утверждение.
Предложение 19.5. Для трехуровневой задачи с комплексны-
комплексными управлениями из оптимальности следует резонанс. Более точно,
управления Sli, SI2 оптимальны тогда и только тогда, когда они
имеют следующий вид:
где <pi,(p2 суть две произвольные фазы. Здесь конечное время t± вы-
выбрано так, чтобы субримановы геодезические были параметризованы
длиной дуги, и оно равно t\ = — тг.
19.4. Задача быстродействия на SOC)
Рассмотрим твердое тело в М3, которое может вращаться вокруг
некоторой оси, закрепленной в теле. В каждый момент времени ориен-
ориентация тела в М? определяет ортогональное преобразование q G SOC).
Мы будем минимизировать длину кривой в SOC), соответствующей
движению тела. Выберем натуральный параметр (длину дуги) t, тогда
кривая q = q(t) удовлетворяет дифференциальному уравнению
19.4- Задача быстродействия на S0C) 273
где / е soC), |/| = i,
есть единичный вектор угловой скорости, соответствующий фикси-
фиксированной оси вращения в теле. Эта кривая — однопараметрическая
подгруппа в SOC):
q(t) = g@)e*>,
и очевидно, что управляемость на SOC) невозможна.
Чтобы расширить возможности движения в SOC), выберем теперь
две линейно независимые оси в теле:
/,#esoC), |/| = |#| = 1, /л#/о,
и предположим, что тело может вращаться вокруг этих осей в опре-
определенных направлениях. Получаем систему
управляемую на SOC):
Lie(qf,qg) = span(g/, qg, q[f, g\) = gsoC) = TgSOC).
Для упрощения обозначений выберем такие векторы
a,b G soC),
что
/ = а + 6, g = а — Ъ.
Тогда управляемая система записывается как
q = q(a±b).
Мы хотим найти кратчайшее вращение тела, переводящее началь-
начальную ориентацию go B конечную конфигурацию q\. Соответствующая
задача оптимального управления имеет вид
= / \q\
\q\ dt —>- min.
о
Так как \q\ = |а ± Ь| = 1, то эта задача эквивалентна задаче быстро-
быстродействия:
ti —>- min.
Отметим, что
{а,Ь) = A±^,^)=0. A9.48)
Более того, за счет изменения масштаба времени можно добиться,
чтобы
\а\ = 1. A9.49)
18 А.А. Аграчев, Ю.Л. Сачков
274 Гл. 19. Задачи на компактных группах Ли
Переходя к овыпуклению, получаем окончательную формулиров-
формулировку задачи:
q = q(a + ub), uG[-l,l], q G SOC),
t\ —>• min,
где a,b G soC) — заданные векторы, удовлетворяющие равенст-
равенствам A9.48), A9.49). Исследуем эту задачу быстродействия.
По принципу максимума, если пара (u(-),q(-)) оптимальна, то су-
существует такая липшицева кривая x(i) G soC), что:
(q = q
\х = [ж, а + u(t)b],
hu(t){x(t)) = (x(t), a + u{t)b) = тах(ж(?), a + vb) ^ 0;
\v\^.l
более того,
hu(t){x{t)) = const.
Условие максимума для функции
v ^ (x(t), a + vb) = (x(t), a) + v(x(t), b), v G [-1,1],
легко разрешается, если функция переключения
х \-^ (ж, 6), х G М,
не обращается в нуль в точке x(i). Действительно, в этом случае оп-
оптимальное управление мож:ет принимать только экстремальные зна-
значения ±1:
(x(t), b)^0 => u(t) = sgn(ar(t), b).
Если функция переключения имеет только изолированные кор-
корни на некотором временном отрезке, то соответствующее управление
u(t) принимает на этом отрезке только экстремальные значения. Бо-
Более того, моменты времени, в которые u(t) переключается с одного
экстремального значения на другое, изолированы. Такое управление
называется релейным.
Исследуем структуру оптимальных управлений. Возьмем любую
экстремаль, для которой кривая x(i) удовлетворяет начальному ус-
условию
{х(О),Ъ)фО.
Тогда дифференциальное уравнение
х = [ж, а ± Ь], ± = sgn(x@), b)
выполняется при t > 0 до тех пор, пока функция переключения
(x(t), b) остается отличной от нуля. На этом временном отрезке
x(t) =
19.4- Задача быстродействия на S0C) 275
Исследуем поведение функции переключения (x(t),b). Заметим,
что ее производные не зависят от управления:
j-t (x(t),Ь) = ([x(t), a + u(t)b],b) = -(x(t), [a,b]).
Если функция переключения обращается в нуль:
(x(t),b) = O,
в точке, где
{x(t),[a,b])?0,
то соответствующее управление переключается, т. е. изменяет свое
значение с +1 на —1 или с —1 на +1. Для того чтобы выяснить,
какие последовательности переключений оптимального управления
возможны, удобно ввести координаты на алгебре Ли ЛЛ.
В силу равенств A9.48), A9.49) скобка Ли [а, Ь] удовлетворяет
условиям
[а,Ъ]±а, [а,Ъ]±Ъ, |[а,Ь]| = |Ь|;
это следует из свойств векторного произведения в ~М?. Поэтому можно
выбрать такой ортонормированный базис
soC) = span(ei,e2,e3),
что
а = е2, Ъ = i/ез, [a, fe] = z/ei, v > 0.
В этом базисе точки переключения принадлежат горизонтальной
плоскости span(ei,e2).
Пусть x(tq) — точка переключения, т. е. t = tq есть положительный
корень функции (x(i),b). Пусть в этой точке управление переклю-
переключается с +1 на —1 (случай переключения с —1 на +1 полностью
аналогичен, мы покажем это ниже). Тогда
поэтому
(ar(ro),ei> ^0.
Далее, так как гамильтониан принципа максимума неотрицателен,
получаем
К(То)(х(т0)) = (ж(то),а) = (ж(то),е2) ^ 0.
Поэтому точка x(tq) лежит в первом квадранте плоскости span(ei, e2):
х(то) е cone(ei,e2).
Пусть х(т\) — следующая после то точка переключения. Управле-
Управление имеет вид
/ *е[го-е,то],
i, te[T0,n],
а кривая x(t) меж:ду переключениями является дугой окружности,
полученной вращением точки x(tq) вокруг вектора а — b = е2 — ve^\
Ъх(тй\ *е[го,п].
18*
276
Гл. 19. Задачи на компактных группах Ли
Точки переключения ж(то), х(т-\) удовлетворяют равенствам
(х(т0), е3) = (я (n), e3) = О,
(я(то),е2) = (х(т1),е2) = К{то_?)(х(т0 - е)),
х(то)\ =
Следовательно,
т.е. x(ti) есть отражение ж(то) относительно плоскости span(e2,es).
Ъ = ^е3
>. е3
Рис. 19.2. Оценка угла поворота в
Легко видеть, что угол поворота в от ж (то) до х{т\) вокруг а — Ъ
ограничен:
О е [тг, 2тг]
(рис. 19.2).
Экстремальные значения в достигаются, когда точка ж (то) лежит
на границе конуса cone(ei, e^)'.
х(т0) Е M+ei => 0 = тг,
=> 0 = 2тт.
Во втором случае точка x(t) так же, как и точка д(?), совершает
полный поворот на угол 2тг. Такая дуга не может быть частью опти-
оптимальной траектории: ее можно исключить с уменьшением конечного
времени t\. Следовательно, угол между двумя переключениями есть
Ое [тг,2тг).
Пусть ж(тг) — следующее после ж(тх) переключение. Поведение
управления после переключения ж(тх) с —1 на +1 аналогично по-
поведению после ж(то). Действительно, напга задача быстродействия
19.4- Задача быстродействия на S0C) 277
допускает симметрию
Ъ^ -Ь.
После замены базиса
ез ^ -е3, ei н->> -еь е2 и-» е2
кривая ж(?) сохраняется, но теперь она переключается в точке х{т-\)
с +1 на — 1. Этот случай уже был изучен, поэтому угол поворота
от х{т\) до х(т2) опять равен 0, более того, х{т2) = ж (то)- Следующая
точка переключения есть ж(тз) = #(ti) и т.д.
Поэтому структура релейных оптимальных траекторий довольно
проста. Такие траектории содержат некоторое количество точек пе-
переключения. Между этими точками переключения вектор x(t) по-
поворачивается попеременно вокруг векторов а + Ъ и а — Ъ на угол
в Е [тг,2тг), постоянный вдоль каждой релейной траектории. Перед
первым переключением и после последнего переключения вектор x(i)
может повернуться соответственно на углы во и 0\, 0 < во, Oi ^ 0.
Система всех оптимальных релейных траекторий параметризована
тремя непрерывными параметрами Oq, 0, в\ и двумя дискретными
параметрами: количеством переключений и начальным управлением
sgn(a;@),b).
Оптимальная траектория может не быть релейной, только если
в точке ж (то), соответствующей первому неотрицательному корню
уравнения (x(t),b) = 0, выполняются равенства
Тогда
ж(то)=//е2, М/О.
Имеются две возможности:
A) либо функция переключения (x(i), b) принимает ненулевые зна-
значения для некоторых t > то и сколь угодно близких к го;
B) либо
(x(t),b) = O, te [ro,ro + e], A9.50)
для некоторого е > 0.
Начнем с первой возможности. Из анализа релейных траекторий
следует, что моменты переключения не могут накапливаться к то
справа: угол поворота между двумя последовательными переключе-
переключениями в ^ тт. Поэтому в случае A) имеем
{x(t),b) >0, te [то,то + 5],
для некоторого 5 > 0. То есть то — момент переключения. Так как
х(то) е Mei, то угол поворота до следующей точки переключения
есть в = 2тг, что неоптимально. Поэтому в случае A) оптимальных
траекторий нет.
278 Гл. 19. Задачи на компактных группах Ли
Рассмотрим случай B). Продифференцируем тождество A9.50)
дважды по t:
j-t(x(t),b) = -(x(t),[a,b]) =0,
j-t (x(t), [a, b]) = ([x(t), a + u(t)b, [a, b}) = u(t)([x(t), b], [a, b}) = 0.
Тогда x{t) = /j(t)e2, t € [ть, ть + s], поэтому
u(t)([a,b],[a,b]) = 0,
т. е.
u(t) = 0, t E [то,то+е].
Это управление не определяется непосредственно из принципа
максимума (мы нашли его с помощью дифференцирования). Такое
управление называется особым.
Оптимальные траектории, содержащие особую дугу (соответст-
(соответствующую управлению u(t) = 0), могут иметь дугу с и = =Ы перед
особой дугой с углом поворота вокруг а ± Ъ меньше 2тг; такая дуга
может быть и после особого участка. Поэтому возможны четыре типа
оптимальных траекторий, содержащих особую дугу:
+ 0+, + 0 -, - 0+, - 0 -.
Семейство таких траекторий параметризовано тремя непрерывными
параметрами (углом поворота на соответствующих дугах) и двумя
дискретными параметрами (знаками на начальном и конечном от-
отрезках) .
Итак, мы описали структуру всех возможных оптимальных траек-
траекторий: релейных и стратегий с особым участком. Множества точек в
SOC), достижимых с помощью таких стратегий, трехмерны, и объе-
объединение этих множеств покрывает всю группу SOC). Но легко ви-
видеть, что достаточно длинные траектории, следующие любой из двух
стратегий, неоптимальны: эти два множества в SOC) пересекаются.
Более того, каждая из стратегий пересекается сама с собой. Для
того чтобы определить оптимальную траекторию для каждой точки
в SOC), необходимо исследовать взаимодействие двух стратегий и
пересечение траекторий, следующих одной и той же стратегии. Эта
интересная задача остается открытой.
Отметим, что структура оптимальных траекторий в этой лево-
инвариантной задаче быстродействия на SOC) похожа на структуру
оптимальных траекторий для машины Дубинса (параграф 13.5). Это
сходство неслучайно: задачу о машине Дубинса можно сформулиро-
сформулировать как левоинвариантную задачу быстродействия на группе изомет-
рий плоскости.
Глава 20
УСЛОВИЯ ОПТИМАЛЬНОСТИ ВТОРОГО
ПОРЯДКА
20.1. Гессиан
В этой главе мы получим необходимые условия оптимальности
второго порядка для задач управления. Как известно, геометрически
исследование оптимальности сводится к изучению границы множеств
достижимости (см. параграф 10.2). Рассмотрим управляемую систему
<i = fu(q), qeM, ueU = mtUcRm, B0.1)
где пространство состояний М есть, как обычно, гладкое многооб-
многообразие, а пространство управляющих параметров U открыто (по су-
существу это означает, что мы изучаем оптимальные управления, не
выходящие на границу С/, хотя аналогичную теорию для релейных
управлений также можно построить).
Множество достижимости Aqo(ti) системы B0.1) есть образ отоб-
отображения в конец
ti
Ftl: и(-) ^ q0 о ехр / fu(t) dt.
о
Траектория g(?), t Е [0,?i], называется геометрически оптималь-
оптимальной для системы B0.1), если она попадает на границу множества
достижимости в момент t\\
Необходимые условия для этого включения даются принципом мак-
максимума Понтрягина. Часть утверждений ПМП можно рассматривать
как условия оптимальности первого порядка (мы увидим это позже).
Сейчас же мы хотим найти условия оптимальности второго порядка.
Рассмотрим задачу в общей постановке. Пусть
F: U^M
есть гладкое отображение, где Ы — открытое подмножество бана-
банахова пространства, а М — гладкое n-мерное многообразие (обычно
у нас U будет пространством допустимых управлений L^QO, ?i], ?/),
a F = Ff± — отображением в конец управляемой системы). Первый
дифференциал
DUF: TuU^TF{u)M
корректно определен независимо от координат. Для второго диффе-
дифференциала это не так. Действительно, рассмотрим случай, когда и есть
регулярная точка F, т. е. дифференциал DUF сюръективен. По тео-
теореме о неявной функции отображение F становится линейным в под-
подходящих координатах в Ы и М, поэтому инвариантно определенного
280 Гл. 20. Условия оптимальности второго порядка
второго дифференциала нет. В общем случае корректно определенной
независимо от координат является только некоторая часть второго
дифференциала.
Дифференциал гладкого отображения F: Ы —>> М молено опреде-
определить с помощью производной первого порядка
DuFv= Ц-
е=0
F(<p(e)) B0.2)
de
вдоль кривой (р: (—?о,?о) ~^U с начальными условиями
(f@) =ueU, ф{0) = v eTuU.
В локальных координатах эта производная вычисляется как
^-ф, ф = ф(О).
В других координатах q на М производная B0.2) вычисляется как
dF . dqdF .
ф = — ф.
du dq du
Координатное представление первой производной B0.2) преобразует-
преобразуется при заменах координат как касательный вектор к М: оно умножа-
умножается на матрицу Якоби ——.
dq
Вторая производная
de2
е=0
B0.3)
иеи, ф(о) = v етии,
вычисляется как
d2F ,. .. dF ..
_(у,>у,) + _у,.
Правило преобразования второй производной по направлению при
заменах координат имеет вид
d2F ,. .Л dF .. dq\d2F ,. .Л dF .Л d2qfdF . dF
— (^^) + —^=-[—(^^) + —^j+—(—^, —
B0.4)
Вторая производная B0.3) преобразуется как касательный вектор в
TF(U^M, только если ф = v G Ker DUF, т. е. если слагаемое B0.4) обра-
обращается в нуль. Более того, она определяется значениями и и v только
dF ..
по модулю подпространства \.m.JJur , порожденного слагаемым ф.
du
Поэтому инвариантно определенным является квадратичное отоб-
отображение
KeiDuF ->¦ TF(u)M/ImDUF,
de2
e=0
(mod!mDuF). B0.5)
20.1. Гессиан 281
После этого предварительного обсуждения, перейдем к формальным
определениям.
Гессиан гладкого отображения F : Ы —>> М в точке и Е Ы есть
билинейное отображение
HessnF: КетDUF x КетDUF -+ Coker DUF = TF{u)M/lmDuF.
B0.6)
В частности, в регулярной точке Coker DUF = 0, поэтому HessM F = 0.
Гессиан определяется следующим образом. Пусть
v,we Ker DUF, А е (ImDUF)^ С T*F(u)M.
Чтобы определить значение
AHessn F(v, w),
возьмем векторные поля
V,W e Vec W, V(u) = v, W{u) = w,
и функцию
aGC°°(M), dF{u)a = X.
Тогда
Л HessM F(v, w)d= VoW{aoF)\u. B0.7)
Покажем, что правая часть не зависит от выбора У, W и а. Первая
производная Ли есть
W(a о F) = <<%)«, *W)>,
и вторая производная Ли V о W (а о F)\u не зависит от вторых про-
производных а, так как F*W(u) = 0. Более того, очевидно, что вторая
производная Ли зависит только от значения V в и, но не от производ-
производных V в и. Чтобы доказать то же самое для поля W, покажем, что
правая часть определения гессиана симметрична по V и W:
(W о V(a о F) - V о W(a о F))|n = [W, V] {а о F)\u =
= dF{u)aoDuF[W,V](u) = 0,
=А
так как A _L Im DUF. Мы показали, что отображение HessM F, заданное
равенством B0.7), определено независимо от выбора координат, как
это указано в B0.6).
Упражнение 20.1. Покажите, что квадратичное отображе-
отображение B0.5), определенное с помощью второй производной по направ-
направлению, совпадает с Hessn F(v,v).
Если разрешить только линейные замены переменных в Ы, воз-
возможно определить полный второй дифференциал
B\F\ Ker DUF х Ker DUF -+ TF^u)M
так же, как гессиан B0.7), но для произвольного ковектора
л е t*f(u)m
282 Гл. 20. Условия оптимальности второго порядка
и постоянных векторных полей
V = v, W = w.
Гессиан есть часть второго дифференциала, не зависящая от выбора
линейной структуры в прообразе.
Упражнение 20.2. Вычислите гессиан ограничения _FL_wO4
гладкого отображения F на поверхность уровня гладкой функции /.
Рассмотрите ограничение гладкого отображения F: Ы —> М на глад-
гладкую гиперповерхность S = /-1@), /: Ы —>> R, df ф 0, и пусть и Е S —
регулярная точка F. Докажите, что гессиан отображения вычисляет-
вычисляется следующим образом:
\Ressu(F\s) = \D2uF-d2J, \±ImDuF\s, A e T*F{u)M \ {0},
где ковектор Л нормирован так, что
\DUF = duf.
20.2. Локальная открытость отображений
Отображение F: Ы -Л М называется локально открытым в точ-
точке и G U, если
F{u) eint F(OU)
для любой окрестности Ои С Ы точки и. В противном случае, т. е.
когда
F(u) e dF(ou)
для некоторой окрестности Ом, точка и называется локально геомет-
геометрически оптимальной для F.
Точка и EU называется локально конечномерно оптимальной для
отображения F, если для любого гладкого конечномерного подмного-
подмногообразия S С U, и ? S, точка и локально геометрически оптимальна
для ограничения F\s.
20.2.1. Критические точки коранга один. Коранг критичес-
критической точки и гладкого отображения F по определению равен корангу
дифференциала DUF:
corankZ\F = codimImZ)nF.
В дальнейшем мы будем часто рассматривать критические точки
коранга один. В этом случае множитель Лагранжа
Ае (ImA^, A/0,
определен однозначно с точностью до ненулевого множителя, и отоб-
отображение
A Hessn F: Ker DUF x Ker DUF -+ R
есть просто квадратичная форма (в случае corankDnF > 1 приходит-
приходится рассматривать семейство квадратичных форм).
20.2. Локальная открытость отображений 283
Сформулируем условия локальной открытости отображения F в
критической точке и коранга один в терминах квадратичной фор-
формы AHessn F.
Теорема 20.1. Пусть F: Ы —>• М есть непрерывное отображе-
отображение, имеющее гладкие ограничения на конечномерные подмногообра-
подмногообразия в Ы. Пусть и EU — критическая точка F коранга один, и пусть
Хе (ImDuF^, Л/0.
A) Если квадратичная форма AHessnF знакопеременна, то F
локально открыто в и.
B) Если форма AHessn F отрицательна (или положительна), то
точка и локально конечномерно оптимальна для F.
Замечание. Квадратичная форма локально открыта в нуле
тогда и только тогда, когда она знакопеременна.
Доказательство. Утверждения теоремы локальны, поэтому
выберем локальные координаты в Ы и М, центрированные соответст-
соответственно в и и F(u), и будем считать, что Ы — банахово пространство,
о 1\/Г ШП
a ivi — ж. .
A) Рассмотрим разложение в прямую сумму в прообразе
TUU = E®KerDuF, dimE = n-l, B0.8)
и соответствующее разложение в образе
TF{u)M = ImDuF®V, dimF = l. B0.9)
Квадратичная форма AHessw F знакопеременна, т. е. она принима-
принимает значения обоих знаков на Ker DUF. Поэтому можно выбрать такие
векторы
v,w G Ker DUF,
что
AF,>,t7) = 0, XF^(v,w)^0;
мы обозначаем через F', F" производные вектор-функции F в ло-
локальных координатах. Действительно, пусть квадратичная форма
Q = XF" принимает значения противоположных знаков на некото-
некоторых vq,w E Ker DUF. В силу непрерывности Q существует ненулевой
вектор v G span(^o,^), на котором Q(y,v) = 0. Более того, легко ви-
видеть, что Q(v,w) ф 0.
Так как первый дифференциал задает изоморфизм
DUF = F'U: E
U
то существует такой вектор xq Е Е, что
Введем следующее семейство отображений:
Ф?: Е xR^ М, е G М,
Ф?(х,у) = F(s2v + s3yw + ?4xq + еъх), х G Е,
284 Гл. 20. Условия оптимальности второго порядка
Заметим, что
Im Ф? С Im F
для малых е. Поэтому достаточно доказать открытость Ф?. Из фор-
формулы Тейлора
Фе(х,у) = e\F'ux + yFZ(v, w)) + О(е6), е -> О,
1 , п
следует, что семейство —- Ф? гладко по параметру е в точке е = 0.
При е = 0 это семейство задает сюръективное линейное отображение.
По теореме о неявной функции отображения — Ф? суть субмерсии,
потому они локально открыты при малых е > 0. Следовательно, отоб-
отображение F также локально открыто в точке и.
B) Возьмем любое гладкое конечномерное подмногообразие S CW,
и G S. Так же, как в B0.8), B0.9), рассмотрим разложения в прообразе
и в образе
М ~ TF{u)M = Im A, F\s 0 W,
dimW = k = corankDn F\s ^ 1.
Так как дифференциал DUF: E —>• ImDuF задает изоморфизм, по
теореме о неявной функции можно выбрать такие координаты (ж, у)
в 5 и координаты в М, что отображение F принимает форму
Далее, можно выбрать такие координаты (р = ((fi,..., (fk) B W', что
\F(x,y) = (pi(x,y).
Выпипгем условия данной теоремы в этих координатах. Так как
ImDu F\s П W = {0}, получаем
^(o,o)^i =0.
Далее, условие отрицательности формы AHessw.F записывается как
@,0)
Тогда функция
^1 @, у) < 0 при малых у.
Поэтому отображение F\s не является локально открытым в точ-
точке и. ?
Справедливо следующее предлож:ение, гораздо более сильное, чем
предыдущее.
Теорема 20.2 (обобщенная лемма Морса). Пусть и G Ы есть
такая критическая точка коранга один гладкого отображения
F': Ы —>- М, что квадратичная форма HessM F невыроэюдена.
20.2. Локальная открытость отображений 285
Тогда существуют локальные координаты вЫ и М, в которых F
имеет только члены первого и второго порядков:
F{x, v) = DUF x + \ Hessn F(v, v),
(x,v) eU ~E ®Ker DUF.
Мы не доказываем эту теорему, так как не будем ее использовать
в дальнейшем.
20.2.2. Критические точки произвольного коранга. Необхо-
Необходимое условие локальной открытости пункта A) теоремы 20.1 обоб-
обобщается для критических точек произвольного коранга.
Напомним, что положительным {отрицательным) индексом
квадратичной формы Q называется максимальная размерность
положительного (отрицательного) подпространства формы Q:
ind+ Q = max{dimL| Q\L\{Oy > О},
ind_ Q = max{dimL| Q\L\sQ\ < 0}.
Теорема 20.3. Пусть F: U —> M есть непрерывное отображе-
отображение, имеющее гладкие ограничения на конечномерные подмногообра-
подмногообразия. Пусть и ЕЫ — критическая точка F коранга т.
Если
ind_ Л Hessn F ^ т V Л _L Im DUF, Л ф 0,
то отображение F локально открыто в точке и.
Доказательство. Утверждение теоремы локально, поэтому
можно выбрать координаты и считать, что Ы — банахово пространст-
пространство, и = 0, М = Rn и F@) = 0.
Более того, можно считать, что пространство Ы конечномерно;
сейчас мы докажем это. Для любого Л _l_ ImD^F, Л ф 0, существует
такое подпространство
Е\ С U, dim^A = m,
что
0.
Будем брать Л на единичной сфере
S™-1 = {A e (imDuF)^ | |А| = l}.
Для любого A G Srn~1 существует такая окрестность О\ С Srn~1, A G
G Од, что Е\> = Е\ для любых А; G О\ (это легко следует из непре-
непрерывности формы A' Hessn F на единичной сфере в Е\).
Выберем конечное покрытие:
N
s™-1 = UoXi.
286 Гл. 20. Условия оптимальности второго порядка
N
Тогда ограничение F на конечномерное подпространство J2 Е\± удов-
удовлетворяет условиям данной теоремы. Поэтому молено предполагать,
что U конечномерно. Но тогда теорема следует из приведенных далее
лемм 20.1 и 20.2. ?
Лемма 20.1. Пусть F: M.N —>> Мп есть гладкое отображение, и
пусть F@) = 0. Предположим, что квадратичное отображение
Q = Hess0F: Ker D0F -+ Coker D0F
имеет регулярный нуль:
3 v G Ker DqF: Q(v) = 0, DVQ сюръективно.
Тогда отображение F имеет регулярные нули сколь угодно близко
к началу координат в M.N.
Доказательство. Слегка модифицируем рассуждение, ис-
использованное при доказательстве пункта A) теоремы 20.1. Разложим
прообраз первого дифференциала:
RN = Е 0 Ker D0F, dim E = п - га;
тогда ограничение
D0F: E ^IyuDqF
взаимно однозначно. Равенство Q(v) = Hesso F(v) = 0 означает, что
FZ(v,v) Elm DqF.
Тогда существует такое xq G Е, что
Определим семейство отображений
Фе(х,у) = F(s2v + е3у + s4x0 +?5ж), х е Е, у е Ker D0F.
Первые четыре производные Ф? обращаются в нуль при е = 0, поэтому
получаем тейлоровское разложение
Затем рассуждаем так же, как в теореме 20.1. Семейство — Ф? гладко
и линейно сюръективно при е = 0. По теореме о неявной функции
отображения — Ф? суть субмерсии при малых е > 0, поэтому они
имеют регулярные нули в любой окрестности начала координат в M.N.
Следовательно, отображение F также имеет регулярные нули сколь
угодно близко к началу координат в M.N. ?
Лемма 20.2. Пусть Q : M.N —>• Mm есть такое квадратичное
отображение, что
ind_ XQ ^ т V Л G Mm*, Л ф 0.
Тогда отображение Q имеет регулярный нуль.
20.2. Локальная открытость отображений 287
Доказательство. Молено предполагать, что у квадратичной
формы Q нет ядра:
Q(vr)^0 УуфО. B0.10)
Если это не так, профакторизуем по ядру Q. Так как DVQ = 2Q(v, •),
условие B0.10) означает, что DVQ Ф 0 при v ф 0.
Теперь докажем лемму индукцией по т.
В случае т = 1 утверждение очевидно: знакопеременная квадра-
квадратичная форма имеет регулярный нуль.
Шаг индукции: докажем утверждение леммы для произвольно-
произвольного т > 1 в предположении, что она доказана для всех значений,
меньших т.
A) Предположим сначала, что Q~1@) ф {0}. Возьмем такое v ф
Ф 0, что Q(v) = 0. Если v — регулярная точка Q, то утверждение
данной леммы доказано. Поэтому предположим, что v — критическая
точка Q. Так как DVQ ф 0, имеем
rankDVQ = fc, 0 < к < т.
Рассмотрим гессиан отображения Q:
Hess^Q: KeTDvQ^Wn-k.
Второй дифференциал квадратичного отображения равен удвоенному
этому отображению, поэтому
Далее, так как ind_ XQ ^ т и codimKer DVQ = /с, получаем
ind_ AHessv Q = ind_ AQ|KerD q ^ m — k.
По предположению индукции квадратичное отображение Hessv Q
имеет регулярный нуль. Применяя лемму 20.1 к отображению Q,
заключаем, что Q также имеет регулярный нуль. Утверждение данной
леммы в случае A) доказано.
B) Теперь рассмотрим второй случай: Q-1@) = {0}.
B.а) Очевидно, что ImQ есть замкнутый конус.
B.6) Более того, можно считать, что ImQ \ {0} открыт. Действи-
Действительно, предположим, что существует
x = Q(v) e <9ImQ, хфО.
Тогда v — критическая точка Q, и точно так же, как в случае A),
из предположения индукции для Hessv Q следует, что Hessv Q имеет
регулярный нуль. По лемме 20.1 Q локально открыто в точке v и
Q(v) G intlmQ. Поэтому будем далее предполагать, что множест-
множество ImQ \ {0} открыто. Вместе с пунктом B.а) это означает, что Q
сюръективно.
B.в) Покажем теперь, что это свойство приводит к противоречию,
что и докажет данную лемму.
288 Гл. 20. Условия оптимальности второго порядка
Гладкое отображение
veS
N-1
\Q\ ' \Q(v)
сюръективно. По теореме Сарда оно имеет регулярное значение.
Пусть х Е Sm~1 есть регулярное значение отображения Q/\Q\.
Далее рассуждаем следующим образом. Найдем наименьшее а >
> О, для которого
Q(v) = ax, v e S ,
и применим условия оптимальности к соответствующему решению vq ,
чтобы показать, что ind_ XQ $J m — 1, что противоречит условию
леммы.
Рассмотрим следующую конечномерную задачу оптимизации со
связями: a^min; Q(v)=ax, а>0, vGSN-\ B0.11)
Очевидно, что эта задача имеет решение; пусть пара (г>о,&о) реали-
реализует минимум. Выпишем условия оптимальности первого и второго
порядка для задачи B0.11). Существуют такие множители Лагранжа
(и,Х)фО, ^еМ, A€Ta*0XR"\
что функция Лагранжа
?(z/, A, a, v) = va + A(Q(v) - аж)
удовлетворяет условиям стационарности:
^ = г/ - \х = 0, B0.12)
0 CL
¦w-
С г;
= ADVoQ|57v-i = 0.
(vo,ao)
Так как ?;q есть регулярная точка отображ:ения Q/|Q|, имеем v ф 0,
поэтому мож:но положить
z/ = 1.
Тогда необходимые условия оптимальности для задачи B0.11) запи-
записываются как ,_. , .
AHessU0Q|5Jv_i ^0. B0.13)
Напомним, что гессиан ограничения отображения отличен от огра-
ограничения гессиана этого отображения (см. упр. 20.2 выше).
Упражнение 20.3. Докажите, что
A (Hess. 0|^-0 {и) = 2{\Q{u) - |^|2AQ(^)),
v eS14'1, ueKerDv Q\sn-l
Следовательно, из неравенства B0.13) следует, что
XQ(u) - |^|2AQ(^o) ^ 0, и е KerDV0 Q|5JV-i ,
поэтому
XQ(u) ^ \u\2XQ(vq) = \u\2aoXx = |?x|2ao^ = |г^|2ао > 0,
20.3. Дифференцирование отображения в конец 289
XQ()^O, ueKeiD
V0 Q\sn-l
Более того, так как vq ^ TVoSN~1, получаем
XQ\L ^0, L = KerDV0 Q\sN-! 01^.
Теперь вычислим размерность неотрицательного подпространства L
квадратичной формы XQ. Так как vq — регулярное значение Q/|Q|,
имеем q
dim Im DVQ -^- = т - 1.
Поэтому lmDVo Q\sN-± может иметь размерность т или т — 1.
Но г>о — критическая точка Q\sN-i, поэтому
dimlmDVo Q\SN-! = m - 1
и
dimKerDVo Q\SN-i =N-l-(m-l) = N-m.
Следовательно, dimL = TV — m + 1, поэтому ind_ XQ ^ m — 1, что
противоречит условию данной леммы.
Поэтому случай B.в) невозможен, и шаг индукции данной леммы
доказан. ?
Теорема 20.3 полностью доказана.
20.3. Дифференцирование отображения в конец
В этом параграфе мы вычислим дифференциал и гессиан отобра-
отображения в конец для управляемой системы
д = Щ ueUcR171, U = intU, q G M, B0.14)
с правой частью fu(q), гладкой по (u,q). Мы исследуем отображение
в конец
Ftl: U -+ М,
у /n(
о
в окрестности фиксированного допустимого управления
й = й(-) ей.
Так же, как в доказательстве принципа максимума (см. пара-
параграф 12.2), из формулы вариаций следует разложение потока:
Ftl {и) = q0 о е^р у gtiU(t) dt о Ptl,
о
19 А.А. Аграчев, Ю.Л. Сачков
290
Гл. 20. Условия оптимальности второго порядка
где
fu(T) dr,
Далее, введем промежуточное отображение
Gtl : и ^ q0 о ехр / gt^
dt.
Тогда
следовательно,
поэтому дифференцирование Ftl сводится к дифференцированию Gtx •
Мы вычислим производные отображ:ения Gtx с помощью асимптоти-
асимптотического разложения хронологической экспоненты:
a(Gtl(u)) =
= q0o I Id + / gT^T) dr + / /
0 0^
B0.15)
Введем еще несколько обозначений:
и(г)
9т, и, 9 т =
ди2
и(т)
9т, и,
Д е т*м,
ди
й(т)
и(т)
hu.
Тогда дифференциал (первая вариация) отображения G^ равен
Управление и есть критическая точка Ftl (или, что эквивалентно, Gtl)
тогда и только тогда, когда существует такой множитель Лагранжа
До G Т*оМ, До ф 0,
что
т. е.
te[o,ti].
20.3. Дифференцирование отображения в конец 291
Перенося ковектор Aq вдоль исследуемой траектории
q(t) = g0 о?*,
получаем кривую ковекторов
At = РГхАо = АоР,;1 е т*ф)м,
являющуюся траекторией гамильтоновой системы
At = ft«(t)(At), ^G [0,ti]
(предложение 11.3). Тогда
Мы показали, что и есть критическая точка отображения в конец Ftl
тогда и только тогда, когда существует такая кривая ковекторов
что
At = Лад (At), B0.16)
(At) = O, te[0M B0.17)
ди u(t)
В частности, любая понтрягинская экстремаль есть критическая точ-
точка отображения в конец. Из принципа максимума Понтрягина следу-
следуют условия оптимальности первого порядка B0.16), B0.17). Отметим,
что ПМП содержит больше, чем эти условия: согласно ПМП гамиль-
гамильтониан hu(Xt) не только критичен, как в B0.17), но достигает мак-
максимума вдоль оптимального управления u(t). Обратимся к условиям
второго порядка.
Из асимптотического разложения B0.15) следует выражение для
второго дифференциала:
D2~Gtl(v,w)a =
4 0
гдеа? С°°{М) и
v, w Е Ker D%
т. е.
/ g'tv(t) dt = q0o g'tw(i) dt = 0.
Преобразуем эту формулу для второй вариации с помощью следую-
следующего разложения на симметричную и кососимметричную части.
19*
292 Гл. 20. Условия оптимальности второго порядка
Упражнение 20.4. Пусть ХТ — неавтономное векторное поле
на М. Тогда
jj XT2 о ХТ1 drx dr2 =
t t
= \jXTdro
о о
Полагая Xt = g[v(t) и учитывая, что qo о J g'tv(t) dt = 0, получаем
о
go ° / / XT2 о XTl dr\ dr2 — -qo° / / [Х^,ХТ1\ drx dr2,
поэтому
2
D±Gtl(v,w)a =
= qo°Qgr(v(r),wCr))dT+ II \g'nv(vi),gtT1w(T1)]dT1d7^ja =
gl;(v(r),w(T))dT+ f\ fg'^vi^dT^g^win)]
о Lo J
эбно выраж:ается в гамильтоновых те]
,и = ^oPr* (fu — fu(r)) = hu(Xr) — hu{r)
О 0 0
Первый член удобно выражается в гамильтоновых терминах, так как
Тогда
\tlD2~Ftl(v,w) = \0D2~Gtl(v,w) =
= / h^(Xr)(v(r), w(r)) dr + / Ao / g'T v(t2) dr2, gf w(ti)\ dr\.
J J \ J I
0 0 0
B0.18)
Для того чтобы записать и второй член этого выражения в га-
гамильтоновых терминах, вычислим линейный на слоях гамильтониан,
соответствующий векторному полю g'Tv:
Xogfrv = (\0, Рт}^ fx
где производные по и берутся при и = и{т). Вводя гамильтониан
20-4- Необходимые условия оптимальности 293
можно записать второй член выражения B0.18) для второй вариации
в следующем виде:
J J Х° [^(Г2)> #T!™(r
о о
о о
о о
Здесь производные —— hu^Ti и —— hu^Ti берутся при и = u{ji).
о и о и
20.4. Необходимые условия оптимальности
Применим полученные результаты о второй вариации и докажем
необходимые условия геометрической оптимальности экстремальной
траектории системы B0.1).
20.4.1. Условие Лежандра. Зафиксируем допустимое управле-
управление й, являющееся критической точкой коранга m ^ 1 отображения в
конец Ft1. Для простоты будем предполагать, что и(-) кусочно гладко.
Возьмем любой множитель Лагранжа
Тогда
t
Xt = Р/~1А0 = Ао о ехр / hu(T) dr, t e [0, ti],
о
есть траектория гамильтоновой системы принципа максимума.
Введем обозначение для соответствующей квадратичной формы,
вычисляющей гессиан отображения в конец в B0.18):
tl t! П
Q(v) = I ti;(\T)(v(T),v(r))dT + I Ao |^(г2)йг2,^г;(г1) dn.
о oo -1
Тогда равенство B0.18) записывается как
Xtl HesSuFtl(v,v) = Q(y), v e KerDuFtl.
По теореме 20.3, если управление и локально геометрически опти-
оптимально (т. е. отображение в конец Ft1 не является локально открытым
294 Гл. 20. Условия оптимальности второго порядка
в и), то существует такой множитель Лагранжа Aq , что соответствую-
соответствующая форма Q удовлетворяет условию
ind_ Q\KerD~Ft <m = corankD^Ftl. B0.20)
Ядро дифференциала D^Ft± определяется конечным числом скаляр-
скалярных линейных уравнений:
Ker DzFtl = iveTzU | q0 о Jgftv(t) dt = oV
т. е. оно имеет конечную коразмерность вТ^Ы. Поэтому из неравенст-
неравенства B0.20) следует, что
ind_ Q < +ос
для соответствующей экстремали А^. Если взять экстремаль —А^,
проецирующуюся в ту же экстремальную кривую q(i), то получим
форму Q конечного положительного индекса. Поэтому из локальной
геометрической оптимальности и следует конечность положительного
индекса формы Q для некоторого множителя Л агранжа Ао-
Предложение 20.1. Если квадратичная форма Q имеет ко-
конечный положительный индекс, то вдоль соответствующей экст-
экстремали \t выполняется следующее неравенство:
ti;{\t){v,v) ^ 0, te [0,*i], v G IT. B0.21)
Неравенство B0.21) называется условием Лежандра.
В частности, если траектория q(t) локально геометрически опти-
оптимальна, то условие Лежандра выполняется для некоторой экстрема-
экстремали А^, тг(Аг) = q(t). Впрочем, необходимость условия Лежандра для
оптимальности непосредственно следует из условия максимума ПМП
(упражнение). Но далее нам понадобится более сильное утверждение
об индексе Q, сформулированное в предложении 20.1.
Отметим еще раз, что при изучении геометрической оптимальнос-
оптимальности все знаки можно обратить: умножая А^ на —1, получаем квадра-
квадратичную форму с ind_ Q < +оо и противоположное условие Лежандра
h"(\t)(v,v) ^ 0. Конечно, это относится и к последующим условиям,
связанным с геометрической оптимальностью.
Докажем предложение 20.1.
Доказательство. Возьмем произвольную гладкую вектор-
функцию
v: M^Mm, suppv С [0,1],
и введем семейство вариаций вида
те [0,<i), ?>0.
20-4- Необходимые условия оптимальности
295
Отметим, что вектор-функция г>^? сосредоточена на отрезке [г, г + е].
Найдем асимптотику формы Q на введенном семействе:
0 L 0
1
= e Г hf^(Xr)(v(s), v(s)) ds + O(e2), B0.22)
где O(s2) равномерно поив норме L^
Предположим, от противного, что
для некоторого т G [0,^i), v G Mm. В главных осях квадратичная
форма становится суммой квадратов:
где по меньшей мере один коэффициент
4 >о.
Выберем вектор-функцию v вида
/v1(s)\ / Q \
v(s) =
V 'о' У
с единственной ненулевой компонентой vl(s). Для достаточно ма-
малых е > 0 Q(vr,?) > 0- Но при любых фиксированных т и е прост-
пространство вектор-функций v-f,e бесконечномерно. Поэтому квадратич-
квадратичная форма Q имеет бесконечный положительный индекс. Полученное
противоречие завершает доказательство. ?
20.4.2. Регулярные экстремали. Мы доказали, что условие Ле-
жандра необходимо для конечности положительного индекса квад-
квадратичной формы Q. Соответствующее достаточное условие дается
усиленным условием Лежандра:
til(\t){v,v) < -a\v\2, te[O,ti], veR™, B0.23)
a > 0.
Экстремаль, удовлетворяющая усиленному условию Лежандра,
называется регулярной (отметим, что это определение относится толь-
296 Гл. 20. Условия оптимальности второго порядка
ко в случае открытого пространства управляющих параметров ?/,
когда условие Лежандра связано с максимальностью hu).
Предложение 20.2. Если \t, t G [0,?i], есть регулярная экс-
экстремаль, то:
A) для любого т G [0,?i) существует такое е > 0, что форма Q
отрицательна на пространстве L™ [г, г + е];
B) форма Q имеет конечный положительный индекс на прост-
пространстве T^U = L™[(Mi].
Доказательство. A) Разложим форму Q:
«1
Q1(v)=Jh';(\T)(v(T),v(r))dT,
о
t\ Ti
/Г Г 1
Ао / gfT2v(r2) dr2,gfTlv(r1) dr± =
\_ J I
0 0
t\ ri
\_
0 0
oo
В силу непрерывности /i"(Ar) по г из усиленного условия Лежандра
следует, что
f
при малых е > 0. То же рассуждение, что и в B0.22), доказывает, что
член Qi доминирует на малых отрезках:
поэтому
QH[Tjr+e])<0
для достаточно малых е>0и всех v G Ь^[0, ^i], v ф 0.
B) Покажем, что форма Q отрицательна на любом подпространст-
подпространстве L™ [0, t\] конечной коразмерности, отсюда следует, что ind+ Q < оо.
Такое ж:е рассуж:дение, как и примененное при доказательстве
пункта A), показывает, что любая точка т G [0, ?i] может быть по-
покрыта таким отрезком [т — е, т + е], что форма Q отрицательна на
пространстве L™ [т — е,т + е]. Выберем такие точки 0 = tq < т\ < ...
... < гдг = ^i, что Q отрицательна на пространствах L^[tv_i,7v], г =
= 1,... ,7V. Определим следующее подпространство конечной кораз-
коразмерности в L^[0,^i]:
ди
Ti-l
20-4- Необходимые условия оптимальности 297
Для любого v Е L, v ф О,
()
г=1
Поэтому L есть искомое отрицательное подпространство конечной ко-
коразмерности квадратичной формы Q. Следовательно, форма Q имеет
конечный положительный индекс. ?
Предложения 20.1 и 20.2 устанавливают связь знакоопределен-
знакоопределенности формы h"(\t) с знакоопределенностью формы Q, поэтому в
случае коранга один с локальной геометрической оптимальностью
управления и (благодаря теореме 20.1). Условие Лежандра необходи-
необходимо для конечности ind+ Q, а потому и для локальной геометрической
оптимальности и. С другой стороны, усиленное условие Лежандра
достаточно для отрицательности Q на малых отрезках, поэтому и
для локальной конечномерной оптимальности и на малых отрезках.
Отметим, что гораздо более сильный результат получается из теории
полей экстремалей (параграф 17.1). Действительно, при усиленном
условии Лежандра максимизированный гамильтониан принципа мак-
максимума гладок, и следствие 17.1 дает локальную оптимальность на
малых отрезках (в топологии С([0, ti], М), а потому и в L^QO, ?i], ?/),
и в топологии сходимости на конечномерных подмногообразиях в Ы).
20.4.3. Особые экстремали. Рассмотрим теперь случай, когда
вторая производная гамильтониана hu обращается в нуль тождествен-
тождественно вдоль экстремали, в частности, случай аффинных по управлению
т
систем q = fo(q) + ^ uifi{<l)- Итак, будем предполагать, что экстре-
г=1
маль А^ удовлетворяет тождеству
а;'(А«)=О, te[O,h]. B0.24)
Такая экстремаль называется вполне особой. Как и в случае регу-
регулярных экстремалей, это определение относится только к случаю
открытого множества управляющих параметров U.
Для вполне особой экстремали выражение для гессиана B0.18)
принимает форму
Ftl(vi,v2) = Ао
\
0 0
Чтобы найти доминирующий член гессиана (сосредоточенный на диа-
диагонали Ti = т2), проинтегрируем по частям. Обозначим
ti
= /
298 Гл. 20. Условия оптимальности второго порядка
Тогда
t
' о
>) + /&*
== ^0 I ~~ / [SV^l I'M? grV2\T) I ^^ ~
0
о о
+ / \g' ^i(r2), / a' w2(r1)dr1\ dr2 . B0.25)
0 r2
Проинтегрируем по частям также условие допустимости go °
о JTg'tvi(i)dt = 0:
0 *i
Qo ° \ g'twi{t) dt + ^0^@) I = 0. B0.26)
о
Далее мы будем брать вариации v^, подчиненные ограничению
Wi@) = [vi(t)dt = O, г = 1,2.
о
Предположим, что функции v(s), использованные при построении
семейства г;^?е(г) = vl J, удовлетворяют равенству
1
/ v(s) ds = 0.
о
Тогда первообразная
6
= I v{s')ds'
такж:е сосредоточена на отрезке [0,1]. При сделанном предположении
второй и третий члены в выражении гессиана B0.25) обращаются в
нуль, и равенство B0.26) сводится к следующему:
о
о
/ gtwi(t)dt = 0.
20-4- Необходимые условия оптимальности 299
Асимптотика гессиана на семействе г>^? имеет вид
1
Atl HessG Ftl (Уг,е,Уг,е) = Q(vr,e) = ?2Хо j\g'^w(s), g'^v(s)} ds + O(s3).
0
Исследование этого доминирующего члена приводит к необходимым
условиям оптимальности.
Предложение 20.3. Пусть \t, t G [0,?i], есть вполне особая
экстремаль. Если квадратичная форма Q = Xtl Hess^ Ftl имеет ко-
конечный положительный индекс, то
М&ъд'М = о v<7i,i72 eRm, te [o,tx]. B0.27)
Равенство B0.27) называется условием Гоха. Его можно также
записать следующим образом:
или, в гамильтоновой форме,
V дщ ouj ) \дщ ouj
г, j = 1,..., 772, ? Е [0, ?i].
Как и раньше, производные по и вычисляются при и = u(t).
Докаж:ем предлож:ение 20.3.
Доказательство. Возьмем такую гладкую вектор-функцию
2тг
v: Ш —> Мт, сосредоточенную на отрезке [0,2тг], что J v(s) ds = 0, и
о
построим, как раньше, вариацию управлений
Получаем
Q(vr,e) = е2 I \0\gLw(s),gLv(s)] ds +
о
s
где ti;(s) = J v(sf) dsf. Доминирующий член есть интеграл
о
2тг 2тг
J X0\g^w(s),g^v{8)] ds = J cu{w{s), v(s)) ds, B0.28)
о о
u(x,y) = Х0[д'тХ,д'ту], х,у G Mm.
Заметим, что билинейная кососимметричная форма си входит в
условие Гоха B0.27). Чтобы доказать предложение, покажем, что
300
Гл. 20. Условия оптимальности второго порядка
если и) ^0, то доминирующий член гессиана B0.28) имеет положи-
положительное подпространство сколь угодно большой размерности.
Пусть и) ф 0 для некоторого т Е [0,?i]. Тогда rank о; = 21 > 0 и
существуют координаты в Мт, в которых форма со имеет вид
X =
Возьмем вектор-функцию v вида
0
vis) =
0
fl(
0
= У]€к cos ks,
k>0
= yj?7fe sinks.
k>0
\ о /
Подставляя v(s) в B0.28), получаем
2тг
u)(w(s), v(s)) ds = —2тг
гь
О к>0
Очевидно, что эта форма имеет положительное подпространство бес-
бесконечной размерности.
Для сколь угодно большого N можно найти TV-мерное положи-
положительное пространство Ln формы B0.28). Существует такое sn > 0,
что Q(vt,?n) > 0 для любых v Е Ljy. Поэтому ind+ Q = оо. Полученное
противоречие доказывает условие Гоха. П
Упражнение 20.5. Покаж:ите, что условие Гоха выполняется
не только для кусочно гладких, но и для измеримых ограниченных
экстремальных управлений и в точках Лебега.
Условие Гоха дает сильные ограничения на вполне особое опти-
оптимальное управление и. Для вполне особой экстремали первые два
члена в B0.25) обращаются в нуль по условию Гоха. Более того, при
условии w@) = 0 третий член в B0.25) также равен нулю. Тогда вы-
выражение для гессиана B0.25) сводится к следующим двум слагаемым:
Xtl Hess? Ftl (v, v) = Q(v) =
h
1 n f 1 A
gfTw(r),gfrw(r)\ dr + / Ig'^wfo), / g'^w^) drA dr2 .
J о L r2 J У
B0.29)
20-4- Необходимые условия оптимальности 301
Предположим, что квадратичная форма Q имеет конечный поло-
положительный индекс. Такими же рассуждениями, какие применялись
при доказательстве предложения 20.1, доказываем еще одно поточеч-
поточечное условие:
Xo[gftv,gftv}^0 VveR171, t G [0,*i]. B0.30)
Это неравенство называется обобщенным условием Лежандра.
Заметим, что обобщенное условие Лежандра можно переписать в
гамильтоновых терминах:
u(t),h'tv} , titv} (Xt) + [h'i{u{t), v), titv} (Xt) ^ 0,
veRm, *e[0,*i].
Это следует из равенств
t
./ d —у f , - , <9/u
^ = Itexp / ^G(r) "яп" v =
о
if д i~
= Рп \k(t), -^7^
L KJ Hi
Сильная версия B0.31) обобщенного условия Лежандра играет во
вполне особом случае такую же роль, как усиленное условие Лежанд-
Лежандра в регулярном случае.
Предложение 20.4. Пусть экстремаль Xt вполне особа, удов-
удовлетворяет условию Гоха, усиленному обобщенному условию Ле-
Лежандра
-a
veR171, *e[o,*i],
для некоторого а > 0, и следующему условию невырожденности:
линейное отображение
dfu(qo)
ди
и@)
TqoM инъективно.
B0.32)
Тогда квадратичная форма QlKerD~Ft отрицательна на малых
отрезках и имеет конечный положительный индекс на L^[0,?i].
Доказательство. Это предложение доказывается аналогич-
аналогично утверждению 20.2. В разложении B0.25) первые два слагаемых
обращаются в нуль по условию Гоха, а четвертый член отрицателен и
доминирует на малых отрезках. Третий член мал на коротких отрез-
отрезках, так как
^^ «л@),
и@)
302 Гл. 20. Условия оптимальности второго порядка
а условие B0.32) позволяет выразить wi@) через интеграл J Wi(r) dr
о
на ядре DuFtl, определенном равенством B0.26). ?
Мы будем называть экстремаль, удовлетворяющую всем условиям
предложения 20.4, хорошей особой экстремалью.
20.4.4. Необходимые условия. Суммируя результаты этого па-
параграфа, получаем следующие необходимые условия для того, чтобы
квадратичная форма Q имела конечный положительный индекс.
Теорема 20.4. Пусть кусочно гладкое управление и = u(t), t G
G [0, ?i], есть критическая точка отображения в конец Ftl. Пусть
ковектор Xtl G ТД (у\^ является множителем Лагранжа:
\tlDzFtl =0, Atl /0.
Если квадратичная форма Q имеет конечный положительный
индекс, то:
(I) траектория Xt гамильтоновой системы принципа максимума
А* = Лэд(Л*), К(Х) = (XJu(q)),
удовлетворяет равенству
Л;(А4) = О, t€ [0,*!];
(П.1) выполняется условие Лежандра:
h'l(\t)(v,v)^o, veRm, te[o,ti].
(П.2) Если экстремаль Xt вполне особая:
h'^xt)(v,v) = o, veRm, te[o,h],
то выполняются условие Гоха
{hftvuhftv2}{xt) = o, vuv2eRm, te[o,h], B0.33)
и обобщенное условие Лежандра
{{Лад, ЛМ, Kv}{\t) + {ВД*), t;), hftv}(Xt) < 0,
veW71, te[o,t!\.
Замечание. Если гамильтониан hu зависит от и аффинно (аф-
(аффинные по управлению системы), то второе слагаемое в обобщенном
условии Лежандра B0.34) обращается в нуль.
Напомним, что соответствующие достаточные условия конечности
индекса второй вариации даются в предложениях 20.2 и 20.4.
Комбинируя теоремы 20.4 и 20.3, получаем следующие необходи-
необходимые условия оптимальности.
Следствие 20.1. Если кусочно гладкое управление и = u(t)
локально геометрически оптимально для управляемой систе-
системы B0.14), то вдоль соответствующей экстремали Xt выполня-
выполняются условия первого порядка (I) и второго порядка (П.1), (П.2)
теоремы 20.4.
20.5. Приложения
303
20.5. Приложения
В этом параграфе мы применим полученные условия оптималь-
оптимальности второго порядка к конкретным задачам.
20.5.1. Анормальные субримановы геодезические. Рас-
Рассмотрим субриманову задачу
и =
г=1
до, 9A) = 9ъ
1 т !
J(u) = - I 2_2 и? dt = - I \u\2 dt —>• min.
о i=1 о
Исследование оптимальности эквивалентно изучению границы
множества достижимости для расширенной системы
г=1
= \\и
у е
Гамильтониан равен
г=1
Параметр v постоянен вдоль любой геодезической (экстремали). Ес-
Если v ф 0 (нормальный случай), то экстремальное управление мож-
можно определить из принципа максимума. Далее будем рассматривать
анормальный случай:
i/ = 0.
Тогда
г=1
В анормальном случае условие максимума ПМП непосредственно
не определяет управления (анормальные экстремали вполне особые).
Из этого условия следует, что анормальные экстремали Л^ удовлетво-
удовлетворяют кроме гамильтоновой системы
следующим тождествам:
hi(Xt) = 0,
i = 1,... ,m.
304 Гл. 20. Условия оптимальности второго порядка
Применим условия второго порядка. Как мы уже отмечали, усло-
условие Лежандра вырождается. Условие Гоха принимает форму
{hi,hj}(\t) = 0, ij = l,...,m.
Если анормальная экстремаль А^ проецируется в оптимальную тра-
траекторию q(t), то в любой точке q этой траектории существует такой
ковектор
A е Т*М, ХфО,
ЧТО
(X,[fiJj](q)) = 0, ij = 1,...,га.
Следовательно, если
span(?(g), [/<,/,-]((/)) = ГдМ, B0.35)
то через точку q не проходят локально оптимальные строго анормаль-
анормальные траектории.
Экстремальная траектория называется строго анормальной, ес-
если она является проекцией анормальной экстремали и не является
проекцией нормальной экстремали. Отметим, что в случае corank > 1
экстремальные траектории могут быть анормальными, но не стро-
строго анормальными (т. е. могут быть анормальными и нормальными
одновременно): могут существовать два множителя Лагранжа (А, 0)
и (A',z/ ф 0). Малые дуги таких траекторий всегда оптимальны в
-| т
силу гладкости нормального гамильтониана Н = - J2 h2 (см. след-
2 г=1
ствие 17.1).
Распределения span(/^(g)), удовлетворяющие условию B0.35), на-
называются 2-порождающими. Например, левоинвариантные распреде-
распределения полного ранга, возникающие в субримановой задаче на ком-
компактной группе Ли в параграфе 19.2 и упражнении 19.1, являются
2-порождающими, поэтому в этих задачах нет строго анормальных
траекторий.
Пример 20.1. Рассмотрим следующую левоинвариантную суб-
риманову задачу на GL(n) с естественным критерием:
Q = QV, Qe GL(n), V = V\ B0.36)
l
J(V) = | fir V2 dt -> min. B0.37)
о
Упражнение 20.6. Покажите, что нормальные экстремали в
этой задаче суть произведения двух однопараметрических подгрупп.
(Указание: повторите рассуждение параграфа 19.2.) Отсюда следует,
что любая невырожденная матрица может быть представлена в виде
произведения двух экспонент eve^v~v ^2. Заметим, что не любая
невырожденная матрица представляется в виде одной экспоненты еУ.
20.5. Приложения 305
В задаче B0.36), B0.37) имеется много анормальных экстремалей,
но они не могут быть оптимальными. Легко видеть, что распределе-
распределение, заданное правой частью этой системы, 2-порождающее. Действи-
Действительно,
[QV1,QV2] = Q[V1,V2],
причем если матрицы У% симметричны, то их коммутатор [Vi, V2] ко-
сосимметричен. Более того, любая кососимметричная матрица может
быть получена таким образом. Но любая (п х п)-матрица есть сумма
симметричной и кососимметричной матриц. Поэтому распределение
{QV | V* = V} 2-порождающее, и строго анормальные экстремальные
траектории неоптимальны.
20.5.2. Локальная управляемость билинейных систем.
Рассмотрим билинейную управляемую систему вида
х = Ах + иВх + vb, u,veR, xeW1. B0.38)
Мы хотим выяснить, когда эта система локально управляема в начале
координат, т. е.
OeintA0{t) V*>0.
Отрицание необходимых условий геометрической оптимальности дает
достаточные условия локальной управляемости.
Применим к нашей системе условия второго порядка из следст-
следствия 20.1. Предположим, что
0 G dAo(t) для некоторого t > 0.
Тогда траектория x(t) = 0 геометрически оптимальна, поэтому она
удовлетворяет принципу максимума. Зависящий от управления га-
гамильтониан равен
hUtV(p,х) = рАх + ирВх + vpb, X = (р, х) е T*Rn = Mn* x W1.
Вертикальная часть гамильтоновой системы вдоль траектории x(t)
имеет вид
р=-рА, peW1*. B0.39)
Из принципа максимума следует, что
р(т)Ъ = p(O)e~ATb = 0, те [0,*],
т. е.
= 0, г = 0,...,п-1, B0.40)
для некоторого ковектора р@) Ф 0, поэтому
Переходим к условиям второго порядка. Условие Лежандра вы-
вырождается, так как система аффинна по управлению, а условие Гоха
принимает форму
р(т)вь = о, re [o,t].
20 А.А. Аграчев, Ю.Л. Сачков
306 Гл. 20. Условия оптимальности второго порядка
Дифференцируя это тождество в силу гамильтоновой системы B0.39),
получаем, вдобавок к B0.40), дополнительные ограничения на р@):
р@)А{ВЪ = 0, г = 0,..., п - 1.
Обобщенное условие Лежандра вырождается.
Итак, неравенство
spanF, АЪ,..., Ап-Ч, ВЪ, АВЪ,..., Ап~1ВЪ) ф W
необходимо для геометрической оптимальности траектории x(t) = 0.
Иными словами, равенство
spanF, АЪ,..., An~\ ВЪ, АВЪ,..., Ап~1ВЬ) = W1
достаточно для локальной управляемости билинейной системы B0.38)
в начале координат.
20.6. Системы со скалярным управлением
В этом параграфе мы применим условия оптимальности первого
и второго порядков к простейшему (и наиболее сложному для управ-
управления) случаю систем со скалярным управлением:
Q = fo(q) + uh(q), ueMcR, qe M. B0.41)
Система аффинна по управлению, и условие Лежандра автомати-
автоматически вырождается. Далее, управление одномерно, поэтому условие
Гоха тривиально. Впрочем, обобщенное условие Лежандра работает
(мы выпишем его ниже). Сначала применим принцип максимума
Понтрягина. Введем линейные на слоях кокасательного расслоения
гамильтонианы
Ы(Х) = (\,Мд)), г = 0,1;
тогда гамильтониан системы равен
hu(X) = ho(X) + uh1(X).
Мы будем рассматривать экстремали, соответствующие управлению
u(t)€(a,p). B0.42)
Гамильтонова система ИМИ имеет вид
Xt = ho(Xt) + u^h^Xt), B0.43)
а условие максимума сводится к тождеству
hi(At) = O. B0.44)
Экстремали А^ липшицевы, поэтому предыдущее тождество можно
дифференцировать:
Ai(Ai) = j-t hj(At) = {h0 + u(t)fti,hi}(At) = {Ao, Ai}(At) = 0. B0.45)
Равенства B0.44), B0.45), выполняющиеся тождественно вдоль
любой экстремали А^, которая удовлетворяет B0.42), не позволяют
20.6. Системы со скалярным управлением 307
определить соответствующее управление u(t). Чтобы получить ра-
равенство, содержащее u(i), продолжаем дифференцировать:
/ii(At) = {h0 + u(t)hu {ft0, fti}}(At) =
= {ft0, {/г0, hi}}(At) + u(t){hu {h0, hi}}(At) = 0.
Введем обозначение для гамильтонианов:
hhi2...ik = {hil,{hi2,...,{hik_1,hik}...}}, i/ G {0,1}.
Тогда любая экстремаль At с ограничением B0.42) удовлетворяет
тождествам
hi(At) = hoi(At)=0, B0.46)
Aooi(At) + u(t)hwl(Xt) = 0. B0.47)
Если hioi(Xt) Ф 0, то экстремальное управление и = u{\i) определя-
определяется однозначно точкой Л^:
?^ B0-48)
Заметим, что условие регулярности /iioi(A^) ф 0 тесно связано с
обобщенным условием Лежандра. Действительно, для гамильтониа-
гамильтониана hu = ho + uh\ обобщенное условие Лежандра принимает вид
{{ho + ubi,hi},Ai}(At) = -Aioi(At) ^ о,
Если ж:е это неравенство становится строгим, то управление опреде-
определяется соотношением B0.48).
Предположим, что /iioi(At) ф 0, и подставим управление г/(А) =
= — ^ooi(A)//iioi(A), определяемое равенством B0.48), в гамильтонову
систему B0.43):
А = fto(A) + iz(A)fti(A). B0.49)
Любая экстремаль, на которой выполняются условия B0.42) и
^loi(At) ф 0, есть траектория этой системы.
Лемма 20.3. Многообразие
{A G T*M| ftx(A) = ftoi(A) = 0, ft1Oi(A) ф 0} B0.50)
инвариантно для системы B0.49).
Доказательство. Прежде всего заметим, что условие регу-
регулярности ftioi(A) ф 0 гарантирует, что условия B0.50) определяют
гладкое многообразие, так как d\h\ и d\hoi линейно независимы.
Введем гамильтониан
Соответствующее гамильтоново векторное поле
?(А) = Ао(А) + u(A) h^X) + ht (A) u(A)
20*
308 Гл. 20. Условия оптимальности второго порядка
совпадает с полем B0.49) на многообразии {hi = /iqi = 0}, поэтому
достаточно показать, что (р касается этого многообразия.
Вычислим производные вдоль поля (р:
hi = {h0 + uh-L, hi} = ftOi - (hiu)hu
hoi = {ho + uhi, hoi} = /ippi + uhioi^ — (hpiu)hi = — {hoiu)hi.
=o
Линейная система с переменными коэффициентами для h\(t) =
= fti(At), hoi{t) = hol(Xt)
ffti(t) = hol(t) - (hlU){Xt) fti(t),
имеет единственное решение. Поэтому для начальных условий /г-i (О) =
= ^oi(O) = 0 получаем решение h\{t) = hoi(t) = 0. Следовательно,
многообразие B0.50) инвариантно для поля <^(А), а потому и для
поля B0.49). П
Теперь опишем все экстремали системы B0.41), удовлетворяющие
условиям B0.42) и hioi ф 0. Любая такая экстремаль принадлежит
многообразию {hi = hoi = 0}, и через любую точку Ао этого многооб-
многообразия, удовлетворяющую граничным условиям на управление
проходит единственная такая экстремаль — траектория А^ систе-
системы B0.49).
В задачах, рассмотренных в гл. 13 и 18 (машина Дубинса, вра-
вращение вокруг двух осей в SOC)), все особые экстремали возникали
именно таким образом. В общем случае hioi ф 0, и все экстрема-
экстремали, удовлетворяющие B0.42), могут быть изучены, как это сделано
выше. Но в некоторых важных примерах гамильтониан /iioi может
обращаться в нуль. Например, рассмотрим механическую систему с
управляемой силой
или, в стандартной форме,
Г 2/1 = 2/2,
i = g(yi) + *
Векторные поля в правой части равны
поэтому
20.6. Системы со скалярным управлением 309
Более общо, /г-ioi также обращается в нуль для систем вида
Интересный пример системы такого рода — машина Дубинса с управ-
управлением угловым ускорением:
'' Х\ = COS0,
sm0> (xux2)eR\ 6eS\ yel, \u\^l.
Имея в виду такую мотивацию, рассмотрим теперь случай, когда
ftioi(A) = 0. B0.52)
Тогда равенство B0.47) не содержит u(t), и мы продолжим диффе-
дифференцирование, чтобы получить уравнение, определяющее управление
h\ J(Xt) = ftooi(At) = ftoooi(At) + u(t)hlool(Xt) = 0.
Оказывается, сомножитель при u(t) тождественно обращается в нуль
при условии B0.52):
= {^i, {/го, {^0, ^i}}} =
, /г0}, {/го, hi}} +{/г0, {hi, {/г0, ^i}}} = {/го, hioi} = 0.
=о
Поэтому получаем, в дополнение к B0.46), B0.47) и B0.52), еще одно
тождество без u(t):
t) = 0.
Продолжим дифференцирование:
h[4)(Xt) = hoooi(At) = ^ooooi(At) + u(t)h1OoO1(Xt) = 0. B0.53)
Для машины Дубинса с управлением угловым ускорением /iioooi (А*) ф
Ф 0, и в случае общего положения (в классе систем B0.51)) это также
верно. При условии /iioooi(At) ф 0 можно выразить управление в виде
и = и(Х) из уравнения B0.53) и найти все экстремали так же, как в
случае hlol(Xt) ф 0.
Упражнение 20.7. Покаж:ите, что для машины Дубинса с
управлением угловым ускорением особые траектории суть прямые на
плоскости (ж1,Ж2):
xi = х\ + ?cos#o, ^2 = ^2 + ^sin^o, ^ = ^о, У = 0-
Впрочем, эта система устроена по-новому. Появляется новый тип
оптимального управления, когда управление имеет бесконечное число
переключений на компактных временных интервалах.
310 Гл. 20. Условия оптимальности второго порядка
Для стандартной машины Дубинса (с управлением угловой ско-
скоростью) особые траектории могут сопрягаться с релейными траекто-
траекториями следующим образом:
u(t) = ±1, t< i; u{t) = 0, t > i, B0.54)
или
u(t) = 0, t <t- u(t) = ±1, t > t. B0.55)
Покажем, что при управлении угловым ускорением такие управ-
управления не могут быть оптимальны.
Приведенное ниже рассуждение показывает, как наши методы мо-
могут применяться в ситуациях, не покрываемых формальной теорией.
В ходе этого рассуждения мы докажем предложение 20.5, сформули-
сформулированное на стр. 314.
Рассмотрим задачу быстродействия для нашей системы со скаляр-
скалярным управлением B0.41). Докажем, что не существует оптимальных
по быстродействию траекторий, содержащих особый участок, за ко-
которым следует релейный участок. От противного: предположим, что
такая траектория q(t) существует. Рассмотрим сужение этой траекто-
траектории на особый и релейный участки:
q(t), te[O,ti],
Пусть Xt — экстремаль, соответствующая экстремальной траек-
траектории q{t). Предположим, что такая экстремаль единственна с точ-
точностью до ненулевого множителя (в типичном случае это так). Пере-
Перепараметризуя управление (т. е. выбирая и — u(t — 0) в качестве нового
управления), получаем
и{1 - 0) = 0, а < 0 < /3,
без изменения структуры скобок Ли. Заметим, что сейчас мы изучаем
оптимальную по быстродействию траекторию, а не геометрически
оптимальную, как раньше. Впрочем, гамильтониан ПМП hu = ho +
+ uh\ для задачи быстродействия такой же, как для геометрической
задачи, поэтому проведенный выше анализ особых экстремалей при-
применим. По сути ниже мы докажем, что особый и релейный участки
не могут сопрягаться не только на оптимальной по быстродействию
траектории, но также и на оптимальной по медленнодействию или
геометрически оптимальной траектории.
Мы предполагаем, что поля /0, /i удовлетворяют тождеству
а экстремаль А^ удовлетворяет неравенству
frioooi (\) Ф 0-
Так как иA — 0) = 0, то из равенства B0.53) следует /looooi(^) =
20.6. Системы со скалярным управлением 311
Из условия максимума ПМП следует, что
т. е. вдоль всей экстремали
Но на особом участке hi(Xt) = 0, поэтому
Первая отличная от нуля производная функции ui(t)hi(Xt) при t =
= i + 0 положительна. Имея в виду, что u(t) =7 на релейном участке
t G [?, ?1], мы вычислим эту производную. Так как /ii(A^) = /loi(A^) =
= ^ooi(A^) = hoooi(Xi) = hiQQi(Xi) = 0, то первые три производные
обращаются в нуль:
4т utyh^Xt) = 0, А; = 0,1, 2,3.
dtk t=t+o
Поэтому четвертая производная неотрицательна:
CLT
Сейчас мы используем это неравенство с тем, чтобы получить проти-
противоречие благодаря теории второй вариации.
Напомним выражение B0.29) для гессиана отображения в конец:
XtRessuFt(v) =
t t n
= J\0[g'T,g'T]w2(T)dT + JJ\0 [g'^g'r^wfoMTjdndT!. B0.57)
0 0 0
Здесь
= 7(^00001 (X-t) + 7^10001 (А^)) = 72^ioooi(A^) ^ 0.
Так как 7 > 0, получаем
-t) >0. B0.56)
w(r) = f v(e)de, гу(О) = 0,
g'T = Pr'
T
PT = exp / /u@) dO.
о
Первый член в выражении для гессиана B0.57) обращается в нуль:
312 Гл. 20. Условия оптимальности второго порядка
Дважды интегрируя второй член по частям, получаем
\tHessuFt(v) =
t t п
= J\0[gfT,gfT]r12(T)dT + JJ\0 [^,^]77(r2O7(ri)dr2dri, B0.58)
0 0 0
где
т
г](г) = /
(i) b /() = 0.
о
Первый член в B0.58) доминирует на игольчатых вариациях v = v^ ?:
X-t HessM F-t{vu) = eA\0[g'-v g\} + O(e5).
Вычислим главный член в гамильтоновой форме:
Ао[#, g'-t] = At-[[/o,[/o,/i]], [/0,/i]] = {ftooi,hoi}(At-) =
= {{hi, h0}, hooi}(Xi) = {hi, {/i0, /iooi}}(A^) - {/г0, {hi,
В силу неравенства B0.56)
\lKessu Fi(vo) > 0,
где
^o = v-ti?
для достаточно малых е > 0. Это означает, что
d2
ds s=o
а о F-t(u + <s?;o) = A^ Hessn
для любой функции a G G°°(M), a{q(t)) = 0, dq^a = A^. Тогда
2
а о F-t(u + s^o) = v At- HessM F^(v0) + O(s3), s -+ 0,
т. е. кривая i^(i/ + у^г^о) является гладкой при s = +0 и имеет каса-
касательный вектор
as
s=+o
<Ab?o)>0. B0.59)
Итак, вариация оптимального управления и в направлении г>о по-
порождает касательный вектор ?о ко множеству достижимости ЛЧо (I),
принадлежащий полупространству (А^, • ) > 0 в Т а\М.
20.6. Системы со скалярным управлением 313
Так как экстремальная траектория q(t) есть проекция единствен-
единственной с точностью до скалярного множителя экстремали А^, то управ-
управление и является критической точкой коранга один отображения в
конец:
&milmDuF-t = dimM - 1 = п - 1.
Это означает, что существуют вариации управления, порождающие
гиперплоскость касательных векторов к Aqo (t):
3^i,..., vn-i G TUU такие, что
—
Cl S
span(fb..., ?n_i) = ImDuF-t.
Итак, вариации vq, vi, ..., vn—i управления и на особом участке
порождают неотрицательное подпространство ковектора Л^:
п-1
us = и + t/s^vq + ^^SiVi, s = (s0, si,. •. ,sn_i) G M+ x IR72,
Fi(u + svi)=€i, г =
=0
?о + span(?i,..., ?n_i) = {(A,-, • ) ^ 0}.
Добавим игольчатую вариацию на релейном участке. Так как
управление u(t), t G [Mi], неособое, заключаем, что функция пере-
переключения hi(Xt) ф 0, t e [Mi]. Выберем любой момент
h e (Mi) такой, что ^i(A^) ф 0.
Добавим игольчатую вариацию, сосредоточенную на малых отрезках
вблизи t\\
{us(i), t е [0,1],
и(г)=Ъ t? P,*i]Upi+e,ti],
0, t е [h.h +е].
Игольчатая вариация порождает касательный вектор
де (e,s)=(+o,o) 1 s'e *х
Р^ = ехр у /u(r) dr;
г
эта производная вычисляется, как в доказательстве принципа макси-
максимума (см. лемму 12.2). Определим расположение вектора
относительно гиперплоскости Im DuFtl:
314 Гл. 20. Условия оптимальности второго порядка
Так как hi (Л^) ф О, то из принципа максимума следует, что 7^1 (А^) =
= u(t\)h\{\-t^) > О, поэтому
(Atl,ryn) < 0.
Перенесем касательные векторы ^, г = 0,..., п — 1, из q(t) в g(?i):
e,s) = (O,O)
г = 0,... ,п — 1.
Неравенство B0.59) переносится в неравенство
<Atl,77o> = (At,?o> >0,
помимо этого, конечно,
(Atl, rji) = (А^, Ci> = 0, г = 1,..., п - 1.
Неравенство (\tl,r]n} < 0 означает, что игольчатая вариация на ре-
релейном участке порождает касательный вектор в полупространстве
(At 15 • ) < 0, дополнительном к полупространству (А^, • ) ^ 0, порож-
порожденному вариациями на особом участке.
Подведем итоги. Отображение
F: Ш+ х IT xR|^M, F(s,e) = Ftl(ua,e),
удовлетворяет условию
К"
х +) +щ p^,,?ni) +
= Tq{tl)M.
По лемме 12.1 и замечанию после нее отображ:ение F локально от-
открыто в точке (s,e) = @,0). Поэтому образ отображения Ftl(us^?)
содерж:ит окрестность конечной точки q(ti). По непрерывности g(?i)
остается в образе Ftl_$(us^?) для достаточно малых 5 > 0. Иными сло-
словами, точка q(ti) достижима из до за время t\ — 5, т. е. траектория q(t),
t G [0,^i], неоптимальна по быстродействию, противоречие.
Мы доказали, что оптимальная по быстродействию траектория
q(t) не может содержать особого участка, за которым следует ре-
релейный участок. Аналогично, особый участок не может следовать за
релейным.
Получаем следующее утверждение о возможной структуре опти-
оптимального управления.
Предложение 20.5. Пусть векторные поля в правой части
управляемой системы B0.41) удовлетворяют тождеству
[Л Л/о, Л]] =0. B0.60)
Пусть оптимальная по быстродействию траектория q(t) этой
системы является проекцией единственной с точностью до скаляр-
скалярного множителя экстремали А^, и пусть /iioooi(At) ф 0.
Тогда траектория q(t) не может содержать особого участка и
релейного участка, прилегающих друг к другу.
20.6. Системы со скалярным управлением 315
Замечание.В этом рассуждении оптимальные по быстродейст-
быстродействию управления молено заменить оптимальными по медленнодей-
ствию или геометрически оптимальными управлениями.
Что происходит вблизи особых траекторий при условии B0.60)?
Предположим, что особая траектория оптимальна (как прямые для
задачи Дубинса с управлением угловым ускорением). Заметим, что
оптимальное управление существует, поэтому функция качества всю-
всюду определена. Для граничных условий, достаточно близких к осо-
особой траектории, есть два возможных типа оптимального управления:
A) либо оно совершает бесконечное число переключений на ком-
компактном временном отрезке, прилегающем к особому участку, так что
оптимальная траектория «сходит» с особой траектории с бесконечным
числом переключений;
B) либо оптимальное управление релейно, но число переключений
бесконечно возрастает, когда конечная точка приближается к особой
траектории.
В случае A) говорят, что имеет место явление Фуллера. Оказы-
Оказывается, что явление Фуллера действительно возникает в задаче Ду-
Рис. 20.1. Сопряжение особого участка и участка с явлением Фуллера
бинса с управлением угловым ускорением (рис. 20.1). Приведенные
выше рассуждения подсказывают, что это явление не патология, но
неизбежность для некоторых классов систем (в частности, в приложе-
приложениях). Это явление можно наблюдать, останавливая теннисный мячик
между столом и опускающейся ракеткой. Теория явления Фуллера
описана в книге [18]. Из этой теории следует, что в задаче Дубинса с
управлением угловым ускорением действительно реализуется альтер-
альтернатива A).
Гл а в а 21
УРАВНЕНИЕ ЯКОБИ
В гл. 20 установлено, что знак квадратичной формы А^ Hess^ Ft
связан с оптимальностью экстремального управления и. При естест-
естественных предположениях вторая вариация отрицательна на малых от-
отрезках. Теперь мы хотим найти момент времени, когда эта квадратич-
квадратичная форма перестает быть отрицательной. Мы выведем дифференци-
дифференциальное уравнение (уравнение Якоби), которое позволяет найти такой
момент (сопряженное время). Более того, мы дадим необходимые и
достаточные условия оптимальности в этих терминах.
Напомним выражение B0.18) для квадратичной формы Q,
i^ = QlxerD-F ' полученное в параграфе 20.3:
Продолжим форму Q с пространства L^ на L2 по непрерывности.
Мы будем рассматривать семейство задач на отрезках [0,?], t Е
Е [0,?i], поэтому введем соответствующие множества допустимых
управлений:
Ut = {и Е Ь2([0,и],и)\ и(т) = 0 при т > t},
и пространства вариаций управлений:
Vt = TzUt ={»? LSiMi]! v(t) = 0 при т > t} ~ L™[O,t].
Обозначим вторую вариацию на соответствующем отрезке через
Qt = Q\Vt ¦
Заметим, что семейство пространств Vt упорядочено по включе-
включению:
t'<t" => Vt/CVt//,
а семейство форм Qt согласовано с этим порядком:
Qt' = QHvt/ •
В частности,
Qt,, < 0 => Qt, < 0.
Обозначим момент времени, когда формы Qt перестают быть от-
отрицательными ,
21.1. Регулярный случай: вывод уравнения Якоби 317
где t
g'Tv(r)dr =
J
и
есть замыкание пространства Ker D^Ft в L2. Если квадратичная фор-
форма Qt\K отрицательна для всех t Е @, t\], то по определению t* = +00.
21.1. Регулярный случай: вывод уравнения Якоби
Предложение 21.1. Пусть Xt — регулярная экстремаль, для
которой t* E @, ?i].
Тогда квадратичная форма Qt^Kt вырождена.
Доказательство. По усиленному условию Лежандра норма
, ?* . 1 /о
IMIb." =
о
эквивалентна стандартной L™-норме. Тогда
Qu = I K(v(r)) dr + J\0\ JgfT2v(r2) dr2, g'^vin) drx =
0 00
где R — компактный оператор в L™[0,?*].
Сначала докажем, что квадратичная форма Q^ неположительна
на ядре Kt^. От противного: предположим, что существует такое v G
Линейное отображ:ение D^Ft^ имеет конечномерный образ, поэтому
Vu = Ки 0 Е, dimE < 00.
Семейство D^Ft слабо непрерывно по ?, поэтому оператор D^Ft^_?\E
обратим и
Vt.=KU-e®E
при малых е > 0. Рассмотрим соответствующее разложение
V = V? + Же, Ve G Kt^-еч %е ? ^?-
Тогда же —>• 0 слабо при ? —>• 0, поэтому х? —>- 0 сильно в силу ко-
конечномерности Е\ Следовательно, v? ^ v сильно при е —>- 0. Далее,
Q^#_e(ve) = Qt*{v?) —>- Qt^{v) при ?¦ —>> 0, так как квадратичные фор-
формы Qt непрерывны. Итак, Q^-e^e) > 0 при малых ? > 0, что проти-
противоречит определению t*. Мы доказали, что
Qu\ku<°- B1Л)
Теперь покаж:ем, что
3 v G i^t*, г> ^ 0, такое, что Qtm (v) = 0.
318 Гл. 21. Уравнение Якоби
С помощью рассуждений, аналогичных использованным при до-
доказательстве предложения 16.2 (при изучении сопряженных точек в
линейно-квадратичной задаче), показываем, что функция
fi(t) = sup {Qt(v)\ v e Ku \\v\\h» = 1} B1.2)
удовлетворяет следующим свойствам: /i(t) не убывает, верхняя грань
в B1.2) достигается и jj,(t) непрерывна справа.
Неравенство B1.1) означает, что //(?*) ^ 0. Если //(?*) < 0, то
fi(t* + s) < 0 при малых е > 0, что противоречит определению t*.
Поэтому //(?*) = 0, более того, существует такое
v E Kt^ \\v\\h" = 1,
что
Учитывая неположительность квадратичной формы Q^, зак-
заключаем, что элемент v ф 0 принадлеж:ит ядру квадратичной фор-
формы Qt#\Ku- ?
Предлож:ение 21.1 мотивирует введение следующего важ:ного по-
понятия. Момент tc G @, ^i] называется сопряженным временем (для
начального момента t = 0) вдоль регулярной экстремали А^, если
квадратичная форма Qtc\x вырождена. Отметим, что по предложе-
предложению 20.2 формы Qt\K отрицательны при малых t > 0, поэтому малые
дуги регулярных экстремалей не содержат сопряженных точек: для
них t* > 0. Предложение 21.1 означает, что момент ?*, когда квад-
квадратичные формы Qt\xt перестают быть отрицательными, является
первым сопряженным временем.
Начинаем вывод дифференциального уравнения, позволяющего
находить сопряженное время для регулярной экстремальной па-
пары (u(i),\t). Симплектическое пространство
будет пространством состояний этого уравнения. Введем семейство
отображений
Jf . Ж. —Г Zj,
JtV = —
ди
hu,t У-
u(t)
В этих обозначениях билинейная форма Qt записывается как
= J'/»;'(«i (r), t72(r))dt+ ff cT{Jr,vl{r2),Jr1v2{ri))dT1dT2 B1.3)
21.1. Регулярный случай: вывод уравнения Якоби
319
(см. B0.18), B0.19)). Рассмотрим форму Qt на подпространстве
Kt = KerD^Ft = Li G V
f JTVi{r) dr G По|, B1.4)
где
есть вертикальное подпространство.
Вариация управления v G Vt удовлетворяет включению
veKer(Qt\Kt)
тогда и только тогда, когда линейная форма Qt(v, •) аннулирует под-
подпространство Kt С Vt- Так как вертикальное подпространство По С X)
лагранжево, равенство B1.4) можно переписать следующим образом:
\ =0
То есть аннулятор подпространства Kt С Vt совпадает со следующим
конечномерным пространством линейных форм на Vt'-
tr( JT ¦, v) dr
1/е
П0|.
B1.5)
Итак, получаем, что v G Ker (Qt\x ) тогда и только тогда, когда
форма Qt(v, •) на Vt принадлежит подпространству B1.5). То есть
v G Ker (Qtlx ) тогДа и только тогда, когда существует такое v G По,
что
t
Qt(v,-) = j\{JT-,v)dr.
о
Преобразуем равенство форм B1.6):
t t
f a{Jr -,v)dT = f K{v{t), -)dr+ jf a{JT2
, JTl
B1.6)
dr2 =
f
a
0 0 0
Это равенство форм означает, что подынтегральные выражения
должны совпадать:
Jev@)d0,JT
,t]. B1.7)
320 Гл. 21. Уравнение Якоби
Используя кривую в пространстве X)
г
rjT = J Jev{0)d0 + v, те [0,*], B1.8)
о
равенство форм B1.7) можно переписать следующим образом:
K(v(t), ¦) + a(r]T,JT-)=0, T?[O,t]. B1.9)
Из усиленного условия Лежандра следует, что линейное отобра-
жение ъ" • u$m -л u$m*
невырождено (мы обозначаем здесь и ниже линейное отображение в
сопряженное пространство тем же символом, что и соответствующее
квадратичное отображение), поэтому определено обратное отобра-
Тогда равенство B1.9) записывается как
v(T) + (h';y1tT(riT,JT-) = O, re[0,t]. B1.10)
Получаем следующее утверж:дение.
Теорема 21.1. Пусть А^, t G [0,?i], есть регулярная экстре-
экстремаль.
Момент t G @, t\] является сопряженным временем тогда и
только тогда, когда существует непостоянное решение rjr уравне-
уравнения Якоби „ 1
nr = JT{K) 1<r{JT-,4r), re[0,t], B1.11)
удовлетворяющее граничным условиям
щ е По, rjt е По. B1.12)
Уравнение Якоби B1.11) есть линейная неавтономная гамильто-
нова система на Е: -> , ч ,
rjr = br(r]T) B1.13)
с квадратичным гамильтонианом
где (h")~1 — квадратичная форма на Мт*.
Доказательство. Мы уже доказали, что существование v G
G Ker Qt | к равносильно существованию решения rjT уравнения Яко-
Якоби, удовлетворяющего граничным условиям B1.12).
Если v = 0, то г]Т = const в силу B1.8). Следовательно, если т\т =
= const, то JTv(r) = rjT = 0. В силу B1.3) вторая вариация принимает
форму t
Qt(y) = / h'^{v{r)) dr < — ct\\v\\\2 для некоторого а > 0.
21.2. Особый случай: вывод уравнения Якоби 321
Но v Е KerQt, поэтому Qt(v) = 0, следовательно, v = 0. Поэтому
ненулевые v соответствуют непостоянным г]т, и обратно.
Остается доказать, что Ът — функция Гамильтона для уравнения
Якоби B1.11). Обозначим
Тогда уравнение Якоби записывается как
rjr = JTAT(rjT),
т. е. мы должны доказать, что
JTAT{rJ) = bT(r]), т? ЕЕ. B1.14)
Так как
то получаем
{^Ьт, 0 = -{a(JT ¦, О, Ат(т,)) = <т(?, JTAT(ту)).
Поэтому равенство B1.14) доказано, как и вся теорема. ?
21.2. Особый случай: вывод уравнения Якоби
В этом параграфе мы выведем уравнение Якоби для хорошей
особой экстремальной пары (u(t),\t).
В отличие от регулярного случая, в особом случае вторая вариация
может быть невырожденной в момент ?*, когда она перестает быть
отрицательной. Для того чтобы построить теорию сопряженных точек
для особого случая, мы произведем замену переменных в форме Qt.
Обозначим, как и раньше, интегралы
Ui(r) = I V
щ(т) = / Vi(s)ds, i = 1,2,
г
и обозначим билинейную форму, входящую в обобщенное неравенство
Лежандра,
Для хорошей особой экстремали выражение для второй вариа-
вариации B0.25) записывается как
Qt{vi,v2) = JIt{w1{t),w2{t)) dr + J<j( Jrwi(r), J Jew2{0) dOj dr +
),/jx^2(r)
dTy
21 А.А. Аграчев, Ю.Л. Сачков
322 Гл. 21. Уравнение Якоби
Условие допустимости B0.26) для вариаций управления ^(-) можно
записать следующим образом:
t
/•
Jrw(r) dr + Jow(O) G По. B1.15)
о
Отображение y{) ^ {w{^ w{Q)) ? ^ x Rm
имеет всюду плотный образ в L™ x Mm, и гессиан Qt вместе с условием
допустимости B1.15) продолжаются на L™ x W71 по непрерывности.
Обозначим т /ГкЛ -^
7 = Jo^@) G Го
и рассмотрим продолженную форму
= / /г(гУ1(т),гУ2(т))йт+ / aljTwi(r), / Jew2{0)d0j dr
О Or
+ crf 7i, / Jrw
^ n
u
n
на пространстве ^ u
Г J(T)dT + 7en0. B1.16)
Г
Тогда так же, как в регулярном случае, получаем, что ограниче-
ограничение квадратичной формы Qt{w) на пространство B1.16) вырождено
в момент t = t*. Момент ?, удовлетворяющий этому свойству, называ-
называется сопряженным временем для хорошей особой экстремали Л^.
Аналогично регулярному случаю сейчас мы выведем гамильтоново
уравнение Якоби для определения сопряженного времени на хороших
особых экстремалях, хотя функция Гамильтона и граничные условия
сейчас будут отличными от полученных для регулярного случая.
Пусть t G @, ti] — сопряженное время, т. е. пусть форма Qt(wi,W2)
имеет нетривиальное ядро на пространстве B1.16). Тогда существует
такая пара f
(w,j) EL^lO.t] хГ0, J Jrw(r)dT + ~f еП0,
о
что линейная форма на пространстве L™[0,?] x Го
Qt(-,w) = JlT{.L2,w{r))dT + f °(jr 'L
0
Q/f JTw{r)dr\ B1.17)
аннулирует допустимое пространство B1.16). В свою очередь анну-
лятор допустимого пространства B1.16) есть пространство линейных
21.2. Особый случай: вывод уравнения Якоби 323
форм
/ ct(Jt - L2,v)dT + a( •го»1')» v € по-
о
Поэтому, подобно регулярному случаю, существует такое v G По, что
Qt(-,w)= / cr(JT
о
В силу представления B1.17), предыдущее равенство форм расщеп-
расщепляется:
( it м
о
То есть
lTw(r) = -а[ Jt • Km, / Jew@) <1в -v), B1.18)
T
*( t0, fjTw(T)dT-Л =0. B1.19)
Используя кривую в пространстве Е = Т\0(Т*М)
t
rjT= I Jew@) d0 - i/, r G [0, t], B1.20)
r
можно переписать равенства B1.18), B1.19) в форме
lTw(r) = -<т(Jr -Мт,г/Т), rG[0,t], B1.21)
Последнее равенство означает, что 770 принадлежит косоортогональ-
ному дополнению Tq. С другой стороны, щ G Гд + По, сравните опре-
определение B1.20) с B1.16). То есть
Напомним, что По° есть лагранж:ево подпространство в симплекти-
ческом пространстве Е, содержащее изотропное подпространство Го;
см. определение A1.28). Заметим, что условие Гоха
a(JtvuJtv2)=0, «1,«2бГ, <€[0,ti],
21*
324 Гл. 21. Уравнение Якоби
означает, что подпространства
Г* = span{Jt?;| v G W71} С Е
изотропны. Получаем граничные условия для кривой rjT:
%enj°, meu0. B1.22)
Более того, равенство B1.21) дает дифференциальное уравнение
для г)т:
rjr = -jTw{r) = JT l-\(j{JT •, r/r)), г G [0, t]. B1.23)
Аналогично регулярному случаю получаем, что это уравнение га-
мильтоново с гамильтонианом
Ш = -± l^nX- ,r,),a(JT- ,г,)), V €?.
Линейное неавтономное уравнение B1.23) называется уравнением
Якоби для вполне особого случая.
Следующее предложение доказывается так же, как теорема 21.1
для регулярного случая.
Теорема 21.2. Пусть Xt — хорошая особая экстремаль.
Момент t G @, t±] является сопряженным временем тогда и
только тогда, когда существует непостоянное решение rjT уравне-
уравнения Якоби
fir = Л/^ИЛ-,^r)), r G [0,*], B1.24)
с граничными условиями
77oGll?0, /ft Gilo. B1.25)
Уравнение Якоби B1.24) гамильтоново:
fjT = bT(r]T), B1.26)
с неавтономной квадратичной функцией Гамильтона
В следующем утверждении приведен первый интеграл уравне-
уравнения B1.23), он может быть полезен при изучении уравнения Якоби
в особом случае.
Лемма 21.1. Для любого постоянного вектора v G Mm функ-
функция a(rj,JTv) есть первый интеграл уравнения Якоби B1.23).
Доказательство. Требуется показать, что
сг(т7г, JTv) + cr(ryr, JTv) = 0 B1.27)
для решения rjT уравнения B1.23). Первое слагаемое вычисляется с
помощью уравнения Якоби:
cr(r)r, JTv) = -(dr,TbT, JTv) = I'1 [a(JT •, JTv), a(JT •, rjT)j =
21.3. Необходимые условия оптимальности 325
(где 1~х — билинейная форма)
= (а(JT •, 77т), 1~г(т(^Т •, Jrv)) =
(где Z — линейное отображение в сопряженное пространство)
= (a(JT •, 77т), v) = -сг(т7т, JTv),
и равенство B1.27) доказано. ?
В частности, эта лемма означает, что
т.е. поток уравнения Якоби сохраняет семейство пространств Г^.
Так как это уравнение гамильтоново, его поток сохраняет также и
семейство Гг. Следовательно, граничные условия B1.22) можно пере-
переписать в другой форме:
21.3. Необходимые условия оптимальности
Предложение 21.2. Пусть (и, А^) — экстремальная пара ко-
ранга один. Предположим, что Xt — регулярная или хорошая особая
экстремаль. Пусть t* G @, ?i].
Тогда:
A) либо для любого непостоянного решения rjt, t G [0,?*], уравне-
уравнения Якоби B1.13) или B1.26), удовлетворяющего граничным усло-
условиям B1.12) или B1.25), продолжение
удовлетворяет уравнению Якоби на [0, ?i];
B) либо управление и не является локально геометрически опти-
оптимальным на [0, ?i].
Доказательство. Предположим, что условие A) не выпол-
выполняется, и докажем, что тогда справедливо условие B). Возьмем любое
ненулевое v G Ker( Qt*\K ), и пусть 77*, t G [0, ?*], есть соответствующее
непостоянное решение уравнения Якоби с граничными условиями.
Рассмотрим продолжение v нулем:
_
) []
o, te[u,h],
и соответствующее продолж:ение константой rjt, как в B1.28).
Так как fjt не удовлетворяет уравнению Якоби на [0,?i], имеем
v ? Ker( Qtl \Kt ). Заметим, что Qtl (v) = Qt^ (у) = 0. С другой стороны,
существует такое w G Ktl, что Qtl(v,w) ф 0. Тогда квадратичная
форма Qtx принимает значения обоих знаков в плоскости span (г;, w).
326 Гл. 21. Уравнение Якоби
В особом случае расширенная форма Qt знакопеременна, поэтому
знакопеременна и исходная форма.
Итак, форма Qtl меняет знак на Ktl. По теореме 20.1 управле-
управление u(t) неоптимально на [0,?i]. П
Заметим, что случай A) предложения 21.2 дает сильные ограни-
ограничения на экстремаль А^. Если этот случай реализуется, то множество
сопряженных точек совпадает с отрезком [?*,?i].
Предположим, что изучаемое управление u(t) аналитично; тогда
решения щ уравнения Якоби также аналитичны. Если щ постоянно
на некотором отрезке, то оно постоянно на всей своей области опреде-
определения. Поэтому в аналитическом случае альтернатива A) предложе-
предложения 21.2 невозможна, и первое сопряженное время t* дает необходимое
условие оптимальности: траектория не может быть локально геомет-
геометрически оптимальной после t*.
Отсутствие сопряженных точек влечет конечномерную локальную
оптимальность в случае коранга один (см. теорему 20.1). В следующих
двух параграфах мы докажем гораздо более сильный результат для
регулярного случая: отсутствие сопряженных точек достаточно для
сильной оптимальности.
21.4. Регулярный случай: преобразование
уравнения Якоби
Пусть А^ — регулярная экстремаль. Предположим, что максими-
максимизированный гамильтониан Н(Х) гладок в окрестности А^. Из условия
максимума ПМП получаем уравнение
которое можно разрешить в окрестности А^:
^i(A)=0 «¦ u = u(A).
Отображение A i—>> и(Х) гладко вблизи А^ и удовлетворяет равенству
u(Xt) = u(t).
Максимизированный гамильтониан ПМП выражается в окрестнос-
окрестности А^ как
Я(А) = Ли(А)(А)
(см. предложение 12.1). Рассмотрим поток на Т*М:
t
etH о exip Г -hu(T) dr = etH о Р*.
21.4- Регулярный случай: преобразование уравнения Якоби 327
По формуле вариаций в гамильтоновой форме (см. B.27) и A1.22)),
этот поток гамильтонов:
t
е1Й о Р* = exp Г CT dr B1.29)
о
с функцией Гамильтона
Заметим, что
т.е. Ао — особая точка поля /3$. Иными словами, Aq — критическая
точка гамильтониана:
Естественно предположить, что соответствующий гессиан связан с
оптимальностью экстремали А^.
Следующее предложение устанавливает связь между двумя га-
мильтоновыми системами: уравнением Якоби на Е и гамильтоно-
гамильтоновой системой с максимизированным гамильтонианом на Т*М. Мы
воспользуемся этим соотношением при доказательстве достаточных
условий оптимальности в параграфе 21.5.
Предложение 21.3. Гамильтониан bt уравнения Якоби равен
половине гессиана функции Гамильтона /3t в точке Ао:
bt = -HessAo/3t.
Доказательство. Напомним, что гамильтониан уравнения
Якоби в регулярном случае равен
Преобразуем линейную форму:
(где (Р^*)* — дифференциал диффеоморфизма (Р/): Т*М
^Г*М)
dhu
328
Гл. 21. Уравнение Якоби
Тогда гамильтониан ht можно переписать как
Вычислим гессиан функции Гамильтона
Легко видеть, что
HessAo Pt(rj) = HessAt
Далее,
h) ^
dxu
=o
= (d
Дифференциал с/д^ можно найти дифференцированием тож:дества
dhu
ди
и(Х)
= 0
в точке А = А^. Действительно, получаем
d2hu A dhu
о и
поэтому
Следовательно,
//\— 1 7
t) d
Xt
т. e.
HessAo
и предложение доказано. П
В силу того, что гамильтониан /3t достигает минимума в точке Ло,
квадратичная форма bt неотрицательна:
Обозначим через Ct пространство постоянных вертикальных ре-
решений уравнения Якоби на отрезке [0, ?]:
ct = {v е по| bT(v) = о, т е [о,*]}. B1.30)
Мы мож:ем дать следующее простое описание этого пространства:
С4 = П0П ( П Кег6т).
21.5. Достаточные условия оптимальности 329
Действительно, особые точки гамильтонова векторного поля суть
критические точки гамильтониана, а критические точки невырожден-
невырожденной квадратичной формы суть элементы ее ядра.
21.5. Достаточные условия оптимальности
В этом параграфе мы получим достаточные условия оптимальнос-
оптимальности для задачи с интегральным функционалом:
Я = fu(q), gGM, и G U = int U С Mm,
= qo, q(h) = qii
, u(t)) dt —>• min,
/
о
с закрепленным или свободным конечным временем. Отметим, что
сейчас мы будем изучать оптимальную задачу, а не геометрическую,
как раньше. Однако теория уравнения Якоби остается применимой,
так как уравнение Якоби зависит только от гамильтониана hu(X) и
экстремальной пары (u(t),Xt).
Для нормального гамильтониана принципа максимума
К(\) = (A, fu{q)) - <p{q, и), A G Т*М,
и регулярной экстремальной пары (u(t),Xt) задачи оптимального
управления рассмотрим уравнение Якоби
В параграфе 21.3 мы показали, что отсутствие сопряженных точек
на интервале @,?i) необходимо для геометрической оптимальности
(по крайней мере в аналитическом случае коранга один).
Упражнение 21.1. Покажите, что отсутствие сопряженных
точек на @, ?i) необходимо и для оптимальности (в аналитическом
случае), сводя задачу оптимального управления к геометрической.
Покажем теперь, что отсутствие сопряженных точек также доста-
достаточно для оптимальности (в регулярном случае).
Траектория q(t), t G [0,?i], называется сильно оптимальной для
задачи оптимального управления, если она реализует локальный ми-
минимум функционала качества относительно всех траекторий системы,
близких к q(t) в равномерной топологии С([0, ?i], M) и имеющих те
же граничные точки, что и q(t). Если этот минимум строгий, то
траектория q(t) называется строго сильно оптимальной.
Теорема 21.3. Пусть Xt,t? [0, ?i], есть регулярная нормальная
экстремаль в задаче с интегральным функционалом и закрепленным
временем, и пусть максимизированный гамильтониан Н(Х) гладок
в окрестности Xt.
Если промежуток @, ?i] не содержит сопряженных точек, то
экстремальная траектория q(t) = тг(А^), t G [0,?i], строго сильно
оптимальна.
330
Гл. 21. Уравнение Якоби
Доказательство. Мы используем теорию полей экстремалей
(см. параграф 17.1) и вложим Л^ в семейство экстремалей, хорошо
проецирующееся на М.
Максимизированный гамильтониан
Н{\) = maxhu(\), Л G Т*М,
иеи
определен и гладок. Тогда по теореме 17.1 достаточно построить та-
такую функцию a G С°°(М), что семейство многообразий
Ct = etS{C0)cT*M, *E[0,*i],
?0 = {Л = dqa] С Т*М,
Ао G Со,
хорошо проецируется на М:
тг: ?t —>- М есть диффеоморфизм вблизи Л^, t G [0, ?i].
Иными словами, требуется, чтобы касательные пространства T\tjCt =
= е1/1(T\ojCq) имели нулевое пересечение с вертикальными подпрост-
подпространствами Щ = TXt{T*{t)M):
Это возможно благодаря отсутствию сопряженных точек (типичная
ситуация для сопряженной точки — складка при проекции на М —
изображена на рис. 21.1).
Рис. 21.1. Сопряженная точка — складка
21.5. Достаточные условия оптимальности 331
Мы докажем ниже существование такого многообразия Со бла-
благодаря переходу к его касательному пространству Lo — лагранжеву
подпространству вЕ (см. определение в п. 11.5.3). Для любого лагран-
жева подпространства Lq С Е, трансверсального По, можно найти
такую функцию a Е С°°(М), что график ее дифференциала Со = {Л =
= dqa} С Т*М удовлетворяет условиям:
1) Ао G ?0;
Действительно, в канонических координатах (р, q) на Т*М опре-
определим функцию вида
а(о) = (Ро, я) + 2 ЯТМ, Ао = (ро, 0),
с симметричной (n x п)-матрицей Л. Тогда
А = {А = (р, q)\p = po + Aq},
ТХоСо = {(dp,dq)\ dp = Adq},
и остается только выбрать линейное отображение А с графиком Lq.
Заметим, что симметричность матрицы А соответствует лагранжево-
сти подпространства Lq . Ниже мы используем аналогичную конструк-
конструкцию для параметризации лагранжевых подпространств квадратичны-
квадратичными формами.
Для завершения доказательства осталось найти такое лагранжево
подпространство Lq С Е, что
= {0}, te[o,h].
В силу B1.29) гамильтонов поток с максимизированным гамильтони-
гамильтонианом имеет разложение
t
еш = фг о p*-i^ ф4 = ^JpT dTa
о
Заметим, что поток Р^~г на Т*М порожден потоком Pt на М,
поэтому он сохраняет семейство вертикальных подпространств:
Таким образом, остается доказать существование лагранжева под-
подпространства Lo С Е, для которого
(ф«.А,)ПП<, = {0}, te[o,ti]. B1.31)
Предлож:ение 21.3 устанавливает связь меж:ду гамильтонианом bt
уравнения Якоби и гамильтонианом /3t:
-HessAo pt = bt.
Следовательно, поле bt есть линеаризация поля /3t в особой точке До:
гамильтониан bt и гамильтоново поле bt суть соответственно главные
332 Гл. 21. Уравнение Якоби
члены тейлоровского разложения /3t и fit в точке Ао- Линеаризация
потока есть поток линеаризации, поэтому
t ч t
( ехр \ fiTdr \ = ехр / Ът dr.
V { /*А0 {
Введем обозначение для потока уравнения Якоби:
t
Bt = ехр / Ьт dr.
о
Тогда
и равенство B1.31) переписывается в виде
(Б^о)ППо = {0}, ?e[0,?i]. B1.32)
Остается доказать существование лагранжева подпространства Lq,
удовлетворяющего этому равенству.
Напомним, что отрезок @, t-\\ не содержит сопряженных точек:
где Ct — пространство постоянных вертикальных решений уравнения
Якоби на [0,?] (см. B1.30)).
Для того чтобы прояснить основные идеи доказательства, рассмот-
рассмотрим сначала простой случай, когда
Ct = {0}, t€(O,ti], B1.33)
() {} (]
Возьмем любое лагранжево подпространство Я С И, являющееся
горизонтальным, т. е. трансверсальным вертикальному подпростран-
подпространству Пд. Тогда пространство X) распадается в прямую сумму:
Е = По 0 Я.
Выберем такое е G @, ti), что
(вд,)пя = {о}, te[o,e].
В силу непрерывности потока Bt существует такая окрестность верти-
вертикального подпространства По, что для любого лагранжева подпрост-
подпространства Lq из этой окрестности
Для завершения доказательства остается найти такое лагранжево
подпространство Lg, удовлетворяющее условию
Введем параметризацию множества лагранжевых подпространств
q С И, достаточно близких к По- Выберем координаты Дарбу (р, q)
21.5. Достаточные условия оптимальности 333
на S, в которых
Такие координаты можно выбрать многими способами. Действи-
Действительно, симплектическая форма а задает невырожденное спаривание
взаимно трансверсальных лагранжевых подпространств По иЯ:
(/,е) = а(е,/), е G По, / G Я.
Возьмем любой базис ei,...,en в По и соответствующий базис
/ъ • • • 1 fn в Н, двойственный относительно этого спаривания, и мы
получим базис Дарбу в Е. В координатах Дарбу симплектическая
форма записывается как
O-((pi,gi),(p2,g2)) = {РЪЯ.2) - (P2,gi>.
Любое n-мерное подпространство L С Е, трансверсальное Я, есть
график линейного отображения
5: По ^Я,
Подпространство L лагранж:ево тогда и только тогда, когда соот-
соответствующее отображение S имеет симметрическую матрицу в сим-
плектическом базисе (упражнение):
Введем квадратичную форму на По с матрицей S:
S{p,p) = (p,Sp).
Множество лагранжевых подпространств L С S, трансверсальных
горизонтальному пространству Я, параметризовано квадратичными
формами S на По- Для такой параметризации лагранжевых подпро-
подпространств L С Е, ЬПН = {0}, будем использовать термин (По,Я)-
параметризация.
Рассмотрим семейство квадратичных форм St, параметризующее
семейство лагранжевых подпространств вида
Lt =
т. е.
Lt = {(p,Stp)\ ре По}.
Лемма 21.2. Справедливо равенство
Доказательство. Возьмем любую траекторию (р, q) =
= (pt,qt) гамильтонова поля bt. Из равенства
Q = Stp
334 Гл. 21. Уравнение Якоби
получаем
q = Stp + Stp,
т.е. _>
bt(p,q) = (p,Stp + Stp).
В силу квадратичности гамильтониана 6^, получаем
Но левую часть легко вычислить:
о-((Р> q), h(p, q)) = сг((р, q), (р, q)) = сг((р, S», (р, Stp + S*p)) =
= (p, 5tp + 5tp) - (p, 5*p) = (p, 54р)
в силу симметричности ^. П
Так как гамильтониан fit достигает минимума в Aq, имеем bt ^ О,
поэтому
st^o.
Выберем начальное подпространство Lq с помощью частичного по-
порядка на квадратичных формах, индуцированного положительными
формами. Выбирая любое лагранжево подпространство Lo С ? с со-
соответствующей квадратичной формой
#о>0,
достаточно близкой к нулевой форме, получаем
S* >0, te[O,e].
То есть
на [0, е], а потому и на всем отрезке [0, ti].
Равенство B1.32) доказано в простом случае B1.33). Теперь рас-
рассмотрим общий случай. Сейчас пересечение (^По) П По = Ct непусто,
но от него можно избавиться, переходя к уравнению Якоби на фак-
торпространстве Cf jCt.
Семейство постоянных вертикальных решений Ct не возрастает:
Cf D Ct» при t' < t".
Имеем Cq = По и положим по определению Ctx+o = {0}. Семейство
Ct непрерывно слева, обозначим его точки разрыва:
0 ^ Si < S2 < • • • < Sk ^ ti
(отметим, что в простом случае B1.33) было к = 1, s± = 0). Семейст-
Семейство Ct постоянно на промежутках (s^Si+i]-
Построим такие подпространства Ei С По, г = 1,..., к, что
ct = Ei+1 е е{+2 е... е Ек, te (si5 si+i].
Заметим, что при t = 0 получаем разложение вертикального под-
подпространства:
По = С0 = Е!®...@Ек.
21.5. Достаточные условия оптимальности 335
Для любого горизонтального лагранжева подпространства Н С Е
можно построить соответствующее разложение Н:
H = F1®...®Fk, <т(Д^) = 0, 1фз. B1.34)
Зафиксируем любое начальное горизонтальное подпространство
Но С Е, i^o П По = {0}. Следующее утверждение завершает доказа-
доказательство теоремы 21.3 в общем случае.
Лемма 21.3. Для любого г = 1,..., к существуют такие число
Si > 0 и лагранжево подпространство Hi с S, 7^ПП0 = {0}, что
любое лагранжево подпространство Lq С Е, Lq DHq = {0}, имеющее
(По, Hq)-параметризацию So(p,p) = е(р,р), 0 < ? < б^, удовлетворяет
условиям:
A) Ltnn0 = {0}, *е[0,*];
B) Ltd Щ = {0}, ? G [0, s^], w лагранжево подпространство Lt
имеет (Hq, Hi)-параметризацию St > 0.
Доказательство. Докаж:ем лемму индукцией по г.
Пусть г = 1. При si = 0 утверждение тривиально, поэтому считаем,
что si > 0. Возьмем любое е\ > 0 и любое лагранжево подпространст-
подпространство Lo С Е с квадратичной формой е{р,р), 0 < е < ?i, в (По,#о)-пара-
(По,#о)-параметризации.
Заметим, что Ct = По, т.е. Bt\Uo = Id при t G @, si]. Далее,
Lt ПП0 = BtLonBtUo = Bt(LonUo) = {0}, t e [0, si].
В силу непрерывности потока Bt существует горизонтальное лагран-
ж:ево подпространство Hi с такой (По, Но)-параметризацией —S(p,p),
5 > 0, что LfClHi = {0}, t G [0, si]. Легко видеть, что подпрост-
подпространство Lo задается в (По, Hi)-параметризации квадратичной формой
So{p,p) = ?f(p,p) > 0, ?; = е/A + е/8) < е. Мы уже доказали, что St ^
^ 0, поэтому
5t >0, te [0,si],
в (По, i^i)-параметризации.
Базис индукции (г = 1) доказан.
Докажем шаг индукции. Зафиксируем г ^ 1, предполож:им, что
утверж:дение леммы 21.3 доказано для г, и докажем его для г + 1.
Пусть t G (s^ Si+i]; тогда С* = ^+i 0 ... 0 ^fc- Введем разложение
горизонтального подпространства Щ как в B1.34):
Hi = F1®...@Fk.
Обозначим
Ll = Lo П (??i 0 F{), Lg = Lo П (E'2 0 i^).
Так как BtE'2 = Ef2, то косоортогональное дополнение (E'2)z =
= .E^ 0 E2 0 -F{ также инвариантно относительно потока уравнения
Якоби: Bt(E'2y = {Ef2)z.
336 Гл. 21. Уравнение Якоби
Для того чтобы доказать, что Lf П По = {0}, вычислим это пере-
пересечение. В силу включения По С (E2)z получаем
BtL0 ПП0 = BtL0 C\Bt(Ef2)z ПП0 = Bt{L0 П (?2)z) ПП0 = ?tLj ПП0.
B1.35)
Поэтому требуется доказать, что BtLl ПП0 = {0}, t Е (s^, s^+i].
Так как подпространства Е2 и (E2)z инвариантны относительно
потока Bt, фактор-поток определен корректно:
Bt: E^E, ? = {E'2)z/Ef2.
В факторе поток .Е^ не имеет постоянных вертикальных решений:
Из рассулсдений, приведенных при доказательстве простого слу-
случая B1.33), следует, что
^0 = ^0/^2 5
для Lq, достаточно близких к По, т.е. для достаточно малых е. По-
Поэтому
Теперь легко доказать, что это пересечение пусто:
BtLl П По С BtLl ПЕ2 = BtL\ П Б4^ = 5t(Lj П ?^2) = {0},
t e (si,s»+i].
Учитывая цепочку B1.35), получаем
т. е. мы доказали условие A) из формулировки леммы 21.3 для г + 1.
Переходим к условию B). Так же, как при доказательстве ба-
базиса индукции, показываем, что существует такое горизонтальное
лагранжево подпространство -E/^+i С X, что кривая лагранжевых под-
подпространств Lt, t G [0, s^+i], трансверсальна Щ+-\_. В (По, ^+i)-napa-
метризации начальное подпространство Lq задается полож:ительной
квадратичной формой So(p,p) = ?f(p,p), 0 < ?f < ?. Так как S^ ^ 0,
получаем
St >0, tG [0,si+i].
Условие B) доказано для г + 1.
Шаг индукции доказан, и доказательство данной леммы завер-
завершено. ?
В силу этой леммы
= {0}, te [(Mi],
21.5. Достаточные условия оптимальности 337
для всех начальных подпространств Lg, задаваемых квадратичными
формами So = е(р,р), 0 < е < ?&> Для некоторого Е\~ > 0 в (По, #0^па-
#0^параметризации. Это означает, что мы построили семейство экстрема-
экстремалей, содержащее Л^ и хорошо проецирующееся на М. По теореме 17.1
экстремаль Л^, t Е [0, ?i], сильно оптимальна. Теорема 21.3 дока-
доказана. ?
Для задачи с интегральным функционалом и свободным конечным
временем t\ аналогичное рассуждение и теорема 17.2 дают следующее
достаточное условие оптимальности.
Теорема 21.4. Пусть \t,t E [0, ?i], есть регулярная нормальная
экстремаль в задаче с интегральным функционалом и свободным
временем, и пусть гамильтониан Н(Х) гладок в окрестности Xt.
Если на отрезке @, ?i] нет сопряженных точек, то экстремаль-
экстремальная траектория q(t) = тг(Л^), t G [0,?i], строго сильно оптимальна.
22 А.А. Аграчев, Ю.Л. Сачков
Глава 22
РЕДУКЦИЯ
В этой главе мы рассмотрим метод сведения аффинной по управ-
управлению системы к нелинейной системе на многообразии меньшей раз-
размерности.
22.1. Редукция
Рассмотрим аффинную по управлению систему
га
q = f(q) + ^2uigi(q), щ G M, q G М, B2.1)
г=1
с попарно коммутирующими векторными полями при управлениях
Поток системы можно разложить по формуле вариаций:
i=l *
= ехр / ехр( у^ Wi(r) a,dgi)fdr о expf /^ Wi(t)gi). B2.2)
1 ^ / ^ /
о %—1 %—1
Wi(t) = / Ui(r)dr.
о
га
Здесь мы считаем J^ щ{т)д{ невозмущенным потоком и учитываем,
г=1
что поля (^ взаимно коммутируют. Введем частичную систему, соот-
соответствующую второму члену в разложении B2.2):
q = expf y^Wi&dgi )f(q), ^GM, q G M, B2.3)
где u>i — новые управления. Множества достижимости А\ (i) исходной
системы B2.1) и Azit) частичной системы B2.3) за время t из точки
go G М тесно связаны друг с другом:
Ai(t) С A2{t) о <^ expf 22wigi J Wi G R> С cl(A(t)). B2.4)
Действительно, первое включение следует непосредственно из раз-
разложения B2.2). Чтобы доказать второе разложение в B2.4), заметим,
2.1. Редукция 339
что отображение
t
о ехр / exp ( V^ щ(т) ad^ ) / dr
о
непрерывно в топологии Li; это следует из асимптотического разло-
жения хронологической экспоненты. Поэтому отображение
(w(-),v) ^ q0 о ехр / ехр I ^^(r)ad^ \ f dr о ехр
о V*=i J ^
непрерывно в топологии L\ x Mm. Наконец, отображ:ение
),г;) = ( / и(т) dr, / и(т) di
чо о
и(') ^ [w[-),v) = ( / и[т)йт, / и{т)йт
j j
о о
имеет всюду плотный образ в L\ x Mm. Тогда из разложения B2.2)
следует второе включение в B2.4).
Частичная система B2.3) инвариантна относительно полей gf.
ехр(^2vi9i))ехр(^2щ ad^)f= ехр(^2(щ ~ щ">adgi)f-
B2.5)
Поэтому цепочка B2.4) и равенство B2.5) означают, что исходную
систему B2.1) можно рассматривать как композицию частичной сис-
системы B2.3) с потоком полей gf. любое множество достижимости исход-
исходной системы за время t есть (с точностью до замыкания) множество
достижимости частичной системы за время t плюс скачок вдоль ^,
более того, скачок вдоль gi возможен в любой момент времени.
Пусть (u(t),\t) — экстремаль исходной аффинной по управлению
системы. Экстремаль А^ вполне особая, более того, условие максимума
ПМП равносильно тождеству
(At, gi) = 0.
Легко видеть, что
lit = ( ехр( 2^Wi(i)gij J Xt
^ ^ г=1
есть экстремаль системы B2.3), соответствующая управлению
w(t) = / и(т) dr,
о
более того,
{fH,9i) = 0. B2.6)
(Мы используем здесь термин «экстремаль» как синоним критической
точки отображения в конец, т. е. мы требуем, чтобы экстремальное
22*
340 Гл. 22. Редукция
управление было критическим, но не обязательно минимизирующим,
для зависящего от управления гамильтониана ПМП.) Обратно: ес-
если fit — экстремаль B2.3) с липшицевым управлением w(t) и выпол-
выполняется тождество B2.6), то
есть экстремаль исходной системы B2.1) с управлением
u(i) =w(i).
Более того, усиленное обобщенное условие Лежандра для экстрема-
экстремали А^ исходной системы совпадает с усиленным условием Лежандра
для соответствующей экстремали fit частичной системы. Иными сло-
словами, переход от системы B2.1) к системе B2.3) переводит хорошие
особые экстремали А^ в регулярные экстремали fif
Упражнение 22.1. Проверьте, что экстремали Xt и fit имеют
одно и то же сопряженное время.
Так как система B2.3) инвариантна относительно полей <^, эту
систему можно рассматривать на факторе многообразия М по модулю
действия полей д^ если такое фактор-многообразие корректно опре-
определено. Рассмотрим следующее отношение эквивалентности на М:
q'~q & q' в Oq(gu ... ,дт).
Предположим, что все орбиты Oq(gi,... ,дш) имеют одинаковую
размерность и, более того, выполняется следующее условие нерекур-
нерекуррентности: для любой точки q G М существует такие окрестность
Oq Э q и многообразие Nq С М, q G Nq, трансверсальное Oq(gi,...
...,#m), что любая орбита Oq'(gi,... ,дт), qf G Oq, пересекает Nq в
единственной точке. Эти условия выполняются, например, если М =
= Mn, a gi суть постоянные векторные поля, или если т = 1, а поле д\
неособое и нерекуррентное. Если эти условия выполняются, то прост-
пространство орбит M/rsj есть гладкое многообразие. Тогда система B2.3)
корректно определена на фактор-многообразии М/~:
Wi GM, q G M/~. B2.7)
Переход от исходной аффинной по управлению системы B2.1) к
нелинейной по управлению редуцированной системе B2.7) уменьшает
размерность пространства состояний и преобразует особые экстрема-
экстремали в регулярные.
Пусть тг : М —>> М/~ есть проекция. Для множества достижи-
достижимости Дз(^) редуцированной системы B2.7) из точки тг(до) включе-
включения B2.4) принимают форму
Ai(t) С тг-^ЛзС*)) ^ d(Ai(t)). B2.8)
Из приведенного выше анализа экстремалей следует, что q(t) есть
экстремальная кривая исходной системы B2.1) тогда и только тогда,
22.2. Управление твердым телом 341
когда ее проекция тг(q(t)) есть экстремальная кривая редуцированной
системы B2.7). Первое включение в B2.8) означает, что если тг(д(т)),
г G [0, ?], геометрически оптимальна, то д(т), г G [0, ?], также геомет-
геометрически оптимальна.
Можно также определить процедуру обратной редукции. Возьмем
управляемую систему
q = f(q,w), qeM, weW1, B2.9)
ограничим ее на липшицевы управления w(-) и добавим интегратор:
q=J{q,w), (q,w)eMxW, иеГ. B2.10)
U) — Uy
Упражнение 22.2. Докажите, что система B2.9) является ре-
редукцией системы B2.10).
Рассмотрим задачу быстродействия для системы, описывающей
вращения твердого тела (см. параграф 19.4):
22.2. Управление твердым телом
ыстродействия для системы, с
см. параграф 19.4):
q = q(a + ub), q G SOC), ueR, B2.11)
где
a,be soC), (a, b) = 0, |b| = 1, а ф 0.
Отметим, что в параграфе 19.4 мы предполагали, что \а\ = 1, а
не |Ь| = 1, как сейчас, однако один случай получается из другого
делением правой части системы на константу.
Редуцируем систему B2.11). Пространство состояний SOC) необ-
необходимо профакторизовать по орбитам qesb, sGl, поля qb. Соответст-
Соответствующее отношение эквивалентности имеет вид
и структура фактор-пространства описана в следующем утверж-
утверждении.
Предложение 22.1. Фактор-пространство SOC)/~ диффео-
морфно сфере S2, причем каноническая проекция есть
q^qfi, gGS0C), CeS2. B2.12)
Здесь /3 G S2 С М3 есть единичный вектор, соответствующий мат-
матрице b G soC):
/3=
Доказательство. Группа SOC) транзитивно действует на
сфере ?2. Подгруппа в SOC), оставляющая точку /3 Е S2 неподвиж:-
342 Гл. 22. Редукция
ной, состоит из вращений вокруг прямой /3, т. е. она равна
ет = {esb\ seR}.
Поэтому фактор SOC)/eR6 = SOC)/~ диффеоморфен 52, проекция
SOC) —>• S2 задается соотношением B2.12), и множества уровня этого
отображения совпадают с орбитами поля qb. ?
Частичная система B2.3) в этом примере имеет вид
q = qewadba, q G SOC), w G M,
а редуцированная система B2.7) есть
jqew*dbaC, qCeS2. B2.13)
Правая часть этой симметричной управляемой системы задает
окружность радиуса \а\ в касательной плоскости (q/3)± = TqpS2.
Иными словами, система B2.13) задает риманову метрику на S2.
Так как векторные поля в правой части системы B2.13) постоянны
по модулю, задача быстродействия эквивалентна римановой задаче
(минимизация времени равносильна минимизации длины, если ско-
скорость постоянна по модулю).
Экстремальные кривые (геодезические) римановой метрики на
S2 — дуги больших окружностей, они оптимальны вплоть до полу-
полуокружностей. Сопряженные точки для исходной и редуцированной
систем одни и те же, поэтому для обеих систем экстремальные кривые
оптимальны вплоть до диаметрально противоположных точек.
22.3. Управление угловой скоростью
Рассмотрим систему, описывающую управление угловой ско-
скоростью вращающегося твердого тела (см. F.19)),
fi = fix C[i-\-ul, ueR, fieR3. B2.14)
Здесь /i — вектор угловой скорости твердого тела в системе координат,
связанной с телом, а / G М3 — единичный вектор в общем положении,
вдоль которого прикладывается момент. Заметим, что в параграфе 6.4
допускался только момент и = ±1, сейчас же момент неограничен.
В параграфе 8.4 было доказано, что система с ограниченным управле-
управлением вполне управляема (даже в шестимерном пространстве). Сейчас
мы покажем, что с неограниченным управлением получается полная
управляемость в М3 за сколь угодно малое время.
Применим процедуру редукции к исходной системе B2.14). Час-
Частичная система теперь имеет вид
fi = ewadl(fi x /3[i) = (fi + wl) x /3(fj, + wl), w G M, fieR3.
Фактор M3 по модулю орбит постоянного поля / может быть реали-
реализован как плоскость М2, проходящая через начало координат и орто-
ортогональная /. Тогда проекция М? —>> М2 есть ортогональная проекция
2.3. Управление угловой скоростью
343
вдоль /, и редуцированная система имеет вид
х = (х + wl) х C{х + u>/) — (ж х /3(ж + к;/), /) /, х Е М2, tuGl.
B2.15)
Введем декартовы координаты в М3, соответствующие ортонорми-
рованному реперу с базисными векторами, коллинеарными векторам
/, / х C1, I х (/ х C1). В этих координатах х = (жх, жг) и редуцированная
система B2.15) принимает форму
J Ж1 = ^13^2 + ((^11 — &3з)ж2 "~ ^23^l)^ "~ ^13^ 5 B2.16)
и, B2.17)
где 6 = F^-) — матрица оператора /3 в выбранном ортонормированном
репере. Прямое вычисление показывает, что 613 < 0 и &22 — Ьц Ф 0.
В полярных координатах (г,(р) в плоскости (х-\_,Х2) редуцированная
система B2.16), B2.17) имеет вид
{г = rF(cos (p, sin (p)w — b^ cos ^ ^25
ф = — 613Г sin (p — A/r) sin (^ к;2 + G(cos <^, sin ^)гу,
где F u G — однородные многочлены степени 2, причем G(±l,0) =
= 622 ~~ Ьц.
Подбирая подходящие управления, молено построить траектории
системы в R следующих двух типов:
A) «спирали», т. е. траектории, начинающиеся и заканчивающиеся
на положительной полуоси х\, не проходящие через начало координат
(г ^ 0) и вращающиеся против часовой
стрелки (ф > 0);
B) «горизонтальные» траектории,
почти параллельные оси х\ (х\ ^> х^).
Более того, по этим траекториям
можно двигаться быстро. Действи-
Действительно, система B2.16), B2.17) имеет
очевидную симметрию — она инвари-
инвариантна относительно замен переменных
х\ \-Л olx\, X2 i-)- ax2, w ь^ aw, 11->- a~xt
(a > 0). Следовательно, существуют
«спирали», сколь угодно далекие от
начала координат, со сколь угодно ма-
малым временем полного оборота вокруг
нуля. Далее, из уравнений B2.16),
Рис. 22.1. Полная управляе-
управляемость системы B2.15)
B2.17) легко видеть, что при больших по модулю управлениях w
получаются сколь угодно быстрые движения вдоль «горизонтальных»
траекторий в положительном направлении оси х\.
Комбинируя движения типов A) и B), можно перевести любую
2 2
точку х G М2 в любую точку
( )
2 за произвольное время е > 0
(рис. 22.1). Мы оставляем подробности этих рассуждений читателю в
качестве упражнения (см. также [42]).
344 Гл. 22. Редукция
Итак, множества достижимости A^(t) редуцированной систе-
системы B2.15) из точки х за время t удовлетворяют свойству
Al(e)=R2 VxEM2, s>0.
В силу цепочки B2.8) множества достижимости A^(t) исходной сис-
системы B2.14) удовлетворяют равенству
le))=R3 VfieR3, e>0.
Так как вектор / находится в общем положении, 3-мерная систе-
система B2.14) имеет полный ранг (см. предложение 6.1), поэтому она
вполне управляема за сколь угодно малое время:
Глава 23
КРИВИЗНА
23.1. Кривизна двумерных систем
Рассмотрим управляемую систему вида
Q = fu(q), 4 ?М, ueU, B3.1)
где
dimM = 2, U = R или U = S1.
Мы предполагаем, что правая часть fu(q) гладко зависит от (щ q).
Хорошо известный пример такой системы дает двумерная риманова
задача: локально эта задача задает управляемую систему
q = cosufi(q) + sinuf2{q), q G M, ueS1,
где /i, /2 — локальный ортонормированный репер римановой струк-
структуры. Мы получим инвариантное относительно обратной связи урав-
уравнение Якоби для управляемой системы B3.1), а также построим глав-
главный инвариант этой системы относительно преобразований обратной
связи — кривизну (в римановом случае этот инвариант совпадает с
гауссовой кривизной). Мы докажем теорему сравнения для сопряжен-
сопряженных точек, аналогичную теоремам сравнения в римановой геометрии.
Будем предполагать, что кривая допустимых скоростей управ-
управляемой системы B3.1) удовлетворяет следующим условиям регуляр-
регулярности:
9ША^Ш1ф^ д€Щ u€U. B3.2)
Условие B3.2) означает, что кривая {fu(o)\ u G U} С TqM сильно вы-
выпукла; из него следует усиленное условие Лежандра для экстремалей
системы B3.1).
Введем линейный на слоях кокасательного расслоения зависящий
от управления гамильтониан
и максимизированный гамильтониан
Н(Х) =max/^(A). B3.3)
Будем предполагать, что Н(Х) определен в рассматриваемой области
в Т* М. Более того, мы предполагаем, что для любого А в этой области
максимум в B3.3) достигается для единственного и G U; это означает,
что любая опорная прямая касается кривой допустимых скоростей в
единственной точке. Тогда из условия выпуклости B3.2) следует, что
346 Гл. 23. Кривизна
Н{Х) является гладким в данной области. Более того, Н однороден
порядка один на слоях, поэтому можно ограничиться изучением по-
поверхности уровня
П = Н~1A) СТ*М.
Обозначим пересечение со слоем через
Яд=ППТ*М;
из условия B3.2) следует, что кривая 7iq сильно выпукла.
23.1.1. Подвижный репер. Построим инвариантный относи-
относительно преобразований обратной связи подвижный репер на 3-мерном
многообразии Ц для того, чтобы записать уравнение Якоби в этом
репере. Отметим, что максимизированный гамильтониан Н инвариан-
инвариантен по обратной связи, так как он зависит от всей кривой допустимых
скоростей Д/(д), но не от ее параметризации управлением и. Поэтому
поверхность уровня % и слой 7iq также инвариантны по обратной
связи.
Начнем строить репер с вертикального поля, касающегося кри-
кривой 7iq. Введем в слое полярные координаты:
р = [г cos <р, г sin if) G T*M.
Тогда 7iq параметризуется углом (р:
Из формулы Эйлера для однородных функций получаем
Р(<р) Л ^)/0. B3.4)
Разложим вторую производную в репере р, ——:
dtp
j^ (<P) = ai(<p)p(<p) + а2(<р) j^ (<p).
Кривая 7iq сильно выпукла, а гамильтониан Н однороден на слое,
поэтому
При замене параметра в = 0{ip) получаем
поэтому существует единственный (с точностью до трансляций и ори-
ориентации) параметр в на кривой %q, для которого
Зафиксируем такой параметр в и определим соответствующее верти-
вертикальное векторное поле на %:
_
23.1. Кривизна двумерных систем 347
В инвариантных терминах v — единственное (с точностью до умно-
умножения на =Ы) вертикальное поле на %, для которого
L2vs = -s + bLvs, B3.5)
где s = pdq — тавтологическая форма на Т*М, суженная на 7i.
Определим подвижный репер на % следующим образом:
Заметим, что эти векторные поля линейно независимы, так как v
вертикально, а другие два поля имеют линейно независимые гори-
горизонтальные составляющие:
~~* д f d и d и
Здесь мы обозначаем через и{6) максимизирующее управление на 7iq:
Дифференцируя тождество
\ '' ди и(в)/ ~
а du , n
по t/, получаем —— ф 0.
аи
Для того чтобы записать уравнение Якоби вдоль экстремали А^,
нам потребуются скобки Ли гамильтонова поля Н с векторными по-
полями репера:
[H,V3]=0.
Вычислим недостающую вторую скобку.
Теорема 23.1. Имеет место равенство
[H,[H,v]] = -kv. B3.6)
Функция к = я;(А), A G ?/, называется кривизной двумерной управ-
управляемой системы B3.1). Гамильтоново поле Н инвариантно по обрат-
обратной связи, а поле v инвариантно по обратной связи с точностью до
умножения на =Ы. Поэтому кривизна к есть инвариант системы B3.1)
относительно преобразований обратной связи.
Докажем теорему 23.1.
Доказательство. Параметр в задает отождествление
П ~ {0} х М, B3.7)
поэтому касательное пространство к % может быть разложено в
прямую сумму горизонтального и вертикального подпространств.
348 Гл. 23. Кривизна
По двойственности, любая дифференциальная форма на % имеет
горизонтальную и вертикальную части. Заметим, что тривиализа-
ция B3.7) неинвариантна по обратной связи, так как выбор сечения
в = 0 произволен, поэтому форма dO и горизонтальность подпрост-
подпространства неинвариантны по обратной связи.
Для краткости обозначим в этом доказательстве через
s = s п
горизонтальную форму на 7i. Обозначим производную Ли:
Lv = Lq/qq =
и рассмотрим следующий корепер на 7i:
de, s, s. B3.8)
Легко видеть, что эти формы линейно независимы: dO вертикальна, а
горизонтальные формы s, s' линейно независимы в силу B3.4). Теперь
построим репер на 7/, двойственный реперу B3.8).
Разложим Н на горизонтальную и вертикальную части:
Н= Y + а^- , a = aF,q). B3.9)
горизонтально ч~*>^*™*/
вертикально
Л. у, Y'=\—Y
Докажем, что поля
составляют репер, двойственный кореперу B3.8). Нужно показать
лишь, что пара горизонтальных полей У, Y' двойственна паре го-
горизонтальных форм s, s1. Во-первых,
(sx, Y) = (sA, Я) = (Л, /„> = Я(А) = 1.
Далее,
Следовательно,
0=(8,YY = (8',Y) + (8,Y'),
т. е.
(з',У)=0.
Наконец,
0=(s',Yy = (s",Y) + {S',Y').
Равенство B3.5) мож:но переписать как sff = — s + bs', поэтому
(8',Y') = -(8",Y)=(8-b8',Y) = l.
23.1. Кривизна двумерных систем 349
Итак, мы доказали, что репер
двойственен кореперу
d0, s,sf el
Для завершения доказательства данной теоремы вычислим скоб-
скобку [Н, [Н, v]] с помощью этих реперов.
Сначала рассмотрим стандартную симплектическую форму
сг\п = d(s\n) = ds = dO A s' + dqs,
где dqs — дифференциал формы s по горизонтальным координатам.
Горизонтальная 2-форма dqs имеет разложение
dqs = csAsf, c = c(#,g),
поэтому
а\п = dO A sf + cs A sf.
Так как
гн а и = ^'
получаем
= as' - {sf, Y)dO + c (s, Y)s' - с {sf\ Y)s = as' + cs' = 0,
т. e. a = — с, поэтому
Теперь вычислим требующуюся скобку Ли:
следовательно,
= (Не1 -Н'с)^-е +[У/,У]+сУ//-с/У//
вертикальная част! горизонтальная часть
Осталось убедиться, что горизонтальная часть скобки Н', i?, ——
L L c/#J J
обращается в нуль.
Из равенства sff = — s + &s; следует, что в силу двойственности
реперов У, Y' и s, s'
У/; = -Y - bY'.
Далее,
ds = dO A s' -\- cs A sf',
350 Гл. 23. Кривизна
d(s') = (ds)f = dOA s" + c's A sf + cs A s" =
= -dO A s - bdO A sf + (c + cb)s A s',
и скобку [Yf, У] молено вычислить, используя двойственность реперов
и предложение 18.1:
Итак, горизонтальная часть поля [Я, [Я, v]] равна
\Y' Y] 4- cY" — c'Y' — cY 4- (с 4- cb)Yf — cY - cbY' - c'Y' — 0
Мы доказали, что
где кривизна вычисляется по формуле
^ = -Не' + Я;с. П
Замечание. Напомним, что вертикальное векторное поле г>,
удовлетворяющее B3.5), единственно с точностью до множителя ±1.
С другой стороны, вертикальное поле г>, удовлетворяющее B3.6),
единственно с точностью до множителя, постоянного вдоль траекто-
траекторий Н (и потому не влияющего на к). Следовательно, для вычисления
кривизны к можно использовать любое векторное поле г>, для кото-
которого выполняется равенство вида B3.6).
Итак, теперь нам известны все скобки гамильтонова векторного
поля X = Н с векторными полями репера Vi, V2, V3:
[Я,У1] = -V2, B3.10)
[H,V2] = kVl, B3.11)
[H,V3]=0. B3.12)
23.1.2. Уравнение Якоби в подвижном репере. Мы исполь-
используем построенный подвижный репер для того, чтобы вывести диф-
дифференциальное уравнение для определения сопряженного времени
нашей двумерной системы — уравнение Якоби в подвижном репере.
Как в гл. 21, рассмотрим уравнение Якоби вдоль регулярной экс-
экстремали А^, t G [0,?1], двумерной системы B3.1):
и его поток
t
Bt = exp / bT dr.
0
Напомним, что По = Т\0(Т*М) — вертикальное подпространство
в Е, a Ct С По — подпространство постоянных вертикальных решений
уравнения Якоби на [0, ?] (см. B1.30)). Пересечение ^П0ПП0 всегда
23.1. Кривизна двумерных систем 351
содержит подпространство Ct- Момент t Е @, ?1] есть сопряженное
время для экстремали Л^ тогда и только тогда, когда это пересечение
больше, чем Ct-
Для того чтобы дополнить репер Vi, V2, V3 до базиса в Т\0(Т*М),
рассмотрим векторное поле, трансверсальное 7/, — вертикальное
эйлерово поле Е Е Vec(T*M), имеющее поток
\oetE = el-\ А Е Г М, teR.
В координатах (р, q) на Т*М это поле имеет вид
Векторные поля Уь У2> ^з, i? образуют базис в Т\(Т*М), X е 7i.
Поля Vi = -7—г и .Б вертикальны:
ас/
no = span(V1(Ao),?(Ao)).
Чтобы найти вертикальное подпространство Ct, вычислим дейст-
действие потока Bt на эти поля. При доказательстве теоремы 21.3 мы
разложили поток уравнения Якоби:
Bt{r,) = (Pt% elS(V).
Поэтому
BtE(X0) = (Р/). efE(X0).
Гамильтониан Н однороден порядка один на слоях, следовательно,
поток Н такж:е однороден:
а поля Н и Е коммутируют. То есть гамильтоново векторное поле Н
сохраняет вертикальное эйлерово поле Е. Далее, поток Р? линеен
на слоях, поэтому он также сохраняет поле Е. Итак, вектор E(\q)
инвариантен относительно потока уравнения Якоби, т. е.
С Ct.
Легко видеть, что это включение — на самом деле равенство.
Действительно, учитывая скобку B3.10), получаем
e*/Vi(Ao) = At о e-*ad%! = At о <ух + tV2 + o(t)) i TXt{T*q{t)M),
поэтому
ВД(Ао)ёПо
при малых t > 0. Это означает, что
352 Гл. 23. Кривизна
Поэтому момент t есть сопряженное время тогда и только тогда, когда
т. е.
efv1(X0)eRV1(Xt),
или, что равносильно,
Ао о e*adi?Vi G М(А0 о Vi). B3.13)
Теперь опишем действие потока произвольного поля на подвиж-
подвижный репер.
Лемма 23.1. Пусть N — гладкое многообразие, dimTV = m, и
пусть векторные поля V\,..., Vm G Vec TV образуют подвижный ре-
репер на N. Возьмем векторное поле X G VecTV. Пусть оператор adX
имеет матрицу А = (а^) в этом репере:
т
(ad X
Тогда матрица T(t) = {jij{t)) оператора etadH в подвижном ре-
репере:
m
et,AX у. = J27ij(t)Vi, 7o-(t) G C°°(N), B3.14)
i=l
является решением следующей задачи Kouiu:
t(t) = T(i)A(t), B3.15)
Г@) = Id, B3.16)
где х
Доказательство. Начальное условие B3.16) очевидно. Для
того чтобы получить матричное уравнение B3.15), продифференци-
продифференцируем тождество B3.14) по t:
т
г=1
и дифференциальное уравнение получено. ?
Учитывая включение B3.13), заключаем, что момент t есть со-
сопряженное время тогда и только тогда, когда коэффициенты разло-
разложения
1=1
23.1. Кривизна двумерных систем 353
удовлетворяют равенствам
По предыдущей лемме матрица T(i) = (p(ij(t)) является решением
задачи Коши B3.15), B3.16) с матрицей
/ 0 nt 0\
A(i) = -1 0 0 , Kt = к(\г)
V О О О/
(см. соотношения меж:ду скобками Ли B3.10)—B3.12)).
Итак, момент t G @, t\} есть сопряженное время тогда и только
тогда, когда решения задач Копей
=о, ыо)=1,
i :?l 73i@) = 0, 732@)= 0,
[732 = Kt73i)
удовлетворяют равенствам
72i(*)=73i(*) = 0-
Но задача Копей для 7зъ 732 имеет только тривиальное решение.
Поэтому для сопряженного времени t получаем линейную неавтоном-
неавтономную систему в переменных (х1,х2) = G21,722)
Xl = ~X2> хг@) = Xl(t) = 0. B3.17)
Х2 = KXl
Мы будем называть систему B3.17), или, что равносильно, диф-
дифференциальное уравнение второго порядка
х + кгх = 0, x@)=x(t) = 0, B3.18)
уравнением Якоби для системы B3.1) в подвижном репере.
Доказано следующее предложение.
Теорема 23.2. Момент t G @, t\] есть сопряженное время для
двумерной системы B3.1) тогда и только тогда, когда граничная
задача B3.18) имеет нетривиальное решение.
Из теоремы сравнения Штурма для дифференциальных уравне-
уравнений второго порядка (см., например, [138]) вытекает следующая тео-
теорема сравнения для сопряженных точек.
Теорема 23.3. A) Если к < С2 для некоторого С > 0 вдоль
экстремали Xt, то на временном отрезке 0, — нет сопряженных
точек. В частности, если к $J 0 вдоль \t, то сопряженных точек
нет.
B) Если к ^ С2 вдоль \t, то на отрезке 0, — есть сопряженная
L G J
точка.
2372 А.А. Аграчев, Ю.Л. Сачков
354 Гл. 23. Кривизна
Характерное поведение экстремальных траекторий двумерной сис-
системы B3.1) в случаях отрицательной и положительной кривизны
изображено на рис. 23.1 и рис. 23.2 соответственно.
Рис. 23.1. Экстремальные траек- Рис. 23.2. Экстремальные траек-
траектории: к < 0 тории: к, > О
Пример 23.1. Рассмотрим управляемую систему, соответствую-
соответствующую римановой задаче на 2-мерном многообразии М:
q = cosufi(q) + sinuf2{q), q G M, ueS1,
где /i, /2 — ортонормированный репер римановой структуры (•,•):
(fufj) = 5ij, ij = 1,2.
В этом случае к есть гауссова кривизна риманова многообразия М,
вычисляемая следующим образом:
« = -С1 - С2 + ЛС2 - /2С1,
где q — структурные константы репера Д, Д:
[/ь/2] = ci/i +С2/2.
(Мы докажем эту формулу для к в гл. 24.)
Для римановой задачи кривизна к = K,(q) зависит только от точки
на базе q G М, но не от координаты в в слое. Вообще говоря, это не
так: кривизна есть функция от (д, в) G И.
Условия оптимальности в терминах сопряженных точек, получен-
полученные в гл. 21, могут быть легко применены к рассматриваемой двумер-
двумерной системе B3.1).
Предположим сначала, что tc G @, ?1) есть сопряженное время
для экстремали Л^, t G [0,?1], системы B3.1). Проверим выполнение
условий предложения 21.2. Из условия B3.2) следует, что экстремаль
регулярна. Соответствующее управление и имеет коранг один, так
как множитель Лагранжа А^ однозначно определяется из принципа
максимума (с точностью до скалярного множителя). Далее, уравне-
уравнение Якоби не может иметь решений вида B1.28): если бы это было
так, то уравнение Якоби в подвижном репере х + к^х = 0 имело бы
23.2. Кривизна трехмерных аффинных по управлению систем 355
нетривиальное решение с граничными условиями x(tc) = x(tc) = 0,
что невозможно. Итак, экстремаль Л^ удовлетворяет условиям пред-
предложения 21.2, и альтернатива A) этого предложения не реализуется.
Поэтому соответствующая экстремальная траектория не является ло-
локально геометрически оптимальной.
Если отрезок [0, t±] не содержит сопряженных точек, то по тео-
теореме 21.4 соответствующая экстремальная траектория оптимальна
по быстродействию по сравнению со всеми другими допустимыми
траекториями, достаточно близкими в М.
23.2. Кривизна трехмерных аффинных по управлению
систем
В этом параграфе мы рассмотрим аффинные по управлению трех-
трехмерные системы:
я = /о(<?) + M/i(g), ueR, g e м, B3.19)
dimM = 3.
Мы редуцируем такую систему к двумерной, как в гл. 22, и вычис-
вычислим кривизну полученной двумерной системы — инвариант систе-
системы B3.19) по обратной связи.
Мы предполагаем, что выполнены следующие условия регулярнос-
регулярности на М:
/о Л Л Л [/о,/i]/0, B3.20)
/iA[/o,/i]A[/b[/o,/i]]/0. B3.21)
Любая экстремаль А^ аффинной по управлению системы B3.19)
вполне особая, она удовлетворяет равенству
fti(At) = (At,/i> = 0, B3.22)
и соответствующее экстремальное управление нельзя найти непос-
непосредственно из этого равенства. Дифференцирование B3.22) по t дает
Еще одно дифференцирование приводит к равенству, содержащему
управление:
hooi(At) + u(t)hwl(Xt) = (Xt, [/о, [/о, /i]]> + u(t)(Xu [/ь [/о, /i]]> = 0.
Тогда особое управление определяется однозначно:
Применим к системе B3.19) преобразование обратной связи:
и \-> и — u(q).
Это преобразование влияет на поле /о, но сохраняет условия регуляр-
регулярности B3.20), B3.21). После этого преобразования особое управление
равно
и = 0.
2372*
356 Гл. 23. Кривизна
Тогда имеет место импликация
A/i = А[/о, Д] = 0 =* А[/о, [/0, Л]] = 0.
Поэтому будем считать далее, что
[/о, [/о, Л]] e span(/b [/о, /i]). B3.23)
В трубчатой окрестности траектории поля /0 рассмотрим редук-
редукцию трехмерной системы B3.19)
^f = e^ad/1^^j we{-e,e), qeM = M/eR/l, B3.24)
для достаточно малого ?.
Эта система имеет те же сопряженные точки, что и исходная сис-
система B3.19). Если система B3.24) не имеет сопряженных точек, то
соответствующая особая траектория системы B3.19) геометрически
сильно оптимальна, т. е. локально приходит на границу множества
достижимости.
Опишем кокасательное расслоение фактора М. Касательное
пространство к М состоит из касательных векторов к М по модулю Д:
TqM~TqM/Rfi(q), B3.25)
qeM, q = qo eRfl G M,
отождествление B3.25) задается отображением
v ь-» v, v G TqM, v G TqM,
d
v=Tt
t=o
t=0
Поэтому кокасательное пространство к М состоит из ковекторов
на Af, ортогональных Д:
|д =0},
Л ^ Л, Л G T*M n{fti =0}, Л G Г|М,
(Л, ?) = (Л, v), v G TgM, ? G TgM.
Учитывая, что поле Д есть проекция гамильтонова поля hi, легко
видеть, что
Т*М-{/г1=О}/емЯ1,
где отображ:ение Л Н> Л определено выше (упражнение: покажите, что
\г = \2 <^ \2 g Ai о е^11). Итак, кокасательное расслоение факто-
фактора М получается из Т*М с помощью гамильтоновой редукции по /ii,
т. е. с помощью ограничения на поверхность уровня гамильтониана hi
с последующей факторизацией по действию потока hi.
Далее, из условия регулярности B3.21) следует, что поле hi транс-
версально поверхности уровня {hi = /iqi = 0}, и эта поверхность
23.2. Кривизна трехмерных аффинных по управлению систем 357
уровня дает еще одну реализацию кокасательного расслоения фак-
фактора: __
Т*М ~ {/ц = hOi = 0}.
В этой реализации ho есть гамильтоново поле, соответствующее мак-
максимизированному гамильтониану — генератору экстремалей (Н в па-
параграфе 23.1). Поверхность уровня максимизированного гамильтони-
гамильтониана G1 в параграфе 23.1) реализуется как подмногообразие
{hx = h01 = 0, /г0 = 1} С Т*М.
С помощью канонической проекции тт: Т* М —>> М это подмногооб-
подмногообразие можно отождествить с М, поэтому поверхность уровня % из
параграфа 23.1 реализуется сейчас как М. Мы используем эту реа-
реализацию, чтобы вычислить кривизну трехмерной системы B3.19) как
кривизну к ее двумерной редукции B3.24).
Гамильтоново поле Н из параграфа 23.1 теперь равно /о, a Д
есть вертикальное поле. Остается нормировать Д, т.е. найти такое
вертикальное поле аД, a G С°°(М), что
[/o,[/o,a/i]] = -«a/i B3.26)
(см. B3.6)). Тройка
/О, /l, /2 = [/о, Л]
образует подвижный репер на М. Рассмотрим структурные констан-
константы этого репера:
2
[Л.Л-] = ХLЛ' »,j = 0,1,2.
fe=0
Заметим, что включение B3.23), полученное после предварительного
преобразования обратной связи, теперь записывается как Cq2 = 0. По-
Поэтому
[/о, [/о, /i]] = -cJ2/i - сУ/о, /i].
Теперь можно найти такой нормирующий фактор а для Д, чтобы
выполнялось равенство B3.26). Получаем
= (/02а)Д + 2(/оа)[/о, Д] + а[/0, [/о, Д]] =
= (/оа - cj2a)/i + B/оа - с^)[/0, Д].
Теперь искомая функция а находится из первого уравнения в частных
производных
2/оа - cl2a = 0,
и можно вычислить кривизну:
_ /о а - с
358 Гл. 23. Кривизна
Итак, кривизна аффинной по управлению трехмерной систе-
системы B3.19) выражается через структурные константы как функция
на пространстве состояний М:
1 1 / 2 \2
К = С02 "" J \C02J "" 2
Оценки кривизны к; вдоль (необходимо особой) экстремали трех-
трехмерной аффинной по управлению системы позволяют получать оцен-
оценки сопряженного времени, а потому и отрезков, на которых экстре-
экстремаль локально оптимальна. Действительно, по построению к есть
кривизна редуцированной двумерной системы. Как известно из гл. 22,
редукция переводит особые экстремали в регулярные, а исходная и
редуцированная системы имеют одно и то же сопряженное время.
Поэтому посредством редукции можно применить теорему 23.3 к ис-
исследованию оптимальности особых экстремалей трехмерных аффин-
аффинных по управлению систем.
Глава 24
КАЧЕНИЕ ТЕЛ
В этой главе мы применим теорему об орбите и принцип максиму-
максимума Понтрягина к инвариантной геометрической модели качения пары
твердых тел. Будет решена задача управляемости, в частности, мы
покажем, что система вполне управляема тогда и только тогда, когда
тела не изометричны. Мы поставим задачу оптимального управления
и изучим ее экстремали.
24.1. Геометрическая модель
Рассмотрим два твердых тела в трехмерном пространстве, катя-
катящихся одно по другому без проскальзывания и
прокручивания, рис. 24.1.
Вместо вложения задачи в М3, рассмотрим
инвариантную геометрическую модель этой
системы.
Пусть М и М суть двумерные связные мно-
многообразия — поверхности катящихся тел. Для
того чтобы измерять длины кривых на М и М,
будем считать, что каждое из этих многообра-
многообразий риманово, т. е. имеет риманову структу-
структуру — скалярное произведение в касательных
пространствах, гладко зависящее от точки мно-
многообразия:
(vuv2)m, Щ € ТХМ,
М
м
Рис. 24.1. Катящие-
Более того, мы предполагаем, что М и М ориентированы (по-
(поверхности твердых тел в М3 ориентированы вектором внешней нор-
нормали) .
В точках контакта тел х G М и х G М их касательные пространст-
пространства отождествляются с помощью изометрии (т. е. линейного отображе-
отображения, сохраняющего римановы структуры)
q: TXM^TSM
(рис. 24.2).
Мы имеем дело только с сохраняющими ориентацию изометриями
и далее будем опускать слова «сохраняющие ориентацию» для упро-
упрощения языка. Изометрия q есть состояние системы, и пространство
состояний есть связное 5-мерное многообразие
Q = {q: ТХМ
х G M, x G M, q изометрия}.
360
Гл. 24- Качение тел
М
м
Рис. 24.2. Отождествление касательных пространств в точке контакта
Обозначим проекции из Q на М и М:
ir{q)=x, ir{q)=x, q: TXM -^TSM,
qeQ, х е М, х ем.
Локальные координаты на Q можно ввести следующим образом.
Выберем произвольные локальные ортонормированные реперы ei, e<i
наМи?!, ?2 на М:
{ei,ej)M = Sij, {euej)j^ = 5{j, i,j = 1,2.
Для любой конфигурации тел q G Q, обозначим через в угол поворота
от репера ei, ?2 K реперу gei, ge2 в точке контакта:
gei = cos# e\ + sin^ e2,
дв2 = — sin в ei + cos 0 ег •
Тогда локально точки q ? Q параметризуются тройками (ж, ж, 0), ж =
= тг(д) G М, ж = тг(д) G М, 6 ? S1. Выбирая локальные координа-
координаты (жх,Ж2) на М и (ж!,Ж2) на М, получаем локальные координа-
координаты (ж1,Ж2,Ж1,Ж2,0) на Q.
Пусть q(t) E Q есть кривая, соответствующая двилсению катящих-
катящихся тел. Тогда x(t) = тг(q(t)) и ж(^) = тг(q(t)) суть траектории точек
контакта в М и М соответственно. Условие отсутствия проскальзы-
проскальзывания означает, что
q(t)x(t) = Щ, B4.1)
а условие отсутствия прокручивания геометрически формулируется
следующим образом:
q(t)(векторное поле, параллельное вдоль x(t)) =
= (векторное поле, параллельное вдоль x(t)). B4.2)
Наша модель игнорирует ограничения состояния, соответствую-
соответствующие допустимости контакта тел, вложенных в М3. Впрочем, заметим,
что если поверхности МиМ имеют соответственно положительную и
неотрицательную гауссовы кривизны в точке, то их контакт локально
допустим.
24-2. Двумерная риманова геометрия 361
Из условий допустимости B4.1) и B4.2) следует, что кривая x(t) G
G М однозначно определяет все движение q{t) G Q. То есть скорос-
скорости допустимых движений определяют распределение А ранга 2 в
5-мерном пространстве Q. Мы покажем это формально и вычислим
распределение А явно ниже. Перед этим напомним некоторые началь-
начальные сведения из римановой геометрии.
24.2. Двумерная риманова геометрия
Пусть М — двумерное риманово многообразие. Мы опишем рима-
новы геодезические, связность Леви—Чивита и параллельный перенос
на Т*М ~ ТМ.
Пусть (•, •) — риманова структура и ei, e<2 — ортонормированный
репер на М.
24.2.1. Римановы геодезические. Для произвольных точек
х$,х\ G М будем искать кратчайшую кривую в М, соединяющую ж о
И Х\\
х = mei(x) + г^2е2(ж), х G M, (ui,u2) G М2,
х@) = ж0, х(^) = жь
/ = f(x, x}1/2 dt = f[u\ + ^
[\ + ^) min.
о о
Так ж:е, как в параграфе 19.1, из принципа максимума легко сле-
следует, что параметризованные длиной дуги экстремальные траектории
в этой задаче (римановы геодезические) являются проекциями траек-
траекторий нормального гамильтонова поля:
x(t) = тг о etS(X), \еП = {Н = 1/2} С Т*М,
hi(X) = (A,e^), г = 1,2.
Поверхность уровня % есть сферические расслоение над М со слоем
Пд = {hj + h22 = 1} П T*M ~ 51,
параметризованным углом (р:
Кокасательное расслоение риманова многообразия отождествля-
отождествляется с касательным расслоением благодаря римановой структуре:
ТМ ~ Г*М,
v \-> X = (г;, •).
Тогда И С Т*М отож:дествляется со сферическим расслоением
? = {?; gTM| \\v\\ = 1} СГМ
24 А.А. Аграчев, Ю.Л. Сачков
362 Гл. 24- Качение тел
единичных касательных векторов к М. После этого отождествления
можно рассматривать etH как геодезический поток на S.
24.2.2. Связность Леви—Чивита. Связностью на сферическом
расслоении S —>> М называется произвольное горизонтальное распре-
распределение D:
D = {DV CTVS\ v G<S},
dv e tv(sx) = tvs, sx = sn txm.
Любая связность D на М задает параллельный перенос единич-
единичных касательных векторов вдоль кривых на М. Пусть x(t), t G [0,?i],
есть кривая в М, и пусть vq G Тх^М есть единичный касательный
вектор. Кривая x(t) имеет единственный горизонтальный лифт на S
с началом в vq:
v(t) eS, 7rov(t) = x(t),
v(t) G Dv{;t),
v{0) = Не-
Недействительно, если кривая x(t) удовлетворяет неавтономному
дифференциальному уравнению
х = ui(t) ei(x) + u2(t) е2(ж),
то его горизонтальный лифт v(t) есть рептение поднятого уравнения
« = ui(tN(«) + «2(*N(«), B4.3)
где & — горизонтальные лифты базисных полей е^:
Dv = span(^i(v),^2(v)), тг*& = е».
Заметим, что репгения уравнения B4.3) продолж:аются на весь
временной отрезок [0, ?i], так как слои Sx компактны. Вектор v(ti)
есть параллельный перенос вектора vq вдоль кривой x(t).
Векторное поле v(i) вдоль кривой x(i) называется параллельным,
если оно сохраняется параллельными переносами вдоль x(t).
Связность Леви-Чивита есть единственная связность на сфери-
сферическом расслоении S —>• М, удовлетворяющая свойствам:
1) скорость любой римановой геодезической параллельна вдоль
геодезической (т.е. геодезическое поле Н горизонтально);
2) параллельные переносы сохраняют угол, т. е. горизонтальные
лифты векторных полей на базе М коммутируют с векторным по-
д ,
лем -—, определяющим элемент длины (или, что эквивалентно, эле-
о (р
мент угла) в слое Sx.
Вычислим связность Леви—Чивита как горизонтальное распреде-
распределение на Ц — S. В гл. 23 был построен инвариантный относительно
обратной связи репер на многообразии %:
24-2. Двумерная риманова геометрия 363
Можно показать, что
с2-|-), B4.4)
+ с2^-\ B4.5)
где Ci — структурные константы ортонормированного репера на М:
[ei, е2] = ciei + с2е2, Ci e С
Действительно, составляющая поля Я = /24/2,1 + /2,2/2-2 в касатель-
касательном пространстве многообразия М равна h\e\ + /1262- Чтобы найти
составляющую поля Я в слое, вычислим производные Hhi двумя
разными способами:
= -h2(H(p).
Аналогично,
поэтому
Следовательно,
и равенство B4.4) доказано. Отсюда равенство B4.5) получается непо-
непосредственным дифференцированием.
Заметим, что с помощью разложений B4.4), B4.5) можно легко
вычислить гауссову кривизну к риманова многообразия М по форму-
формуле теоремы 23.1:
+ /г2е2 + (ci/ii + с2/г2) tj—
Так как
[Я,Я'] = (с? + С2 - elC2 !^
получаем
fc = -c?-cl + eic2-e2ci. B4.6)
Свойства 1) и 2) горизонтального распределения D на?{, задаю-
задающего связность Леви-Чивита, означают, что Н G D и е* ^D = D,
поэтому
7-. г sd/д (р t
D = spanje* ; ^
Так как
ef /д*Н = h1(<p- s)(ei + ci |^) + A2(V - s
(e2 + c2 |-),
24*
364 Гл. 24- Качение тел
получаем
1-форма связности D
имеет вид
uj = C\UJ\ + с2а;2 — d(p,
где (cji,^) — двойственный корепер к (ei,e2):
^ (^,е^) = % г, j = 1, 2.
24.3. Допустимые скорости
Вернемся к задаче о качении тел и запишем условия допустимос-
допустимости B4.1), B4.2) для кривой q(t) G Q как ограничения на скорость q(t).
Разложим скорости кривых контакта в М и М в ортонормированных
реперах:
х = а\ е\{х) + а2 е2(ж), B4.7)
ж = ai ei(x) + а2 е^ж). B4.8)
Тогда условие непроскальзывания B4.1) принимает форму
Si = a\ cos 0 — п2 sin#, ci2 = cii sin 6 + CL2 cos 6. B4.9)
Рассмотрим условие непрокручивания B4.2). Обозначим струк-
структурные константы в реперах:
[еье2] = ciei + c2e2, c{ G С
еье2] = ciei + c2e2, q G
Пусть q: T*M —>> Т|М есть отображение, индуцированное изомет-
рией g благодаря отождествлению касательных и кокасательных
пространств:
q ио\ = cos в ио\ + sin # 22,
g о;2 = — sin # cDi + cos в cD2.
В кокасательном расслоении условие непрокручивания означает, что
если
есть параллельное ковекторное поле вдоль кривой x(t) G М, то
есть параллельное ковекторное поле вдоль кривой x(t) G М.
В силу того, что изометрия q{t) поворачивает касательные прост-
пространства на угол e(t), отображ:ение q(t) поворачивает кокасательные
пространства на тот ж:е угол: (p(f) = <p{t) + 0{t), поэтому
9{t) = Ш - <p{t). B4.10)
24-4- Управляемость 365
Ковекторное поле X(t) параллельно вдоль кривой на базе x(t) тогда и
только тогда, когда Л G Кего;, т.е.
ф = {C\UJ\ + С20;2, Х) = С\п\ + С2п2.
Аналогично, А(?) параллельно вдоль x(t) тогда и только тогда, когда
(р = (с\ Si + с2 о?2, ж) = с\ ai + ?2 a2 =
= ai(ci cos# + C2 sin#) + a2(—ci sin# + ?2 cos#).
В силу равенства B4.10), условие непрокручивания принимает форму
в = ciai + C2S2 - (ciai + c2a2) =
= ai(—ci + ci cos^ + C2 sin^) + a2(—c2 — ci sin^ + C2 cos^). B4.11)
Итак, условия допустимости B4.1) и B4.2) для катящихся тел оп-
определяют ограничения B4.9) и B4.11) вдоль кривых контакта B4.7),
B4.8), т.е. распределение ранга два А на Q, порожденное локально
векторными полями
Хх = ei +cos#ei +sin6>?2 + (-ci + ci cos 6> + ?2 sin 6>) —-, B4.12)
о 0
X2 = e2 — sin^?i + cos0e2 + (—c2 — ci sin^ + C2 cos^) —. B4.13)
С/ б'
Допустимые движения катящихся тел суть траектории управляемой
системы
q = u1X1(q) + u2X2(q), q G Q, ifci,iz2GM. B4.14)
24.4. Управляемость
Обозначим гауссовы кривизны римановых многообразий М и М
соответственно через к и к. Поднимем эти кривизны с М и М на Q:
k(q) = k(n(q)), k(q) = к(Цд)), q E Q.
Теорема 24.1. A) Множество достижимости О систе-
системы B4.14) из точки q G Q есть гладкое погруженное связное
подмногообразие в Q размерности 2 или 5. А именно:
(k-k)\o = 0 => dimO = 2,
(fc-fc)lo^O => dimO = 5.
B) Существует инъективное соответствие между изометрия-
ми г: М —>• М и 2-мерными множествами достижимости О систе-
системы B4.14). В частности, если многообразия М и М изометричны,
то система B4.14) не является вполне управляемой.
C) Предположим, что оба многообразия М и М полны и односвяз-
ны. Тогда соответствие между изометриями г: М —>• М и 2-мер-
2-мерными множествами достижимости О системы B4.14) биективно.
366 Гл. 24- Качение тел
В частности, система B4.14) вполне управляема тогда и только
тогда, когда многообразия М и М неизометричны.
Доказательство. A) По теореме об орбите множество дос-
достижимости симметричной системы B4.14), т.е. орбита распределе-
распределения А, проходящая через произвольную точку q G Q, есть гладкое
погруженное подмногообразие в Q. Покажем, что любая орбита О
распределения А 5-мерна или 2-мерна.
Зафиксируем любую орбиту О и предположим сначала, что су-
существует точка q G О, в которой многообразия М и М имеют разные
гауссовы кривизны: k(q) ф k(q). Для того чтобы построить репер на Q,
вычислим повторные скобки Ли полей Х\, Х2:
Х3 = [ХиХ2] = схХх + с2Х2 + (k-k) JL, B4.15)
Х4 = [Х1,Хз] =
= (Х1с1)Х1 + (Х1С2)Х2 + с2Х3 + {Хг{к - к)) ^ + {к - к) [хи |^],
B4.16)
= (Х2с1)Х1 + (Х2с2)Х2 - ClX3 + (Х2(к -k))^ + (k-k)\
B4.17)
B4.18)
— = cos в е± + cos 0 е2 + (...)—. B4.19)
При вычислении скобки B4.15) было использовано выраже-
выражение B4.6) гауссовой кривизны через структурные константы. Легко
видеть, что
Lie(Xb X2)(q) = span (ХЪХ2, Х3, Х4, Х5) (q) =
Система B4.14) имеет полный ранг в точке q G О, где к ф к, поэто-
поэтому dim О = 5.
С другой стороны, если k(q) = k(q) во всех точках q G О, то в силу
равенства B4.15) распределение А интегрируемо, поэтому dim О = 2.
B) Пусть г: М —>> М есть изометрия. Ее график
Г = {q G Q\ q = i*x: TXM -+ TSM, x G M, ж = г(ж) G M}
есть гладкое двумерное подмногообразие в Q. Докажем, что Г —
орбита А. Локально выберем ортонормированный репер ei, e2 в М и
возьмем соответствующий ортонормированный репер ei = i*ei, ^2 =
= г*е2 в М. Тогда ^|г = 0. Так как ci = ci, ?2 = с2 и fc(g) = /c(g), то
24-4- Управляемость 367
ограничения полей Х\, Х2 имеют вид
-X"i|r = ei + ei, Х2|г = е2 + е2.
Поэтому поля Х\, X2 касаются Г. Из скобки Ли B4.15) получаем
поэтому Г есть орбита А. Разные изометрии %\ф i<i имеют разные гра-
графики Fi ф Г2, т.е. соответствие между изометриями и двумерными
орбитами инъективно.
C) Теперь предположим, что многообразия М и М полны и одно-
связны. Пусть О — двумерная орбита А. Построим изометрию г: М —>•
4Мс графиком О.
Заметим прежде всего, что для любой липшицевой кривой x(t) G
G M, t G [0,^i], и любой точки qo ? Q существует такая траекто-
траектория q(t) системы B4.14), что 7r(q(t)) = x(t) и q@) = go- Действитель-
Действительно, липшицева кривая ж(?), ? G [0, ^i], есть траектория неавтономного
дифференциального уравнения х = ui(t)ei(x) + ?12(?)е2(ж) для неко-
некоторых щ G Ь^О^х]. Поднимем эти уравнения на Q:
q = тфХ^д) + u2(t)X2(q), g@) = q0. B4.20)
Покажем, что решение этой задачи Копей определено на всем от-
отрезке [0,?i]. Обозначим через R риманову длину кривой ж(?), а через
B(xo,2R) С М замкнутый риманов шар радиуса 2R с центром xq.
Кривая x(t) содержится в B(xq, 2R) и не пересекается с его границей.
Заметим, что шар B(xo,2R) есть замкнутое ограниченное подмно-
подмножество полного пространства М, поэтому он компактен. Проекция
x(t) G М максимального решения q(t) задачи Коши B4.20) имеет
риманову длину не больше R, поэтому она содержится в компакте
B(xo,2R) С М, хо = 7г(#о)> и не пересекается с его границей. Итак,
максимальное рептение q(t) задачи B4.20) содерж:ится в компакте К =
= B(xo,2R) х B(xo,2R) x S1 и не выходит на его границу. Поэтому
максимальное решение q(t) определено на всем отрезке [0,?i].
Теперь легко видеть, что тг(О) = М для двумерной орбиты О.
Действительно, пусть qo Е О; тогда xq = тг(до) ? 7Г(^)- Возьмем любую
точку х\ G М и соединим ее с хо липшицевой кривой x(i), t G [0,^i].
Пусть q(t) есть подъем кривой x(t) на орбиту О с начальным условием
q@) = q0. Тогда g(*i) G О и хх = 7r(g(^i)) G тг(О). Поэтому тг(О) = М.
Аналогично, тг(О) = М.
Проекции
тг: О -^ М, тг: О ->> М B4.21)
суть локальные диффеоморфизмы, так как
тг*(Х2) = e2, tt*(^2) = -sin^ ei
Более того, можно показать, что проекции B4.21) суть глобальные
диффеоморфизмы. Действительно, пусть q G О. Любая липшицева
368 Гл. 24- Качение тел
кривая ж(-) на Af, выходящая из тг(д), имеет единственный лифт
на О, выходящий из д, причем этот лифт непрерывно зависит от ж(-).
Предположим, что q' G О, g' ^ g, тг(д') = тг(д), а #(•) — кривая на О,
соединяющая q с qf. Стягивая замкнутую кривую тг (#(•)) и рассмат-
рассматривая ее лифт на О, получаем противоречие с локальной обрати-
обратимостью тг|о- Поэтому тг|о глобально обратимо, следовательно, это —
глобальный диффеоморфизм. То лее самое справедливо для Що-
Поэтому можно определить диффеоморфизм
г = тг о (vrlo): М —» М.
Так как
отобралсение г есть изометрия.
Если многообразия М и М неизометричны, то все множества
достижимости системы B4.14) 5-мерны, следовательно, это открытые
подмножества в Q. Но многообразие Q связно, поэтому оно совпадает
с единственной орбитой. ?
24.5. Задача минимизации длины
24.5.1. Постановка задачи. Предположим, что к(х) ф к(х) для
любых х G М, х G М, т. е. к — к ф 0 на Q. Тогда в силу пункта A)
теоремы 24.1 система B4.14) вполне управляема. Рассмотрим следую-
следующую задачу оптимизации: для любых двух заданных конфигураций
контакта системы твердых тел найти допустимое движение, перево-
переводящее первую конфигурацию во вторую, и такую, чтобы траектория
точки контакта в М (или, что эквивалентно, в М) была кратчайшей.
Эту геометрическую задачу можно сформулировать как задачу опти-
оптимального управления:
q = UlX1 + u2X2, qeQ, u = (uuu2) GM2, B4.22)
(?@) = Qo, q(ti) = (Zi, t\ закреплено,
t±
I = j{u\ + u22I/2 dt -+ min.
о
Отметим, что проекции уравнений B4.22) на М и М имеют соот-
соответственно вид
х = и\е\ + ^2^2, х G М,
х = ^i(cos6^?i + smOd2) + u2(— sin6>?i + cos6e2), x G M,
поэтому субриманова длина / кривой q(t) равна римановой длине
каждой из кривых x(t) и x(t).
24-5. Задача минимизации длины 369
Как обычно, заменяем длину / функционалом действия
J = - / (и\ + и\) dt —>• min,
о
и ограничимся кривыми постоянной скорости:
и\ + и\ = const / 0.
24.5.2. Принцип максимума. Как показано при доказательст-
доказательстве теоремы 24.1, векторные поля Xl,...,X5 образуют репер на Q
(см. B4.15)-B4.17)). Обозначим соответствующие линейные на слоях
в T*Q гамильтонианы:
gi(fi) = (/1, Х{), fi е T*Q, i = 1,..., 5.
Тогда гамильтониан принципа максимума имеет вид
9и{») = ^ШЫ + ^2^2Ы + | (и? + и\),
а соответствующая гамильтонова система записывается как
/х = ?Wi(/i) + W2(/x), /x G T*Q. B4.23)
24.5.3. Анормальные экстремали. Пусть v = 0. Из условия
максимума ПМП следует, что
= 0 B4.24)
вдоль анормальных экстремалей. Дифференцируя эти равенства в
силу гамильтоновой системы B4.23), получаем еще одно тождество:
= 0. B4.25)
Еще одно дифференцирование в силу B4.23) дает равенство, содер-
содержащее управления:
Ul{t)g4(fit) + u2(t)g5{fit) = 0. B4.26)
Естественно ожидать, что условия B4.23)-B4.26) на анормальные
экстремали в Q должны проецироваться в некоторые естественные
геометрические условия на М и М. Это действительно так, и сейчас
мы выведем дифференциальные уравнения для проекций анормаль-
анормальных экстремалей на М и М.
В соответствии с разложением касательных пространств
TqQ = ТХМ 0 TSM
получаем разложение кокасательных пространств
T*Q = Т*М ф TiM ф TJS1,
(i?T*Q, XeT*M, A G Т|М, айв
370 Гл. 24- Качение тел
Тогда
gi(/i) = (/i,Xi) = (А +A + ad0, ei + cos0ei + sin0e*2
\
= fti (Л) + cos 0 fti (A) + sin 0 h2 (A) + abi, B4.27)
#2(aO = (ц,Х2) = ( A + A + adO, e2 - sin0e"i + cos 0 e^ + ^2^-^ ) =
= h2 (A) - sin в fti (A) + cos (9 ft2 (A) + ab2, B4.28)
где bi = —ci + ci cos в -\-d2 sin 0, 62 = —C2 — ci sin в -\-д2 cos 0;
^3(/i) = </i,X3> = (A + A + ad0, сгХг +c2X2 + (* - fc)|
= Cl^(/i) + c2^2(/x) + a(k - k). B4.29)
Тогда тождества B4.24) и B4.25) принимают форму
а = 0,
/ii + cos 0 /11 + sin 6 h2 = 0,
h2 — sin 0 /11 + cos 6 h2 = 0.
При этих условиях, принимая во внимание равенства B4.16)-B4.19),
получаем
Л, {Х1с1)Х1 + (Х2с2)Х2 + с2Х3 +
+ {Хг{к -к))^ + (к- к) [Хг, |
= (к — k)(sin6 hi — cos 0 h2) = (к — k)h2,
= (A + A, (^d)^! + (X2c2)X2 - ClX3 +
+ (X2(k -k))^ + (k- k) [X2, |^] } =
= (k — k)(cos6 hi + sin 0/12) = —(fc —
Тогда из тождества B4.26) следует, что
— u2hi = 0.
Поэтому с точностью до перепараметризации времени анормальные
управления удовлетворяют следующим равенствам:
щ =fti(A), u2 = h2{\). B4.30)
Для того чтобы записать проекции гамильтоновой системы B4.23)
на Т* М и Т*М, разложим гамильтоновы поля gi, g2. Учитывая pa-
24-5. Задача минимизации длины 371
венства B4.27), B4.28), получаем
~9\ — hi + cos 0 hi + sin 0 h2 + (— sin в hi + cos # /12)$ + aai +
= h2 — sin 0 hi -\- cos # /12 + (— cos 0 hi — sin # /12)$ + aa2 + a2c?.
Отсюда легко следует, что в = — ——. Так как а = 0 вдоль анормаль-
о а
ных экстремалей, проекция на Т*М системы B4.23) с управления-
управлениями B4.30) имеет вид
А = hihi + h2h2 = Я, Н = -(hj + h22).
Следовательно, проекции x(t) = тг(q(t)) суть римановы геодезические
на М.
Аналогично, для проекций на М получаем равенства
ui = — cos в hi — sin в h2, г^2 = sin в hi — cos 0 /12,
поэтому
A = (— cos в hi — sin 0 h2) (cos 0 hi -\- sin 0 /12) +
+ (sin в hi — cos 0 /12) (— sin в hi + cos 0 /12) = —/&i /&i — h2h2 = —H,
H=\{h21+hl),
т. е. проекции x(t) = тг(q(t)) суть геодезические в Af.
Доказано следующее утверждение.
Предложение 24.1. Проекции анормальных экстремальных
кривых x(t) = 7r(q(t)) и x(t) = 7r(q(t)) суть римановы геодезические
соответственно в М и М.
Анормальные субримановы геодезические q(t) оптимальны на от-
отрезках [0,г], на которых хотя бы одна из римановых геодезичес-
геодезических x(i), x(i) является минималью длины. В частности, малые дуги
анормальных геодезических q(t) оптимальны.
24.5.4. Нормальные экстремали. Пусть v = — 1. Нормаль-
Нормальные экстремальные управления определяются из условия максимума
ПМП:
ui = 01, и2 = д2,
и нормальные экстремали суть траектории гамильтоновой системы
Ф Ц е T*Q, B4.31)
Максимизированный гамильтониан G гладок, поэтому малые дуги
нормальных экстремальных траекторий оптимальны.
Рассмотрим случай, когда одна из катящихся поверхностей есть
плоскость: М = М2. В этом случае нормальная гамильтонова систе-
372
Гл. 24- Качение тел
ма B4.31) упрощается. Выберем следующий репер на Q:
Y1=X1, Y2=X2, Y3 = ^, Y4 = [Yt,Y3], Y5 = [Y2,Y3],
и введем соответствующие линейные на слоях гамильтонианы
rrii(ij) = (fi,Yi), i = 1,...,5.
Учитывая, что ci = C2 = к = 0, вычислим скобки Ли в этом репере:
\Yi,Y2] = ClY! + C2Y2 - kY3,
[Y±, У4] = -ClY5, [Y2, У4] = -c2Y5,
\Y1,Y5]=c1Y4, [У2,У5]=с2У4.
Тогда нормальная гамильтонова система B4.31) записывается сле-
следующим образом:
- пц = -т2{с1т1 + с2ш2 - А;ш3),
Ш2 = 772i (CiTTli + С27712 — ^771з),
777.3 = 777,1777,4 + 777,2777,5,
777.4 = — (Cl77li + С2 777,2O77,5,
777.5 = (ciTTli + C2 777,2) 777,4,
k g = 777,1X1 + 777,2X2.
Отметим, что кроме гамильтониана G= -G77,^ + 777,2), эта сис~
тема имеет еще один интеграл:
Введем координаты на поверх-
поверхности уровня G = 1/2:
777i = COS 7, 777,2 = SHI 7,
777,3 = 777, 777,4 = PCOSG + ф),
Рис. 24.3. Сфера на плоскости Ш5 = psinG + ф)-
Тогда гамильтонова система еще более упрощается и принимает вид
7 = с\ cos 7
777, =
С2 sin 7
ф = km,
q = cos 7 Xi + sin 7 X2.
Случай /с = const, т. е. качение сферы по плоскости, вполне интег-
интегрируем. Эта задача подробно изучена в книге [12].
ПРИЛОЖЕНИЕ
В этом приложении мы докажем несколько технических предло-
предложений из гл. 2.
1. Гомоморфизмы и операторы в С°°(М)
Лемма 1. На любом гладком многообразии М существует та-
такая функция a G С°°(М), что для любого N > 0 найдется компакт
К (е М, для которого
a(q) > N VqeM\K.
Доказательство. Пусть е&, k G N, есть разбиение еди-
единицы на М: функции е& G С°°(М) имеют компактные носители
оо
supp е^ <Е М, образующие локально конечное покрытие М, и J^ е& =
оо
= 1. Тогда функцию J2 ^ек мож:но взять в качестве а. ?
к=1
Напомним и докажем предложение 2.1.
Предложение 2.1. Пусть (р: С°°{М) —>• М — нетривиальный
гомоморфизм алгебр.
Тогда существует такая точка q G М, что (р = q.
Доказательство. Возьмем гомоморфизм <р : G°° (М) —>> М.
Тогда множ:ество
Kenp = {f eC°°{M)\ <pf = O}
есть максимальный идеал в С°°(М). Далее, для любой точки q G М
множ:ество функций
Iq = {feC°°(M)\f(q)=0}
есть идеал в С°°(М). Для того чтобы доказать данное предлож:ение,
покаж:ем, что
KenpClq A)
для некоторой точки q G М. Тогда Кег (р = Iq и (р = q.
От противного: предполож:им, что Кег (р (jL Iq для любой точки q G
G М. Это значит, что
VqeM 3bqeKei(p: bq(q) ф 0.
Изменяя, если необходимо, знак 6^, получаем, что
MqeM 3bqeKerip,OqcM: bq\o > 0. B)
374 Приложение
Зафиксируем функцию а, существующую по лемме 1. Обозна-
Обозначим (р(а) = а; тогда (р(а — а) = 0, т. е.
(а — a) G Кет (р.
Более того,
3 К (в М т. ч. a(q) -a> О V qE M\K.
Выберем конечное покрытие компакта К окрестностями Oq, как в B):
п
г=1
и пусть ео, ei,..., еп G С°°(М) есть разбиение единицы, подчиненное
следующему покрытию многообразия М:
M\K,Oqi,...,Oqn.
Построим функцию, определенную глобально на М:
п
с = ео(а - а) + ^ е^. > 0.
г=1
Так как
имеем
(р(с) ф 0.
Но с G Кег<?>; получаем противоречие. Включение A) доказано так
же, как и данное предложение. ?
Теперь сформулируем и докажем теорему о свойствах регуляр-
регулярности для композиции операторов на G°°(М), в частности для неав-
неавтономных векторных полей или потоков на М.
Предложение 1. Пусть At и Bt — непрерывные по t семейст-
семейства линейных непрерывных операторов на С°°(М).
Тогда композиция At о Bt таксисе непрерывна по t. Если вдобавок
семейства At и Bt дифференцируемы при t = to, то семейство At о Bt
таксисе дифференцируемо при t = to, и его производная удовлетворя-
удовлетворяет правилу Лейбница:
Доказательство. Для доказательства непрерывности необ-
необходимо показать, что для любой функции a G С°°(М) следующее
выражение стремится к нулю при е —>- 0:
(At+e о Bt+? -At о Bt)a = At+? о (Bt+e ~ Bt)a + (At+e - At) о Bta.
В силу непрерывности семейства At второе слагаемое (At+? — At) о
о Bta —>- 0 при е —>- 0. Так как семейство Bt непрерывно, множество
функций (Bt+e — Bt)a лежит в любой заранее выбранной окрестности
2. Остаточный член хронологической экспоненты 375
нуля в С°°(М) для достаточно малого е. Для любого ?q > 0 семейст-
семейство At+?, \e\ < ?q, локально ограничено, а поэтому и равностепенно
непрерывно по теореме Банаха-Штейнгауза. Следовательно, At+? о
о {Bt+? — Bt)a —>• 0 при е —> 0. Непрерывность семейства At о Bt дока-
доказана.
Дифференцируемость и правило Лейбница доказываются анало-
аналогично с помощью разложения
- (At+e о Bt+? -At о Bt)a =
= At+? о -?{Bt+? - Bt)a + \{At+? - At) о Bta. П
2. Остаточный член хронологической экспоненты
Докажем оценку B.13) остаточного члена для хронологической
экспоненты.
Лемма 2. Для любых t\ > 0, полного неавтономного векторного
поля Vt, компакта К (е М и целого числа s ^ 0, существуют С > 0
и компакт К' (е М, К С К', для которых
\\Pta\\8iK ^ Сехр( С f \\VT\\S^ dr) ||a||s,K', . .
aeC°°{M), te [o,ti],
/ Уг dr.
Pt = exp
о
Доказательство. Обозначим компактное множество
Kt = U{PT(K)\Te[o,t}}
и введем функцию
a{t) = sup{ "У1*'1" | a G C~(M), ||a||s+1,^ / o} =
= sup{||Pta||e>x| a e C°°(M), \\a\\e+1>Kt = 1}. D)
Заметим, что функция ск(?), t G [0,^i], измерима, так как верхнюю
грань в правой части D) можно брать по любому счетному всюду
плотному подмножеству С°°(М). Более того, в силу неравенств B.3)
и оценки
IH|s,Pt(K) ^ |H|s + l,Kt
функция a(t) ограничена на отрезке [0, ti].
Так ж:е, как при определении полунорм || • \\8,к в параграфе 2.2,
зафиксируем собственное вложение М С M.N и векторные поля /ii,...
..., hjsi G Vec M, порож:дающие касательные пространства к М.
376 Приложение
Пусть qo E К — точка, в которой
\\Ъа\\а,к =
= sup{\hilo...ohil(Pta)(q)\qeK, 1 ^ гь ..., ц ^ N, 1 ^ I ^ s}
достигает своей верхней грани, и пусть ра = ро(ж]_,..., ждг) есть мно-
многочлен степени $С <s, производные которого порядка не выше s в точ-
точке qt = Pt{qo) совпадают с соответствующими производными а в qt.
Тогда
\\Pta\\s,K = \К о ... о МДР«)Ы| <: WPtPaWstK, E)
В конечномерном пространстве всех вещественных многочленов сте-
степени $J s все нормы эквивалентны, поэтому существует константа С >
> 0, не зависящая от выбора многочлена р степени $С <s, для которой
Из неравенств E) и F) получаем оценку
а,К ^ \\PtPa\\s,K ^ n \\PtPa\\s,K _ n \\PtPa\\s,K
\\a>\\s,Kt ^ ||Pa||S,gt ^ ||Pa||s,Kt
Так как
Pta
t
= a+ J PTo Vradr,
имеем
\\Pta\\s,K < Н\81к + J \\Рт о VTa\\s,K dr ^
о
(по неравенству G) и определению B.2))
t
о
Разделив на ||a||s+i?Kt, получаем
следовательно,
t
J'a(T)\\VT\\a,KtdT,
2. Остаточный член хронологической экспоненты 377
откуда по лемме Гронуолла следует, что
Тогда из оценки G) получаем
\\Pta\\.,K < С ещ>(с f \\VT\\s,Kt dr) \\а\\в>к,,
и необходимое неравенство C) доказано для любого компакта К' D
DKt.D
Теперь докажем оценку B.13).
Доказательство. Разложение B.11) можно переписать в
виде
= Sm{t) + I. . . J PTm о VTm о . . . о VT1
где
^ Г С
Sm(t) =Id+22j...JVTko...oVTldTk... dn.
Тогда
\\{Pt - Sm(i))a\\StK ^ / ... / \\PTm oVTm o...oVTla\\StKdTm ... drx ^
Am(t)
(по лемме 2)
/\ r r
\\VT\\s,K'dr I у •••у ||Km o...oyria||S5K'^rm ... drx.
о Am(t)
Оценим последний интеграл. По определению полунорм B.2)
f...f\\VTmo...oVTla\\atK,dTm...
Am(t)
Am(t)
... » Ti s-|-?77/ 1 JC' ^ s-Ьтм К1 СЬТ'тть • • • QiT\
25 А.А. Аграчев, Ю.Л. Сачков
378 Приложение
,K' / '•• / l|Km
t
1
-i,^' drm ... dri = \\a\\s+m к' —г / H^Hs+m-i.K' dr ,
ml VJ )
ml VJ
и оценка B.13) доказана:
5m(t))a||e,K^
С ( } \ ( Г \m
— expl С / ||Уг||8,к'йт) I / ||K||s+m-i,K'^T ||a||8+mjK'. ?
Список литературы*)
Книги по теории управления и неголономной геометрии
1. Алексеев В.М., Тихомиров В.М., Фомин СВ. Оптимальное управле-
управление.— М.: Наука, 1979.
2. Bellaiche A., Risler J. (Eds) Sub-Riemannian geometry // Progress in
Math.— 1996.—V. 144.
3. Беллман P. Динамическое программирование.— M.: ИЛ, 1960.
4. Block A. Nonholonomic Mechanics and Control.— Springer, 2003.— (Inter-
(Interdisciplinary Applied Mathematics. V. 24).
5. Boscain U., Piccoli B. Optimal synthesis for control systems on 2-D mani-
manifolds.— Springer, 2004.- (SMAI. V. 43).
6. Brockett R. W., Millman R.S., Sussmann H.J. (Eds) Differential geometric
conrol theory.— Boston: Birkhauser, 1983.
7. Davydov A.A. Qualitative theory of control systems. Translations of
Mathematical Monographs.— American Mathematical Society, 1994.
8. Гамкрелидзе Р.В. Основы оптимального управления.— Тбилиси:
Изд-во Тбил. ун-та, 1975.
9. Gauthier J.-P., Kupka I.A.K. Deterministic observation theory and appli-
applications.— Cambridge University Press, 2001.
10. Isidori A. Nonlinear control systems: an introduction.— Springer-Verlag,
1985.
11. Jakubczyk В., Respondek W. (Eds) Geometry of feedback and optimal cont-
control.— Marcel Dekker, 1998.
12. Jurdjevic V. Geometric control theory.— Cambridge University Press,
1997.
13. Montgomery R. A tour of subriemannian geometries, their geodesies and
applications.— AMS, 2002.
14. Nijmeijer H., van der Schaft A. Nonlinear dynamical control systems.—
Springer-Verlag, 1990.
15. Понтрягин Л.С, Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф.
Математическая теория оптимальных процессов.— М.: Физматгиз,
1961.
16. Sontag E.D. Mathematical control theory: deterministic finite dimensional
systems.— Springer-Verlag, 1990.
*) Список содержит как работы, упомянутые в тексте, так и некоторые
другие работы, полезные для более глубокого ознакомления с предметом;
он никоим образом не претендует на полноту.
25*
380 Список литературы
17. Sussmann H.J. (Ed.) Nonlinear controllability and optimal control.— Mar-
Marcel Dekker, 1990.
18. Zelikin M.I., Borisov V.F. Theory of chattering control with applications
to astronautics, robotics, economics, and engineering.— Basel: Birkhauser,
1994.
19. Зеликин М.И. Оптимальное управление и вариационное исчисление.—
М.: Едиториал УРСС, 2004.
Статьи
Хронологическое исчисление и близкие вопросы
20. Аграчев А.А., Гамкрелидзе Р. В. Экспоненциальное представление по-
потоков и хронологическое исчисление // Мат. сб.— 1978.— Т. 107 A49).—
С. 467-532.
21. Аграчев А.А., Гамкрелидзе Р.В. Хронологические алгебры и нестацио-
нестационарные векторные поля // Итоги науки. ВИНИТИ. Проблемы геомет-
геометрии.— 1980.- Т. 11.— С. 135-176.
22. Аграчев А.А., Гамкрелидзе Р.В. Ряды Вольтерра и группы перестано-
перестановок // Итоги науки. ВИНИТИ. Современные проблемы математики.
Новейшие достижения.— 1991.— Т. 39.— С. 3-40.
23. Agrachev A., Gamkrelidze R., Sarychev A. Local invariants of smooth
control systems // Acta Appl. Math.— 1989.— V. 14.— P. 191-237.
24. Agrachev A., Marigo A. Nonholonomic tangent spaces: intrinsic construc-
construction and rigid dimensions // Electronic Research Announcements of the
American Mathematical Society.— 2003.— V. 9.— P. 111-120.
25. Аграчев А.А., Сарычев А.В. Фильтрации алгебры Ли векторных полей
и нильпотентная аппроксимация управляемых систем // ДАН СССР.—
1987.- Т. 295.— С. 777-781.
26. Аграчев А.А., Вахрамеев С. Хронологические ряды и теорема Ко-
ши-Ковалевской // Итоги науки. ВИНИТИ. Проблемы геометрии.—
1981.— Т. 12.— С. 165-189.
27. Chen К. Т. Integration of paths, geometric invariants and a generali-
generalized Вaker-Hausdorf formula // Annals of Mathematics.— 1957.— V. 65.—
P. 163-178
28. Fliess M. Fonctionelles causales nonlineaires et indeterminees noncommu-
tatives // Bull. Soc. Math. France.— 1981.— V. 109.— P. 3-40.
29. Гамкрелидзе Р.В., Аграчев А.А., Вахрамеев С. Обыкновенные диффе-
дифференциальные уравнения на векторных расслоениях и хронологическое
исчисление // Итоги науки. ВИНИТИ. Современные проблемы мате-
математики. Новейшие достижения.— 1989.— Т. 35.— С. 3-107.
30. Kawski M. Nilpotent Lie algebras of vector fields // J. Reine & Angewandte
Mathematic- 1988.— V. 188.- P. 1-17.
31. Kawski M. Combinatorics of nonlinear controllability and noncommuting
flows // Mathematical control theory. ICTP Lecture Notes Series.— 2002.—
V. 8.-P. 222-311.
32. Kawski M., Sussmann H.J. Noncommutative power series and formal Lie
algebraic Techniques in nonlinear control theory // Operators, Systems and
Linear Algebra / Eds U. Helmke, D. Pratzel-Wolters, E. Zers.— Teubner,
1997.-P. 111-128.
Список литературы 381
33. Magnus W. On the exponential solution of differential equations for a linear
operator // Commun. Pure Appl. Math.— 1954.— V. VII.— P. 649-673.
34. Ree R. Lie elements and an algebra associated with shuffles // Annals of
Mathematics.— 1958.— V. 68.— P. 210-220.
35. Sussmann H.J. A product expansion of the Chen series // Theory and Ap-
Applications of Nonlinear Control Systems / Eds C.I. Byrnes, A. Linquist.—
Elsevier, 1986.— P. 323-335.
36. Tretyak A.I. Chronological calculus, high-order necessary conditions for
optimality, and perturbation methods // J. Dynam. Control Systems.—
1998.- V. 4, № 1.— P. 77-126.
Управляемость
37. Agrachev A. Newton diagrams and tangent cones to attainable sets //
Analysis of Controlled Dynamical Systems / Eds B. Bonnard, B. Bride,
J.P. Gauthier, I. Kupka.— Proc. col. Int. Lyon, France, 3-6 juillet, 1990.—
Birkhauser, 1991.—P. 11-20.
38. Agrachev A. Is it possible to recognize Local Controllability in a finite
number of differentiations? // Open Problems in Mathematical Systems
and Control Theory.— London: Springer-Verlag, 1999.— P. 15-18.
39. Agrachev A., Gamkrelidze R. Local controllability for families of diffeomor-
phisms // Systems and Control Letters.— 1993.— V. 20.— P. 67-76.
40. Agrachev A., Gamkrelidze R. Local controllability and semigroups of dif-
feomorphisms // Acta Appl. Math.— 1993.— V. 32.— P. 1-57.
41. Agrachev A., Sarychev A. The control of rotation for asymmetric rigid
body // Problems of Control and Information Theory.— 1983.— V. 12.—
P. 535-547.
42. Аграчев А.А., Сарычев А.В. О редукции гладкой системы, линейной
по управлению // Мат. сб.— 1986.— Т. 130, №1.— С. 18-34.
43. El Assoudi R., Gauthier J.P., Kupka I. On subsemigroups of semisimple
Lie groups// Ann. Inst. Henri Poincare.— 1996.— V. 13, №1.—P. 117-133.
44. Ayala Bravo V. Controllability of nilpotent systems // Geometry in non-
nonlinear control and differential inclusions.— 1995.— V. 32.— P. 35-46.
45. Bianchini R.M., Stefani G. Graded approximations and controllability
along a trajectory // SIAM J. Control and Optimization.— 1990.— V. 28.—
P. 903-924.
46. Bonnard B. Controllabilite des systemes bilineaires // Math. Syst. The-
Theory.— 1981.- V. 15.- P. 79-92.
47. Bonnard В., Jurdjevic V., Kupka /., Sallet G. Transitivity of families of
invariant vector fields on the semidirect products of Lie groups // Trans.
Amer. Math. Soc— 1982.— V. 271, №2.- P. 525-535.
48. Brockett R. W. System theory on group manifolds and coset spaces // SIAM
J. Control.- 1972.— V. 10.— P. 265-284.
49. Gauthier J.P., Bornard G. Controlabilite des systemes bilineaires // SIAM
J. Control Optim.— 1982.— V. 20, №3.- P. 377-384.
50. Hilgert J., Hofmann K.H., Lawson J.D. Controllability of systems on
a nilpotent Lie group // Beitrage Algebra Geometrie.— 1985.— V. 20.—
P. 185-190.
382 Список литературы
51. Jurdjevic V., Kupka I. Control systems on semi-simple Lie groups and
their homogeneous spaces // Ann. Inst. Fourier, Grenoble.— 1981.— V. 31,
№4.— P. 151-179.
52. Jurdjevic V., Kupka I. Control systems subordinated to a group action:
Accessibility // J. Differ. Equat.— 1981.- V. 39.- P. 186-211.
53. Jurdjevic V., Sussmann H.J. Controllability of non-linear systems // J.
Diff. Equat.— 1972.— V. 12.— P. 95-116.
54. Jurdjevic V., Sussmann H. Control systems on Lie groups // J. Diff.
Equat.— 1972.- V. 12.- P. 313-329.
55. Krener A. A generalization of Chow's theorem and the Bang-Bang theorem
to non-linear control porblems // SIAM J. Control.— 1974.— V. 12.—
P. 43-51.
56. Lawson J.D. Maximal subsemigroups of Lie groups that are total // Proc.
Edinburgh Math. Soc— 1985.— V. 30.— P. 479-501.
57. Levitt TV., Sussmann H.J. On controllability by means of two vector fields //
SIAM J. Control.- 1975.— V. 13.— P. 1271-1281.
58. Sachkov Yu.L. Controllability of hypersurface and solvable invariant sys-
systems // J. Dyn. Control Syst.— 1996.— V. 2, №1.— P. 55-67.
59. Sachkov Yu.L. Controllability of right-invariant systems on solvable Lie
groups // J. Dyn. Control Syst.- 1997.- V. 3, №4.— P. 531-564.
60. Sachkov Yu.L. On invariant orthants of bilinear systems // J. Dyn. Control
Syst.— 1998.— V. 4, №1.- P. 137-147.
61. Сачков Ю.Л. Управляемость инвариантных систем на группах Ли и
однородных пространствах // Современная математика и ее приложе-
приложения. Т. 59. Динамические системы-8.— М.: ВИНИТИ, 1998.
62. Sachkov Yu.L. Classification of controllable systems on low-dimensional
solvable Lie groups // Journal of Dynamical and Control Systems.—
2000.- V. 6, №2.- P. 159-217.
63. San Martin L.A.B. Invariant control sets on flag manifolds // Math. Con-
Control Signals Systems.— 1993.— V. 6.— P. 41-61.
64. San Martin L.A.B., Tonelli P.A. Semigroup actions on homogeneous
spaces // Semigroup Forum.— 1994.— V. 14.— P. 1-30.
65. Сарычев А.В. Построение множеств достижимости для управления
моментом вращающегося асимметрического твердого тела (особый
случай) // Космические исслед.— 1984.— Т. 22.— С. 828-841.
66. Сарычев А.В. Гомотопические свойства пространства траекторий
вполне неголономной дифференциальной системы // ДАН СССР.—
1990.- Т. 314.— С. 1336-1340.
67. Sarychev A.V. Nonlinear systems with impulsive and generalized func-
functions controls // Nonlinear Synthesis.— Birkhauser, 1991.— P. 244-257.—
(Progress in Systems and Control Theory. V. 9).
68. Sussmann H.J. Lie brackets and local controllability: a sufficient condition
for scalar-input systems // SIAM J. Control and Optimization.— 1983.—
V. 21.—P. 686-713.
69. Sussmann H.J. A general theorem on local controllability // SIAM J. Cont-
Control and Optimization.— 1987.— V. 25.— P. 158-194.
70. Sussmann H.J. A general theorem on local controllability // SIAM J. Cont-
Control Optim.— 1987.- V. 25.- P. 158-194.
Список литературы 383
71. Третьяк А. И. Достаточные условия локальной управляемости и необ-
необходимые условия оптимальности высшего порядка. Дифференциаль-
Дифференциально-геометрический подход // Современная математика и ее приложе-
приложения. Т. 24. Динамические системы-4.— М.: ВИНИТИ, 1996.
Существование и регулярность оптимальных управлений
72. Agrachev A. On regularity properties of extremal controls // J. Dynamical
and Control Systems.— 1995.— V. 1.— P. 319-324.
73. Agrachev A., Sigalotti M. On the local structure of optimal trajectories
in R3 II SIAM J. on Control and Optimization.— 2003.— V. 42.— P. 513-
531.
74. Bonnard В., Kupka I. Generic properties of singular trajectories // Ann.
Inst. H. Poincare. Anal. Non Lineaire.— 1997.— V. 14.— P. 167-186.
75. Bressan A., Piccoli B. A generic classification of time optimal planar sta-
stabilizing feedback // SIAM J. Control and Optimization.— 1998.— V. 36.—
P. 12-32.
76. Brunowsky P. Existence of regular synthesis for general problems // J.
Diff. Equations.— 1980.- V. 38.— P. 317-343.
77. Krener A.J., Schattier H. The structure of small-time reachable sets in
low dimensions // SIAM J. Control and Optimization.— 1989.— V. 27.—
P. 120-147.
78. Kupka I. Generalized Hamiltonians and optimal control: a geometric study
of the extremals // Proceedings ICM-86 in Berkeley.— AMS, 1987.—
P. 1189-1189.
79. Kupka I. Geometric theory of extremals in optimal control problems. I.
The fold and Maxwell case // Transactions of AMS.— 1987.— V. 299.—
P. 225-243.
80. Piccoli В., Sussmann H.J. Regular Synthesis and sufficient conditions for
optimality // SIAM J. Control and Optimization.— 2000.— V. 39.—
P. 359-410.
81. Schdttler H. The local structure of time optimal trajectories in dimension 3,
under generic conditions // SIAM J. Control and Optimization.— 1988.—
V. 26.-P. 899-918.
82. Sussmann H.J. Analytic stratifications and control theory // Proceedings
ICM-78 in Helsinki.— Acad. Sci. Fennica, 1980.— P. 865-871.
83. Sussmann H.J. Envelopes, conjugate points, and bang-bang extremals //
Algebraic and geometric methods in nonlinear control theory. Math. Appl.
Reidel, Dordrecht.- 1986.— V. 29.— P. 325-346.
84. Sussmann H.J. The structure of time optimal trajectories for for single-
input systems in the plane // SIAM J. Control and Optimization.— 1987.—
V. 25.— P. 433-465; 868-904.
85. Sussmann H.J. Regular synthesis for time optimal control of single-input
real-analytic systems in the plane // SIAM J. Control and Optimization.—
1987.- V. 25.— P. 1145-1162.
Геометрические задачи оптимального управления
86. Agrachev A. Methods of control theory in nonholonomic geometry //
Proceedings ICM-94 in Zurich.— Birkhauser, 1995.— P. 1473-1483.
384 Список литературы
87. Agrachev A. Exponential mappings for contact sub-Riemannian struc-
structures // J. Dynamical and Control Systems.— 1996.— V. 2.— P. 321-358.
88. Agrachev A. Feedback-invariant optimal control theory and differential
geometry, II. Jacobi curves for singular extremals // J. Dynamical and
Control Systems.— 1998.— V. 4.— P. 583-604.
89. Agrachev A. On the equivalence of different types of local minima in sub-
Riemannian problems // Proc. 37th IEEE Confer, on Decision and Control,
1998.-P. 2240-2243.
90. Agrachev A. Compactness for sub-Riemannian length-minimizers and sub-
analyticity // Rend. Semin. Mat. Torino.— 1998.— V. 56.— P. 1-12.
91. Аграчев А.А. Формула Гаусса-Бонне для контактных субримановых
многообразий // Докл. Акад. наук России.— 2001.— Т. 381.— С. 583-
585.
92. Agrachev A., El-Alaoui С, Gauthier J.-P. Sub-Riemannian metrics on
R3 II Proc. Canadian Math. Soc— 1998.— V. 25.— P. 29-78.
93. Agrachev A., Bonnard В., Chyba M., Kupka I. Sub-Riemannian sphere in
Martinet flat case // ESAIM: J. Control, Optimisation and Calculus of
Variations.— 1997.- V. 2.— P. 377-448.
94. Agrachev A., Chariot G., Gauthier J.-P., Zakalyukin V. On sub-Riemann-
sub-Riemannian caustics and wave fronts for contact distributions in the three-space //
J. Dynamical and Control Systems.— 2000.— V. 6.— P. 365-395.
95. Agrachev A., Gamkrelidze R. Feedback-invariant optimal control theory
and differential geometry. I. Regular extremals // J. Dynamical and Con-
Control Systems.- 1997.- V. 3.- P. 343-389.
96. Agrachev A., Gauthier J.-P. On the Dido problem and plane isoperimetric
problem // Acta Appl. Math.— 1999.— V. 57.— P. 287-338.
97. Agrachev A., Gauthier J.-P. Sub-Riemannian metrics and isoperimet-
isoperimetric problems in the contact case // Proc. Int. Confer. Pontryagin-90.—
Moscow, 1999.- V. 3.— P. 5-48.
98. Agrachev A., Gauthier J.-P. On subanalyticity of Carnot-Caratheodory
distances // Annales de l'Institut Henri Poincare-Analyse non lineaire.—
2001.- V. 18.— P. 359-382.
99. Agrachev A., Sarychev A. Strong minimality of abnormal geodesies
for 2-distributions // J. Dynamical and Control Systems.— 1995.— V. 1.—
P. 139-176.
100. Agrachev A. Sarychev A. Abnormal sub-Riemannian geodesies: Morse
index and rigidity // Annales de l'Institut Henri Poincare. Analyse non
lineaire.— 1996.— V. 13.— P. 635-690.
101. Agrachev A., Sarychev A. Sub-Riemannian metrics: minimality of abnor-
abnormal geodesies versus subanalyticity // ESAIM. J. Control, Optimisation,
and Calculus of Variations.— 1999.— V. 4.— P. 377-403.
102. Agrachev A., Zelenko I. Geometry of Jacobi curves. I, II // J. Dynamical
and Control Systems.— 2002.- V. 8.— P. 93-140; 167-215.
103. El-Alaoui C, Gauthier J.-P., Kupka I. Small sub-Riemannian balls in IR3 //
J. Dynamical and Control Systems.— 1996.— V. 2.— P. 359-421.
104. Boscain U., Chambrion Т., Gauthier J.-P. On the К + P problem for a
three-level quantum system: Optimality implies resonance // J. Dynam.
Control Systems.- 2002.— V. 8.- P. 547-572.
Список литературы 385
105. Brockett R. W. Nonlinear Control Theory and Differential Geometry //
Proceedings ICM-82 in Warsaw.— Polish Scientific Publishers, 1984.—
P. 1357-1368.
106. Brockett R., Dai L. Non-holonomic kinematics and the role of elliptic func-
functions in constructive controllability // Nonholonomic Motion Planning /
Eds Z. Li, J. Canny.— Boston: Kluwer, 1993.— P. 1-21.
107. Jacquet S. Subanalyticity of the Sub-Riemannian Distance // J. Dynam.
Control Systems.- 1999.— V. 5, №3.- P. 303-328.
108. Liu W.S., Sussmann H.J. Shortest paths for sub-Riemannian metrics on
rank-2 distributions // Memoirs of AMS.— 1995.— V. 118, №569.
109. Марков А. А. Некоторые примеры решений специального класса задач
на наибольшие и наименьшие количества // Сообщ. Харьковск. мат.
общ.— 1887.- Т. 1.- С. 250-276.
110. Mittenhuber D. Controllability of Solvable Lie Algebras // J. Dynam. Cont-
Control Systems.- 2000.— V. 6, №3.- С 453-459.
111. Mittenhuber D. Controllability of Systems on Solvable Lie Groups: the
Generic Case // J. Dynam. Control Systems.— 2001.— V. 7, № 1.— С 61-
75.
112. Monroy-Perez F. Non-Euclidean Dubins problem // J. Dynam. Control
Systems.— 1998.- V. 4, №2.— P. 249-272.
113. Myasnichenko O. Nilpotent C,6) Sub-Riemannian Problem // J. Dynam.
Control Systems.- 2002.— V. 8, №4.- P. 573-597.
114. Сачков Ю.Л. Экспоненциальное отображение в обобщенной задаче Ди-
доны // Мат. сб.— 2003.— V. 194, №9.- С. 63-90.
115. Sachkov Yu.L. Symmetries of Flat Rank Two Distributions and Sub-
Riemannian Structures // Transactions of the American Mathematical
Society.— 2004.- V. 356, №2.— P. 457-494.
116. В ершик A.M., Гершкович В. Я. Неголономные динамические системы
и геометрия распределений // Итоги науки и техники. Современ-
Современные проблемы математики. Фундаментальные направления. Динами-
Динамические системы. Т. 7, 8.— М.: ВИНИТИ, 1986.
117. Zelenko I. Nonregular abnormal extremals for 2-distributions: existence,
second variation and rigidity // J. Dynamical and Control Systems.—
1999.-V. 5.-P. 347-383.
Вторая вариация и близкие вопросы
118. Аграчев А.А. Необходимое условие оптимальности в общем нелиней-
нелинейном случае // Мат. сб.- 1977.- Т. 102.- С. 551-568.
119. Аграчев А.А. Гомологии пересечений вещественных квадрик // ДАН
СССР.- 1988.— Т. 299.— С. 1033-1036.
120. Аграчев А.А. Квадратичные отображения в геометрической теории
управления // Итоги науки. ВИНИТИ. Проблемы геометрии.— 1988.—
Т. 20.- С. 111-205.
121. Аграчев А.А. Топология квадратичных отображений и гессианы глад-
гладких отображений // Итоги науки. ВИНИТИ. Алгебра. Топология. Гео-
Геометрия.- 1988.- Т. 26.— С. 85-124.
122. Аграчев А.А., Гамкрелидзе Р.В. Принцип оптимальности второго по-
порядка для задачи быстродействия // Мат. сб.— 1976.— Т. 100, №4.—
С. 610-643.
386 Список литературы
123. Аграчев А.А., Гамкрелидзе Р. В. Индекс экстремальности и квазиэкс-
квазиэкстремальные управления // ДАН СССР.— 1985.— Т. 284.— С. 777-781.
124. Аграчев А.А., Гамкрелидзе Р.В. Индекс Морса и индекс Маслова глад-
гладких управляемых систем // ДАН СССР.— 1986.— Т. 287.— С. 521-524.
125. Аграчев А.А., Гамкрелидзе Р.В. Вычисление эйлеровой характерис-
характеристики пересечений вещественных квадрик // ДАН СССР.— 1988.—
Т. 299.—С. 11-14.
126. Аграчев А.А., Гамкрелидзе Р.В. Квазиэкстремальность управляемых
систем // Итоги науки. ВИНИТИ. Современные проблемы математи-
математики. Новейшие достижения.— 1989.— Т. 35.— С. 109-134.
127. Аграчев А.А., Гамкрелидзе Р.В. Квадратичные отображения и глад-
гладкие вектор-функции: эйлерова характеристика поверхностей уровня //
Итоги науки. ВИНИТИ. Современные проблемы математики. Новей-
Новейшие достижения.— 1989.— Т. 35.— С. 179-239.
128. Аграчев А.А., Гамкрелидзе Р.В. Симплектическая геометрия и необхо-
необходимые условия оптимальности // Мат. сб.— 1991.— Т. 144.— С. 36-54.
129. Agrachev A., Sarychev A. On abnormal extremals for Lagrange variational
problems // Mathematical Systems. Estimation and Control.— 1998.—
V. 8.-P. 87-116.
130. Аграчев А.А., Стефани Ж., Зезза П. Сильные минимумы в оптималь-
оптимальном управлении // Тр. Мат. инст. им. В.А. Стеклова.— 1998.— Т. 220.—
С. 4-22.
131. Agrachev A., Stefani G., Zezza P. A Hamiltonian approach to strong mi-
minima in optimal control // Proc. Symp. Pure Math. V. 64.— AMS, 1999.—
P. 11-22.
132. Agrachev A., Stefani G., Zezza P. Strong optimality of a bang-bang trajec-
trajectory // SIAM J. on Control and Optimization.— 2002.— V. 41.— P. 991-
2014.
133. Agrachev A., Vakhrameev S. Morse theory and optimal control problems //
Nonlinear Synthesis / Eds C.I. Byrnes, A. Kurzhansky. Proc. Int. Conf.
Sopron, Hungary, 5-9 June, 1989.— Birkhauser, 1991.— P. 1-11.
134. Bonnard В., Kupka I. Theory of the singularities of the input/output map-
mapping and optimality of singular trajectories in the minimal-time problem.
Forum Math.- 1993.- V. 5.— P. 111-159.
135. Krener A.J. The high order maximum principle and its application to sin-
singular extremals // SIAM J. Control and Optimization.— 1977.— V. 15.—
P. 256-293.
136. Сарычев А.В. Устойчивость отображений гильбертовых пространств
и эквивалентность управляемых систем // Мат. сб.— 1980.— Т. 113.—
С. 146-160.
Другие цитированные источники
137. Арнольд В.И. Математические методы классической механики.— М.:
Наука, 1989.
138. Арнольд В.И. Обыкновенные дифференциальные уравнения.— М.:
Наука, 1974.
Список литературы 387
139. Арнольд В.И., Гивенталь А. Б. Симплектическая геометрия // Совре-
Современные проблемы математики. Фундаментальные направления. Итоги
науки и техники. Т. 4.— М.: ВИНИТИ, 1985.— С. 5-139.
140. Hale J. Ordinary differential equations.— Robert E. Krieger Publishing
Company, Inc., 1980.
141. Джекобсон H. Алгебры Ли.— M.: Мир, 1964.
142. Малъгранж Б. Идеалы дифференцируемых функций.— М.: Мир, 1968.
143. Понтрягин Л.С. Непрерывные группы.— М.: Наука, 1984.
144. Rabinowitz Р.Н. Periodic solutions to Hamiltonian systems // Commun.
Pure Appl. Math.— V. 31.- P. 157-184.
145. Рокафеллар Р. Т. Выпуклый анализ.— M.: Мир, 1973.
146. Рудин У. Функциональный анализ.— М.: Мир, 1975.
147. Segal I.E., Kunze R.A. Integrals and operators.— Springer, 1978.
148. Уорнер Ф. Основы теории гладких многообразий и групп Ли.— М.:
Мир, 1987.
149. Weinstein A. Periodic orbits for convex Hamiltonian systems // Ann.
Math.— V. 108.— P. 507-518.
СПИСОК ОБОЗНАЧЕНИЙ
D2UF 281 SL(Cn) 246
Dq$ 17 SL(n) 246
F* 144 SOC) 86
Lz 162 SO(ra) 102, 246
Lf 151 SUC) 264
P* 21 SU(ra) 247
T*M 143 (? 15
TqM 17 u(n) 246
TXM 16 VecM 17
[Vi,y2] 26 adV 46
Ad Б 46 F 31, 148
Лдо 25, 69, 136 ind+ Q 285
Aqo (t) 24, 136 ind_ Q 285
Лд0 136 ел Л uj2 146
Ogo 69 a 156
C°°(M) 30 so(n) 102
DiffM 15 ^ 156
Ф*У 18 <
GL(Cn) 246 ^ 42'48
GL(n) 246 exP 38' 48
HessMF 281 К b} 158
Л!М145 11а1Ь^ 34
AfcM 147 ^ 150
Лг 163 etv 44
Lie^ 72 etadV 48
Lieg^7 72 if 152
O(n) 246 s 154
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Алгебра Ли 47
, структурные константы 243
Векторное поле 17, 36
автономное 44
, гамильтонов лифт 161
гамильтоново 156
консервативное 118
неавтономное 36
параллельное 362
полное 20, 38
, поток 21
с компактным носителем 38
совместимое 113
устойчивое по Пуассону 117
, экспонента 44
Векторные поля, коммутатор 27
, скобка Ли 26
Вложение 15
Внешнее произведение 146
Внешняя &-форма 145
Выпуклая оболочка 141
Гамильтониан 156
Гамильтонова система 157
Гессиан 281
Группа Ли 245
линейная 247
— общая линейная 246
— ортогональная 246
— специальная линейная 246
ортогональная 246
унитарная 246
— унитарная 246
Двойственный базис 143
Динамическая система 17
Динамическое программирование
235
Диффеоморфизм 15
Дифференциал 17
— второй 281
Дифференциальная форма 144
—, &-форма 147
, внешний дифференциал 150
, внутреннее произведение 152
, интеграл 145, 148
, производная Ли 151
Дифференциальное уравнение не-
неавтономное 37
Дифференцирование алгебры 33
Задача быстродействия 141
линейная 203
— линейно-квадратичная 215
— оптимального управления 134
— риманова 254
— субриманова 256
Игольчатая вариация 171
Изотропное подпространство 162
Индекс квадратичной формы 285
Интегральный инвариант Пуанка-
ре-Картана 228
Касательное пространство 16
Касательный вектор 16
Кокасательное пространство 143
Кокасательное расслоение 143
, каноническая симплектичес-
кая структура 156
, канонические координаты 144
, тривиализация 239
Коммутатор векторных полей 27
Кривизна гауссова 354
—, двумерные системы 347
—, трехмерные аффинные по управ-
управлению системы 358
Критическая точка, коранг 282
Лагранжево подпространство 162
Лемма Морса 284
390
Предметный указатель
Машина Дубинса 194
с управлением угловым ускоре-
ускорением 309
Многообразие 14
— риманово 358
— симплектическое 156
Многообразия диффеоморфные 15
Множество достижимости 24, 136
Модуль 77
— конечно порожденный 77
— локально конечно порожденный
78
ОДУ 17
— неавтономное 37
Оптимальная траектория 136
Оптимальное управление 136
Оптимальность геометрическая 279
— локальная геометрическая 282
конечномерная 282
— сильная 329
— строгая сильная 329
Орбита 69
Ослабленная система 142
Отображение в конец 216, 279
, второй дифференциал 292
, дифференциал 290
— гладкое 15
— локально открытое 282
— собственное 15
Параллельный перенос 362
Погружение 70
Подгруппа Ли 248
Подмногообразие 13
— погруженное 70
Поток 36
Преобразование обратной связи 120
Принцип максимума Понтрягина
164, 173, 176, 178, 183
Пространство управляющих пара-
параметров 22
Распределение 79
— 2-порождающее 304
—, интегральное многообразие 79
— интегрируемое 79
Редукция 338
Релаксация 141
Риманова структура 359
Связность 362
— Леви-Чивита 362
Семейство векторных полей вполне
неголономное 73
, орбита 69
полного ранга 73, 110
симметричное 69
Семейство функций, свойства регу-
регулярности 35
Семейство функционалов, свойства
регулярности 36
Симплектическая структура 156
Симплектическое многообразие
156
Скобка Ли векторных полей 26
, координатная формула 27
Скобка Пуассона 158
Сопряженная точка 225
Сопряженное время 318, 322
— пространство 143
Тавтологическая 1-форма 154
Теорема Ли 249
— Филиппова 138
Тождество Якоби 47
Топология, С°°(М) 34
Точка Лебега 171
—, устойчивая по Пуассону 116
Траектория оптимальная 136
Управление оптимальное 136
— особое 198, 278
— релейное 197, 274
Управляемая система 22
, аффинная по управлению 55
билинейная 305
вполне управляемая 57
левоинвариантная 247
линейная 55
линейная, индексы Кронекера
126
линейная, нормальная форма
Бруновского 127
ослабленная 142
правоинвариантная 247
, пространство состояний 22
со скалярным управлением
306
, состояние 22
Управляемость локальная 305
Управляющий параметр 22
Уравнение Гамильтона-Якоби 235
— Якоби в подвижном репере 353
, особый случай 324
, регулярный случай 320
Предметный указатель
391
Условие Фробениуса 80
— общего положения 203
— оптимальности Гоха 299, 302
Лежандра 294, 302
обобщенное 301, 302
усиленное 301
усиленное 295
Условия оптимальности достаточ-
достаточные 229, 233, 329, 337
необходимые 164, 302
Условия трансверсальности 178
Форма Лиувилля 154
Формула вариаций 51
— Картана 152
— Коши 55
Функционал качества 135
Функция переключения 274
Хронологическая экспонента левая
42
правая 38
Эквивалентность локальная по сос-
состоянию 81
и обратной связи 129
— по обратной связи 121
Экспонента векторного поля 44
Экстремаль 165
— анормальная 177
— вполне особая 297
— нормальная 181
— регулярная 295
— строго анормальная 304
— хорошая особая 302
Экстремальная траектория 165
Явление Фуллера 315
Учебное издание
ЛГРЛЧЕВ Андрей Александрович
САЧКОВ Юрий Леонидович
ГЕОМЕТРИЧЕСКАЯ ТЕОРИЯ УПРАВЛЕНИЯ
Редактор Е.Ю. Ходан
Оригинал-макет Д.В. Горбачева
Оформление переплета А.Ю. Алехиной
ЛР №071930 от 06.07.99. Подписано в печать 30.09.04.
Формат 60x90/16. Бумага офсетная. Печать офсетная.
Усл. печ. л. 24,5. Уч.-изд. л. 27,5. Заказ № 11036
Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru; http://www.fml.ru
Отпечатано с готовых диапозитивов
в ППП «Типография «Наука»
121099, Москва, Шубинский пер., 6
ISBN 5-9221-0532-9
9 78592205323