Текст
                    OPTIMAL CONTROL
An Introduction to the Theory
and Its Applications
MICHAEL ATHANS
Assistant Professor
Department of Electrical Engineering
Massachusetts Institute of Technology
PETER L. FALB
Associate Professor
Information and Control Engineering
The University of Michigan
McGRAW-HILL BOOK COMPANY
New Ycrk/St. Louis/San Francisco/Torcnto/Lcndon/Sydney


М. АТАНС и П. ФАЛБ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Перевод с английского канд. техн, наук Г. Н. АЛЕК.САКОВА Под редакцией д-ра техн, наук проф. Ю. И. ТОПЧЕЕВА ИЗДАТЕЛЬСТВО «МАШИНОСТРОЕНИЕ» Москва 1968
УДК 62—50.001 Редактор инж. Л. П. Строганов 3-18-3 105-68 Атанс М. и Фалб П Л. Оптимальное управление. Перевод с английского. Под ред. д-ра техн, наук проф. Ю. И. Т о п ч е е в а. М., «Машиностроение», 1968, стр. 764. Книга американских ученых М. Атанса и П. Фалба пред¬ ставляет собой систематическое изложение теории оптимального управления детерминированных систем. Изложению теории оптимального управления предшествует обширное введение, где приводятся основные сведения из теории множеств, линейной алгебры и теории дифференциальных урав¬ нений линейных систем с постоянными параметрами. Далее рассматривается теория оптимального управления на основе классических вариационных методов и принципа максимума Понтрягина. Ряд глав посвящен изложению методов расчета и проектиро¬ вания систем оптимальных по отношению к различным крите¬ риям оптимальности (максимуму быстродействия, расходу топ¬ лива, комбинированному и квадратичному критериям). Как пра¬ вило, результаты синтеза доведены до рабочего алгоритма или блок-схемы аналогового управляющего устройства. Книга снабжена многочисленными примерами. Работа предназначена для научных работников, инжене¬ ров, преподавателей и аспирантов, занимающихся вопросами автоматического управления, а также может быть использована студентами старших курсов высших учебных заведений, спе¬ циализирующихся в области автоматики. Илл. 265. Табл. 2. Библ. 325 назв.
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Прошло немногим более 10 лет с тех пор, как Л. С. Понтрягин и его ученики В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко заложили строгие математические основы теории оптимального управления, сфор¬ мулировав и доказав принцип максимума \ а к настоящему времени методы оптимального управления нашли весьма широкое практическое применение. Несмотря на физическую ясность этих методов, в практике проекти¬ рования оптимальных систем инженер встречается с целым рядом мате¬ матических трудностей, для преодоления которых ему необходимы глу¬ бокое понимание теории оптимального управления и обширные знания в различных ее технических приложениях. Предлагаемый вниманию читателей перевод книги американских ученых М. Атанса, П. Фалба и представляет собой систематическое изложение теории оптимального управления детерминированных систем, иллюстрированной многочислен¬ ными примерами, необходимыми для понимания теории и получения пер¬ вых практических навыков синтеза оптимальных систем. Авторы книги, желая сделать ее более доступной широкому кругу читателей, в ряде случаев отказываются от строгих аналитических дока¬ зательств, а пользуются геометрическими, носящими часто эвристический характер 1 2. Применение геометрических доказательств не только упро¬ щает изучение теории оптимального управления за счет большей нагляд¬ ности изложения, но формирует у читателя четкие представления, позво¬ ляющие ему быстрее перейти к решению поставленных перед ним прак¬ тических задач. Книга состоит из трех разделов: первого (гл. 2—4), где излагаются математические основы линейной алгебры и динамики линейных систем управления с постоянными параметрами; второго (гл. 5—6), где рассмат¬ ривается теория оптимального управления, основанная на классических вариационных методах, принципах максимума Понтрягина и динамиче¬ ского программирования Веллмана; третьего (гл. 7—10), посвященного методам проектирования систем, оптимальных по быстродействию, расходу топлива и квадратическому критерию. Книга представляет собой обработку прочитанных авторами в Мас- сачузетском технологическом институте лекций по теории оптимального управления и ее практическим приложениям и отличается хорошей логи¬ кой построения, четкостью математических постановок рассматриваемых задач, ясностью изложения, большим числом примеров конкретного проек¬ тирования некоторых классов систем автоматического управления. В тех случаях, когда аналитические методы проектирования оптимальных систем делаются громоздкими, авторы прибегают к расчетам на цифровой вычи¬ слительной машине. Книга представляет интерес и будет полезна как для инженеров, зани¬ мающихся проектированием систем автоматического управления, так и для аспирантов и студентов старших курсов высших учебных заведений, изучающих теорию автоматического управления. Ю. И. ТОЛЧЕЕВ 1 См. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории оптимальных процессов, «Доклады Академии наук СССР», т. ПО, 1956, № 1, стр. 7—10. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В, Мищенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз, 1961. 2 В этих случаях авторы указывают на литературные источники, в которых приводятся строгие математические доказательства. 5
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ 9 ГЛАВА 1 ОСНОВНЫЕ ПОЛОЖЕНИЯ. СОДЕРЖАНИЕ КНИГИ 1.1. Введение (11). 1.2. Задача синтеза системы (11). 1.3. Цель управления (13). 1.4. Исторический обзор (14). 1.5. Назначение книги (17). 1.6. Общие замечания по струк¬ туре книги (18). 1.7. Описание содержания глав книги (20). 1.8. Требования к минимуму знании, необходимых для чтения книги, и предложения относительно ее изучения (23). ГЛАВА 2 ЛИНЕЙНАЯ АЛГЕБРА 2.1. Введение (25). 2.2. Множества (25). 2.3. Операции над множествами (26). 2.4. Функции (29). 2.5*. Векторные пространства 1 (30). 2.6*. Линейные комбинации и базис (33). Линейная алгебра. 2.7*. Линейные преобразования и матрицы (35). 2.8*. Операции над линейными преобразованиями и матрицами (36). 2.9*. Линейные преобразования V в V (40). 2.10*. Собственные векторы и собственные значения (42). Эвклидовы пространства. 2.11*. Внутренние произведения (46). 2.12. Неравенство Шварца (48). 2.13. Определение ортогональности и нормы (49). 2.14. Некоторые свойства скалярного произведения на Rn (50). 2.15. Некоторые свойства симметричных матриц (53). ГЛАВА з МАТЕМАТИЧЕСКИЙ АНАЛИЗ 3.1. Введение (58). Расстояние и связанные с ним понятия. 3.2*. Определение (58). 3.3*. Сферы и пре¬ делы (60). 3-4*. Открытые и замкнутые множества (62). 3.5*. Полнота и сжатие (65). Свойства множеств в Rn. 3.6. Компактность (67). 3-7. Гиперплоскости и конусы (68). 3.8*. Выпуклость (71). Векторные функции. 3-9*. Вводные замечания (75). 3.10*. Непрерывность (77). 3.11. Кусочная непрерывность (80). 3.12*. Производные (82). 3.13. «Гладкие» множества из Rn (90). 3.14*. Интегралы (92). 3.15*. Векторные пространства (97). 3-16*. Функ¬ ционалы (105). Дифференциальные уравнения. 3.17*. Предварительные замечания (107). 3.18. Тео¬ рема существования и единственности (112). 3.19*. Линейные дифференциальные уравне¬ ния. Основные положения (118). 3.20. Фундаментальная матрица (121). Системы с постоянными параметрами. 3 21*. Экспонента от At (127). 3.22. Сведение к канонической форме (130). 3.23*. Вычисление фундаментальной матрицы с помощью преобразования Лапласа (133). 3.24*. Системы n-го порядка (137). * * * 3.25. Сопряженная система (141). 3.26. Устойчивость линейных систем с постоян¬ ными параметрами (142). 1 Значение звездочек разъясняется в гл. 1. 6
ГЛАВА 4 ОСНОВНЫЕ ПОЛОЖЕНИЯ 4.1*. Введение (145). 4.2*. Цепочка RL (145). 4.3. Система со многими перемен¬ ными (150). Динамические системы. 4.4*. Вводные замечания (151). 4.5. Определение (155). 4.6. Ди¬ намические системы, рассматриваемые в данной 1<ниге (159). 4.7. Линейные динамические системы (162). 4.8. Связь между входом и выходом системы. Передаточная функция (164). 4.9*. Отыскание представления в пространстве состояний (или в форме динамической системы) объекта, передаточная функция которого содержит только полюса (165). 4.10*. Отыскание представления в пространстве состояний (или в форме динамической систе¬ мы) объекта, передаточная функция которого содержит полюса и нули (171). Задача управления. 4.11*. Вводные замечания (178). 4.12*. Определения (179). 4.13. Специальные случаи (181). 4.14*. Множество достижимых состояний (183). 4.15*. Управляемость и наблюдаемость. Определения (186). 4.16*. Управляемость линей¬ ных систем с постоянными параметрами (187). 4.17*. Наблюдаемость линейных систем с постоянными параметрами (192). Физическое представление понятия нормальности. 4.18. Регулирование выхода (196). 4.19. Эффект сокращения полюса с нулем (198). 4.20. Практический пример (199). 4.21*. Нормальные линейные системы с постоянными параметрами (201). ГЛАВА 5 УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МИНИМУМА И УРАВНЕНИЕ ЯКОБИ —ГАМИЛЬТОНА 5.1. Введение (204). 5.2. Обычный минимум (205). 5.3. Обычный минимум с ограни¬ чениями. Простая задача (210). 5.4. Обычный минимум с ограничениями. Необходимые условия и множители Лагранжа (214). 5.5. Некоторые замечания (217). 5.6. Пример (222). Вариационный подход к задаче управления. 5.7*. Необходимые условия для задачи с незакрепленными концами (233). 5.8. Достаточные условия для' -задачи с незакрепленным концом (246). 5.9. Задача с закрепленным концом (252). 5.10*. Обсуждение вариационного метода (254). Принцип минимума Понтрягина. 5.11*. Введение (260). 5.12*. Формулировка задачи управления (260). 5.13*. Принцип минимума Понтрягина (263). 5.14*. Замена перемен¬ ных (266). 5.15*. Доказательство принципа минимума. Предварительные замечания (280). 5.16*. Эвристическое доказательство принципа минимума (282). 5.17*. Некоторые замеча¬ ния по принципу минимума (313). Достаточные условия оптимальности. 5.18*. Вводные замечания (316). 5.19*. Урав¬ нение для функционала (317). 5.20*. Достаточное условие оптимальности (319). 5.21. Некоторые замечания относительно достаточных условий (324). ГЛАВА 6 СТРУКТУРА И СВОЙСТВА ОПТИМАЛЬНЫХ СИСТЕМ 6.1. Введение (327). Задачи об оптимальном быстродействии. 6.2*. Формулировка и геометрическая интер¬ претация (328). 6.3*. Применение принципа минимума (334). 6.4*. Замечания (351). 6.5*. Линейные системы с постоянными параметрами (352). 6.6 Структура оптимального регулятора и проблема обратной связи (364). 6.7. Геометрические свойства управления, оптимального по быстродействию (367). 6.8. Существование оптимального управления (374). 6.9. Уравнение Гамильтона—Якоби (377). 6.10. Комментарии и замечания (382). Задачи на оптимум расхода топлива. 6.11. Введение (383). 6.12. Обсуждение задачи и ограничений (384). 6.13*. Формулировка задании получение необходимых условий (385). 6.14*. Линейные системы с постоянными параметрами (394). 6.15. Дополнительные фор¬ мулировки и функционалы (404). 6.16. Комментарии (409). Задачи на минимум энергии. 6.17*. Введение (410). 6.18*. Линейная задача с задан¬ ными конечным состоянием и временем перехода (412). 6.19*. Пример (417). 6.20. Ограни¬ чения управления по величине (426). Вырожденные задачи. 6.21*. Гамильтониан — линейная функция управления (430). 6.22. Гамильтониан — линейная функция управления и его абсолютного значения (442). * * * 6.23. Некоторые замечания относительно существования и единственности оптималь¬ ных и экстремальных управлений (444). 6.24*. Связь между задачами с фиксированными и нефиксированными граничными условиями (446). 6.25. Заключительные замечания (450). 7
ГЛАВА 7 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО БЫСТРОДЕЙСТВИЮ 7.1*. Введение (451). Оптимальные по быстродействию системы 7.2*. Управление объектом, который представляет собой два интегратора (453). 7.3. Управление объектами с двумя постоянными времени (469). 7.4*. Управление объектом, описываемым передаточной функцией третьего порядка с двумя интегрирующими и одним апериодическим звеньями (477). 7.5. Управление объектом, имеющим передаточную функцию с действительными полюсами (489). 7.6. Неко¬ торые замечания (501). 7.7*. Управление гармоническим осциллятором (503). 7.8. Управ¬ ление устойчивым гармоническим осциллятором с демпфированием (520). 7.9. Управление гармоническим осциллятором при помощи двух входных переменных (525). 7.10. Управ¬ ление нелинейными системами первого порядка (537). 7.11*. Управление для одного класса нелинейных систем второго порядка (541). 7.12*. Управление объектом, имеющим в пере¬ даточной функции два интегрирующих звена и один нуль (547). 7.13. Управление объек¬ том, имеющим передаточную функцию с двумя интегрирующими звеньями и двумя нулями (560). 7.14. Общие результаты относительно оптимального по быстродействию управления объектами, имеющими в передаточных функциях дифференцирующие звенья (567). 7.15. Заключительные замечания (578). ГЛАВА 8 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО РАСХОДУ ТОПЛИВА 8.1. Введение (580). 8.2. Линейные системы первого порядка. Интегратор (582). 8.3. Линейные системы первого порядка. Апериодическое звено (588). Оптимальное по расходу топлива управление объектом с двойным интегрирова¬ нием. 8.4*. Постановка задачи (591). 8.5*. Задача с незаданным временем перехода (592). 8.6*. Время перехода фиксировано или ограничено сверху (600). 8.7. Время пере¬ хода ограничено произведением минимального времени на постоянный коэффициент (608). 8.8*. Минимизация линейной комбинации времени и расхода топлива (616). * * * 8.9. Минимизация линейной комбинации времени и расхода топлива для объекта, представляющего собой интегратор и апериодическое звено (622). 8.10*. Минимизация линейной комбинации времени и расхода топлива для нелинейной системы второго по¬ рядка (633). 8.11*. Замечания и обобщения (649). ГЛАВА 9 ПРОЕКТИРОВАНИЕ ОПТИМАЛЬНЫХ ЛИНЕЙНЫХ СИСТЕМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ 9.1*. Введение. (654) 9.2*. Постановка задачи (656). 9.3*. Задача о регуляторе состоя¬ ния (659). 9.4. Обсуждение результатов и примеры (668). 9.5*. Задача о регуляторе состояния для инвариантной во времени системы при Т — оо (672). 9.6. Анализ системы первого порядка (677). 9.7. Задача о регуляторе выхода (682). 9.8*. Задача о регуляторе выхода для системы с одним входом и одним выходом (687). 9.9*. Задача слежения (692). 9.10. Приближенные соотношения для систем, инвариантных во времени (699). 9.11*. За* дачи слежения, сводимые к задачам о регуляторе выхода (702). 9.12. Анализ следящей системы первого порядка (7Û4). 9.13*. Некоторые замечания (708). глава ю ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ ПРИ ОГРАНИЧЕНИИ УПРАВЛЕНИЯ ГИПЕРСФЕРОЙ 10.1. Введение (710). 10.2. Обсуждение, ограничения || u(t) || m (711). 10.3. Поста¬ новка задачи об управлении оптимальном по быстродействию (712). 10.4. Аналитическое определение оптимального по быстродействию управления для одного класса нелинейных систем (715). 10.5. Обсуждение результатов (718). 10.6. Оптимальное управление системами с инвариантной нормой (721). 10.7. Оптимальное по быстродействию управление ско¬ ростью вращения тела с одной осью симметрии (733). 10.8. Рекомендации по дальнейшему чтению литературы (744). * * * Литература , 745 Алфавитно-предметный указатель 758
ПРЕДИСЛОВИЕ Последние достижения науки об управлении вызвали необходимость написать книгу, являющуюся введением в теорию оптимального управле¬ ния, доведенную до практического применения. Цель данной книги — снабдить инженера или аспиранта основными знаниями, необходимыми для глубокого понимания теории оптимального управления автоматиче¬ скими системами. Мы надеемся, что материал, изложенный в книге, позво¬ лит аспирантам, начиная с ранней ступени их деятельности, успешно применять на практике теоретические положения работ по автоматиче¬ скому управлению и критически оценивать достоинства и значение много¬ численных работ, публикуемых в литературе по теории управления. Нам хотелось также указать на большое значение аккуратного и точного мышления и дисциплинированной интуиции для будущего ученого. В связи с этим в книгу было включено большое число примеров и упражнений. Книга подразделяется на три основные части: 1. Математическое введение в описание и анализ динамических систем (гл. 2—4). 2. Основные положения теории оптимального управления, включая принцип максимума Понтрягина (гл. 5 и 6). 3. Приложения теории оптимального управления к расчету систем с обратной связью, оптимальных по отношению к различным критериям (гл. 7—10). В гл. 2 излагаются достаточно конспективно основные положения линейной алгебры и определяются векторные обозначения, используемые на протяжении всей книги. В гл. 3 рассматриваются элементарные топо¬ логические свойства /г-мерного эвклидова пространства, основы теории векторных функций и различные положения векторных дифференциаль¬ ных уравнений. Гл. 4 посвящена изложению основных понятий о представлении дина¬ мической системы в пространстве состояний и определению задачи управ¬ ления. В гл. 5 выводятся и анализируются основные условия оптималь¬ ности, включая принцип максимума Понтрягина. Структура и основные свойства оптимальных систем по отношению к различным конкретным показателям преобразования рассматриваются в гл. 6, которая является переходной от теоретического материала предыдущих глав к проблемам расчета конкретных систем управления, рассматриваемых в последующих главах. Гл. 7 посвящена решению задачи оптимизации по быстродействию для некоторых специальных систем. В гл. 8 даются приложения теории к расчету систем, имеющих минимум расхода топлива. В гл. 9 предла¬ гаются вниманию читателя общие результаты, достижимые для одного важного класса задач оптимизации, а именно: для управления линейными объектами по критерию квадратичной интегральной оценки. В заключи¬ тельной главе (гл. 10) рассматривается класс задач автоматического 9
управления, которые решаются проще прямыми методами, нежели мето¬ дами, основанными на принципе максимума Понтрягина. Мы глубоко признательны многим нашим коллегам и студентам за их неоценимую помощь в подготовке данной книги. В частности, мы хотим поблагодарить профессора Калифорнийского университета в Беркли К- А. Дэзоера, декана Бруклинского политехнического института Джона Траксела, профессора Калифорнийского университета в Беркли Е. Р. Пол¬ лака, доктора X. К. Кнудсена из Линкольновской лаборатории Мас- сачузетского технологического института и доктора С. Дж. Кэхью из научно-исследовательской лаборатории ВВС в Кембридже за вниматель¬ ный просмотр рукописи и за их многочисленные, очень полезные предло¬ жения и комментарии. Мы также выражаем нашу благодарность доктору Г. Галкину из лабо¬ ратории фирмы «Бэлл-Телефон» в Уиппени за его замечания по гл. 4 и 5; профессору В. У. Броккэту из Массачузетского технологического инсти¬ тута за предложения по гл. 6 и профессору P. Е. Калману из Стэнфорд¬ ского университета за очень полезные замечания по гл. 9. Ряд студентов Массачузетского технологического института помогли нам своими замеча¬ ниями и предложениями после очень внимательного изучения рукописи. Мы особенно хотим поблагодарить Д. Грея, Д. Клейнмана, У. Левина, Дж. Планта и X. Уитсенхаузена за их исключительную помощь в напи¬ сании книги. Р. А. Кэрол из Линкольновской лаборатории предоставил нам результаты расчетов на цифровой вычислительной машине, приведен¬ ные в гл. 9, за что мы ему очень признательны. И, наконец, мы хотим поблагодарить мисс Дж. М. Келли, которая выполнила исключительную работу по печатанию большей части рукописи, и миссис С. М. Маккей, которая очень помогла нам при подготовке рукописи. МАЙКЛ АТАНС ПИТЕР Л. ФАЛБ
ГЛАВА 1 ОСНОВНЫЕ ПОЛОЖЕНИЯ. СОДЕРЖАНИЕ КНИГИ 1.1. ВВЕДЕНИЕ В последнее десятилетие значительное внимание уделяется оптималь¬ ному управлению, получившему свое развитие в виде общей теории, осно¬ ванной на сочетании вариационных методов, теории автоматического регулирования и применении быстродействующих вычислительных машин. Поэтому возникла большая необходимость в изложении введения в теорию оптимального управления и ее приложений, которая снабдила бы инже¬ нера и студента теоретическими основами, необходимыми для глубокого понимания последних достижений в теории, практике расчетов и проекти¬ ровании систем автоматического управления. Предлагаемая вниманию читателя книга восполняет в какой-то мере данный пробел. В настоящей главе рассмотрены основные положения, сформулиро¬ вана задача синтеза оптимального управления и приведено содержание книги. В § 1.2 дана постановка задачи синтеза систем оптимального упра¬ вления. Затем в § 1.3 перечислены вопросы, которые необходимо решать при проектировании систем оптимального управления. Далее в § 1.4 изложена краткая история развития теории оптимального, управления и указано на перспективность вопросов, рассматриваемых в книге. В § 1.5 достаточно подробно рассказано о цели данной книги. Исходя из сформулированных задач будут сделаны общие замечания по структуре книги (§ 1.6) и подробно описано содержание ее глав (§ 1.7). Первая глава заканчивается § 1.8, в котором указываются требования к объему предварительных знаний, необходимых для чтения книги, а также даются некоторые предложения по изучению ее материалов, осно¬ ванные на нашем опыте преподавания. 1.2. ЗАДАЧА СИНТЕЗА СИСТЕМЫ Синтез системы начинается с постановки задачи (иногда довольно неопределенной), которая должна выполняться с помощью существующего или вновь разработанного метода. Например, специалисту по проекти¬ рованию систем может быть предложено увеличить выход химической дистилляционной колонны или спроектировать систему связи со спут¬ ником. В качестве требований к задачам инженеру обычно задается: 1. Некоторая совокупность целей, которые достигаются в результате осуществления физического процесса. Например, может быть поручено спроектировать ракету, способную перехватить заданную цель в течение определенного отрезка времени. 2. Некоторая совокупность ограничений как внутренних, присущих самому физическому процессу, так и наложенных искусственно, извне. Н
В реальных системах почти всегда существуют ограничения, связанные со стоимостью, надежностью или размерами объектов или устройств управления. Разработка системы, которая выполняет поставленные перед ней задачи и удовлетворяет наложенным на нее ограничениям, по сути дела, и есть проблема синтеза системы. Существуют два метода решения задачи синтеза: эмпирически — интуитивный (первый метод) и логически —дедуктивный (второй метод). Решая задачу синтеза первым методом, инженер использует свой опыт, умение, интуицию и результаты экспериментов с тем, чтобы создать из реальных агрегатов некоторый прототип требуемой системы. Он имеет дело с реальными агрегатами и не разрабатывает математических моделей, не прибегает к методу моделирования системы. Короче говоря, исходя из имеющихся агрегатов или оборудования, которое может быть разра¬ ботано, инженер просто собирает систему, выполняющую поставленную задачу. Например, если инженеру задан тип проигрывателя, оконечный усилитель и характеристики громкоговорителя, а перед ним ставится задача спроектировать систему звуковоспроизведения, отвечающую задан¬ ным показателям качества, то он может на основе экспериментов и своего опыта прийти к выводу, что заданные требования к качеству звуковос¬ произведения могут быть удовлетворены с помощью предварительного усилителя с вполне определенными характеристиками, который он зака¬ зывает и после его изготовления включает в рассматриваемую систему. Поэтому первый метод часто справедливо относится к «инженерному искусству». К сожалению, для сложных систем с высокой точностью работы пер¬ вый метод часто оказывается неприемлемым. Более того, высокая стои¬ мость оборудования, нужного для проведения экспериментов, и возмож¬ ность привести его в негодное состояние могут являться серьезным пре¬ пятствием к применению этого метода. Например, никто не вздумает пытаться управлять ядерным реактором, просто экспериментируя с самим реактором, и, наконец, первый метод редко приводит к созданию общих принципов синтеза систем, которые могут применяться при решении дру¬ гих задач. Второй метод решения задачи синтеза начинается с замены реальной системы математическими соотношениями. Другими словами, первый шаг синтеза состоит в разработке математической модели, соответствующей фи¬ зическому процессу, целям системы и налагаемым ограничениям. Удовле¬ творительное математическое описание и формулировка проблемы синтеза системы являются исключительно увлекательной и сложной задачей. Желаемые особенности системы, такие как надежность и простота, почти невозможно перевести на математический язык х. Более того, математи¬ ческие модели, которые являются идеализацией и приближением к реаль¬ ным системам, не являются единственными. Сформулировав задачу синтеза в виде некоторых математических зави¬ симостей, инженер, проектирующий систему, ищет далее ее структурную 1 В настоящее время на основе развития методов регуляризации некорректных задач А. Н. Тихонова В. В. Солодовниковым разработан принцип минимальной сложности, позволяющий синтезировать систему управления с наиболее простой структурой. См., напри¬ мер, следующие работы: Солодовников В. В., Ленский В. Л. Синтез систем управления минимальной сложности. «Изв. АН СССР. Техническая кибернетика», 1966, № 2. Солодовников В. В., Ленский В. Л. Принцип минимальной сложности и регу¬ ляризация задач синтеза систем управления (гл. 5); Синтез оптимальных систем и коррек¬ тирующих устройств минимальной сложности (гл. 8). В сборнике «Современные методы проектирования систем автоматического управления. Анализ и синтез». М., «Машинострое¬ ние», 1967 (Прим. ред.). 12
схему, которая представляет собой аналитическое решение стоящей перед ним проблемы синтеза. Моделирование математических соотношений с помощью средств вычислительной техники (цифровых, аналоговых или аналогово-цифровых) часто играет весьма важную роль в поисках нужного решения. Полученное решение даст инженеру некоторые представления о числе требуемых взаимозависимостей, о типе вычислений, которые должны быть проделаны, о необходимых математических описаний подсистем и т. д. После определения соотношений, описывающих систему в целом, инженер часто моделирует их с тем, чтобы глубже «заглянуть внутрь» системы и исследовать поведение модели при идеальных условиях. Из мо¬ делирования можно сделать вывод о том, насколько математические соот¬ ношения соответствуют реальной физической системе, исследовать чув¬ ствительность модели к изменениям параметров и непредсказуемым воз¬ мущениям, сравнить различные варианты структуры системы. После завершения проектирования и проверки путем моделирования и экспериментов с моделью инженер строит прототип системы в виде макета. Процесс макетирования обратен процессу моделирования, по¬ скольку макет — это физическая система, которая должна адекватно изображать полученные математические соотношения. Затем исследуется макет системы с целью установить, отвечает ли система предъявленным требованиям и удовлетворяются ли заданные ограничения. Если система функционирует правильно, работа может считаться завершенной Е Часто по экономическим или другим причинам инженер бывает не удовлетворен системой, которая выполняет поставленную задачу, и он пытается ее улучшить, или оптимизировать. Процесс оптимизации на этапе предварительного проектирования весьма полезен с точки зрения пони¬ мания работы системы и часто используется для сравнения вариантов, в то время как процесс оптимизации на этапе математического макетиро¬ вания связан в основном с выбором лучших показателей. Роль оптими¬ зации в задаче синтеза будет рассмотрена в следующем параграфе. 1.3. ЦЕЛЬ УПРАВЛЕНИЯ Определенный класс задач синтеза систем представляет собой задачу «управления» системой. Например, перед инженером может быть постав¬ лена задача разработать автопилот с определенным видом переходной характеристики, быстродействующую следящую систему или систему управления положением спутника, которая не потребляла бы слишком много топлива. Запись целей управления в математической форме на этапе предварительного проектирования обычно называют задачей управления. Существенными элементами задачи управления являются: 1) математическая модель системы, которой надо управлять; 2) желаемый выходной сигнал системы; 3) совокупность допустимых входов или управляющих сигналов; 1 По терминологии, принятой в СССР, первый этап проектирования системы управ¬ ления, выполненный на основе математических соотношений, именуется предварительным (предэскизным) проектированием. Второй этап проектирования, когда упрощенные мате¬ матические соотношения заменяются более полной математической моделью, реализуемой на электронных вычислительных машинах, называется эскизным проектированием (мате¬ матическим моделированием). На третьем этапе проектирования к электронной модели подключается динамический стенд, имитирующий перемещения объекта управления. Макеты реальной аппаратуры управления устанавливаются на стенде. Этот этап проектиро¬ вания именуется стендовой отработкой системы управления (физическим моделированием). И, наконец, на четвертом этапе проектирования производится отработка системы управле¬ ния в реальных условиях (натурные испытания). (Прим, ред.). 13
4) функционал, или стоимость, измеряющие эффективность данного процесса управления. Рассмотрим теперь, как возникают эти элементы из физической задачи синтеза реальной системы управления. Математическая модель, представляющая физическую систему, состоит из набора соотношений, которые описывают реакцию или «выход» системы относительно различных входных сигналов. Ограничения, основанные на особенности физических процессов в системе, связаны с этим набором соотношений между входами и выходом системы. При переводе задачи проектирования в задачу управления инженер сталкивается с трудностью описания желаемого физического поведения системы в математической форме. Цели системы часто переводятся в тре¬ бования к выходу системы. Например, если проектируется следящая система, желаемым выходом является сам отслеживаемый сигнал (или сигнал, достаточно близкий к нему). Поскольку «управляющие» сигналы в физической системе обычно полу¬ чаются с помощью устройств, которые могут обеспечить лишь ограничен¬ ные по величине силы или энергии, на входные сигналы накладываются некоторые ограничения. Эти ограничения дают набор так называемых допустимых входных (управляющих) сигналов. Часто желаемые цели могут быть достигнуты с помощью различных управляющих сигналов, и поэтому инженер отыскивает способ измерения качества работы системы или стоимости управления, который позволил бы ему выбрать «лучший» вход. Выбор математического выражения функцио¬ нала является весьма субъективным моментом, так как выбор, сделанный одним проектировщиком, не является для другого обязательным. Опыт и интуиция инженера играют важную роль в определении функционала стоимости, подходящего для поставленной перед ним задачи. Более того, функционал (стоимость) будет зависеть от желаемого поведения системы. Например, при стремлении ограничить колебания переменной, описы¬ вающей поведение системы, например х (/), можно принять стоимость преобразования (функционал) пропорциональной [х(/)]6 и пытаться сде¬ лать интеграл этой стоимости на отрезке времени, скажем Ц < / < /2, малым. В большинстве случаев функционал выбирается таким образом, чтобы его величина зависела от входного сигнала и переменных, описы¬ вающих поведение системы. Когда функционал выбран, задача управления формулируется сле¬ дующим образом: требуется определить допустимые входные сигналы, обеспечивающие получение желаемого результата на выходе, одновре¬ менно минимизируя (оптимизируя) выбранный показатель. Теория опти¬ мального управления помогает инженеру в отыскании решения стоящей перед ним задачи. Такое решение (если оно существует) называется опти¬ мальным управлением. Итак, задача управления есть перевод задачи синтеза системы управ¬ ления на язык математики; решение задачи управления относится к опре¬ деленной методике, которой руководствуется инженер при разработке реальной системы управления. 1.4. ИСТОРИЧЕСКИЙ ОБЗОР До второй мировой войны проектирование систем управления пред¬ ставляло собой искусство. В течение войны и после нее было потрачено много усилий на проектирование замкнутых систем, в которых отрица¬ тельная обратная связь использовалась для улучшения переходного про¬ цесса и повышения точности. Первые теоретические методы анализа си- 14
стемы автоматического регулирования опирались на работы Г. Бодэ и Найквиста х. В частности, такие понятия, как частотная характеристика, ширина полосы пропускания, усиление (в децибеллах) и запас фазы исполь¬ зовали для проектирования систем в частотной области, основываясь на способе проб и ошибок. По сути дела, это было началом инженерных методов современной теории управления. Теория автоматического регулирования 1 2 быстро развивалась в период после окончания войны и до начала 50-х годов. В это время широко при¬ менялись временные критерии, такие как время нарастания, время пере¬ ходного процесса, максимум относительного перерегулирования. Метод корневого годографа, предложенный в 1948 г. У. Эвансом 3, явился свя¬ зующим началом между методами анализа и синтеза во временной и ча¬ стотной областях и представляет собой достаточно мощный аналитический инструмент исследования. В течение этого периода инженер, занимаю¬ щийся управлением, имел дело с проектированием линейных следящих систем. Небольшими нелинейностями объекта и усилителя мощности можно было пренебречь, так как отрицательная обратная связь делала харак¬ теристики системы нечувствительными к изменениям параметров и воз¬ мущениям. Технический прогресс промышленного производства и исследования космоса, которые начались в середине столетия, пробудили интерес как к системам с исключительно высокой точностью и требованием мини¬ мальной стоимости, так и к нелинейным системам управления, в частности релейным системам управления, так как реле является простым и непри¬ хотливым усилителем мощности. Для анализа систем управления с релей¬ ными устройствами было предложено два метода: описывающей функции 4 1 В эти же годы в СССР А. В. Михайловым, В. В. Солодовниковым и многими другими учеными закладывались теоретические основы частотных методов ана¬ лиза и синтеза линейных систем автоматического регулирования. Более подробно с исто¬ рией развития теории автоматического регулирования в СССР можно ознакомиться по книге «Техническая кибернетика, книга 1. Теория автоматического регулирования», М., «Маши¬ ностроение», 1967 (Прим. ред.). 2 См. Основы автоматического регулирования. Теория. Под ред. В. В. Солодовни¬ кова. М., Машгиз. 1954 (Прим. ред.). 3 В том же году в СССР была опубликована работа К. Ф. Теодорчика «Траектории корней характеристического уравнения системы третьего порядка при не¬ прерывном изменении свободного члена и максимально достижимая при этом устойчи¬ вость», журнал «Теория физики», том 18, 1948. В практике проектирования автоматических систем в СССР метод корневого годо¬ графа нашел ограниченное применение, хотя он и освещался достаточно широко в оте¬ чественной литературе, см. например: Удерман Э. Г. Метод корневого годографа в теории автоматического управле¬ ния. М., Госэнергоиздат. 1963 (Прим. ред.). 4 Метод гармонической линеаризации или гармонического баланса Крылова—Бого¬ любова (или по терминологии, принятой в США, описывающей функции) основан на исполь¬ зовании асимптотических разложений, представляющих развитие теории возмущений. Дальнейшее развитие этого метода принадлежит Е. П. Попову и Л. С. Гольдфарбу. Крылов Н. М.,Боголюбов Н.Н. Основные проблемы нелинейной механики. Изв. АН УССР, 1933, № 4, стр. 475—498. Крылов Н. М., Боголюбов Н. Н. Вве¬ дение в нелинейную механику. Изд. АН УССР. Киев, 1937, 364 стр. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний. Изд. 3-е. М., Физматгиз. 1963, 410 стр. Попов Е. П. Динамика систем автоматического регулирования. М., Гостехиздат. 1954. Попов Е. П., Пальтов И. П. Приближенные методы исследования нелиней¬ ных автоматических систем. М., Физматгиз. 1960, 792 стр. Гольдфарб Л. С. О некоторых нелинейностях в системах регулирования. «Автоматика и телемеханика», т. 8, 1947, № 5, стр. 349—383. (Прим. ред.). 15
и фазового пространства Г Метод описывающері функции позволяет инже¬ неру исследовать устойчивость замкнутой нелинейной системы с частотной точки зрения, а метод фазового пространства — проектировать нелиней¬ ные системы управления во временной области. Законы управления, обеспечивающие минимальное время переходного процесса (в терминах линий и поверхностей переключения), для различ¬ ных систем второго и третьего порядка были получены в начале 50-х годов. Доказательства оптимальности были эвристическими и, по сути дела, геометрическими. Однако идея определения оптимальности системы по отношению к такому специфическому показателю качества системы как время переходного процесса представляла значительный интерес для ин¬ женера-проектировщика. Точная формулировка этой проблемы привлекла к ней интерес математиков. Проблема оптимального по времени управления интенсивно изуча¬ лась математиками в СССР и США. В 1953—1957 гг. Р. Веллман, Р. В. Гам- крелидзе, Н. Н. Красовский и Ж. Ла-Саль развили основы теории задачи о минимальном времени перехода и представили результаты, связанные с существованием, единственностью и основными свойствами управления, оптимального по быстродействию1 2. Вскоре последовалопризнание того, что задачи управления, по сути дела, являются и задачами вариационного исчисления. Классическое вариационное исчисление не может с легкостью обхо¬ диться с теми «жесткими» ограничениями, которые обычно имеют место в задачах управления. Это затруднение привело Л. С. Понтрягина к пер¬ вому предположению о существовании его знаменитого принципа макси¬ мума и затем к тому, чтобы вместе с В. Г. Болтянским и Р. В. Гамкрелидзе дать его доказательство 3. Принцип максимума был впервые провозглашен на международном конгрессе математиков, который проходил в Эдин¬ бурге в 1958 г. Принцип максимума Понтрягина можно рассматривать как способ подхода к вариационным задачам Гамильтона, а метод динамического программирования Веллмана следует рассматривать как направление, иду¬ щее по пути Гамильтона—Якоби. Использование методов динамического 1 Метод фазового пространства был создан и развит А. А. Андроновым и его учени¬ ками. Андронов А. А., X а й к и н С. Э. Теория колебаний, ч. 1. ОНТИ. М.—Л., 1937 или Андронов А. А., Витт А. А. и Хайкин С. Э. Теория колебаний, 2-е изд, переработ. и доп. Н. А. Железцовым. М., Физматгиз. 1939, 915 стр. (Прим. ред.). 2 Из числа первых работ в области оптимальных по быстродействию систем управ¬ ления, выполненных в СССР, следует назвать: Фельдбаум А. А. Оптимальные процессы в системах автоматического регули¬ рования. «Автоматика и телемеханика», т. 14, 1953, стр. 712—728. Фельдбаум А. А. О синтезе оптимальных систем с помощью фазового про¬ странства. «Автоматика и телемеханика», т. 16, 1955, № 2, стр. 120—149. Болтянский В. Г., Гамкрелидзе Р. В..Понтрягин Л. С. К теории оптимальных процессов «ДАН», т. ПО, 1956, № 1, стр. 7—10. Гамкрелидзе Р. В. К теории оптимальных процессов в линейных системах «ДАН», т. 116, 1957, № 1, стр. 9—11. Красовский Н. Н. К теории оптимального регулирования. «Автоматика и телемеханика», т. 18, 1957, № 11, стр. 960—970. Красовский Н. Н. Об одной задаче оптимального регулирования. «Приклад¬ ная математика и механика», т. 21, 1957, № 5, стр. 670—677. (Прим. ред.). 3 См. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории оптимальных процессов «ДАН», т. ПО, 1956, № 1, стр. 7—10 или Понт¬ рягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мишенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз. 1951, 391 стр. Болтянский В. Г. Математические методы оптимального управления. М., Физ¬ матгиз. 1966, 307 стр. (Прим, ред.) 16
программирования в решении задач управления принесло большую пользу. Одновременно с быстрым развитием теории управления происходил непрерывный прогресс в области вычислительной техники, которая снаб¬ дила инженеров неограниченно расширяющимися вычислительными воз¬ можностями и мощными средствами моделирования. Широкая доступность специализированных и универсальных вычислительных машин значи¬ тельно сократила потребность получения решений в замкнутой форме и требования к тому, чтобы корректирующие устройства осуществлялись с помощью RC цепочек. Современная теория и техника управления могут, следовательно, рассматриваться как результат слияния трех различных направлений: теории автоматического регулирования, вариационного исчисления и вы¬ числительной техники. В наши дни теория управления является прежде всего средством проектирования, позволяющим инженеру-проектировщику правильно вы¬ бирать внутреннюю структуру и находить аналитическим способом реше¬ ния задачи оптимального управления. Из этого совершенно не следует, что процесс проектирования оптимальных систем управления является достаточно простым делом. Поскольку оптимальные системы с обратной связью, как правило, сложны и в принципе нелинейны, то очень трудно анализировать влияние изменения параметров и возмущений на характе¬ ристики системы. В добавок к этому необходимость точного измерения переменных (или фазовых координат) и вычислительные трудности, свя¬ занные с отысканием оптимального управления, могут сделать оптималь¬ ное устройство экономически нецелесообразным. Тем не менее мы глубоко убеждены в том, что современная теория управления будет становиться все более полезной наукой для инженерной практики. Для этого есть несколько оснований. Во-первых, предэскизные проекты и модели, выполненные с помощью цифровых или аналоговых машин, могут служить основой для сравнения вариантов проектируемых систем. Во-вторых, знание оптимального решения данной задачи служит инженеру надежной путеводной нитью при выборе варианта, близкого к оптимальному. В-третьих, прогресс в области вычислительной техники будет способствовать преодолению затруднений, которые возникают при реализации оптимальных законов управления в реальных системах с помощью существующих вычислительных средств. И, наконец, хотя оптимальные устройства далеко не часто могут быть реализованы, тем не менее теория расширяет горизонты инженерной практики и, следова¬ тельно, позволяет инженеру браться за решение таких сложных и труд¬ ных проблем, о которых раньше он не смел и подумать. 1.5. НАЗНАЧЕНИЕ КНИГИ При написании этой книги мы преследовали две основные цели. Во-первых, хотели создать учебник по теории оптимального управления и ее приложениям для аспирантов первого года обучения, специализи¬ рующихся в области автоматического управления; во-вторых, — снабдить инженеров и аспирантов доступным и значительным теорети¬ ческим фундаментом, необходимым для дальнейшего развития теории и практики систем автоматического управления. Мы не пытались и не хотели написать исчерпывающую монографию. В книге уделено довольно много внимания разработке вводного мате¬ риала, который излагается весьма детально. В частности, мы хотели: 1. Развить основы математического аппарата, необходимые для глу¬ бокого понимания теории. 17
2. Дать строгую формулировку задачи управления. 3. Изложить необходимые условия оптимальности, уделив особое внимание принципу максимума Понтрягина и основным достаточным условиям в форме уравнений Гамильтона—Якоби. 4. Проиллюстрировать приложения теории простыми задачами, при¬ бегая к помощи различных общепринятых критериев оптимальности. 5. Рассмотреть структуру, свойства и техническую реализацию неко¬ торых оптимальных систем с обратной связью. В книге мы не стремились излишне «углубить» многие из рассматри¬ ваемых вопросов и опускали целый ряд других важных задач. Поэтому при доказательствах часто использовались эвристические положения. А для изучения более строгих доказательств мы отсылаем читателя к соот¬ ветствующим литературным источникам. Надеемся, что основной материал, изложенный в книге, позволит аспирантам на ранней ступени их научной деятельности применять на практике достижения теории автоматического управления и квалифици¬ рованно оценивать достоинства и значение бесчисленных статей, публи¬ куемых в литературе по автоматическому управлению (которые, к сожа¬ лению, содержат много неосновательных претензий на всеобщность). Хотим также отметить неоценимое значение для будущего ученого более строгого мышления и дисциплинированной интуиции, которые так необ¬ ходимы для его развития. Мы обнаружили, что аспиранты, специализирующиеся в области прак¬ тики автоматического управления, не могут по настоящему изучить теорию управления без убедительных примеров и выполнения определенного числа упражнений. Только с помощью последних они могут оценить полезность и преимущества теории. Примеры нужны и математикам-прикладникам, стремящимся внести свой вклад в теорию, поскольку эти примеры часто помогают им отличать физический смысл от чисто математического. Поэтому в книгу включено большое число примеров и упражнений, которые, мы надеемся, будут полезны аспирантам, инженерам и мате¬ матикам-прикладникам. 1.6. ОБЩИЕ ЗАМЕЧАНИЯ ПО СТРУКТУРЕ КНИГИ Книга может быть разделена на следующие три основные части: 1. Математические основы, относящиеся к описанию и анализу дина¬ мических систем (гл. 2—4). 2. Некоторые положения теории оптимального управления, включая принцип максимума Понтрягина для непрерывных детерминированных систем с конечным числом переменных (гл. 5—6). 3. Приложения теории к расчету систем с обратной связью, опти¬ мальных по отношению к различным критериям (гл. 7—10). На протяжении всей книги мы часто пытались строго формулировать определения, теоремы и задачи; с другой стороны, иногда лишь бегло описывали доказательства, опустили или отнесли к числу упражнений многие доказательства, сославшись на соответствующую литературу. Мы считали такой метод изложения наиболее удобным для аспирантов, специализирующихся в области техники автоматического управления. В книге использованы обозначения теории множеств и векторной алгебры, позволяющие избежать громоздких математических записей, затрудняющих изучение основных положений. Мы знаем, что после на¬ чального переходного периода аспиранты приспосабливаются к такой тер¬ минологии и способу думать «физически» в терминах множеств, векторов и матриц. Основные положения книги, как правило, иллюстрируются 18
примерами. Мы, однако, не пытались скрыть трудности, особенно вычисли¬ тельного характера, связанные с анализом и синтезом систем со многими переменными. Большинство тщательно проработанных примеров включено в книгу с целью снабдить читателя иллюстрациями общей теории. Эти примеры послужат углублению понимания и повышения уровня интуиции. Кроме того, включены многочисленные упражнения. Упражнения распадаются на три категории: 1) обычные упражнения; 2) упражнения, которые используются для иллюстрации «вершин» теории, а также вычислительных трудностей, связанных с определением оптимальных законов управления х; 3) упражнения для обоснования новых положений теории и прило¬ жений. Некоторые из них относятся к категории «почти невозможных». Мы часто ссылаемся на несколько литературных источников по од¬ ному и тому же вопросу. Кроме того, отмечаем литературу, относящуюся к тому или иному конкретному вопросу, так что заинтересованный чита¬ тель может с успехом «обратиться за консультацией» к литературным источникам. С этой целью в книгу включена подробная библиография, которая, однако, не является исчерпывающей. В нее были включены статьи, отчеты и книги, с которыми мы знакомы. Поскольку нашей целью было дать введение в теорию оптимального управления и ее приложения, мы не обсуждаем множество важных вопро¬ сов, которые являются слишком «продвинутыми» или требуют дополни¬ тельной подготовки. В частности, в книге не освещены следующие вопросы: 1. Вычислительные алгоритмы для определения законов оптималь¬ ного управления сложных систем. 2. Задачи с ограничениями фазовых координат. 3. Теория оптимального управления для дискретных (или импульс¬ ных) систем. 4. Задачи, связанные с объектами с распределенными параметрами. 5. Теория оптимального управления для стохастических систем. 6. Проектирование оптимальных фильтров, интерполяторов, сглажи¬ вающих устройств 1 2. Ниже кратко перечислены некоторые из причин, по которым эти важ¬ ные вопросы были опущены. 1. Несмотря на то, что много усилий было посвящено (и посвящается) разработке сходящихся вычислительных алгоритмов, было получено мало общих результатов, которые гарантировали бы сходимость или содер¬ жали бы информацию относительно скорости сходимости алгоритма. 2. Ограничения фазовых координат более сложны для анализа, чем ограничения управляющих сигналов. Необходимые условия для задач с ограничениями фазовых координат имеются в литературе, но, по нашему мнению, не относятся к материалам вводного характера. 3. Теория дискретных стохастических систем 3, а также систем с рас¬ пределенными параметрами 4 в настоящее время еще только развивается. Поскольку изучение систем с распределенными параметрами требует знания дифференциальных уравнений в частных производных, а изучение стохастических систем требует знания теории вероятностей (в том числе 1 Некоторые упражнения гл. 9 требуют использования цифровой вычислительной машины. 2 Читатель, которого интересуют перечисленные выше вопросы, может ознакомиться с ними по литературным источникам, добавленным при переводе книги. (Прим. ред.). 3 См. [312]. 4 См. [235]. 19
стохастических дифференциальных уравнений), эти вопросы, очевидно, не годятся для введения в теорию оптимального управления. 4. Для синтеза оптимальных фильтров линейных систем с гауссовыми шумовыми процессами может быть использована теория Винера—Кал- мана—Бюси. Однако общие результаты, относящиеся к нелинейным системам с негауссовым шумом, в настоящее время недоступны для целей практики. Заинтересованный читатель без больших затруднений сможет изучать теорию Винера—Калмана—Бюси после усвоения разделов дан¬ ной книги, относящихся к детерминированным системам. В следующем параграфе приводится описание содержания каждой из глав книги. 1.7. ОПИСАНИЕ СОДЕРЖАНИЯ ГЛАВ КНИГИ Ниже дается краткое описание содержания каждой из глав. При этом особое внимание уделяется взаимным связям между различными главами. Линейная алгебра (гл. 2). В этой главе дается обзор основ¬ ных положений линейной алгебры и приводятся векторные и матричные обозначения, которые используются далее на протяжении всей книги. После краткого изложения известных положений и теории множеств вво¬ дится понятие векторного пространства, а затем рассматриваются линей¬ ные преобразования. Теория матриц излагается в основном с точки зре¬ ния линейных преобразований, и в значительно меньшей степени исполь¬ зуется распространенный подход к матрицам как к упорядоченным наборам чисел. Мы подчеркиваем, что матрица связана с линейным преобразова¬ нием и заданной координатной системой, а также указываем, что линейные преобразования являются внутренними, а матрицы ими не являются. В остальной части гл. 2 рассматриваются собственные значения и собст¬ венные векторы, подобие матриц, внутреннее и скалярное произведения, эвклидовы векторные пространства и некоторые свойства симметричных матриц. Материал этой главы используется в каждой из последующих глав книги. Математический анализ (гл. 3). В гл. 3 обсуждаются элементарные топологические свойства n-мерного эвклидова пространства, основы теории векторных функций и некоторые положения векторных дифференциальных уравнений. Эта глава начинается с изучения понятия расстояния и связанных с ним представлений об открытых и закрытых множествах, о компактности. Далее рассматриваются функции различных переменных, развиваются определения непрерывности, кусочной непре¬ рывности (или регулярности), производной, градиента и интеграла таких функций. Вводятся важные понятия функционального пространства и рас¬ стояния между элементами функционального пространства. Оставшаяся часть гл. 3 посвящена векторным дифференциальным уравнениям. Здесь доказываются основные теоремы существования и единственности и разви¬ вается метод решения линейных дифференциальных уравнений с помощью фундаментальной матрицы. Материал этой главы будет полезен при чтении последующих глав книги. Основные положения (гл. 4). В этой главе мы вводим понятия, связанные с представлением системы в пространстве состояний, приводим определение задачи управления и начинаем ее изучение. Рас- мотрение понятия «состояние системы» начинается на примере простых электрических цепей. После популярного изложения методов математи¬ ческого описания физических систем мы приводим аксиоматическое опре¬ деление динамической системы. Далее рассматриваются конечно-мерные непрерывные системы. Материал гл. 3 используется для того, чтобы уста- 20
новить соотношения между состоянием системы и начальными условиями дифференциальных уравнений, описывающих систему. В § 4.9 и 4.10 описываются приемы представления системы с постоянными параметрами, имеющей один вход и один выход, в пространстве состояний. Физический смысл фазовых координат иллюстрируется с помощью аналогового моде¬ лирования дифференциальных уравнений. Глава завершается формули¬ ровкой определения задачи управления и обсуждением некоторых след¬ ствий, вытекающих из этого определения. В частности, мы рассматри¬ ваем множество достигаемых состояний и качественные определения поня¬ тий управляемости, наблюдаемости и нормальности и развиваем некоторые из важных приложений этих понятий. Материал этой главы служит крае¬ угольным камнем теории и практики оптимального проектирования, рас¬ сматриваемых в последующих главах книги. Условия оптимальности. Принцип минимума1 иуравнение Гамильтона — Якоби (гл. 5). В этой главе формулируются и изучаются основные условия оптимальности. Мы вклю¬ чили сюда обзор теории отыскания минимума функций, определенных на n-мерном эвклидовом пространстве; упоминание об использовании вычисления вариаций для решения задач управления; постановку и эври¬ стическое доказательство принципа минимума Понтрягина и рассмотрение уравнений Гамильтона—Якоби, основанных на сочетании «принципа опти¬ мальности» Веллмана и леммы Каратеодори по способу, предложенному Калманом. Для развития интуиции у читателя мы начинаем изложение с обычного минимума (с § 5.2 по § 5.4) и приводим обзор применения метода неопределенных множителей Лагранжа для решения задачи мини¬ мизации с ограничениями. Далее излагаем вариационный подход к задачам управления (с § 5.5 по § 5.10), шаг за шагом показывая способ, который можно использовать, чтобы найти некоторые необходимые и достаточные условия оптимальности. С § 5.11 по § 5.17 приведены некоторые необхо¬ димые условия оптимальности, основанные на принципе минимума Пон¬ трягина. Мы тщательно формулируем различные задачи управления и варианты принципа минимума, соответствующие каждой из этих задач. Эвристическое доказательство принципа минимума, опирающееся в основ¬ ном на геометрические представления, приводится в § 5.16. Некоторые следствия принципа минимума приведены в § 5.17. Глава завершается рассмотрением условий Гамильтона—Якоби и связанными с ними доста¬ точными условиями. Здесь также показывается, что принцип минимума является основным методом отыскания оптимального управления систем, рассматриваемых в гл. 7—10. Структура и свойства оптимальных систем (гл. 6). В этой главе исследуются структура и основные свойства систем, оптимальных по отношению к различным специальным критериям ка¬ чества; указываются методы, позволяющие определить, являются ли опти¬ мальные и экстремальные управления единственными, а также рассмат¬ ривается вопрос единственности управлений. Далее авторы концентрируют свое внимание на вопросах, позволяющих перейти от теоретического мате¬ риала предыдущих глав к конкретным задачам проектирования, которые и являются содержанием последующих глав книги. Вначале рассматри¬ вается задача управления, оптимального по быстродействию для линейных и нелинейных систем (с § 6.2 по § 6.10). После обсуждения задачи управ¬ ления, оптимальной по быстродействию, с геометрической точки зрения 1 В этой книге «принцип максимума» назван «принципом м и н и - м у м а». Отличие формулировки состоит в перемене знака и совершенно не сказывается на результатах расчетов. (Прим. ред.). 21
для получения соответствующих необходимых условий используется принцип минимума. Затем приводятся определения единственности и нор¬ мальности, а также принципа релейного управления для нормальных систем с оптимальным быстродействием. Мы рассмотрим ряд теорем, отно¬ сящихся к существованию, единственности и числу переключений для линейной инвариантной по времени системы (§ 6.5). Материал этой части настоящей главы используется в гл. 7. Далее с § 6.11 по § 6.16 излагается задача оптимального управления на минимум расхода топлива. Для полу¬ чения необходимых условий снова используется принцип минимума, а затем следуют доказательства единственности и нормальности задач, оптимальных по расходу топлива. Устанавливается принцип релейного управления для нормальных задач на оптимум расхода топлива и разви¬ ваются теоремы единственности для линейных систем с постоянными пара¬ метрами. Мы рассмотрим также различные формулировки задач, учиты¬ вающие оптимальность как по времени, так и по расходу топлива (§ 6.15). Этот материал используется в гл. 8. С § 6.17 по § 6.20 приведены задачи на минимум энергии. Дано аналитическое решение задачи с фиксирован¬ ными временем и конечным состоянием для линейной системы с постоян¬ ными параметрами и иллюстрируются общие результаты на довольно простом примере. Эти результаты мы применяем и развиваем в гл. 9. Глава завершается краткими замечаниями о проблемах единственности (§ 6.21 и 6.22) и некоторыми соображениями относительно существования и единственности оптимальных и экстремальных управлений. Проектирование систем, оптимальных по быст¬ родействию (гл. 7). Теория, развитая в гл. 5 и 6, применяется в этой главе к решению задачи оптимального быстродействия для ряда конкретных систем. Рассматривается определение оптимального по быстро¬ действию управления как функции от состояния системы; исследуются структуры систем с обратной связью, оптимальных по быстродействию; указываются типы нелинейностей в цепи обратной связи. Здесь же изу¬ чается синтез субоптимальных систем. Мы начинаем с § 7.2 по § 7.6 рас¬ сматривать объекты, передаточные функции которых имеют только веще¬ ственные полюсы. Сложность оптимальных по быстродействию систем с обратной связью иллюстрируется путем сравнения оптимальной по быстродействию системы для объектов второго порядка (§7.2 и 7.3) с аналогичной системой для объекта третьего порядка (§ 7.4). Далее исследуется задача оптимального быстродействия для объектов типа коле¬ бательного звена без затухания (с § 7.7 по § 7.9). Мы показываем (§ 7.10 и 7.11), как результаты, полученные для линейных систем, можно исполь¬ зовать при решении задачи оптимального управления для одного класса нелинейных систем, применяя при этом экспериментальные характери¬ стики и графические построения. В заключение главы рассматриваются объекты, передаточные функции которых содержат как нули, так и полюсы (с § 7.12 по § 7.15). Мы отмечаем влияние на характер и структуру опти¬ мальной по быстродействию системы управления минимально-фазовых и не минимально-фазовых передаточных функций объектов. Проектирование систем оптимальных по рас¬ ходу топлива (гл. 8). Теоретические положения гл. 5 и 6 мы исполь¬ зуем для расчета ряда систем, оптимальных по расходу топлива. Показы¬ ваем при этом, что для консервативных систем управление по минимуму расхода топлива часто оказывается не единственным. В главе рассматри¬ ваются способы, с помощью которых в задачах на минимум расхода топ¬ лива может быть учтено также и время перехода. Приводятся также практические реализации такого рода оптимальных систем. Особо отме¬ чаем, что нелинейные системы часто допускают единственные решения 22
задачи управления, оптимального по расходу топлива (в противополож¬ ность задаче об оптимальном быстродействии). Глава начинается с рас¬ смотрения не единственности оптимальных по топливу управлений (с § 8.2 по § 8.5). С § 8.6 по § 8.10 исследуются различные методы, позволяющие включить время перехода в функционал преобразования. Возможность единственности решения также обсуждается в § 8.10. Глава завершается замечаниями относительно графических методов, которые часто исполь¬ зуются для отыскания оптимального управления как функции исходного состояния в задачах на оптимальное по расходу топлива управление. Проектирование оптимальных линейных си¬ стем по квадратичному критерию (гл. 9). В этой главе излагаются общие результаты для важного класса задач оптимизации, а именно — задач управления линейными объектами с переменными пара¬ метрами и квадратичным критерием оптимальности. На основании неко¬ торых результатов Калмана по задаче инверсии материал этой главы можно рассматривать, по сути дела, как обобщение обычной теории управ¬ ления. При этом сначала исследуется задача о регуляторе состояния (с § 9.2 по § 9.6), а затем задача о регуляторе выхода (§ 9.7 и 9.8) и, нако¬ нец, глава завершается изучением задачи преследования (с §9.9 по §9.13). Поскольку в § 9.5, 9.8 и 9.9 изучаются линейные системы с постоян¬ ными параметрами, нетрудно обнаружить некоторую взаимосвязь между свойствами оптимальных систем и хорошо скорректированных следящих систем, для проектирования которых использована обычная теория авто¬ матического регулирования. Теоретические результаты настоящей главы легко могут быть использованы при управлении процессами (или объек¬ тами со многими входами и выходами или с переменными параметрами), для анализа которых невозможно непосредственно применять теорию автоматического регулирования. Задача оптимального управления для случая, когда управление ограничено гиперсферой (гл. 10). В этой главе изучается широкий класс задач управления, которые легче могут быть решены прямыми методами, нежели способами, основанными на принципе минимума. Основные положения рассматриваются с § 10.2 по § 10.6. С помощью типовых примеров мы иллюстрируем влияние огра¬ ничений на структуру и свойства систем, оптимальных по отношению к различным критериям оптимальности. 1.8. ТРЕБОВАНИЯ К МИНИМУМУ ЗНАНИЙ, НЕОБХОДИМЫХ ДЛЯ ЧТЕНИЯ КНИГИ, И ПРЕДЛОЖЕНИЯ ОТНОСИТЕЛЬНО ЕЕ ИЗУЧЕНИЯ Мы полагаем, что аспирант или инженер, специализирующийся в области автоматического управления и желающий использовать настоя¬ щую книгу в качестве учебника, хорошо владеет следующими дисцип¬ линами: 1. Основами теории автоматического регулирования, включая такие положения как переходной процесс системы, передаточные функции системы, обратная связь и коррекция линейных систем. 2. Обыкновенными дифференциальными уравнениями и математиче¬ ским анализом, включая применение метода преобразования Лапласа для решения линейных дифференциальных уравнений с постоянными коэффи¬ циентами, а также основными сведениями о матрицах вместе с некоторыми практическими навыками выполнения различных преобразований с мат¬ рицами. Мы считаем такую основу достаточной для понимания большей части книги. Для удобства читателя в книгу включены необходимые специаль¬ 23
ные разделы математики: линейная алгебра, векторные дифференциальные уравнения и некоторые другие. Основное содержание книги было изложено в специальном курсе, рассчитанном на один семестр обучения в Массачузетском технологиче¬ ском институте. Параграфы, отмеченные звездочкой в оглавлении, изла¬ гались в аудитории, остальные разделы изучались самостоятельно. Нельзя слепо следовать учебнику при чтении лекций. Поэтому различные препо¬ даватели расширят или сократят некоторые разделы в зависимости от собственных научных интересов или от уровня подготовки слушателей. В этой связи необходимо отметить, что гл. 8—10 не связаны непосредст¬ венно друг с другом и поэтому могут изучаться в любой последователь¬ ности. Для слушателей с более основательной подготовкой (например, после изучения курса, основанного на материалах книги Заде и Дэзоера «Теория линейных систем») гл. 2—4 можно в лекционном курсе опустить, рекомендовав слушателям прочесть их самостоятельно, а материал гл. 5 и 6 излагать более детально.
ГЛАВА 2 ЛИНЕЙНАЯ АЛГЕБРА 2.1. ВВЕДЕНИЕ Настоящая глава, а также гл. 3 посвящена математическим основам теории оптимальных систем управления. В этих главах приводятся основ¬ ные определения и теоремы, необходимые для понимания содержания остальных глав. Математические основы излагаются весьма конспективно, так как предполагается, что читатель знаком с большинством необходи¬ мых математических понятий. Следует также отметить, что приводится только тот материал, который необходим для понимания последующих разделов книги. В данной главе будут рассмотрены множества, функции, векторные пространства, линейная алгебра и эвклидовы пространства. Основной целью изложения является перевод известных физических понятий линей¬ ных систем на язык математики. Поэтому математический аппарат рас¬ сматривается с точки зрения векторного пространства и линейных преоб¬ разований, а не как некоторый набор операций над числами и матрицами. При дальнейшем изложении мы считали, что читатель хорошо знаком с детерминантами и их использованием при решении систем алгебраи¬ ческих линейных уравнений. Подробные изложения теории детерминантов содержатся в литературе ([24] см. гл. 10; или [21], см. дополнение А). Весь материал настоящей главы, целиком или по частям, можно найти в литературе, например, [21], [24], [51], [90], [124], [192], [196] и [212]. 2.2. МНОЖЕСТВА Рассмотрим объекты, которые имеют различные свойства и могут быть сопоставлены друг с другом. Набор объектов, имеющих некоторые общие характеристики и различающихся по своим свойствам, называется мно¬ жеством. Знак 6 используется для обозначения принадлежности к дан¬ ному множеству. Иначе говоря, если А есть множество, то а G А означает, что а является элементом множества А. Два множества одинаковы тогда и только тогда, когда они имеют одинаковые элементы. Если А и В — множества, то говорят, что А содержится в В или является подмножеством В, когда каждый из элементов А является эле¬ ментом В. Такое соотношение обозначается как А^В. (2.1) Пусть А есть множество и ^5 — свойство, которым могут обладать элементы множества Л, тогда \а : ^(а)| представляет собой совокупность элементов множества Л, действительно обладающих свойством Напри¬ 25
мер, если А есть множество всех девушек из Нью-Йорка, и $ — свойство быть блондинкой, то \а : ^З(в)} представляет собой множество всех нью- йорских блондинок. Пример 2.1. Допустим, что R — множество вещественных чисел и ^3—свойство «I I 1» (т. е. абсолютная величина меньше или равна 1). Тогда {г : | г | 1}представляет собой множество вещественных чисел, по абсолютной величине меньших или равных 1. Пусть 0 означает множество, в котором нет элементов. Тогда послед¬ нее называется пустым, или нулевым, множеством. Заметим, что Ф можно определить как \а : $(а)}, где ^3—любое свойство, которым не обла¬ дает ни один из элементов. Например, ^3 есть свойство «а=£а». Заметим также, что Ф с: А для любого множества А. Множество Л, элементы которого можно пронумеровать в последо¬ вательности alf а2, . . являющейся конечной или бесконечной, назы¬ вается счетным множеством. Отметим, что если множество имеет конечное число элементов, то оно является счетным. Но не каждое счетное множество имеет конечное число элементов. Например, множество {1, 2, 3| является конечным и, следовательно, счетным, в то время как множество |1, -4-, — , . . ) счетно, но не является конечным. Множество {г : I г I < 3 п I ’ til < 1} примера 2.1 не является счетным. 2.3. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ Рассмотрим ряд операций над множествами, а именно: суммирование, пересечение, дополнение и произведение. Если А и В —два множества, то сумма Л и В, обозначаемая как Л U В, является множеством всех элементов, принадлежащих множеству Л или множеству В. Заметим, что ЛиВ = |х:хЕЛ или хЕВ}. (2.2)1 Пересечением двух множеств Л и В, обозначаемым Л П В, называется множество элементов, одновременно принадлежащих обоим множествам Л и В. Заметим, что ЛрВ = {х:хЕЛ и xEBj. (2.3) Если Л и В — два множества и Л с В, то множество элементов В, которые не являются элементами Л, называют дополнением Л в В и обо¬ значают В — Л (или просто — Л, если смысл В ясен из контекста). Если обозначить X Е А те элементы х, которые не являются элементами Л, то легко видеть, что В — А = {х:х£В и х$Л}. (2.4) Наконец, произведением двух множеств Л и В, которое обозначается Л X В, называют множество всех упорядоченных пар (a, Ь), где а Е Л и b £ В. Укажем, что ЛхВиВхЛв общем случае не одинаковы. Можно записать Л X В - {(а, 6):аЕЛ 6Е В). (2.5) Иногда вместо (а, Ь) мы будем писать Рассмотрим далее неко¬ торые примеры операций. Символ R на протяжении всей книги будет использоваться для обозначения множеств вещественных чисел, и поэтому под R часто будет пониматься вещественная числовая ось или просто все вещественные числа. 1 <Или» не исключает возможности принадлежности х к обоим множествам А и В. 26
Пример 2.2. А= {r:O^r^l}, где г представляет собой элементы R. Пусть В = <j 2^, тогда имеем A J В — {г : 0^ г<^ 2} и A f] В = |г : -^-<J Г=С 1| • Пример 2.3. А = {г : 0 г 1}, где г — элементы R. Пусть В — {г : 0 г 2}, тогда A с В и В — А = {г : 1 < г 2}. Пример 2.4. А = {г : 0 г 1} и В = {s : 1 s 2}, где rus — элементы R. Тогда Д’ А X В = {(г, s) : 0 г 1, l<^s^2); (рис. 2.1, а); В X А — {(s, г) : 1 s 2, 1}. (рис. 2.1, б). 4 о Упражнение 2.1. Пусть R2 = R X R и А — подмножество R\ определенное как А --= {(х, у) : х2 -h У2^ 1}, и пусть В —под- Рис. 2.1 А X В отличается от В X А множество R2, определенное как В — — {(х, у) : (х — I)2 4~ у2 1}. Что представляют собой A f| В, A J В и R2 — Д? Вычертите фигуры, изображающие эти множества на плоскости. Если Лх, . . .,Ап —множества, то можно дать определения: объеди¬ нения, пересечения и произведения этих множеств. В частности, объеди- п нение A lf . . ., Ап, которое обозначается J Aif определяется как /=і и (\)аД и Лп. 1=1 \/=1 у (2.6) п Пересечение Alf . . ., Ап, обозначаемое П Ah определяется как /=і П ( п—\ \ П А = ПАП Ап, (2.7) І=1 \ І=1 ) п и, наконец, произведение Alf . . ., Ап, обозначаемое П AL или А1 X і=Л X А 2 X • • • X АПІ определяется как п П Л. = {(а1ў а2 ап) : aiÇ.Al для і = 1, ..п}. (2.8) <=і п Элементы П At часто называют упорядоченными n-ками чисел, которые иногда записывают в виде столбцов ai (2.9) Заметим, что п U At = [а :а£ Л1г или а£А2, или ..., или a G Л„}; І=1 П А= (а:а£ А и а G А2 и... и а^Ап}. Упражнение 2.2. Докажите уравнения (2.10). (2.10) 27
Эти понятия можно определить и для бесконечных наборов 4 = 1,2... со множеств. Например, объединение J At определяется как z=i со U At — {а : существует 40, для которого а £ AJ (2.11)1 Z=1 и пересечение оо П А( определяется как ■=-і оо п At — [a: a g Л- для всех і]. Z = 1 (2.12) Определение бесконечного произведения мы опускаем, так как в даль¬ нейшем оно нигде не используется. Пример 2.5. Пусть Аі = {г : —Z^ /}, для і = 0, 1, 2, . . где г представляет ОО оо собой элемент из R. Тогда J Л/ = R и П Л = {0}, т. е. подмножество из R, состоя- Z=1 щее лишь из 0. Пример 2.6. Пусть А[ для і= 1, 2, . . . есть подмножество из R2 (= R X R), определенное как Аі — {(х, у) : і х << і + 1}. Тогда Л, представляет собой полосу (рис. 2.2), параллельную оси у и заключен¬ ную между х~ іих = /+ 1, исключая точки прямой х= і + 1. Для этих множеств имеем Û Аі = {(х, уУЛ^х} и оо П Аі=0 (пустое множество). z=i Связь между различными операциями над множествами устанавливается с помощью сле¬ дующей простой теоремы. Теорема 2.1. а) Даны множества Л, В и С. Справедливы соотношения 1. А — А = 0 и А — 0 — А; 2. Л U А = А и А П А = А; 3. А с: С и В czC тогда и только тогда, когда Л (J В^С\ 4. СсЛ иСс£ тогда и только тогда, когда С с Л р В\ 5. Л U (В П С) = (Л U В) П И U Q; 6. Л П (В U С) = (Л П В) U (Л П С); б) Даны Л£ (4 = 1,2...) — подмножества из Л. Справедливы соот¬ ношения 1. а-( U А К п И-А); \z=i у z=i 2. л-fn Û И-А); \Z=1 / 1=1 в) Даны множества Л, В, С и D . Справедливы соотношения 1. Л X В = 0 только в том случае, если А = 0 или В = 0\ 2. (Л X В) U (С X В) - (Л U С) X В; 3. (Л X В) р (С X D) - (Л р С) X (В П D). Доказательство. Большинство выводов теоремы являются очевидными следствиями определений. Для иллюстрации этого докажем пункт 5. 1 Это означает, что существует по меньшей мере одно /0, для которого а А^. Может быть и большее число таких множеств. 28
Пусть а£А — тогда а не принадлежит Alt поскольку если бы а принадлежало Alf то оно принадлежало бы и J Л,. Другими словами, а^А —ЛР Из аналогичных рассуждений следует, что a g Е А — Л4; для всех і и, следовательно, а Е Q (Л — Л,). С другой сто- і— 1 роны, если а Е П (Л — Л4), то а Е А — At для всех і и, следовательно 1—1 / оо \ а не принадлежит ни одному из Л4. Из этого следует, что а £ А — ( U 4 • \/=і / Упражнение 2.3. Доказать часть теоремы 2.1 для соотношения б), пункт 2. 2.4. ФУНКЦИИ Вообще говоря, функция есть некоторое правило, устанавливающее связь элементов одного множества с элементами другого множества. Более строго функцию можно определить следующим образом. Пусть Л и В — множества и G — такое подмножество Л X В, что существует по крайней мере один элемент (а, Ь) множества G для каждого а из А. Заметим, что для некоторых элементов а из А может и не быть соот¬ ветствующих элементов (а, Ь) в G. G в этом случае называют графом. Если [а, Ь) есть элемент графа G, то b называют значением G, соответ¬ ствующим а, и записывают fe-G(a). (2.13) Соотношение (2.13) между Л и В называют функцией В от Л (преобра¬ зованием Л в В); часто это записывают просто как G (а) или G. Множество элементов а из Л, для которых существуют пары (а, Ь) в G, называется областью существования G (а) или G, а множество элементов b в В, для которых существуют пары (а, Ь) в G, называется областью изменения G (а) (или G). Пример 2.7. Пусть А = В ~ R и G — подмножество из R2, определенное как G = = ((a, b) : b = а2} (см. рис. 2.3). Тогда G есть граф; соотношение b = G (а) = а2 есть Рис. 2.3. Типичный граф G Рис. 2.4 Граф G и множества 6(Лі) и G-1 (BJ. Множество G"1 (Ві) состоит из двух частей функция; область существования G (а) — вся область R, а область изменения G (а) пред¬ ставляет собой множество всех вещественных неотрицательных чисел. Если G — граф и Л1сзЛ, то подмножество 0(Л^ множества В, определенное как О(ЛЛ = {6:(ах6) принадлежит G для некоторых а} из Лг), (2.14) называется отображением А1 через G. Если В, то подмножество G-1 (BJ в Л, определенное как G"1(B1) = [а : (а, bj) принадлежит G для некоторых Ьг из Вх}, (2.15)
называется обратным отображением Вг через G. Заметим, что G (Л) есть область изменения G и что G"1 (В) есть область существования G. Пример 2.8. Пусть G есть граф примера 2.7 и пусть А1= {а : 0 а 1} и — = {Ь Тогда = {b : 0^ 1} и G'1 (Bi) = {a : — 2 a — 1 или l^a^2} (см. рис. 2.4). Упражнение 2.4. Показать, что G~1(B1 (J B2) — G"1 (B)) (J G~l(B2) и что Если для всех b в области изменения G, b = G (а) и b = G (a J озна¬ чает, что а = alt то мы говорим, что функция G однозначна. Другими словами, если b £ G (Л) предполагает, что в А существует единственное а такое, что G (а) = Ь, то G (а) однозначна. С другой стороны, если областью изменения G является все множество В, т. е. если G (Л) = В, тогда мы говорим, что функция G (а) — взаимно однозначная. Функ¬ цию G (а), являющуюся однозначной и взаимооднозначной, иногда назы¬ вают соответствием (или однозначным соответствием), a b = G (а) и соот¬ ветствующее а называют соответствующими элементами. Пример 2.9. Пусть G — подмножество из /?2, определенное как G — {(а, Ь) : b = а}. Функция G (а) является однозначной и взаимооднозначной. Функция примера 2.8 не яв¬ ляется ни однозначной, ни взаимооднозначной. Предположим, что Л, В и С — множества, G—граф, заключенный в Л X В, и Н— граф, заключенный в В X С. Пусть HoG—подмно¬ жество Л X С, определенное как HoG = {(g, с): существует b В такое, что (a, fe)ÇG и (6, с) g И}. (2.16) Тогда HoG— граф в Л X С, который называется композицией Н и G, Функция (HoG) (а), которую часто записывают как H [G (а)], называется сложной функцией (иногда — функцией от функции). Отметим, что об¬ ластью существования ее является G"1 {[Я-1 (с) ]}, а областью измене¬ ния — H {[G (а) ]}. Пример 2.10. Пусть G — граф примера 2.7 и Н — подмножество из 7?2, определенное как Н — {(6, с) : с — sin b}. Тогда HoG = {(а, с) : с = sin а2} и H [G (а)] = sin а2. Предположим, что G есть граф из АхВ и ArczA. Тогда G± = = {(«!, b) : ах ç Лх и (ах, Ь) £ G} также является графом. Функцию Gx (ах) называют ограничением G по Лг Заметим, что Gx (aj = G (aj для A1. Легко видеть, что Gx преобразует подмножество Лх из А в некоторое подмножество из В. Функцию G± часто называют сегментом G, соотнесенным с Alt и записывают Сд1 вместо Gx. Отметим также, что G иногда называют продолжением Gx. Пример 2.11. Пусть G — граф примера 2.8 и 4Х = {а : 0}. Тогда Gr ~ = {(ар Ь) : ах 0 и b — а\ }есть граф, Gx (04) — ограничение G по Аѵ Однозначно ли Gx? 2.5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Векторное пространство есть множество элементов, которые можно складывать друг с другом и умножать на (вещественные) числа. Уточним это положение. Пусть V — некоторое множество и G+ граф, областью су¬ ществования которого является все пространство V X V, а область изме¬ нения заключена в V. Другими словами, функция G+ преобразует V X V в V. Если (vx, ѵ2) £ V X V, то пишут üx + ѵ2 для элементов G+ (üp ü2), т. e. Ui + v2 = G+(üx, ü2). (2.17) Элемент vx + v2 называют суммой vx и v2. Предположим, что G. есть граф, область существования которого все R X V, а область изменения содер- 30
жится в V, Другими словами, функция G. преобразует 7? X V в V. Если (г, ѵ) 6 R X V, то элементы G. (г, ѵ) множества V записывают как г V, т. е. r-v = G.(r, ѵ), (2.18) где г • V называют произведением ѵ на г, а V — векторным пространством (вещественным), если для суммы и произведения справедливы следующие соотношения: Сумма 1) + ѵ2 = ѵ2 + для всех ѵ1 и ѵ2 из V; 2) + (ѵ2 + ^з) = (ѵі + v2> + ѵз Для всех v2 и v3 из V; 3) в V существует единственный элемент 0, такой, что ѵ + 0 = 0 + ѵ для всех V из V; 4) для любого V из V существует единственный элемент —ѵ из V, такой, что V + (—ѵ) = (—ѵ) + ѵ = 0. Произведение 5) Гі-(г2у) = (ri'r2)'v Для всех гг и г2 из R и всех ѵ из V; 6) 1 • V = V для всех V из V; 7) г (üi + ѵ2) — rv± + гѵ2 для всех г из R и любых ѵ1 и ѵ2 из V; 8) (r1 + r2)-v = r1-v + r2-v для всех г± и г2 из R и всех ѵ из V. Если V — векторное пространство, то элементы V будем назы¬ вать «векторами» и в дальнейшем для их обозначения будем использо¬ вать «жирные» строчные буквы латинского алфавита. Произведение на вещественное число будем записывать в виде г-ѵ. Рассмотрим важный пример, иллюстрирующий понятие векторного пространства. Этот пример будет играть основную роль в дальнейшем изложении, и поэтому читателю его следует тщательно изучить. Пусть V есть множество всех п реальных чисел, написанных столбцами: (2.19) Под г, иногда понимают 7-й элемент столбца. Если являются двумя элементами V, то Г2 + s ѵ + w = (2.20) + sn. 31
а если г Е 7?, то г-ѵ = (2.21) Векторное пространство V в этом случае обозначают Rn, а элементы V называют /г-мерными векторами-столбцами. Упражнение 2.5. Проверьте условия с 1 по 8 для Rn. Покажите также, что если v Е Rn.w—‘Р ’ (—1).®и0.ф= 0. Справедливо ли это для любых векторных пространств? Пример 2.12. Пусть V есть множество всех п вещественных чисел, написанных строч¬ ками (гх, г2, . . ., гп). Если ѵ — (гг, г2, ...» гп) и w = (sp $2, . . ., sn) — элементы из V, то V 4- W = (гх + sx, r2 + s2, . . ., rn+ sn), и если г g /?, то r-ü = (rrx, rr2, . . rrn). Векторное пространство V в этом случае будем обозначать Rn, а его элементы V назы¬ вать /г-мерными векторами-строками. Упражнение 2.6. Покажите, что Rn является векторным пространством. Предположим, что V — векторное пространство и W — подмножество из V. Будем считать, что W есть подпространство V, если 1) wlt w2 Е IF, то Wi + w2 Е IF; 2) г Е 7?, w Е IF, то rw Е IF. Другими словами, 1F — подпространство F, если IF само является векторным пространством по отношению к операциям сложения и умно¬ жения. Заметим, что если IFX и 1F2 — подпространства F, то IFi П IF2 также является подпространством V. Если W± и IF2 — подмножества V, то IFi + IF2 cz V определим как IFj. + IF2 = {ti: существуют Wj в IF! и w2 в IF2 такие, что V = wr + w2) (2.22) и будем называть суммой VFT и IF2. В частности, если IFj и IF2 — под¬ множества F, то IFi + IF2 — также подмножество V. Если IF — подмно¬ жество V и г — вещественное число, то подмножество r-W cz F можно определить как г IF = {ci : существует w в IF такое, что ѵ = rw}. Будем называть его произведением IF на г. В частности, если 1F — подмножество F, то rIF — подмножество V. Пример 2.13. Пусть W — подмножество из Rn, определенное как W есть подпространство Rn. Пример 2.14. Если U7 — подмножество из V, состоящее только из 0, то W — под¬ пространство V. Упражнение 2.7. Покажите, что если и W2 — подпространства V, то Wr П ^2 и Wi + W2 также подпространства V. Покажите, что если W — подпространство V, то rW — также подпространство V. На протяжении всей книги мы будем оперировать исключительно вещественным векторным пространством. Однако понятие векторного про¬ странства можно определить значительно шире, заменив множество вещест¬ венных чисел R множеством любых, например комплексных чисел С, 32
имеющим те же основные алгебраические свойства. Множество С комплекс¬ ных элементов, для которого определены и справедливы понятия суммы и произведения, аналогичные 1)—8), стр. 31 называется комплексным век¬ торным пространством. Обсуждение общего понятия векторного простран¬ ства можно найти в работе [24]. В этой книге мы найдем много примеров того, насколько понятия векторного пространства полезны при решении задач управления. Существует много других областей, например теория цепей, теория связи, теория электромагнитного поля, в которых понятие векторного пространства играет исключительно важную роль и позволяет решать различные задачи, с которыми читатель может быть уже знаком. Математическое представление известного физического понятия линейности является основой для определения векторного пространства. 2.6. ЛИНЕЙНЫЕ КОМБИНАЦИИ И БАЗИС Предположим, что V — векторное пространство, а ѵ2, • • vn — элементы V. Считаем, что вектор V из V есть линейная комбинация (или линейно зависит от ^), если существуют вещественные числа rlf г2, • • -, rrt, такие, что ѵ - 1 2 г.дг,-)-••• l rnvn. (2.23)1 Вместо (2.23) иногда записывают È г,.®,. = 4- г2ѵ2 4- • • • +■ rnvn. (2.24) i- 1 Элементы • • -, из линейно зависимы (или vit і = 1, 2, . . ., /г линейно зависимы), если 0 есть линейная комбинация в которой не все rt = 0. Другими словами, еоі : і = 1,2, . . ., п линейно зависимы, если о =- S = rjüj 4- W 4- • • • 4- rnvn (2.25) и существуют rt 0. С другой стороны, если 0 = S rpî (2.26) справедливо только при условии rt = 0, для всех і = 1, 2, . . ., п, то векторы ѵ2, . . ., ѵп} называют линейно независимыми. Заметим, что векторы еъ е2, . . ., еп из определенные как (т. е. і-я составляющая равна 1, а все остальные 0), линейно независимы. Упражнение 2.8. Покажите, что если ѵ =/= 0, то векторы {я} линейно независимы. Указание. Воспользуйтесь условием 6. 1 Сумма п элементов ѵ2, . . ., ѵп в пространстве V может быть определена путем индукции (т. е. + • • • + ѵп) = (г>і H- v2 + F tfrt+i) + vn, что легко сделать, воспользовавшись условиями 1 и 2 на стр. 31. 2 Атанс и др. 33
Множество всех линейных комбинаций векторов ф1у г>2, • . Фп из V есть подпространство V, которое мы будем называть отображением мно¬ жества {гіх, ^2, • • -, ^п}- Легко показать, что отображение [е19 е2, . . еп} есть все пространство Rn. Упражнение 2.9. Покажите, что отображение {®х, ѵ2> • • -, Ѵп} есть подпростран¬ ство V. Набор векторов {сіх, ф2, . . Фп} множества ’ называется (конечным) базисом V, если: 1) векторы фі9 і = 1, 2, . . ., п линейно н. звисимы; 2) каждый элемент V есть линейная комбинация фі (т. е. V есть ото¬ бражение векторов ф2, . . ѵп). Напомним, что elf е2, . . еп [см. (2.27)1 является базисом Rn, кото¬ рый мы будем называть единичным или нормальным базисом Rn. Если {^і, ѵ2, . . ., Фп} есть базис V, то ф G V означает, что ф = S (2.28) і=1 где az — единственные элементы R; az называют координатами ф по отно¬ шению к базису {ях, ф2, . . ., Фп\. Легко видеть, что если ф = G Rn> то числа гх, г2, . . ., гГІ являются координатами вектора ф по отношению к базису (elf е2, . . еп}. Если Ф2, . . ., Фп$ есть некоторый (фиксированный) базис V, а и Ф = S — некоторый элемент V, то можно считать, что координаты г=1 ах, а2, . . ап вектора ф определяют некоторый вектор а в Rn, компо¬ ненты которого по отношению к нормальному базису {е19 е2, . . ., еп} в Rn равны ах, а2, . . ., ап, т. е. _аи_ Если {гіх, ф2і . . ., Фп\ является базисом V, то п называется размер¬ ностью V. Можно показать, что если V имеет базис, то любые два базиса V имеют одинаковое число элементов. Более того, можно показать, что любая линейно независимая система векторов {wx, w2, . . ., wm\ из V может быть дополнена до базиса V (существуют такие элементы х19 . . ., хп_т вѴ, что система векторов {wb . . ., . . ., хп_т} образует базис 7). Следовательно, размерность любого соответствующего 1 подпространства W (W =£ V) n-мерного пространства V меньше, чем п. 1 Слово «соответствующее» означает, что W CZ V, но W =)= V. 34
Пример 2.15. Если UZj и W2 — подпространства n-мерного пространства V, то dim [rjH-dim [Г2] = dim [Г, 4- UZ2] + dim \WA П W]2, где dim [ ] обозначает размерность. Например, в Rn, если IFj есть отображение {^} и W2 — отображение {ег + е2), то dim [IFJ + dim [IF2] = 2 = dim [U/2] + + dim [ П №2], поскольку \V1 + U?2 есть отображение {eD e2} и U7X f| ^2 = {0}. ЛИНЕЙНАЯ АЛГЕБРА 2.7. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И МАТРИЦЫ Сформулировав определение векторного пространства, математик ста¬ рается отыскать естественный класс преобразований, который «сохраняет» это понятие. Например, если V и W — векторные пространства и если 21 есть преобразование (функция) V в W, то можно поставить вопрос: какими свойствами должно обладать 21, чтобы сохранить структуру V и W? Во-первых, 21 должно сохранять понятие суммы. Иначе говоря, для всех элементов еи1 и ^2 из V должно выполняться: 1 ) 21 + ѵ2) = 21 (îù) + 21 (^2). (2.29) Во-вторых, 21 должно сохранять понятие произведения. Если /? и V £ V, то 2) 21(ггі) = гВД. (2.30) Преобразование 21 множества V в W, область существования кото¬ рого есть все V и которое удовлетворяет приведенным выше условиям, называется линейным преобразованием. Для обозначения линейных пре¬ образований мы в дальнейшем, если не сделана специальная оговорка, будем всегда использовать готические прописные буквы. Предположим, что V есть n-мерное пространство с базисом гг2, . . ., vn\; W — m-мерное пространство с базисом [Wi, w2, . . wm} и 21 — линейное преобразование V в W. Так как каждый элемент W есть линейная комбинация wz и 21 (я,) есть элемент W, то можно написать 21 (ü/)=S для /==1,2,..., п. (2.31) п Далее, если ѵ = S — элемент V, то согласно условиям 1) и 2) /=і имеем 2l(^)=S S (2.32) /=і Набор чисел \аи< і = 1,2, . . ., т; j = 1, 2, . . ., п\ можно записать в виде таблицы, обозначенной А и содержащей m строк и п столбцов: c/ц а12 . . . а1п А а21 а22 . . . а2п . _J^ml • • • ^тп _ Такая таблица называется m X п матрицей. Числа называются элементами (коэффициентами, или составляющими) матрицы А. Иногда для сокращения вместо матрицы вида (2.33) пишут 4 = (ап). Укажем, что і обозначает строку и j — столбец матрицы Л, в кото¬ рых находится элемент аі}-. В дальнейшем для обозначения матриц будут * 35
использоваться жирные заглавные латинские буквы. Мы видим, что матрица А связана с линейным преобразованием 21 и базисами ѵ2, . . ѵп] и w2, . . Если fall ^12 • * ’ ^ІП b2l b22 . . . b2n B = (2.34) _um\ um2 • • • unm есть m X n матрица, то линейное преобразование 23 пространства V в W можно определить как п т 33(®) = s S «A/W,. (2.35) /=11=1 п ДДЯ V = S в /=1 гі2, . . ., ѵп\ и jwb V. В есть матрица 23 по отношению к базисам W2, . . -, Wm\ пространств V и W соответственно. Упражнение 2.10. Покажите, что 33, определенное как (2.35), действительно является линейным преобразованием V в IV7. Пример 2.16. Пусть V /?2, и 21—линейное преобразование V в IF, определенное как ЭД (ej ег + 2е2 + Зе3, ЭД (е2) ~= е3 [см. (2.27)]. Тогда матрицу А преобразования 21 можно записать в виде: А - 1 0" 2 0 3 1 Если задана матрица то 33 (ех) = ег + е3 и ЗВ (е2) — + 2е2. Отметим, что если ЭД — линейное преобразование V в W, такое, что ЭД (я) = 0 для любого ѵ из V, то его матрица А будет состоять только из нулей; и наоборот, если В состоит из элементов, равных 0, то линейное преобразование 93 (2.35) обладает тем свойством, что 93 (v) = 0 для всех ѵ из V. 2.8. ОПЕРАЦИИ НАД ЛИНЕЙНЫМИ ПРЕОБРАЗОВАНИЯМИ И МАТРИЦАМИ Предположим, что ЭД и 93 — линейные преобразования V в W и что А и В — матрицы ЭД и 93 по отношению к базисам {ггх, . . ., ѵп} и jwb w2, • • -, Wm\ соответственно. Найдем матрицы преобразований ЭД + 23 и гЭД, г £ /?, определенные как (ЭД 4-93)(г>) = ЭД(ü) 4-93(я) для всех (2.36) (гЭД)(гі) = г [ЭД(гг)] для всех ѵ^Ѵ. (2.37) Легко видеть, что ЭД 4~ 93 и г ЭД также будут линейными преобразо¬ ваниями V в W; мы будем называть ЭД 4~ 93 суммой ЭД и 93, гЭД — про¬ изведением ЭД на г. 36
Если А =- (aZ;) и В = (&,,), то т (21 + ®)(^) = 21 (ѵ,) + ф(^) = V а w, Z--1 т т + Z bijWi = 2 (az/ + &z/)wz (2.38) г---1 t—1 И т т (г21) (»,) = г 121 (г>;)] = г 2 «,/W,. = 2 (raz/)wz. (2.39) г=1 г —1 Другими словами, матрица преобразования ЭД + ® есть (аи + Ьп) и матрица преобразования гЭД есть (гаі}). Обозначим эти матрицы соот¬ ветственно через А + В и г А. В развернутой форме 62 и + Ьп а12 4- Ь12 ... alrt 4- bln ! 0 __ ^21 ^21 ^22 4~ ^22 • • • ^2П 4“ &2п 4Q) _ 4/îi 4" Ьті 4п2 4“ Ьт2 . . . Clnin 4- fynn _ И ~ гаи га12 . . . га1п ~ rA- га^ га^---га^ . (2.41) _ га,п1 га,п., . . . гатп _ А 4- В называется суммой матриц А и В, а гА — произведением матрицы А на число г. Можно показать, что множество всех линейных преобразований V в W и множество всех т X п матриц являются век¬ торными пространствами по отношению к понятиям суммы и произве¬ дения. Множество всех линейных преобразований V в W будем обозна¬ чать Ÿ (I/, W) и множество всех т X п матриц — 3R (т, п). Упражнение 2.11. Докажите, что £ (V, R) — векторное пространство, и покажите справедливость аксиом 1—8 по отношению к £ (V, R). Пространство С (V, R) обозна¬ чают |/* и называют пространством, сопряженным к V. Упражнение 2.12. Пусть 'V = Rn и пусть ЭД£/?* [см. упражнение 2.11]. Пока- п жите, что если vÇ^R/ly то ЭД, (я) — а/ ЭД, (е/), гДе а/ — координаты ѵ по отношению /=і к е/ (см. § 2. 6). Покажите, что преобразования ЭД/ пространства Rn в R, определяе- (п \ где ѵ 2 ajei Для 1• “ 1’ 2, . . /2, принадлежат к Rn и что /=і ' / / п \ ЭД/ (ej) -- Ô//, где 0/ О, если і ф j и Ô// 1 Указание: eL ô//^/ . Покажите что {ЭДр ЭД2, . . ., ЭДЛ} является базисом R*n. Базис {21р ЭД2, . . ЭДЛ| называют дуальным по отношению к {еІУ е2, . . ., еп}. Чему равна матрица ЭД/ по отношению к базисах! (еІ5 е2, . . ., еп] в Rn и 1 для /?? Можно ли найти однозначное линейное преобразование Rn в Rn (пространство л-мерных векторов-строк)? (Указание: При¬ мите, что fi — n-мерный вектор-строка, имеющий 1 на і-м месте и 0 на всех осталь¬ ных). Если такое преобразование существует, какая матрица с ним связана относительно базисов {ЭДЬ ЭД2, . . ., ЭДЛ) и {/ь /2, . . ., Л}? Предположим теперь, что V, W и X — векторные простран¬ ства с базисами j^, ѵ2, . . ., <гЦ, w2, . . wm} и {хъ x2l . . хр} соответственно. Если ЭД, — линейное преобразование W в X и 93 — — линейное преобразование V в W, то ЭДо93 будет линейным преобразо- 37
ванием V в X. Для примера проверим условие 1. Путь ѵ и ѵ'— эле¬ менты V, тогда (21о93) (ѵ + sf) = il [® (v Ч- ü')] = 21 [® (v) -}- ® (я')] = = 21 [® (ü)] + 21 [® (O - (2Lo53)(ü) -4 (2lo93)(v'). Попытаемся теперь найти матрицу преобразования 21о®, предпо¬ лагая, что А = (aik) и В = (bkj) — матрицы 21 и ®. Имеем (2lo®)(^) - 21 -21 tn S bkiwk k=\ tn m p p / tn \ ~ Xj (^k) Xj bkj Xi alkXi Xj ( Xj ctikbkj I xt. k=\ k=\ z=l 1=1 \Л=1 / (2.42) Другими словами, элементы матрицы С = (cZ/) преобразования 21о93 имеют вид т Сц = S «/А/ (2.43) k=i для і = 1, 2, . . ., р и / — 1, 2, . . ., fi. Матрицу С называют произведением матриц А и В и записывают С = АВ. (2.44) Отметим, что число столбцов матрицы А должно быть равно числу строк матрицы В. В общем случае АВ В А. Пример 2.17. Пусть А = J Упражнение 2.13 А = 01 2 R = P —И 1 о] и [1 21 В = I I . Найдите АВ и ВА. Если А = (aif) есть матрица т X п,то матрица Л' размера п X т, определенная как Л' - «и «12 «21 • • «22 ‘ • «ml «/и 2 (2.45) _«1П «2П «mn называется транспонированной матрицей Л. Строки Л' являются столб¬ цами Л и столбцы Л' — строками Л. Если транспонированную матрицу Л представить как Л' = (а'ц), І = 1, 2, . . ., п. і = 1, 2, . . ., m, (2.46) то ан = аіГ Пример 2.18. Если А = Г° 1 01 |2 3 4]* Если <02, . . , ѵп] — базис V, {wlr w2 wm] — базис W и 11 — линейное преобразование V в W с матрицей А по отношению к этим п базисам, то для ѵ = Xj имеем /=і п т т / п \ т / п \ зад = g az Sat/Wf = .g (^.ga.ja) j w. = .g ^_ga'.a.) w. (2.47) 38
Иначе говоря, А' может рассматриваться как определение перехода от координат а, вектора ѵ к координатам 51 (ѵ). Отметим также, что (Л')' = Л; (Л + ВУ = Л' + В'; (АВ)' = В'А'. (2.48) Рассмотрим транспонирование матрицы с другой точки зрения. Предположим, что Л = (аи) есть матрица т X п и w — элемент Rm, т. е., что - - si s2 w = (2.49) Тогда w можно рассматривать какт X 1 матрицу и произведение Л'w как aus. А’ѵо = S «2/S/ г=1 (2.50) А’ча есть элемент Rn, и преобразование ЭД/ пространства Rm в Rn можно определить, полагая (2.51) для w из Rm. Легко видеть, что 31' — линейное преобразование Rm в Rn. Так как элементы базы elt е2, ■ . ., ет пространства Rm опреде¬ ляются как 0 0 t-я строка, (2.52) нетрудно заметить, что 81W (2.53) Другими словами, Л' есть матрица 21 по отношению к нормальным базисам Rm и Rn. 39
2.9. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ V В V Сосредоточим теперь внимание на линейном преобразовании вектор¬ ного пространства V в V. Предположим, что ѵ2> • • -, Ѵпі —данный базис V. Если 91 — линейное преобразование V в V, то его матрица Л, отнесенная к заданному базису, будет иметь п строк и п столбцов (т. е. А есть п X п матрица). Важным частным случаем линейного преобразо¬ вания V в V является идентичное преобразование определяемое как 5 (г») = f • Матрица / преобразования J имеет вид / = "1 0 ... (Г О 1 ... О (2.54) (2.55) О 0 ... 1 т. е. Г = (ô,z), (2.56) где ôz/ = 0, если i j и ô/7 = 1. ô/z называется символом Кронекера, а / — единичной матрицей. Заметим, что 91 о S = S’ о 9l = 91 для любых линейных преобразований 91 пространства V в V, и, следовательно, ІА - AI - А (2.57) для любой п X п матрицы А. Упражнение 2.14. Докажите формулу (2.57), используя выражение (2.43). Упражнение 2.15. Покажите двумя способами, что если гі Г2 принадлежит к Rn и I — п X п единичная матрица, то Іѵ = ѵ [см. (2.50)]. Указа¬ ние: используйте формулу (2.43) и определение (2.51). Предположим, что 9( — линейное преобразование V в себя и что существует линейное преобразование 93 пространства V в себя, такое, что 9(о93 = 93 о9(-$- (2.58) В этом случае преобразование 91 называют невырожденным, а пре¬ образование 93, обозначаемое 9(-1, — обратным к 9(. Если А и В — матрицы 91 и 93 соответственно, то уравнение (2.58) означает, что В А = АВ = I. (2.59) С другой стороны, если А есть п X п матрица и существует п X п матрица В, которая удовлетворяет выражению (2.59), то говорят, что А — невырожденная матрица и матрица В, обозначаемая Л-1, называется матрицей обратной к А. Отметим, что Л"1 Л - ЛЛ1 - /. (2.60) Следующая теорема (доказательство которой содержится в упраж¬ нении 2.16) дает более глубокое представление о понятии невырожденного линейного преобразования. Теорема 2.2. Если V — /г-мерное пространство и 91 — линейное пре¬ образование V в себя, то
а) 21 невырожденное тогда и только тогда, когда 21 (ѵ) = 0 справед¬ ливо лишь при V = 0; б) 21 невырожденное тогда и только тогда, когда областью сущест¬ вования 21 является все пространство V. Следствие теорем ы : 9( есть невырожденное преобразование тогда и только тогда, когда базис • • -, преобразуется в базис |21(^і), 21 (^2), • • -, îl (^и)Ь Другими словами, невырожденное преобразование соответствует изменению базиса V. Заметим, что единич¬ ная матрица всегда невырожденная. Можно также показать, что п X п матрица А невырожденная тогда и только тогда, когда детерминант Л, обозначаемый как det Л, не равен нулю, т. е. det А 0. Пример 2.19. Пусть 21—линейное преобразование в себя, определенное как 21 (^і) ” + ^2’ 21 (^2) — Тогда матрицу А преобразования 21 относи¬ тельно базы [еъ е2} запишем в виде где А — невырожденная матрица в том и только в том случае, если ad — be 0. Если 21 — невырожденное преобразование, то 21”1 определяется как: 2Г1 (ех) —7-^-7— 4 □—~г~ 2L”1 (^) =■ —-j е2 v ad — be ad — be “ ad — be 1 ad — be и ~ d — с ad — be ad — be ad — be ad — be Например, если 13 2 1 Упражнение 2.16. Докажите теорему 2.2. Пусть 21 — линейное преобразование V в V такое, что: 1) если гн ¥= ^2, то 21 (*>і) =h 21 (^2) и 2) область существования 21 — все пространство V. Покажите, что 21 невырождено. Указание: если ф g У, то ф = 21 (w) для некоторого w. Примите 21”1 (ѵ) = Единственно ли w? Покажите, что если 93 — невырожденное линейное преобразование V в V, то 93 удовлетворяет условиям 1 и 2. Теперь можно доказать теорему 2.2. (Указание: используйте свойства 1 и 2. Например, пока¬ жите, что утверждение: «21 (ѵ) = 0 справедливо лишь для ф — 0» подтверждает, что если {®і, ф2, . . ., фп} есть базис V, то 21 (®і), 21 (я2), • • 21 (ѵп) линейно независимы. Пусть С —линейное преобразование V в V и {г»!, ѵ2. . . . ѵп] и (и>і, w2, . . —базисы пространства V. Можно написать п <£(■»,) = У / = 1,2 п і—1 и п (2.61) І = 1 Иначе говоря, А = (а;/) есть матрица преобразования (£ по отно¬ шению к базису {»1( ѵ2, ..., ѵп\ и В = (6,;) — матрица Q. по отношению к базису («>!, w2, ..wn\. Установим взаимосвязь между А и В. По¬ скольку Wi принадлежат V и (clt ѵ2, ..ѵп]—базис, то п W; = 2 / = 1, 2, ..., п, (2.62а) і—1 41
и поскольку <vk принадлежат V и {wb w2, •. -, wn} —базис, то п Vk = 2 k = 1, 2, .. „ п. /=1 (2.626) Пусть P = (p.J и Q — (qik). Легко видеть, что PQ—QP = I и, сле¬ довательно, Q = Р"1. Далее, (п \ п п п 2 Рі^і = 2 Ро'С (©,) =22 (Puaki)’0k = І = \ / 1 = 1 і=1 k=\ п п п п / п п » п = 222 (Pijakiqrk) W, = 2 ( 2 2 PriflkiPii} = 2 briwr. (2.63) /=1 л=1 г=Л \/г=1 і=1 / г=1 Следовательно, В = Р1АР = QAQ1. (2.64) Матрицы А и В называют подобными, а линейные преобразования, определяемые (2.62а) и (2.626), называют преобразованиями подобия. В общем случае, если А и В — любые две п х п матрицы, для которых имеется невырожденная матрица Р такая, что справедливо уравнение (2.64), то А и В называют подобными матрицами. Отметим, что подобные матрицы соответствуют одному и тому же линейному преобразованию, но по отношению к различным базисам. 2.10. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Предположим, что 21 — линейное преобразование V в себя и А есть матрица 21 по отношению к базису {г^, гі2, . . ., в V. Вектор ѵ =/= 0 в V называют собственным вектором 21, если существует К С А такое, что 21 (ü) = fay, (2.65) À называют собственным значением ЭД,. Посмотрим, что это значит. Для начала заметим: поскольку v 0, отображение вектора ѵ (см. § 2.6) есть одномерное подпространство Ѵг пространства V. Легко видеть, что 21 (Ѵ\) cz Ѵі (ѵ есть базис VJ. Затем, если —одномерное подпро¬ странство V с Wi в качестве базиса и ЭД, (WJ cz W19 то 21 (wj 6 означает, что 2L(w1) = Xw1, (2.66) так как Wi — собственный вектор ЭД,. Иначе говоря, собственные значе¬ ния 21 соответствуют одномерным подпространствам пространства V, которые преобразование 21 преобразует в самих себя. Пример 2.20. Предположим, что 21 — линейное преобразование /?2 в себя, для кото¬ рого 21 (<?і) = + е2 и 21 (е2) = + е2, тогда 21 (ег + е2) = 2 + е2), так что еѵ + + е2 — собственный вектор ЭД и 2 — собственное значение ЭД; аналогично ЭД — е2) = = 0—0 (ех — е2), где — е2 — собственный вектор и 0 — собственное значение ЭД. Матрица À преобразования ЭД по отношению к {е1У е2} записывается в виде 1 1 1 1 А = Эта матрица подобна матрице В = ГО [О °1 2j * 42
Действительно, 1 1 /2 /2" 1 1_ /2 /2 Что представляет собой данное преобразование подобия? Собственные значения можно рассматривать несколько иначе. Если ѵ— собственный вектор 21 с собственным значением X, то 21 (с>)—'кѵ = = 0; if = S а/Сі/, поскольку {с^, ѵ2, ..ѵп} — базис V, то можно обнару- /=і жить: п / п \ эд. (г»)—х® = 2 «7ЭД (®/) — М 2 ai‘Oj I = /=1 \;=1 / " n " /п = 22 ajaij,°i — 2 = 0* (2.67) /=11=1 /=1 n Заметим, что гі£- = ô£./p£., где ô£/- — символ Кронокера. Поэтому урав¬ нение (2.67) можно записать в виде п п п п ЭД (®) — М) = S 2 ^ац^і — 2 2 = /=1 f=l /=1 Z=1 n / n \ = 22 — bafta ©,• = o. i=l \/=l / (2.67a) Так как — базис V, имеем («n — X)a, + a12a2 H + alnan = 0; ' °2iai + (g22 — X) a2 + • • • + a2nan = 0; . (2 68) + G„2a2 + • • • + <ann — X)a„ = 0. . Система n линейных уравнений с n неизвестными x19 x2, . . xn вида (an — X)xj + a12x2 H 4- alnxn = 0; G21X1 + (G22 M X2 + + а2ПХП — Qi (2 69) amxi + аП2х2 + • • • + (ann — X)x„ = 0 имеет ненулевое решение = аь х2 = а2, . . хп — ап ^так как ѵ = п \ = J] ajVj 7^ 0 I. Отсюда заключаем, что det(4 —Х/) = 0. (2.70) Если det (Л — X/) раскрыть в виде функции от X, то получится поли¬ ном вида det (Л — Х/) = (—1)"Х" +^-1 Н +сп = 0, (2.71) где clf c2f . . сп зависят от а£/. Иначе говоря, X есть корень полинома р (z) степени п: p(z) =■ det (Л — zi) == (— l)nzn -h ctzn-x + • • • + cn. (2.72) 43
Полином р (z) иногда называют характеристическим полиномом мат¬ рицы А. Если, с другой стороны, р £ 7? есть корень полинома р (z), то система уравнений («п — н)*і + «12*2 + • • • + «іЛ - 0; ' «2іхі -Е («22 н)х2 ± * * * 4" а2пхп “0; (2 уд) «Л 1-^1 4" «П2^2 4" ‘ ‘ Т («пн 0 имеет ненулевое решение х2 |32, . . хп = рп и вектор w = п = ü P/®/ есть собственный вектор с собственным значением р. Харак- J---A теристический полином р (z) [уравнение (2.72)1 матрицы А имеет п ком¬ плексных корней, и мы условимся называть любой корень р (z) собствен¬ ным значением матрицы А. Если матрица В подобна матрице Л, В = РАР1 (Р — невырожденная матрица), то det (В — zi) det (PAP1 — PzIP') - det (A — zl). (2.74) Подобные матрицы А и В имеют один и тот же характеристический полином и, следовательно, одинаковые собственные значения. Заметим, что собственные значения линейного преобразования 91 действительно являются собственными значениями матрицы А и каждое вещественное собственное значение А является собственным значением преобразова¬ ния îl. Корни характеристического полинома матрицы Л, имеющие мни¬ мые части (и часто называемые комплексными собственными значениями Л), не являются собственными значениями линейного преобразования ^1. Другим интересным и полезным свойством характеристического поли¬ нома р (z) матрицы Л является то, что сама матрица Л является «корнем» полинома. Справедлива следующая теорема: Теорема 2.3. (Теорема Кэли—Гамильтона): Если Л есть п X п матрица с характеристическим полиномом р (z) (2.12), то Л есть «корень» р (z) в том смысле, что р(А)-^(-\)пАп + сіАп-1 + ••• +спІ. Доказательство этой теоремы можно найти в работах [21] и [24]. Пример 2.21. Пусть ЭД — линейное преобразование R3 в себя с матрицей А по отно¬ шению к базе {ві> е2, е3}: 1—10“ — 1 1 Кз“ 0 КЗ 1 Характеристический полином матрицы А есть р (z) = —z3 + 3z2 + z — 3; собственные значения А — числа 1, —1 и 3. Далее, 3 + е3 — собственный вектор ЭД с собственным значением 1, ех 4~ 2^3— КЗ е3 — собственный вектор ЭД с собственным значением —1 и —ех + 2е2 — КЗ е3 — собственный вектор ЭД с собственным значением 3. Матрица А подобна матрице 1 0 В = 0“ о 3 Упражнение 2.17. Проверьте основные положения примера 2.21. Покажите, что А удовлетворяет уравнению —А3 + ЗД2 + А — 31 — 0. Предположим, что преобразование 21 обладает свойством: îL(üt.) = і = 1, 2, ..., п. (2.75) 44
зису вид оворят, что ЭД — диагональное преобразование по отношению к ба- ü2, . . ., ѵп]. В этом случае матрица А по отношению к имеет ~Хх О ... О - (2.76) О 0 ... где Хь Х2, . . Х,г — собственные значения А (или ЭД,). Если В есть матрица ЭД, по отношению к другому базису [wb w2, . . wn\ того же пространства V, то, как мы уже знаем из выраже¬ ния (2.64), В подобна А (т. е. существует невырожденная матрица Р такая, что В = РАР1) и, следовательно, Хх, Х2, . . ., Хп являются также собственными значениями В (вернитесь к примеру 2.21, имея это в виду). Теперь рассмотрим линейное преобразование ЭД пространства V в себя, имеющее различные собственные значения Хх, Х2, . . ., Х„. Пред¬ положим, что w2, .. ., wn — соответствующие собственные векторы ЭД, [т. е. ЭД (wt.) = XzwJ. Можно показать, что множество {wx, w2, . • -, wn] действительно является базисом V. Следовательно, матрица В преобразо¬ вания ЭД по отношению к базису диагональна, т. е. Л о ... о " о х2 ... о __о о ... хп_ (2.77) Если окажется, что ЭД — линейное преобразование Rn в себя с п различными собственными значениями Хь Х2, . . knt то через А мы будем обычно обозначать п X п матрицу вида (2.78) О 0 ... к и будем называть Л матрицей собственных значений. Наконец, когда А есть п X п матрица, а через Ak (X) мы обозначим k X k матрицу вида “X 1 0 ... ОХ 1 ... А(Х)--= (2.79) ООО... ООО... то можно показать, что если все собственные значения А — вещественные числа, то А подобна матрице вида (2.80) где тг + т2 4 • • -4^4 ‘ п и Хь Х2, . . ., Хр — собственные значения (необязательно различные) матрицы A. J (Л) называется жордановой канонической формой матрицы А. 45
Пример 2.22. Рассмотрим 3X3 матрицу А: г 1 I 0~і можно показать, что или Пример 2.23. Если А есть 2X2 матрица — zi) — 0, то А подобна матрицам вида и X — двойной корень уравнения def (А — 'X 01 n і ИЛИ и ЛІ 'X 1*1 0 х] ЭВКЛИДОВЫ ПРОСТРАНСТВА 2.11. ВНУТРЕННИЕ ПРОИЗВЕДЕНИЯ Предположим, что V — векторное пространство и Р — функция, область существования которой — все пространство V X V и область изменения заключена в R. Говорят, что Р есть внутреннее произведение на V, если удовлетворяются следующие условия: 1) Р(^і + ^2, *>з) = Р(Ѵі, ^з) + Для всех vlf ѵ2 и ѵ3 из У; 2) Р(гѵъ <и2) = гР(ѵ1У ü2) для всех г из R и ѵ2 из V; 3) я2) = Р (ѵ2» ^і) Для всех и ѵ2 из V. Р иногда называют симметричной билинейной формой на V х. Функцию Р (гі, V) часто называют квадратичной формой на У, произ¬ веденной Р. Упражнение 2.18. Покажите, что если Р — внутреннее произведение на V, то: а) Р (Яр ѵ2 + ѵ3) = P (®і, tf2) + ? (^і’ ®з) Для всех и из V и б) Р ^2) = = гР z>2) для всех г g R и pp ф2 Ç V. Указание: следует многократно исполь¬ зовать условие 3. Предположим, что Р есть внутреннее произведение на V и что {^, ^2, • • •> ѵп} — некоторый базис в V. Положим, что Р(^., = aijt i = 1, 2, ..., n; / = 1, 2, ..., n, (2.81) 1 Это более общая терминология, так как термин внутреннее произведение обычно сохраняют для того, что мы в дальнейшем будем называть положительно определенным внутренним произведением [см. уравнение (2.84) ]. 46
и пусть А = (ап) есть п X п матрица. А называют матрицей Р по отно¬ шению к базису (üj, ѵ2і ..ѵп}. Прежде всего отметим, что условие 3 означает, что аа = Р (ѵ{, Vj) =* Р (ям) = ait. (2.82) Матрица А обладает свойством aij = ajt для i = 1, 2, . . п и / = — 1, 2, . . ., п, т. е. А и транспонированная матрица Л' одинаковы: А=А'. (2.82а) В общем случае, если п X п матрица В остается той же самой при транспонировании (т. е. В = В'), то В называют симметричной матрицей. Например, единичная матрица I есть матрица симметричная. Мы пока¬ зали, что если Р — внутреннее произведение на V, то матрица А = где аи- = Р (ѵІУ V;), симметрична. Предположим далее, что В = (fez/) есть симметричная п X п матрица. Можно ли определить внутреннее произ¬ ведение Q на V, для которого Q (üz, ü,) = fy,? Можно, когда Q за¬ дается формулой Q(v, w) = £ £ (2.83) І=1 /=1 п п где с = J а ®, и w = S і=і ‘ /=і Упражнение 2.19. Покажите, что уравнение (2.83) действительно определяет внутрен¬ нее произведение Q на V. Если В — единичная матрица /, найдите, во что превращается формула для Q? Пример 2.24. Матрица Г 1 2 —11 3 1 О 3 В = симметрична и определяет внутреннее произведение Q на /?3, причем Q «1 а2 аз — аіРі + 2ctiр2 — аіРз 2а2р! За2рз — азРі + Зссзр2 + (ХзРз. _Рз_ Отметим, что 0’ 1 , такой, что Q (w, w) —1 ’Ч Иначе говоря, существует ненулевой вектор ф = 0 , такой, что Q (ф, ф) = 0, [1. 0. и другой ненулевой вектор w = Внутреннее произведение Р на V положительно, если Р обладает свойством Р(ѵ, ѵ)^0 (2.84) для всех V из V. Будем называть Р определенным (невырожденным), если утвержде¬ ние «Р (^, г>о) = 0 для всех v Ç V» справедливо лишь для г>0 = 0. Если В— симметричная матрица, причем соответствующее ей внутреннее произве¬ дение на V [см. формулу (2.83)] положительно определенно, то В — поло¬ жительно определенная матрица. Значение последнего понятия рассмат¬ 47
ривается в § 2.12, 2.13 и 2.15. Векторное пространство V вместе с опре¬ деленным внутренним произведением Р на V называется эвклидовым пространством. Например, если рассматривать внутреннее произведение Р на /?п, матрица которого по отношению к нормальному базису (е19 е2, ...» еп} 1 равна единичной матрице /, т. е. то это внутреннее произведение положительно определенно и Rn оказы¬ вается эвклидовым пространством. Выделим это внутреннее произведе¬ ние называя его скалярным произведением, и будем использовать обозначение w) для P (v, w). Если — суть элементы Rni то скалярное произведение ѵ на w w) =-2 (2.86) t=l Это внутреннее произведение будет использоваться в дальнейшем очень часто. Пример 2.25. Если ѵ = J и w = j — элементы R2, то (v, w) = К2 — 3, (я, ф) = 2 и (w, w) = 11. Упражнение 2.20. Покажите, что скалярное произведение на Rn, {v, w) положи¬ тельно определенно. 2.12. НЕРАВЕНСТВО ШВАРЦА Пусть V есть эвклидово пространство с внутренним произведением Р. Докажем неравенство, известное как неравенство Шварца, а именно: \P(v, w)|2 < P(v, v)P(w, w) (2.87) для всех ü, w из V. Для доказательства неравенства (2.87) Р должно быть лишь положительно (определенности Р не требуется). Если X — любое вещественное число, то P (V + Xw, V + Xw) = Р (я, ѵ) — 2ХР (ѵ, w) + №Р (w, w) > 0, (2.88) так как Р положительно. Если P (w, w) 0, то подстановка X =—P (ѵ, w)/P (w, w) в уравнение (2.88) даст желаемый результат, т. е. фор¬ мулу (2.87). Если P (w, w) —0, но P (v, ѵ) + 0, то, рассматривая выра¬ жение P (Хг> + W, Х^+ w), мы снова придем к формуле (2.87). Наконец, 1 См. также формулу (2.27). 48
если P (w, w) = 0 и Р (ѵ, ѵ) = 0, то, полагая в уравнении (2.88) Х= = —P (ѵ, w), получим неравенство — 2 [P (v, w)]2 > 0, (2.89) которое справедливо лишь для P (v, w) = 0, что опять доказывает спра¬ ведливость формулы (2.87). В дальнейшем мы будем использовать нера¬ венство Шварца довольно часто. Заметим, что если Р —скалярное произведение на Rn [см. (2.86)], то неравенство Шварца принимает вид Полагая имеем (2.90) (2.91) 2.13. ОПРЕДЕЛЕНИЕ ОРТОГОНАЛЬНОСТИ И НОРМЫ Пусть V — эвклидово пространство с внутренним произведением Р. Будем говорить, что два вектора ѵ и w ортогональны (или перпендику¬ лярны), если P(ü, w) = 0. (2.92) Например, векторы ех и е2 в /?2 ортогональны по отношению к ска¬ лярному произведению на Т?2: (ех, е2} = 0. Если V /г-мерно, то в нем существует такой базис (Uj, ѵ2, . . .,Фп], что фі ортогонально если i j и P (ф., ^) = 1. Иначе говоря, матрица Р по отношению к базису ф2, • . Фп\ есть единичная матрица /. Такой базис назы¬ вается ортогональным в пространстве V. Например, натуральный базис {е1У е2, . . ., еп] есть ортогональный базис Rn для скалярного произведе¬ ния на Rn, т. е. (еІУ е3) = 8ih 1, 2, ..., п; / = 1, 2, ..., п. (2.93) Пример 2.26. Матрица А = 3 2 симметрична и определяет внутреннее произ¬ ведение Р на /?3: [_0 2 4 — аіРі + аіР2 “Ь а2рі 4“ За2р2 + 2а2Рз 2а302 4- 4а3р3 — == (аі + аг) (Рі "Ь Рг) + а2Рг "I" (а2 + 2«з) (р2 + 2рз). — положительно определенно, и поэтому, если положить = ev w2 = и w3 = = —e2 2*^3’ T0 вектоРы Wi, w2 и w3 образуют ортогональный базис R3 по отно¬ шению к внутреннему произведению Р. Заметим, что Р (а, 0) — (а, 40) и что P Wj) = A W/) = для /, / = 1, 2, 3. Упражнение 2.21. Докажите, что внутреннее произведение Р для примера 2.26 дей¬ ствительно положительно определенно. Указание: используйте ортогональный базис [wl( w2, w3}, предварительно доказав его ортогональность. Упражнение 2.22. Покажите, что ((сцP j + 4а3Р3)|2 < (а2 4а3) (р2 4" 40|). Указание: используйте неравенство (2.87) и внутреннее произведение при¬ мера 2.26. 49
Если V — эвклидово пространство с внутренним произведением Р, то У P (ф, ф) называют нормой элемента ф из V и записывают Mf = ѴР{Ѵ, ѵ). (2.94) В случае скалярного произведения на Рп для нормы ф записывают II = у для всех Ф из Rn. (2.95) Норма обладает следующими важными свойствами: 1) Йіір 0 для всех Ф из V, причем ||ü|| = 0 тогда и только тогда, когда Ф = 0; 2) ||^і + ѵ2\\Р < ІІ^іЦр + для всех ф19 ф2 из V; 3) ІІгг,ІІр== ИМ рДля всех г из Я и для всех ф из V. В следующей главе мы более подробно рассмотрим понятие нормы. В § 3.2 мы покажем, что норма позволяет определить расстояния между элементами V. Более того, мы можем определить «угол» Ѳ (фъ ф2) между векторами Фі и ф2 с помощью формулы = <2'96) Таким образом, существуют понятия длины и угла в пространстве V. Поэтому V называют эвклидовым пространством. 2.14. НЕКОТОРЫЕ СВОЙСТВА СКАЛЯРНОГО ПРОИЗВЕДЕНИЯ НА Rn Предположим, что С = (си) есть п X т матрица. Тогда, если и— элемент из то Си мы можем рассматривать как элемент из 7?п (см. § 2.8). Иначе говоря, если то Си = т 2juj Попытаемся определить (Си, х), где x(zRn- Имеем 50
где С = (Cji) —транспонированная матрица С и сц = сц для і = 1, 2, . . п и / = 1, 2, . . ., т. Итак, {Си, X} = {и, С'х). (2.98) Последнее выражение мы будем использовать в дальнейшем довольно часто. Пример 2.27. Пусть С— 3X2 матрица 1 О О 1 1 2 Если — элементы R2 и R3 соответственно, то а (Си. х) = игхх + и2х2 + urx3 + 2w2x3 = (и, С'х) = (хх + х3) + и2 (х2 + 2*з)- Подставьте какие-нибудь числа вместо Uj и х,, если вы все еще сомневаетесь в справедли¬ вости данного положения. Далее в этом параграфе мы будем рассматривать только простран¬ ство Rn. Все векторы будут считаться элементами Rn и все матрицы — размера п х п. Предположим, что А = (а^) удовлетворяет соотношению А = -4', (2.99) что эквивалентно = —ан для f = l,2, ..п и / = 1, 2, ..., п. (2.100) Говорят, что А — кососимметричная матрица. Каково значение этого свойства по отношению к скалярному произведению? Согласно выраже¬ нию (2.98) имеем {Ах, х) = {х, А'х) (2.101) для любого X. Это означает, что {Ах, х) = {х, — Ах) = — {Ах, х) (2.102) для любого х, если А кососимметрична. Иначе говоря, {Ах, х) = 0 (2.103) для любого х, если А кососимметрична. Справедливо и обратное: если матрица А удовлетворяет уравнению (2.103) для любого х, то А — косо¬ симметрична. Уравнение (2.103) означает, что векторы Ах и х ортого¬ нальны. Таким образом, операция А над вектором х производит век¬ тор Ах, ортогональный к х. 51
0 а b ' 0 11" Пример 2.28. А = — а 0 — с кососимметрична; — 1 0 0 — Ь с 0 — 1 0 0 также кососим¬ метрична. р/ Пример 2.29. Если В — любая п X п матрица, то матрица кососимметрична / 5 ~ D в +В . В— В' (почему?), а матрица— симметрична. Отметим, что В — х 1 ~ . Л £ А Упражнение 2.23. Покажите, что если (Дх, х)=0 для любого х, то А = —Д'. Указание: ( А (еі — ef), ві — ef) = 0. Мы знаем, что {elf е2, • • -, еп] есть ортонормальный базис в Rn. Пред¬ положим, что Ф невырожденная матрица; тогда набор векторов |Феп Фе2, ..., Феп) есть базис Rn (почему?). Посмотрим, каким условиям должна удовлетворять матрица Ф для того, чтобы этот базис был ортонормальным. Имеем (Ф^, Фе7) = (е^ Ф'Фе,). (2.104) Если Ф = (<рг/), то можно написать Ф'Фе,; = <р;.р<рР/, (2 105) Р=1 где Ф' = (ф'7) с ф'.. = фх... Следовательно, (Фе., Фе.) = ô.y. тогда и только тогда, когда Ф'Ф (2.106) Аналогично можно показать, что (Фег, Фе;) = тогда и только тогда, когда ФФ' - I (2.107) В результате получаем, что базис {Феь Фе2, . . ., Ф^Пі снова будет ортонормальным только в том случае, если обратная и транспонирован¬ ная матрицы Ф' одинаковы, т. е. Ф^-Ф', (2.108) или, что то же самое, ф'ф . ф'ф = 7. (2 109) Любая матрица, удовлетворяющая условию (2.109), называется орто¬ гональной матрицей (и преобразование, определяемое Ф, как в § 2.7, называется ортогональным преобразованием). Мы видим, что (Фх, Фх) - (X, х) (2.110) для любого вектора х и ||Фх|| = |]х[| [см. (2.95)] (2.111) для любого X в Rn, если Ф — ортогональная матрица. Ортогональную матрицу (или преобразование) Ф можно представлять себе как преобразование, сохраняющее эвклидову длину ||х|| вектора х, но изменяющее его «направление». [cos Ѳ sin О'] ‘ Ѳ Ѳ (для некоторого угла Ѳ). Тогда fcosO — sin 01 ' Tcos2 0 4- sin2 0 0 ] Г1 0"] Ф — л I; ФФ | , так что Ф есть [sin Ѳ cosOJ [ 0 sin2 0 4-cos2 0] [0 1J ортогональная матрица. 52
Упражнение 2.24. Определите, является ли матрица нальной? cos Ѳ sin Ѳ О — sin Ѳ cos Ѳ О О 0 1 ортого- Является ли ортогональной матрица 1 О О О cos Ф sin Ф ? О — sin Ф cos Ф Что можно сказать о произведении этих матриц? 2.15. НЕКОТОРЫЕ СВОЙСТВА СИММЕТРИЧНЫХ МАТРИЦ В § 2.11 мы уже отмечали, что существует тесная связь между поня¬ тием внутреннего произведения и симметричными матрицами. Исполь¬ зуем эту связь, чтобы отыскать некоторые свойства симметричных матриц, которые нам часто будут нужны в дальнейшем. В этом параграфе мы будем рассматривать лишь пространство Rn. Следовательно, все векторы будут предполагаться элементами из Rn, а все матрицы — размера п X п Пусть еъ е2, . • еп обозначает нор¬ мальный базис в Rn [см. уравнение (2.27)1 и пусть Q = (çz/) —симме¬ тричная п X п матрица, т. е. Q - Q', (2.112) где Q' — транспонированная матрица Q. Мы ‘знаем, что функция Q (ѵ, w), определенная как Q(ü, w) Qw (2.113) для всех V и w из /?п, является внутренним произведением на Rni по¬ скольку Q симметрична. п п Если V = 2^ и W " |3.£;, то имеем Q(f, w) = РА/= ÈÈ Qe/р,. (2.114) \/=1 /==1 / 1=1 /=1 Мы знаем, однако, что п Qer-^qkjek, (2.115) k=\ и, следовательно, А, Qe/ = qkj ’.еІУ ej) = qit, (2.116) Æ=1 поскольку (ez, ek} àik (где ôt/2 = 0, если i -^= k и ôz/ = 1). Отсюда выте¬ кает, что Q(ü, w) — (if, Qw -= S (2.117) и что Q — матрица внутреннего произведения Q по отношению к нормаль¬ ному базису \еъ е2, . . еп\. Рассмотрим теперь очень важную теорему, которая утверждает, что существует ортонормальный базис \f±, f2, . • fn\ в Rn, обладающий свойством Q(Z-//) = W h /=1,2..., п, (2.118) 53
где Х2, . . — п вещественных чисел. Иными словами, матрица внутреннего произведения Q по отношению к базису • • •> fn} есть диагональная матрица с элементами А,п Х2, . . Хп. Строго говоря, мы мо¬ жем доказать следующую теорему: Теорема 2.4. Если Q — симметричная п X п матрица и Q — вну¬ треннее произведение на Rn, определенное уравнением (2.113), то в Rn существует ортонормальный базис f2, . . ., /„}, т. е. {fi, /=1. 2, .... п (2.119) такой, что матрица Q по отношению к ft есть диагональная матрица Л вида " Хі 0 ... О ~ Л= • (2.120) _ 0 0 ... Х„_ Иначе говоря, существует ортогональная матрица Ф [т. е. Ф'Ф = /, см. уравнение (2.109)], обладающая свойством (Ф^, = ХД,; і, / ==1,2, . . ., п (2.121) или, что эквивалентно, Ф'(?Ф = Л. (2.122) Поскольку Ф ортогональна и Ф' — инвертированная матрица Ф, уравнение (2.122) означает, что Q и Л— подобные матрицы (см. § 2.9). Следовательно, вещественные числа Х2, . . ., — собственные зна¬ чения Q х. Можно непосредственно установить два следствия этой теоремы. Следствие 2.1. Если Q — (вещественная) симметричная п X п ма¬ трица, то собственные значения Х2, . . ., матрицы Q вещественны. Следствие 2.2. Если Q (ü, ѵ) = (ѵ, Qv} — квадратичная форма, произведенная внутренним произведением Q (см. § 2.11), то существует ортонормальный базис {f19 f2, . . ., /п}, такой, что Q(v, ѵ) = {V, Qv) = S М? (2.123) І=1 для всех V из Rn, где À, — собственные значения Q и Рг- — координаты ѵ п по отношению к базису /£, т. е. ѵ = 2 IV,- Пример 2.31. Пусть Q — сумметричная 2X2 матрица: р_Га Л. <«і- Qet)=a Qe2) = Ь; р cj’ {е2, Qe1} = b (е2, Qe2) = c. Теорема устанавливает, что существует ортонормальный базис {/х, /2) в Т?2, такой, что (/„ Qfi) = Qf2) = 'f2,Qfô = 0 и (/2, Qf2) = Х2, где и Х2 —соб- ственные значения Q. Так как нетрудно видеть, что det (Q — XI) — X2 — (а + с) X + (ас — Ь2) и, следовательно, соб¬ ственные значения Q равны . (а + с) + К (а — с)2 4- 462 , (а + с) — V (а — с)2 + 4/>2 Лі = 2 и Л2 = 2 * 1 Доказательство этой теоремы можно найти в литературе [21] или [24]. 54
Так как (а — с)2 + 0, собственные значения и Х2 должны быть действитель- „ , Н Ц ными. В частности, если а — о — с= 1, т. е. Q= I I, то собственные значения Q равны 0 и 2, и существует ортогональная матрица Ф, а именно: такая, что Ф'фФ = Векторы /] = Фег = 1 1_ /2 /2 1 1_ /2 /Т 1 /2“ 1 И ?2 = Ф^2 1 /2 1 L J _/2 являются новыми ортонор¬ мальными векторами базиса в /?2. Исходя из следствия 2.2, введем следующую терминологию для симметричной п X п матрицы Q. Будем говорить, что Q: 1. Положительно определенна, если все собственные значения поло¬ жительны, т. е. \ > 0 для всех Z, (2.124) или, что эквивалентно, тогда и только тогда, когда Q(ü, ü) = Лр, Qü)>0 (2.125) для всех V =/= 0 из 2. Положительно полуопределенна, если собственные значения Х2, . . матрицы Q неотрицательны и хотя бы одно из собственных значений \ равно нулю, т. е. \ 0 для всех і (2.126) и = 0 для некоторых £ (1, 2, . . ., п}, (2.127) или эквивалентно, если Q(ü, ѵ) = Qv)^0 (2.128) для всех V из Rn и существует некоторый! вектор гі 0 в Rn, для которого Q(ü, v) = (<ut Qv) = 0. (2.129) 3. Отрицательно определенна тогда и только тогда, когда собствен¬ ные значения Х2, . . матрицы Q отрицательны, т. е. <0 для всех і (2.130) или эквивалентно, если Q(ü, у) = (2.131) для всех V =£ 0 из Rn. 4. Отрицательно полуопределенна тогда и только тогда, когда все собственные значения Х2, . . ., матрицы Q неположительны и по крайней мере одно из них равно нулю, т. е. < 0 для всех і (2.132) и или х = 0 для некоторого £ {1, 2, . . ., п] эквивалентно, если (2.133) для Q(ü, ѵ) = (ü, Qv) < 0 всех V из Rn и (2.134) для Q(ü, v) = (ü, Qv) = 0 некоторого V 0 из Rn. (2.135) 55
Заметим, что если Q положительно или отрицательно определенна, то Q должна быть невырожденной, поскольку Q подобна диагональной матрице, не имеющей нулей среди элементов главной диагонали. Если Q положительно или отрицательно полуопределенна, то Q должна быть вырожденной матрицей, поскольку Q имеет нулевое собственное зна¬ чение. Частные случаи использования этих понятий рассматриваются в гл. 6 и 9. Пример 2.32. Матрица Q = положительно полуопределенна, так как ее соб¬ ственные значения равны 0 и 2. Так как нам часто надо будет определять, является ли данная сим¬ метричная п X п матрица Q =-- (qu) положительно определенной, устано¬ вим два критерия положительной определенности с помощью следующей теоремы: Теорема 2.5. Пусть Q =■- (qif) — симметричная п X п матрица. Тогда а) Q положительно определенна в том и только в том случае, если существует некоторое k > 0, такое, что (ü, Qü> &ИІ2 (2.136) для всех V из Rn, где ||я|| = ф) — эвклидова норма ф [см. урав¬ нение (2.95)]. б) Q положительно определенна в том и только в том случае, если справедливы соотношения det(Qr)>0, г- 1, 2, ..., п, (2.137) где det (Qr) есть детерминант г X г матрицы Qr = (W; 1, 2, ..., г; Р- 1, 2, . . ., г, (2.138) т. е. 7іі Уі2 • • • 9іг Q = <?21 <?22 ••• Ягг (2.139) _<7г1 <?г2 • • • ЯГГ- Докажем пункт а) этой теоремы, а за доказательством пункта б) отошлем читателя к литературе [21 1. Предположим сначала, что соотно¬ шение (2.136) удовлетворяется. Так как k > 0 и || ф|| 0, если ф О (см. § 2.13), то (г>, Qv) ^£||^||2>0 (2.140) для всех ф из Rn. С одной стороны, на основании уравнения (2.125) можно заключить, что Q положительно определенна. С другой стороны, предположим, Q положительно определенна, тогда на основании след¬ ствия 2.2 заключаем, что существует ортонормальный базис flf f 2, ... . . ., fnt такой что (v, = (2.141) для всех ф из Rn, где pz — координаты ѵ по отношению к /t и \->0, і - 1, 2, . . ., п (2.142) (так как Q положительно определенна). Однако, так как fj) =àtl, i, j= 1, 2 n, (2.143) 56
мы имеем II® If2 = (©, ©) = z £ Pi fi, І₽,/,> - S ?’ /-1 / r-=l и если считать k положительным числом (/г > 0), причем k < \ і = 1, 2, . .., и, то из уравнений (2.141) и (2.144) можно заключить, что п п (ѵ, Qv} = ₽Ь=*М2. і=1 і = 1 (2.144) (2.145) (2.146) Таким образом, пункт а) теоремы 2.5 доказан. Пример 2.33. Предположим, что Г<711 <712 1^21 <?22. — симметричная 2X2 матрица. Q положительно определенна только тогда, когда çu > 0 и qnq2.2 — 4:> Если Q - <7и <712 <7із ^21 <722 <723 <7зі <7.32 <7зз — симметричная 3X3 матрица, то Q положительно определенна, если <7ц>0 и quq^ — — q^ 0 и det Q > 0. Этотпример иллюстрирует пункт б) теоремы в тех частных случаях, когда п -- 2 и п = 3.
ГЛАВА 3 МАТЕМАТИЧЕСКИЙ АНАЛИЗ 3.1. ВВЕДЕНИЕ В этой главе продолжим изложение некоторых положений матема¬ тики, необходимых нам в дальнейшем. Основное внимание будет сосредо¬ точено на таких понятиях как расстояние, сходимость векторных функций, дифференциальные уравнения и линейные системы. С целью полноты изложения привлечен математический аппарат высшего анализа. Все эти теоретические положения развиваются лишь в такой степени, чтобы чита¬ телю было доступно изучение последующих глав книги. Заинтересованный читатель может углубить свои знания в этой области с помощью следующих книг: [21], [25], [46], [51], [59], [124], [180], [192], [196], [205] и [212]. РАССТОЯНИЕ И СВЯЗАННЫЕ С НИМ ПОНЯТИЯ 3.2. ОПРЕДЕЛЕНИЕ Мы приступаем к изучению очень важного понятия о расстоянии и некоторых его следствий. Рассмотрим сначала интуитивное понятие расстояния и попытаемся абстрагировать его наиболее существенные элементы. Прежде всего заметим, что когда мы говорим о расстоянии, то всегда представляем его между двумя точками, например: расстояние между Нью-Йорком и Бостоном 208 миль. Во-вторых, отметим, что рас¬ стояние между двумя точками равно нулю, когда эти точки совпадают. Например, расстояние между Бостоном и Бостоном равно нулю миль. В-третьих, мы обычно рассматриваем расстояние между точками незави¬ симо от порядка, в котором эти точки называются, т. е. расстояние между Нью-Йорком и Бостоном то же самое, что между Бостоном и Нью-Йорком. И, наконец, интуитивное понятие расстояния триангулярно в том смысле, что если Л, В и С — три точки, то расстояние между 4 и Сне превышает суммы расстояний между А и В и В и С. Например, расстояние между Нью-Йорком и Бостоном меньше, чем сумма расстояний между Нью- Йорком и Олбани и между Олбани и Бостоном. Эти сведения приводят нас к следующему строгому определению понятия расстояния. Определение 3.1. Если X — некоторое множество, то функция d, принимающая лишь вещественные значения, определенная на всем мно¬ жестве X X X, называется функцией расстояния на X, если удовлетво¬ ряются следующие условия: 1) d (х, у) 0 для всех х, у из X и d (х, у) = 0 тогда и только тогда, когда X = у; 2) d (х, у) = d (у, х) для всех х, у из X; 58
3) d (x, z) < d (x, y) + d (y, z) для всех x, y и z из X, Функцию d (x, y) мы часто будем называть расстоянием между х и у и именовать (3) неравенством треугольника. Множество X вместе с заданной функцией расстояния d на X называется метрическим пространством. Если X — эвклидово пространство с Р в качестве внутреннего про¬ изведения (см. § 2.11 и 2.13), то мы можем определить расстояние, приняв d(х, у) = Ux — у||р = ѴР(х — у, х — у), (3.1) где II (х —у) |[р представляет собой норму х — у (см. § 2.13) и х, у£Х. На основании первого и второго свойств нормы (§ 2.13) и свойства про¬ изведения Р (§ 2.11) замечаем, что уравнение (3.1) действительно опре¬ деляет расстояние на X, В частном случае, когда X есть пространство Rn и Р — скалярное произведение на Rn [уравнение (2.86)], мы имеем Xi Уі x2 Уг X = и y = Уп_ d(x, у) = Il x — у И = Ѵ(х — у, х — у) (3.2) или, что эквивалентно, Такую функцию расстояния будем называть натуральным, или эвкли¬ довым, расстоянием. Пример 3.1. Если X = R есть множество вещественных чисел, то расстояние междух и yt d (х, у) представляет собой абсолютное значение разности х — у, т. е. d (х, у) ~ — I х — у |. Например, d (5, 3) = | 5 — 3 | = 2. Пример 3.2. Если 1 З' 1 2 1 4 х = О 2 О то d(x, z) =||х—z|| = Кб d(x, у) =||х — Я = 2 Кб d (у, z) = ||у — z || = 3. Пример 3.4. Предположим, что X = /?2 и х = , тогда функция Итак, получим Кб <2/б +3; 2 Кб < Кб +3; 3 < Кб +2 Кб. Пример 3.3. Если X — любое множество и мы зададим d (х, у) = 1, если х=ру и d (х, х) = 0 для x и у из X, то d будет функцией расстояния на X. г п Г Уі _ _ LZ/2J d (х, у), заданная как d (x, у) = I хх — £/іі +|х2— */2| есть функция расстояния на /?2. Упражнение 3.1. Покажите, что функция d примера 3.4 действительно есть функция расстояния на Т?2. Обобщите это понятие расстояния на Rn. Указание: в примере 3.4 2 d(x, у) - 2 \*1~ Уі\- £ = 1 59
Упражнение 3.2. Если max {а, b} обозначает наибольшую величину из а, Ь, то функ- LizzJ/ на Докажите эго и обобщите на Rn. Указание: d (й’ 3.3. СФЕРЫ И ПРЕДЕЛЫ Пусть X — множество, d — расстояние на X и х0 — фиксированный элемент X. Часто интерес представляют точки, находящиеся в пределах заданного расстояния от фиксированной точки х0. Если р > 0 — веще¬ ственное число, то множество S (х0, р), определенное как 5(*(ь Р) = І*ЕХ : d(xQ> х)<р}, (3.4) называется открытой сферой радиуса р вокруг х0. Иными словами, S (х0, р) — множество элементов из X, расстояние которых от х0 меньше, чем р. Например, если X = R и мы исполь¬ зуем натуральное расстояние на R, то S (0, 1) = {г : I г I < 1 ). Отметим, что если р <а, то S (х0, р) с: S (х0, <*)• Рис. 3.1 a) S (0, 1) — внутренняя часть круга, S (0, 1) — внутренняя часть круга вместе с окружностью, являющейся границей круга; б) S (О, 1) — внутренняя часть квадрата, S (0, 1) — весь квадрат Пример 3.5. Пусть X — R2 и х0 = [ 0J' Если использовать натуральное расстояние [уравнение (3.3)], то S (0, 1) есть множество |х “ j : < <Z 1 j (см. рис. 3.1, а). Если использовать определение расстояния из упраж¬ нения 3.2, то S (•£(), 1) — - [д/j : max {|хіІ» |х21} <11 (см. рис. 3.1, б). Аналогичным образом, если р > 0 — вещественное число, то множе¬ ство S (х0, р), определенное как S(x0, р) = |х6 X : d(x0, х) <р), (3.5) называют замкнутой сферой радиуса р около х0. Другими словами, S (х0, р) есть множество элементов из X, расстояние которых от х0 не превосхо¬ дит р. Например, если X = R и мы будем использовать натуральное рас¬ стояние на R, то S (0, 1) = {г : | г | < 1}. Причина использования терми¬ нов «открытое и замкнутое пространство» будет ясна из следующего па¬ раграфа. Наконец, заметим, что в частном случае пространства Rn с расстоя¬ нием і| X — у і| имеем S(x0> р) - |х(Е Rn :||х — ЛоІКр} S(x0, р) = (хе /?„ :||х — .toll < р}. (3.6а) (3.66) Определив понятия открытой и замкнутой сферы с центром в неко¬ торой точке, мы готовы к тому, чтобы сформулировать понятие сходи¬ мости. Предположим, что х„, п = 1, 2, ... есть последовательность элементов из X. Что означает утверждение: последовательность прибли¬ жается к х0 (стремится или сходится к х0)? Интуитивно мы рассматри¬ ваем последовательность как стремящуюся к х0, если элементы хп все больше приближаются к х0 по мере увеличения п.
Определение 3.2. Сходимость. Последовательность \хп: п = 1, 2,. . .} называют сходящейся к х0, если для любого действительного е > 0 суще¬ ствует N (е) такое, что если п^> N (е), то хп окажется в S (х0, е), т. е. d (х0, хп) < s для всех п больших, чем N (е). Иначе говоря, если взять любую открытую сферу с центром в xQ, то, начиная с некоторого элемента, все остальные члены последовательности будут находиться внутри этой открытой сферы. Часто пишут хп -> х0 для обозначения следующего положения: «хп сходится кх0». Например, последовательность хп = —, п = 1, 2, . . . в 7? сходится к 0. Легко видеть, что последовательность хп сходится к х0 тогда и только тогда, когда последовательность вещественных чисел d (Xq, хп) сходится к 0. В частном случае пространства Rn с расстоянием IlX—у-l последовательность хп сходится к х0 тогда и только тогда, когда для б > 0 существует N (б) такое, что ||хп—х0|| <е для всех п > N (е). Пример 3.6. Точки хп = [}/^] в ^2 сходятся к началу координат в R2 по отно¬ шению к натуральному расстоянию на R2, а также по отношению к расстояниям из упраж¬ нений 3.1 и 3.2. Пример 3.7. Если X — любое множество и d — расстояние из примера 3.3 (т. е. d (х, у) - 1 при х /- у и d (х, х) — 0 для х, у из X), то последовательность хп — х0, п — 1, 2, . . . сходится к Л'о. Определение 3.3. Предел последовательности. Если последователь¬ ность хП9 п 1,2,... сходится к х0, то х0 называют пределом последова¬ тельности и записывают это так: Рис. 3.2 Две открытые сферы s («О. -|-) и 5 (i/o. -|-) [см. уравнение (3.4)] не встречаются х0 = lim хп. П-+ оо Посмотрим, может ли последовательность хп, п = 1, 2, ... иметь больше одного пре¬ дела? Заметим сначала, что если х0 и yQ — два различных элемента из X, то d (х0, yQ) р > О и, следовательно, S (х0, и S^z/0, не пересекаются, т. е. S (х0, -у) П П S ^z/0> -у) = 0 [см. (рис. 3.2) ]. Для того чтобы X принадлежал одновременно S (хц, и S (^уо, -уу должно быть обеспечено услові х) + d (х, у о), что приводит к противоречию р <р (почему?). Если по¬ ложить Е то нетрудно получить, что для п > N (е) хп не принад¬ лежит к S (z/0, е), и поэтому z/0 не является пределом последователь¬ ности. Наконец, предположим, что хп, п = 1, 2, ... есть последователь¬ ность элементов из и обозначим компоненты хп через хпі, т. е. d (х0, z/o) = P < d (х0, 61
Тогда N-мерный вектор хс компонентами х19 х2, . . xN есть предел последовательности {хД только в том случае, если каждая величина до¬ есть предел последовательности {xrtit}. Иначе говоря, хп -> х тогда и только тогда, когда хп, і хі Для всех (З.бв) Чтобы показать это, запишем N I Хп.< — Xt I С II Хп — X II < S I хп. і — Хі I, (3.6г) так как 3.4. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА Предположим опять, что X — множество и d — расстояние на нем. В этом параграфе мы рассмотрим важные свойства, которыми могут обладать подмножества из множества X. Определение 3.4. Внутренняя точка. Если А — подмножество из X и если xÇ Л, то говорят, что х есть внутренняя точка Л, когда суще¬ ствует р > 0 такое, при котором открытая сфера S (х, р) содержится в Л, т. е. S (х, р) с: Л. Например, если подмножество Л само является открытой сферой (Л = S (х0, р)), тогда любой элемент Л есть внутренняя точка Л. Упражнение 3.3. Покажите, что если А = S (х0, а) и х g X, то х есть внутренняя точка А. Указание: рассматривайте открытую сферу S(x, р) с р = а — d (х0, х). Пример 3.8. Пусть X = R, с натуральным расстоянием d (г, s) = | г — s|, и пусть А — подмножество из X, заданное соотношением А — [г : 0 << 1}. Точка г= — есть вну¬ тренняя точка А, но точка г = 1 таковой не является. Пример 3.9. Пусть X — любое множество и d — функция расстояния из примера 3.3 (т. е. d (х, у) = 1 при X #= у и d (х, х) = 0). Если А — любое подмножество из X, то каж¬ дый элемент А есть внутренняя точка А. Определение 3.5. Открытое множество. Говорят, что Л — открытое подмножество множества X, если каждый элемент Л есть внутренняя точка Л. Иначе говоря, Л открыто, если для каждого х из Л существует р > 0 (которое может зависеть от х), такое, что 3 (х, р) содержится в Л. Заме¬ тим, что открытая сфера является открытым подмножеством (упражне¬ ние 3.3). Если X = R и a, b — элементы /?, причем а < Ь, то множе¬ ство {г : а <^г <^Ь\ открыто и называется открытым интервалом с кон¬ цами а и Ь. Такое множество мы иногда будем обозначать (af Ь) \ т. е. (а, Ь) = {г £ Я : а <^г < 6}. Если А± и Л 2 открыты, то можно показать, что Лх П Л2 также от¬ крыто. Далее, если Л,, / — 1,2,... открыты, нетрудно видеть, что J Л/ і=\ также открыто. Наконец, все пространство X и нулевое множество Ф также открыты. Упражнение 3.4. Покажите, что если Хх и А2 открыты, то Xj П А2 открыто. [Ука¬ зание: Если X g А1 П А2, то существуют рі> 0 и р2> 0, такие, при которых 1 Нельзя путать с парой (а. Ь) в пространстве R X R. Значение символа (а, Ь) всегда будет очевидно из контекста. 62
S (x, px) CZ Ai и S (x, p2) C A2. Что представляет собой S (x, pj f] 5 (x, p2)?]. Если множества Alt A2, . . An открыты, то является ли открытым множеством их пересече¬ ние Лх П А2 fl * ‘ ’ П Является ли множество |^lj : Х; + х2 < 1 и хх > oj откры¬ тым в /?2? Определение 3.6. Предельная точка. Пусть В есть подмножество из X их — элемент X. Будем говорить, что х — предельная точка В, если существует последовательность хп, п = 1, 2 . . . элементов В (хп 6 В для п = 1, 2, . . .), которая сходится к х. Отметим, что х, будучи предельной точкой В, может и не быть эле¬ ментом В. Например, если В — подмножество из 7?, заданное соотноше¬ нием В = \г : 0 < г < 1}, то точка 0 является предельной точкой В, которая не принадлежит В, поскольку последовательность —, п = 1, 2, . . . элементов из В сходится к 0, который не является элементом В. Если у — любая точка из В, то у есть предельная точка В, так как после¬ довательность хп = у у п = 1, 2, ... сходится к у. Определение 3.7. Замкнутое множество. Будем говорить, что В — замкнутое подмножество из X (или, что В замкнуто), если каждая предель¬ ная точка принадлежит В. Докажем теперь следующую теорему. Теорема 3.1. Если А открыто, то X — А (дополнение Л, см. § 2.3) замкнуто, и, наоборот, если В замкнуто, то X — В открыто. Доказательство. Пусть А открыто и х£Л. Существует р > О, такое, что S (х, р) с: Л и, следовательно, S (х, р) не встречается с X — Л, т. е. S (х, р) П (X — Л) = 0. Ясно, что х не может быть предельной точкой X — Л. Это доказывает, что все предельные точки X — А принад¬ лежат X — Л, т. е. что X — А замкнуто. С другой стороны, предположим, что В замкнуто и х С X — В. Рассмотрим открытые сферы S (х, для п = 1, 2, . . . Докажем, что существует N, для которого S Çx, cl X — В, Если это не так, то каждая сфера S (х, пересекается с В и существуетхп в S (х, П 5 для п = 1, 2. . . Последовательность {xj, п = 1, 2, ... сходится к х, так как т > п соответствует S (х, — ) cz S ^х, — ) и так как для р > 0 существует т такое, что р >• —. Поскольку В закрыто и все хп принадлежат В, получаем противоречие: x С В. Итак, открытая сфера S (х, содержится в X — В (для некоторого X), и поэтому х есть внутренняя точка X — В. Следовательно, X — В открыто. Упражнение 3.5. Покажите, что замкнутая сфера S (х0, р) есть замкнутое множество. Указание: Если хл, п — 1, 2, . . принадлежит S (х0, р) и {хп} сходится к х, то d (хп, х) сходится к 0, так как d (х0, x) d (х0, хп) + d (хп, x) P + d (хп, х). Если Вх и В2 замкнуты, можно показать, что Вх J В2 также зам¬ кнуто. Далее, если Bz, 4 = 1,2,..., замкнуты, то П В, также замкнуто. Наконец, все пространство X замкнуто и нулевое пространство 0 также замкнуто. Если X = R и а и b — элементы /?, причем а <* &, то множество {г : а < г < Ь\ замкнуто и называется замкнутым интервалом с кон¬ цами а и Ь. Такое множество мы иногда будем обозначать как [а, Ь], т. е. la, b] = {г g R : а < г < b}. Мы будем также использовать обо- 63
значения [а, b) и (а, Ь] для множеств \г : а < г << Ь] и {г : а <^г < Ь\ соответственно. Резюмируя все это, получим (а, Ь) = {г : a<Z г ' [а, Ь] = {г : а С г С Ь] ; [а, Ь) \г : а < г < Ь\\ (а, Ь] = {г : а<_г < Ь}. Укажем, что множества [я, Ь) и (а, b I не являются ни открытыми, ни замкнутыми и часто называются полузамкнутыми или полуоткрытыми интервалами. Предположим, что С — подмножество из X. Дадим определения трех подмножеств из X, которые называются внутренней частью, замыканием и границей С. Определение 3.8. Внутренняя часть. Если дано множество С, то его внутренней частью, обозначаемой і (С), является множество всех внутрен¬ них точек С, т. е. z(C)— (х : существует р>0, такое при котором S (х, р) cz С}. (3.8) Заметим, что А открыто в том и только в том случае, если оно совпа¬ дает со своей внутренней частью Іиначе говоря, і (Л) Л]. Например, внутренней частью la, b) является открытый интервал (а, Ь). Определение 3.9. Замыкание множества. Замыканием данного мно¬ жества С, обозначаемым с (С) (или С), является множество всех предель¬ ных точек С: с (С) = [х : существует последовательность хп, п = 1, 2, . . ., такая, что хп сходится к х}. (3.9) Можно показать (упражнение 3.6), что с (С) есть замкнутое множество. Далее, множество В замкнуто тогда и только тогда, когда оно совпадает со своим замыканием, т. е. В = с (В). Например, замыкание интервала [а, Ь) есть замкнутый интервал la, bl. Определение 3.10. Граница множества. Границей данного множе¬ ства С, обозначаемой b (С), называется множество предельных точек С, которые не являются внутренними точками С: 0(C)-с(С)—/(C). (3.10) Можно показать, что граница С, b (С) есть замкнутое множество. Действительно, b(C) = с(С) П с(Х-С). (3.11) Иными словами, граница С есть пересечение замыкания С с замыка¬ нием X — С. Например, границей множества [а, Ь) является множество, состоящее из двух точек а и Ь. Пример 3.10. Множество С на задано как С — Цх] : xî "Е х2 < 1 или хі ~ 2, х2 = з| (рис. 3.3). Иначе говоря, С = S (0, 1) (J • Тогда і (С) — S (0. 1); с (С) = S (0, 1) J {[3]} и b (С) — ([^] : Х| + %2 = 1 или хі ~ 2, х2 — з|. Отметим, что среди четырех множеств С, і (С), с (С) и b (С) тождественных множеств нет. 1 Где {(2, 3)} есть множество, состоящее из одной точки L 64
Рис. 3.3. Множество С состоит из внутренней части круга и точки (2, 3). Внутренней частью мно¬ жества і (С) является внутренняя часть круга; границей b (С) — граница круга (окружность) и точ¬ ка (2, 3)\ замыканрем (С) — весь круг и точка (2, 3) Упражнение 3.6. Докажите, что с (С) замкнуто. Указание: Предположим, что x£c{c(Q); тогда существует последовательность^, уп £ с (С), которая сходится к х. Но уп g с (С) означает, что существует хп в С с d (хп, Уп) <Z ♦ Покажите, что последова¬ тельность хп сходится к X. Пример 3.11. Пусть X = R и С — множество всех раци¬ ональных чисел, С = {г £ R; г= где р и q — целые числа^. Тогда і (С) пусто, с (С) есть вся линия R и b (С) также вся линия R. Понятия, которые мы рассмотрели, могут быть несколько обобщены. По сути дела, мы говорили о метрических пространствах и о том, что назы¬ вается топологией. Общее понятие топологии и то¬ пологического пространства основано скорее на понятии открытых множеств, чем на понятии рас¬ стояния Эти более общие идеи можно найти в ра¬ боте [196]. 3.5. ПОЛНОТА И СЖАТИЕ Предположим, что X есть множество с функ¬ цией расстояния d и что х, следовательность, существует N (-у) то d (х0, хп) Из неравенства треугольника п = 1, 2, ... — по- сходящаяся к х0. Для е > О такое, что если (определение 3.1) следует, что если n, т^> N (-у), то d (хп, хт) <е. Это свойство сходящихся последовательностей весьма важно и приводит к следующему. Определение 3.11. Равномерная сходимость. Последовательность уп, п = 1, 2, . . ., элементов из X независимо от того, принадлежит ее предел к X или нет, называется равномерно сходящейся, если для каждого 8>0 существует N (е) такое, что если пит превосходят N (е), т. е. п > N (е), m > N (е), то d (хп, хт) <е. Если каждая последовательность в X рав¬ номерно сходится к элементу из X, то говорят, что множество X является полным. Например, эвклидово пространство Rn с эвклидовой функцией расстояния является полным Ч Пример 3.12. Пусть X — (0, 1 ] и d (х, у) = | х — у | для х, у в (0, 1 ]. Последова¬ тельность Хп = п = 1, 2, . . ., сходится равномерно в X, но ее предел не принадле¬ жит X. Иначе говоря, множество X — (0, 1 ] не является полным. Упражнение 3.7. Докажите, что если X = [1, 2), причем d (х, у)= | х — у | для х, у из [1, 2), то X не является полным. Определение 3.12. Сжатие. Пусть X — полное множество и Т — преобразование (функция) X в себя, т. е. Т — функция, область суще¬ ствования которой — все множество X и область изменения содержится в X. Если существует вещественное число k, 0 < k << 1, такое, что для всех х, у из X справедливо d[T(x), T(y)]<kd(x, у), (3.12) 1 Действительно, Rn полно по отношению к функциям расстояния d (х, у) = || X — /~7і п 2 (Хі — Уі)2 (эвклидово расстояние); d (х, у) = Jj Iх* ~~Уі\ и d ^) = = max {| xz — yi\}. 3 Атанс и др. 65
то преобразование Т называют сжатием на X. Иначе говоря, Т есть сжа¬ тие, если Т уменьшает расстояние между точками. Отметим, что число k в уравнении (3.12) не зависит от х и у. Пример 3.13. Пусть X — закрытый интервал [0, 1 ] с d (х, у) — | х — у | для х. у Х^1 из [0, 1 ] и пусть f — преобразование [0, 1 ] в себя, заданное как f (х) — -у. Тогда | f (х) — — f (у) I = L*+-Е L!.* El I X _ у |э и f есть сжатие на [0, 1 ]. Пример 3.14. Пусть X = Rn и ЭД, — линейное преобразование Rn в себя, заданное как ЭД (я) = Аѵ, где А — (а.^) есть п X п матрица и v £ Rn [см. уравнение (2.51)]. Пред- п п положим также, что 2 = в этом слУчае есть сжатие. і=і /=1 Если wÇ Rn, то Г п. г П \2 d (А я, Aw) = Il Av — Aw|| = ||А (v — w)|| = 1 / аи(ѵі ~ ш/)( • V i=i (/=1 J В силу неравенства Шварца [уравнения (2.87) или (2.91)] d (Av, Aw) у/4"S S a}j И — w II2- Следовательно, d(Av, Aw)^. kd(v, w). Таким образом, ЭД (v) есть сжатие. Например, при и = 2 и А = 2 1 2 1 9 1 имеем ап=-у; ^2=— ; • 2 1 2 2 9 9 3 «22 =-3-; «11 + «12 + «21 + «22 = -4 Следовательно, преобразование ЭД, заданное как ЭД (ех) — 1 1 ~ Из" 2 Кб" 1 1 2 КЗ , ЭД(е2)= 1 /з 1 2/6 , является сжатием. 1 __ 2/б ” 1_ /3 Докажем теперь важную теорему, которая показывает, как сжатие может быть связано с решением уравнений. Теорема 3.2. Если Т есть сжатие на X, то существует единственный элемент х* £ X, такой что T (х*) = X*. (3.13) Более того, если — произвольный элемент X и если х2 = Т (хх), х3 = Т (х2), . . ., хп — T (xrt_j), то последовательность [хп} сходится к х*. Доказательство. Прежде всего докажем, что такой элемент х* дол¬ жен быть единственным. Предположим, что х* и у* — два элемента из X, удовлетворяющие уравнению (3.13), т. е. Т (х*) = х* и Т (у*) = у*. Тогда d [Т (х*), T (ÿ*)] < kd (х*, ÿ*), поскольку Т — сжатие и, следо¬ вательно, d (х*, у*) < kd (х*, у*), что при любом k, 0 < k << 1 справед¬ ливо лишь в случае d (х*, у*) = 0. Следовательно, х* = у*. Докажем теперь, что существует элемент х*, удовлетворяющий уравнению (3.13). Пусть хх — любой элемент из X, х2 = Т (xj, х3 = = Т (х2) и вообще хп = T (хл_і), п --= 1, 2, ... (3.14) 66
Последовательность хп, п = 1, 2, ... сходится равномерно. Если 8 > 0, то существует N (г) такое, что если п N (е), то kn~'d(xi, х2) 11 < 8. (3.15) Предположим, что я, m > N (s) (положим, что т п), тогда d(xn, хт) = d[T (х^), Т (х^)] < kd [ T (xn_2), T (xm_£)] < < kn~Xd [Xx, T (xm_n_x)] < kn^ [d (xb x2) + (xi> хз) + • • • + (*1> xm-n)] < < kn~xd{xu x2) {1 + k + k2 H + km~n~x\ < <én~1d(x1, *2)|утту|<8 (3.16) [по неравенству (3.15)]. Другими словами, последовательность xn, п = = 1, 2, ... сходится равномерно и, следовательно, имеет пределом х* (так как X — полное множество). Мы убедились, что Т (х*) = х*. Рассмотрим последовательность Уп ~ Т (хп) = хп+1, п = 1, 2, . . . Ясно, что уп сходится к X*, и мы пока¬ жем, что уп сходится к Т (х*). Это и обоснует сформулированную нами теорему. Так как х* — предел последовательности {хп}, для 8 >> 0 суще¬ ствует N (8) такое, что если п^> N (е), то хп принадлежит к S (х*, 8), т. е. d (х*, хп) Следовательно, d [T (х*), Т (хп) ] = d [71 (х*), уп] < < kd (х*, хп) <8 и уп принадлежит к S (Т (х*), е) для всех п > N (е). Таким образом, мы показали, что уп сходится к Т (х*). Эту теорему мы используем в дальнейшем для доказательства теоремы существования решения дифференциальных уравнений. СВОЙСТВА МНОЖЕСТВ В Rn 3.6. КОМПАКТНОСТЬ В этом и следующем параграфах мы будем рассматривать исклю¬ чительно эвклидово пространство Rn с натуральным расстоянием d на Rn [см. уравнение (3.2)]. Определение З.ІЗ.Ограниченное множество. Предположим, что С есть подмножество из Rn. Будем говорить, что С ограничено, если» имеется конечное р > 0, при котором С заключено в сфере S (0, р) радиуса р с центром в начале координат. Определение 3.14. Компактность. Пусть С есть подмножество из Rn. Если множество С замкнуто и ограничено, то говорят, что С есть компакт¬ ное подмножество из Rn (или что С компактно). Например, замкнутый интервал [О, T], Т >• 0 есть компактное подмножество множества R = R±. Компактные множества обладают различными свойствами, которые можно использовать для определений компактности и которые часто «по¬ лезны при доказательствах теорем, связанных с компактными множе¬ ствами. Эти свойства могут быть записаны так: 1) С компактно, если С замкнуто и ограничено; 2) С компактно, если для любого заданного набора открытых мно¬ жеств Alt Л 2, . . ., таких, что Ce U Aif существует конечный набор /=і чисел П1, ZÎ2, . . ., Пы, при которых С CZ Апл U U • • • U Это утверждение часто называют свойством Гейне—Бореля; 1 Это утверждение часто формулируют следующим образом: множество является замкнутым, если найдется конечная система открытых множеств, которые целиком покры¬ вают это множество. В нашей литературе это утверждение именуется леммой о конечном покрытии. (Прим. ред.). 67
3) С компактно, если Вг, В2, . . . — любой набор закрытых множеств, (п \ / °° \ П В} J Ф Ф для каждого п, то С П | Г1 Æ/1 (это утвер- /=і / \ /=і / ждение часто называют свойством конечного числа пересечений); 4) С компактно, если для любой заданной последовательности хп, п — 1, 2, . . ., в С 1 Рис. 3.4. Замыкание с (4) и граница b (4) ограниченного откры¬ того множества 4 яв¬ ляются компактными подмножествами из R2 существует подпоследовательность хПі, хП2, . . ., кото¬ рая сходится к элементу из С (это утверждение иногда называют свойством Больциано—Вейершт- расса). Можно показать, что если подмножество С из Rn обладает хотя бы одним из этих свойств, то оно обладает и всеми остальными [51], [196]. Пример 3.15. Если х — элемент из Rn ир>0, то замк¬ нутая сфера S (х, р) компактна, а открытая сфера S (х, р)—нет. Действительно, если 4 есть ограниченное подмножество из Rn, то замыкание 4, с (А) [уравнение (3.9)] компактно и граница b (4) также компактна. Например, если 4 — подмножество из Т?2, определенное как 11, то с (4) = — 1 > — суть компактные подмножества из R2 (рис. 3.4). : 11 и 3.7. ГИПЕРПЛОСКОСТИ И КОНУСЫ Рассмотрим два специальных класса подмножеств эвклидова про¬ странства, чтобы подойти к изучению в следующем параграфе понятия выпуклости. Грубо говоря, гиперплоскость в Rn аналогична линии на плоскости /?2 и может рассматриваться как подпространство размерности (п — 1) пространства Rn. Более строго это можно сформулировать в виде: Определение 3.15. Гиперплоскость в Rn. Пусть L(x) — функция на Rni принимающая только вещественные значения и определяемая в виде (3.17) где а — заданный ненулевой элемент из Rn и b — заданное веществен¬ ное число. Тогда подмножество L из Rn, заданное как {п X : L (х) = 2 аіхі — b — О z=i (3.18) называют гиперплоскостью в Rn. Например, множество L из R3, имеющее вид : 1 •%! + 1 -х2 + 1 -х3— у 2 3J есть гиперплоскость в R3. 68
Примем, что În х: L(x) = ?£ alxi — fe > О (3.19) — b<ZO (3.20) L+ и L~ называют открытыми полупространствами, определенными L. Заметим, что L+ и L~ — суть открытые множества и что Rn = L+ J L U U L~. Иногда мы будем называть множества L+ U L и L J L замкну¬ тыми полупространствами, определенными L. Легко видеть, что L+ J L есть замыкание для В+, что L~ U L — замыкание для L~ и L есть граница как для В+, так и для В" (рис. 3.5). Если А и В — два любых подмножества из /?п, то говорят, что гиперплоскость L раз¬ деляет А и В, если А содержится целиком в одном закрытом полупространстве, опреде¬ ленном В, и В содержится целиком в другом закрытом полупространстве, определенном В, т. е. если A сВ+ J L и Bcz L- U L (3.21а) или Рис. 3.5. Гиперплоскость L и полупространства £+ и L’ A<=L~ (JL и BcL+\}L. (3.216) Если окажется, что А содержится целиком в одном открытом полу¬ пространстве, определенном В, а В — в другом, то говорят, что L строго разделяет А и В. Например, в 7?3 гиперплоскость хг — 1 = 0 разделяет множество S (0, 1) и и строго разделяет множества S (0, 1) и L~ = jx : L (x) Пусть L — гиперплоскость в Rn и А — подмножество из /?п. Оче¬ видно, что L или имеет общие элементы с замыканием А, т. е. L П с (А) =£ 0, или L не имеет общих элементов с замыканием с (Л), т. е. L П с И) = Ф- Если L имеет общие точки с замыканием с (Л), то должно удовлетво¬ ряться одно из трех условий: 1) L содержит Л или Л с В; 2) оба множества L+ f) Л и L~ П А не являются пустыми; 3) L не содержит Л, и Л содержится или в L+ U В, или в В“ U В; т. е. либо В+ f) Л, либо L~ Ç\ А является пустым. Если В удовлетворяет условию 2, говорят, что В пересекает Л; если удовлетворяется условие 3, то говорят, что В есть плоскость, опорная к Л. Пример 3.16. Пусть А —подмножество из /?3, определенное как Гиперплоскость х3 — 1 = 0 не имеет общих точек с замыканием А; гиперплоскость X — 0 содержит Л; гиперплоскость — х2 = 0 пересекает А и гиперплоскость хг + х2 + 69
+ х3 — К2 = 0 является опорной к А ^соприкасается с замыканием А в точке хх = > /2 \ х2 = ~2~ , хз = О I (рис. 3.6). Пример 3.17. Пусть А —подмножество S (0, 1) из /?2, т. е. А = + р Если L — прямая в Т?2 (иначе говоря, L — гиперплоскость в /?2), *1 х2 хгх2=О Рис. 3.6. Множества из при¬ мера 3.16 L=ri : IL^J то возможны три пересекает А и L Опорная пиния А ^2Л2 случая: a) L[\ А — ф\ б) L в) L является касательной L пересекаетА лх ѵѴѴ ѴЛ° о? Рис. 3.7. Три возможных варианта расположения прямой L относи¬ тельно области А к А, т. е. L П с (Л) состоит из одной точки на границе А (рис. 3.7). Прямые, удовлетворя¬ ющие условиям а) или в), являются прямыми, опорными к Д. Этот параграф мы завершим определениями отрезка, луча и конуса. Определение 3.16. Пусть х и у—два элемента из Rn. Отрезком прямой, соединяющим х и у, является подмножество из Rn, определяемое соотношением \zÇ.Rn:z = rx-\-sy, г О, s 5= 0, г + s — 1}, (3.22а) и лучом, соединяющим х с у и Р P P Р Рис. 3.9. Конусы с вершиной Р Рис. 3.8. Отрезок прямой, соединяю¬ щий точки X и у и два луча, опреде¬ ляемых этими точками исходящим из х, является подмножество, задаваемое соотношением {z(z Rn:z = х + г(у — х), г^О). (3.226) Заметим, что отрезок, соединяющий х и у, совпадает с отрезком, соединяющим у с х. Но луч, соединяющий х с у и исходящий изх,отли¬ чается от луча, соединяющего у с х и исходящего из у (рис. 3.8). 70
Определение 3.17. Конусы. Подмножество К из Rn называется кону¬ сом с вершиной х0, если для любой точки х в х^х0, все точки луча, соединяющего х0 с х и исходящего из х0, принадлежат /С. Различные примеры конусов иллюстрируются рис. 3.9. 3.8. ВЫПУКЛОСТЬ Обратимся к очень важному свойству, а именно, к выпуклости. Подмножество из Rn выпукло, если отрезок прямой, соединяющий две любые точки этого множества, принадлежит множеству. Более точное определение приведено ниже. Определение 3.18. Выпуклость. Подмножество А из Rn выпукло, если для любых хи j из Л иг^О, $^0из/?, г + s = 1, точка rx+sy принадлежит А. Например, открытая сфера S (0, р) из Rn выпукла, так как из И XИ <р, ІІУІІ <Р можно заключить, что || rx + sy|| < || гх|| + ||$у|| = = г II X II + s||y II < гр + sp = р, если г О, s 0 и г + s = 1. Пример 3.18. В пространстве 7?3 множество выпукло; множество Рис. 3.10. Множество А не является выпук¬ лым. Выпуклая обо¬ лочка А представляет собой треугольник (плоскость) также выпукло. Любой отрезок прямой или луч выпуклы. Пример 3.19. Множество точек А из заданное в виде Л = 0, х2^ 0, (%і/3 + %2/3)3/2 не является l|_V2 J J выпуклым (рис. 3.10). Множество точек R на Т?2, заданное в виде /< = Л 1 : один из 11*2 J = 0 или х2 = 0І , не является выпуклым, хотя и представляет собой конус с вер- Г0 шиной L0 Пример 3.20. Если а и b — элементы из /?, причем а<^Ь, то интервалы (a, ô], (а, Ь), [а, Ь) и [a, ô] выпуклы. Упражнение 3. 8. Докажите, что закрытая сфера S (0, р) в Rn выпукла. Упражнение 3.9. Докажите, что интервалы [0, 2] и [4, 5] выпуклы, а [0, 2] (J (J [4,5] — нет. Определение 3.19. Выпуклый конус. Конус К в Rn, если он является выпуклым множеством, часто называют выпуклым конусом. Заметим, что не каждый конус является выпуклым (см. пример 3.19). Выпуклые конусы будут рассматриваться в гл. 5 и 6. Определение 3.20. Выпуклая комбинация. Предположим, что хь х2, . . ., xN — N элементов эвклидова пространства Rn. Будем говорить, что X есть выпуклая комбинация элементов хь X2, . . xNi если сущест¬ вуют вещественные числа гх, г2, . . ., rN, такие, что N X = 2 і=1 N Z = 1,2. ..., N и = z=i (3.23) 71
Если А —выпуклое подмножество из Rn и хъ лг2, . . xN— эле¬ менты?!, то любая выпуклая комбинация из xt принадлежит к А. Так как А выпукло, то это утверждение справедливо согласно определению для случая N = 2. С помощью индукции распространим его на N элементов. Полагая, что это утверждение справедливо для N — 1, предположим, у что X 2 есть выпуклая комбинация xt. Можно считать, что 1, /=і в этом случае G + г2 ) +^_! - 1 — rN ф О, следовательно, рѴ-1 лг — (/*1 ^*2 * * * ~Ь ? дл-і) I і —I х і Ѵ 1 21 N 17 Zj Г1 + r2 F F 'W-i 1 V 4=1 + r NXN- (3.24) (3.25) Но выражение в скобках (3.25) представляет собой элемент А согласно допущению, сделанному по индукции; поэтому из-за выпуклости А х принадлежит А. Определение 3.21. Выпуклая оболочка. Пусть В — любое подмно¬ жество из Rn и со(В) обозначает множество всех выпуклых комбинаций элементов из В, т. е. со(В) = {х: существуют элементы хъ х2, . . xNr в В, такие, что х есть выпуклая комбинация xz}; ‘ (3.26) со(В) называется выпуклой оболочкой В. Заметим, что множество В выпукло в том случае, если оно совпадает со своей наименьшей выпуклой оболочкой, т. е. В = со(В). Действительно, выпуклая оболочка есть наименьшее выпуклое множество, содержащее В. Упражнение 3.10. Покажите, что множество со(В) выпукло. Указание: предпо¬ ложите сперва, что V ЛГ ЛГ—1 X = 2 и У 2 SiXi принадлежат со(В) и rx + sy = (г/7 + ssj Хі + 4 = 1 4 = 1 4=1 Затем надо показать, что если N м х^2 ГіХі\ У 2 sfli И Z1 XV • • •’ ZN~ XN’ ZM+1 = 4=1 / = 1 ' ’ ’ ZN+M ’ " Ум ’ T0 N N-\-M Л’ X -■2r^’+ 2 Ог'; y 2O-Z/+ 2 w+л t^i A’ -pi 4=1 /Ѵ-4-1 Пример 3.21. Предположим, что В есть множество из при¬ мера 3.19, а именно: Рис. 3.11. Выпуклая оболочка области В есть сама область В и треугольник В = {(хЛ) : х^О, х2^0, (х2/3 + ^3)3/2< Н- В этом случае выпуклая оболочка определяется как со(В) = {(хі%2) : хі ^0, x2z>0, Хі4-х2<1} (см. рис. 3.10). Пример 3.22. Пусть В — Вг J В2, где Вх — {(хр х,2) : Xj Ь хі =^0} и В2 - {(*1*2) ' хі +Х2=С 1, х2 =С0}, иначе говоря, состоит из трех квадрантов окружности единичного радиуса, как показано на рис. 3.11. Тогда выпуклая оболочка В, со(В) будет иметь вид со(В) — В U {(ххх2) : Хі > 0, х2 > 0, хх4-х2^1}. УѴ может зависеть и от х. 72
Сформулируем и докажем несколько важных теорем относительно выпуклых множеств в Rn. Теорема 3.3. Если А — выпуклое подмножество из Rn, то замыка¬ ние А, с (А) [уравнение (3.9)] также выпукло. Доказательство. Предположим, что х, у, — элементы с (Л), а г, s — элементы из г>0 и s>0 и r + s = 1. Покажем, что rx + sy при¬ надлежит к с (Л), т. е. найдем последовательность элементов {ztl\ из Л, которая сходится к rx+sy. Поскольку х и у принадлежат с (Л), суще¬ ствуют последовательности хп и уп элементов из Л, такие, что хп сходится к X и уп сходится к у. Выберем zn = rxn + syn. Прежде всего zn принад¬ лежит Л, так как Л выпукло. Покажем теперь, что zn сходится к rx + sy. Если 8 > 0, то существует М (е) такое, что если п > М (е), то || хп —х||<< <8 и II Уп — УII Следовательно, для всех п >» 7И (е) имеем II гхп syn — (rx + sy ) || - Il r (Xn — X) + s (yn — y) Il < r\\xn — x|| + sb„ — y||<8- (3.27) Отсюда видно, что последовательность zn сходится к rx + sy. Это и доказывает теорему. Теорема 3.4. Если Л — выпуклое подмножество из 7?п, то і (Л) [внутренняя часть Л, уравнение (3.8)] является либо выпуклым, либо пустым множеством. Действительно, если Л выпукло и і (Л) не «пусто», справедливо следующее утвержде¬ ние. Если даны две точки X и у в Л, при¬ чем у принадлежит /(Л), то любая точка отрезка прямой между X и у (за исключе¬ нием, возможно, лишь самой точки х) есть внутренняя точка Л (см. рис. 3.12). Доказательство. Рис. 3.13. К доказательству теоремы 3.4 Рис. 3.12. Любая точка отрезка, соединяющего X и у, за исключением, возможно, ТОЧКИ X, является внутренней точкой выпуклого мно¬ жества А Так как у есть внут¬ ренняя точка Л, то имеется р >> 0, такое, при котором 3 (у, р) с Л. Пусть z — точка на отрезке прямой, соединяющей лг и у, отличная от X. Тогда Z = ГХ + sy, (3.28) Покажем, что открытая сфера S (z, sp) содержится в Л, следовательно, Z есть внутренняя точка Л (см. рис. 3.13). Если W£S(z, sp), тогда ||w — г II -- U w — (rx H- sy)|| < sp, (3.29) что означает ||-7-(w — rx) — sy J = s !-1-(w — rx) — y||<sp. (3.30) Иначе говоря, | J_ (î€, _ rx) _ y | < (3.31) откуда видно, что -y- (w — rx) принадлежит S (y, p). Так как S (y, p) содержится в A и A выпукло, w = s (w — rx) + rx есть элемент A. Таким образом, S (z, sp) a: A. Теорема доказана. 73
Следующая теорема, доказательство которой мы опустим (см. [59]), будет применяться в гл. 5. Сформулируем теорему. Теорема 3.5. а) Если А и В — открытые выпуклые подмножества из не имеющие общих точек, то существует гиперплоскость L, разде¬ ляющая А и В. б) Если А — выпуклое подмножество из Rn и х — элемент границы Л, то существует по крайней мере одна плоскость, опорная к Л и содержа¬ щая точку X. в) Если А — замкнутое множество из внутренняя часть кото¬ рого і (Л) не является «пустым» множеством, и для каждого элемента х границы Л существует опорная плоскость, то Л выпукло. Пункт а) теоремы иллюстрируется рис. 3.14, а и б. Отметим, что на рис. 3.14, а гиперплоскость L строго разделяет Л и В, но для случая, Рис. 3.14. а) L строго разделяет А и В; б) L разделяет А и В. Прямой, строго разделяющей А и В, не суще¬ ствует. Рис. 3.15. Опорные гипер¬ плоскости Li и L2, прохо¬ дящие через граничные точки выпуклого множе¬ ства А показанного на рис. 3.14, б, не существует гиперплоскости, строго разде¬ ляющей А и В. Пункт б) теоремы иллюстрируется рис. 3.15. Его можно сформулировать иначе следующим образом: «Если х есть точка границы выпуклого множества Л, то существует гиперплоскость L, проходящая через X, такая, что Л содержится целиком либо в L+ (J L, либо в L~ J L. Последнее утверждение мы будем использовать в гл. 5. Пункт в) теоремы дает косвенный способ определения, является ли закрытое множество выпуклым. Наконец, рассмотрим более подробно точки границы выпуклого мно¬ жества и опорные плоскости. Можно сформулировать следующие поло¬ жения: 1. Точка X границы выпуклого множества Л из Rn является регуляр¬ ной точкой, если она является элементом единственной гиперплоскости, опорной к Л. 2. Опорная гиперплоскость L выпуклого множества Л есть регуляр¬ ная опорная гиперплоскость Л, если она имеет с Л единственную общую точку. 3. Выпуклое множество Л называется регулярным выпуклым множе¬ ством, если каждая точка его границы является регулярной точкой и если каждая опорная к Л гиперплоскость является регулярной опорной к Л гиперплоскостью. Сфера S (0, р) есть образец регулярного выпуклого множества. Термин «регулярный» по отношению к множеству, грубо говоря, озна¬ чает, что множество не имеет «углов». Множество Л ! на рис. 3.16 регулярно, множество Л 2 имеет две нерегулярные точки (или «угла»), но каждая гиперплоскость, опорная к Л2, регулярна. Множество Л3 имеет и нерегу- 74
Q Рис. 3.16. Аі — регулярное выпуклое мно¬ жество. Р и Q—нерегулярные точки («углы») выпуклого множества А2- М и N — нерегу¬ лярные точки выпуклого множества А3. L — нерегулярная опорная гиперплоскость множества А3 могут обладать. Мы надеемся, что математики со многими понятиями, лярные точки, и нерегулярную опорную гиперплоскость. Отметим, что выпуклые множества типа {(хх, х2) : *2 = 0, —1 < хг < 1} или типа единичного куба в R3 также являются нерегулярными выпуклыми мно¬ жествами. И, наконец, отметим, что не¬ возможно определить единствен¬ ную нормаль к выпуклому мно¬ жеству в нерегулярной точке (или в «угле») множества. ВЕКТОРНЫЕ ФУНКЦИИ 3.9. ВВОДНЫЕ ЗАМЕЧАНИЯ Переходим к изучению век¬ торных функций, т. е. таких функций, которые принимают раз¬ личные значения, соответствующие точкам векторного пространства, и сформулируем ряд важных свойств, которыми такие функции читатель уже встречался в курсах которые рассматриваются ниже. Поэтому изложение известных вопросов будет весьма кратким. Однако понятия, которые представляют для нас особый интерес, излагаются более строго, чем это свойственно основным курсам математики. Мы рассмотрим понятия непрерывности, производ¬ ной и интеграла от функции, функциональные пространства и функцио¬ налы х. Мы часто будем начинать обсуждение с рассмотрения знакомого слу¬ чая функции, преобразующей 7? в /?, т. е. вещественной функции одной переменной. Далее мы будем переходить к обсуждению функций (преоб¬ разования) R в Rn (векторных функций одной переменной) и, наконец, рассматривать функции от Rm в пространстве Rn [векторные функции нескольких (вещественных) переменных. ] Обычно мы будем вводить такие понятия, как непрерывность функции одной переменной только по отношению к R, а не к интервалу из R [см. уравнение (3.1)]. Если читатель примет интервал за область существования функции (см. § 2.4) в определении, то он легко получит соответствующую форму¬ лировку понятия и будет в состоянии интерпретировать теоремы для этого случая. Напомним, что если х есть элемент из Rn, (3 .32) 1 См. [51 ], [192] и [196]. Эта литература особенно интересна с точки зрения углубле¬ ния приведенных понятий. 75
то х2, . . ., хп называются компонентами х. Если/— функция из/? в /?п, то для t из R имеем Л (О (3.33) где /і, /2, • • •> fn — вещественные функции, которые называются компо- Г t нентами /. вид (3.33), Например, функция /(/) из /? в /?3, /(f) = е z имеет L cos / гДе fi (t) = t, f % (О = е~\ /з (0 = cos Для обозначения векторных функций мы будем использовать жирные прописные буквы латинского алфавита. Аналогично, если g есть функция из Rtn в /?Л и и — элемент из /?ш, то gt (а) &(») g (и) = (3.34) ёп (»)_ где — действительные функции от « £ Rm, называемые компонентами Например, если g есть функция из R2 в R3, au — g- из — элемент /?2, то типичная функция g из /?2 в /?3 может иметь вид z/l 3^2 g(«) = log их + e~U2 sin U\ + где gx (и) = + 3u2, g2 (и) = log иѵ + и g3 («) - sin + и]. Рассматривая уравнения (3.33) и (3.34), видим, что существует тесная связь между векторными функциями и функциями, принимающими только вещественные значения. Эту связь мы часто будем использовать в дальнейшем. Если обозначить через J (7?ш, /?п) совокупность всех функций из /?т в Rtl, т. е. ÎV (Rtn, Rn) = {/ :/ есть функция из Rni в /?„}, (3.35) и определить понятия суммы и произведения (на элемент из 7?) для эле¬ ментов J (7?т, /?п), полагая [/+51 («) = /(») + £(«) — сумма (3.36) [г/] (а) = rf(u) — произведение (3.37) Для /, g из 5 (Rm, Rn), и из Rm и г из /?, то J (7?m, R^ становится вектор¬ ным пространством по отношению к этим понятиям суммы и произведения (см. § 2.5). Эти понятия суммы и произведения мы будем часто исполь¬ зовать ниже. 76
3.10. НЕПРЕРЫВНОСТЬ В § 2.7 мы обнаружили, что если математик дал определение понятия, то он пытается установить, какой вид преобразований это понятие «со¬ храняет». Мы дали определение предельной точки в § 3.3, и теперь мы рас¬ смотрим преобразования, сохраняющие это понятие. Для начала введем понятие предельной точки преобразования. Определение 3.22. Если Xt и Х2 — множества с функциями расстоя¬ ния d1 и d2 соответственно, f — преобразование из Х± в Х2, область существования которого все множество и х0 — элемент из то будем называть элемент у из Х2 предельной точкой f при х0, если для любой последовательности хп, п = 1,2 элементов из Хъ сходящейся к х0 (хп ¥= =£= х0 для любого /г), соответствующая последовательность f (xrt), п = 1, 2, . . ., сходится к у. В этом случае #=1іт/(х). (3.38) х-»х0 Заметим, что преобразование может и не иметь предельной точки при данном х0, но если оно имеет таковую, то она единственна. Отметим также, что у — lim f (х) вовсе не означает, что у = f (х0). х->х0 Определение 3.23. Непрерывность. Пусть Х1 и Х2 — множества с функ¬ циями расстояния dr и d2 соответственно, f — преобразование ХА в Х2, областью существования которого являются все Хъ и х0 — точка в Хг. Говорят, что f непрерывна в точке х0, если f (х0) есть предельная точка f при х0, т. е. / (х0) = 1 ігп / (х). (3.39) х-> х0 Если f непрерывна в любой точке х0, то говорят, что f есть непрерыв¬ ное преобразование (или функция) или просто, что f непрерывна. Непрерывность f означает, что если х0 есть предел последовательно¬ сти X., п = 1, 2, . . ., то f (х0) является пределом последовательности =1,2,... Читатель хорошо знаком с так называемым 8, ô определением непре¬ рывности вещественных функций одной переменной. Покажем, как оно связано с определением (3.23). Понятие предельной точки преобразо¬ вания мы будем связывать со сферами в множествах Хг и Х2. Следующая теорема устанавливает искомую зависимость. Теорема 3.6. Точка у является предельной точкой преобразования f при х0 тогда и только тогда, когда для каждого е>0 существует ô>>0, такое, что /[S(x0, ô)]c=S(t/, е) U (f(x0)} (3.40) или что эквивалентно, если 0 <dx (х, х0) <0 соответствует d2 (/(х), у) <е. (3.41) В частности, если f есть функция из 7? в /?, то у есть предельная точка f при х0 тогда и только тогда, когда для каждого 8 > 0 существует Ô > 0, такое, что 0 < | х — х01 < Ô соответствует |/(х) —у\ (3.42) В более общем случае, если f преобразует Rm в 7?п, то у есть пре¬ дельная точка f при х0, в том случае, когда для любого 8>0 существует Ô > 0, которое может зависеть от 8, такое, что 0<[;х — х0||<0 соответствует ]\f (л) — у'|<8, (3.43) 77
где знак || || обозначает эвклидову норму на Rn. Наконец, из уравне¬ ния (3.40) следует, что f непрерывна при х0, тогда и только тогда, когда для любого 8 > 0 существует ô > 0, такое, что /[S(x0, ô)]cS(/(xo),8). (3.44) Последнее утверждение иллюстрируется рис. 3.17 для случая пре¬ образования R2 в себя. Доказательство. Из определения предельной точки видно, что если f удовлетворяет условию (3.40), то у — предельная точка /при xQ. С другой стороны, если у — предельная точка / при xQ и задано 8 > 0, то мы ут¬ верждаем, что существует ô > 0, такое, что / [S (х0, ô)] с S (у, е) U U {/ (Хо)І- Если это не так, то для п = 1, 2, . . . в Х± найдется хп =/= х0, такое, что d± (хПі xQ) < — и d2 (f (xn), y) 8. Но это означало бы, что Рис. 3.17. е, Ô — свойство непрерывности хп сходится к X в то время, как / (х„) не сходится к у. Это противоречит тому, что у является предельной точкой / при х0- Таким образом, наше утверждение доказано, а вместе с ним доказана и теорема 3.6. Эта теорема имеет прямое следствие: функция / непрерывна тогда и только тогда, когда обратное отображение [см. уравнение (2.15)] каждого открытого подмножества из Х2 есть открытое подмножество в X, т. е. /-1 (Л) открыто в Хъ если А открыто вХ2. В силу теоремы 3.1 можно обнаружить, что / непрерывна тогда и только тогда, когда обратное изображение любого замкнутого подмножества из X есть замкнутое подмножество в т. е. f'1 (В) замкнуто в Xlt если В замкнуто в Х2. Если g есть функция преобразования из Rm в Rnt из уравнения (3.44) легко заключить, что g непрерывна тогда и только тогда, когда каждая из ее компонент glf g2, . . ., gn есть непрерывная функция преобразо¬ вания Rm в R [см. уравнение 3.34)]. Действительно, заметим, что если и и V — элементы Rmi то для і — 1, 2, . . ., п п І£(«) — ^(^)1<И(«)— 2|&(») —£(<0Ь (3.45)1 і=\ откуда следует справедливость сделанного выше утверждения. Далее, легко видеть, что если g и h — непрерывные функции пре¬ образования Rm в Rn, то сумма g и A, g + h [см. уравнение (3.36)] и произведение g на элемент г из R [см. уравнение (3.37) ] также являются непрерывными функциями преобразования из Rm в Rn. Иначе говоря, множество iff :ff — непрерывная функция преобразования Rm в Rn} (3.46) есть векторное пространство, которое является подпространством множе¬ ства всех функций преобразования Rm в Rn, fi (Rmi Rn) [см. уравне¬ ние (3.35)]. О пространствах такого типа будет сказано несколько под¬ 1 См. уравнение (3.6г). 78
робнее в § 3.15. Наконец, отметим, что если g — непрерывная функция преобразования Rm в Rn и h — непрерывная функция преобразования Rn в Rp, то сложная функция hog [см. уравнение (2.16)] есть непрерыв¬ ная функция преобразования Rm в Rp. Пример 3.23. Пусть fn — преобразование R в себя, заданное соотношением fn (х) — хп для п — 0, 1, 2, .... Преобразование fn непрерывно, и, следовательно, любая полино¬ миальная функция непрерывна. Преобразование R в себя, заданное как U (х) — 0, при x^z О и U (х) = 1 при х> О, не является непрерывным при х= 0, но оно непрерывно во всех точках х ф 0. Пример 3.24. Пусть ЭД, — линейное преобразование Rm в Rn с матрицей преобразо¬ вания А = (aij) по отношению к нормальным базисам в Rm и Rn (см. § 2.6). Преобра¬ зование ЭД непрерывно. Для доказательства непрерывности отметим, что если являются элементами из Rfn, то ЭД (я) — ЭД (w) = ЭД (ѵ — w) и (ЭД (ѵ — w), ЭД (ѵ — w)) “ m 2 аИ (ГІ — S!) 7=1 m 2 а27 (Г7 — s/) 7=1 т 2 ani (ri—si) —7=1 m 2 a«7 (r7 ~ sl) —7=1 ~ tn 2 “V (r7 — S7') 7=1 tn 2 a27 (r7 — S/) 7=1 Отсюда используя уравнение (2.32), имеем п ( m \2 <21 (V _ W), sy, (® — w)) = 215 an (ri — Sà ï 7=1 l/=l ) и, следовательно, преобразование ЭД непрерывно. Пример 3.25. Пусть f — функция преобразования R в себя, заданная как f (х) = | х [ (см. рис. 3.18). f непрерывна. Вообще, функция преобразования Rm в R, заданная как f (х) — ||х||, для х из Rm есть непрерывная функция. Г і Пример 3.26. Если х = есть элемент Rm и мы зададим функцию преобразова¬ ния Rm в R как \_Хт J f(x)= max {|Х7І) Z=l, 2, .... m (f (x) равна наибольшей из абсолютных величин компонент х), то f непрерывна, так как / tn \ 1 |xz |< I 2 х/ / = Ï» 2, - - т. ' /=1 / Пример 3.27. Если х — 1 См. уравнение (2.91). — элемент Rm и заданы функции Ф/, і = 1, 2, . . ., tn 79
о| (рис. 3.19), то А является замкну- преобразования Rm в R как Фг- (х) — Xj> то функции ф/ будут непрерывны. В частности, если рассматривать R2 и Фх j j = х1? то Фх непрерывна. Если А есть подмножество Хі 1 1 х2 J Xj тым в R2, но Фх (Л) не является замкнутым в R. Рассмотрите в свете этого примера заме¬ чания, следующие за теоремой 3.6. из R2, заданное как А — Рис. 3.18. Непрерывная функция f (х) I X I Рис. 3.19. Множество А зам¬ кнуто, но его проекция на ось хх не является замкну¬ тым множеством Упражнение 3.11. Покажите, что если g и h — непрерывные функции преобразова¬ ния Rm в Rn, то g + h является также непрерывной функцией преобразования Rm в Rn. У Казани е: если и и ѵ принадлежат Rm, то Il (g + h) («) — (g + h) (v) Il Il g (a) — g (v) i| + И h (u) — h (z>) 4. Предположим теперь, что f — непрерывная функция преобразова¬ ния Rm в Rnn С — компактное подмножество из Rm (см. определение 3.14). Ниже мы покажем (см. теорему 3.7), что f (С) [см. уравнение (2.14)] есть компактное подмножество из Rn. Важным частным следствием этого положения является то, что вещественная непрерывная функция дости¬ гает максимального и минимального значений, если область ее существо¬ вания ограничена компактным множеством. Теорема 3.7. Если f есть непрерывное преобразование Rnl в Rtlu С — компактное подмножество из Rm, то f (С) есть компактное подмножество ИЗ Rn. Доказательство: Для того чтобы доказать компактность f (С), мы воспользуемся свойством 4) из § 3.6 г. Предположим, что уп, п = 1 2, . . . есть последовательность элементов f (С); тогда существуют эле¬ менты хПУ п 1, 2, ... из С такие, что f (хп) = уПУ п == 1, 2, . . . Так как С компактно, то существует подпоследовательность хП1, хП2, • • . последо¬ вательности {хп}у имеющая х своим пределом в С. Однако из непрерыв¬ ности f следует, что уПі = f(xn), Уп2=/(хП2), . . • сходится к f (х), который является элементом f (С). Иначе говоря, уПі, Уп2, ... и есть иско¬ мая сходящаяся подпоследовательность последовательности (уД. 3.11. КУСОЧНАЯ НЕПРЕРЫВНОСТЬ В предыдущем параграфе мы рассмотрели понятие непрерывности в точке. Посмотрим, что происходит в точке, где преобразование не яв¬ ляется непрерывным. В этой точке функция разрывна. Для начала рас¬ смотрим два примера. Пример 3.28. Пусть f — преобразование R в себя, заданное как f (х) = —1, для х<с 0 и f (х)і — 1 для х> 0 (рис. 3.20). Функция f (х) не является непрерывной при х = 0. 1 Свойство (4) устанавливает, что множество К компактно, если для заданной после¬ довательности хл, п— 1, 2, ... элементов из К существует подпоследовательность хп , х , . . . элементов {хл}, которая сходится к элементу из К- 80
Если хп, п = 1,2, ... есть последовательность, сходящаяся к 0 при хп^2 О для каждого п или хп^> 0 для каждого п, то предел последовательности f (хп), п = 1,2, ... существует. Действительно, при хп 0 для всех п имеем lim f (хп) — —1; при хп > 0 для всех п имеем П-> оо Нт f (хп) = 1. П-> 00 Пример 3.29. Пусть g — функция преобразования R в себя, заданная как g (х) — —1, если х — иррациональ¬ ное число, и g (х) — 1, если х — рациональное число. Функция g не является непрерывной ни при каком х, в том числе и при X — 0. Имеются последовательности хп, п = = 1,2,. . сходящиеся к 0, скажем, хп^> 0 для любого п, для которых пределом является lim g (хп) = —1, либо limg(xn) = 1, для которых последовательность g (хп), п- 1, 2, ... не имеет предела. По существу, функция f примера 3.28 гораздо «ближе» к непрерывной при 0, чем функция g примера 3.29. Мы попытаемся разъяс- /М Рис. 3.20. Функция f (х) в точке X — 0 не является не¬ прерывной (имеет разрыв) нить это положение в последующей части настоящего параграфа. Пусть теперь f — преобразование R в множество X с d в качестве расстояния на X. Определение 3.24. Пределы справа и слева. Если t — элемент /?, то будем говорить, что f имеет предел справа при t (или имеет предел сверху при /), если в X существует такой элемент х, что для любой задан¬ ной последовательности tn, п = 1, 2, . . ., которая сходится к t (причем tn > t для любого /г), lim f (tn) = х, т. е. х есть предел последователь- П-> 00 ности Часто это записывают так: X — f(t+) или lim / (Z) = х. t-*t+ (3.47) Аналогично будем говорить, что f имеет предел слева при t (или имеет предел снизу при /), если имеется элемент у в X такой, что для любой заданной последовательности tn, п = 1, 2, . . ., сходящейся к t (причем tn < t для любого п) lim / (Q = у, т. е. у есть предел последователь- П> оо ности \f (/„)}. Можно это записать в виде 1 flOi-o" t Рис. 3.21. Пределы функции f (t) слева и справа в точке t = 0 одинаковы, однако в этой точке имеет место раз¬ рыв функции или lim/(Z) = ÿ. (3.48) t-»t~ Например, функция / в примере 3.28 имеет при 0 пределом справа 1 и пределом слева — 1. Отметим, что если даже х = f (/+) и у = f (Г) су¬ ществуют и равны, функция /, тем не менее, мо¬ жет иметь разрыв при /. Этот случай показан на рис. 3.21, который иллюстрирует пример 3.30. Пример 3.30. Пусть f — преобразование R в себя, определенное как f (/) = 1, если t #= 0 и f (0) = 0. Тогда lim f (t) = 1 = lim f (Z), но f не является непрерывным f->o+ f->0" при 0 (рис. 3.21). Определение 3.25. Кусочная непрерывность. Если f — преобразова¬ ние R в множество X с расстоянием d на X, будем говорить, что f имеет простой разрыв (или скачок) при /, если (1) f претерпевает разрыв при t и (2) f имеет при t пределы как справа, так и слева, т. е. f (/+) и f (Г) оба существуют. Если множество точек разрыва S) (/) = )/: t есть раз¬ рыв /, т. е. f не непрерывна при t] есть счетное множество 1 [т. е. если эле¬ менты © (/) могут быть пронумерованы в некоторой последовательности tn, 1 См. § 2.2. 81
п = 1, 2, . . . (которая может быть конечной)] и состоит только из простых разрывов, то будем называть f кусочно-непрерывной (или регулярной) 1 функцией. Иными словами, f кусочно-непрерывна, если имеется счетное количество точек разрыва и в каждой из этих точек f имеет оба предела (справа и слева). Пример 3.31. Пусть f — функция преобразования R в себя, заданная как f (f) = О, если t < 0, f (/) = 1, если 0^ 1, f (/) = —1, если 1 <J t 2, и f (t) == 0, если /> 2. Функция f (t) кусочно-непрерывна и представляет собой функцию, называемую ступенча¬ той, или кусочно-постоянной. Существует конечная последовательность tlt t2, t3 (/х = 0, t2 = 1 и /3 = 2), такая, что f постоянна на интервалах (/х, /2), (/2, /3), а также на множествах (t : t <2 tr] и {t : t^> /3} / n (рис. 3.22). О ступенчатой функции мы будем подробнее гово- I рить в § 3.15. I Отметим, что любая непрерывная функция 0 / £ і является и кусочно непрерывной и что f есть кусоч- 1 но-непрерывная функция преобразования R в Rn _ 1 в том и только в том случае, когда компоненты /, /2, . . fn (см. уравнение (3.33)] кусочно-непре- Рис. 3.22. Кусочно- рывны. Далее, если мы определим понятия суммы постоянная функция и произведения (на элемент из R) для кусочно¬ непрерывных функций аналогично (3.36) и (3.37), то можно обнаружить, что множество всех кусочно-непрерывных функций преобразования R в Rn образует векторное пространство, которое является подпространством J (/?, Rn). Отметим, наконец, что сложная функция, составленная из кусочно-непрерывных функций, не обяза¬ тельно является кусочно-непрерывной. Однако если f — непрерывная функция, преобразующая Rn в R, и g — кусочно-непрерывная функ¬ ция, преобразующая R в Rn, то fog есть кусочно-непрерывная функция, преобразующая 2 R в R. Пример 3.32. Пусть / — закрытый интервал с концами 0 и 1, т. е. / =[0, 1] [см. вто¬ рое уравнение из 3.7)], и f — функция, преобразующая I в Rn с компонентами fv f2, . . ., . . ., fn. Мы говорим, что f кусочно-непрерывна на / [сравнить с замечаниями в конце § 3.9], если точки /, в которых / терпит разрыв, являются простыми разрывами / и если они счетные. Например, функция, преобразующая / в /?2, заданная как f (t) = [ g J, для t Гп 1 \ x-z.x Г 01 . Г 1 1 \ г—И < Г1 il в Р’ ~ )’ _1 для в "4"» т ) Н' = о] для * в Т ’ КУСОЧНО’ непрерывна. Легко видеть, что множество всех кусочно-непрерывных функций, преобразую¬ щих I в Rn с суммой и произведением, определенными по выражениям (3.36) и (3.37), образует векторное пространство. 3.12. ПРОИЗВОДНЫЕ В этом параграфе мы рассмотрим исключительно важное понятие производной от функции. Производная функции представляет собой «местную» аппроксимацию с помощью линейной функции. Производную можно понимать как меру скорости изменения функции. Попытаемся уточнить это положение. Предположим сначала, что f — функция, преобразующая R в себя, и /0 — некоторый элемент из R. Если / «близко» к /0, то можно попытаться аппроксимировать / (/) функцией fa (t) следующего вида: Ж) + ^-'о) = № (3.49) 1 См. подробнее в работе [51 ]. 2 Имеем Ііш g (/) = V, откуда следует, что t->t+ lim f [^ (f)] = f (îO- t~>t+ Последнее замечание будет нами использовано в § 3.15. 82
где 21 — линейное преобразование 7? в себя. Выражение (3.49) можно записать в виде ^(/) = /(/о) + а(/-/о), (3.50) где а — элемент из R Ч Нетрудно видеть, что fa (/) представляет собой прямую, проходящую через f (to) (рис. 3.23). Нам хотелось бы выбрать а таким образом, чтобы I fa /f\ f /f\ I fa (t) была касательна к f (f) в t0, т. e. чтобы предел , /—, при t-+tQ был равен 0. Иначе говоря, мы хотим выбрать а так, чтобы HmI — а| = 0. (3.51) Если имеется такое а в /?, при котором удовлетворяется уравне¬ ние (3.51), то говорят, что f (t) дифференцируема при t = а а есть про¬ изводная f при tQ. Тогда можно записать а =-g-|/o = Df(/o) = /(/). (3.52) Будем называть функцию f дифференци¬ руемой, если f имеет производную при каждом /0 из R и обозначать через или Df(t), или f (t) (3.53) такое преобразование R в себя, значение которого при t есть производная f в точке t. Эту функцию будем называть производной функции /. Можно показать, что если f имеет Рис. 3.23. Аппроксимирую¬ щая функция fû (t) производную, то f непрерывна. Далее, если f дифференцируема и а, b Ç /?, причем а <^Ь, то существует Ѳ в интервале (а, 6) такое, что f(b) -f(a) = НѲ)(Ь-а) = -g- |Ç (b - a). Последнее соотношение часто называют теоремой о конечном прира¬ щении (теоремой Лагранжа). Если / есть дифференцируемая функция преобразования R в себя, то можно рассматривать функцию f (t) = задаваясь вопросом, имеет ли эта функция производную в данной точке /0 из R- Если f (/) имеет произ¬ водную при /о, то говорят, что f (t) дважды дифференцируема в t0 или что f (/) имеет вторую производную в t0. Последнее можно записать в виде dCfV)) I _ d2f \ dt k ” f dt2\to' Повторяя эти действия, можно получить производные более высоких порядков и написать для них общую формулу d”(f(t)) I _ f(nUt X J_ Гdn~yf(t) dt |f, ' dt dtn-l Определим понятие производной от векторной функции преобразова¬ ния R в Rn. Пусть /0 — элемент из R и 21 —линейное преобразование R В Rn- 1 Отметим, что а есть матрица ЭД, (1 X 1 матрица) (см. § 2.8), тогда выражение (3.50) можно записать в виде fa (t) = f (/0) + («, t — t0), где { ) обозначает скалярное произ¬ ведение на R [см. уравнение (2.86)]. 83
Рассмотрим функции fa (t), заданные как /а(0 = Ж) + или эквивалентную ей (3.54) /а(0 = /(М + «('-6Д (3.55) где а есть вектор из 7?,,1. Как и в выражении (3.51), мы хотели бы вы¬ брать а таким образом, чтобы lin.'l/IO-ZW-aUo. t — to II (3.56) t->îo t*t0 Если в Rn имеется a, для которого уравнение (3.56) удовлетворяется, будем говорить, что f дифференцируема в /0 и что # есть производная f в tQ. Запишем это в виде а==П/(/0)=/(М; (3.57) f дифференцируема в /0 в том и только в том случае, если ее компоненты /1( /2 fn (см. § 3.9) дифференцируемы в /0; fAQ /2(^0) (3.58) Jn(M_ Будем называть f просто дифференцируемой, если f имеет производ¬ ную в каждой точке t0 из R, и записывать или Df(t), или /(/) (3.59) для обозначения функции преобразования /? в R,n, величина которой в точке t равна производной f в t. Эту функцию будем называть произ¬ водной от f и записывать f(t) = (3.60) Jn(0_ Если, далее, f и g дифференцируемы, то можно заметить, что сумма f + g и произведение r f (г Е R) также дифференцируемы, причем У =/(Ш(0 (3.61) (3.62) Из выражений (3.61) и (3.62) вытекает, что множество всех дифферен¬ цируемых функций, преобразующих R в Rn, образует векторное простран¬ ство, которое является подмножеством множества всех функций преоб¬ разования R в Rn, J (/?, R;l). Если g—дифференцируемая функция, 1 Здесь а — вектор-столбец из п элементов ЭД, (1), который является матрицей линей¬ ного преобразования ЭД [см. формулу (2.31)]. 84
преобразующая R в R, и f — дифференцируемая функция, преобразу¬ ющая R в Rn, то сложная функция fog дифференцируема и ^^ = 7[бИ-г(0-4|г1,Д. (3.63) Упражнение 3.12. Покажите, что функция, преобразующая R в Rn, дифференци¬ руема в ta в том и только в том случае, если все компоненты / дифференцируемы и ”/і (<о)" ft (^о) f(ta) = Указание: следует использовать уравнение (З.бв). Пример 3.33. Пусть I — закрытый интервал с концами 0 и 1, I ■= [0, 1] [см. урав¬ нение (3.7)] и f — функция, преобразующая I в Rn с компонентами fu f2, . . ., fn. Будем считать функцию f дифференцируемой на /, если для каждого t0 из I существует а в Rn (которое может зависеть от /0), такое, что І,т Il tç./ II f — г0 II это выражение означает, что любой последовательности tn, п — 1, 2, ... элементов из /, tn =/= іо ни ПРИ каком /г, которая сходится к /0, соответствует последовательность II /(<п) ~/(<о) II II tn-t0 II’ сходящаяся к 0. Легко заметить, что f дифференцируема на / тогда и только тогда, когда каждая компонента fi дифференцируема на I. Например, функция /, преобразующая / г» /дч Г sin л/1 ,, г / Г л cos nt "I в R2, заданная как f (t) = , дифференцируема на / и / == . . I cos л? I I — л; sin Jtr I Итак, мы рассмотрели функции одной (вещественной) переменной. Предположим теперь, что / есть функция, преобразующая R,n в R. В этом случае имеют смысл несколько различных определений производной. Во-первых, мы можем повторить процедуру, использованную для нахо¬ ждения производной функции одной переменной, во-вторых, рассма¬ тривать f как функцию от компонент вектора в Rtn и найти производные f по отношению к этим компонентам (т. е. частные производные); наконец, мы можем рассматривать поведение f вдоль заданного «направления» в Rm и получить производную от f по отношению к этому направлению. Уточним эти различные понятия производной. Если Uq — элемент из Rm и и «близко» к я0, можно попытаться ап¬ проксимировать f (и) с помощью функции fa (и) вида /(«о)-+ 51(а —йо)-Г(й), где 2( — линейное преобразование Rtn в R (т. е. ?( — элемент ства /?*, сопряженного к Rmj [см. упражнения 2.11 и 2.12]. Уравнение (3.64) можно записать в виде fa(«) = f(#o) + (а, и — (3.64) простран- (3.65)1 m-мерный где а — элемент из R,n. Опять-таки мы хотели бы выбрать вектор а таким образом, чтобы («) была касательной к /(«) в точке и0, 1 Здесь знак (,) обозначает скалярное произведение на Rm [см. уравнение (2.86)]. 85
т. e. таким образом, чтобы предел — при я, стремящемся к uQ. \\и — Uo II был равен 0. Иначе говоря, мы хотим получить lim I f W —/ («о) « — «о> I _ n u™ol l|« —«oil |j« —«oil | (3.66) Если существует а из Rm, для которого выполняется соотноше¬ ние (3.66), то говорят, что f дифференцируема в точке uQt и называют а градиентом (или производной /) в точке и0. В этом случае пишут а = v/(«o) = gradf(«0) =-ЦЦ . (3.67) '«О Функцию f называют дифференцируемой, если градиент существует в каждой точке и0 из Rm. Обозначают градиент следующим образом: (?/)(«) или grad /(и) или (3.68) Заметим, что grad f есть векторная функция; будем обозначать ее компоненты в виде (£>Л(«) или (3.69) т. е. ГФіЛ («) I (DJ)(«) ди • -(Dmf) (U)- Например, если /— функция преобразования R2 в /?, заданная как Z(R ]) = u*+sin^’ то df Г 2«! I df п df = И = %U1 TT2- = COS U2. du L cos u2 J dut 1 du2 2 Если / дифференцируема и u± и a2 — точки из Rm, то можно пока¬ зать, что существует точка а* на отрезке, соединяющем иг и и2 (см. опре¬ деление 3.16), такая, что 7(И1) —/(и2) = \-^(»*)> «1 —«2/; (3.70а) это соотношение, часто называемое теоремой о конечных приращениях, мы используем в § 3.18. Будем теперь рассматривать / как функцию компонент векторов в Rm. Если т S и^і \ І = 1 и = 1 еі — элементы натуральной базы в Rm [см. уравнения (2.27)]. 86
то можно написать (т \ S «л =/(«!> «2. •••> ««)• (3-71) і =1 / Пусть uQ — данный элемент из Rm с компонентами и01, и02, • • •> wom- Исследуем поведение /, если изменяется только одна из компонент и0, предположим первая. Рассмотрим функцию glt преобразующую R в себя, заданную как gi(u) = f(u,u02,...,u0m). (3.72) с àf Если g± имеет производную в точке и01, то говорят, что част¬ ная производная в точке uQ. Частную производную будем обозначать (7>і/) («о) или , т. е. 1 «о (^1)(«01) = W)(«o) = -^-1 . (3.73) IWo Отметим, что (DJ)(«0) = lim і{й’ ы°2’ /-(tZo1’ “ог’ u°m) ■. (3.74) W->Woi « — «01 Частные производные f по другим компонентам можно определить совершенно аналогично, т. е. считать, что f имеет частную производную по щ в точке а о, если существует такое, что ]jm |/(«оі> • • •> «o/-i> «> «oZ+i, •• «om) Z («01> • • •> «om) & I _ Q (g 75) В этом случае можно написать a/ = (D/)(«0) = -^7| . (3.76) UUl IWo Если / имеет частную производную по щ в каждой точке а0, то гово¬ рят, что / имеет частную производную по щ, и обозначают функцию пре¬ образования Rm в R, значение которой в точке а0 равно (£\/) (а0), как (Ц/)(«) или (3.77) Но мы уже использовали эти обозначения раньше для компонент градиента f [см. уравнение (3.70)]. Предоставим читателю самому убе¬ диться в обоснованности использования этих обозначений. Рассмотрим теперь понятие производной функции /, преобразующей Rm в /?, вдоль заданного «направления» в Rm. Предположим, что а0 — элемент Rm и е — заданный единичный вектор в Rm, т. е. (е, е) = 1. (3.78) Будем считать единичный вектор е направлением и говорить, что f имеет производную по направлению е в точке а0, если функция ge, преоб¬ разующая R в себя, определенная как ge(t) te), (3.79) 87
имеет производную при t = 0. Производную от ge при 0, ge (0) будем называть производной от f в точке и0 по направлению е (рис. 3.24). Ука¬ жем, что <L.=^(0)- (380) где е2, . • -, ет — нормальный базис в Rm, т. е., что частные произ¬ водные от / являются производными от f по направлениям являющи¬ мися векторами нормального базиса в Rm (см. § 2.6). Действительно, если т е = 2 г-1 то можно показать, что Рис. 3.24. Для получения производ¬ ной функции f в точке д0 по направле¬ нию е пределы берутся вдоль прямой L = (е, grad /(«о))- (3.83) Например, если f — функция пре¬ образования R2 в R, заданная как /(Ы ) = и1 + и2> И еСЛИ то производная f по направлению е в точке 0 равна , так как -0 = (0^(0)" _1=(О2/)(0). 1 Г2 В заключение рассмотрим преобразование f пространства R,n в Rn с компонентами flf . ., fn. Пусть а0 — элемент из Rm. Если и «близко» к и о, функцию f (и) можно аппроксимировать функцией fa (и) вида /а(и) = /(«о) + 5((« —«о), (3.84) где 9( — линейное преобразование Rm в Rn. Мы хотели бы выбрать $( таким образом, чтобы f (и) была касательной к f (и) в точке и0, т. е. таким образом, чтобы (3-85> Если А = — матрица преобразования ?( (см. § 2.7), то мы хотим выбрать аи таким образом, чтобы 1 II fW-fM _ А'(а- ц0) И __ п 2ДТ0Н іі«-«оіі іі«-«оіі II Если в R имеются такие аи-, для которых условие (3.86) удовлетво¬ ряется, говорят, что f дифференцируема в точке uQ и что матрица А есть 88 (3.86)
производная f в точке а0. А часто называют матрицей Якоби функции/ в точке а0. Можно показать, что п X т матрица А имеет вид Wi)(«o) (ад(«0)... (г>„гА)(«о)‘ (^іЛК^о) • • • (^т/г)(^о) (g g7) _.(D1/)(a0)(D/î)(a0).. .(Dtnfn)(u<>L где /і, /2, • fn — компоненты / и Di означают частные производные. Элемент, стоящий в f-м ряду и /*-м столбце матрицы Л, равен о/(«о). (3.88) Матрицу А мы часто будем обозначать . В случае, если / есть преобразование Rn в себя, детерминант матрицы А называют якобиа¬ ном / в точке «ои пишут det А = det L - det < L_. (3.89) Будем говорить, что f дифференцируема, если f имеет производную в любой точке «о из Rm, и писать или [Djfiia)] (3.9Ѳ) для обозначения функции, преобразующей Rm в множество п X т ма¬ триц S01 (п, tri) (см. § 2.8), величина которой в точке и равна матрице Якоби функции f в точке «. Эту функцию будем называть производной f. Если /1(«1, U2, . . -, Щп) /(») = /2 (Wl> И2> • • -, ит) _/п (^1, ^2> * * -, Q (3.91) ~ df л то производная от /, т. е. будет равна df _ ди ~dh диг df2 диг dfi ди., df, ди2 dfi - dum dfï дит dfn dfn dfn ди Y ди., ’ ' dutn (3.92) Например, если f есть преобразование 7?3 в R2, заданное как то д/ _ Г 2«і 1 О ~ [ 0 —1 2и3 ‘ Пример 3.34. Пусть ЭД, — линейное преобразование Rm в Rn с матрицей А ~ (ац) дэд, Мы знаем, что ЭД («) = Au для и из Rm, и можем убедиться, что - = А. 69
В частности, если ЭД, — линейное преобразование R3 в R2 с матрицей А = Г 1 — 1 О "I ~ [ 0 2 3 J ’ Т0 д^І = А = 1 —1 0 ди 0 2 3’ Пример 3.35. Предположим, что f—преобразование /?2 в R3: /(«) = ■ «2 + «2 ’ — и1и2 __ иг sin и2_ тогда 2и± 2и2 — и2 — Uy Sin и2 Uy COS и2 и df ди Заметим, что '0 0' 0 0 0 О и поэтому f не однозначно. 3.13. «ГЛАДКИЕ» МНОЖЕСТВА ИЗ Rn Используем понятия производной и градиента для изучения понятия «гладкости» подмножеств из /?п. Грубо говоря, подмножество из Rn «гладко», если оно в каждой точке имеет касательную плоскость. Уточним это положение. Начнем с ряда определений. Определение 3.26. Пусть f (х)—непрерывная действительная функ¬ ция на Rn. Обозначим через S (/) подмножество из Rni определенное как 5(/) = {л:/(х) = 0). (3.93) S (/) есть множество точек х из Rn, в которых f равна нулю. S (/) называется (непрерывной) гиперповерхностью в Rn, заданной /. Определение 3.27. Пусть S (/) — гиперповерхность в Rn и х0 — элемент S (/) (т. е. /(лг0) = 0). Будем называть х0 регулярной точкой S (/), если градиент f по х при xQ существует и не равен нулевому вектору. Иначе говоря, х0 есть регулярная точка S (/), если ^(*о)¥=О. (3.94) Заметим, что если xQ — регулярная точка S (/), то множество L (лг0) = (лег : \-^-(*о)> X — (3.95) представляет собой вполне определенную гиперплоскость (см. определе¬ ние 3.15), проходящую через точку лг0. Это обстоятельство подводит нас к следующему определению: Определение 3.28. Если х0 — регулярная точка гиперповерхности S (/), то L (х0) называют гиперплоскостью, касательной к S (/) в точке х0. Говорят, что вектор п (х0) есть нормаль к S (/) в точке х0, если « (*о) = с-^ (ХО), с #= 0. (3.96) 90
Иначе говоря, п (х0) — ненулевой вектор, коллинеарный градиенту f в точке лг0. Отметим, что если п(х0) — нормаль к S (/) в регуляр¬ ной точке л:о, то касательная гиперплоскость L(x0) определяется урав¬ нением L(Xo) = {х: (л(лг0), х — х0) = 0}. (3.97) Пусть f — действительная функция, заданная на Rn. Будем назы¬ вать / гладкой, если: 1) / дифференцируема [т. е. существует, см. выражение (3.68)]; 2) градиент есть непрерывная функция, преобразующая Rn в себя. Определение 3.29. Если f — гладкая функция и если каждая точка xQ из S (/) регулярна, то говорят, что 3 (/) есть гладкая гипер¬ поверхность. Заметим, что гладкая гиперповерхность имеет вполне опре¬ деленную касательную гиперплоскость в каждой точке. Пример 3.36. Пусть f (х) = (а, х), где а — некоторый ненулевой вектор из Rn', f есть гладкая функция, множество S (f) — гиперплоскость L, проходящая через начало координат и заданная соотношением (а, х) — 0; касательная гиперплоскость L (х0) в любой точке х0 из S (f) есть само множество S (f) (-L). Пример 3.37. Пусть f— действительная функция на R2, заданная как f Ç — 1, яв¬ ляется гладкой; множество S (f) есть окружность еди¬ ничного радиуса (рис. 3.25) и касательная гиперпло- есть скость L г 1 -1 ѵъ 1 к S (f) в точке Г- 1 -| 1 L JÀ2 J L Г2 J прямая xt + х2 — К2= 0 (как показано на рис. 3.25). Читателю следует рассмотреть этот пример, имея в виду определение 3.22. Мы можем теперь сформулировать опре¬ деление «гладкого» множества в Rn. Пусть /і, f2,..fn-k —п—k различных гладких функций на /?„, где 1 < k —1, а 5 (/і, /2, • • -, fn-k) обозначает пересечение [см. уравнение (2.10)] гипер¬ поверхностей S (/J, S (/2), . . ., S (fn_k), т. е. $(Â, f2, ..fn-k) = 3(A) n S(/2) Л ... ns(/„_è). (3.98) Иными словами, S (fx, f2, ■ ■ fn-k) есть множество точек x из R.n, в которых все ft, i = 1, 2 n. — k равны 0, т. e. S(A, f2 fn-k) = = [x: А(х) = 0 и A(x) = 0 и ... и fn-k{x) = Q\. (3.99) Определение 3.30. Будем говорить, что S (/у, /2, . . ., есть глад¬ кое 6-мерное многообразие в /?„, если для каждой точки хй из S (/ІЎ/2, • • •> • • ; fn-k) n — k векторов (-^-) (Xo), (-|j) (Xo), • • -, (-%^) (*o) ли‘ нейно независимы [см. уравнение (2.26)]. Если S (/і, /2, . . ., fn_k) — гладкое é-мерное многообразие, то каж¬ дая из гиперповерхностей S (Д) гладкая. Следовательно, если xQ—эле¬ мент S (/і, /2, . . /„.J, то касательная гиперплоскость (лг0) к S (Д) 91
в точке xQ определена для і = 1, 2, . . п — k. Пусть М (х0) обозначает пересечение гиперплоскостей L; (xQ): М (х0) = Li (Ло) П Л2 (х0) П ... П Ln_k (х0) = (3.100) = {х:\-^(х°)> х~*о/ = О « —*о/ = О и ... ... и X — х0/ = о). (3.101) Будем называть М (х0) касательной плоскостью к S (/\, f2l . . ., fn_k) в точке х0. Таким образом, гладкое ^-мерное многообразие имеет каса¬ тельную плоскость в каждой точке. Пример 3.38. Пусть (х) = (а1, х) и f2 (х) = (а2, х), где а1 и а2 — линейно неза¬ висимые векторы в Rn. Функции и f2 — гладкие; множество S (/\, f2) есть п — 2-мерное многообразие и касательная плоскость М (х0) к S (flt f2) в любой точке х0 из S (fx, f2) есть само множество S (/\, f2). Пример 3.39. Пусть — действительная функ- Рис. 3.26. Множество S (/\, f2) из примера 3.39. ция на /?з, заданная как х2 _*з_ ~хх — sin х3, *2 = _хз J 7 fi и /г — гладкие; одномерное многообразие *5 (fi, fz) в R3 представляет собой винтовую линию (рис. 3.26), и, например, касательная /ПИ 1 о и f2 — действительная функция; f2 = Х2 — cos х3- к S (fi, Іъ в точке "О' 1 0 есть пересечение плоскостей хх—х3~ 0 и х2— 1 = 0. М Определение 3.31. Пусть S (Д, /2, • • •» fn-k) есть гладкое А-мерное многообразие в Rn и пусть xQ— элемент из S (/ь /2, • • -, fn-k)- Будем считать, что вектор р трансверсалей к S (/\, /2, • • fn-k) в точке х0, если (р, х — Xq) = 0 для всех х из М (х0). (3.102) Заметим, что р трансверсалей к S (/\, /2, . . ., fn_k) в точке х0 в том и только в том случае, когда р есть линейная комбинация (см. § 2.6) п — k векторов (хо), (-^-) (-Vo). • • •. (■^7)(хо)- Это понятие трансверсальности очень важно для изучения материала гл. 5. Вектор р трансверсалей к S (/\, /2, . . ., fn_k) в точке xQ, кроме того, в том случае, если р удовлетворяет k соотношениям (р, X1 — Xq) = О, 7=1,2, ..., k, (3.103) где х'і — элементы из М. (х0) такие, что векторы х]'—xQ линейно неза¬ висимы. 3.14. ИНТЕГРАЛЫ Интеграл от функции f есть функция g, производная от которой равна /. Уточним это понятие. Предположим, что f — действительная функция, определенная на замкнутом интервале [а, Ь] из /?, и пусть g — непрерывная функция, преобразующая [а, Ь] в R. Будем говорить, что g есть первообразная функция для /, если существует счетное подмножество А из [а, Ь] такое, что если / принадлежит [а, Ь] —А [см. уравнения (2.4)], то g имеет произ¬ водную при t, т. е. g (/) = /(/). Заметим, что если g и h — две первообраз- 92 1
ные к /, то разность g — h есть константа на [a, b ] 1. Если f есть кусочно¬ непрерывная функция на la, b] (см. § 3.11), то можно показать, что суще¬ ствует функция g, являющаяся первообразной /. Например, если f — ступенчатая функция (см. пример 3.31 и § 3.15), т. е., если имеется ко¬ нечное число элементов t0, t±, . . ., tn из [a, b], причем а = /0 < h <j <? ’ * <X < b, таких, что f равна постоянным величинам с( на каждом из (открытых) интервалов (/z, /z+1), тогда функция g, определенная как Z-1 g(t) = Ci(t - /,.) + 2 с/(6+1 - tj) (3.104) 7=0 для t из Ц, //+1], есть первообразная к /. Функцию типа g (f) часто называют кусочно-линейной. Это приводит к следующему определению. Определение 3.32. Интегралы. Если f есть действительная кусочно¬ непрерывная (т. е. регулярная) функция, определенная на (закрытом) интервале [а, Ь], и если g — первообразная к /, то разность g (t2) — g (fj для t2, из la, b] называют (определенным) интегралом от до t2 (или просто интегралом /) и записывают g = J/(T)dT. (3.105) G Используем символ sup | f (т) |, где / — интервал, для обозначения т Е 1 максимального значения |/ (т) | на интервале /, если этот максимум суще¬ ствует, и для обозначения наибольшей нижней границы множества чи¬ сел М, т. е. I/ (т) I < М для всех т из I, если этот максимум не существует. Число sup I f (т) I будем называть верхней границей /(т) на /. В § 3.15 мы т € 1 покажем, что если f кусочно-непрерывна, то существуют такие числа М, что I/ (т) I < М для всех т из /. Важные свойства интеграла от функции собраны в следующей теореме, которая приводится без доказательства (см. [51]). Теорема 3.8. Если f и h — кусочно-непрерывные функции, заданные на la, b], и если с — элемент из R, то для tlf /2 и t из Іа, Ь] справедливо: G G G a) J [f + h] (t) dx — J/(T)dr + j* h(x)dx\ (3.106) G G G G G б) t 2 J f(x)dx G §cf(x)dx = G G cJ/(t)c?t; G (3.107) в) < J|/(T)|dT < G ;(/2 — /i)sup|f(T)|; T g [a, b] (3.108) г) если f непрерывна, то непрерывная функция j f (т) dx дифферен- 1, цируема в любой точке / из [а, 6] и Д) е) чг p(T)dT = W); Lg t G 12 р(т)Л + J/(т)Л = J/(т)Л; (3.109) b если J I /(т) I dx = 0, a 1 Это следует из теоремы о конечных приращениях (см. [51 ]). 93
то существует счетное подмножество А из [а, 6], возможно «пустое», такое, что f (т) = 0, если т С [а, Ь] — А. В частности, ь J|/(T)|dT = 0 а означает, что f (т) = 0 для всех т из la, b], в случае, если f непрерывна и f (т) = 0 при всех т из la, b), когда / непрерывна справа, т. е. f (т +) = = f (т) для всех т из [а, Ь); ж) если имеется счетное подмножество А из la, b], такое, что / (т) = = h (т) для всех т из Іа, 6] — Л, то b b J /(т)б/т = J h(x)dT. a a Иначе говоря, две кусочно-непрерывные функции f и h могут разли¬ чаться в счетном числе точек и тем не менее иметь одинаковые интегралы. Например, если f (т) — непрерывная функция на [а, Ь] и h (т) = f (т) для т = (а, Ь), т. е. f (а) h (а) и f (b) h (6) только в двух точках а и Ь, то b b J f(T)dT = J /г(т) dr. Эти свойства интегралов будут неоднократно использоваться в даль¬ нейшем. Предположим теперь, что f — функция, преобразующая [а, Ь] в Rn с компонентами flt f2, . . ., fn. Интеграл от f можно определить через его компоненты. Определение 3.33. Если/—• кусочно-непрерывная функция, то инте¬ грал от/на интервале от tr до /2 (или просто интеграл от /) есть эле¬ мент из Rn, компонентами которого являются интегралы от Д на интер¬ вале от до /2 или G J Л (T) dt il f2 У /(т) dx (3.110) 2 J fn(y)dx G Свойства интегралов, перечисленные в теореме 3.8, имеют естественные аналогии для интегралов от векторных функций. Например, свойство в) [уравнение (3.108)] для интеграла от векторной функции выглядит сле¬ дующим образом: T g [а, Ь] (3.111)1 1 sup H f (т) II есть наибольшая нижняя граница множества чисел М, таких, т g [а, Ь] что II/(т) H М для всех т из [а, 0]. 94
b Свойство e) записывается в виде: если J || f (т) dx\\ = 0, то суще- а ствует счетное подмножество А из [а, 6], такое, что f (т) = 0, если тС Ія, 6] —Л; в частности, из равенства ь JiI/COHt = о а следует, что f (т) = 0 для всех т из [a, b], если f непрерывна, и для всехт из [а, Ь), если f непрерывна справа. Другое важное свойство интеграла от векторной функции связано с линейными преобразованиями. Если ЭД, — линейное преобразование Rn в Rnl, то 21 J/(T)dr = J 21 [/(т)] Л. (3.112) Это соотношение можно записать в виде (3.113) где А = есть т X п матрица преобразования 21. Наконец, предположим, что F есть функция преобразования интер¬ вала la, t>] в множество ЭД (п, т) (см. § 2.8) матриц размера п X т. Дру¬ гими словами, F (f) для t из [а, Ь] есть п X т матрица, элементы которой мы обозначим через /(7 (/) для і — 1, 2, . . ., п и / = 1, 2, . . ., т. Имеем F(/) = Ai (О Д2(0- • • fUt) fUt) fUt). • - fut) (3.114) fm(t) fut)- ■ - fut) A Заметим, что Д/ есть функции преобразования la, b] в /?. Будем гово¬ рить, что матричная функция F (f) кусочно-непрерывна (или непрерывна), если каждая из функций /17 (t) кусочно-непрерывна (или непрерывна). Имея это в виду, дадим следующее определение. Определение 3.34. Если F — кусочно-непрерывная матричная функ¬ ция, то интеграл от F в пределах от до t2 (или просто интеграл от F) есть элемент множества ЭД (п, т), элементы которого есть интегралы от ftj на интервале — t2, т. е. G \ G jF(T)dT =Jf,/(T)dT >G JÙ G (3.115) 95
или G t2 G J/u(T)dT J 7іг(т)гіт... J/lm(r)dT ti G G G J F(x)dx= t. t2 t2 t2 J fn (t) dx J f22 (t) dx • • • J f2m(x) dx il il il (3.116) І2 G І2 \fm(^)dx §fn2(x)dx- • J fnm(x)dx h t, <■ Снова заметим, что свойства интегралов, отмеченные в теореме 3.8, имеют аналогии и для интегралов матричных функций. Существуют и специфические свойства матричных интегралов, которые нам потре¬ буются для дальнейшего изложения. Они сформулированы в следующей теореме. Теорема 3.9. Пусть F (/) — кусочно-непрерывная функция преобра¬ зования интервала [af Ь] в множество п X т матриц; Р— заданная (постоянная) матрица размера р X п; Q — (постоянная) матрица раз¬ мера т X q и V — заданный (постоянный) вектор в Rni. Тогда a) PF(t)Q — кусочно-непрерывная функция преобразования интер¬ вала [a, ô] в множество р X q матриц и J [PF(t) Q] dx = P s J F(x) dx Q; (3.117) б) F (т) V — кусочно-непрерывная функция преобразования интер¬ вала la, b] в Rm: G ( ] j (F(t) ü} dx = К F(t) g Ig J (3.118) Обратимся к примерам, иллюстрирующим понятие интеграла и некоторые из его следствий. Пример 3.40. Пусть f— функция, преобразующая [0, Т] в R, заданная как f (t) = = е1. Имеем G J exdx — еІ2 — eil ti и т J ex dx = eT — 1. о Если g— функция, преобразующая [0, T ] в R, заданная как g (t) = t + 1, то G J g (t) dx = —£-1 + *2 — *1 G и T f T2 J g(T)6/T = —+T. 0 96
Очевидно, что т т т J {ет +(т 4- 1)) гіт =ет — 1 +-Ç- + T = j ех dx j (т + 1) dx. о оо Пример 3.41. Пусть f преобразует [О, Т] в /?3 и задана как f (Z) — Тогда J dx t, ^2 J sin т di G Jl.dT eh — etl — cos t2 + cos ty sin t 1 Пример 3.42. Пусть функция F преобразует [О, Г] в множество матриц размера Тогда т F(t) di = и ет — 1 О — т 2 _ Если Р = [ _ J у и Q [ [ (°]. то PF (/) Q =- -Ç-T о 1 — ет О Если т J PF(x)Qdx = и г j F(t) V di = о - ь. 1 1 1 1 = ет — Т Г ? Ь—1 2 X 2 3.15. ВЕКТОРНЫЕ ПРОСТРАНСТВА Выше уже рассматривался вопрос о множестве функций, имеющих общие свойства для случая множества кусочно-непрерывных функций. Обычно множества функций являлись векторными пространствами. Теперь мы хотели бы ввести для такого рода множества функций понятие расстояния, совместимое с понятиями суммы и произведения. По сути дела, векторное пространство функций с соответствующей функцией расстояния можно назвать функциональным пространством. Уточним это понятие и рассмотрим его на нескольких важных примерах. Определение 3.35. Функциональное пространство1 * * 4. Пусть —под- пространство векторного пространства $ Rn) всех функций преобра¬ 1 См. литературу [196] и [205]. Это определение — частный случай понятия, извест¬ ного как топологическое векторное пространство. Последнее понятие является весьма общим. 4 Атанс и др. 97
зования Rm в Rn или подпространство векторного пространства Ь], Rn) всех функций преобразования интервала [а, Ь] в Rn nd — расстоя¬ ние на 5 (см. определение 3.1). Будем называть J функциональным про¬ странством, если оно обладает свойствами: 1) пусть f и g — заданные элементы а {fk} и — последо¬ вательности из 5, сходящиеся к f и g соответственно [т. е. d (fk, f) -> О и (gk> S) 0]. Последовательность fk + gk сходится к f + g, т. е. d(fk + gk, / + g)^0. (3.119) 2) пусть f —заданный элемент из J и г —элемент из R, а {/J из $ и {rj из R — последовательности, сходящиеся к f и г соответственно. Последовательность rkfk сходится к г/, т. е. d(rkfk, rf)^ 0. (3.120) Обратимся к некоторым важным определениям функциональных про¬ странств. Начнем с рассмотрения множества всех ограниченных функций преобразования интервала la, Ь] в Rn. Определение 3.36. Ограниченная функция. Функцию f преобразо¬ вания [а, Ь] в Rn называют ограниченной, если существует число М из /?, М > 0, такое, что ||/(0 И < М для любого t из [а, Ь]. (3.121) Пусть 93 ([a, b], R ) обозначает следующее множество: 93([я, b], Rn) = [f : f — ограниченная функция из [а, 6] в Rn}. (3.122) Нетрудно заметить, что 93(1«, b], Rn) есть векторное пространство, являющееся подпространством множества b], Rn) всех функций, преобразующих la, Ь] в Rn. Введем понятие расстояния на 93(1«, b], R^, которое превратит последнее в функциональное пространство. Определение 3.37. Норма функции. Пусть /— элемент из 93 (Ія, 6], Rn), т. е. / — ограниченная функция из [а, Ь] в Rn, Нормой /, ||/ ||, по определению является наибольшая нижняя граница множества чисел М такая, что ||/ (ОН < М для любого t из la, b] Ч В частности, если / непрерывна, то 11/11 = sup||/(/)ll = max|l/(/)||, (3.123) /£[a,ô] t£[a,b] поскольку II/ (t) Il действительно достигает максимума на [а, 6] (см. тео¬ рему 3.7). Если/ ng— элементы из 93 ([a, b], Rn),r. е. если обе функции/ и g ограничены, то расстояние между f ng,d (f, g), есть просто норма / — g, иначе говоря, d (f, g) = Il f - g II = su p И f (Z) - g (/) Ц. (3.124)1 2 Покажем, что 93 (k, b], Rn) вместе с понятием расстояния есть функ¬ циональное пространство. Теорема 3.10. Функция d, определяемая уравнением (3.124), действи¬ тельно является расстоянием на 93 (la, b], Rn). Множество 93 (la, b], Rn) есть функциональное пространство по отношению к этому определению расстояния. 1 ||/|[ часто называют наибольшим значением || f (t) || на интервале [а, 6]. 2 sup ||/(0 —g (Oil следует понимать как наибольшую нижнюю границу множества t g [а, Ь] чисел М, таких, что 11/(0 — g (0 II М для любого t из [a, д], т. е. sup || f (t) — g (t) || tÇ- [a, b] есть наибольшее значение || / (0 — g (0 II ♦ 98
Доказательство. Убедимся прежде всего в том, что функция d, опре¬ деляемая уравнением (3.124), обладает свойствами 1) и 3) определения 3.1. Очевидно, что свойством 2) она обладает, так как \\f (/)—g (/)|| = = Il g (f) —f (t) Il для любого t из [a, Ь]. Что касается неравенства тре¬ угольника [свойство 3) определения 3.1], то для f, g и h из 93 ([а, Ь] Rn) справедливо + (3.125) для всех / из [а, Ь]. Это означает sup 11/(0 - h (/)|| < sup Ц|/(/) - g (OU + Il g (t) - < t g [a, b] t Ç. [a, b] <sup||/(O — g(OII + sup||g(/) —й(/)||. (3.126)1 t£(a,b] t£[a,b] Очевидно, что d (/, g)^ 0 и d (f, f) = 0. Далее, если d(/, g) = 0, то для любого заданного /0 из [а, Ь] должно быть ||/ (/0) —g (/0)|| = 0, так что / (/0) = g (Iq). Мы показали, что d есть функция расстояния на 93 ([a, b], Rn). Проверим, удовлетворяется ли условие 1) определения 3.35. Пусть/ ng — элементы из 93 ([а, Ь], 7?п), тогда II/+ g II <11/11 +UII- (3.127) Отсюда следует, что ІІЛ + gk — (/ + ^11 <11/* — Л + lk* — ffll> (3-128) т. e. d (fk + gk, f + g) < d(fk, + /) + d(gk - g). (3.129) Из последнего выражения видно, что условие 1) удовлетворяется. Для уравнения (3.127) имеем II/+ £ІІ = sup II(/ + £)(/) 11 = SUp||/(/) + g(/)||< < sup||/(OI| + supllg-(t)II = ||/|] + ||g||. (3.130)2 Предлагаем читателю самому убедиться в том, что условие 2) опре¬ деления 3.35 удовлетворяется. 93 ([а, b], Rn) является полным (см. § 3.5) по отношению к расстоя¬ нию d, определяемому по уравнению (3.124). Для того чтобы убедиться в этом, заметим, что если f} есть равномерно сходящаяся последователь¬ ность (см. определение 3.11), то любая fj(t) — равномерно сходящаяся после¬ довательность в Rn, которая должна сходиться к элементу из Обозначим этот элемент через f (t). Если задано е > 0, то существует N (-у), при котором II fj — fk II < -|-, если j, £>Л/(-|-). Если / > N (-|-) , то II// -/II <8- Это следует из соотношения ||/;- (/) — /(OU < II// (0 — -/* (011 -4- Wfk (0—f (0 II, которое справедливо для любого t из la, b] (т. е. при t G la, Ь] можно выбрать k (0 > N (-|-) так, чтобы || fk (0 (0 — /(OIK-J. 1 Уравнение (3.126) обосновывается следующим образом. Если A4 и N — числа такие, что II f (t) — g (0 М и ll£ (/) — й (Oil N для любого/ из [а, д], то ||/ (0 — — g (ОН + Il g (0 — h (t) \\ ^ М-\- N для любого t из [а, ô] и, следовательно, ||/(0 — — h (/) И A4 + N для любого / из [а, 0]. Читатель должен иметь это в виду примени¬ тельно к утверждениям, аналогичным уравнению (3.126). 2 Сравнить с уравнением (3.126). 99
Обозначим через (£([а, &], Rn) множество всех непрерывных функций, преобразующих Іа, Ь] в Rn\ G (k, b], Rn) = \f :f есть непрерывное преобразование [a, b] в Rn\. (3.131) По теореме 3.7 множество S (la, b], Rn) содержится в множестве ® (la, b], Rn); более того, оно является его подпространством (см. § 3.10). Иначе говоря, непрерывные функции, определенные на компактном интервале, ограничены. Расстояние d, определенное уравнением (3.124) по отношению к Ê([a, b], Rn), есть расстояние между непрерывными функциями. С помощью теоремы 3.11 мы покажем, что если fk — после¬ довательность непрерывных функций, сходящаяся к /, то/должна быть непрерывна. Это доказывает, что S([a, b], Rn) есть функциональное пространство. Действительно, G ([a, b], Rn)—полное функциональное пространство по отношению к этому расстоянию. Теорема 3.11. Если fk —последовательность непрерывных функций, сходящаяся к /, то / непрерывна. Доказательство. Пусть t0 — некоторая точка из [а, Ь] и {tm} — после¬ довательность из [a, b], которая сходится к /0. Покажем, что /(tm) схо¬ дится к Предположим, задано е > 0; существует К такое, что при k> К имеем sup||/ft(/) — С~. /€ la. Ы 3 При этом справедливо соотношение II/(4.)-/(to)Il < \\'f(tm) -fk(tm)\\ -Н!Л (t,n) - Л (Oil + + ІІ/И0-Ж)ІІ- (3.132) Так как fk непрерывна, то существует М, начиная с которого (т. е. при /п>Л4) IIЛ (Л) - Л (О II <1- (3.133) Из уравнения (3.121) следует, что при т > М ІІ/(Л)-Л0)||<е (3.134) и, следовательно,/(/т) сходится к/(/0). Последнее и доказывает непре¬ рывность/. Упражнение 3.13. На основании теоремы 3.11 необходимо показать, что множество непрерывных функций (£ ([a, ô], Rn) есть векторное пространство. Указание: исполь¬ зуйте теоремы 3.7, 3.11 и 3.10. Теорему 3.11 часто формулируют так: предел равномерно сходящейся последовательности непрерывных функций есть непрерывная функция. Заметим, что теорема остается справедливой и в том случае, когда слова «непрерывная» повсюду заменяются на «кусочно-непрерывную» функцию. Теорема 3.11а. Если fk — последовательность кусочно-непрерывных функций, которая сходится к/ [по отношению к расстоянию d из уравне¬ ния (3.124)1, то и / кусочно-непрерывна. Это опять-таки означает, что множество всех кусочно-непрерывных функций, преобразующих [а, Ь] в Rn, является функциональным пространством, если можно показать, что каждая непрерывная функция преобразования [а, Ь] в Rn ограничена. Покажем, что если функция/кусочно-непрерывна, то существует после¬ довательность stn ступенчатых функций (см. § 3.14) х, для которых || sm —/[| сходится к 0. 1 Напомним, что ступенчатая функция s определяется следующим образом: если /0 G, • • •’ tn — элементы из [а, д], причем а = /0 < tr <? • •< tn — b и s = const = Ci на каждом из открытых интервалов (^, /z+1), то такая функция s называется ступенчатой. 100
Теорема 3.12. Если f— кусочно-непрерывная функция, преобразую¬ щая [а, Ь] в то существует последовательность sm ступенчатых функ¬ ций, такая, что для любого 8 > 0 существует М (е) такое, что при т > > М (8) для любого t из la, b] справедливо неравенство || $т (/)— —/(011 <8. Доказательство. Для доказательства воспользуемся рис. 3.27. Пусть W — некоторое целое число. Предположим, что t Е [а, Ь] и t а или Ь. Существуют элементы і (/) и г (/) в la, b], такие, что если о, т принадлежат к (i (t), t) или к (t, г (/)), то II/ (о) — f (т) II < . Это справедливо, потому что/(/+) и / (t—) существуют \ Аналогично существуют элементы г (а) и t (6) такие, что если, например, о, т принадлежат (а, г (а)), то ||/ (о) — прерывистой линией, —кусочно-непрерывная функция f (/); сплошная кривая — аппроксимирующая ступенчатая функция SN (О f (т) II С . Выберем теперь элементы sn s2, . . ., sp на [a, b] таким обра¬ зом, чтобы каждое t из la, b] находилось хотя бы в одном из интервалов [а, г (a)), (i (SJ, г (sj), . . ., (z (sp), r (sp}), (i (6), b)]. Мы можем это сде¬ лать в силу свойства компактных множеств Гейне—Бореля (см. § 3.6, свойство 2). Рассмотрим множество \а, b, sb s2, . . sp, г (a), i (b), і (sj, r (s^, . . ., i (Sp), r (sp)} и определим точки a = /0 < h < * • • < = b как точки этого множества, расположенные в порядке возрастания. Точка находится в одном из интервалов la, г («)],... и т. д. Точка /.+1 находится в том же интервале, что и /•, или является r (sq) для некото¬ рого q. Следовательно, если о, т принадлежат (/z, то ||/ (о) — — Если определить sN как МО) =/(6); М0=/( ) для Z из то последовательность ступенчатых функций sN для N = 1, 2, ... и есть искомая последовательность. 1 Иначе говоря, 0 означает, что существует интервал, скажем, i (t) такой, что II/(т)для т из (i (t), t). Из неравенства треугольника следует, что II/ (а) -/ (т) II И/ (а) - f (t-) И + HJ (/-) - f (т) |j ==s + A- = ± . 101
Обозначим функциональное пространство всех кусочно-непрерывных функций преобразования la, b] в Rn через ^3 ([я, b], Rn): $ ([a, b], Rn) = {f :f есть кусочно-непрерывная функция, преобразующая [а, b] в Rn], (3.136) Важным следствием теорем 3.11, 3.11а и 3.12 является тот факт, что множество непрерывных функций £ (la, b], Rn) и множество кусочно¬ непрерывных функций ^5 ([а, b], Rn) являются замкнутыми подмноже¬ ствами множества всех ограниченных функций ([a, b], Rn) (см. опреде¬ ление 3.7) и, следовательно, полны (см. § 3.5), поскольку множество 33 ([a, b], Rn) является полным. Таким образом, каждая непрерывная или кусочно-непрерывная функция преобразования [а, Ь] в Rn ограни¬ чена. Этот результат будет использован нами в § 3.18 и 3.19. Другим важным следствием этих теорем и свойств интегралов [урав¬ нение (3.111)1 является то обстоятельство, что если fk есть последова¬ тельность элементов из 33 (Ія, 6], /?„), которая сходится к/в смысле рас- ь стояния по уравнению (3.124), то последовательность ^fk (т) dx схо- а b дится к J/(t) dx. Это, естественно, приводит к известному результату, а относящемуся к почленному интегрированию рядов. Иначе говоря, интеграл есть непрерывная линейная функция на 33 (fa, b], Rn). Рассмотрим множество непрерывных функций Q, ([я, b], Rn) и введем иное понятие расстояния на этом множестве. Определение 3.38. Пусть f—элемент из £ ([a, b], Rn). Норма /, которую будем обозначать как Ц/І^ \ есть просто интеграл эвклидовой нормы для / (/) на интервале la, b]: ь ll/lli = J||/(t)||A. (3.137) a Если f и g — элементы из (£ ([a, b], Rn), то расстояние (/, g) между f и g есть просто норма f — g, т. e. b ddf, g) = ||/~glli = j*ll/(T)-ff(T)||dT. (3.138) a Легко показать, что уравнение (3.138) действительно определяет расстояние на (£ ([a, b], Rn) и что (£ ([a, b], Rn) оказывается функциональ¬ ным пространством по отношению к этому понятию расстояния. Упражнение 3.14. Требуется доказать, что уравнение (3.138) определяет расстояние на (£ [0, 1], R) и что (£ ([0, 1], 7?) есть функциональное пространство по отношению к этому расстоянию. Указание: использовать теорему 3.8; в частности, полезны свой¬ ства в) и е) [уравнение (3.108)]. Уравнение (3.137) имеет смысл и для функции/, кусочно-непрерыв- ь ной на [а, Ь], т. e. J || f (т) || dx существует. Имеются, однако, такие а кусочно-непрерывные функции g, не равные нулю, для которых b J IIS’ (Т)ПТ = Это обстоятельство не позволяет определить расстоя- а 1 Индекс 1 вводится, чтобы отличать это понятие нормы (один) от понятия, сформу¬ лированного в определении 3.37. 102
ние на $ (la, Z? J, Rn) с помощью уравнения (3.138), так как нарушается свойство 1) определения 3.1. Для того чтобы обойти это затруднение, будем называть две кусочно-непрерывные функции f и g «подобными», или эквивалентными (или почти везде совпадающими), если множество А точек t из [а, Ь], в которых /(/) =/=■ g(Z)1 является счетным. Нетрудно заметить, что f и g эквивалентны в том и только в том случае, если b J ll/W —£0011^ = а Обозначим через [/] множество всех h из ^3 (Іа, 6], /?„), «подобных»/: 1/1 — {Л:/ подобна Л). (3.139) Если теперь определить функцию dlt положив ь dA\f\, [gl)= Уі|й(т)-Л(т)|Ит, (3.140) а где h — любой элемент множества [/] и k — любой элемент из [g], то легко видеть, что d± есть расстояние на множестве всех [/]. Хотя, строго говоря, для определения dx следует использовать уравнение (3.140) и рассматривать множество [/], в дальнейшем мы обойдем это обстоя¬ тельство и будем рассматривать в качестве определения расстояния d1 на ^3([а, 6], Rn) уравнение (3.138). Имея это в виду, будем рассма¬ тривать $([а, 6], Rn) как функциональное пространство по отноше¬ нию к dv Отметим, что (Е ([a, b], Rn) и ^3 ([а, ft], Rn) не являются полными (см. § 3.5) по отношению к расстоянию d±. Вернемся к множеству непрерывных функций (Е([а, 6], Rn) и введем еще одно определение расстояния на этом множестве. Определение 3.39. Пусть/и g — элементы из £ ( [а, &], 7?п). Скаляр¬ ное (или внутреннее) произведение/и g, обозначенное через 1/, g], опре¬ деляется уравнением ь I/. £1=4</(т), £(Т)>Л, (3.141) а где (/ (т), g (т)) есть обычное скалярное произведение на Rn [см. уравне¬ ние (2.86)1. Покажем, что это определение имеет смысл и что внутреннее произведение [/, g 1 действительно является положительно определенным внутренним произведением на векторном пространстве G ([a, b], Rn). Теорема 3.13. [/, g] есть положительно определенное внутреннее произведение на (Е ([a, b], Rn). Доказательство (см. § 2.11). Свойства 1,2 и 3 произведения [/, g] не¬ посредственно следуют из соответствующих свойств скалярного произ¬ ведения (/, g). Проверим, обладает ли [/, g], например, свойством 2). Если г £ R и /, g Е (Е ([a, b], Rn), то ь ь Vf, g] = J (г/(т), g(T)) dx = J r 'J(%), g(r)) dr = a a b = g(r))dr =^r[f, g]. (3.142) 1 Cm. § 2.2. 103
Рассмотрим теперь [/, f] [см. уравнение (2.84)] и покажем, что оно неотрицательно: I/. /] = ,f (/(*). /(т)) di. (3.143) Но (/ (т), f (т)/^0 для любого т из Іа, Ь]. По теореме 3.8в имеем I/. /1 = J (/СО. /СО) di = I </(т), /(О) I di > j (/СО. /(О/ di =а0. (3.144) Наконец, пусть/0 — элемент из (Е (к, 6], Rn) такой, что [/, /01 = О для каждого элемента f из (Е ([а, 6], /?п). В частности, [/0, /01 = 0- Но (3.145) и на основании теоремы 3.8е ||/0 (т) ||2 = 0 для любого т из [а, Ь]. Оче¬ видно, что /о 0, и теорема доказана. На основании этой теоремы можно определить понятие нормы ана¬ логично § 2.13 [см. уравнение (2.94)] для элементов из £ (к, 6], Rn). Будем называть ее нормой (два) и обозначать ||/||2: ІІ/ІІ2 = И/, /] = J(/(O./.(O)^ Jll/(^)U2^ (3.146) Неравенство Шварца (2.87) справедливо для внутреннего произведе¬ ния [/» g*]; поэтому (3.147) или эквивалентно 12 1/2 Г b j (/(т). fW)di J (g(T), g(r))<ÏT (3.148) Уравнение (3.148) будет использовано в гл. 10. Такое понятие нормы позволяет определить расстояние d2 в (Е ([a, Ô], Rn) [сравнить с уравнением (3.1)]: Предлагаем читателю убедиться в том, что (Е (k, b], Rn) есть функ¬ циональное пространство по отношению к этому понятию расстояния. Заметим лишь, что (Е (la, b], Rn) не является полным по отношению 104
к расстоянию d2. Заметим также, что это понятие расстояния применимо и к множеству кусочно-непрерывных функций, если согласиться рас¬ сматривать «подобные» функции одинаковыми [сравнить с уравне¬ ниями (3.139) и (3.140)]. Пример 3.43. Пусть f (/) = sin/ для t из [0, л]. Тогда f (/) есть элемент из (£ ([0, л], R) и мы имеем И/И = sup I sin 11 == 1; t (î [0. Л] ||/lk = J I sin t \dt = 2; Отметим, что |lf|| < у ||2 <|| fill- Пример 3.44. Пусть f (t) = 1 для / из [0, 1 ] и g (/) — «пик», заданный как 4—8/ f (/) и g (t) — элементы из С ([tz, ô], R) и ІШі = і; UII-2; ||/_£|| = 1; 11/11!= 1; иііі=Ц-; и/-гііі=-г; /4 1/2 3/0 1 t Рис. 3.28. Функции f, g и h из примера 3.44; h (Z) = 0 при любом t 6 [0, 1 ] Отметим, что |j/ — g||2 < ||/ — glli <||/ — g|| и || f || < || g ||, но || g||i <||/Ці- Выберем, h (t) = 0 для всех / из [0, 1 ] и используем понятие расстояния между элементами функционального пространства для определения, какая из двух функций f или g ближе к h. Если использовать расстояние d, то d(f, /г) = Ц/Ц = 1 и d(g, h)—\\g\\—2. Следовательно, f ближе к h, чем g. С другой стороны, если использовать расстоя¬ ние dp то di (f, h) = mill =-. 1 и dr (g, h) =UII1 =~2~ и по отношению к этому расстоянию g ближе к h, чем f. Аналогично g ближе к Л, чем f относительно d2. Таким образом, мы видим, что «близость» функций зависит от того, какое понятие расстояния используется. 3.16. ФУНКЦИОНАЛЫ Функционал — это вещественная функция векторного пространства (обычно функционального пространства). После предварительного обсу¬ ждения мы определим это понятие более строго и четко. Пусть L — действительная функция на RN. Если у — элемент из Ry с компонентами у±, у2, . . ., yN, то L(S) = ЦУі, Уг W (3.149) £(0- / ? Если f (t) — функция преобразования R в RN с компонентами (/), /2 (0, • • •» /л/ (О» то 1/(0 ] есть функция преобразования R в R (т. е. функция времени) и L [/(/)] =L[fi(t), f2(t) (3.150) 105
Если предположить, что L дифференцируема по у,, то будет функ- иУі цией, преобразующей RN в R, и поэтому [f (/) ] —функция преоб- ѵУі разования из R в /?, которую будем обозначать Итак, вду[/(/)] = і/(0] = /2(0,-.-,/ѵ(0] =(ад[/(оі. (з.і5і> Часто будет представлять интерес отыскание минимума (или ма¬ ксимума) функции типа ь ь Л/) = = Je [/,(/), f2(t) fN(t)]dt, (3.152) a a где L — непрерывная функция преобразования RN в R; f — непрерывно или кусочно-непрерывно преобразует [а, Ь] в Rx и /д, /2, • • », Аѵ — ком~ поненты /. Функция J есть функция преобразования из ([я, 6], Rn) [см. уравнение (3.136)1 в R. Если T Е la, b], то можно задать веще¬ ственную функцию J (T, f), положив т т J(T,f) = $L [f(t)] dt ~ \ L [fdt), M dt. (3.153) a a Функцию J (T, f) будем называть функционалом. Пусть L — диф¬ ференцируема по gt и производная от L по у>, [см. (3.77)] есть непре- оуі рывная функция из Rn в R. 1Аъ\ мэжем определить новый функционал àJ(T, f) , положив dfi (t) T T />(/) /Л01Л. <3.154) a a dJ (T f) —47-777^- будем называть частной производной от J (T, f) по Д (/). Урав- VI і \ч нение (3.154) будет использоваться в дальнейшем довольно часто. Заметим, наконец, что для каждой фиксированной функции f функ¬ ция J (Т, /)от Т имеет производную во всех точках за исключением счет¬ ного множества точек А из [а, 6]. Если Т не принадлежит к Л, то произ- 7 /<Л (T’ f) водная от J (T, f) по Т, —^7 " Равна = L ïfi(T), f2(T), . .. , fN(T)]. (3.155) В частности, если f непрерывна, то = £ [/(Т)] для всех Т из [а, Ь]. (3.156) Пример 3.45. Пусть L (у) — 1 для всех у из Rn; L непрерывна и (у) = 0 для і = — 1, 2, .... N и у из Rn- Если f Ç ([а, 5], Rn), то т J(T,f) = ^ \dt=T — a а 106
dJ (T, f) dT Пример 3.46. Пусть L (y) = 2 Ci I Уі I, (=1 где cA, c2, ...» — положительные константы. В этом случае L непрерывна и N L[f(t)] ^сі\Уі\ і=\ для f из Sp ([а, 6], Ry). Следовательно, т N NT = 2 Ci I fi (/) I dt = 2 ‘I J I A «) I dt a ï=1 i—1 a dJ (T,f) 4 г i f its i = Zj Ci\ fi U ) I- i=l Заметим, что в общем случае неопределенна. dfi (О Пример 3.47. Пусть L (У) = Ц- {У. У) = -у- 2 УІ L непрерывна и для / из $]3 ([а, 6], Rn). Следовательно, J(T, f) = -у- J 2 (O dt; = 4-2 (Г) a i=l x=l И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 3.17. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Поведение всех физических систем, которые мы будем рассматривать, описывается системами обыкновенных дифференциальных уравнений. В этом параграфе дадим определение понятия системы обыкновенных диф¬ ференциальных уравнений, объясним, что понимают под решением си¬ стемы, и рассмотрим начальные и граничные условия, а также изучим влияние параметров системы. В последующих параграфах дадим доказа¬ тельство теоремы существования и единственности решения и детально изучим линейные системы. Дифференциальным уравнением называют уравнение, в которое входят производные неизвестной функции. Например, уравнения х(/) = —%(/) (3.157) и —= 1 + dFfx'і} (3.158) 107
являются дифференциальными уравнениями. В уравнении (3.157) неиз¬ вестная функция X есть функция одной действительной переменной. Это уравнение называют обыкновенным дифференциальным уравнением. В уравнении (3.158) неизвестная функция F есть функция нескольких переменных. Такие дифференциальные уравнения называют дифферен¬ циальными уравнениями в частных производных. На протяжении всей книги вместо термина «обыкновенное дифференциальное уравнение» мы будем использовать термин «дифференциальное уравнение». Уточним понятие дифференциального уравнения. Определение 3.40. Пусть F — непрерывная 1 функция преобразова¬ ния открытого подмножества А размерности Rn+2 (см. определение 3.5) в R. В этом случае уравнение F [%(/), л-(/), /] = 0 (3.159) называют дифференциальным уравнением n-го порядка 2. Действительная функция ф (/), определенная на открытом интервале (/х, /.,), называется решением дифференциального уравнения (3.159), если а) ф (/) непрерывна на (/1( /2); б) точка -ф(0 - ф(/) _ф(п)(/)_. принадлежит множеству А для t из (/1( /2); в) F Іф (t), ф (/), . . ., ф<л) (/), t] 0 для t из (^і, /2). (3.160) Если уравнение (3.159) можно записать в виде x{n\t) — G [х(0, x(t), ..., х<'1-1>(0, d - ° (3.161a) или xw(t) = G[x(t), x(t), .... x(n-1)(0. (3.1616) будем говорить, что уравнение разрешено относительно высшей произ¬ водной. Порядок дифференциального уравнения соответствует порядку наи¬ высшей производной, встречающейся в уравнении. Решение уравнения связано с интервалом определения. Например, функция се~1 есть решение уравнения (3.157) на любом интервале (/ь /2)« Пример 3.48. Пусть F —функция из /?3 в /?, заданная как F (уъ у3) = у2 — . Уз Функция F непрерывна на открытых множествах: Уі У'і Уз ' Уз > 0 и Уі У'і Уз 1 Хотя относительно F могут быть рывность вполне достаточна для наших целей. à,xn 2 х(п) (0 обозначает n-ю производную от х (/) по t. сделаны и более «слабые» предположения, непре- 108
Пусть А = Л + (J А , тогда F непрерывна на Л и мы можем рассматривать диффе¬ ренциальное уравнение -J- = 0. Для t>> 0 решением уравнения будет х (f) = log t + с (с — произвольная постоян¬ ная); для t < 0 решением будет х (t) — log (—t) + с. Дадим определение системы дифференциальных уравнений первого порядка х. Определение 3.41. Пусть /2, . . fn — непрерывные функции от произведения открытого множества Ап из Rn и открытого интервала (7\, Т 2) (который может представлять собой все /?, быть задан как мно¬ жество \t : t <^Т2] и т. д.), т. е. из Ап X (7\, Т2) [см. уравнение (2.5)] 1 2 в R. Предположим, что частные производные •’ Хп't} , і, / = 1, 2, п, (3.162) где х2, . . хп — координаты Rn, являются непрерывными функ¬ циями преобразования Ап X (Т19 Т2) в R. Система уравнений х1(0 = 7і[*і(0, х2(/) xn(t), /]; x2(f) = f2 [хх (/), x2(/), x„(0, /]; Xn(t) = x2(t), xn(t), Л (3.163) называется системой из n дифференциальных уравнений первого порядка; х. часто называют зависимыми переменными, a t — независимой перемен¬ ной. Уравнения (3.163) записывают в векторной форме: аг(/) = /[х(/), /], (3.164) где х(/) = *1(0 х2(0 И f[x(t), t] = ~fiïxdt), .. Л •• ., xn(t). „ xn(t), t] (3.165) _fn(*l(O, •• ; Xn(t), /]_ /г-мерную функцию ф (/), определенную на подынтервале (/ь /2) из (ТГ Т2), называют решением системы, если а) ф (/) непрерывна на (/ь /2),‘ 'МО б) ф (0 = -ЫО- есть элемент из Ап для всех t из (fb Z2); 1 Данное определение может быть более общим, но этого не требуется для настоя¬ щей книги. 2 А X (7\, Т2) можно рассматривать как подмножество (открытое) из Rn+i- 109
в) ip (Z) — f [ip (Z), для всех t из (/,, /2), за исключением, возможно, счетного подмножества А элементов из (/1( /2), т. е. Фі(О = fi hMO. ф2(0, •••. MUO. Л; іЫО = f2№(0. ^(0 яиО. Л; (3.166) 'МЛ = /пН’і(О. ф2(Л. •••, Ч>»(0. Л- Системы п дифференциальных уравнений первого порядка будут все время встречаться в основных разделах книги. Они описывают широкий класс физических систем. Решения таких систем соответствуют функциям преобразования R (или интервала из /?) в Rn и могут пониматься как траектории в пространстве Rn. Часто мы будем исключать t из описания этих траекторий, т. е. записывать уравнения траекторий только через переменные xz. Пример 3.49. Пусть (хь х2, t) — х2 и f2 (хх, х2, /) = —xlf и f2 непрерывны на Rn X R (=Rn+i) так же, как и производные от них: = 0; = 1; ■ ^2- = —1 их у ох2 ОХг и = 0. Итак, мы имеем систему двух дифференциальных уравнений первого порядка. хх == х2; х2 = —хх Ч Функция ф(0 с компонентами фі (/) = d cos t + с2 sin t\ ф2 (t) = — d sin t 4- c2 cos t; где cx и c2 — постоянные интегрирования, как нетрудно заметить, является решением системы. Если ф (0 есть 2X2 матрица: cos t sin Я — sin t cos Я’ то X (0 = ф (0 — решение системы. Заметим, что ф (0 есть ортогональная матрица (см. пример 2.30) для любого t. Траекториями системы являются окружности на пло¬ скости Хр х2, уравнения которых можно записать в виде хх + х| = + с2. При изучении дифференциальных уравнений, описывающих поведение физических систем, мы обычно отыскиваем решения, удовлетворяющие дополнительным «граничным условиям». Например, уравнение (3.157) можно рассматривать как уравнение, описывающее процесс радиоактив¬ ного распада, где х (t) — количество вещества, оставшееся после t сек. Если X (0) = с — количество вещества в начале процесса, то отыски¬ вается такое решение уравнения (3.157), для которого ф (0) = с. Иначе говоря, решение должно удовлетворять начальному условию ф (0) = с. Определение 3.42. Пусть х (0 = f (х (0, 0 — система п дифферен¬ циальных уравнений первого порядка [см. определение (3.41)], где f определена на множестве Ап X (Tlt Т2), а (х, /0) —точка из Ап X (Тъ Т2). Эту точку назовем начальной точкой, а числа х10, х20, . . хп0, яв¬ ляющиеся компонентами х0, — начальными значениями. Будем называть соотношения (3.167) xz(/o) = *zo, 4 = 1, 2, ..., п начальными условиями. 1 При записи систем уравнений часто будем опускать время t. 110
О решении системы ф (/) говорят, что оно удовлетворяет начальным условиям или является решением задачи с начальными значениями, если ф(/о) = *о, (3.168) т. е. ^(/o)=:xzo, 4 = 1, 2, ..., п. (3.169) В следующем параграфе мы покажем, что при сделанных нами пред¬ положениях решение задачи с заданными начальными условиями суще¬ ствует. Пример 3.50. Рассмотрим систему , 0 ) — начальные условия, т. е. 1 из примера 3.49: = х2; х2 — —%і- Пусть и 0 — начальные значения, тогда Ф(0 = cos t — sin t sin t cos t cos t —sin t есть решение задачи с заданными начальными значениями. Укажем, что имеется п начальных условий и все эти условия должны удовлетворяться в один и тот же «момент времени» /0. В общем случае для того, чтобы полностью определить решение системы п дифференциаль¬ ных уравнений первого порядка, требуется п условий. Будем называть эти условия граничными. Пусть, например, имеем систему х (/) = f [лг (/), Z] с/, определенной на 7?п+1, и требуется найти решение ф (/) такое, чтобы ■фі (G) = Х1О, 1|>2 (/2) = *20 (U = хп0, где tlf t2, . . tn— точки из R и заданы. В этом случае соотношения xt (fz) = xz0 образуют мно¬ жество граничных условий. Пример 3.51. Вновь рассмотрим систему хх = х2\ х2 — —хг из примеров 3.49 и 3.50. Пусть Хі (0) = 1, х2 (л) = 0 — граничные условия. Тогда гр! (/) = cos t, гр2 (t) = = —sin t — решение системы, удовлетворяющее этим условиям. В дальнейшем будем рассматривать системы, зависящие от пара¬ метров: *(0=/[*(0> я, і] (3.170) или, в записи через компоненты, xn(t), «i, U2, ... ит, л (3.171) где f—непрерывная функция на множестве Ап х Вт х (Тъ Т2) [Ап и Впі — открытые подмножества из Rn и Rm соответственно], а частные производные f по компонентам х и и также непрерывны на множестве Ап х Bm х (Т1У Т2), которое рассмат¬ ривается как подмножество из Rn+^m. Систему вида (3.170) будем назы¬ вать системой п дифференциальных уравнений первого порядка, завися¬ щих от параметров иг, . ., ит. Решение такой системы, зависящее от параметра а, удовлетворяет уравнению Ф(Л ")=/[Ф(0> и, а (3.173) Более подробно такие системы рассмотрим в следующем параграфе, а их значение для управления — в гл. 4. Пример 3.52. Рассмотрим систему: хг (/) = х2 (/), х2 (/) = — xr (t) + и, где и — некоторый параметр. Иначе говоря, [xx, х2, и, /] — х2 и f2 [%і, х2, и, 4] = —хѵ + и. 111
Очевидно, что fr и f2 непрерывны и имеют необходимые непрерывные частные производ¬ ные. Векторная функция ф (/, и), заданная уравнением [cos t sin t —sin t cos t о с2 + I (cos т) и di является решением системы. 3.18. ТЕОРЕМА СУЩЕСТВОВАНИЯ И ЕДИНСТВЕННОСТИ Ниже будет показано, что решение задачи с начальными значениями для системы п дифференциальных уравнений первого порядка существует и единственно. Сначала докажем, что система может быть заменена систе¬ мой интегральных уравнений, а затем покажем, как с помощью теоремы 3.2 можно получить желаемый результат. Доказательство теоремы достаточно сложно. Необходимо, чтобы читатель хорошо понял формулировку теоремы, и не очень существенно, если он не усвоит так же хорошо ее доказательство. Теорема 3.14,х. Пусть Ап — открытое множество из Rn и (Т1У Т2) — открытый интервал (который может быть всем R или множеством ( t : t < < Т 2\ и т. д.). Предположим, что 1-1) /і (•*, и, /), f2 (х, и, f) . . .,fn (х, a, t) — непрерывные функ¬ ции, преобразующие Ап х Rm х (Tlf Т2) в R [см. уравнение (2.5)]; 1.2) частные производные dft (х, a, tydxj — непрерывные функции, преобразующие Ап X Rm X (Т„ Т2) в R; 1.3) xQ — элемент из Ап, tQ — элемент из (Tlt Т2); 1.4) и (т) — кусочно-непрерывная функция, преобразующая (Т±, Т2) в Rm. Существует функция ф (/), преобразующая интервал (/г, /2), содер¬ жащий /0, в пространство Rn, с компонентами фі (0, Фз (О, • • •> Фи (О, такая, что 2.1) ф (/) непрерывна на (/ь /2) и ф (/) £ Ап для t из (/ь /2); 2.2) ф (/0) - х0; (3.174) 2.3) ф (/) есть решение системы х(/)=/[х(/)> а(/), /], т. е. Ф/(0 = Ш(0, *(0> И (3.175) для і = 1, 2, . . ., п и всех точек t из (/ь /2), за исключением, возможно, счетного множества А точек t из (/г, /2). Далее, если ср (/) —другая функция, удовлетворяющая условиям 2.1, 2.2 и 2.3 на интервале (sx, s2), содержащем /0 (по условию 2.3), то ф(0 = Ф(0 (3.176) для всех t из (sn s2) n (/n Z2) [см. уравнение (2.3)]; иначе говоря, реше¬ ние единственно. Доказательство. Допустим, мы нашли решение ф (/), такое, что ф (/о) = Xq. Можно утверждать, что t ■ф(/) =-х0 + м(т), T]dT. (3.177) О 1 См. литературу [46], [51], [180] и [196]. 112
Так какф (т) — f [ф (т), и (т), ті везде, за исключением счетного множества точек А из (/ь /2); f непрерывна, а ф и и кусочно-непрерывны х, то их можно интегрировать для получения соотношения (3.177). С другой сто¬ роны, предположим, что ф (/) удовлетворяет уравнению t x(t) = xQ Ч- ^/[х(т), а(т), T]dx, (3.178) Іо т. е., что ф (/) удовлетворяет уравнению (3.177). Тогда ф (/0) = лг0 и ф (/) = f [ф (/), и (t), t] везде, за исключением счетного множества то¬ чек А из (tlf t2). Попытаемся найти решение интегрального уравнения (3.178). Пусть х0 ç Ап и /0 G (Тъ Т2). Так как Ап — открытое множество, существует сфера S (х0, À) с центром в х0, целиком содержащаяся в Ап (см. определение 3.4), и, следовательно, если Х<<Х, замкнутая сфера S (х0, X) целиком содержится в Ап. Аналогично мы можем найти р, >> О, такое, что замкнутый интервал [/0— р, tQ + р] целиком содержится в (Гі, Т2). Другими словами, если ||* —*о||<А, и |/— /0|<р, (3.179) то X g Ап и t ç. (Tlf Т2). Далее, и (т) — кусочно-непрерывная функция на I/o — И, /0 + pl следовательно, существует замкнутая сфера S (0, ѵ) с центром в начале координат пространства Rm, такая, что и (т) принадлежит к S (0, ѵ) для всех т из [/0 — H, to + р]. Заметим, теперь, что множество S (х0, А) X S(0, v) X По — р, + р] замкнуто и огра¬ ничено, если его рассматривать как подмножество из Rn+l+fn, и, следо¬ вательно, компактно (см. § 3.6). Тогда существуют числа М и N такие, что если .V и t удовлетворяют неравенствам (3.179), то ||/[х, /]|| < М (3.180а) и «(/), /]|<?Ѵ (3.1806) для г, / = 1, 2, . . ., п. Выберем р < р, такое, что для некоторого заданного k, 0 <^k <1, удовлетворяется соотношение p<min{A> _L_|. (3.181) Рассмотрим интервал [/0 — р, /0 + РІ и функциональное пространство С (По — р, + р], Rn) всех непрерывных функций, преобразующих этот интервал в Rn с нормой [см. уравнения (3.124) и (3.131)1. Как было показано в § 3.15, (£ (По — р, /0 + pL Rn) является полным. Если X — подмножество из С ([/0 — P, h + pl, Rn\, определенное, как X = {ф : II ф (т) — х0 II < X для любого т из [/0 — P, h + P1} » (3.182) то нетрудно убедиться, что X есть замкнутое1 2 подмножество из Q, (Ио—р, tQ + pl, Rn) и, следовательно, является полным. Пусть теперь Т — преобразование X в себя, заданное соотношением t Т(дб)(/) = х0 +J/[96(t), «(т), т]Л. (3.183) Іо 1 См. замечания в конце § 3.11. 2 fm-+fu Wfm — Xoll^rZ, отсюда ||/_^Хо1|^||/—/ап+//п — Хо||^||/ап — Хо!| + + 11/ — fm\\ С À --h II/ — frn\\, и наше утверждение доказано. 113
Иначе говоря, если ф (т) — непрерывная функция на [/0 —р, /0 + pL изменяющаяся вблизи х0, то Т (ф)—непрерывная функция на[/0—р, ^o+p L величина которой в каждой точке t задается уравнением (3.183). Теперь убедимся, что Т действительно преобразует X в себя. При этом заметим Г(0б)(О — *о|| = j*/[$(T), «(т)т]Л to —/0|тах||/[дб(т), м(т)т]||< < рМ < по уравнению (3.180а); < М = X по уравнению (3.181). (3.184) (3.185/ (3.186) (3.187) Докажем, что Т есть сжатие на X [см. § 3.5 и уравнение (3.12)]. Покажем, что если ф^ и дб2 — элементы из X, то \\Т (фу} - Т (ф2}\\ с k № - #2||, (3.188) где k — заданное число между 0 и 1 [см. уравнение (3.181)]. Пусть t £ Ио — р, t0 + РІ. тогда Т(ф1)(і)-Т(ф2)(і)\\= J [/[^(т), и(т), х]-/[ф2(х), «(т), т]} dx < t < УіІЛбМт), »(т), х\—Лф2(х), и(х), x]||dx < to < |/ — /0| max II/[фг (т), и (т), т] — f (ф2 (т), и (т), т] || < < prfN ||g0! — g62|| < (3.189) (3.190) (3.191) — 0б2|| (3.192) по уравнению (3.181). Переход от неравенства (3.191) к выражению (3.192) требует доказа¬ тельства. Это можно сделать, воспользовавшись уравнениями (3.70а), неравенством Шварца (2.87) и уравнением (3.1806) (см. упражнение 3.15). Так как Т есть сжатие, то, согласно теореме 3.12, существует единствен¬ ная функция ф (/) из X, такая, что (3.193) т. е. t ■ф(/) = лго+ J/ltCO- и(х),х] dx. (3.194) to В силу уравнения (3.178) и рассуждений, приведших к нему, мы видим, что ф (/) — искомое решение на интервале (/0 — р, h + р)- Предположим теперь, что ф и ф— два решения, определенные на интервалах t2) и (sn s2) соответственно. Рассмотрим множество (G, t2) П (sn s2), которое не может быть пустым, поскольку t0 принад¬ лежит к нему. Отметим, что (/ь П ($і, s2) = (max{/1, sj, min{/2 s2}), (3.195) т. e. (fb t2) П (sb s2) является интервалом (mn m2), где/?ц = max {/b sj и m2 = min (/2, s2). Предположим, что т — точка из (т1У т2), такая, что Ф(т)^^(т). (3.196) 1 Из уравнения (3.111). 114
Положим, для определенности, что /0 <Л Если Е — множе¬ ство точек из Ко, т), в которых if = дб, то Е имеет верхнюю границу, а следовательно, и наименьшую верхнюю границу, которую мы обозначим через о х. Определим, принадлежит ли о к Е? Если о g £, то тогда существовал бы открытый интервал при о, (о — е, а + е), содержащийся в Е, поскольку мы можем применить наше доказательство условий 2.1, 2.2 и 2.3 теоремы 3.14 к задаче с t0 = о и х0 = if (а) = ф (о). Но по¬ следнее приведет к тому, что в £ будет содержаться элемент, больший, чем о. Это невозможно. Следовательно, о не принадлежит к £. Однако в £ существует последовательность элементов которая сходится к о, так как о — наименьшая верхняя граница £. Поскольку ф непрерывна, lim ф Çtm) = ф (о) и if (Z) непрерывна, Ііігмф Çtm) = if (о). Но ф (tm) = = if (/m) для всех m, что означает ф (о) = if (о), т. е. о принадлежит к Е. Это противоречие доказывает, что неравенство (3.196) выполняться не может, и завершает доказательство теоремы. Упражнение 3.15. Докажите справедливость перехода от уравнения (3.191) к уравне¬ нию (3.192). Указание: рассмотрите, скажем, [фг (т), и (т), т] — [ф2 (т), и (т), т]. В силу уравнения (3.70а) существует точка гфх (т) + зф2 (т), r+ s= 1, г, 0 в Ап такая, что |fx (s), и (т), т] — fx [gS2 (т), и (т), т]| = |( \гфх (т) + зф2 (т), и (т), т], фг (т) — ф2 (т) )|. Используйте неравенство Шварца (2.87) и уравнения (3.1806) и (3.45). Проиллюстрируем доказательство теоремы, проделав все эти выклад¬ ки на простом примере. Пример 3.53. Пусть А2— все пространство R2 и (7\, Т2) — открытый интервал (0, 1). Выберем f± (хь х2, и, t) — х2 + и и f2 (хъ х2, и, t) = — хг. Если и (/) = ——-—р-, г (t 1 ) то и f2 удовлетворяют условиям 1.1 и 1.2 теоремы 3.14. Пусть х0 — 0 и t0 = началь¬ ные условия. Мы хотим решить систему уравнений вида xi(t) = x2(t) + <(Д ; *г(0=— Xi(t). Если if (/) — решение системы с if ("g") =0’ тогда имеем ■фі (О = Ф2 (0 + z L 1) ; Фг (0 = — Фі (О- Интегрируя, получим t 1 Фі (П = 0 + j f ф2 (т) + T(TL 1) ] dT: *0 t if2 (t) = 0— Jipx (T)dx. to (3.197) (3.198) (3.199) 1 о удовлетворяет условиям: 1) t для всех t из Е и 2) если о' t для всех t из Е, то о' о. 115
Таким образом, мы хотим решить систему интегральных уравнений: t Х1 (t) = J U (T) + T(TLU] Л; t0 k } 1 Хг (0 = — J xi (t) (3.200) dr. Поскольку Т?2 открыто и сфера S (0, 2) содержится в /?2, то для удобства можно при¬ нять Х= 1. Возьмем ц = -т- и отметим, что если -у-], то и (т) = —~—— 4 I 4 ’ 4 J т(т —1) 16 161 т* -X-, ~ô" • Іаким образом, мы рассматриваем О о J принадлежит сфере 5 компактное множество S(0, 1) X z—, -77- X —7-, -г- === У- На этом множе- I 3 3 J 14 41 стве У II/(X, и (t), ОН ]/| + + 2 (~у ) + 1 < 7 и I u(t), /] |^1. Выбрав /? = , будем пытаться найти р^~- , такое, что . ( 1 1 I 1 Р^гтпп Мы можем принять р = и рассматривать пространство ’ ^2) и замкнутое подпространство X этого пространства, определенное как X = { ф : max <Pj| -€R4; (3.201) где Преобразование Т пространства X в себя представляется соотношениями Замечаем, что Т{ф) (/) = гг ? T (Т — 1) J — J Фі (T) dv 5 т _1_ 8 (3.202) (3.203) p=-|-, М =7, Х= 1. О Проверим, является ли Т сжатием, т. е. убедимся, что иг (Л) (0 - т (вб2) (011^4-і:061 - X , Г 3 5 1 любого / из , — L 8 8 J для 116
Имеем t ІіП^іИО — Т(ф2) (Ollsg [ (t), « (т), т] — /[g62 (т), и (т), r];|dT-ç 1/г p I max (T), «(T), T]— /[fi62(T), U (T) T]||^ <:ÿx4z 1 xll^ - - 0(М, (3.204) где p , n2 - - 4, N = 1. O Читателю следует самостоятельно проверить все вычисления. Главным выводом этих рассуждений является то, что существует единственное решение г|? (/) системы (3.200), определенное на интервале Г—, -~1 с гр —0. Можно показать, что L о о J \ 2 / Прокомментируем теорему 3.14 и ее доказательство. Замечание 1. Мы не делали никаких предположений относительно существования или непрерывности частных производных от f. по компо¬ нентам и- вектора и. Это будет очень существенно для гл. 5. Замечание 2. Пространство Rm можно заменить любым его подпро¬ странством, содержащим замыкание (см. определение 3.9) области изме¬ нения и (т). Теорема останется справедливой, если мы несколько ослабим сделанные предположения, заменив повсюду пространство на замы¬ кание области изменения и (т). Это замечание имеет исключительно боль¬ шое значение при рассмотрении задачи управления и ограничений в гл. 4. Замечание 3. Теорема является частным результатом, так как суще¬ ствование и единственность решения обосновываются только для неко¬ торого интервала [а именно, (/п /2)1 около начального времени t0. Если читатель вновь рассмотрит пример 3.48, он оценит значение этого заме¬ чания. В следующем параграфе мы покажем, что общий результат может быть получен для линейных систем (см. теорему 3.15). Замечание 4. Мы сформулировали и доказали теорему в том виде, в каком она нам потребуется в дальнейшем. Однако условие 1.2 является более строгим, чем это необходимо. Действительно, теорему обычно фор¬ мулируют и доказывают, заменив условие 1.2 так называемым усло¬ вием Липшица: Существует постоянная R > 0, обладающая тем свойством, что |І/(х1) и, и, ОН <Ккі — для всех хх, х2 из Ап, и из Rni и t из (Т\, Т2). Незначительное изменение доказательства дает тот же результат, если заменить этим условием усло¬ вие 1.2 (см., например, [25] или [46]). Замечание 5. При формулировке теоремы мы полагали, что Ап — открытое множество и (Т\, Т2) — открытый интервал. Эти предположе¬ ния были сделаны для того, чтобы исключить точки в пространстве и 117
во времени, в которых решение не может быть определено, т. е. исклю¬ чить из рассмотрения так называемые «особые» точки. Если, например, рассмотреть систему dx _ 1 dt X — 2 * то не существует решения, проходящего через точку х = 2. хотя суще¬ ствуют единственные решения, проходящие через точки, неограниченно близкие к X — 2. Аналогично отсутствует решение уравнения примера (3.48) в точке t = 0, т. е. для уравнения dx __ 1 ~dt " ~Г' Теорему 3.14 мы будем очень часто использовать в дальнейшем. 3.19. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ. ОСНОВНЫЕ ПОЛОЖЕНИЯ Рассмотрим специальный класс систем дифференциальных уравне¬ ний — так называемые линейные системы. Эти системы имеют большое значение, поскольку они очень часто используются для представления динамического поведения физических систем, встречающихся в инженер¬ ной практике. Для систем такого типа можно получить точное аналити¬ ческое решение, что в высшей степени способствует успеху общего подхода к практическим задачам. Определим понятие термина «линейная система». Определение 3.43. Пусть Ап — открытое множество из Rn и (Тъ Т2) — открытый интервал (который может быть всем 7? или множеством {/:/>» > 7\) и т. д.) Пусть ѵ (t) — кусочно-непрерывная функция из (Т\, Т2) в Rn и A (t) — непрерывная функция из (Тъ Т2) в множество 9ÏÏ (п, п) всех п X п матриц (сравнить с окончанием § 3.14). Тогда система урав¬ нений х(/) = Л (/)*(/) 4 v(t) (3.206) или эквивалентная ей система уравнений п х, (0 = 2 (3.207) /=1 где і — 1, 2, . . ., п и А (/) = \аі} (/)] (ai] (t) — элементы матрицы A (t)) и Vx (/), v2 (/), . . ., vn (/) — компоненты v (/), называется линейной системой с вынуждающей функцией ѵ (/). Систему ^(0 = 2 «о (0^/(0 (3.208) /=1 или эквивалентную ей x(t) = Л (/)*(/) (3.209) часто называют однородной (гомогенной, свободной, без входного воз¬ действия) частью линейной системы. Если Л (/) — матрица, состоящая из постоянных элементов, т. е. Л (/) = А = (aif) для любого t из (Tlf Т2), (3.210) то говорят, что такая система является системой с постоянными парамет¬ рами (инвариантная по времени или система с постоянными коэффициен¬ тами). В противном случае система называется системой с переменными параметрами. 118
Пример 3.54. Пусть А (Z) = Л — диагональная матрица с различными тами Хх, 2с2, . . ., кп вдоль диагонали. Тогда система элемен- (3.211) *1 (/) Х2 (t) — Хі 0 0 . , Х2 . , . . 0 “ . . 0 X, (0 х2 (0 хп (0 _ 0 0 . . • _ Хп (t) есть однородная линейная система с постоянными параметрами. Эту систему можно запи¬ сать в векторной форме =Лх(О (3.212) или в виде хі (/) = Х/х/ (/), і = 1, 2, . . п. (3.213) Из этого последнего уравнения легко заключить, что векторная функция ф (/) с ком- понентами ф, (г) = ае 1 есть решение этого уравнения: ф (0) = г, где с — вектор с компонентами сг, с2, . . ., сп. Обратимся к формулировке и доказательству теоремы существования и единственности (теорема 3.14) для линейной системы. Наиболее сущест¬ венным является то, что решение линейной системы оказывается опреде¬ ленным везде, где определена система [т. е. решение ф(/) теоремы 3. 14 определено на всем интервале (Тх, Т2)]. Теорема 3.15. Пусть (7\, Т2) — открытый интервал и Л (/) — непре¬ рывная функция, преобразующая интервал (Т Т2) в множество п X п матриц 9ïï(n, ri). Предположим, что v (t) —кусочно-непрерывная функ¬ ция, преобразующая (7\, Т2) в Rn, и что х0 6 Rn, tQ С (Tx, T2). Сущест¬ вует функция ф (/), преобразующая весь интервал1 (Тх, в Rn с ком¬ понентами фх (/), ф2 (/), . . ., фп(0 со свойствами: 1) ф (/) непрерывна; 2) ф (/о) X о, 3) ф (0 — решение линейной системы x (t) = А (/) х (t) + г>(/), т. е. ф(/) = А (ОФ (0 + *>(/); (3.215) 4) Ф(0 —единственное решение: любая функция, удовлетворяющая условиям 1, 2 и 3, совпадает с ф (/). Доказательство. Если положить/(х, ѵ, f) = А (/) х + ѵ, то очевидно, что / удовлетворяет предположениям теоремы 3.14. Таким образом, можно найти единственное решение уравнения (3.215) на некотором подынтер¬ вале (/х, /2), содержащем /0, из (7\, Мы хотим показать, что (/х, t2) может быть принят равным всему интервалу (Тх, Т2). Условие 4 тогда окажется следствием теоремы 3.14. Примем, что д5°(/)= для t из [sx, s2]; (3.216) Функция ф^ (/) — непрерывная, т. е. ф° (О Е G ( [sx, s2 ], Rn). Определим по¬ следовательность элементов ф (t) множества G([sx, s2], Rn), положив t $'(t) = x0+ J (Л(т)бб'-1 (t) -h ü(T)} dx, / = 1,2, ... (3.217) 10 1 Это главное отличие от результата теоремы 3.14, справедливого лишь на участке интервала (Тх, Т2). 119
Последовательность ф1 сходится равномерно (см. определение 3.11) в этом пространстве по отношению к норме, определенной соотношением (3.124). Положив это утверждение справедливым, обнаруживаем, что в пространстве (Е ((sx, s2], Rn) должен существовать элемент ф, к кото¬ рому сходится последовательность фі [поскольку £ ([s15 s2], Rn) является полным, см. §3. 15). Но тогда ф (/0) = и последовательность t х0 + J {Л (т)# (т) + г»(т)} Л = фі+1 (t) сходится к t х„ + J [Л (т)дб(т) + г>(т)) dr t о (см. упражнение 3.16). Следовательно, для t из [st, s2] t ФУ) =х0+ J (Л(т)дб(т) -I- г»(т)} dr (3.218) <0 и ф есть решение уравнения (3.215) на этом интервале. Таким образом, остается доказать, что ф1 — равномерно сходящаяся последовательность. Для t из [sj, s2] имеем II# (0 — #(0|| = J (Л (т)х0 + ѵ(т)) dr К где М — постоянное число. Далее t ||#(/)-#(/)|Н J (Л (т) {ф' (т)—#(т)]) t0 t ^Nn2 f M |t — Zo| dr < ^0 > —/O|A1, (3.219) (3.220) (3.221) где W — число, такое, что \аи- (/)| < N для t из [sb s2]. По индукции можно показать, что І!#+1 — #ІІ < М l"Wy-si)]' . (3.222) Напомним, что оо M[n2iV(s2 — Sx)]' __ (s2-s,) /! /=0 (3.223) и, следовательно, последовательность ф' сходится равномерно, так как V—1 И#+ѵ _ ф1 С ln<V(.sp.s,)]^ + ;! (3.224) Таким образом, теорема доказана. Упражнение 3.16. Покажите, что последовательность (/) сходится к t х0 + J {А (т) ф (т) + V (т)} dr. 120
Указание: Фі+' (О - t х0 + j" (4 (T)fl6 (т) + <o (т) ) dx ; и j |4 (т)[д6' (т) —g6(T)]) t,. Il sg|Z —Z0|Ata2||fl6' — A где УѴ — то же число, что и в уравнении (3.221). В § 3.17—3.19 мы обозначали решение системы дифференциальных уравнений символом ф (/). В дальнейшем часто не будем делать различия между решением системы и ее переменными. Иначе говоря, будем писать х (t) вместо ф (/) для обозначения решения системы х — f(xt и, t), (3.225) с того, 3.20. ФУНДАМЕНТАЛЬНАЯ МАТРИЦА Используем теорему 3.15 для того, чтобы получить «полное» решение задачи с начальными условиями для линейных систем. Начнем этой системы (3.226) где \ различны. Мы видели, что решение ляется соотношением X (/) при X (0) = с опреде- х(/) = eAtc, (3.227) где eAt обозначает диагонали: диагональную матрицу с элементами ечі вдоль (3.228) 0 0 ... № Предположим, что мы хотим найти решение уравнения (3.226), удов¬ летворяющее начальному условию х(/о)^аго- Нетрудно видеть, что оно выражается соотношением x(/):=eA(^o)xo= (3.229) = eAt-e~A^xQ. (3.230) Иначе говоря, как только определена матрица eAt\ легко найти полное решение задачи с начальными условиями. Таким образом, матрица eAt является поистине фундаментальной для решения задачи с началь¬ ными условиями. Цель настоящего параграфа: 1. Показать, что с каждой линейной системой ассоциируется матрица вполне определенного вида. 2. Изучить свойства этих матриц. Предположим теперь, что (7\, Т2) — открытый интервал, А (/) — непрерывная функция, преобразующая этот интервал в множество п X п 121
матриц 9Л (п, п) и V (/) — кусочно-непрерывная функция, преобразующая (Tlf Т2) в Rn, Рассмотрим линейную систему л;(/) = 2««/(0х;(0 + ч(0. * = 1. 2 п, (3.231) /=1 где А (0 = (аі} (/)). Эту систему можно записать в векторной форме в виде лг(/) = А (t)x(t) + *>(/). (3.232) Предположим, что tQ — элемент из (7\, 7\). Сформулируем следую¬ щую теорему: Теорема 3.16. Пусть — множество всех решений однородной части уравнения (3.232) [см. определение 3.43 и уравнение (3.209)1, т. е. урав¬ нения х (t) = A (t)x(t). Иначе говоря, = {х(0* x(t) — A(t)x(t) для t из (7\, Т2)]. (3.233) Тогда S? есть n-мерное векторное пространство, базис которого (х1(/), х2(/), . . ., xn(t)] можно получить, если принять х1 (t) за единственный вектор, удовлетворяющий условию X1(t0) = eh (3.234) где е2і ..., еп]'— натуральный базис1 в Rn. Доказательство. Очевидно, что функция х (/) = 0 для любого t при¬ надлежит к Эта функция называется тривиальным решением. Далее, если г и s принадлежат к R, а х (t) и у (/) принадлежат к то [rx(0 + sy(/)] = rx(t) 4- sÿ(t) = = rA(t)x(t) + sA(t)y(t) = A(t)[rx(t) + sy(/)], (3.235) так что и rx (/) + sy (t) принадлежит к ©Л Предлагаем читателю самостоятельно проверить аксиомы 1—8 § 2.5 для S?, Покажем теперь, что (/) образуют базис в (см. §2.6). Предпо¬ ложим, что для любого t из (7\, Т2) п 2 с,х‘(/) = 0, (3.236) тогда z=i S CiX^to) = 2 = °> (3.237) /=1 i=\ что возможно только, если все с£ = 0. Иначе говоря, х1 (/) —линейно независимые функции. Если х (t)—любой элемент из то х (to) можно записать как линейную комбинацию eif т. е. x(t0) = 2 (3.238) 4 = 1 1 Напомним, что = 1 ■ 0 0 1 , • . еп=- 0 0 0 _0_ _1 _ 122
Докажем, что п x(t) = 2 для t из (Л> Т'іУ (3.239) Функция принадлежит к»У и совпадает с х (t) при t = /0, т. е. 2 ₽<■*' (^о) = х (/#)• Из той части теоремы 3.15, в которой доказывается единственность реше¬ ния, следует, что п x(t) = 2 Это и обосновывает утверждение (3.239). Определение 3.44. Фундаментальная матрица. Пусть Ф (/, tQ) есть п X п матрица, /-й столбец которой —вектор х1' (t) из причем (/0) = = 6j. Иначе говоря, столбцы Ф (/, /0)—решения однородной системы урав¬ нений (3.232), удовлетворяющие начальным условиям х1' (/0) цу Ф (/, /0) называют фундаментальной или переходной стемы (3.232): = е}-. Матри- матрицей си- Ф(Мо) = Х(о *î(o • • • x"(t) x'2(t) x22(t) ... x2"(/) (3.240) _4(0 Xn(t) • • • Xnn(t)_ где (/) — г-я компонента /-го вектора xj (/). Отметим, что Ф(^0, /о) = ‘1 о 0 ... 0’ 1 ... 0 (3.241) 0 ... 1_ уравнение (2.55)]. _0 где / есть единичная матрица [см. Мы видим, что Ф (/, /0), по сути дела, является функцией, преобра¬ зующей (7\, Т2) в множество всех іг X п матриц. Эта функция Ф (/, /0) дифференцируема (т. е. каждый коэффициент Ф (/, /0) есть дифференцируемая функция по t) и -^-Ф(/,/0) = Ф(/, /0) = Л(/)Ф(/, /«)• Для доказательства этого заметим, что элемент, стоящий в і-й строке и j-м столбце Ф (/, to), есть х- (t). Так как х} (/) есть решение однородной части нашей системы, имеем xi(t) = 2 aik(t)x'k(t), k=l где А (0 = (aik (/)). Но правая часть уравнения (3.243) в точности равна элементу і-й строки и /-го столбца произведения А (t) Ф (/, /0) [см. урав¬ нение (2.33) ], и, следовательно, справедливость уравнения (3.242) дока¬ зана. Это означает, что фундаментальную матрицу Ф (t,tQ) можно рас¬ сматривать как (единственное) решение матричного дифференциального уравнения, понимая под переменной X (t) п X п матрицу: *(/)= Л (/)*(/), (3.242) (3.243) (3.244) 123
которая удовлетворяет начальному условию Х(/о) = /. (3.245) Далее, если х0 — элемент из Rn, то можно обнаружить, что реше¬ ние x(t) однородной части уравнения (3.232), удовлетворяющее началь¬ ному условию x(t0) = х0, записывается в виде х(/) = Ф(/, tQ)xQ. (3.246) Покажем теперь, что матрица Ф (/, /0) — невырожденная для любого t (см. § 2.9). Есть несколько способов сделать это. Например, предположим, что Ф (/, Zo) — вырожденная матрица для некоторого t из (Тх, Т2). Тогда детерминант Ф (/, Zo), det Ф (/, Го), будет равен 0 и столбцы х1 (/) матрицы Ф (/, Zo) окажутся линейно зависимыми, т. е. 2М'(П=о- (3.247) /=1 где не все (37 = 0. Но функция п 2 М'(0 /=1 есть элемент множества всех решений [см. уравнение (3.233)]. Иначе говоря, мы имеем решение, равное нулю при t. Из единственности реше¬ ний следует, что это решение должно быть тривиальным, т. е. Р/Х'(0 = 0 Для любого t из (7\, Т2). (3.248) /=і Это противоречит тому, что х! (/) —линейно независимые функции. Следовательно, Ф(/, /0) — невырожденная для любого t из (Т1, Т2). (3.249) Попытаемся найти матрицу, обратную Ф(/, /0)- Покажем сначала, что Ф(?, /1)Ф(/1, Г0) = Ф(Л Л>) (3.250) для любых /, С и /0 из (Тъ Т2). Это свойство называется переходным свойством матрицы Ф (/, /0). Пусть х0 — элемент из Rn. Известно, что x(t) = Ф (/, t0)x0 (3.251) есть единственное решение однородной части уравнения (3.232) с x(t0) = = xQ. Следовательно, х(/1)-Ф(/1, /о)хо (3.252) и х(?) = Ф(/, /о)-*го. (3.253) Если положить хг = x^t]), то единственное решение xA(f) однород¬ ной части уравнения (3.232) с x1(f) = x1 определяется формулой Х!(/) = Ф(/, і^х^ (3.254) Из единственности следует, что х(7)-xjî), (3.255) откуда получим Ф(Л /о)АТо = Ф(С ^і)Ф(/і, Л))-Ко (3.256) 124
(рис. 3.29). Уравнение (3.256) выполняется для любого х0 из Rn, что и доказывает справедливость уравнения (3.250). Так как Ф(/о, U = Л то уравнение (3.250) означает, что матрица, обратная к Ф (/, t0), есть Ф (/0, t) т. е. Ф~’(/, /0) = Ф(/0, /). (3.257) Имея в виду это свойство, можно написать полное решение задачи с на¬ чальными условиями для системы (3.232). Для решения системы уравнений (3.232) напишем формулу Рис. 3.29. Переходное свойство фундаментальной матрицы х(/) = Ф(/, /o)Uo + t 1 4- J Ф- 1 (т, /0) ѵ (т)Л = (3.258) Іо J {f 'j х0 -I- j Ф(/о, т)©(т)гіт|. (3.259) to J Так как [ 1 х(/0) = Ф(/0, /0) х0 + /ф-Цт, /0) ®(т)Л = (3.260) I to / = lx0 = xQ, (3.261) то начальное условие удовлетворяется. Проверим теперь, обращается ли в тождество выражение (3.232) при подстановке в него x(t). Имеем {і і xQ + J ф-1 (т, /0) ѵ (т) гіт + Іо х0 + |ф-*(т, /0)г»(т)Л = G Xo + j Ф-1 (т, /о)0(т)й(т +Ф(Л /0)Ф-1(Л = (3.262) = А (i)x(t) + v(t) [из уравнения (3.242)]. (3.263)1 Итак, X (t) есть решение уравнения (3.232), которое можно записать в виде суммы двух членов t Ф(/, t0)xQ и Ф(/, /0) Ф-1(т, /0)г!(т)гіт. (3.264) Іо Первый член представляет собой решение однородного уравнения, а второй зависит от вынуждающей функции. Обратимся теперь к примерам. Пример 3.55. Рассмотрим систему вида Гхдоі Г 0 g (01 Г-ч (01 (01 ;2(о]~1-£<о о Jb2(oJ + k(oJ’ (3-265) где g (0 и ѵі (t) кусочно-непрерывны. Попытаемся найти решение этой системы, удовлетво¬ ряющее начальному условию X (0) = л, (3.266) 1 Уравнение справедливо для t из (Тг, Т2) — A, А — счетное множество точек. 125
где л — заданный элемент из /?2. Однородная система записывается в виде ч (О = g(0*2 (*); I х2 (0 =— g (t}xY (/). j (3.267) Если принять, что X1 (/) и х2 (0 равны: t t cos J g (t) dx sin J g (t) dx х1 (О = 0 t ; x2(/) = 0 t — sin J g(T) dx cos J g (t) dx 0 0 (3.268) то легко убедиться, что х1 (/) и х2 (/) являются решениями системы (3.267), причем х1 (0) = ег и X2 (0) = е2. Примем Ф(С 0) = t t COS J g (T) dx sin J g (t) dx о о t t — sin J g (t) dx cos J g (t) dx о 0 тогда искомое решение уравнения (3.265) будет выражаться формулой X (0 = Ф (t, 0) < л (т, ' ) Ф (т) dx (3.269) (3.270) Упражнение 3.17. Рассматривая систему примера 3.55, необходимо показать, что а) Ф (0, 0) = /; Г 0 g(01 ‘’‘■’•"-Lw « г“-№ в) Ф-1 (/, 0) = Ф (0, /); г) эвклидова норма Ф (/, 0) л та же, что и эвклидова норма л (см. § 2.13). Свойство г) устанавливает, что Ф (/, 0) есть ортогональная матрица (см. § 2.14). Пример 3.56. Имеем Векторные функции линейно независимы, но х1 (0) и х2 (0)—линейно зависимые элементы /?2. Следовательно, ф (t) не может быть фундаментальной матрицей линейной системы. Пример 3.57. Рассмотрим однородную систему À (О х2 (/) ГО 1 [о t (3.271) Легко видеть, что фундаментальная матрица системы имеет вид Ф(*> /о) = *о т2 е 2 е2 dx to t2 f0 t2 2 e2 (3.272) 0 126
Решение х (t) системы при х (/0) = л = 1 к*^2. определяется формулой X(t) =Ф(/, /0) л = (3.273) Упражнение 3.18. Проверьте уравнение (3.250) для матрицы Ф (/, t0) (3.272). Предполагая, что /0 = 0, обозначим фундаментальную матрицу си¬ стемы через Ф (/) вместо Ф (/, 0). Это замечание важно, в частности, для последующих параграфов. СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 3.21. ЭКСПОНЕНТА ОТ At Обратимся к частному, но очень важному классу систем, а именно: к системам с постоянными параметрами. Рассмотрим системы вида х(/) = Лх(/) + і!(а (3.274) где А = (аи) — постоянная матрица, называемая матрицей системы (см. определение 3.43). Система из примера 3.54 является системой с постоянными парамет¬ рами с матрицей Л. Для начала введем некоторые определения, полезные для обсуждения такого рода систем. Определение 3.44а. Если дана линейная система с уравнением вида (3.274), то будем называть собственные значения матрицы системы А (см. § 2.10) собственными значениями системы и говорить, что фунда¬ ментальная матрица Ф (/) есть экспонента от At. Вместо Ф (/) будем запи¬ сывать eAt, т. е. <&(t) = eAt (3.275) (сравните с примером 3.54). Для любой матрицы В размера п X п экспонента от Bt, eBt опре¬ делена, поскольку это есть фундаментальная матрица однородной системы вида *(/) = Bx(t\ (3.276) Поясним, почему мы использовали термин «экспонента от Л/», и тем самым установим свойства eAt. Во-первых, из уравнения (3.241) следует, что ф(О) = ело = /. (3.277) Во-вторых, из уравнения (3.242) имеем eAt = АеА, (3.278) В-третьих, уравнение (3.250) принимает вид eA(î'-ti)eAti ^eAÏ^ (3.279) и поэтому еА (r+s) — eAr-eAs. (3.280) Наконец, решение уравнения (3.274), удовлетворяющее начальным условиям х(0) = |, (3.281) 127
определяется формулой t X (t) = eAt^ + eAt J e~~Axv (?) du - (3.282a) о = eAtl + Je-4 <(-T>t>(T)rfr. (3.2826) 0 Покажем теперь, что A и eAt обладают свойством коммутативности и что мы можем рассматривать eAt как сумму бесконечного ряда матриц. Предположим, ѵ — произвольный элемент из /?п. Покажем, что как AeAtvt так и eAt Аѵ являются решениями системы x(t) = Ax(t), (3.283) удовлетворяющими начальному условию х(0) = Аѵ. (3.284) Очевидно, АеАоѵ =- А/ѵ = Av (3.285) и еЛ0Лг> = /Аѵ = Av, (3.286) так как и АеАІѵ, и eAtAv удовлетворяют уравнению (3.284). С помощью уравнения (3.278) находим -±-(AeAtv) = A-^r(eAt)v = A(AeAlv) (3.287) и -^-(еАІАѵ) = -^-(eAt)Av = A(eAIAv). (3.288) Из единственности решения уравнения (3.283) следует, что для лю¬ бого t AeAtv - eAtAv. (3.289) Но поскольку V — просто элемент из 7?п, А и eAt обладают свойст¬ вом коммутативности, т. е. AeAt = eAtA для любого t. (3.290)1 Далее эвристически покажем, что eAt можно рассматривать как бес¬ конечный ряд 2 l + At + Æ-J- + ••• +^7Т+ (3.291) или в более компактной форме записи °° k (3-292> k=0 1 (ÂeAt —eAtA)v= 0 для любого ѵ из Rn, см. также замечание в конце § 2.7. 2 Если определить норму матрицы Д, положив ||Д || = max {| аг/- |; i, j — 1, 2, . . .,. . . п}, то можно показать, что ряд (3.291) сходится при таком нормировании для любого t, и его можно почленно дифференцировать. Опираясь на это, можно строго доказать спра¬ ведливость уравнения (3.292). Заметим, что в общем случае элементы eAt не являются функциями е ч . 128
При t = 0 ряд превращается в /+ ЛО + А2-Х + = /. (3.293) Если почленно продифференцировать ряд (3.292), то получится соот¬ ношение d I V Ak V л* dt I / 2- £•' dt A'- P ! <3.294) (3.295) Это означает, что ряд удовлетворяет дифференциальному уравнению вида X(t) = AX(t), (3.29Ô) где X (/) — переменная матрица размера п X п. оо Еслиіі — произвольный элемент из Rn, тоеА(ѵ и У -p-ü являются k=^ решениями уравнения (3.283), удовлетворяющими начальному условию X (0) = ѵ, и, следовательно, уравнение (3.292) справедливо. Предположим, что В есть п X п матрица, подобная А 1см урав¬ нение (2.64)1, т. е. существует невырожденная матрица Р, удовлетворяю¬ щая условию В ^-Р АР. (3.297) Покажем, что eBi =P~eAtP. (3.298) г Пусть снова ѵ — произвольный элемент из Rn. Рассмотрим функ¬ ции еВІѵ и Р-хеАІРѵ. Покажем, что обе эти функции являются реше¬ ниями системы x(f) = Bx(t), (3.299) удовлетворяющими начальному условию х (0) = ѵ, откуда и будет сле¬ довать справедливость уравнения (3.298). Очевидно, eBtv удовлетворяет уравнению (3.299) и условию х (0) = ѵ. Имеем P~'eAQPv = Р ЧРѵ = Р-'Рѵ = Іѵ = ѵ (3.300) и -^-(P-'eAlP)v = Р-'= (3.301) = P~'AeAtPv = (3.302) = Р-'А (РР ' ) eAtPv = (3.303) = PlAPP-'eAtPv = (3.304) = B(P-'eAlPv). (3.305) Таким образом, P~xeAtPv удовлетворяет уравнению (3.299) и усло¬ вию X (0) = V. Следовательно, если А и В — подобные матрицы, то eAt и eBt также являются подобными матрицами. 5 Атанс и др. 129
Пример 3.58. Пусть А есть 2X2 матрица Г1 Я [о о]’ Легко видеть, что А2 = А, и, сле¬ довательно, еЛ(=/Ц-А +-J- + •..)=/ + (?- 1)А = Заметим, что еАІ значительно отличается от матрицы 1 1 которая получается, если элементы матрицы А заменить экспонентами от них. 3.22. СВЕДЕНИЕ К КАНОНИЧЕСКОЙ ФОРМЕ Рассмотрим задачу с начальными условиями х(/) = Лх(/); х(0) = І (3.306) Решение этой задачи может быть представлено в виде функции x(t) = eAtl (3.307) и связано с собственными значениями системы (или с собственными зна¬ чениями матрицы Л) х. Прежде всего рассмотрим влияние преобразования подобия [см. уравнение (2.62а) и уравнение (2.626)], а затем рассмотрим случай, когда собственными значениями являются различные действи¬ тельные числа. Предположим, что преобразование пространства Rn в себя задано как $-і(г>) = p-'v, (3.308) где P — невырожденная п X п матрица [см. уравнение (2.50)]. Можно определить преобразование SJS-"1 векторного пространства всех /?п-мерных функций на /?, положив Ф“Чх(/)] =Р-1х(/). (3.309) Обычно будем писать у(/) = $-і[х(/)] -P~W). (3.310) Нетрудно видеть, что у(/) =р-іх(/), (3.311) и, следовательно, уравнение (3.306) преобразуется в уравнение у(/)=р-іЛх(/)= (3.312) = P~xAPP~xx(t) = P-'APy (/) (3.313) с начальными условиями у (0) = Р-Чг(0) = Р-'І. (3.314) Если В — матрица, заданная как В = Р-'АР, (3.315) то В подобна Л, и мы имеем y(t) = By(ty, у(0) = Р-1|. (3.316) Решением задачи с начальными условиями для уравнения (3.316), согласно уравнению (3.262а), является y(t) =eBtP-'l. (3.317) 1 См. определение 3.44 и § 2.10. 130
Следовательно, x(Z) = Py(t) = Рев'Р-'1. (3.318) В силу уравнения (2.74) собственные значения систем (3.306) и (3.316) одинаковы. Предположим, что собственные значения А действительны и различны. Обозначим их через Х2, . . а через Л — матрицу собственных значений [см. уравнение (2.78)], т. е. "Л 0 ... 0“ 0 Х2 ... 0 _0 0 (3.319) Из § 2.10 известно, что существует невырожденная матрица Р такая, что Л = РАР~\ (3.320) Из уравнения (3.318) следует, что решение уравнения (3.306) дается соотношением х(0 (3.321) = р 0 ... 0 “ ... 0 (3.322) 0 e^2t Из выражения (3.317) _ 0 0 следует, что урав нение (3.316) записывается как у (/) = = е^2І т]2 (3.323). где т) = P~'ï = пГ 1 (3.324) e^ntn У ’!«_ Таким образом, мы связали решение нашей задачи с собственными значениями матрицы А. В более общем случае, предполагая, что собственные значения А — действительные числа, и обозначив через J = J(4) (3.325) жорданову каноническую форму от А [см. уравнение (2.80)], укажем на существование невырожденной матрицы Р, для которой J == Р~ХАР, (3.326) откуда, воспользовавшись преобразованием подобия (3.309), можно полу¬ чить х(0 в виде х(/) = Р^Р-1|. Можно показать, что если 70 0 ... 0" о Л ... о J — _о о ... Jp_ (3.327) (3.328) 131
где "X, 0 ... О" О Â2 ... о (3.329) 0 0... >.к_ h+m 1 о j-k+in (3 330) где /. j, X о. • . ., . . 1 ^k+m К+р — собственные значения А, то ~e,J- 0 . . . О " О e'J< ... О _ 0 0 . . . eIJp_ (3.331) В последней матрице приняты следующие обозначения: (3.332) и е и о о о о etJm — e,Kk-nn о ... о 1 ... о о . . о . . Л"-2 01 ( • • • (Ѵт - 2)! ООО 1 (3.333) где Jm есть матрица размера vnl X ѵт [46]. Здесь мы снова связали решение рассматриваемой задачи с собствен¬ ными значениями матрицы А. Если ввести в рассмотрение вынуждающую функцию ѵ (/), т. е. рас¬ сматривать задачу x(t) = Лх(/) + х(0) - I, (3.334) то легко видеть, что использование преобразования подобия y(/)-P’1x(/) (3.335) приводит к задаче У (/) = /н АРу (/) + Р'ѵ (/), у (0) - Р-1|. Положив В = Р ^АР, получим решение уравнения (3.336) у (/) = еВІ Р-Ч + J и g—Вт Р а решение х (/) уравнения (3.334) X (/) = PeBt t P*1! + е~Вх Р~1<о (т) dT й (3.336) (3.337) (3.338) 132
В частности, если собственные значения Х2, . . ., —действи¬ тельные различные числа и Л — матрица собственных значений [см. урав¬ нения (2.78) и (3.319)1, то t x(t) = PeAI + P J <'-*> Р~г<о (т) гіт. (3.339) О В дальнейшем мы будем часто пользоваться этой формулой и преоб¬ разованием подобия [см. уравнение (3.335)1. 3.23. ВЫЧИСЛЕНИЕ ФУНДАМЕНТАЛЬНОЙ МАТРИЦЫ С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА Покажем, как с помощью преобразования Лапласа можно получить фундаментальную матрицу линейной системы с постоянными параметрами. При этом предполагаем, что читатель знаком с преобразованием Лапласа и его основными свойствами. Если X (t) — действительная функция «времени», то обозначим через X (s) преобразование Лапласа от х (t) и запишем x(s) - S [%(/)]. (3.340) Если задано х (s), то для отыскания х (t) можно воспользоваться обратным преобразованием Лапласа и записать x(/)-£-1[x(s)]. (3.341) Имеются подробные таблицы, позволяющие найти обратное преобра¬ зование Лапласа. Основное свойство преобразования Лапласа, необхо¬ димое для наших целей, формулируется следующим образом: если задана дифференцируемая функция х (t) с х (0) = t, то преобразование Лапласа от производной X (/) этой функции X (/) дается соотношением £[%(/)] = s£ [%(/)] (3.342) - sx(s) — g. (3.343) Пример 3.59. Если к (t) — eat, то х (s) = С [еа<1 = -у-!— и £ [х (/)] — sx (s) — 1 — s — a s — a Предположим, что х (t) есть я-мерная функция «времени» (т. е. /?) с компонентами х± (t), х2 (/), . . ., хп (/). Преобразование Лапласа отх (/) можно определить как /г-мерный вектор, компоненты которого являются преобразованиями Лапласа от компонент х (t), и написать х($) = £[х(/)], (3.344) считая, что компоненты х; (s) вектора х (s) равны %,•($)=-- £[xz(/)|, Z = 1, 2, . . ., и. (3.345) Если X (/) дифференцируема и х (0) = то £[х(/)1 = s£[x(/)] — I- (3.346) = sx(s) —|. (3.347) Если, наконец, С (t) есть п X т матрица с элементами Сц (/), то пре¬ образование Лапласа С (s) от матрицы С (/) можно определить как п X т матрицу, элементы которой cii (s) являются преобразованиями Лапласа от clf (t). Запишем C(s) = g[C(/)l, (3.348) 133
где Пример 3.60. Найдем преобразования заданных как c17(s) = 2[со(01. Лапласа от (3.349) вектора x (/) и матрицы С (t), (3.350) Имеем sin t x(0 = C(0 = и e ’ k t e cos О)/ (3.351) (3.352) (3.353) Используем теперь эти понятия для отыскания фундаментальной матрицы системы с постоянными параметрами. Прежде всего рассмотрим задачу с начальными условиями для однородной системы x(t) = Ax(t), x(0) = l. Известно, что ее решение записывается в виде х(0 = eAtl. Определим фундаментальную матрицу eAt. Беря преобразование Лапласа от уравнения (3.354), находим sx (s) — I = 4x(s), (3.354) (3.355) (3.356) откуда sx(s) — Ax(s) = I или эквивалентное выражение (sI-A)x(s) = g. (3.357) Если положить, что (3.358) то можно убедиться, что Q(s) = si — Л, (3.359) (3.360) det Q(s) = 0, тогда и только тогда, когда s = некоторому Xz, где Хь Х2, . . ., Хп —собственные значения матрицы Л, поскольку det Q(s) = det (s/ — Л) = 0 (3.361) тождественно с выражением det (Л — s/) = 0 (3.362) [см. уравнение (2.70)]. Следовательно, Q (s)—невырожденная матрица для всех s =# Хр і = 1, 2, . . ., п. Получим x(s) = Q-1(s)l = (s/-4)-1i (3.363) 1 34
Взяв обратное преобразование Лапласа, найдем x(t) = S"1 [x(s)J = g-1 ((s/ — Л Г1] |. (3.364) Поскольку решение системы единственно, заключаем, что eAt = Sr1 [(si — Л)-1]. (3.365) (si — Л)”1. Таким образом, чтобы найти фундаментальную матрицу eAt, мы должны образовать матрицу si — Л, инвертировать ее и затем найти обратное преобразование Лапласа от Пример 3.61. Дана система с матрицей X, (0 ”01’ Xi (/) . X2 (0 . 6 1 _ *2<f) _ А (3.366) (3.367) s — IT — 6 s — 1]’ det Q (s) = s (s — 1) — 6 = (s — 3) (s 4- 2): 1 Q (s) — si — А = (3.368) (3.369) - (s,3|b + 2) (3.370) S — 1 1 6 S s— 1 и (s — 3) (s 4- 2) 6 (s — 3) (s 4- 2) s (3.371) (s —3) ($ + 2) (s — 3) (s —р 2) cAt =£-i[(s/—Д)-і] = Г 2^4- 3e~~2t 5 еея‘-6е-21 5 e3t - e~~2t 5 3e3t 4-2e“2' 5 (3.372) есть фундаментальная матрица системы (3.366). Пример 3.62. Дана система с матрицей X, (0 - X2 (0 _ (3.373) Имеем Г—2 Л= -3 3' — 2 (3.374) [s 4- 2 — 3 3 s + 2 (3.375) det Q (s) = (s + 2)2 + 9; (3.376) — 2 — 3 31 ГхНП — 2J L л2(0 и Q-i (s) = (sl — АГ1 = s + 2 (s + 2)24-9 — 3 (s + 2)2 + 9 3 (s + 2)2+9 s + 2 (s + 2)2 + 9 (3.377) Следовательно, eAt = [(sZ — АГЧ = е 2t cos 3t е 2t sin 3/ —e~2t sin 3t e~2t cos 3/ (3.378) 135
Обратимся теперь к задаче x(t) = Ax(t) -г v(t); х(0) = I, (3.379) где V (/) — вынуждающая функция. Ранее мы показали, что решение этой задачи х (t) определяется фор¬ мулой t x(t) = еАЧ + еА' J е~Ахѵ (т) ih. (3.380) О Дадим интерпретацию этой формулы, используя преобразование Лап¬ ласа. Вычислим X (/), взяв преобразование Лапласа от обеих частей урав¬ нения (3.379). Сделав это, получим sx(s) —£ = Ах (s) + ü(s), (3.381) откуда (si — A)x(s) = | + v(s). (3.382) Полагая, как и ранее, Q (s) = si — А, найдем x(s) = 4- Q~l(s)v(s). (3.383) Обратное преобразование Лапласа дает X(/) - Ÿ-1 [Q"1 (s)J I + S’1 [Q’1 (s) V(s)]. (3.384) Нам известно, что eAt - S-HQ-^s)]. (3.385) Определим, что представляет собой У"1 [Q-1 (s) v (s)]. Если (t) и f2 (t) —две действительных функции t, причем Й[Л(/)]-A(s) и Й[/2(/)]-/2(s), (3.386) то /i(s)72(s)-£[(A*/2)(/)], (3.387) где (/i*/2) (t) есть свертка и /2, которая записывается в виде (/і*72)(О = —т)/2(т)Л. (3.388) Очевидно, что t 2”IA(s)72(s)] =-(Л*/2)(0 = Ул(/-т)/2(т)4/г. (3.389) и Предлагаем читателю убедиться, что 2’1 IQ’1 (s) V (s)) = J еА <'-*> <о (т) di. (3.390) U Таким образом, под несколько необычным выражением t eAt J е~Ах <и (т) di: о в уравнении (3.380) следует понимать не что иное, как свертку фундамен¬ тальной матрицы с вынуждающей функцией v (t). Упражнение 3.19. Имея в виду результаты, полученные в данном параграфе, рассмотрите задачу отыскания фундаментальной матрицы Ф (/, /0) для однородной системы с переменными параметрами х (t) = A (t) х (/) с помощью преобразования Лапласа. 136
Упражнение 3.20. Найдите матрицу eAt для следующих матриц: 3.24. СИСТЕМА л-го ПОРЯДКА Рассмотрим линейное дифференциальное уравнение n-го порядка с по¬ стоянными коэффициентами, которое мы запишем в виде +•••+«! т + ВД(0 = /(О- (3.391) Используя обозначение D = [см. обозначения (3.53)], можно записать {Dn + an_}Dn~} H h axD 4- aQ\y(t) = f(t). (3.392) Докажем, что такая система эквивалентна линейной системе п урав¬ нений первого порядка, собственные значения которой в точности равны корням полинома хп 4- ^п-іхП 1 ~Ь * * * ~Ь &іх + я0, (3.393) и покажем, как найти матрицу преобразования подобия в случае, когда собственными значениями системы являются различные действительные числа. Предположим, что у (/) — решение уравнения (3.391), и определим /г-мерную функцию х (/), положив хДО = </(/); X2(/) = X1(/) = f/(O; х3(/) = х2(/) = 4У (3.394) где (/) — компоненты х (t). Отсюда имеем А(0-л'2(/); Хп (0 = Я0А'і (/) #1*2 (0 * * * — ап~1Хп (0 4“ /(^)* 137
Эту систему можно записать в векторной форме в виде *і(0 0 1 0 0 0 х2(0 0 0 1 ••• 0 0 Хп-1 (0 0 0 0 0 1 xn(t) — а0 — ÛJ — а2■ • • — ап-2 — ап-і (3.396) или, сокращенно, где А = (3.397) "О 1 0 ... О О “ 00 1 ... о о 0 0 0 0 1 _ ^0 ^1 ^2 ^п-2 «п-1_ (3.398) v(t) = . . (3.399) С другой стороны, если а: (/) — решение уравнения (3.396), то сразу видно, что функция у (/) = %і (/) [первая компонента х (/)] есть решение уравнения (3.391). Таким образом, мы получили линейную систему п урав¬ нений первого порядка, эквивалентную одному уравнению n-го порядка. Покажем теперь, что собственные значения матрицы системы А (3.398) являются корнями полинома хп H- an-±xn 1 -F * * * а,]Х Œq. (3.400) Для того чтобы определить собственные значения Л, мы должны найти детерминант матрицы А — X/ и отыскать X, для которых этот детерми¬ нант равен нулю [см. уравнение (2.71)]. Имеем ~—к 1 0 0 0 “ 0 — X 1 0 0 А —7.1 . (3.401) 0 0 0 — X 1 _-а0 — аі ^2 ■ ■ ап-2 ^п-1 _ 138
Раскрывая по минорам первого столбца, получим det (А — X/) = — X det " —X 1 0 . .. 0 0 “ 0 —X 1 .. . . 0 0 > 0 0 . .. —X 1 — а2 — а;! . ^п-1 _ 1 О — /. 1 ... — X .. . 0" ... о (— а0) det _ О О . .. 1_ По метолу индукции, из уравнения (3.402) найдем det (Л — XI) = (— 1)" {Хп + 4 + atî (3.402) (3.403) где À является собственным значением матрицы А в том и только в том случае, когда X есть корень полинома (3. 400), т. е. 7п + а^Х"-1 н h ûiX 4- «о = 0. (3.404) Пример 3.63. Рассмотрим систему -4^-3^ + «/) _ 1. (3.405) Полагая хА (/) = у (/), х2 (0 — У (0, хз (0 ~ У (0» получим систему “il (О- 0 1 о~ “*1 (0‘ і2 (О — 0 0 1 Хг (0 0 (3.406) _і'з (0_ _-4 0 3. (t). Матрица системы А записывается в виде ’ 0 10’ А = 0 0 1 (3.407) — 4 0 3 Собственными значениями матрицы А являются корни уравнения V - ЗХ2 + 4 = 0. (3.408) Собственные значения равны: X = 2, X — 2, X = —1. Упражнение 3.21. Рассмотрите систему d3y(t) d2y(t) dt* dt2 Найдите эквивалентную ей систему. Какова матрица системы и чему равны ее соб¬ ственные значения? Найдите решение у (t) (см. упражнение 3.20). Предположим теперь, что собственные значения матрицы А (3.398) — действительные и различные числа. Обозначим их через Х2, . . ., и будем считать, что Л — матрица собственных значений [см. уравнение (2.78)], т. е. -X! А = о 0 0 ... 0" х2 ... о о ... Хп_ (3.409) 139
Мы знаем, что существует невырожденная матрица Р такая, что Л = Р'АР. Матрица Р есть матрица Вандермонда относительно X,-: " 1 1 ... 1 “ Ài к2 ... Кп X"-1 X"-1 ... X"-1 (3.410) (3.411)1 Для обоснования этого утверждения покажем, что (3.414) (3.415) поскольку X,, будучи собственным значением А, есть корень уравнения (3.404). Следовательно, АРе^'^Ре, (3.416) и поэтому Р^АРе, = Р~'7.1Ре1 = к1Р1Ре1 = (3.417) Совершенно аналогично можно доказать справедливость уравнения (3.412) для / = 2, 3, . . ., п и, таким образом, обосновать уравнение (3.410). * * * * 1 Укажем, что детерминант матрицы Р равен detP=n(^-M=(*2-*i). .. І >І • • • > (^п ^і) (^з ^г) • ♦ • (^п ^тг-і)» так что P — невырожденная, если все X/ различны. 140
3.25. СОПРЯЖЕННАЯ СИСТЕМА Рассмотрим однородную систему с переменными параметрами х(/) = Л (/)*(/). (3.418) В дальнейшем эта система часто будет рассматриваться вместе со свя¬ занной с ней системой Z /) = —4' (t)z(t). (3.419) где 4'(/)—транспонированная матрица 4(0 [см. уравнение (2.45)]. Система, описываемая уравнением (3.419), называется сопряженной системой к системе (3.418). Решение уравнения (3.418), удовлетворяющее начальному условию х (0) = I, выражается формулой х(/) = Ф(/)|, (3.420) где Ф(/) — фундаментальная матрица уравнения (3.418), а решение урав¬ нения (3.419) с начальным условием z (0) = л имеет вид г(/) = Т(/)л, (3.421) где Т(0—фундаментальная матрица уравнения (3.419). Рассмотрим теперь, как связаны между собой Ф(0 и ЧЧО- Эта связь выражается соотношением Т' (/)Ф(/) I для любого t, (3.422) Во-первых, укажем, что Т'(0)Ф(0)-// = /. (3.423) Во-вторых, если выбрать ѵ — произвольный элемент из Rn и при¬ нять, что Л(/) = Т'(/)Ф(/)я, (3.424) то й(/) = {'Г(/)Ф(/)+ ЧГ'(/)Ф(/)}С!. (3.425) Но из определения фундаментальной матрицы следует, что Т(0 = —4'(ЛМГ(/), Ф(0 = 4(/)Ф(/). (3.426) На основании уравнения (2.48) заключаем, что Т'(/) = —Т'(/)4(О (3.427) и й(/) = (-Т' (/)4 (/)Ф(0 + У' (04 (/)Ф(/)} ѵ = (3.428) 0. (3.429) Так как функция h(t) есть решение задачи с начальными условиями й(0 = 0; й(О) = г>, (3.430) которая также имеет решением g(t)=Iv, нетрудно обнаружить, что Чг'(/)Ф(/)г! = Іѵ, (3.431) и, следовательно, уравнение (3.422) справедливо, так как ѵ — произволь¬ ный элемент из Rn. 141
Непосредственным и важным следствием уравнения (3.422) является (*(0, х(/)) = (Т(/)л, Ф(0§)= (3.432) = ( л, Т'(/)Ф(/)§) = (3.433) = (л, 1), [по уравнению (2.98)], (3.434) где символ (,) обозначает скалярное произведение на Rn [см. уравне¬ ние (2.86)1. Предположим, что рассматриваемая система обладает тем свойством, что ее матрица является кососимметричной [см. уравнение (2.99)]. Такую систему будем называть самосопряженной. Система x(t) = A(t)x(t) (3.435) является самосопряженной, если Д(/) + Д'(/) = 0. (3.436) Заметим, что сопряженной системой для самосопряженной системы является сама система. Следовательно, если Ф (/) — фундаментальная матрица самосопряженной системы, то ф'(/)ф(/) = Д (3.437) так как Ф (/) — фундаментальная матрица сопряженной системы. Иначе говоря, Ф (/) есть ортогональная матрица [см. уравнение (2.109)]. Следо¬ вательно, если положить, что х(/) = Ф(/)| есть решение самосопряженной системы для начального условия х (0) = g, то получим (х(0, лг(О) = (Ф(О^ Ф(0£> = І> (3.438) и, следовательно, II* (ОН = 11111- (3.439) Таким образом, если однородная система является самосопряженной, то эвклидова длина решения x(t) является постоянной величиной, не зависящей от времени. Пример 3.64. Рассмотрим систему с постоянными параметрами х (t) = Ах (t). Сопря¬ женная система есть z (t) = —Az(t). Фундаментальная матрица системы есть eAt, фунда¬ ментальная матрица сопряженной системы e~At. Уравнение (3.422) превращается в (e~~A t)' eAt = I, и, следовательно, е~А 1 — (е~~АІ). Если система самосопряженная, т. е. если А + 4' = 0, то eAt — ортогональная матрица и || eAt^ || = || g || для любого g из Rn. показать, что система х (t) = Ax(t) самосопряженная; вычислить фундаментальную матрицу еАі и убедиться путем прямых Упражнение 3.22. « А t вычислении, что е —ортогональная матрица. Упражнение 3.23. Дифференцируя (х (t), X (t)) и используя выражение (2.103), покажите, что если система х (t) — A (t) х (t) самосопряженная, то || х (/) || = const. Про¬ делайте вычисления для частного случая А (і) = 0 Я t or 3.26. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную однородную систему с постоянными парамет¬ рами вида x(t) = Длг(/), (3.440) где А = (а0) — (постоянная) п X п матрица. 142
Система устойчива, если малые отклонения от положения равновесия [т. е. решения х (/) = 0] остаются малыми при сколь угодно большом увеличении времени /, и система неустойчива, если сколь угодно малые отклонения системы от положения равновесия с ростом времени неогра¬ ниченно возрастают. Более строго условия устойчивости могут быть сфор¬ мулированы следующим определением. Определение 3.45. Система (3.440) устойчива, если эвклидова норма ||х(0|| остается ограниченной при t -> сю для любого решения x(t) системы. Систему называют абсолютно устойчивой в том и только в том случае, если Іігп ||лг(/)|| = 0 (3.441) t~> ОО для любого решения системы x(t). Если система не является устойчивой, т. е. если существует решение х(/) такое, что 1іт||х(/)|| = оо, (3.442) ОО то систему называют неустойчивой. Обозначим собственные значения матрицы А через К /Ht» / = 1, 2, ..., и, (3.443) где все А, и р — действительные числа и / = —1. Следующий критерий связывает устойчивость системы (3.440) с собственными значениями (3.443) матрицы А системы. Критерий устойчивости Ч Система (3.440) устойчива, если 1) < 0 для всех і в случае, когда корни действительные числа (3.444) 2) К < 0 для всех k в случае кратных корней вида К + /^ (3.445) Система (3.440) абсолютно устойчива, если \ <0 для любого і. (3.446) Другими словами, система абсолютно устойчива, если все собственные значения имеют отрицательные действительные части. Система устойчива, когда в числе собственных значений нет ни одного с положительной действительной частью и действительные части всех собственных значе¬ ний с кратностью больше единицы отрицательны. Пример 3.65. Рассмотрим систему X] (I) ~ 0 1 X] (0 _*2(*)J L“a0 —^1JLX2(OJ Собственными значениями системы являются корни уравнения X2 —{— X 4- Яд =0. Система абсолютно устойчива только в том случае, если а0 и ах положительны (а0 •> і> 0, ах 0). Если собственные значения имеют кратность больше единицы, т. е. если а~{ — 4а0, то система будет устойчива лишь тогда, когда она абсолютно устойчива. При aQ = — ах = 0 система неустойчива. Сопряженная система для системы (3.440) имеет вид z(t}= — A'z(t), (3.447) 1 См. литературу [21], [25] и [46]. 143
где А' обозначает транспонированную матрицу А. Если Л — собствен¬ ное значение 4, то det(4 —Ѵ) = 0. (3.448) но det (А - V) = — det (— А + Л/) = — det [(— А') 4- М'], (3.449) поскольку детерминанты исходной и транспонированной матриц одина¬ ковы. Следовательно, — À является собственным значением матрицы — 4', если собственным значением матрицы 4 является число Â. Таким образом, с точки зрения критерия устойчивости сопряжения система неустойчива, когда исходная система абсолютно устойчива. В заключение отметим, что понятие устойчивости рассмотрено нами лишь в том объеме, который необходим для дальнейшего изложения материала.
ГЛАВА 4 ОСНОВНЫЕ ПОЛОЖЕНИЯ 4.1. ВВЕДЕНИЕ В гл. 2 и 3 был дан обзор математических понятий, которые необ¬ ходимы нам для дальнейшего изложения. В этой главе мы используем эти понятия для того, чтобы определить и развить основные положения, на которых будет основываться последующее изложение теории систем оптимального управления. В частности, мы сформулируем определения таких ключевых понятий как «динамическая система» и «задача управ¬ ления». В следующих параграфах мы начнем с рассмотрения некоторых про¬ стых примеров, которые послужат мотивировкой формального определения динамической системы. Существенными элементами этого определения явятся понятия входа, выхода и состояния системы. Рассмотрев основные понятия, связанные с динамическими системами, и связав их с более знакомым понятием передаточной функции, мы опре¬ делим задачу управления и рассмотрим некоторые важные специальные случаи. В заключение главы мы определим и рассмотрим некоторые качествен¬ ные свойства систем управления такие, как достижимость, управляемость и наблюдаемость. Эти качественные свойства играют очень важную роль в теории управления. Большинство определений и их приложений являются ключевыми для дальнейшего изложения. Основные понятия входа, выхода и состояния детально обсуждаются в книге Заде и Дезоера [212]. Понятие дина¬ мической системы рассматривается в работах [111], [113] и [210], а общая формулировка задачи управления обсуждается, например, в работах [23], [51], [89] и [106]. 4.2. ЦЕПОЧКА RL Рассмотрим очень простую 7?А-цепочку (рис. 4.1), чтобы проиллюстри¬ ровать основные понятия, которые мы строго определим в дальнейшем. Условимся называть напряжение и (t) «входом» и обозначим ток через і (/). Предположим, что мы наблюдаем и измеряем напряжение у (/) на сопротивлении 7?, и условимся называть это напряжение «выходом». Известно, что ток і (/) и напряжение и (t) связаны дифференциальным уравнением 4г- + w)=«(о, (4.1) 145
и так как у (t) = Ri{f), соотношение (4.1) можно переписать в виде = (4.2) Каждый инженер знает, что если прикладываемое напряжение ко¬ нечно, то ток, протекающий через индуктивность L, не может измениться мгновенно Ч Имея это в виду, сделаем следующий эксперимент. В течение промежутка времени (О, Т ] приложим ко входу непрерывно изменяющееся напряжение u (t) и предположим, что нам известны у (0) и и (0). Чтобы подчеркнуть, что вход известен на всем полузакрытом интервале (0, Г], Рис. 4.1. В этой цепочке выходом у (t) является падение напряжения на сопротивлении R мы обозначим его через w(o, г]. (4.3) Иначе говоря, u^t Ту есть функция, заданная на (0, Т ] с помощью соотно¬ шения и(о, ті(0= «(О Для из (0, Т]. (4.4) Измерим выход у (t) в течение этого нтервала времени и обозначим через ÿ(0, т] функцию, определенную на (0, 74 с по¬ мощью соотношения ^(о, г](0 = УѴ) Для * из (°- Т]- (4-5) Две величины (^(о, г], У(о, и) (4.6) назовем «парой вход—выход» на интервале (0, Т]. Нам хочется предска¬ зать выходное напряжение у^, т]. Итак, мы столкнулись со следующей задачей: задано и(0, т] и дифференциальное уравнение выхода (4.2). Какая дополнительная информация нужна для того, чтобы полностью определить y(Qt Если положить а = R/L, то уравнение (4.2) принимает вид ÿ(f) + ay(t)= au(t\ (4.7) и его решение можно записать как t y(t) = y(fi)e~at + e~at J eaxau (x) dx. (4.8) о Так как u(o, rj известно, то член t e~~at J eox au (t) du U также известен, и, таким образом, единственная величина, которую мы должны знать, чтобы предсказать г/(0, т], есть у (0), т. е. величина выход¬ ного напряжения при t = 0. Отметим, что знания напряжения на входе и (0) при t — 0 не требуется. Основой этого вывода может служить сле¬ дующее рассуждение. Предположим, что и (0 +) =^= и (0), т. е. что при t — 0 + происходит скачок входного напряжения. Так как ток через индуктивность не может измениться мгновенно, то t(O+) = t(O) (4.9) 1 Будем считать, что не бывает импульсов типа ô (Z), и поэтому и (t) не может быть таким импульсом. 146
и, следовательно, J/(0+) = 4/(0) (4.10) не зависит от и (0). Итак, для цепочки (см. рис. 4.1) знания 4/(0, ту и у (0) достаточно, чтобы полностью определить z/(0, ?]. Если дать тривиальное определение: x(t) = y(ty, t£(Q,T], (4.11) то можно обнаружить, что х (0) — минимальный объем информации, требуемый для того, чтобы определить ÿ(0, Г| по заданному u{Qt Т\- Будем называть х (0) состоянием системы при t = 0 и отметим, что х (t) удовлет¬ воряет дифференциальному уравнению %(/) + ах (/) = au (t). (4.12) Заметим, далее, что если ?есть элемент из (0, Т],т. е.О < ? <• Г, то зна¬ ния X (t) [= у (/)] достаточно для того, чтобы найти выход y(f) на интер¬ вале (/, Т], если задан вход и (/) на этом интервале [см. уравнение (3.250) ]. Итак, X (/) будем называть состоянием (переменным) нашей 7?£-цепочки. Рассмотрим теперь ту же цепочку несколько иначе (рис. 4.2). Пред¬ положим, что мы наблюдаем и измеряем напряжение на индуктивности L, а не на сопротивлении R. Назовем это на- пряжение выходом у (/). Ток i (t) по-преж- | I нему удовлетворяет уравнению (4.1), z | однако выход в этом случае описывается I —J Д | уравнением 4/(0 + Ri (0) J y(x)dx = и (t), 0 (4.13) a(t) 1 у н \y(ti 1 1 так как y(t) = L (4.14) Рис. у W 4.2. В этой цепочке выходом является напряжение на индуктивности L Предположим, что мы прикладываем непрерывный входной сигнал (или «вход») и (t), дифференцируемый на временном интервале (0, Т]. В этом случае уравнение (4.13) можно продифференцировать и получить т + 4^(/) = Т’ z€(0, Л (4.15) или, положив а = R/L, записать У(і) + ау (0 = (4.16) Зная у (0), и (0) и 44(о, т], мы хотели бы предсказать выход 4/(0, rj. Здесь необходимо решить следующую задачу. Пусть известны 44<о, г] и дифференциальное уравнение выхода (4.16). Какая дополнительная информация необходима, чтобы полностью определить 4/(0, г]? Рассматривая цепочку на рис. 4.2 с физической точки зрения, мы видим, что если имеет место скачок на входе при t = 0, т. е. если 44(0 + )^= 4/(0), (4.17) то напряжение у (/) на индуктивности L также должно скачкообразно измениться при t = 0 + от у (0) до у (0+), поскольку ток через L и, сле¬ довательно, напряжение на сопротивлении R не изменяются. Другими словами, тот факт, что ток через L не может измениться мгновенно, озна¬ чает, что (4.18) 147 W) = W+)
и, следовательно, ÿ(0) — u(0) = t/(0+) — u(0+) (4.19) ИЛИ Z/(0+) - */(0) -h u (0+) — w (0). (4.20) Решение уравнения (4.16) на интервале (0, Т] записывается в виде / //(/) = e~aty(0-\-) -F e~at J eaxu (t)û’t. (4.21) o+ и, таким образом, чтобы определить тд, мы должны знать у (0+) или, эквивалентно, обе величины у (0) и и (0). Если теперь определить новую переменную х (/), положив *(0 = y(t)—u(t) (4.22) для t из (0, Г], т. е. приняв за х (I) разность между выходом у (/) и вхо¬ дом и (/), то x(t) = y(t)—u(f), /е.(0, Т]. (4.23) Из уравнений (4.16), (4.22) и (4.23) получаем х(/) 4- ax(t) = —au(t) (4.24) для t из (0, 7]. Так как уравнение (4.22) справедливо для любого t из (0, 7], имеем х(0) = //(0)-«(0); (4.25) x(0+) = //(0+)~u(0+) (4.26) и X (0 4- ) - х (0) = у (0+) - у (0) - и (0+ ) + и (0) = (4.27) = 0 по уравнению (4.20) (4.28) Итак, решение уравнения (4.24) можно записать в виде %(/) = e~atx(0) — ae~at j еахи (т) dx. (4.29) о Следовательно, зная х (0) = у (0) — и (0) и г/(0, т\, можно полностью определить х(о, тц и, таким образом, в силу уравнения (4.22) полностью определить y(Qt Ту Назовем х (0) состоянием при t = 0 и заметим, что если t есть элемент из (0, Г), т. е. 0< t <7, то зная х (/) = у (/) — и (f), можно определить выход у (t) на интервале (/, 7] при заданном входе и (t) на том же интервале. Итак, х (t) назовем переменным состоянием системы. Отметим, что уравнения (4.22) и (4.29) описывают поведение цепочки, приведенной на рис. 4.2. Для системы (см. рис. 4.1), в которой выходом у (f) было напряжение на сопротивлении /?, мы получили уравнения: X (/) + ах (/) = au (/) — уравнение состояния, а = R/L; (4.30) у (t) = X (t) — уравнение выхода, (4.31) описывающие поведение цепочки, такие, что знание х (0) и и(о, п позво¬ ляет определить y{Qt Для системы рис. 4.2, где выходом у (/) было напряжение на индук¬ тивности L, мы получили уравнения: X (t) + ах (t) = —au (t) — уравнение состояния, а = R/L; (4.32) у (t) = X (/) + и (/) — уравнение выхода, (4.33) описывающие поведение этой цепочки. 148
Пример 4.1. Примем L — R — 1 ; а = I; Т = 2 сек; у (0) = —0,5 и (0) =—1; и (ty — е~l' 0<Z^2 Для цепочки (см. рис. 4.1) уравнение (4.30) запишется в виде х (О 4- X (/) == е~~1. (4.34) (4.35) На основании уравнения (4.31) и того, что х (0) = у (0), имеем тогда % (0) — —0,5; X (I) — о,5е~' + іе~( , Рис. 4.3. Выход (у f), состоя¬ ние X (/) и вход и (/) для цепочки, показанной на рис. 4.1 Рис. 4.4. Выход у (ty, со¬ стояние X (/) и вход и (/) для цепочки показанной на рис. 4.2 и с помощью уравнения (4.31) найдем у (ty —0,5<? 1 + te 1. (4,38) Состояние X (/), выход у (/) и вход и (t) показаны на рис. 4.3. Для цепочки (см. рис. 4.2) уравнение (4.32) записывается так: +х (0 =—е_'- (4.39) Так как х (0) — у (0) — и (0) |по уравнению (4.33)], имеем х (0) = —0,5 4- 1 = 4-0,5. (4.40) Решением уравнения (4.39) является X (/) — 0,5e-7—te~f. (4.41) Выход, по уравнению (4.33) равный у (t) — = X (t) 4- и (t), запишем в виде у (ty = 0,5е“f — te~l 4- 1,5е~? — te~l. (4.42) Состояние X (t), выход у (ty и вход и (/) пока¬ заны на рис. 4.4. Упражнение 4.1. Рассмотрите RTC-цепочку, показанную на рис. 4.5. Пусть и (t) обозначает входное напряжение, а у^ (ty, уL (t) и ус (t) обозначают напряжения на сопро¬ тивлении R, индуктивности L и конденсаторе С соответственно. Предполагаем, что дифференцируема. Найти соотношения, связывающие вход и (t) с выходами у^ (/), yL (t) и ус (/). В каждом случае с физической точки зрения определите сигналы, которые надо знать при /=0 для того, чтобы полностью определить выходы у# Z/д (о, г] и ус (0 Гр если задано u(0 Упражнение 4.2. Дана система (дифференцирующее звено) с входом и (t) и выхо¬ дом у (t), связанными соотношением У (О — u(ty. 149
Покажите, что если ы(0> дифференцируема, то полностью определен, если известно и (0). Указание: Систему можно представлять в виде единичной индуктив¬ ности; вход и (t) — ток через нее; выход у (t) — напряжение на индуктивности. 4.3. СИСТЕМА СО МНОГИМИ ПЕРЕМЕННЫМИ Обратимся теперь к системе, показанной на рис. 4.6, которая полу¬ чена путем соединения друг с другом нескольких подсистем (обозначен¬ ных на рис. 4.6 символами Sn S2, S3 и S4). Система имеет два входа ux(t) и и2(/) и два наблюдаемых выхода z/JZ) и y2(t). Вход zzj/) при¬ кладывается к подсистемам Sx и S2, выходы которых равны х4(/) и х2(0 соответственно. Вход и2(/) прикладывается к подсистемам S3 и S4. с выходами х3(/) и х4(/) соответственно. Пусть выходные сигналы z/x(/) и z/2(Z), которые мы измеряем, даются соотношениями Рис. 4.6. Система со многими переменными г/і(/) = х4(/) + х3(/); і/2(/) = х2(/) + х4(/), а выходы xt(t) мы наблюдать не можем. Предположим, что каждую из подсистем Sz (f = 1, 2, 3, 4) можно описать простым линейным урав¬ нением первого порядка. Имеем Sp (/) = «,%,(/) 4-ujZ); (4.44) S2: x2(Z) = a2x2(/)-b Uj(/); (4.45) S3: x3(/) = asxs(t) + «2(/); (4.46) S4: x4(/) = a4x4(/) + u2(Z). (4.47) Исходя из этого предположения и соотношений (4.43) можно заклю¬ чить, что выходные сигналы (y^t и y2(t) связаны с входными сигна¬ лами ur(t) и u2(t) следующими двумя соотношениями: ÿi(0 —(«1 + аз)Л(0 + («1«з)Л(0 = = «4(04 ü2(/) —а3ы1(/) —ajü2(0; (4.48) У2 ( О — (а2 а4) у г (t) -г (а2а4) z/2 ( / ) = = «!(/) + u2(t) — — a2u2(t). (4.49) Определим для удобства входной вектор u(t) и выходной вектор y(t), положив й L«2(0j ’ L2(0j ’ Желая предсказать выход (вектор) у(0, г], мы сталкиваемся со следую¬ щей задачей: известны я(0, т] и дифференциальные уравнения выхода (4.48), (4.49). Какая нужна дополнительная информация для того, чтобы полностью определить у(0, ?]? Из рассмотрения дифференциальных уравнений (4.48) и (4.49) сле¬ дует, что для полного определения у(0, достаточно знать следующие начальные условия: */і(0), ^(0), z/2(0), ^2(0), uJO), z/2(0) (4.51) или, что эквивалентно, У(0), ў(0), «(0). 150
С другой стороны, из блок-схемы рис. 4.6 видно, что зная *і(0), х2(0), х3(0), х4(0), (4.52) можно полностью определить х4 (0, г], х2 <о, т], х3 (о, у] и х4 (о, rj при задан¬ ном Ию, г] (см. § 4.2). В силу уравнений (4.44)—(4.47), т. е. исходя из того, что система представляет собой соединение подсистем S1( S2, S3 и S4, заключаем: для определения уі (0, г] и уг (о, г] при заданном «(о, rj тре¬ буется знать вектор x(t), где *(') = -Хі (/)- *2 (О •*з(0 -х4(/)_ (4.53) Вектор х(0) будем называть состоянием системы при t = 0 и вектор х(0 —состоянием системы в момент времени t. Если x(t) может быть измерен, то выход у»<о, г] можно предсказать. Мы предположили, что x(t} измерить нельзя, и поэтому постараемся установить, можно ли рассчи¬ тать х (t) на основании наблюдаемых сигналов и (/) и y(t). Из уравне¬ ний (4.43) следует, что г/і (0) = М (0) + х3 (0); | у2(0) = х2(0) 4-х4(0). J (4,&4) Продифференцировав (4.43), получим Уі (0) = %і (0) + х3 (0) = а1х1 (0) + а3х3 (0) + щ (0) + и2 (0); Уъ (0) = х2 (0) + х3 (0) = а2х2 (0) + я4х4 0) + и± (0) + и2 (0). Итак, если мы знаем у (0), у (0) и и(0), т. е. те же самые величины, что и в (4.51), то можем найти лг(О) из (4.54) и (4.55). Если различны, то х (0) определяется единственным образом; с другой стороны, если, например, а± = а3, то х(0) не является единственным (см. упражне¬ ние 4.3). Во всяком случае, даже на имея возможности непосредственно измерить X (0, его можно рассчитать по входным и выходным сигналам системы. Упражнение 4.3. Предположим, что все подсистемы S2, S3 и S4 идентичны, т. е. в уравнениях с (4.44) по (4.47) имеем аг = а2 — а3— аі. Требуется показать, что зна¬ ния (0) и у2 (0) достаточно, чтобы при заданных входах определить выходы yt (t) и у2 (/). ДИНАМИЧЕСКИЕ СИСТЕМЫ 4.4. ВВОДНЫЕ ЗАМЕЧАНИЯ Познание физического мира основано на эксперименте и абстракции. Инженер изучает физические системы, имея в виду вполне определенные конкретные цели, тогда как теоретик пытается обнаружить общие законы, управляющие поведением физических систем или описывающие их пове¬ дение, в самом общем виде. Попробуем сначала представить поведение инженера-проектировщика. Нам дана физическая система $ («черный ящик»), и мы можем прикла¬ дывать некоторые входные «сигналы» к ^5 так, чтобы наблюдать и изме¬ рять получившиеся в результате выходные «сигналы». Возможной целью изучения системы является определение входа, такого, чтобы выход обладал некоторыми желаемыми характеристиками, а «стоимость» управ- 151
ления была минимальна. Попытаемся достичь этой цели методом «проб и ошибок», испытывая последовательно различные входы. Такая проце¬ дура может дать искомый ответ. В общем же случае это невозможно. Будем рассматривать наши попытки как эксперименты, которые могут привести к описанию поведения $ и определению, какой «выход» будет наблюдаться при приложении любого «входа». Итак, мы столкнулись с задачей описания $ и отыскания подходящей модели поведения Обычно эту задачу пытаются решить путем разработки математических моделей, которые в форме уравнений связывают выход и вход системы. Вид выбранной модели основывается на результатах экспериментов и на предположениях относительно основных законов, управляющих поведе¬ нием всех физических систем. Эти предположения обычно принимаются за аксиомы, которые дают точное определение теоретических понятий, привлекаемых для построения математической модели поведения физи¬ ческой системы ^3. Как только принята некоторая модель, на ее основе делаются определенные выводы, которые проверяются в ходе дальней¬ ших экспериментов над системой В данной книге мы будем иметь дело с физическими системами поведение которых может быть адекватно описано с помощью математи¬ ческих моделей или динамических систем. В § 4.5 дано аксиоматическое определение динамической системы. Здесь же, имея в виду примеры § 4.2 и 4.3, попробуем эвристически рас¬ смотреть некоторые идеи, которые позволят подойти к этой задаче более строго. Для начала проделаем мысленно следующий эксперимент. В неко¬ торый «начальный момент времени» мы прикладываем входной сигнал к физической системе $ вплоть до некоторого будущего момента времени. В течение этого интервала времени, который назовем интервалом наблю¬ дения, будем наблюдать выход системы ^3. Известно, что полученный выход зависит не только от приложенного входного сигнала, но и от вну¬ треннего состояния системы $ в начальный момент времени. Если считать, что есть точное изображение т. е. системы ^3 и идентичны, то можно сформулировать следующую задачу: если к системам $ и 93х, начиная с одного и того же момента, при¬ ложить одинаковые входные сигналы, то будут ли одинаковыми выход¬ ные сигналы систем и $х? Например, если и — идентичные /?ЛС-цепочки, к которым мы прикладываем один и тот же сигнал (напряжение), начиная с момента /0 до некоторого будущего момента времени то задача, которую мы пы¬ таемся решить, может быть поставлена так: будут ли выходные сигналы (напряжения) одинаковы на всем интервале наблюдения (/0, /J? При этом выходное напряжение будет зависеть как от заряда конденсатора и тока, протекающего через индуктивность при t = /0, так и от входного напря¬ жения. Итак, если заряды конденсаторов и токи в индуктивностях систем $ и ^Зі при t = /0 различны, то прикладывая один и тот же входной сигнал (напряжение) к $ и в интервале (/0, t± ], надо ожидать, что будут наблюдаться различные выходные сигналы (напряжения) в системах $ и ^Зр Таким образом, чтобы предсказывать сигнал на выходе, необходимо знать как входной сигнал, так и условия в системе *>|3. Эти условия пред¬ ставляют собой дополнительную информацию, которой мы можем распо¬ лагать для начального момента времени /0, и называются (начальным) состоянием системы ^3 при t = /0. Теперь попробуем выступить в роли теоретика и попытаемся развить формальный способ описания системы Начнем с того, что введем неко¬ торые обозначения. Символом и обозначим типичную входную функцию 152
времени, а у— соответствующую выходную функцию времени. Если t — некоторый момент времени, то и (/) — значение входа и в момент времени /; (4.56) у (t) — значение выхода у в момент времени t. (4.57) Величины и (t) и у (t) могут быть скалярами или элементами из Rtn и Rtl соответственно (т. е. и (/) — набор т действительных чисел и у (/) — набор п действительных чисел) или значительно более общие параметры. Например, если — устройство для распознавания образов, то вход и (/) в момент времени t может представлять собой двумерное изображение, а выход у (/) — решение, является ли и (t) картинкой, изображающей птицу, самолет или робот. Понятия и определения, приведенные в § 4.5, являются весьма общими, но в дальнейшем будем рассматривать лишь те случаи, когда входные величины представляют собой элементы из Rm, а выходные у (/) — элементы из Rn. Начнем наш эксперимент в момент времени /0 и до некоторого будущего момента времени tr приложим к системе входа. Так как мы наблюдаем и измеряем выход у в течение интервала (/0, /х], то будем называть полу¬ закрытый интервал (/0, /Д интервалом наблюдения. Для удобства обо¬ значим величины и и у на этом интервале через а(/0, /ди yUnt Гд, положив #(0 Для t из (/0, (4.58) Уа0, 5>(0 Для t из (/0, /J. (4.59) Две функции (Я(/о, / д, уцп, /д) назовем парой вход—выход на интервале наблюдения. Попросту говоря, систему можно описать как множество всех таких пар, взятых на всех интервалах наблюдения для всех условий (или состояний) Такой подход соответствует проведению всех возмож¬ ных экспериментов над и он нецелесообразен. Мы можем также счи¬ тать, что $3 устанавливает некоторые соотношения между входом, выходом и состоянием. Поскольку в настоящей книге все внимание сконцентрировано на макроскопических объектах, будем считать все системы полностью детер¬ минированными и полагать, что они подчиняются классическим причинно- следственным законам физики. Иначе говоря, будем полагать: 1. Все величины и функции строго детерминировании. Случайные элементы из рассмотрения исключены. 2. Системы без предсказания, т. е. такие системы, когда текущие зна¬ чения входа, выхода и состояния не зависят от их будущих значений. Пусть — абстрактная математическая модель физической системы Для системы мы должны иметь определенный набор входных времен¬ ных функций а, соответствующий набор выходных временных функций у и набор временных функций состояния х. Мы должны иметь два уравне¬ ния: выхода и состояния, связывающие вход, выход и состояние системы Запишем эти уравнения в виде: у(/) = g [х(/0); »((„, м» Go> Ml — уравнение выхода (4.60) И -*г(/) = jf Глг(/о); (^о, /і]] — уравнение состояния. (4.61) Известно, что выход y(t) в момент времени t зависит от состояния лг(/0) в момент времени /0; входа, прикладываемого на интервале наблю¬ дения (/0, /Д, и самого интервала наблюдения (/0, /Д. Мы знаем также, что воздействие на входе а^0> /д не только влияет на выход у(/0, /д> но и из¬ меняет состояние системы. Результат этого изменения х(0 в момент вре- 153
мени t зависит от начального состояния х(/0) в момент времени при¬ кладываемого на интервале наблюдения, и самого интервала наблюдения Go, Gb Если для нашей модели справедливы сделанные выше предположения и если of является адекватным отображением физической системы то уравнения выхода и состояния системы of должны обладать некоторыми естественными и желательными свойствами. Например, обе функции f и g должны быть детерминированными (т. е. ни одна входящая в них величина пе может быть случайной или содержать случайные элементы) и не должны зависеть от будущих значений входа, выхода или состояния. Функции fug должны быть выбраны так, чтобы модель аппроксимировала ре¬ зультаты наших экспериментов над физической системой Иначе говоря, функции/ и g надо выбрать так, чтобы они соответствовали эксперимен¬ тальным данным. В следующем параграфе мы дадим аксиоматическое определение до¬ вольно общего класса моделей систем, а именно: класса динамических систем. Аксиомы предъявляют определенные требования к входным и вы¬ ходным сигналам, к множеству состояний системы и к функциям f и g. В § 4.6 мы наложим дополнительные ограничения, чтобы выделить тот класс систем, который и будет рассматриваться в основной части книги. Однако прежде чем перейти к формальному определению, в заключитель¬ ной части настоящего параграфа мы укажем на некоторые интуитивные аспекты общих аксиом и класса систем, представляющего наибольший интерес. Первая аксиома предполагает, что если известно начальное состояние в момент времени t0 и к системе на интервале (/0, прикладывается известный вход то выход определяется единственным образом. Вторая аксиома утверждает, что существует «достаточно много» состояний системы, так что любая пара вход—выход может быть использована для расчетов. Вторая аксиома, по сути дела, утверждает, что знания началь¬ ного состояния и входа, прикладываемого на интервале наблюдения, достаточно не только для определения выхода на интервале наблюдения, ь’О и состояния системы в пределах интервала наблюдения. Это очень важно, так как состояние в любой момент времени в некотором смысле суммирует всю прошлую информацию, требующуюся для предсказания будущих выходных сигналов и будущих состояний. Третья аксиома является условием «гладкости», которое гарантирует, что малые изменения входа или начального состояния вызовут соответственно малые изменения выхода и будущего состояния системы. Четвертая (и последняя) аксиома содержит условия, которым должна удовлетворять функция, описывающая изменение состояния системы. Системы, которые мы будем изучать в основной части книги, должны удовлетворять не только четырем аксиомам, но и некоторым дополнитель¬ ным условиям. Предположим, в частности, что состояния системы — эле¬ менты некоторого эвклидова пространства Rn, т. е. n-мерные векторы, или соответственно наборы п действительных чисел. Потребуем далее, чтобы входные величины были элементами эвклидова пространства 7?m, т <. п, а выходные величины — элементами Rp. Будем также считать, что все рассматриваемые величины, являющиеся функциями времени, такие, как входы и выходы, определены на некотором открытом интервале (Tlt Т2), а не в дискретные моменты времени (т. е. будем рассматривать непрерыв¬ ные, а не дискретные по времени системы). Наконец, будем считать, что уравнение состояния представляет собой решение дифференциального уравнения, удовлетворяющее условиям теоремы существования и един¬ ственности (теорема 3.14). 154
4.5. ОПРЕДЕЛЕНИЕ1 Определим в этом параграфе понятие динамической системы формаль¬ ным и довольно общим образом. Хотя мы и будем стремиться дать аксиоматическое определение, оно не будет «слишком» общим. В следующем параграфе мы еще больше сузим это определение, с тем чтобы выделить класс систем, который будет рас¬ сматриваться в дальнейшем. Еще раз отметим, что наше представление о динамической системе базируется на понятиях входа, выхода и состояния. Пусть Т — подмножество всех действительных чисел; 2 — множество с расстоянием d на нем (см. § 3.1); Q — множество с расстоянием d и U — множество кусочно-непрерывных функций на Т со значениями в Q. Обозна¬ чим через X (t) — переменную, определенную на Т со значениями в 2, а через g — функцию преобразования из X X Q X Т (см. § 3.2) в эвкли¬ дово пространство Rp. Если /0 и t — элементы из Т, причем tQ < G то будем записывать (/0, t] для обозначения множества всех элементов Т между /0 и /, т. е. (/о, /] = {т:т^7, /0<т</}. (4.62)2 Символ /] будем использовать для обозначения сегмента (отрезка) функции и из U на множестве (/0, t]. Если t — элемент Т, и— элемент U и X (t) —элемент 2, то g [х (/), и (/), t] есть вполне определенный эле¬ мент из Rp) который будем обозначать через у (/), т. е. y(t) = g[x(t), /]. (4.63) Через yUo, будем обозначать сегмент функции (4.63) на (/0, О и писать У(/о, л = [аг(/о); Щіо, d- (4.64) Сформулируем аксиомы: Аксиома 4.1. Для любых x(tQ) из 2; любых / и /0 из Л’ t to, t£T и любого /], uÇU знание х (to) и u(t0> однозначно определяет y{tQt В частности, если и и ѵ — элементы из U такие, что ^(/о. Л = (4.65) то g[x(/0); u(to. d = ff[x(/0), v{to, d- (4.66) Аксиома 4.2. Если t0 < t<< t — элементы из T, x(tQ)—элемент из 2, a S [x (/0), u, t] — множество всех элементов x (/) из 2, удовлетворяю¬ щих уравнению Лг= = «(? п] (4.67) и к* — заданный элемент из U, то пересечение множеств 2 [х (/0), и, ?], где и — элемент из U такой, что и ~ = и* -, не является пустым, т. е. П 2[х(/0), я, Л ¥=$• (4.68) UÇ.U U Z4 = И* Z4 Go, Г] (t0, t] 1 См. литературу [111], [113] и [210], [212]. Особый интерес представляют гл. 1—4 книги [212]. 2 В этом случае интервал (/0, /] скорее является пересечением полузакрытого интер¬ вала (/0, Z] с множеством Т [см. уравнения (2.3) и (3.7)]. 155
В частности, ни одно множество S |х (/0), Л не является пустым. Эта аксиома утверждает, что существует по крайней мере один элемент из I, являющийся общим для любой пары {и, ~ у ~ Можно показать далее, что из аксиом 4.1 и 4.2 вытекает существо¬ вание функции Ф I/, ф х (/о)] такой, что х(/) = Ф[/, ф х(/о)Ь (4.69)1 2 Аксиома 4.3. Функции g, g и Ф непрерывны относительно всех своих аргументов. Зависимость g и Ф от t. означает, что если и и ѵ — эле¬ менты U такие, у которых расстояние г]. г»|г„, d) = SUP I<i(u(i), ü(t)| (4.70)? т Ç Цо. о П 7 мало, то расстояния *(U11 (4-71) И sup (liilx(/0); Tj]-g[x(zo); г>(Го.Т]]||| (4.72) т G По» П т также малы (здесь g\x(tQ)\ u(to, Го]] = g \x(tQ), tf(/0+), /0| и g\x(tQ)\ v<t„, /о)! 5гІ^(/о); гфо + ), M по определению)3 *. Аксиома 4.4. Функция ф удовлетворяет условиям: а. Для любых /, /0£ T, uQ U и х(/0)С U(t0, ф х(/0)| = = х(/0) в том смысле, что предел gSfZ; ф лг(/0)1 равен х(/0), если / приближается к /0 справа. Это можно записать также как ф [/0; #(г0) ?0], х(/о)Ь б. Для любых tQ < t С t из Т, и Ç U и х (/0) < 2 ф [Л х(^)\^ф\і ф& x(/0)]l, (4.73) где t0 << f c t. Это условие называют переходным. в. Для любых т, /0, / ст из [/0, Л П Т и лг(/0) из S, если и, V Ç U и a(r0, z] = v(t9, ф то дб|т, tfUo,T|. X (/0)1 = ф |т, ѵ(І0, и, (4.74) ДЛЯ любого Т ИЗ |/0, /] П Т. Определение 4.1. Динамическая система еР— сложное понятие, состоящее из множеств 7\ 2, Q и U, переменной х(/) и функции g, удов¬ летворяющих условиям аксиом 4.1, 4.2, 4.3 и 4.4. Т называют областью определения системы, 2 — пространством состояний системы, U—пространством входов системы, лг(/)— состоя¬ нием (или переменной состояния) системы; щіо, и называют входом на ин¬ тервале наблюдения системы, а y(to, rj = g[x(tQ); /] 1 — выходом (соответствующим входу >]) системы, причем (я(/о, Z]; y(to, /]) обра¬ зуют пару вход—выход системы; функцию ф{і\ щіо> q, х (/0)1 называют 1 См. работу [212]. 2 Здесь sup означает наибольшую нижнюю границу множества всех чисел М таких, что d (и (т), V (т)) М для любого т из |г0, /] fl Т. Где du есть расстояние на множестве функций и (t0, /], и из U (см. § 3.15). 3 Напомним, что d — расстояние на Q; d — расстояние на 2 и II II — эвклидова норма на Rp. 156
переходной функцией системы, а подмножество {х (т) : х (т) = ф [т; u{t0, т], X (/0) ] для т из [/0, /] П Т} из пространства состояний ѵ _ траекторией |или движением] системы в течение временного интервала [/0, t] П Т из начального состояния лг(/0), произведенной входом д. Наконец, урав¬ нения (4.64) и (4.69) называют соответственно уравнениями выхода и со¬ стояния системы. /Аксиома 4.1, по сути дела, утверждает, что если известно начальное состояние в момент времени tQ и если приложить известный вход в тече¬ ние (/0, /I, t^> /0, то получится выход, определенный единственным об¬ разом. Сущность этой аксиомы состоит в том, что для предсказания вы¬ хода на (/0, t] в случае, когда известно начальное состояние системы при t = tQ, не требуется знания входа, предшествовавшего /0. При этом доста¬ точно знания лишь состояния в момент /0 и t\- Отметим также, что будущие значения входа не влияют на у^0, д, т. е. система не обладает «предвидением». Аксиома 4.2 утверждает, что существует «достаточно» состояний системы, и поэтому можно выбрать для расчета любую пару вход-выход. Эта аксиома предполагает также, что знания начального состояния х(/0) и управления ііщ, t] достаточно не только для того, чтобы определить выход y(f), tQ t С но и состояние системы в момент времени /, лг(/), /0 < Это наиболее важное свойство, так как оно означает, что состояние в любой момент суммирует всю прошлую информацию, требую¬ щуюся для того, чтобы предсказать будущий выходной сигнал и будущее состояние системы. Аксиома 4.3 представляет собой условие гладкости, гарантирующее, что малые изменения входа или состояния системы вызывают соответст¬ венно малые изменения выхода и движения системы. Аксиома 4.4 перечисляет условия, которым должны удовлетворять изменения состояния системы. В частности, такими требованиями являются: 1. Начальные условия должны соответствовать исходной точке дви¬ жения (напомним, что «движение» обозначает траекторию в пространстве состояний системы). 2. Если вход переводит систему из состояния лг0 в х вдоль некоторой траектории и х — некоторое состояние на этой траектории, то этот вход должен перевести систему х в х. 3. Система не обладает «предвидением», т. е. будущие значения входа не влияют на текущее состояние системы. Эти аксиомы являются обоснованной абстракцией свойств физических систем. Следствия аксиом иллюстрируются с помощью рис. 4.7. На рис. 4.7, а показаны два входа Zt] и Z1], причем ukt, G] иЪ, G] J Пусть x(/0) — состояние при /0; у^.чд — единственный выход, полу¬ чающийся при воздействии на систему входа u\to, гд, и у\ц> h, — при и2^, д ]. Выходы показаны на рис. 4.7, б. Согласно нашей терминологии имеем = u\ta. /.] = g [^(Zo). »(/„ /,]]• 157
Аксиома 4.1 и, в частности, уравнения (4.65) и (4.66) гарантируют, что Уа», Я = УЪ», ?]• Пусть 7— произвольная точка из [/0, /J, тогда аксиома 4.2 и урав¬ нение (4.67) утверждают существование состояний х1 (і) и х2 (7) таких, что =і[*Ѵ). «;г J: У a tl] = è[x-(h J. Если [х1 (?)| и [х2 (/)} обозначают множества состояний х1 (t) и х2 (7), то из уравнения (4.68) следует, что кЧО) П И0174 т. е. существует такое состояние е (хчо) п {*2(< при котором У{?, zj —ë‘[x(F), U(Z zj]’, yû. G] = И*(0> «(G G]]' Рассмотрим простую /?£-цепочку, изображенную рис. 4.1. Пусть Т — множество всех действительных чисел, У — действительные числа о) б) Рис. 4.7. Два входа и1 и а2, производящие выходы у1 и у2 с обычным расстоянием, Q = 2 и [/ — множество кусочно-непрерывных функций, преобразующих множество Q в множество 2. Наконец, пусть g — функция, заданная как g (г, s, t) = r, (4.75) где г, s и t — действительные числа. Поскольку g не зависит от s и /, вместо (4.75) для удобства запишем g(r) = r. (4.76) Если и — элемент из U и х0 — элемент из 2, то получаем х(/) = e~atxQ + e~at J cuXu(x)dx, (4.77) и где а = Иначе говоря, t <р(і; «(о, t], х0) = e~atxü + e~at Jеа' u(x)dx. (4.78) и 158
Примем также, что y(t) = g[x(t)] = x(t). (4.79) Таким образом, мы определим динамическую систему с пространством состояний 2 (действительные числа), выходом у (t) и уравнениями состоя¬ ния и выхода: х(/) = ф(/; х(0)) = е~а/х(0) + e~at J eaxu(x)dx о — уравнение состояния; і/(0 = *(0 — уравнение выхода. (4.80) Если нам известны х (0) и u^t q, то мы знаем х (t) и, следовательно, из уравнения (4.80), у (/). По теореме 3.14, х (t) и у (t) определяются пол¬ ностью. Что касается аксиомы 4.2, то элемент ? x(t) = е~^х(О) + е~а~ J eaxu*(y)(h о является пересечением всех множеств 2 (0), tCM- уравне¬ ние (3.259)1. Предоставим читателю проверить самостоятельно аксиомы 4.3 и 4.4. Упражнение 4.4. Проверьте аксиому 4.4 для /?Д-цепочки. Упражнение 4.5. Рассмотрите ÆL-цепочку (см. рис. 4.2) и определите динамическую систему, представляющую эту цепочку. Убедитесь в справедливости аксиом. У к а за ние: Функция g задается как g (г, s, t) = г + s, а функция ф в виде t Ф(/; и(0> z]x0) =e~atx0— ае~а‘\eaTu(t)dr. Ü При этом уравнения выхода и состояния можно записать: у (t) = X (t) + и (t) — уравнение выхода; t X (t) = e~atxQ — ae~at J eaxu (t) du — уравнение состояния, и Теорема 3.8 используется для проверки аксиомы 4.3. 4.6. ДИНАМИЧЕСКИЕ СИСТЕМЫ, РАССМАТРИВАЕМЫЕ В ДАННОЙ КНИГЕ Системы, рассматриваемые в данной книге, являются не только дина¬ мическими системами в смысле определения 4.1, но и удовлетворяют некоторым дополнительным условиям. Мы будем рассматривать только конечно-мерные непрерывные системы. Определение 4.2. Динамическую систему еР называют конечно-мерной: 1) если пространством состояний 2 системы является эвклидово про¬ странство Rn, т. е. 2 = 2) если множество значений входа Q есть эвклидово пространство Rm, т < п, т. е. Q = Rm. В этом случае число п, являющееся размерностью 2, называют порядком (или размерностью) динамической системы. Колеблющаяся струна и полый резонатор (акустический или электро¬ магнитный) являются примерами систем, которые не являются конечно¬ мерными. Будем далее под термином «динамическая система» понимать конечно-мерную динамическую систему. Отметим, что состояниями си- 159
стемы являются /г-мерные векторы х, а входами системы — m-мерные век¬ торы и (/), причем т < п (4.81) Определение 4.3. Говорят, что система оР непрерывна (по времени), если множество Т представляет собой открытый интервал (Tlt Т2\ который может быть равен всему R. Интервал (7\, Т2) часто называют областью существования или интервалом определения системы. Импульсные систе¬ мы являются примером обширного класса систем, не являющихся не¬ прерывными. Определение 4.4. Динамическую систему называют дифферен¬ циальной, если уравнения состояния и выхода системы имеют вид *(/) = $[/; «(!„. Ф х('о)] (4.82) где ф есть решение системы дифференциальных уравнений x(t) = f\x(t\ /], (4.83) где лг(/0) — начальная точка, f удовлетворяет условиям теоремы 3.14, и y(t) = g[x(t), /], (4.84) гДе g — непрерывная функция всех своих аргументов. Мы часто будем ссылаться на уравнения (4.83) и (4.84) как на уравнения системы и на¬ зывать уравнение (4.83) уравнением состояния. Далее, говоря «динамическая система» или просто «система», мы будем подразумевать «конечно-мерную непрерывную дифференциальную си¬ стему». В заключение отметим, что в книге под термином «динамическая система» мы будем понимать сложное понятие, состоящее из открытого интервала (Тъ Т2), который может представлять собой все 7?, множества U кусочно-непрерывных функций преобразования этого интервала в Rni, непрерывной функции/, преобразующей пространство Rn X Rfn х (Ті, Т2) в Rn, и непрерывной функции g, преобразующей пространство Rn X X Rm X (7\, Т2) в Rp, удовлетворяющих условиям: 4.1. Для любых х{} из Rn, tQ и t из (T Т2), t tQ и всех u(t(l, из U существует единственное решение х (т) векторного дифференциального уравнения: х(т) = /[х(т), и(т), т], (4.85) определенное на интервале [/0, /] \ причем x(tQ)^x0. (4.86) Уравнение состояния -*(/) - ф({, d; х0) (4.87) представляет собой это решение. 4.2. ф является непрерывной функцией всех своих аргументов, удовлетворяющей условиям: а) л:й = дб(/0; «(г„. п; л0); (4.88) б) ф(1\ ZJ; х0) = $(/; и(і, п; $(t\ х0)) (4.89) для любого t из [/0, /]; в) Если и = V на (/0, /], то для любого т из [/0, t] «(Го, Т|; хо) = 0б(т; ■»(/„. т]; х0)\ (4.90) 4.3. Если определить выход у(/), положив = ё{ф(т\ х0), «(т), т], (4.91) 1 В действительности это означает, что существует решение на некотором открытом интервале, содержащем [/0, /]. 160
то Уа0. zi однозначно определяется заданием xQ = лг(/0) и ііщ, ф Если /0 < t < t и X (t) = ф (/, ііщ, ф х0), то У(1, п однозначно определяется через X (t) и а <7, ф Мы будем изучать вполне определенный класс динамических линей¬ ных систем. В заключение настоящего параграфа кратко обсудим понятие эквивалентности, которое будет нам полезно в дальнейшем, и рассмотрим некоторые примеры динамических систем. Напомним, что под мы понимаем «модель» некоторой физической системы «Движение» есть внутреннее движение системы и является геометрическим в том смысле, что оно не зависит от способа, которым мы его описываем. Траектории динамической системы («модели») можно рассматривать как кривые в пространстве Rtlt а выход у можно представ¬ лять себе как функцию точек этих кривых. Другими словами, траектории и выход системы являются геометрическими объектами, координаты которых удовлетворяют уравнениям системы. Состояние системы х (/) представляет собой вектор ѵ в Rn с координатами (/), х2 (/), . . ., хп (/) по отношению к натуральному базису еъ е2, .. -, еп пространства Rn (см. § 2.6) \ Если Р — невырожденная матрица размера п X п [см. урав¬ нение (2.59)], то z (t) = Plx (t) можно рассматривать как представление вектора ѵ по отношению к базису Ре1У Ре2 • • Рвп из Rn- Следовательно, если рассматривать динамическую систему о/9', описываемую уравнениями z(t) = P~\f[Pz(t\ /]; (4.92) Я0 = g [Pz(t), u(t), /], (4.93) то траектории и выход системы будут теми же самыми, что и для системы S?. Последнее обстоятельство приводит к следующему определению. Определение 4.5.2 Две динамические системы S? й&' называют экви¬ валентными, если существует невырожденная матрица Р размера п X п из постоянных элементов, такая, что Р’1х(/) = г(/), (4.94) где x(t) — переменная состояния системы о? uz(f) — переменная состоя¬ ния системы <^'. Это понятие эквивалентности будет полезно, в частности, при изуче¬ нии линейных систем (см. § 4.7). Пример 4.2. Пусть (Тѵ Т2)— все R и U — множество всех кусочно-непрерывных функций из R в R, а f — непрерывная функция преобразования R2 X R X Я в R2, задан¬ ная как (4.95) (4.96) 1 Напомним, что — 2 Такое понятие эквивалентности не является наиболее общим, но оно соответствует нашим целям. 6 Атанс и др. 161
и g — непрерывная функция, преобразующая /?2 X R X R в R, заданная как Рассмотрим векторное дифференциальное уравнение: X (т) = /[х(т), и (х), т] = (4.97) (4.98) (4.99) (4.100) Известно (см. пример 3.51), что это уравнение имеет единственное решение: /0)х0 + Ф(/, /о) f Ф(^о, т)[* «7 I U t0 где Ф (/, /0) — матрица: Ф(і, t0) = причем и (т) di, 2 *о т2 2 е 2 di X (/0) — -^о- Запишем выражение (4.101) в виде ( р Г 1 1 1 jc(f)=fl6(f; u(Zo, л; х0)=Ф((. (o)Uo + j Ф(<о. т) I J«(T)drk V Іо ) (4.101) (4.102) (4.103) (4.104) 0 е _ Jo_ е 2 е 2 Из свойств фундаментальной матрицы Ф (/, /0) (см. §3.19) видно, что функция ф (t; U(to х0) удовлетворяет условию 4.2. Далее, так как однозначно опреде¬ ляется величинами х0 и то, очевидно, условие 4.3дакже удовлетворяется. Что ка¬ сается условия 4.1, то оно является следствием теоремы 3.14. Итак, мы определили дина¬ мическую систему второго порядка с помощью уравнений: состояния ГО 11 Г 1 1 x(t) = [о t\ х (0 + [о Jw(Oî (4.105) выхода у(0=[1 0]х(0+0а(0. (4.106) 4.7. ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ Грубо говоря, динамическая система линейна, если линейны уравне¬ ния системы. Можно дать более строгое определение. Определение 4.6. Динамическую систему называют линейной динами¬ ческой системой (или просто линейной системой), если векторное диффе¬ ренциальное уравнение для состояния системы дг (0 есть линейное диф¬ ференциальное уравнение (см. § 3.19) и если выход y(t) есть линейная функция от X (/) и и (/). Уравнения линейной системы имеют вид х(/) = А (/)*(/) + B(t) и (0; (4.107а) y(t) = С(/)х(/) + D(0«(0, (4.1076) где Л (/) — п X п матрица-функция; В (/) — п X т матрица-функция; С (/) — р X п матрица-функция и D (t) — р X т матрица-функция. Все эти матрицы являются функциями времени t. 162
Если приведенные матрицы являются постоянными, то имеем систему с постоянными параметрами, а в противном случае — систему с перемен¬ ными параметрами (сравните с определением 3.43). 7?£-цепочки (см. рис. 4.1 и 4.2) и пример 4.2 представляют собой линейные системы. Для нас особый интерес будут представлять системы, уравнения которых имеют вид л(/) = Л(/)х(о + ^(/)«(О; 1 (4108) y(t) = Cx(t). J В этом случае мы часто будем называть уравнение x(t) = A (t)x(t) + B(t)u(t) (4.109) уравнением системы или просто системой. Если рассматривается линейная система с уравнениями (4.107а) и (4.1076), то уравнения состояния и выхода системы можно записать через фундаментальную матрицу Ф (/, /0) уравнения (4.107а) в виде {t 1 Хо + Уф-1(т, to)B(x)tl(T:)dx ; (4.110) to j у(/)= И((о, (]•- Хо)+ = = С(і)Ф(і, /0) Хо Ф-’(т—/0)^(T)»(T)dT + (4.111) В частности, для линейной системы с постоянными параметрами А (/) = А, В (t) = В, С (/) = С, D (/) = D, имеем {t 1 х0 + J Д»(т)б/тг; (4.112) to J {t ï х0 4- J е~А <*-'») Я«(т) Л 4- Du(t). (4.113) to J Заметим, что свойства переходной функции ф (t; xQ) [см. урав¬ нения с (4.88) по (4.90) ] непосредственно вытекают из свойств фундамен¬ тальной матрицы (см. § 3.20), и наоборот. Отметим также, что понятие эквивалентности (см. определение 4.5) для линейных систем соответствует использованию преобразования подобия (§ 3.22). С другой стороны, если мы применяем преобразование подобия к линейной системе то получаем эквивалентную линейную систему . Наоборот, если линейная система эквивалентна линейной системе^ в смысле определения 4.5, то уравнения^' получены из уравне¬ ний с помощью преобразования подобия. Это означает, что преобразова¬ ние подобия изменяет уравнения системы, но не меняет геометрических свойств движения системы. В частности, если Р — невырожденная п X п матрица [см. уравнение (2.59)] и если Z (t) = P~~^x(t), (4.114) то система с переменной состояния z (/), эквивалентная системе (4.107а) и (4.1076), описывается уравнениями 2(0 =Р“1Л(/)Рг(/) + Р-1В(/)«(/); (4.115) у(0 = С(/)Рг(0 + Л(0«(0- (4.116) Эти положения мы часто будем использовать в дальнейшем. * 163
4.8. СВЯЗЬ МЕЖДУ ВХОДОМ И ВЫХОДОМ СИСТЕМЫ. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ 1 До сих пор мы имели дело преимущественно с основными положе¬ ниями, связанными с абстрактным понятием динамической системы. Посмотрим, как связаны данные положения с передаточной функцией системы, которая, по-видимому, является тем понятием, с которым инже¬ нер, занимающийся управлением, знаком лучше всего, поскольку оно уста¬ навливает связь между входом и выходом линейной системы. Ниже будет показана связь соотношения входа и выхода с ее передаточной функцией, а в следующих двух параграфах — получение описания процесса в виде динамической системы на основе передаточной функции. Одной из наиболее сложных проблем, с которой сталкивается инже¬ нер, является проблема адекватного математического описания данного физического процесса или системы. Если процесс так же прост, как в цепочке § 4.2, то уравнения, описывающие процесс, получаются непосред¬ ственно. Однако в общем случае это невозможно, и хорошее математиче¬ ское описание процесса можно получить только в результате большого количества экспериментов. Обычно экспериментатор прикладывает из¬ вестные входные сигналы и наблюдает получающиеся выходные сигналы. В результате таких экспериментов и априорных теоретических знаний получаются соотношения, связывающие доступные для наблюдения выходные сигналы и допустимые входные сигналы системы. Например, метод частотных характеристик и реакция системы на скачок входного сигнала широко применяются для получения передаточных функций линейных систем с постоянными параметрами. Довольно часто результатом экспериментов над системой с одним входом и одним выходом является линейное дифференциальное уравнение, связывающее ее выход у (t) со входом и (/) в виде {Dn + an_J)n~x••• -I- ахГ> -I а0} y(f) -_=bou(t), (4.117) где символ D обозначает дифференцирование по времени. Если система адекватно описывается дифференциальным уравнением (4.117), то в теории регулирования обычно гцворят, что система имеет передаточ¬ ную функцию G(s) = = 777 7 7— ’ <4-118> и (s) sn 4- Пп-iS 1 + • • • + Û1S 4- а0 где у (s) — преобразование Лапласа от выхода у (t) и и (s) — преобразо¬ вание Лапласа от входа и (t). Так как передаточная функция G (s) (4.118) не имеет конечных нулей, то говорят, что она содержит только полюса. Полюсами G (s) являются корни полинома, стоящего в знаменателе: sn + an_1sn~l 4- F- axs 4- а0. (4.119) Часто уравнение, связывающее выход у (/) со входом и (t) для системы с одним входом и одним выходом, имеет вид {7)п 4- ап-і^п 1 + • • • Ч~ aiD 4~ Яо} у{і) = = {bmDm + bm_1Dtn~x + ... ^blD + bQ\u (0. (4.120) Такая система имеет передаточную функцию fg- = bmSn+ ' ï + éll+ 60 ’ (4.121) w s 4- + •• • 4- 4~ 1 Cm. [34], [36] и [212] (гл. 9). 164
где у (s) — преобразование Лапласа от у (/) и и (s) — преобразование Лапласа от и (t). Передаточная функция H (s) содержит как нули, так и полюса. Нули H (s) являются корнями полинома числителя bmsm — -I- • • • -I- bts + b0, (4.122) a полюсами H (s), как и прежде, корни полинома знаменателя H (s). Предположим, что рассматриваемая система имеет п выходных сигна¬ лов уг (/), г/2 (0, • • -, Уп, (О И т входных сигналов (/), и2 (/), . . . . . ., ит (/). Такую систему часто называют системой со многими перемен¬ ными. Если мы начнем экспериментировать с такой системой (линейной с постоянными параметрами), то получим набор соотношений между вхо¬ дами и выходами вида £4 (D) У1 (t) = (О) и. (/) + $12 (D) и2 (/)+••• + (D) ит (0; e2 (D) y2(t) = $21 (D) и. (О + $22 (D) и2 (/) 4- • • • + {D) иМ (4.123) дифференциальных которого являются ^n(D)yn(t) = ^nl(D)u1(t)^^n2(D)u2(t)-i ... + где (D) и (D), і = 1, 2, . . ., n; j = 1, 2, . . ., m — линейные диф¬ ференциальные операторы с постоянными коэффициентами. Для системы со многими переменными, описываемой набором ‘ ' уравнений (4.123), можно определить передаточную матрицу следующим образом. Пусть у (/) — выходной вектор, компонентами Уі (t), У2 (0» - - •> Уп (О и и (t) — входной вектор с компонентами иг (/), и2 (t), . . ., ит (/). Если преобразование Лапласа от у (t) и #(/) обозна¬ чить через у (s) и и (s) соответственно, то п X т матрица G (s) называется передаточной матрицей системы, если y(s)-G(s)a(s). (4.124) Пример 4.3. Рассмотрим систему со многими переменными из § 4.3. Передаточная матрица этой системы равна 1 1 G (s) = s — аг 1 s — a3 1 (4.125) s — a2 s — a4 J Наконец, в заключение параграфа мы хотели бы указать, что задача получения адекватных соотношений между входом и выходом на основе эксперимента особенно сложна как для нелинейных систем, так и для линейных систем с переменными параметрами. Необходимо подчеркнуть, что в процессе эксперимента получаются соотношения (обычно в виде набора дифференциальных уравнений) между сигналами, прикладывае¬ мыми ко входам и наблюдаемыми на выходах. 4.9. ОТЫСКАНИЕ ПРЕДСТАВЛЕНИЯ В ПРОСТРАНСТВЕ СОСТОЯНИЙ (ИЛИ В ФОРМЕ ДИНАМИЧЕСКОЙ СИСТЕМЫ) ОБЪЕКТА, ПЕРЕДАТОЧНАЯ ФУНКЦИЯ КОТОРОГО СОДЕРЖИТ ТОЛЬКО ПОЛЮСА Инженер, работающий в области управления, хорошо знаком с систе¬ мами, которые имеют один вход и один выход и описываются линейными дифференциальными уравнениями с постоянными коэффициентами я-го порядка вида [Dn + • • • + atD + а01 У{і) = bQu(t), (4.126) 165
где у (t) — (скалярный) выход и и (t) — (скалярный) вход. В предыдущем параграфе мы видели, что такая система имеет передаточную функцию G (s) = -Ц4- • (4-127) V ’ “(s) s" + an.is"-14 F^s + ao Если мы обозначим через sb s2, . . ., sn корни (в общем случае ком¬ плексные) многочлена в знаменателе sn + ^n-isn~x + • • • 4- 4- а0, (4.128) то sz будут полюсами G (s), и мы имеем право написать G (s) = -, п -, г. (4.129) ѵ 7 (s — Si) (s — s2) ... (s — sn) v 7 В этом параграфе мы найдем представление системы (4.126) в про¬ странстве состояний (или в форме динамической системы) и попытаемся показать физический смысл понятия состояния системы. Так как нам надо знать п начальных условий у (0), у (0), . . у(п-ѵ (0) для того, чтобы получить решение дифференциального уравнения (4.126), то можно догадаться, что такое состояние системы. Имея это в виду, по образцу § 3.24 определим п переменных (/), z2 (О, • • -, zn по' ложив zi(0 = y(0; za(0 = i/(0; zn(t) = y^(t). Из (4.130) заключаем, что Zi(0 = z2(/); 22(0 = z3(0; (4.131) a из уравнения (4.126) z„(0 = Dny(t) = —aoy(t) - а1У(і) ап_іУ{п^ (/) - bou (t). (4.132) Следовательно, Zn(0 = ~aoZi(/) —адД/) — Wn(0 (4.133) откуда вытекает, что если мы определили zi по соотношениям (4.130), то zi удовлетворяют системе п линейных дифференциальных уравнений, которые можно записать в матричной форме как "*і(0 ” 0 1 0 .. .. 0 "о“ г2(0 0 0 1 .. .. 0 МО 0 • • = • • + и(і). (4.134) *п-1(0 0 0 0 . .. 1 0 а0 —«1 —а2 .. • • ап-1_ _гп(П _ - ^°_ 166
Векторное дифференциальное уравнение (4.134) имеет вид z(t) = Az(t) + &«(/). (4.135) Уравнение (4.135), за исключением различия в символах, полностью идентично (3.396). Матрица системы А дается соотношением (3.398), а «-мерный вектор b в (4.135) определяется как “О" О (4.136) О Убедимся, что вектор z (t) представляет собой переменную состояния системы (4.126). Чтобы сделать это, мы должны показать, что знание z (t0) Рис. 4.8. Моделирование системы (4. 134) с помощью аналоговой вычислительной машины и u(t0, t] полностью определяет £(fo, и выход у(#0, п. Если z (/0) и u(fo, п известны, то единственное решение уравнения (4.135) с z (t0) в качестве исходной точки и управляющей функцией иц0, t] выражается соотно¬ шением t z(t) = еА J<*-'•>&« (т)гіт, (4.137) /о где —фундаментальная матрица уравнения (4.135). Следова¬ тельно, Z(t0, t] полностью определяется начальной точкой z (/о) и функ¬ цией U(iot fj. Так как у (/) = (/) [в силу (4.130)], то очевидно, что y{t0, (j = Zi(f0,f] также полностью определяется z (/о) и u{tQt Уравне¬ ниями состояния системы являются выражения z(t) = Az(t) + bu(t)-, I У(/) = 21(О. I Мы предлагаем читателю убедиться, что действительно нашли дина¬ мическую систему, которая описывается уравнением (4.126). Рис. 4.8 иллюстрирует моделирование векторного дифференциального уравнения (4.134) с помощью аналоговой вычислительной машины. Для моделирования требуются п интеграторов. Переменные состояния 2і (0, г2 (0, • • -, гп (0 соответствуют выходным сигналам интеграторов. 167
Постоянные коэффициенты а0, аА, . . ап_г являются коэффициентами усиления в цепях каналов обратной связи. В § 3.24 было показано, что собственные значения À2, . . ., матрицы системы (3.396) являются корнями полинома V 4-ап_Х~' -1 } «А f-a0. (4.139) Но два полинома (4.128) и (4.139) идентичны, и, следовательно, имеют одинаковые корни. Таким образом, собственные значения матрицы А (3.396) те же самые, что и полюса передаточной функции О (s) (4.127). Этого следовало ожидать, потому что полюса передаточной функции определяют частотную и переходную характеристики системы и урав¬ нения (4.138) представляют собой просто другой способ описания той же системы. Иначе говоря, собственные значения матрицы системы А опре¬ деляют характеристики системы (4.138), а полюса О (s) — характеристики системы (4.126). Так как это — математические описания одного и того же физического процесса, то полюса и собственные значения должны быть связаны друг с другом. В данном случае они одинаковы. В § 2.10 мы пока¬ зали, что собственные значения являются инвариантным свойством ли¬ нейного преобразования и матрица, связанная с линейным преобразова¬ нием, зависит от базисов векторных пространств. Систему также можно рассматривать как линейное преобразование и, следовательно, обнаружить, что полюса (или собственные значения) представляют собой инвариантные величины. В данном случае матрица и вектор состояния системы зависят от выбранного базиса. Это лишь другая формулировка того положения, что собственные значения эквивалентных систем (см. определение 4.5) одинаковы, тогда как их переменные состояния и ма¬ трицы могут быть различными. Для того чтобы проиллюстрировать неединственность вектора со¬ стояния, произведем следующую замену переменной. Пусть Q — невыро¬ жденная п X п матрица; определим вектор x(f), положив *(/) = (4.140) где z (t)— вектор, определяемый соотношением (4.130). Такая замена эквивалентна замещению системы (4.138) системой, эквивалентной по определению 4.5. Продифференцировав обе части выражения (4.140), получим *(/)== Q"W)- (4.141) Умножив обе части уравнения (4.135) на матрицу Q'1, получим Q-'z (t) = Q-'Az (t) 4- Q-'bu (/). (4.142) Подставляя (4.140) и (4.141) в (4.142), находим, что x(f) удовлетворяет дифференциальному уравнению x(t) = Q~1AQx(t) + Q~1bu(t). (4.143) Пусть S=Q-14Q; (4.144) Уравнение (4.143) запишется в виде x(t) = Sx(f) 4 (4.145) Матрицы S и А подобны 1 и, следовательно, имеют одинаковые соб¬ 1 См. § 2.9. 168
ственные значения (см. § 2.10). Так как собственные значения А те же, что и полюса функции G (s), то и собственные значения S должны совпадать с полюсами G (s). Далее, x(t) можно рассматривать как вектор состояния системы (4.126). Заметим, что для любого tQ знание х (/о) и u{to,t] пол¬ ностью определяет х^б, q, так как ; х(0 = es (t~to)x(Éo)-\- es J e~s (4.146) t0 Но если известен вектор х (т) для любого т из (/0, /], то известен и вектор г (/), так как z (т) = Qx(t), где Q — невырожденная матрица, и, следовательно, (т) = у (т) для любого т из (/0, t], Итак, x(f) — вектор состояния системы (4.126), и уравнения (4.135) и (4.145) являются эквивалентными описаниями этой системы. Упражнение 4.6. Промоделируйте с помощью аналоговой вычислительной машины систему (4.126), используя ее представление в виде (4.145). Можно считать, что sz/- — эле¬ менты S, qij — элементы Q и сі — компоненты с. Требуется показать, что компонентами Х[ (t) и в этом случае являются выходы п интеграторов. Полезную замену переменных можно произвести, когда полюсами передаточной функции G (s) (или, соответственно, собственными значениями матрицы системы) являются различные действительные числа. В § 3.24 мы показали, что в этом случае можно отыскать невырожденную ма¬ трицу Р, которая является матрицей Вандермонда (3.411), такую, что (4.147) где А — диагональная матрица собственных значений (3.409). Если определить вектор состояния x(f), положив х(/) = (4.148) то x(f) будет удовлетворять дифференциальному уравнению x(t) = Xx(f) + P~lbu(t). (4.149) Обозначим элементы Р~1 через гі;, і, j = 1, 2, . . ., п. Так как век- тор b задан в виде (4.136), то уравнение (4.149) можно записать: X,. (t) = Vz(0 + GA“(O» (4.150) где — собственные значения матрицы системы и гіп — элементы по¬ следнего (дг-го) столбца матрицы Р”1. Рис. 4.9 иллюстрирует аналоговую модель системы, описываемой уравнениями (4.149) или (4.150). Компоненты вектора состояния (фазовые координаты) (/) опять представляют собой выходные сигналы п инте¬ граторов. Выход у (t) = (t) равен сумме xt (/), т. е. </(/) = ?,(/) = 2 %,.(/). (4.151) так как первая строка матрицы Вандермонда состоит целиком из единиц [см. матрицу (3.411)1. Числа гіп, і = 1, 2, . . ., п в (4.150) можно вычислить непосредственно, проинвертировав матрицу Р, однако их легче определить иным способом и получить дополнительную информацию о физическом смысле такого преобразования уравнений системы. Так как полюса G (s) расположены при s = можно написать п <41И> Z=1 169
где rz представляет собой вычет G (s) в f-м полюсе Так как \ раз¬ личны, имеем г ! І (^І ^і) (^' ^г) • • • Oti ^і-і) (^І ^і+і) • • • (h ^п) (4.153) Предположим, что вначале система находится в покое (т. е. все на¬ чальные условия — нулевые) и что приложен вход и (/), тогда п У($) = Ьо 2 (4.154) При этих же условиях, из выражения (4.150) находим x.(s) = (4Л55) Так как s ‘ у(/) = 2 х, (0, Ï=1 имеем п п У(з) = £xz(s) = ôo£ (4Л56) І=1 і=1 1 Сравнивая выражение (4.154) с (4.156), получим гіп = г1, (4.157) т. е. элементы последнего столбца Р-1 равны вычетам G (s). Рис. 4.9. Моделирование с помощью аналоговой вычисли¬ тельной машины системы (4.150) Преобразование подобия позволило заменить модель системы, пока¬ занную на рис. 4.8, моделью, которая приведена на рис. 4.9. Коэффи¬ циенты усиления г1п, г2п, . . гпп (рис. 4.9) в точности равны вычетам передаточной функции G (s) в полюсах Х2, . . ., соответственно. Пример 4.4. Рассмотрим систему с одним входом и одним выходом, описываемую уравнением третьего порядка {£>3 + 3D2 + 2D} у (0 = и (0. (4.158) Эта система имеет передаточную функцию У Q ( ! ! (Л 1 50) и (s) “ “ s3 + 3s2 + 2s ~ s (s 4- 1) (s + 2) V ' 170
с полюсами s = 0, s = —1 и s = —2. Если принять, что zi (О = ИО; г2(0=ў(0; гз(О = ÿ(O> . (4.160) то вектор z (/) с компонентами г, (/), г2 (/), г3 (Z) должен удовлетворять векторному диффе¬ ренциальному уравнению вида Zj(Z) г2 (Z) Lz3 (Z). или, более сокращенно, (4.161) z(t) =Az(t) + bu (Z). (4.162) Найдем собственные значения матрицы А. Для этого отыщем нули det (X/ — А), т. е. À —1 0 det (X/ —Л) = det À —1 = V + ЗѴ 4- 2Х. (4.163) Собственные значения А равны 0, —1 и —2. Полюса G (s) и собственные значения А одинаковы. Эти собственные значения — действительные различные числа. Если Р — матрица Вандермонда 1 1 0 —1 0 1 Р = (4.164) то, применяя преобразование подобия к уравнению (4.161), получим следующую систему, эквивалентную исходной: (4.165) (4.166) где X (()=-- Р *2 (Z). Заметим, что G М = 1 = 1 1 □_ 1 s (s + 1) (s + 2) 2s s + 1 Ф 2 (s + 2) * (4.167) Следовательно, вычеты G (s) равны элементам последнего столбца Р"1 [т. е. вычеты — это компоненты вектора, на который умножается и (/) в уравнении (4.166)]. 4.10. ОТЫСКАНИЕ ПРЕДСТАВЛЕНИЯ В ПРОСТРАНСТВЕ СОСТОЯНИЙ (ИЛИ В ФОРМЕ ДИНАМИЧЕСКОЙ СИСТЕМЫ) ОБЪЕКТА, ПЕРЕДАТОЧНАЯ ФУНКЦИЯ КОТОРОГО СОДЕРЖИТ ПОЛЮСА И НУЛИ Рассмотрим объект с одним входом и одним выходом, который описы¬ вается линейным дифференциальным уравнением с постоянными коэф¬ фициентами: {Dn + an_xDn 1 4~ • • • 4’ GjD 4~ y(J) = = \bnDn + bn_1Dn~ï + • • • + b,D + b0} u(t), (4.168) 171
где у (/) — скалярный выход и « (/) — скалярный вход. В § 4.8 [см. урав¬ нение (4.121)] мы видели, что такая система имеет передаточную функцию = -- v ' и (s) — ^пзП 1 • • • ~r~ bts 4~ b0 ,, 169) sn + ^n-isn 1 + • • • + ÆiS + Uq Если обозначить через sx, s2, . . sn комплексные корни полинома знаменателя H (s) и через ох, о2, • • •> — комплексные корни 1 полинома числителя H (s), то sz будут полюсами H (s), а — нулями H (s) и можно написать // (s) - Ьп (s — oj (s — g2) (s — Si) (s — s2) (s —an) (s — sn) (4.170) В этом параграфе мы найдем представление в пространстве состояний (или в форме динамической системы) объекта, который описывается урав¬ нением (4.168). Для того чтобы получить решение дифференциального уравне¬ ния (4.168), необходимо знать 2п начальных условий, а именно: у (0), у (0), . . ., у{п~Х} (0) и и (0), и (0), . . ., а(п~і} (0). Попытаемся определить вектор состояния следующим образом. Пусть г (/) есть /г-мерный вектор с компонентами zx (/), z2 (/), . . . . ., zn (/), заданными соотношениями 2і(0 = і/(0 —Ло«(О; г2(0 — і/(0 — Л#«(0 — AjU(O; 2з(0 = і/(0—М(0—М(0 —М(0; (4.171) 2« (0 = У(п~'} (0 - (0 - Л1«("~2) (0 hn-iU (0, где Ло, hlt . . ., hn_i — постоянные, которые нужно найти. Соотношение (4.171) можно записать в виде 2,(0 = y<Z-1)(0- S t = l- 2, .... п. (4.172)2 k=Q Найдем дифференциальное уравнение, которому удовлетворяют zt- (/). Из соотношений (4.171) заключаем, что y(t)-hQu(t)= (4.173) -г2(/)Н М(0- (4.174) Наш вывод основан на дифференцировании уравнения, определя¬ ющего z1 (/), и на подстановке результата в уравнение, определяющее z2 (t). Совершенно аналогично можно получить г,(^) = //“>(0- (4.175) k=Q = (4.176) 1 Мы приняли, что число нулей равно числу полюсов. Это несущественно, так как можно выбрать Ьп = ^п-1 — ’ • • — Ьт+і — 0, Ьт =/= 0. В этом случае будем иметь т нулей и п полюсов. 2 Напомним, что (Z) = u (t). 172
так как zi+1 (/) = y{i) (/) — S u(k} = k=Q = yz) (0 - hiU(t) - É uw (t)ht_k. (4.177) /2=1 Дифференцирование выражения (4.172) для i = n дает: (4.178) /2=1 Дифференциальное уравнение (4.168) дает соотношение ÿ<n)(0 = — V а.уМ (Z) bnUW (/) 2 bku(k} (t) + bou(t). i=0 &=1 (4.179) Из выражения (4.177) следует, что л—1 п—\ л—1 Г і S «(Ѵг)(0= S ад+1(о+ S а,- S (t)hi_k (=0 z=0 г=() L/e = l л—1 + «(/)£ аД (4.180) і -о и, следовательно, л-1 л—1 гп(0 = — S аЛ+і(0 + bnu{n}(t) + S bkUW(t) + bou(t) — i=O É=1 (4.181) Путем непосредственных вычислений можно получить Л—1 і л—1 л—k— 1 — s а(. É и(к) (t) = — S и(к) (t) S hiai+k. t—0 Л=1 fe=l i=0 (4.182) Подставив это выражение в уравнение (4.181) и сгруппировав члены, получим л—1 МО = - S аЛ+1(0 + (bn - h0)uw (t) + (=0 л—1 I* 'П—k—1 ù f л—1 \ + ^uw(f)\bk-ha_k- S M+4 + «(O po-S аД • (4.183) k=A I £=0 J I f=0 J Выберем h таким образом, чтобы zn (/) не зависела от всех производ¬ ных и (/). Это можно сделать, положив h0 = bn- (4.184) л—k—1 hn-k = bk— S htauk для k=\, 2, n—1. i=0 Подставив выражение (4.184) в уравнение (4.183), получим дифферен¬ циальное уравнение л—1 zn(0 = — S aiZi+i(f) + hnu(f), (4.185) 4=0 где л—1 й„ = &0-2аЛ. (4.186) і ' *0 173
Итак, мы получили дифференциальные уравнения относительно (/), которые можно записать в векторной форме: 4(0 МО 0 0 1 0 0 . . 1 . . 0 0 4(0 + " Лі «(0 4-1(0 0 0 0 1 zn-r(t) hn-, .4(0 а0 —«1 —а2 . . • — ап-1_ /At) (4.187) или, сокращенно, г(/)-Лг(/) + МО> (4.188) где А — матрица (3.398) и h — вектор с компонентами Л2, • • -, определяемыми уравнениями (4.184) и (4.186). Рис. 4.10. Представление в виде аналоговой модели системы (4.187) Заметим, что вычисление постоянных і = 0, 1, . . ., п не предста¬ вляет особого труда, так как уравнения (4.184) имеют вид = Л1 = ^0an-iî Л2 - &п-2 — U-2 — (4.189) и hL находится последовательными подстановками. Нетрудно убедиться, что вектор z (t) представляет собой вектор со¬ стояния системы (4.168), так как знание z (Q и полностью опре¬ деляет решение дифференциального уравнения (4.188) на интервале Ио, t] (т. е. г(/о d). Поскольку выход у (t) равен ÿ(0 = ^i(0 + M(a (4.190) ясно, что y(to п полностью определяется величинами z (/0) и Мы предлагаем читателю получить уравнения состояния и убедиться, что действительно нашли динамическую систему, которая описывается выражением (4.168). Интересно сравнить дифференциальное уравнение (4.187) си¬ стемы (4.168) с дифференциальным уравнением (4.135) системы (4.126). Матрица системы А одинакова в уравнениях (4.187) и (4.135). Эти уравне- 174
ния отличаются лишь векторами b и й, на которые умножается управле¬ ние и (f). Ясно, что собственные значения матрицы системы А являются полюсами как передаточной функции H (s) [см. (4.169)], так и передаточ¬ ной функции G (s) [см. (4.127)]. На рис. 4.10 показана аналоговая модель векторного дифференциаль¬ ного уравнения (4.187). Фазовые координаты являются выходами п инте¬ граторов. Сравнивая рис. 4.8 и 4.10, нетрудно заметить, что последняя схема отличается от первой лишь наличием каналов прямой связи, а каналы обратной связи обеих схем идентичны. Выше мы полагали, что число полюсов и нулей H (s) одинаково. Рассмотрим случай, когда передаточная функция H (s) имеет т нулей и п полюсов, причем m<Zn. Иначе говоря, предположим, что в уравнении (4.168) ьп = Ьп.і = • •• = bm+1 = 0, Ьт=£0 (4.191) и что H (s) имеет вид H (s) = - bm, (s~ - °т) . (4.192) ѵ 7 (s — Si) (s — s2) ... (s — sn) v Способом, совершенно аналогичным тому, который использовался для систем с п нулями и п полюсами, можно показать, что вектор г (/) с ком¬ понентами Zj (/), z2 (/), . . ., zn (f), определенными как г2(/) = ў(0; = У(п-т) ^) = y(n~14t)-hn.mu^(t) W (0> 1 (4.193) где n—k—1 hn-k = bk— S О/+Л> k = °> t j—n—tn . . /И, (4.194) можно рассматривать как вектор состояния системы с передаточной функцией H (s) по выражению (4.192). Доказать это мы предлагаем читателю, отметив, что г (0 удовлетворяет векторному дифференциаль¬ ному уравнению "0 ^п-1 hn (4.195) 175
Выше уже рассматривался эффект преобразования подобия для слу¬ чая действительных различных собственных значений (§ 4.7 и 4.9). По¬ смотрим, к каким выводам приведет нас преобразование подобия в дан¬ ном случае. Пусть собственные значения À2, . . ., матрицы системы А (4.188) действительны и различны. Определим вектор состояния х (/), положив х(/)-P-^(Z), (4.196) где Р — матрица Вандермонда (3.411). Новый вектор состояния удовле¬ творяет дифференциальному уравнению х(0 - Лх(0 + P-'huify (4.197) где Л —диагональная матрица собственных значений (3.409). Еслиx1(f). х2 (/), . . ., хп (/) — компоненты х (/) и Ѵі~ Ѵ2 V = p-^h (4.198) то уравнение (4.197) можно записать в виде xi(t)=kixi(t) + viu(t). (4.199) На рис. 4.11 показана модель системы (4.199) в предположении, что Ьп 0, т. е. когда H (s) имеет п нулей и п полюсов. Из сравнения рис. 4.11 с рис. 4.9 видно, что единственное отличие — канал прямой связи от входа и (/), который показан на рис. 4.11. С другой стороны, если Ьп = 0 (т. е. число нулей по крайней мере на один меньше числа полюсов), то hQ = 0 и рис. 4.11 и 4.9 имеют одинаковую структуру. Если Ьп — 0, то коэффициенты и2, ...» ѵп можно рассчитать непосредственно. Можно определить vt и в терминах вычетов H (s) в полю¬ сах Для этого предположим, что в начальный момент система находится в покое, т. е. У(0) = ÿ(0) = ••• = ÿ(n-1) (0) = u(0) — • • • = u^-1’ (0) = 0, (4.200) 176
и к ней прикладывается входной сигнал и (/). Известно, что преобразова¬ ние Лапласа дает z/(s) = //(S)M(S) = 2 (4-201) 1=1 где pt — вычет H (s) в полюсе \. Так как Хг различны, имеем п ^rn (Xz <h) (X/ а2) . . . (Xz от) . 9П9\ Р‘ (Xz - Xi) (Xz - X2) . . . (Xz - Xz^) (Xz - Xz+1) . . . (Xz - X„) ’ где H (s) имеет m нулей o2, • • tT- e- H (s) определяется урав¬ нением (4.192)]. Из уравнения (4.200) в силу (4.193), определяющего z (/), следует, что z (0) = 0, и поскольку Р"1 — невырожденная матрица, то %і (0) - х2 (0) - - - - - хп (0) - 0. (4.203) Из уравнения (4.199) получим xi(s) = s-=17«(s)- (4-204) Элементами первой строки матрицы Вандермонда Р (3.411), являются единицы. Так как Ьп = 0, то и hQ = 0, и мы получим п п y(s) = zl(s) = 2^.(5)= (4.205) Z=1 Z=1 1 Сравнение выражений (4.205) с (4.201) приводит к заключению, что ѵі = Рр 1• = h 2, ..., п. (4.206) В этом и предыдущем параграфах мы показали, как найти описание системы в пространстве состояний (в фазовом пространстве) по ее пере¬ даточной функции. Мы показали, что собственные значения матрицы системы равны полюсам передаточной функции, а ее нули влияют только на управление в том смысле, что нули передаточной функции определяют «усилительный» вектор Ь. Отметим, что представление системы в пространстве состояний соот¬ ветствует моделированию системы с помощью аналоговой модели, в кото¬ рой фазовые координаты являются выходами интеграторов. Полюса передаточной функции и собственные значения матрицы си¬ стемы одинаковы. Нетрудно убедиться, что критерий устойчивости (§ 3.26) можно преобразовать в известный критерий устойчивости в терминах положения полюсов передаточной функции на комплексной плоскости. Пример 4.5. Рассмотрим систему y\t) -г 3ÿ (t) + 2у (Z) = ü (t) + 7« (0 + 12« (О, для которой имеем п = 3; а0 = 0; «х = 2; а2 — 3; Ь3 = 0; b2 — 1; ЬА = 7; Ьо = 12. Из уравнения (4.194) находим hQ — 0; hr = 1; h2— 4; h3 = —2. Фазовые координаты zx (0> z2 (/) и z3 (/) определяются соотношениями (4.193): (0 = г2(0 = ^(0-«(0; 177
Упражнение 4.7. Найдите дифференциальные уравнения в фазовых координатах zi (t) для следующих систем: 1) 7(0 = ’Й); 2) ÿ\t) = ü(t) + 8Û (0 4 15u (0; 3) ÿ'(t) -y(t)=à (t); 4) ÿ<4> (/) + 2ÿ(3) (t) + z/<2> (t) = u(2) (/) + u(1> (/). Упражнение 4.8. Рассмотрите систему y (t) 4 at (t) y (t) 4 a0 (t) y (t) = b2 (t)u (t) 4 (0 à (/) 4 b0 (t) и (/), где коэффициенты являются непрерывными функциями времени. Требуется найти описа¬ ние системы в пространстве состояний. У Казани е: Необходимо использовать выра¬ жения Zi (0 = у (t) — hQ (t) и (t) и т. д. Упражнение 4.9. Обобщите результат упражнения 4.8 на случай линейной системы с переменными параметрами n-го порядка. ЗАДАЧА УПРАВЛЕНИЯ 4.11. ВВОДНЫЕ ЗАМЕЧАНИЯ Ранее сформулировано общее определение динамической системы и рассмотрены связанные с ним понятия входа, выхода и состояния. Поэтому мы подготовлены к тому, чтобы в достаточно общем виде рассмо¬ треть задачу «управления» динамической системой. При изучении физиче¬ ской системы обычно имеются в виду какие-то определенные цели. В дан¬ ном случае мы хотим, чтобы наша физическая система выполняла опре¬ деленную задачу и делала это возможно «дешевле». Например, нам необ¬ ходимо спроектировать автопилот с некоторыми определенными характе¬ ристиками или систему управления положением спутника, достаточно быстродействующую, но потребляющую не слишком много рабочего тела, или быстродействующую силовую следящую систему. Перевод этих инже¬ нерных задач проектирования на абстрактный язык динамических систем и представляет собой то, что мы будем дальше называть «задачей управле¬ ния». Существенными элементами задачи управления являются: 1) динамическая система, которой надо «управлять»; 2) желаемый выходной сигнал или цель системы; 3) множество разрешенных (или допустимых) «управлений» (т. е. входных сигналов); 4) функционал, измеряющий эффективность «управляющих дей¬ ствий». В качестве желаемой цели системы будем рассматривать заданное состояние или множество таких состояний, которые могут изменяться с течением времени. Иначе говоря, вопрос о получении определенного выходного сигнала мы заменим задачей «попадания» в определенное множество цели в пространстве состояний системы. Например, если мы хотим, чтобы выходной сигнал у (Z) линейной системы, определяемой уравнениями x(t) = A(t)x(t) + все время стремился к нулю, это означает, что мы хотим достичь такого множества состояний х, для которого Сх = О1. «Управляющие» сигналы физической системы обычно получаются с помощью аппаратуры, способной дать ограниченные по величине «силу» или «энергию». Это обстоятельство вызывает необходимость накладывать 1 Если (5 — преобразование Rn в Rp, <5х = Сх, то множество цели есть ядро (0) (см. § 2.4). 178 (4.207)
ограничения на множество всех входов, которые можно использовать для управления системой. Множество управлений (7, удовлетворяющее таким ограничениям, будем называть областью допустимых управлений. Для большинства физических систем желаемая цель может быть до¬ стигнута с помощью различных допустимых входов, дающих различные переходные процессы. Нам хотелось бы рассчитать каждый из них и, если возможно, выбрать наилучший. Это обстоятельство требует некото¬ рого критерия (или функционала). Функционалы, которые мы будем использовать для измерения «стоимости» управления нашей системой, принимают действительные значения и зависят от состояний, соответ¬ ствующих началу и концу «управляющих действий»; траектории движения системы от исходного до конечного состояния; времени, в течение которого прикладывается управление, и используемого закона управления. 4.12. ОПРЕДЕЛЕНИЯ Предположим, что нам дана динамическая система /г-го порядка Літ=/[^т ! (4.208) y(t) = g[x(t), a(t), /] J на интервале определения (T T2) (cm. §4.6). Обозначим переходную функ- цию системы через Ло)- (4.209) Пусть L — непрерывная действительная функция, заданная на Rn X X Rm X (7\, Т2), т. е. непрерывная функция вида L(Xi, х2, • • -, и2> • • -, ит, О, (4.210) и К — действительная функция на Rn X (7\, Т2): К(хі, х2,..., хп, t). (4.211) Будем считать подмножество S из Rn X (Tlt Т2) заданным и назовем его множеством цели (target set). Элементами множества цели являются пары (лг, /), состоящие из состояния х и точки t из интервала определе¬ ния системы. Важным элементом определения динамической системы является множество U кусочно-непрерывных функций (см. определение 4.4). Эле¬ менты и из U будем называть управлениями и покажем, как связаны огра¬ ничения с определением U. Предположим, что для каждого t из (Tlt Т2) задано подмножество Ut из Rm (обычно замкнутое, ограниченное и выпуклое или все /?щ). Обо¬ значим набор всех множеств Ut через Q, т. е. Й = {^:/С(Л, Л))- (4.212)1 Определение 4.7. Ut называют областью ограничений при t и Q — множеством ограничений (или просто ограничениями). Если U — мно¬ жество всех ограниченных кусочно-непрерывных функций и (/) на (Т19 Т2), такое, что и (t)Q Ut для всех t из (Т19 Т2), (4.213) то говорят, что U есть множество, или область управлений, удовлетво¬ ряющая ограничениям Q (или U — область допустимых управлений). Любой элемент и из U называется допустимым управлением. 1 Q имеет другой смысл, нежели в § 4.5. Здесь множество из § 4.5 представляет собой пространство Rm. 179
Пример 4.6. Обозначим через U подмножество из Rm, заданное как 67 = {«і^і + ti2e2 + • • • + и-т^пі : | щ | ^Л4/}, (4.214) где Мі — заданные постоянные и е19 е2, . . ет — натуральный базис в Rm [см. урав¬ нение (2.27)]. Тогда довольно часто встречающееся множество ограничений Q дается соот¬ ношением Q = {Ut — Û: t из (Л, Т2)}. (4.215) Здесь и (t) удовлетворяет ограничениям Q тогда и только тогда, когда для любого t из (?і, Т2) имеем г = 1, 2,. . tn. (4.216) Часто говорят, «« (/) удовлетворяет ограничению |щ (/)| Л4(-, і— 1, 2, . . ., m» вместо «я (6) удовлетворяет ограничению Q». При Мг — М2 — * • -= Мт = 1, ограничива¬ ющим множеством является гиперкуб в Rm. Пример 4.7. Пример ограничений, зависящих от времени, можно получить, приняв ,, ((« : lu/lsgl, і = 1, 2, . . m для t из (Tlt T]} Uf = < (4.217) I : I Ui I 2, 4 = 1, 2,. . tn для t из (T, T2)}, где T — некоторый заданный элемент из Т2). Далее рассмотрим случай, когда M (t) является положительной действительной функцией времени на (Т1, Т2) и Ut = {и : \щ\^М (t), і = 1, 2, . . tn}. (4.218) Пример 4.8. Другим важным примером ограничения является Ut = {« ; II« (4.219) где М — заданное число и || и || обозначает эвклидову норму и (см. § 3.2). В этом случае часто говорят, что и (/) удовлетворяет ограничению: П(0ІІ^А1. (4.220) Последний тип ограничений рассматривается в гл. 10, где ограничивающим мно¬ жеством является гиперсфера радиуса М. в Rtn- Пусть /0 — заданный элемент из (7\, Т2) и xQ— заданный элемент из Rn. Для и из U зависимость х(т) = дб(т; х0) (4.221) является единственным решением системы, удовлетворяющим начальному условию х(/0) = -ѵ0, (4.222) а функция 7, преобразующая Rn X Т2) X U X Rn X (Ть Т2), определенная как t J (хп, t0, и, X, t) = К (х, /) + J L [лс(т), «(т), r]dr, (4.223) <0 является действительным числом. В выражении (4.223) /( и L — функции, введенные ранее [см. уравнения (4.210) и (4.211)]. Определение 4.8. Говорят, что управление и переводит xQ в S [более строго (х0, t0) в S], где S.— множество цели, если множество {$(*; х0), t:t^tQ] (4.224) встречает (т. е. пересекает) множество S. В этом случае говорят, что движение системы встречает, или пересекает, S. Если и переводит xQ в S и tf — первый момент времени после /0, когда движение х (t) = = ф {t; u{tQ, t], *ѵ0) вступает в S, то, обозначив: Xf^x(tf) = $(tf; и((0, x0), (4.225) 180
вместо J (л:,), ta, и, Xf, tf) [см. уравнение (4.223) ] пишут J (х0, tQ, и), т. е. J(x0, t0, a) — J (х$, t0, a, xh tf) = (4.226) = K(xf, tf)+ §L[x(x), «(T), x]dx — (4.227) to = K lift», t ]J x0), 4- (4.228) 4- J^[g6(T; «(?„, ri; x0), u(x), x]dx. J (x0, /0, и) называют значением функционала для управления и по отношению к множеству цели S; tf — конечным временем; Xf — конечным состоянием и К (Xf, tf) — конечной стоимостью. Если и —такой элемент из U, который не переводит х0 в S, принято полагать J(xQ, t0, и) = оо. (4.229) Функционал 1 J (х0, tQ, и), преобразующий Rn х (Т1, Т2) X U в R U {оо}2, называют функционалом преобразования системы. Так как начальные состояние лг0 и время /0 часто фиксированы, то обычно пишут J (и) вместо J (х0, /0, Частные случаи функционалов преобразования, представляющие практический интерес, рассматриваются в гл. 6. Мы можем теперь строго сформулировать задачу управления. Определение 4.9. Задачей оптимального управления системой (4.208) по отношению к множеству S, функционалу преобразования J (лг0, /0> #), множеству допустимых управлений U и начальному состоянию х0 в момент времени /0 является отыскание управления и из (/, минимизирующее функционал J (и). Другими словами, задачей оптимального управления является следующее. Заданы: динамическая система (4.208); начальное состояние х0; начальное время /0; множество S; область допустимых управлений U. Найти: управление и из U, переводящее х0 в S,3 т. е. (дб(^; x°)’ S и минимизирующее функционал J (и) = J (лг0, #)• Любое управление и*, дающее решение задачи оптимального упра¬ вления, называют оптимальным управлением. Отметим, что существование оптимального управления не является необходимым. Действительно, в U может вообще не оказаться управлений и, переводящих х0 в S. Этот случай более подробно разбирается в § 4.14. С другой стороны, может ока¬ заться несколько оптимальных управлений (см. гл. 6, 8 и 10). Так как отыскание максимума действительной функции эквивалентно отысканию минимума той же функции с обратным знаком, то достаточно рассмотреть только минимизацию функционалов. По этой причине в даль¬ нейшем мы будем иметь дело только с отысканием минимума. 4.13. СПЕЦИАЛЬНЫЕ СЛУЧАИ В этом параграфе мы рассмотрим некоторые специальные случаи за¬ дачи управления, а именно: задачу без ограничений, вопрос об огра¬ ничении состояний и различные специальные вопросы, возникающие из 1 J называют функционалом, потому что J зависит от множества функций U\ J есть функция от функций. (Сравните с § 3.16.) 2 Я U {°°} есть множество всех действительных чисел вместе с символом оо, превы¬ шающим любое действительное число. 3 Т. е. переводящее (х0, ^о) в *$• 181
конкретного вида множества цели, т. е. задачи о регуляторе и точке встречи (перехвате). При рассмотрении этих задач будем использовать терминологию и обозначения, приведенные в § 4.12. Несмотря на то, что входы физической системы неизбежно ограничены, часто оказывается интересным рассмотреть задачу оптимального управле¬ ния без ограничений, т. е. случай, когда ограничением Ut в момент вре¬ мени t (см. определение 4.7) является все пространство Rtn для любого t. Иначе говоря, мы часто будем полагать, что любая ограниченная кусочно¬ непрерывная функция из (Т!, Т2) в Rm является допустимым управлением. При этом говорят, что изучается свободная оптимальная задача или оптимальная задача без ограничений. Отметим, что свободная задача может не иметь решения, тогда как аналогичная задача с ограничениями имеет решение и наоборот. При определении задачи оптимального упра¬ вления мы рассмотрели влияние ограничений на величину управлений, предполагая, что вектор состояния системы может принимать любое значение в Rn. Иногда возникает задача управления, где ограничения накладываются и на фазовые координаты системы. Определение 4.10. Пусть X — замкнутое подпространство простран¬ ства состояний Rn и множество цели S содержится в X X (Т\, Т2), тогда оптимальная задача с ограниченным состоянием системы формулируется следующим образом. Дана динамическая система (4.208), начальное состояние х0 из X, начальное время /0, множество цели S и область допустимых управле¬ ний U. Найти управление и из (7, переводящее х0 в S вдоль траектории, целиком заключенной в X, и минимизирующее функционал преобразова¬ ния J (и) = J (х0, ^о, и) по отношению ко всем таким управлениям. Можно заметить, что к общей оптимальной задаче добавлены требо¬ вания: 1) чтобы начальное состояние принадлежало к X и 2) рассматри¬ ваются лишь те управления, которые дают траектории, целиком проходя¬ щие в X. Такие задачи в данной книге рассматриваться не будут, поэтому мы отсылаем заинтересованного читателя к другим литературным источ¬ никам [43], [54], [129]. Рассмотрим некоторые частные случаи множества S и соответству¬ ющие им варианты задачи управления. Напомним, что S представляет собой подмножество из Rn X (Т19 Т2) — элементами S являются пары (х, /), соответствующие состоянию х в момент времени t из Т2). Если множество S имеет вид s - US/ X {/}, (4.230) Л), где St — заданные (непустые) подмножества из Rn, то такую задачу назы¬ вают задачей с нефиксированным временем. Иначе говоря, мы пытаемся достичь множества, движущегося в пространстве состояний, причем достичь его мы имеем право в любой момент времени /, принадлежащий интервалу определения (Т1У Т2). В частном случае S= {(#(/), /):/е(Л, Л)Ь (4.231) где z (0 — заданная на (Tlf Т2) /г-мерная функция времени. Эту задачу называют задачей о точке встречи (или задачей преследо¬ вания). Напротив, если S имеет вид S = X {Т}, (4.232) где Т — заданный элемент из (7\, Т2), 182
то такую задачу называют задачей с фиксированным временем. В данном случае мы пытаемся достичь заданного множества в заданный момент времени Т. Если Т2 = оо, то часто вместо X [Т] рассматривают множество цели S X {/0 + 71}. Определение 4.11. Пусть Т — заданный элемент из (Тъ Т2) и S1 — заданное подмножество из Rn. Задача с фиксированным временем форму¬ лируется так: задана динамическая система (4.208), начальное состоя¬ ние лг0, начальное время /0, причем /0 < Г, множество цели Si X {Т} и множество допустимых управлений U; необходимо найти в U управле¬ ние и, которое переводит систему из лг0 в S, минимизируя функционал преобразования т J (u) = J (х0, t0, u) = К [х(Т), 71] 4 J L [х(т), и(т), x]dx. Предположим теперь, что множество S имеет вид {**} Х(Л, 7\), (4.233) где х* — единственная точка, обычно начало координат в Rn. Такую задачу называют задачей с фиксированной конечной точкой и нефикси¬ рованным временем. В общем случае, если множество всех х из Rn в об¬ ласти цели S состоит из единственной точки, то о задаче управления говорят как о задаче с фиксированным концом. Если точка х* является точкой равновесия системы \ то такую задачу называют задачей о регуля¬ торе. В дальнейшем будут возникать другие варианты задач управления, но после приведенного обсуждения их интерпретация не должна вызывать у читателя затруднений. 4.14. МНОЖЕСТВО ДОСТИЖИМЫХ СОСТОЯНИЙ 2 В теории управления важную роль играют некоторые качественные свойства систем. В частности, очень важны понятия достижимости, управ¬ ляемости и наблюдаемости. В этом параграфе рассматривается понятие достижимости и сопутствующее ему понятие множества достижимых состояний. В следующем параграфе мы дадим определения понятий управ¬ ляемости и наблюдаемости. Термин «достижимость» означает, что мы можем найти такое управле¬ ние, которое переводит систему из заданного состояния xQ в другое состоя¬ ние хг. Сформулируем это понятие более строго. Предположим, что рас¬ сматривается система с переходной функцией $(/; Щі0, п>‘ хо) и областью допустимых управлений (/, удовлетворяющей ограничениям Q (см. опре¬ деление 4.7), т. е. U в том случае, когда и — кусочно-непрерывная функция и (4.234) для любого t из интервала определения системы. Здесь Ut — заданные подмножества из Определение 4.12. Состояние х± называют достижимым, или доступ¬ ным из исходного состояния Хо при tQ по отношению к U, если существует элемент и± из U, такой, что дб(6; м; хо) = хі (4.235) 1 Это означает, что f (х*, 0, /) = 0 для любого t из (7\, Т2), где f— функция, фигу¬ рирующая в уравнении (4.208). 2 См. [87]—[89], [142], [145], [146], [150], [152], [169] и [189]. 183
для конечного /0. Если А (I; х0, /о, U) обозначает подмножество из Rn, которое состоит из всех состояний хъ достижимых из х0 при tQ по отношению к U в момент времени /, Л (/; Xq, tQ, U) = {х±: существует u^U такое, что $(/; tti (t0) d; лг0) = Xi}, (4.236) то A (t; x0; t0; U) называют областью достижимых состояний в момент времени t (из лг0 при t0 по отношению к £7), a J A (t; х0; t0; U) — t > t0 множеством достижимых состояний (из xQ при tQ по отношению к (7). Предположим, что наша система линейна и описывается уравнениями x(t) = A(f)x(f) + y(t) - C(t)x(t) + D(t)u(t). (4.237) (4.238) Пусть Ф (/, /0) — фундаментальная матрица уравнения (4.237) (см. § 3.20). Тогда переходную функцию системы ф можно записать в виде $(/; u{to. /]; х0)^Ф(/, /о) Хо + J Ф(/о, т) Д(т)«(т)гітк (4.239) I J Исследование выражения (4.239) приводит нас к следующей теореме. Теорема 4.1. Если область допустимых управлений U для си¬ стемы (4.237) и (4.238) выпукла (см. § 3.8), то для любых xQ и /0 множество достижимых состояний A (t; xOl U) также выпукло. В частности, если U состоит из всех кусочно-непрерывных функций, удовлетворяющих ограничению «(т)£і7х, (4.240) где все (7Х выпуклы, то и Л (t; лг0, /о, ^0 выпукло. Доказательство. Предположим, что область U выпукла, что xQ — произвольный элемент из Rn и tQ — произвольный момент времени. Мы хотим показать, что если х± и х2 — элементы из Л (/; лг0; tQ; U) и г, s — действительные числа, такие, что г + s = 1, г, s 0, то гхг + + sx2 целиком принадлежит Л (/; лг0; tQ; U). Существуют управления и и2 из (7, такие, что {t х0 н- J Ф(/о, x)B(x)u^(x)dx Іо {t х0 г [Ф(А>, x)B(x)u2(x)dx і. Следовательно, (4.241) (4.242) {/ ) Xq-{- ]*Ф(/о, т)в(т)[га1(т) 4- su2 (т)]я!тк (4.243) to J Так как область U выпуклая, то rux + su2 принадлежит к £7, и мы доказали, что гхг 4- sx2 принадлежит к Л (/; лг0; U). Читатель может самостоятельно проверить справедливость этой теоремы в частных слу¬ чаях. Следствие 4.1. Если U состоит из управлений, удовлетворяющих ограничению Z - 1, 2, . . .,m, (4.244) то множество Л (/; лг0; tQ; U) выпукло. 184
систему Пример 4.9. Если даже все А (t\ xQ; tQ\ U) выпуклы, из этого не следует, что и (J A (t\ х0; /0; U) является выпуклым. Покажем это на простом примере. Рассмотрим t^t0 Х'і (0 = 0 1" Х1 (0 + '«1 (О' (4.245) . ^2 (0. 1 0_ -xï (і). .«2 (0. всего из одной функции, тождественно равной нулю: Предположим, что U состоит иі (0 “ и2 (0 = О для любого t. Пусть /0 ~ 0 и х0 ~ X (0) — . Множество A (t; х0; 0; U) состоит из единствен¬ ной точки I S*n I и, следовательно, выпукло. Однако J А (/; х0; 0; U) есть множество L cos t J И —Ч’ которое, очевидно, выпуклым не является. Следствие 4.2. Если х0 = 0, область U — выпуклая и содержит функцию а (/) для любого t, то множество достижимых состояний выпукло. В частности, если U выпуклая и содержит u (t) = 0, а система является линейной с постоянными параметрами, то множество состояний, дости¬ жимых из xQ = 0 по отношению к U \ является выпуклым. Теорема 4.2. Предположим, что U состоит из всех кусочно-непре¬ рывных функций, удовлетворяющих ограничению (4.246) где все множества Ux содержатся в сфере S (0, М) в Rtn. Тогда для любого /> t0 множество A (t; х[}; tQ; U) ограничено (см. § 3.6). Доказательство. Предположим, что хг принадлежит к А (/; х0; U); тогда существует а из U такое, что = Ф(/, /0) х0+ J Ф(/о, т)Я(т)#(т)гітк (4.247) Так как все элементы матриц Ф и В являются непрерывными функ¬ циями на По, И, то можно заключить, что существуют числа L, N, при которых II Ф(/, (4.248)1 2 ||Ф(/0, г)В(т)о|| < 2ѴМ (4-249) для любого т из По, t] и для любого ѵ из Rn. Из теоремы 3.8 имеем ІІХіІІ < L [||х0|| + (^~/о)maxII«(т)||] < (4.250) тСОо, И <L{||x0|| + (/-/0)W} (4.251) и, следовательно, А х0; /0; U) cz 5(0, L{||xo|| + (/-/o)^A/}). (4.252)3 Таким образом, мы доказали, что множество А (і; х0; /0; U) заключено в сфере 5 из Rn и, следовательно, ограничено. Следствие 4.3. Если U состоит из управлений, удовлетворяющих ограничению |uz(t)| < Mh 1=1,2, .. .,т, (4.253) то А (/; х0; /0,’ ограничено. 1 Рассматриваются лишь управления, принадлежащие к U. 2 Напомним, что || || обозначает эвклидову норму (см. § 3.6). 3 См. уравнение (3.5). 185
Упражнение 4.10. Рассмотрите систему (4.245) для (/) = 0 и |м2(/)|^1 при любом t. Пусть t0 — 0 и начальное состояние хг (0) = х2 (0) — 0. Покажите, что множе¬ ством достижимых состояний А для t = л является А = {(хі> x2):xî + x2^4)- Упражнение 4.11. Рассмотрите систему xr (t) = х2 (/); х2 (t) = и (/); 0-с и (/) 1 для любого t. Пусть /0 = 0; (0) = х2 (0) = 0. Найдите множество достижимых состоя¬ ний при t = 1. В заключение приведем теорему, которая очень часто используется при доказательстве существования оптимального управления. Её доказа¬ тельство можно найти в работе [142]. Теорема 4.3. Предположим, что для системы (4.237) с постоянными A (t) и В (/) область U состоит из измеримых 1 функций, удовлетворяющих ограничению: »(тЖ (4.254) где множества Ux : 1) выпуклы; 2) содержатся в некоторой сфере S (0, М) в Rm и 3) замкнуты в Rm (см. § 3.4). Тогда для любого t > t0 множество Л (/; х0, tQ; U) замкнуто. 4.15. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ. ОПРЕДЕЛЕНИЯ В этом параграфе мы определим понятия управляемости и наблюдае¬ мости. Грубо говоря, термин «управляемость» означает, что в течение конечного отрезка времени t возможно перевести систему из любого состояния в начало координат. Термин же «наблюдаемость» означает, что начальное состояние системы можно определить путем соответствующих измерений ее выхода. Несколько ниже мы дадим строгие определения этих понятий, а в последующих двух параграфах рассмотрим их для слу¬ чая линейной системы с постоянными параметрами, позволяющего полу¬ чить критерии управляемости и наблюдаемости в развернутой форме. В заключение мы рассмотрим некоторые практические примеры этих понятий 2. Предположим, что задана динамическая система x(t)=f[x(ty u(t)\ /]; (4.255) У(О = u(t); /] (4.256) с переходной функцией ф(Т-, Хо) и с областью допустимых управле- ний U, состоящей из всех ограниченных кусочно-непрерывных функций, преобразующих интервал определения в Rm. Никаких специальных огра¬ ничений на и не накладывается. Определение 4.13. Управляемость. Если состояние х± = 0 дости¬ жимо из Xq при /0 (см. определение 4.12), то говорят, что состояние х0 управляемо в момент времени /0. Иначе говоря, х0 управляемо при /0, если существует кусочно-непрерывная функция uQ такая, что fl6(T; Хо)=О (4.257) для некоторого конечного T tQ. Если каждое состояние х0 управляемо при /0, то система управляема при tQ. Наконец, если каждое состояние х0 управляемо в каждый момент времени /0 на интервале определения си¬ стемы, то система полностью управляема (или просто «управляема»). Определение 4.14. Наблюдаемость. Говорят, что состояние х0 на¬ блюдаемо для t = tQ, если для заданного управления и существует время 1 Кусочная непрерывность здесь недостаточна, и поэтому требуется наличие изме¬ ряемое™ (см. [192], где дается определение этого понятия). 2 Более детальный анализ этих понятий читатель найдет в [35], [61], [82], [106], [109], [111], [113], [130], [210] и [212]. 186
/j 2»/ог такое, что знания «((„м и выхода2 у{,0.м = g (х0; а((о>(11) достаточно для определения х0. Если каждое состояние х0 наблюдаемо при /0, то говорят, что система наблюдаема при /0. Наконец, если каждое состояние х0 наблюдаемо в любой момент времени /0 в интервале определе¬ ния системы, то система полностью наблюдаема (или просто «наблю¬ даема»). Ниже мы покажем, что понятия управляемости и наблюдаемости являются внутренними свойствами системы, т. е. они сохраняются при всех эквивалентных преобразованиях системы (см. определение 4.5). Теорема 4.4. Пусть Р — невырожденная п X п матрица и z (t) = = P1 2 X (0- Система /]; (4.258) y(t) = /] (4.259) управляема (или наблюдаема), когда эквивалентная система г(/) = Р"1/[Рг(/), #(/), /]; (4.260) y(t) = g{Pz(t\ u(t), t] = h[z(ty u(tyt] (4.261) управляема (или наблюдаема). Доказательство. Предположим сначала, что система (4.258), (4.259) управляема, /0 — заданное время и z0 — заданный элемент из Rn. Тогда в Rn существует элемент х0 такой, что zQ = Р-1х0, а для некоторого T t0 — элемент а0 из U, для которого ф(Т\ Хо) = О, (4.262) где ф — переходная функция системы (4.258), (4.259). Если z(t) = р~гф(і; u°tt, Хо), (4.263) то непосредственно видно, что z (/0) = и £ (Т) = Р~г0 = 0. Так как справедливо и обратное положение, то часть теоремы, относящаяся к упра¬ вляемости системы, доказана. Для доказательства другой части теоремы, относящейся к наблюдае¬ мости системы, предположим, что система (4.258), (4.259) наблюдаема. Пусть tQ — заданный момент времени, z^ — заданный элемент из Rn, и — любой элемент U и х0 — PzQ. Существует время T t0 такое, что й(<о,П и y(to, г] = g (х0; U(t0, г]) достаточны для определения х0. Так как g[Pz(ty u(f), t] - g[x(t), u(t), /],^то = g (PzQ; #(f0,ri) = = h(z0; U(t0,T]) и» следовательно, знания h(z0; и достаточно для определения z0. Так как справедливо и обратное положение, то эта часть теоремы также доказана. 4.16. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную систему с постоянными параметрами вида х(0 = Ax(t) + Bu(f); (4.264) y(t) = Cx(t) + Du(t), (4.265) где Л, В, С и D — соответственно матрицы пХ п, nXm, р X п и р X пг и попытаемся обнаружить внутреннее содержание понятия управляемости для этого случая. 1 t-! может зависеть от и. 2 См. § 4.5. 187
Для начала предположим, что — управляемое состояние при /0. Существует Т О (Т = — /0) такое, что для некоторого и имеем 'о-И xQ = — J е~А ^-^Ви (т) dx, (4.266) где eAt — экспонента от At (см. § 3.21). Из выражения (4.266) и уравнения /о-Н т J е~А «-^Ви (т) dx = J е~А°Ви (a) do (4.267) видно, что х0 управляемо при 0. Иначе говоря, при исследовании, яв¬ ляется ли состояние х0 линейной системы с постоянными параметрами управляемым, мы можем принимать 0 за начальный момент времени. Далее, следует говорить об управляемом состоянии вообще, так как мы показали, что начальный момент времени можно выбирать произвольно. Мы показали, что для управляемости х0 при t необходимо и достаточно, чтобы Хо было управляемо при t = 0. Другим важным следствием выражения (4.266) является то обстоя¬ тельство, что множество состояний х0, являющихся управляемыми, есть подпространство из R^. Теорема 4.5 дает описание подпространства управляемых состояний в терминах матрицы системы А и матрицы В. Ясно, что если и — управляемые состояния, то существует траекто¬ рия, соединяющая х0 с хг. В частности, можно двигаться от 0 к любому управляемому состоянию. Упражнение 4.12. Покажите, что область состояний, управляемых при t = 0, является подпространством из Rn. Обозначим через р = 1,2,. . ., п — n-мерный вектор, являющийся р-м столбцом матрицы В: ^13 йр = (4.268) _Az3_, и пусть еар — /г-мерный вектор, определенный как еар = Ла&6; а = 0, 1, . . ., п — 1 ; р = 1, 2, . . ., т, (4.269) где Л° = I и Ла = А А • -А (а раз) для а > 0. Теорема 4.5. Линейная система с постоянными параметрами (4.264), (4.265) полностью управляема тогда и только тогда, когда векторы еа^ отображают все пространство Rn, т. е. только в том случае, когда любой элемент из Rn есть линейная комбинация векторов еа$ (см. § 2.5). Доказательство. Докажем эту теорему, дополнительно предположив, что матрица системы А не имеет комплексных собственных значений (пол¬ ное доказательство можно найти в [61 ]). Прежде всего предположим, что | — управляемое (при t = 0) состоя¬ ние системы. Существуют 0 и управление а* такие, что т — e~As Ви* (s)ds. (4.270)1 2 о 1 Напомним, что подмножество W векторного пространства V является его подпро¬ странством, если: 1) w2 € то Wi + w2 £ № и 2) если г g R и w С W, то rw g W (см. § 2.5). 2 Переменная s обозначает время, а не комплексную переменную. 188
Так как (см. § 3.21) со р = 0 и каждая п X п матрица удовлетворяет своему характеристическому уравнению (см. § 2.10, теорема 2.3), то п—1 e~As = S 4а(з)Ла, а=0 (4.271) где фа (s) — скалярные функции от s. Следовательно, /1—1 т — 1= 2 J 4>a(s)AaSu*(s)ds а=0 0 поскольку п—1 пг Г Т J%(sM(s)ds а=0£ = 1 Lo m U* (s) = S Up(s)e6> 3=1 где — элементы натурального базиса в Rn. Последнее (4.272) (4.273) (4.274) доказывает достаточность. С другой стороны, предположим, что | — элемент пространства Rn. Покажем, что существуют Т > 0 и управление я* такие, что т — e~As Bu* (s)ds. о (4.275) Допустим, что для момента времени Т >> 0 существует действитель¬ ная функция ср (s), удовлетворяющая условиям 1) ф<а> (0) = (Т) = 0 для а = 0, 1, . . ., п — 2, где ф(а) (s) обо¬ значает производную от ф (s) по s порядка а и ф(0) (s) = ф (s); 2) ф (s) > 0 на (0, Т); 3) матрица Q, определенная как Q = J ф ($)е~Л5 ds, (4.276) о — невырожденная. Так как каждый элемент из Rn есть линейная комбинация еа8, то можно записать - Q-’l = S аа^еа6, (4.277) а, 3 где яа3 — действительные числа. Управление и* (s) с компонентами (s), определяемыми соотноше- НИЯМИ /1—1 «P*(S)= S аа₽ф(а)(з), (4.278) a=0 переводит g в начало координат за время T. Далее, Т п—1 m Г Г j e-^Bu^^ds = 2 ^аз J T(a)(s)e~4sds (4.279) о а=0 3=1 Lû J 189
Поэтому достаточно показать, что J Ф(а> (5)е-Л5 ds = QAa. о С помощью выражения (4.275) получим т — QQ-^l = — £ = j e~AsBu* (s) ds. О (4.280) (4.281) Выражение (4.280) легко доказать методом индукции по числу а, используя формулу (4.276) и интегрируя по частям на основе соотноше¬ ния (3.278). Теперь остается показать, что соответствующая функция ф (s) суще¬ ствует. Такой функцией является <p(s)= s2n(T — s)2n, (4.282) и она, очевидно, обладает свойствами 1 и 2. Покажем, что матрица т Q = §<f(s)e~Asds (4.283) о — невырожденная. Пусть J — жорданова каноническая форма А (см. § 2.10). Существует невырожденная матрица Р такая, что Р~гАР = J и ед (т-s) == p-\eJ a-s)p^ > (4.284) гр Д Т Так как матрица е невырожденная, то достаточно доказать, что матрица т PeATQP~x = J ф (s)/(r-s> ds (4.285) о невырожденная. Но eJ (T~S} — треугольная матрица с элементами eKi(T~s} вдоль диагонали, где — собственные значения (необязательно раз¬ личные) матрицы А (см. § 3.22). Следовательно, т п г т det J q(s)eJ ds = П J ^{s)eKiSds о i==i L о (4.286) и поэтому правая часть выражения (4.285) есть невырожденная матрица, так как т J Ф (s)eÀ‘s ds> 0 (4.287) о для любого і (см. теорему 3.8). Итак, теорема доказана. Ее важными следствиями являются: Следствие 4.4. Подпространство управляемых состояний системы (4.264), (4.265) то же самое, что и отображение векторов еа^ (4.269). Иначе говоря, х0 управляемо в том и только в том случае, когда лг0 — линейная комбинация векторов еар. Следствие 4.5. Пусть G — матрица п X пт, определенная соотно¬ шением О = [я ; АВ ; А2В ; . . . ; Д'-’л] (4.288) или эквивалентным соотношением б? [*01, #02» • > ^От { £ц> ^12> • • • > *іт! • • ■ еп_12, , еп_1т], (4.289) 190
где вектора eaft определяется соотношением (4.269). Система полностью управляема тогда, когда ранг G равен п, т. е. ранг G = п, (4.290) или, иначе говоря, в том случае, когда в G имеется п линейно независимых векторов-столбцов. Следствие 4.6. Если В есть п X 1 матрица Ь, т. е. если управления являются скалярными величинами, то система полностью управляема в том и только в том случае, когда п X п матрица . ;An-1&] (4.291) невырождена, или, полагая в том и только в том случае, когда b\ 1 7 e—. >1 /=1 /=1 det G = det Ь2 /=i n ■ /=1 ¥=0, (4.292) bn /=1 /=1 где — элементы матрицы Ak. Следствие 4.7. Если матрица системы А—диагональная матрица с различными элементами, то система полностью управляема, если матрица В не имеет нулевых строк. Последние два следствия дают простые правила для определения, является ли система полностью управляемой. Пример 4.10. Рассмотрим систему _*2_ (4.293) Управляема ли она? В есть вектор-столбец b = и АЪ — вектор j^. Следова¬ тельно, система управляема. Пример 4.11. Рассмотрим систему *1 ’1 Г + ’ 1 ’ _X2 _ _X2 _ _ 0 _ и. (4.294) Управляема ли она? В есть вектор-столбец b = [q] и Ab — вектор Следова¬ тельно, b и Ab не отображают /?2, и система не является управляемой. Пример 4.12. Рассмотрим систему — "о Г xl + 1 Г «1 (4.295) _x2 _ _1 2 _X2 _ 0 2_ _«2 _ 191
Управляема ли она? В — 2X2 матрица Л—2X2 матрица J,] и АВ — 2 X 2 матрица £ Итак, G — [В > ДВ] есть 2X4 матрица: Г—1 1 о 21 G = [ 0 2 -1 5J Ранг G равен 2, следовательно, система управляема. Векторы gj и линейно независимы. Любые два вектора-столбца матрицы G в данном случае линейно независимы. Упражнение 4.13. Покажите, что невозможно найти решения уравнения (4.294), начинающегося в точке и оканчивающегося в точке Упражнение 4.14. Какие из приведенных систем полностью управляемы? Упражнение 4.15. Какиім условиям должны удовлетворять Ьъ Ь2 и Ь3, чтобы обес¬ печивалась полная управляемость системы *1 A, 1 0 *1 *2 — 0 A 1 x2 + Ьг -А'з _ .0 0 _*3_ Упражнение 4.16. Рассмотрите нелинейную систему хх = а^'Л'з + х2 = а2ххх3 + w2; х3 = а3ХіХ2 + и3, где ах + а2 + а3 = 0. Можно ли показать, что эта система управляема? 4.17. НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную систему с постоянными параметрами вида x(t) = Ах (/) + Bu(t)\ (4.296) у(0 = Сх(0 + Du (t'y (4.297) где Л, В, С и D — соответственно п X п, п X т, р X п и р X т матрицы. Определим, какой смысл заключен в понятии «наблюдаемость системы». Предположим, что х0 наблюдаемо при /0- Тогда состояние лг0 является наблюдаемым и при t = 0. Для того чтобы показать это, будем считать и заданным элементом из U и примем, что я(/) = я(/—/0), (4.298) где <о есть элемент U. В силу наблюдаемости х0 при t0 можно заключить, “то существует 7^0, такое, что v{tot to+T] и y(tût /û+rj = g (xQ; ѵщ> t^T]) определяют лг0. Из соотношения = х0) = = еА (t~to> I x0 + J e~A (T) dx (4.299) I J 192
для Z из [Zo, t0 + 74 следует, что y(t) = СеА ! х0 + J е-А fT-'»>£ü(r) с/т ! + Dv(t) (4.300) I /о J для t из Uo, t{} + Т]. Если произвести замену переменных s = t— Zo; о т — /0, то уравнение (4.300) с помощью соотношения (4.298) запи¬ шется в виде у (s) = СеАѣ j xQ + J e~A°Bu(o)do ? + Du(s) (4.301) l о J для s из [0, 74. Следовательно, a(0, г] и y(o, т] = g (x0; Д(о, rj) опреде¬ ляют x0. Итак, для линейной системы с постоянными параметрами достаточно рассматривать наблюдаемость при t = 0. Иначе говоря, линейная система с постоянными параметрами наблюдаема в том и только в том случае, когда она наблюдаема при t = 0. Если Хо наблюдаемо при t = 0, то знания У(0, т] = g (лго,* 0) для неко¬ торого T Г> 0 достаточно для определения х0. Справедливо и обратное положение. Если мы знаем свободное движение системы, начиная с х0 (см. 3.19), то этого достаточно для определения х0, и х0 наблюдаемо. Для доказательства этого утверждения заметим, что если а есть элемент из Ut то у(О = Сдб(/; а(0,п; xQ) + Da(t) = (4.302) {г ) a;0+р-ЛтВи(т)гіт +£>«(/)= (4.303) 0 J t = y°(t) + C ^e~AxBu(x)dx + Dn(t). (4.304) Ü Из выражения (4.304) следует, что если у°0, т] определяет Хо, то вели¬ чины U(o, т] и у(0, г] определяют х0- Предположим теперь, что х0 и хг— два наблюдаемых состояния при t = 0, причем Хо¥=^і- Если через у° (0 и у? (/) обозначить выходы системы, начиная с х0 и хг соответственно, производимые управлением и (т) = 0 (т — любое), то мы знаем, что yQQ(t) = CeAtxQ-, (4.305) y?(Z) = Сел*Хі. (4.306) Существует (например, Т), для которого yg(7)^y?(T). (4.307) Если бы уо (0 = yî (0 для любого t > 0, то знание уо на любом интервале (0, t] не позволило бы определить состояние х0, которое в этом случае ненаблюдаемо. Следовательно, если любое состояние наблюдаемо (для t = 0), то преобразование, связывающее каждое из состояний х с соответствующей (свободной) выходной функцией у (t) = CeAtx, будет взаимооднозначным (см. § 2.4). Выше указывалось, что множество управляемых состояний является подпространством из Rn. Справедливо ли это для множества наблюдаемых состояний? Очевидно, что если х0 наблюдаемо, то и гх0, где г Ç R, также наблюдаемо. Предположим, х0 и хх наблюдаемы. Тогда состояние х0 + х1 7 Лтанс и др. 193
также наблюдаемо. Прежде чем доказать справедливость этого утвержде¬ ния, рассмотрим более внимательно, что означает наблюдаемость для линейных систем с постоянными параметрами. В частности справедлива следующая теорема. Теорема 4.6. Обозначим через і = 1, 2, . . ., р /г-мерный вектор- столбец, компонентами которого являются элементы і-й строки матрицы С, например где С = (cit). (4.308) Пусть wki, k = 0, 1, . . ., п — 1, і = 1, 2, . . ., р есть n-мерный век¬ тор, заданный как wki=ÀkCi, (4.309) где А к — транспонированная [см. уравнение (2.45) ] матрица Ак. Пусть X — наблюдаемое состояние и rki — действительное число, определенное как ГЫ = <Wki> ху, (4.310) т. е., если wkij — j-я компонента wki и — j-я компонента х, то п (4.311) /=і Пусть Х\, Х2, . . Хп —п неизвестных. Рассмотрим систему урав¬ нений п Гм = k = 0- 1 И— 1; І = 1, . . . , р. (4.312) /=і Тогда х является единственным решением системы (4.312). С другой стороны, если уравнение (4.312) имеет единственное решение X/ = yh / = 1, 2, . . ., п, то вектор у с компонентами у} является наблюдаемым состоянием системы. Доказательство. Так как состояние х наблюдаемо, то существует Т 0 такое, что у (/) = CeAtx на [0, Т\ однозначно определяет х. Тогда і-я компонента yt (/) вектора у (/) выражается как п-1 = S ^t)(Àkc\, X) = (4.313) /г=0 п-1 = S х) = (4.314) fe=0 п—1 = 2^(0^, (4-315) /г=0 П— 1 оо где eAt = так как eAt = J] (см. § 3.21) и любая п X п матрица является корнем своего характеристического уравнения [по теореме (2.3)]. По определению л: есть решение уравнения (4.312). Если существует другое решение х', то из выражения (4.315) следует, что y(t) = CeAtx' (4.316) 194
на [О, Т] и, следовательно, у(0, г] не позволяет однозначно определить х. Итак, X есть единственное решение уравнения (4.312). Мы предлагаем читателю доказать справедливость обратного утвер¬ ждения теоремы. Следствие 4.8. Если лг0 и наблюдаемы, то х0 + х± также наблю¬ даемо. Упражнение 4.17. Докажите следствие 4.8. Указание: Пусть х0) = X1)=rkll, тогда {Wkt, xQ Д- Xi) = rkio + rki\- Решениями какого уравнения являются компоненты вектора х0 + Х^ Почему они являются единственным решением этого уравнения? Ответ на последний вопрос может быть получен с помощью доказатель¬ ства от противного. Следствие 4.9. Если х наблюдаемо, то CeAtx однозначно определяет X на любом интервале [О, T], Т > 0. Следствие 4.10. Система полностью наблюдаема в том и только в том случае, если каждый вектор х есть линейная комбинация векторов wki (см. § 2.5). Следствие 4.11. Подпространство наблюдаемых состояний есть отоб¬ ражение векторов wki. Иначе говоря, х наблюдаемо тогда, когда лг0 есть линейная комбинация wki. Следствие 4.12. Пусть Н — п X пт матрица, определенная соотно¬ шением Н =[с\АС'\ . . . >(Л')П-1С]. (4.317) Система полностью наблюдаема в том и только в том случае, когда ранг матрицы Н равен п, или, что эквивалентно, если в матрице И имеется п линейно независимых столбцов. В частности, если С есть матрица раз¬ мера 1 X п (вектор-строка г, выходом является скалярная функция), то система полностью наблюдаема в том случае, когда п X п матрица Н=\с\Ас\. . . ;(4')"~V] (4.318) невырожденная (см. следствия 4.5 и 4.6). Следствие 4.13. Если матрица системы А —диагональная с различ¬ ными элементами, то система полностью наблюдаема, когда матрица С не имеет нулевых столбцов (см. следствие 4.7). Два последних следствия дают простые правила проверки наблюдае¬ мости систем. Пример 4.13. Рассмотрим систему RJ Го ЯpJ_L.ro 1. иг] |_б 9J |_-^2 J L 1 J , (4 * = 110][2]=хг Наблюдаема ли она? Так как с' = |gj и А'с' — j^j, то система наблюдаема. Пример 4.14. Наблюдаема ли система (4.320) и (4.321) Имеем с' = |д| и А'с' = Следовательно, система ненаблюдаема. Если рассмотреть единичную массу, движущуюся без трения, обозначив через (/) — положение точки, а через х2 (0 и и (t) — соответственно ее скорость и приложенную силу, то и х2 будут соответствовать уравнению (4.320). Выход у, представляющий собой ско¬ рость точки, может возникнуть в случае наблюдения системы с помощью радара, исполь- * 195
зующего эффект Допплера, который измеряет величину относительной скорости. По ско¬ рости можно определить положение, но лишь с точностью до неизвестной постоянной. Этот случай представляет собой один из примеров ненаблюдаемости системы. Упражнение 4.18. Рассмотрите систему хі (0 — #ііхі (0 + аі2х2 (О ~Ь biu (Oî х2 (/) a2lxr (0 + а22х2 (t) + b2u (/); У(*) = СіХі (/) + с2х2 (t). Требуется получить условия, при которых система ненаблюдаема и неуправляема. Может ли рассматриваемая система быть одновременно ненаблюдаемой и неуправляемой? Проиллюстрировать результат, подобрав нетривиальные числовые значения. Дать схему модели на АВМ. Объяснить с ее помощью неуправляемость, ненаблюдаемость или то и другое одновременно. Упражнение 4.19. Рассмотрите систему Xt — axt 4- Û)X2 г bvw, х2 — — œxj 4- ах2 4~ b2u\ У = xi при œ 4= 0. Покажите, что система управляема, за исключением случая, когда bt = b2~ 0, и что система наблюдаема. ФИЗИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ПОНЯТИЯ НОРМАЛЬНОСТИ 4.18. РЕГУЛИРОВАНИЕ ВЫХОДА До сих пор мы уделяли мало внимания физическому смыслу поня¬ тий управляемости и наблюдаемости. Постараемся исправить такое положение, рассмотрев в этом и двух последующих параграфах некоторые практические стороны приведенных выше понятий. В данном параграфе разберем задачу о регулировании выхода. Рассмотрим линейную динамическую систему с постоянными пара¬ метрами: x(t) = Ax(t)+Bu(ty, (4.322) y(t) = Cx(t) + Du(t). (4.323) В инженерной практике часто представляет интерес перевести выход системы у (/) в 0 и удерживать его в этом состоянии при отсутствии даль¬ нейших возмущений. Регулируя выход, мы желаем найти: 1) управление, переводящее выход системы у (?) в 0; 2) управление, удерживающее выход в этом состоянии после переход¬ ного процесса. Примем tQ — 0 и предположим, что мы нашли управление такое, что у(Т) = 0. (4.324) Будем считать нашу систему наблюдаемой, т. е. мы можем вычислить начальное состояние xQ при t = 0. Так как уравнение (4.322) — линейное с постоянными коэффициентами, то выражения (4.324) и (4.323) дают соотношение {г eAtx0 + eAt J e~AxBu(T)dr [ + Du(T) = 0. (4.325) o J Предположим теперь, что система еще и управляема. Это означает, что мы можем найти такое управление а(0, rj, при котором х (Т) = 0. Если X (t) = 0 и и (t) = 0 для t > Т, (4.326) то у (/) = 0 для любого t^T. (4.327) 196
Следовательно, если система полностью управляема и полностью наблюдаема, то можно регулировать ее выход. Отметим, что управляемость и наблюдаемость дают достаточные условия регулирования выхода, не являясь, конечно, необходимыми. Обнаружить это можно, регулируя выход и определяя такое управление и (0 для t >> Т, когда решение уравнения х (f) = Ах (t) + Ви (0, обозначенное через х (0 для t Т, удовлетворяет уравнению (4.328) Обозначим через Н множество х (Т), для которых можно найти управление и (0. Если система управляема, то можно 1 перевести систему из лг0 в Н. Если система неуправляема, то и в этом случае можно найти управление, переводящее х0 в Н. Пример 4.15. Для иллюстрации рассмотрим простую систему второго порядка *1 (t) х2 (О О 1 хх (О О — 1 J L х2 (Z) У (0 = (О U (0; (4.329) (4.330) Легко видеть, что система наблюдаема, но не управляема. Пусть и ^2 обозначают начальные значения фазовых координат хх (t) и х2 (/). Простое интегрирование уравне¬ ния (4.329) позволяет получить х2 (0 = £ге ‘ ; t (/) = - |2е~' + g, + У и (т) dx. (4.331) Так как система наблюдаема, то |х и £2 можно вычислить, зная выход у (t). Пусть Т — заданное время и требуется найти такое управление, чтобы у (Т) ~ 0. Так как у (/) = хх (/), то нужно получить хх (Т) — 0. Если для любого t Т хт (/) ~ 0, то у (t) — 0 также для любого t^T. Эти рассуждения определяют множество Н в пло¬ скости состояний ххх2. Очевидно, таким множеством является вся ось х2. Пусть и (t) — k является постоянной величиной, тогда при t = Т из уравнения (4.331) получим о =ХХ(7) =|1-а2е-г + ^ + kT. (4.332) Это означает, что постоянное управление и (0 = k = h , 0 < t < T (4.333) переводит выход в нуль при t — Т. Далее задача состоит в том, чтобы удерживать выход в этом состоянии, т. е. удерживать состояние на оси х2. Для Т управление u(t)=- х2 (t} = - . t > Т (4.334) дает [см. (4.329)] хг (/) = 0 для /> Т, и, следовательно, хх (/) — у (t) — 0 для t^> Т. Итак, мы можем регулировать выход, хотя система и не является управляемой. Аналогич¬ ный случай будет рассмотрен в § 4.20, но там мы потребуем, чтобы управление было огра¬ ниченным. Рассмотрим систему (4.329) с выходом z/(/) = х2 (0- (4.335) Система (4.329), (4.335) неуправляема и ненаблюдаема. Нетрудно убедиться, что в этом случае регулировать выход нельзя. Разберем другие примеры, интерпретирующие понятия управляемо¬ сти и наблюдаемости. При этом отметим, что часто ненаблюдаемость или 1 В этом случае управляемость означает, что любое состояние достижимо из любого другого состояния. 197
неуправляемость системы означают, что имеется больше фазовых коор¬ динат, чем это необходимо. Для иллюстрации рассмотрим физическую систему, показанную на рис. 4.12. Постоянные kly k2, k3 и k4 — коэффи¬ циенты усиления; хг (/), х2 (/), х3 (О и (О — выходы четырех интегра¬ торов. Выход у (/) —сумма переменных xz, і = 1, 2, 3, 4. Нетрудно показать, что вектор ГХ1 (/) х(/)- (4.336) Lx4(/)J можно рассматривать как вектор состояния, и описать физическую си¬ стему, приведенную на рис. 4.12, уравнениями x(t) = 0х(/) -1- ^2 ^3 - &4 - (4.337) y(t) = [l 1 1 1] x(t). (4.338) Читателю легко убедиться, что ниями (4.337) и (4.338), неуправляема система, описываемая уравне- и ненаблюдаема. В то же время Рис. 4.12. Аналоговая модель физической системы нетрудно доказать, что вы¬ ход удовлетворяет дифферен¬ циальному уравнению y(t) = ku(t) (4.339) где k = ki k2-\- k^. (4.340) Если k 0, то нетрудно заметить, что система z(/) = te(Z); (4.341) r/(/) = z(Z) (4.342) и управляема, и наблюдаема. Следовательно, выход ее можно регулиро¬ вать и рассматривать z (t) = у (t) как состояние системы. Очевидно, что с точки зрения связи входа с выходом системы (4.337), (4.338) и (4.341), (4.342) эквивалентны. Этот простой пример пока¬ зывает, что выбор состояния системы и особенно размерности фазового пространства с точки зрения связи выхода со входом системы является весьма существенным. Если же размерность фазового пространства больше, чем это необходимо, то система оказывается неуправляемой и ненаблю¬ даемой. В работе [212] содержится строгое изложение этих идей. В работе [35] приведены полезные соотношения для систем, рассматриваемых с точки зрения выхода, с использованием понятия управляемости. 4.19. ЭФФЕКТ СОКРАЩЕНИЯ ПОЛЮСА С НУЛЕМ В этом параграфе мы покажем, что обычные способы сокращения полюса с нулем, применяемые при проектировании следящих систем, приводят, согласно нашему определению, к неуправляемым системам 198
(или неполностью управляемым). Рассмотрим систему с различными соб¬ ственными значениями, фазовые координаты которой удовлетворяют диф¬ ференциальным уравнениям [см. уравнение (4.199)] хг(/) = \хД/) + vzu(0, 4 = 1,2, . . ., п, (4.343) где vt — вычет передаточной функции H (s) [уравнение (4.170)] в і-м полюсе. Если предположить, что в передаточной функции H (s) [см. (4.170)] ох = sx, (4.344) т. е. что в точке s = sx = ох находятся полюс и нуль передаточной функ¬ ции, тогда уравнение для фазовой координаты хх (/) запишется в виде хх(/) = s1x1(/)+ ^(/), (4.345) где = рх, вычет H (s) при sx = Àx. С помощью выражения (4.202) имеем 1-Р1- (M - X2) (Xj - Хз) . . . (Xi - X„) ~U’ (4.34b) так как Àx = sx = ox. Итак, xx (/) = sxxx (/), (4.347) и поэтому, согласно следствию 4.7, система неполностью управляема. 4.20. ПРАКТИЧЕСКИЙ ПРИМЕР С практической точки зрения управление системой означает, что мы заставили выход изменяться желаемым образом. Имея это в виду, рас¬ смотрим проявления неуправляемости на следующем примере. Скалярный выход у (/) связан с ее скалярным входом и (/) линейным дифференциальным уравнением второго порядка ÿ(0 + 2у (/) + y(t) = u(t) + u(t). (4.348) Передаточная функция системы имеет вид = H(s) = 5 + 1 = s + 1 /4 349) U (S) n{S) S2 + 2s + 1 (s + l)2 (4.<54У) В полученной передаточной функции имеются два полюса и один нуль, все при s = —1. Следуя порядку, описанному в § 4.10, определим фазовые координаты zx (/) и z2 (/), полагая = (4-350) г2(/) = г/(/) — «(/). Тогда Попробуем показать, что система неуправляема. Для проверки этого утверждения образуем матрицу G = [b\Ab] = (4.352) 199
Ее детерминант равен нулю. Используем следствие 4.6, и применим к уравнению (4.351) преобразование подобия, преобразующее матрицу А в ее каноническую жорданову форму (см. § 2.10). Пусть и (4.353) (4.354) Тогда J — искомая каноническая форма. Примем, что X = Р'Ч (4.355) •МО == Zj(Z) = y(f); (4.356) х2(0 = г, (Z) + г2(0 = y(t) + y(t) — u(f). Новые фазовые координаты Хі (t) и х2 (/) удовлетворяют Xj(/) — ' — 1 г *1(0 + ■ 1 ■ «(/). Л (0‘. 0 — 1 .*2 (0. 0_ уравнению (4.357) Если принять, что (0) = х2 (0) = g2, то решение уравне¬ ния (4.357) запишется в виде t Xi(t) = Ue~‘ -|- ет«(т)Л; (4.358) О х2(0=^е_<- (4.359) Теперь попробуем для заданных начальных значений и |2 найти управление, переводящее выход# (/) в нуль и заставляющее его оставаться равным нулю в дальнейшем. Итак, мы хотим найти такое управление, чтобы для некоторого Т выполнялось #(/)=0 #(/) = 0 для t Т; для t>T. (4.360) Это требование к выходу эквивалентно требованию к фазовым коор¬ динатам лд (/) и х2 (^) уравнения (4.356): х,(0 = 0 для ✓ >\ /хч , . ™ (4.361) x2(t) =— u(t) для t>T. Из выражения (4.358) заключаем, что любое управление и (t), удов¬ летворяющее соотношению т - JeTU(T)dT = g1 + Ê2T, (4.362) о действительно переводит х± в нуль за время Т, а из выражения (4.359) находим, что управление u(t) = — £2е“* для t>T (4.363) обеспечивает выполнение условия у (t) = 0 для Т. Итак, хотя си¬ стема и неуправляема, выходную величину и ее производную можно сде¬ лать равными нулю. 200
Наложим ограничения на величину управления в виде \и (0| < М для любого t (4.364) (сравните с примером 4.6). Можно ли найти управление, удовлетворяю¬ щее ограничению (4.364) и переводящее выход у (t) и его производную у (t) в нуль? Если £2 и Ттаковы, что существует управление и (/), | и (/) | < М такое, что т = + (4.365) и то (Г) будет равно нулю, но £2 может оказаться таким, что ||2е~'|>Л4 для 7 < / < Г'. (4.366) Следовательно, не существует управления, удовлетворяющего огра¬ ничениям (4.364) и (4.363). Иначе говоря, для таких и g2 выход и его производная не могут быть сделаны равными нулю в течение заданного времени х. Аналогичные задачи будут рассмотрены в § 7.13. 4.21. НОРМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 2 В этом параграфе мы рассмотрим понятие нормальности. Нормальная система — это такая система, которая является управляемой по отноше¬ нию к каждой из компонент ^ (/), и2 (0, • • -, (/) управления и (/). Мы ограничимся обсуждением случая линейной системы с постоянными параметрами, хотя понятие нормальности может быть определено и в более общем виде. Заметим, что понятие нормальности будет широко использо¬ ваться в гл. 6. Рассмотрим линейную систему с постоянными параметрами *(/) = Лх(/) + (4.367) где А и В — матрицы, соответственно размера п X п и п X т. Пусть р = 1, 2, . . ., т обозначает n-мерный вектор, образующий р-й стол¬ бец матрицы В: ^10 ^23 (4.368) Иначе говоря, ‘t ! t ! ! tl В = bi ! ^ ! - • .\bm -1 1 4 1 1 1- 1 Так как и (t) ограничено, то существует время t* (зависящее от и g2), которое величина Т должна превосходить, для того чтобы было возможно решить задачу. Время Т может быть много больше, чем t*. 2 Понятие нормальности было введено в [142] по отношению к системам, оптималь¬ ным по быстродействию. (4.369) 201
Определение 4.15. Нормальность. Говорят, что система (4.367) нор¬ мальна, если каждая из систем x(t) = Ax(t) + b2u(t). (4.370) x(t) = Ax(t) + bmu(t) ‘ полностью управляема (см. определение 4.13), где b$—столбцы ма¬ трицы В из уравнения (4.367) [т. е. Ь$ определяются уравнением (4.368)]. Рассмотрим физический смысл этого определения и его связь с управ¬ ляемостью системы X (t) = Ах (t) + Ви (0. Для того чтобы ответить на эти вопросы, представим систему в виде, изображенном на рис. 4.13. На рис. 4.13 на каждую из компонент и± (0, и2 (0, . . ит (0 вектора и (t) «действуют» соответствующие «векторы усиления» blf b2, • • -, Ьт, в ре¬ зультате чего получаются «векторные сигналы» Ь1и1 (0, Ь2и2 (0, . . ., • • •> bmum (t). Эти векторные сигналы суммируются и образуют сиг¬ нал Ви (0. По сути дела, это просто графическое представление уравне¬ ния вида Bu(t) = t I f I &1 I *2 I • 4 111 «1 (О U2 (/) = (/) + b2u2 (/)+•••+ Ьпіит(і). (4.371) На рис. 4.13 показано также т нормально закрытых ключей 1,2,..., . . ., т. Каждый ключ, размыкаясь, заземляет соответствующую компо¬ ненту вектора и (t) независимо от его остальных компонент. Если, на¬ пример, ключ (3 разомкнут, то и6 (0 = 0 для любого t. Если теперь система х (0 = Ах (t) + Ви (і) полностью управляема и все ключи замкнуты, то можно найти скалярные сигналы их (0, г], ^2(0 тр • • •» ит(о гр переводящие систему из любого начального состоя¬ ния ’ х0 в 0 в течение времени 71, которое может зависеть от х0. Предположим, что мы разомкнули все ключи за исключением первого, тогда получим &2«2 (/) = Ь3и3(і) = ... =bmum(t) = O. (4.372) 202
На движение системы можно воздействовать только с помощью ска¬ лярного управления и± (/). Теперь система описывается уравнением вида x(t) Ax(t) + biu1(t). (4.373) Необходимо определить, существует ли кусочно-непрерывная функ¬ ция их (0 Т] для заданной системы (4.373) и начального состояния х0 при = 0, переводящая систему из х0 в 0. Такое управление существует в силу следствия 4.6 тогда и только тогда, когда система (4.373) управляема, или эквивалентно, если матрица размера п X п G^b^Ab^ . . .'Л^Ч] (4.374) невырожденная. Аналогично, если разомкнуть все ключи за исключе¬ нием |3, то система (4.367) запишется в виде х(/) — Ax(t) + b$Uç,(t). (4.375) Управление up(0 т„ переводящее систему из xQ в 0, можно найти в том и только в том случае, если п X п матрица С7₽ = [&₽,;л^; . . .!лп-’&3] (4.376) невырожденная. Термин «нормальность» означает, что система управляема по каждой из компонент управления и, следовательно, нормальность предполагает, что система полностью управляема. Более того, справедлива следующая теорема: Теорема 4.7. Система х (t) = Ах (Z) + Ви (/) нормальна тогда и только тогда, когда det Gp Ф 0 для всех р = 1, 2, . . ., т, (4.377) где Ор — матрица размера /г X /г, С₽=[&Р:Л&₽!. • - (4.378) и &р — р-й столбец матрицы В. Из примера 4.16 видно, что не каждая управляемая система является нормальной. Пример 4.16. Рассмотрим систему Хі (/) і2 (/) (4.379) где а — некоторая постоянная величина. Прежде всего система (4.379) управляема при Г1 а — 3 — За всех значениях а, потому что матрица G = I $ [1 1 г з“| и . Для исследования нормаль- 1J L — ности системы образуем две матрицы Gj и G2 [см. уравнение (4.378)]: '1 — 3’ 'а — За 2 10 (4.380) _1 — 5J’ где Оі всегда невырожденная, тогда как О2 невырожденная лишь для а 0. Итак, система нормальна лишь при условии a 0. При а — 0 система (4.379) не яв¬ ляется нормальной, но остается управляемой. Нетрудно заметить, что если а = 0 и их (t) — = 0, то система (4.379) превращается в систему À (0 =-3%! (0; Х2 (0 = — 5Х2 (0 + 2«2 (t). В этом случае управлять координатой xr (t) с помощью одного только сигнала управления и2 (t) невозможно. (4.381)
ГЛАВА 5 УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МИНИМУМА И УРАВНЕНИЕ ЯКОБИ —ГАМИЛЬТОНА 5.1. ВВЕДЕНИЕ Задача оптимального управления состоит в том, чтобы найти управле¬ ние а*, минимизирующее заданный функционал преобразования J (и) Ч Целью настоящей главы будет развитие некоторых весьма общих условий оптимальности управления к*. Мы будем предполагать, что имеется неко¬ торое решение задачи оптимального управления а*, и попытаемся сделать из этого некоторые выводы. Эти результаты позволят нам найти способ судить о том, может ли данное управление быть решением поставленной задачи. В последующих главах будет показано, что эти общие условия имеют большее значение для решения практических задач управления. Так как задача оптимального управления является задачей миними¬ зации, нам придется иметь дело с отысканием экстремумов. Поэтому часть настоящей главы посвящена изучению задач минимизации. При этом имеется в виду получение необходимых условий минимума. Вначале рас¬ сматривается обычный минимум, т. е. минимум действительных функций, определенных на эвклидовом пространстве Rn; затем исследуются мини¬ мум функционалов и принцип минимума Понтрягина. Результаты минимизации используются для получения классического принципа минимума (методами вариационного исчисления) для задачи управления с незакрепленным концом. Этот классический принцип мини¬ мума послужит основой развития известного принципа минимума Пон¬ трягина 1 2, который и дает необходимые условия оптимальности. В конце главы рассматриваются условия достаточности, основанные на уравнении Якоби—Гамильтона и принципе оптимальности. Перед тем как перейти к детальному изучению проблем минимизации, отметим роль, которую играют необходимые условия при практическом отыскании решений. Использование необходимых условий обычно ограни¬ чивает количество управлений, которые могут представлять решение поставленной задачи. Далее методом исключения можно определить, какое из управлений является наилучшим. Часто встречается случай, когда существует единственный элемент, удовлетворяющий необходимым усло¬ виям. Следовательно, этот элемент и должен быть искомым решением (если он существует). Важность этих замечаний читатель будет все глубже понимать по мере дальнейшего чтения данной книги. 1 См. определение 4.9. 2 См. сноску на стр. 21. 204
К материалу V гл. относятся работы [20], [23], [26], [30], [31], [33], [37], [40], [43], [45], [47], [49], [53], [54], [68], [79], [80], [87], [89], [91], [112], [115], [116], [131], [132], [148], [158], [169], 1171], [177], [179], [188], [190], [191], [204], [207] и [208]. 5.2. ОБЫЧНЫЙ МИНИМУМ Изучение необходимых условий оптимальности мы начнем с рассмо¬ трения теории обычного минимума. Эта теория позволяет решать задачи отыскания точки или точек, в которых некоторая действительная функ¬ ция /, определенная на области эвклидова пространства 7?п, имеет мини¬ мум. Ниже мы дадим точное определение понятий минимума и абсолют¬ ного минимума для такой функции f и опишем некоторые необходимые и достаточные условия для их отыскания. В следующем параграфе будет показано влияние некоторых допол¬ нительных ограничений на эту зада¬ чу. Если f — действительная функ¬ ция, определенная на всем R, то имеем следующие два определения. Определение 5.1. Точку х* из R называют (локальным) минимумом функции /, если существует число е •> 0 такое, что при | х — х* | «< е f(x*)<f(x). (5.1) X Рис. 5.1. Виды минимумов Иначе говоря, х* есть локальный минимум /, если f (х*) не превы¬ шает f (х) для любого X в окрестности х* (т. е. для х, близких к х*). Определение 5.2. Точку х* из R называют абсолютным миниму¬ мом /, если /(х*)</(х) (5.2) для всех X из R. Очевидно, что абсолютный минимум f является также локальным минимумом f и что локальный минимум может не быть абсолютным мини¬ мумом (рис. 5.1). На практике часто представляют интерес действительные функции /, определенные не на всем R, а на интервале из R [см. уравнение (3.7)]. В этом случае понятия минимума и абсолютного минимума полностью аналогичны понятиям, сформулированным в определениях 5.1 и 5.2. Имея в виду эти определения, предположим, что f — действительная функция, определенная и непрерывная на замкнутом интервале [а, Ь]. По теореме 3.7 f может иметь абсолютный минимум на Іа, Ь]. Попробуем его отыскать. Прежде всего, если х — внутренняя точка интервала la, b], т. е. х принадлежит открытому интервалу (а, Ь), и производная /' (х) существует и не равна нулю, то точка х не может быть минимумом /. Таким образом имеем первое необходимое условие: 1. Если X* — внутренняя точка из [a, b], f' (х*) существует их* — минимум /, то Г(х*) = -^-(х*) = °. (5.3) Точка X, в которой /' (х) равна нулю, называется экстремумом функ¬ ции /. Можно заключить, что абсолютным минимумом f могут быть эк¬ стремумы /, конечные точки интервала а и b и точки из (а, Ь), в которых производной / не существует. 205
Предположим, что f' (х) — кусочно-непрерывная функция \ имеющая конечное число разрывов на [а, Ь]. В этом случае имееі^ второе необ¬ ходимое условие: 2. Если внутренняя точка х* из [af Ь] является минимумом /, то /'(х*) = 0 (5.4) или lim и lim/'(x)<0. (5.4а)1 2 Х-+Х*+ х->х*— Если а — минимум /, то 1іш/'(х)>0; (5.5) и если b — минимум /, то limf'(x)<0. (5.6) х-> Ь— Различные примеры этих условий иллюстрируются с помощью рис. 5.2. С целью лучшего освоения этого понятия целесообразно краткое обосно- /W вание необходимого усло¬ вия 2. Пусть X* — внутрен¬ няя точка [a, Ь], являю¬ щаяся минимумом /. При t достаточно малом f(a+)>0 f’M-0 f’iïrW f(b-)<0 f’M>0 Рис. 5.2. К необходимому условию 2 О <|/|<е (5-7) имеем f(x* + O>/(**)- (5.8) Назовем х* + t возмущением х*. Если f (х) существует, то на осно¬ вании определения f можно написать Дх* + /) — /(X*) = -f- 0(/), (5.9) где через 0 (/) обозначен поправочный член, обладающий свойством Нщ2Д1 = 0. (5.10) Таким образом, f (х* + /) приблизительно равна f (х*) + tff (х*). Если предположить, что f' (х*) положительна, то для t <<0 мы получим, что разность f (х* + 0 — f (х*), равняясь приблизительно tf' (х*), ока¬ жется отрицательной. Мы пришли к противоречию, так как х* является минимумом /. Мы предлагаем читателю обосновать утверждение для слу¬ чая, когда /' (х*) не существует. Упражнение 5.1. Необходимо показать, что если х* —внутренняя точка из [a, ô], являющаяся минимумом f, и f' (х*) не существует, то lim f' (х) 0. Указание: х->х*4- Если 0, то Упражнение 5.2. Необходимо показать, что наличие члена 0 (/) в уравнении (5.9) не мешает доказательству, т. е. с его учетом предположение f' (х*) > 0 приводит к про¬ тиворечию. Указание: Если f' (х*)> 0, то существует 0 такое, что f' (х*)> 0. Выбрать ô > 0 1 Это означает, что f' (х+) и f' (х—) существуют для всех х, за исключением, воз¬ можно, самой этой точки. 2 См. определение 3.24. 206
е, а затем рассмотреть знак такое, чтобы для | t | < ô выполнялось Hx* + 0-f(x*) для _ô < t < о Отметим, что обоснованиями необходимого условия 2 являются: 1) небольшие изменения (возмущения) х вызывают соответственно малые изменения величины f (х); 2) для малых изменений х изменение f (х) можно аппроксимировать членом, зависящим от производной от f (х). Из обоснования необходимых условий 1 и 2 можно заключить, что если X* — точка, в которой /' (х*) = 0, и производная от f меняет знак с отрицательного на положительный при переходе через х*, то х* — ми¬ нимум /. Это достаточное условие минимума можно сформулировать следующим образом: 1. Если X* —внутренняя точка из [a, b ], в которой /' = 0, а /" (х*) >0, то X* является локальным минимумом /. В настоящее время известны различные достаточные условия мини¬ мума, однако в данной книге мы будем пользоваться только достаточным условием 1. Перейдем к задаче отыскания минимума функции нескольких пере¬ менных. Функция g есть действительная функция, зависящая от век¬ тора X с компонентами хь х2, . . хп. Вопрос минимизации таких функций сложен, и поэтому мы перечислим только те результаты, которые нам понадобятся в дальнейшем. Для начала сформулируем три определения. Определение 5.3. Точку х* из Rn называют локальным миниму¬ мом g, если существует е >> 0 такое, что при || х — х* || <е 1 g(x*) <g(x). (5.11) Точках* есть минимум g (х), если g- (х*) не превосходит g (х) для всех X, лежащих в окрестности х*. Определение 5.4. Точку х* из Rn называют абсолютным миниму¬ мом g, если g(x*)<,g(x) (5.12) для всех X из Rn. Абсолютный минимум g является локальным минимумом g, однако локальный минимум не обязательно является абсолютным минимумом. Часто представляет интерес отыскание минимума g на некотором под¬ множестве из Rn и изучение функций, определенных на подмножестве из Rn, а не обязательно на всем Rn. В частности, имеем. Определение 5.5. Открытое ограниченное подмножество D из Rn называют областью определения, если для любых двух точек х0 и Хі из D существует кусочно-линейная функция [см. уравнение (3.104) ] X, преобразующая [0, 1 ] в D, такая, что À (0) = х0 и À (1) = Хі (т. е. в D существует ломаная линия, соединяющая х0 и хг), как показано на рис. 5.3. Пусть dD обозначает границу D (см. определение 3.10) и D — подмножество из Rn такое, что DdDcD U dD. (5.13) Точку X* из D называют локальным минимумом g в D, если суще¬ ствует 8 > 0 такое, что для X С S(x*, 8) f) D (5.14) 1 Напомним, что символ || || обозначает эвклидову норму. 207
имеем £(**) <g(x). (5.15) Иначе говоря, х* есть минимум g в D, если g (х*) не превосходит g (х) для всех X из D, близких к х*. Предположим, что D — заданная область, g (х) = g (хь х2, . . хп) непрерывна на замыкании D (=D J dD) области D и что g имеет непре¬ рывные частные производные по каждой из компонент хъ х2, . . ., хп векторах в D. Тогда имеем третье необходимое условие: 3. Если точка х* из D Рис. 5.3. Типичная область является минимумом g, то все частные про¬ изводные g в точке х*равны нулю, т. е. = ■” = ’^Г<Х*)==О (5.16) или эквивалентно, градиент g [см. уравнения (3.67) и (3.68) 1 в точке х* равен нулевому вектору 0. Это необ¬ ходимое условие можно рассматривать следующим образом. Пусть а — единичный вектор с ком¬ понентами сс!» а2, . . ., ап и f (t) —функ¬ ция, определенная как f(f) = g(x*+ ta). (5.17) Если X* — минимум g, то 0 является минимумом f и, следовательно, п Г (9)^ == <Ѵ£(**Х <х)=о. (5.18) 1=1 1 Так как /' (0) является не чем иным, как производной g по напра¬ влению а в точке х* [см. уравнение (3.80)], необходимое условие 3 экви¬ валентно условию, что производная от g по любому направлению а в точке X* обращается в нуль. Продолжим обоснование необходимого условия 2 несколько дальше. Предположим, что g имеет непрерывные частные производные второго порядка. В окрестности нуля можно написать п п г ta)a‘ai- (5Л9) / = 1 / = 1 Из достаточного условия 1 можно заключить, что 0 будет миниму¬ мом функции /, если /' (0) = 0 и п п <5-2о> В результате этих рассуждений получаем следующее второе доста¬ точное условие: 2. Если производная от g по любому из направлений а в точке х* обращается в нуль и неравенство п п <52|> £ —1 /=1 208
выполняется для каждого направления а, то х* является локальным минимумом g. Выражение (5.21) очень похоже на внутреннее произведение (см. § 2.11). Если Q—симметричная матрица размера п X п, элементами которой являются ^-^7 (х*), т. е., если Q задается соотношением дх^ dxjxj**)- (х*\ ’ ’ дхі дхп 7 Q = дх2дхх > >(•*•). ■ дх^ дх.,дх„ ) _ дхп дхг 7 Ô2g / А \ -5 f— (X*) . дхпдх2 ѵ 7 ...^(х*) , дхп ѵ 7 (5.22) то можно определить внутреннее произведение Q на Rn с матрицей Q [см. уравнение (2.83)] и убедиться в том, что достаточное условие 2 экви¬ валентно достаточному условию 3. 3. Если градиент g в точке х* равен 0 и если матрица Q (5.22) поло¬ жительно определенна [см. § 2.15 уравнение (2.84)], то х* есть мини¬ мум g. В частности, если g — функция на /?2, то условия ^(^)=^-(J;«) = 0; (5.23) (5.24) (5.25) гарантируют, что в точке лг* имеет место минимум g. Еще раз отметим, что эти условия были получены путем вычисления влияния малых изменений х на функцию g с помощью «производной» (в данном случае — частных производных) от g. Мы предлагаем чита¬ телю самостоятельно рассмотреть полученные результаты с этой точки зрения. х’2 -4- и* Пример 5.1. Рассмотрим функцию g, заданную на R2 в виде g (х, у) — —2' " * Начало координат (0, 0) есть минимум g, так как dg_ _ dg _ d2g _ &g _ . &g _ дх ' ду ~у' dxdy ’ dy2 ’ dx2 и достаточное условие выполняется при х* — (0, 0). Отметим, что матрица Q по выраже¬ нию (5.22) в данном случае является единичной матрицей. Функция g, рассматриваемая как поверхность в R3, представляет собой параболоид вращения, показанный на рис. 5.4. jj2 Пример 5.2. Рассмотрим функцию g, определенную на R2 в виде g (х, у) — . dg и дх dg * в начале координат обращаются в нуль, но начало координат не яв- Производные ляется ни минимумом, ни максимумом функции g. Матрица Q в этом случае имеет вид Г1 °' [о — 209
и не является ни положительно, ни отрицательно определенной. Функция g, рассматривае¬ мая как поверхность в R3, является гиперболическим параболоидом, как показано на рис. 5.5. Начало координат называют «седловой точкой» g, или «седлом» (рис. 5.5). Рис. 5.4. Параболоид к при¬ меру 5.1 Рис. 5.5. Гиперболический параболоид к примеру 5.2. В начале координат находится особая точка типа «седло» 5.3. ОБЫЧНЫЙ МИНИМУМ С ОГРАНИЧЕНИЯМИ. ПРОСТАЯ ЗАДАЧА В предыдущем параграфе была рассмотрена задача отыскания мини¬ мума функции на подмножестве из эвклидова пространства Rn. Теперь мы рассмотрим задачу отыскания минимума функции, на которую наклады¬ ваются некоторые ограничения. Для того, чтобы подойти к общим резуль¬ татам, которые будут получены в следующем параграфе, рассмотрим неко¬ торые более наглядные случаи, используя функции на /?2. Предположим, что f = f (х, у) и h (х) — действительные функции, соответственно определенные на R2 и R. Пусть уравнение у = /г (х); X £ R (5.26) определяет собой кривую1 в пространстве /?2. Если определить g (х, у), положив g(x, У) = у —h (х), (5.27) то уравнение кривой запишется g(x, у) = у — Ь(х) = 0. (5.28)2 Определим, в каких точках кривой у = h (х) функция f (х, у) мини¬ мальна? Другими словами, мы хотим найти точки (х*, z/*) на кривой [т. е. z/* = h (х*)] такие, что если точка (х, у) есть точка кривой «вблизи» точки (х*, z/*), то /(%*, y*)<f(x, у). (5.29) Так как у* — h (х*) и у = h (х), уравнение (5.29) можно записать в более наглядном виде: /(X*, Л(х*))</(х, Л(х)). (5.30) Точку X*, ÿ* называют минимумом f на кривой у — /і (х) = 0. Исполь¬ зуем принцип возмущений для получения необходимого условия мини¬ мума f на кривой у — h (х) = 0. Пусть точка (х*, у*) является таким огра¬ ниченным минимумом, a f и g — достаточно гладкие (т. е. дифференци¬ руемые) функции. Если точка (х, у) «близка» к (х*, #*), то можно написать x = x*-f-e^; ÿ=ÿ* + eg2) (5.31) 1 Эта кривая есть множество точек {(х, у) : у = h (х)} в плоскости х, у в качестве пространства Я2. 2 См. § 3.13. Заметим, что кривая есть множество S (g). 210
где s — малое положительное число и | = (£„ g2) — некоторый вектор. Следовательно, f(x, у) = f(x*, у*) + е у*), I) + О (I), (5.32) где yf(x*, у*) — градиент f в точке (х*, у*) [см. уравнение (3.67)1 и О (е) — член, зависящий от е и обладающий свойством 1іт-£^=0. (5.33) Е->0 8 Если точка (х, у) не только «близка» к (х*, z/*), но и находится на кривой, то у = h (х). Учитывая уравнения (5.31) и то, что у* = h (х*), имеем: У = h(x) = h(x* е^) = h(x*) + eç2 = y* + e£2. (5.34) Но так как значение x «близко» к х*, то можно написать А(х*4-е^) = А(х*)н-8-^-(x*)g2-|- О(е) (5.35) и, следовательно, S2=-g(x*)|; (5.36) [так как lim ° = 01. Итак, для возмущения (x*, z/*) вдоль кри- \ е-»0 8 / вой у = h (х) уравнение (5.32) можно записать в виде «х. (/) = + «і L t, l, + е -g- (л, + о И- (5.37) Так как (x*, z/*) есть минимум f на кривой, 8 > 0, lim ° ■ = О, 8->0 8 a lx может быть как положительным, так и отрицательным, имеем ■ÿ-\ +-FI -т~\ =°- <5-38) ОХ |(х*. У*) ду |(Х*. г/*) ах |х* ' 7 Это уравнение — необходимое условие того, что точка (x*, z/*) является минимумом f на кривой у — /і (х) = 0. Отметим, что при выводе уравнения (5.38) мы рассматривали возму¬ щения вдоль кривой у — h (х). Иначе говоря, если было выбрано, то £2 определялось соотношением (5.36). Таким образом, в соответствии с неравенством (5.30) наш результат зависит лишь от одной производной. Результатом этого является ограничение свободы выбора возмущения и, следовательно, уменьшение размерности задачи. Упражнение 5.3. Рассматривая функцию одной переменной F (x) = f [х, /г(х)], при помощи метода возмущений необходимо получить уравнение (5.38). Подойдем к уравнению (5.38) несколько иначе. Рассмотрим функцию §(Х, у) = у — h(x). (5.39) Ограничение можно записать в виде g(x, у) = 0. (5.40) Заметим, что частная производная 211
нигде на ограничивающей кривой не обращается в нуль. Имеем df df d(f, g) _ дх дУ д (х, у) dg dg дх ду = det df df дх ду dh . dx df df dh dx ' dy dx ' (5.42)* (5.43) (5.44) Левое выражение представляет собой якобиан от f и g по отношению к X и у Ісм. уравнение (3.89)]. Следовательно, уравнение (5.38) можно представить в виде d(/> g) I =0 д(х, у) |(х*, </*) (5.45) Смысл полученного соотношения состоит прежде всего в том, что система уравнений относительно переменной р — 4-Р — дх |(х», У*у м дх |(ж*. ^*) JLI +р-^-і ду l(x*,ÿ*) ду |(х«. у») (5.46) имеет решение р = р*. Действительно, так как g (х, у) = у — h (х), то ^=^=-<L^> = const (5-47) является одним таким решением. Заметим, что если G(x, y) = f(x, z/) + p*g(x, y) = f(x, y)+ D*ïy—h(x)], (5.48) где p* — решение (5.46), то уравнение (5.46) после замены в нем р* на р можно рассматривать как необходимое условие того, что точка (х*, у*) является минимумом G (х, у). Иначе говоря, если (х*, z/*) является мини¬ мумом G (х, у), то, как мы уже знаем, частные производные функции G по X и по у в точке (х*, у*) должны быть равны нулю [см. условие (5.16)]. Таким образом, получаем -&L ,*)=£у)+p*g {х'ÿ)1 L «•> = -Х| +р*-^| =0; дх |(х*. г/*) дх |(х*, у*) 4п-| = {f(x, у) + p*g(x, у)} I = ду |(х*. Ў*) ду [l ѵ ô v AI +p*-^| dy lu*, y*) dy |(x», y») = 0. Cm. § 3.12. 212
Итак, необходимым условием того, что точка (х*, z/*) является мини¬ мумом функции f при ограничении g (х, у) = у — h (х) = 0, будет суще¬ ствование числа р*, для которого справедливы уравнения: 4-1 +р*>| ^0; (5.49) 2L\ +р*>| =0; ду |(х*. г/*) г ду |(х*. у*) (5.50) g(x*, У*) = У* — h(x*) = 0; (5.51) число р* называется множителем Лагранжа. Несколько обобщим теперь нашу задачу. Предположим, что f (х, у) — действительная функция, определенная на /?2, и g (х, у) —также дей¬ ствительная функция на /?2, не обязательно вида у — h (х). Мы можем попробовать найти необходимые условия минимума f вдоль кривой g (х, у) = 0. Предположим, что f и g достаточно гладкие (т. е. достаточное число раз дифференцируемые) и что норма градиента g не равна нулю: Если (х*, z/*) есть минимум f при ограничении g (х, у) =0, то суще¬ ствует число р*, называемое множителем Лагранжа, такое, что х*, z/* и р* являются решениями системы уравнений дх Г ' дх -= 0; (5.53) JL л-р^- ду Л ' ду - 0; (5.54) g(x, у) = 0, (5.55) т. е. справедливы соотношения дх |(х*. £/*) дх I - 0; |(Х‘. у*) (5.56) JL\ + ду |(x’,ÿ’) г ду 1 == 0; |(х\ (/•) (5.57) g(x*, у*) = = 0. (5.58) Доказательство этого положения аналогично приведенному выше, и в разъяснении нуждается лишь утверждение (5.52). Это утверждение предполагает, что уравнение g (х, у) = 0 разрешимо относительно одной из переменных х или у. Например, если 4-1 ^°- ду І(х‘, у’) то в окрестности х* существует функция h (х): у* = h(x*\, Q = g[x, /г(х)]; dg dh __ дх dx ~ dg ’ ~ду~ (5.59) (5.60a) (5.606) (5.60b) 1 Как станет ясно ниже, мы требуем лишь || yg || > 0 на кривой g (х, у) — 0. 213
т. e. уравнения g (x, y) = 0 и y = h (x) определяют одну и ту же кривую «вблизи» от (х*, у*). Необходимость условий с (5.56) по (5.58) мы пред¬ лагаем доказать читателю. Пример 5.3. Пусть f (х, у) — —ху и g (х, у) = у + хех. Какие точки могут оказаться минимумом f при ограничении g = 0? Можно принять h (х) = —хех и использовать уравнение (5.38). Таким образом, мы должны решить урав¬ нения —У + (—X) (—ех — хех) = 0; У + хех = 0. Очевидно, что только точки являются решениями этих урав¬ нений и лишь они могут оказаться минимумом f при ограничении g — 0. Рассмотрение функции х2е* приводит к заключению, что точка (0, 0) является минимумом f, а точка ( ”2’ —максимумом f при ограничении g = 0. Пример 5.4. Пусть f (х, у) = —ху и g (х, у) — х2 + у2 — 1. Необходимо найти, какие точки могут оказаться минимумом f при ограничении g — 0? Прежде всего отметим, что предположение (5.52) в точке (0, 0) не удовлетворяется. Однако эта точка не при¬ надлежит кривой g (х, у) = 0 и мы можем воспользоваться поэтому необходимыми усло¬ виями (5.56)—(5.58). Полагая, G(x, у, р) = — ху + р (х2 + у2 — 1), получаем, что мы должны решить уравнения -g-=-P+2px = 0; dG , „ — = -x + 2Pÿ=0; g (X, у) = X2 + у2 — 1 = 0. Легко проверить, что решениями этих уравнений являются У “Fs)’ ''“FT j “ х* — j/^’ г/* =. Таким образом, минимумом 1 К2 ’ У* = f при ограничении р-= 0 могут быть точки I—— I, I — » — I—т=- » — I, \К2 Г2/ \ Г2 Г2/ И2 /2/ / 1_ 1 \ \ К2’ Г2/ V елгт / 1 1 \ / 1 1 \ Упражнение 5.4. Покажите, что точки —— и , — деистви- \ К2 К2 ) \ У2 К2 ) тельно являются минимумами в примере 5.4. Указание: рассмотрите функцию — I x I — I x I2. 5.4. ОБЫЧНЫЙ МИНИМУМ С ОГРАНИЧЕНИЯМИ. НЕОБХОДИМЫЕ УСЛОВИЯ И МНОЖИТЕЛИ ЛАГРАНЖА После предварительного рассмотрения экстремальных задач в преды¬ дущих параграфах мы подошли к решению задачи отыскания минимума функции при некоторых ограничениях. Отыскание необходимых условий для этого типа задач весьма тесно связано с понятием множителей Ла¬ гранжа, которые будут часто использоваться в дальнейшем. Начнем со строгой постановки задачи, затем с помощью теоремы 5.1 сформулируем необходимые условия и закончим параграф их обсуждением. Итак, предположим, что D — заданная область из Rn (см. определе¬ ние 5.5), f (х) = f (хх, х2, . . ., хп) — непрерывная действительная функ- 214
ция на замыкании 1 D и (х) = gr (хь х2, . . хп), g2 (х) = g2 (х1( х2, • • -, Sm (x) Sm (xi> x2, • • -, Xn) — непрерывные действительные функции на D. Предположим также, что функции g независимы, т. е. что множество общих нулей функций g, или множество всех х, удовлетво¬ ряющих условию S1W ==g2W = ••• - êM = 0, (5.61) не может быть определено при меньшем числе функций 2 g. Определение 5.6. Точку х* из D называют локальным минимумом / при ограничениях £і(*) = 0, £2(л:) = 0, ..., ^(х) = 0, (5.62) если, во-первых, ^(х*)-0, £2(х*) = 0, •••> ^(х*) = 0 (5.63) и, во-вторых, существует 8 > 0 такое, что если удовлетворяется условие ||х —х*||<е, (5.64) причем xQD, (5.65) и £і(лг) = О, £2(х) = 0, ..., gm(x) = 0, (5.66) то Hx*Xf(x). (5.67) Таким образом, мы хотим изучать задачу отыскания минимума функ¬ ции на D при ограничениях gt (х) = 0, і = 1, 2, . . ., т. Предположим далее, что f (хь х2, . . ., хп) и (х19 х2, . . ., хп), і = 1 , 2, . . ., т имеют непрерывные частные производные по всем в области D. Потребуем также, чтобы систему уравнений gt (х) = 0, і = 1, 2, . . ., tn можно было разрешить относительно т координат Xj через п — т осталь¬ ных координат. Это условие будет выполнено, если предположить, что везде на D выполняется неравенство g2. ■ • •• gm) I2 > 0 (5.68) d(x(1, XZ2. . . Xlm) J '^т где под знаком суммы стоят различные якобианы [см. уравнение (3.89)] функций g по отношению к подмножествам из х2, . . хп}, содержа¬ щим т различных элементов. Отметим, что неравенство (5.68) выполняется в том и только в том случае, когда т векторов (ѵ£і, Ѵ£г, • • •» Ѵ£дп) линейно независимы во всех точках D. Пример 5.5. При п = 4 и т — 2 рассмотрим две функции gt и g2 четырех перемен¬ ных хъ х2, хз и *4- Тогда уравнение (5.68) принимает вид Г d(gi, g2) I2 _і_ Г d(gi> g2) p I Г d(gi, g2) 12 L d(xlf x2) J ' L d(xlt x3) J ~*L d(xi, x4) J I Г d(gi, g2) p г d(gl, g2) -12 г d(gl, g2) p L d(x2, x3) J L d(x2, x4) J L d(*3, x4) J Если X* — (x|, x£, x^f xjf) — точка, удовлетворяющая уравнениям ограничений gi (х*) —0, g2(x*) =0, то один из якобианов должен быть не равен нулю хп в точке X*. Пусть . I =^=о. Это означает, что в окрестности двумерного век- о (хг, х2) |х* 1 См. определение 3.9. 2 См. § 3.13. 215
тора (х*, х^ мы можем разрешить уравнения ограничений относительно хх и х?, выразив их через х3 и х4, т. е. существуют функции hx (х3, х4) и h2 (х3, х4) такие, что а) х\ = hx (xj, X*), х2 = Л2 (xj, X*); б) gi [йі (х3, х4), Л., (х3> х4), х3. х4] = 0; ёг [hx (х3, х4), Л2 (х3> х4), х3, х4] = 0; d(gi, g г) d(gi, g,) __ х2) dh, d(x4, x2) дх3 “ d(gi, gt) ’ dx4 ~ ^(gl. gg) d(xlt хг) d(x4> x2) d(gi. ga) ^(gi. ga) дЛ2 д(Хі, x3) dh2 ___ d(X], x4) ^х3 d(gi. g2) ’ dx4 ^(gi. ga) d(xlt x2) â(x4> x2) Функции hx и h2 представляют собой местные «решения» уравнений g} — 0, g2 = 0 для двух переменных хг и х2 в выражении через х3 и х4. Упражнение 5.5. Пусть g± (хь х2, х3, х4) = хг ф- х2 + х3 ф- х4 и g2 (хь х2, х3, х4) = = Х1 — Х2 ф- х% + Х4. Можно ли разрешить уравнения gA ~ 0 и g2 = 0 относительно х4 и х2, выразив их через х3 и х4 «вблизи» начала координат? Можно ли выразить х3 и х4 через хх и х2? Полу¬ чите решения в тех случаях, когда они существуют. Необходимые условия минимума функции f при ограничениях gt — = 0, і = 1, 2, . . т в точке х* из D определяются теоремой. Теорема 5.1. Если х* — точка области Z), в которой f имеет локаль¬ ный минимум при ограничениях gt == 0, і = 1, 2, . . m, причем все функции f и gt имеют непрерывные частные производные, то существуют числа р*, р*, . . р*2, называемые множителями Лагранжа. В этом слу¬ чае X , р*, р*, . . р*т являются решением системы п ф- т уравнений относительно п ф- т неизвестных xlf x2t ..., хп, р19 р2, ..рт: JL + P1^L + р^ + ... + Рт^ = 0; (5.69) дхі dxt dxt > rm fa. \ / gj (xi>x2 ^n)=0. (5.70) где i = 1, 2, . . ., n и j = 1, 2, . . m. Иначе говоря, справедливы равенства L*+L*+4г L*н L*=0; (5-71) gj (х*, X*, ..X*) = 0 (5.72) для /=1,2, . . ., п и j = 1, 2, . . ., т. Доказательство этой теоремы, которую мы часто будем использовать в дальнейшем, очень похоже на рассуждения, использовавшиеся ранее при выводе соотношений (5.49)—(5.51), поэтому предлагаем выполнить его самостоятельно х. Рассмотрим теперь, каков смысл теоремы 5.1? Существенно, что она позволяет нам заменить задачу отыскания минимума f при огра¬ ничениях gj = 0, / = 1, 2, . . m задачей отыскания минимума функции G(x, рг, р2, ..рт) = = f(x) 4- Р& (X) + р^2 (лг) 4 Ь pmgm (X). (5.73) 1 См. [91]. 216
Для того, чтобы показать это, будем считать р и g (х) /n-мерными век¬ торами с компонентами plt р2, . . рт и gx (х), g., (х), . . ., g,H (х) соответ¬ ственно. Уравнение (5.73) при этом запишется в виде G(x, p) = f(x){р, £(*)). (5.74) Необходимыми условиями минимума функции G в точке х*, р* яв¬ ляются wL- "• <5-75> <576) где і 1, 2, . . ., п, / = 1,2, . . ., т и m-мерный вектор с компо¬ нентами . Но уравнения (5.75) и (5.76) представляют собой лишь векторную форму записи уравнений (5.71) и (5.72), что и доказывает наше утверждение. Если мы хотим отыскать абсолютный минимум f при ограничениях gi= 0, / = 1,2, . . ., т на D, то теорема 5.1 устанавливает, что абсолют¬ ный минимум может иметь место в тех точках из D, в которых выполняются условия (5.71) и (5.72), а также в точках границы D, удовлетворяющих уравнениям ограничений. Такая задача, как отмечалось в § 5.2, является типичной задачей отыскания минимума. п Упражнение 5.6. Найти минимум f (хь хп) — 2 х/ ПРИ огРаничениях /==1 п §(хъ х2, • • хп) -- 2 аіхі — 1 аі > 0 на множестве >0, х2 > 0, . . . хп > 0. /=1 5.5. НЕКОТОРЫЕ ЗАМЕЧАНИЯ Перед началом изучения функциональных минимумов и вариацион¬ ных подходов их определения мы хотели бы дать эвристический обзор результатов и способов, полученных для обычных задач отыскания мини¬ мума. В этом обзоре рассматриваются основные идеи в задачах обычной минимизации (см. § 5.2—5.4) и приводятся обоснования некоторых мето¬ дов, которые будут использованы при обсуждении минимизации функ¬ ционалов. В § 5.2—5.4 мы рассматривали задачу отыскания минимума действи¬ тельной функции /, определенной на области А эвклидова простран¬ ства Rn. Мы обычно предполагали, что f непрерывна и что подмножество А из Rn компактно (см. § 3.6). Эти предположения служат гарантией, что задача имеет решение, т. е. что минимум f на А существует. Затем мы отыскали точки, <в которых может иметь место абсолютный минимум f на Д, а для того, чтобы облегчить этот поиск, получили необходимые условия, основанные на методе возмущений. В нем используется то поло¬ жение, что «производная» является наилучшей линейной аппроксимацией функции (см. § 3.12). Мы установили, что локальный минимум может иметь место только при следующих условиях: 1) в точках границы А; 2) в точках, в которых производная / не существует; 3) в тех внутренних точках Л, где производная f обращается в нуль. 1 См. уравнение (5.16). 217
Точки, в которых производная f обращается в нуль, называют точ¬ ками экстремума функции /, и полученные необходимые условия факти¬ чески являются условиями экстремума. Рассмотрим теперь некоторое обобщение задачи х. Предположим, что V — векторное пространство (см. § 2.5) с функцией расстояния d (см. § 3.2), полученной из нормы || || на V. Иначе говоря, предположим, что существует действительная функция ||г>||, определенная на V и обла¬ дающая свойствами: 1) II я II 0 для всех V из V и ||г>|| = 0 в том и только в том случае, если V = 0; 2) I, V + w II < Il VII + Il w II для всех ѵ и w из V; 3) Цг^Ц = |r||| V II для всех ѵ из V и г из R. Расстояние d на V определено соотношением d(v, w) = ||ü — wII (5.77) для V и w из V. Мы предлагаем читателю проверить, что d действительно определяет расстояние на V и что это понятие расстояния совместимо с понятиями суммы и произведения на V: 1. Если заданы элементы ѵ и w из V и последовательности {üj и {wk] из V, сходящиеся соответственно к ѵ и w, то последовательность [vk + wk] сходится к V + w, т. е. d(vk -I ѵ I w)->0. (5.78) 2. Если заданы элементы ѵ из V и г из R и последовательности {^} из У, сходящиеся к гі, и гк из R, сходящаяся к г, то последовательность сходится к гѵ, т. е. d(rkvk, гѵ)->0. (5.79) Упражнение 5.7. Требуется доказать, что функция d [уравнение (5.77)] определяет расстояние на V, удовлетворяющее условиям (5.78) и (5.79). Функциональные пространства 93, $ и (£, введенные в §3.15, являются векторными пространствами этого типа. Если А есть подмножество из V, обладающее тем свойством, что для любой заданной последовательности ak, k = 1, 2, . . . в А существует подпоследовательность akv akcii . . ., сходящаяся к элементу из А (сравните со свойством 4 в § 3.6), то подмно¬ жество А компактно. Наконец, полагая, что J — некоторый функционал, заданный на множестве А (которое может быть компактным или нет), можно дать следующее определение. Определение 5.7. Вектор а* из А называют локальным миниму¬ мом J, если для любого а из Л, достаточно «близкого» к а*, удовлетворяется неравенство J(a*) < J(a). (5.80) Если А компактно (см. теорему 3.7), то J имеет на А абсолютный ми¬ нимум. Попытаемся найти точки, которые можно рассматривать в качестве потенциальных точек абсолютного минимума. Сосредоточим свое внимание на внутренней точке а* из Л и попытаемся использовать метод возмущений. Для начала нам необходимо ввести поня¬ тие производной для того, чтобы затем аппроксимировать / (а) вблизи а* с помощью функции вида /(«*) + ЭД, (а — а*), (5.81) где ЭД, — линейное (непрерывное) преобразование V в R (см. § 3.12) 1 2. 1 Сравните это с § 3.15. 2 Т. е. ЭД представляет собой элемент пространства V*, сопряженного к V, и, следо¬ вательно, является линейным функционалом на V' (см. упражнение 2.11). 218
Если ^О. (5.82) IIй и II то линейное преобразование il называют производной J в точке а* и запи¬ сывают: 21 = ôJ(a*). (5.83) Выражение SJ (а*) часто называют первой вариацией J в точке а*. Отметим, что 8J (а*) вновь будет функционалом на V и, следовательно, (а*) является линейным преобразованием V в R. Если V — ненулевой вектор из V и 8 — некоторое действительное число, то а* 4-8^ называют возмущением или вариацией а* по направле¬ нию ѵ. Если SJ (а*) существует, то можно написать J (а* +- = J (а*) Е 8J (а*) [ег>] + о (е) = = «/(а*) + 8ÔJ(a*) V + О (е), (5.84) где О (е) обладает свойством Ит°1£} = 0. (5.85) Е-»0 8 Если а* — минимум J и А(8) = J(a* + 8ü), (5.86) то при 8 = 0 имеет место минимум действительной функции F (е), и можно заключить, что é/F(e)| п de |e=ü-U’ т. е. lim I•/(«*+**)-■'«И I = Hm|JL ÔJ(g*)v + -°(£L| = e->0 8 8->01 8 8 I = |SJ(a*)ü| = 0. (5.87)1 Так как v — любой ненулевой вектор из V, то ÔJ(a*) = 0. (5.88) Это условие является точной аналогией необходимых условий, полу¬ ченных для функций одной или нескольких переменных. Его смысл станет более понятен из последующих параграфов. Итак, вновь заключаем, что локальный минимум J может иметь место лишь: 1) в точках границы Л; 2) в точках, где не существует производной J; 3) в тех внутренних точках Л, где производная (первая вариация) J обращается в нуль. Пример 5.6. Пусть <р (х) — непрерывно дифференцируемая действительная функция на R и J — действительная функция, определенная на функциональном пространстве SJ3 ( [0, 1], R) всех кусочно-непрерывных функций 2 из [0, 1 ] в R с помощью соотно¬ шения 1 J («) = j ф Іи (/)] dt. О 1 Напомним, что (а*) —линейное преобразование V в R и поэтому 8J (а*) ѵ— действительное число, поскольку Ф — элемент из V. 2 См. § 3.15. 219
Если и* — элемент из ([О, 1 ], R) и и* + &ѵ — возмущение, или вариация и*, то 1 1 J (il* 4“ eü) J ф [И* (/) + &Ѵ (^)J dt " Ç |ф [u* (/)] 4- 8 I * ü (/) 4“ О (8 Д J/ = il t) \ J 0 1 = J (U*) + 8 J <p- [U* (/)] V (/) dt 4- O (8). U Если при и* имеет место локальный минимум J, то 1 J Ф' [«* (О] ѵ (О dt — О и для всех и из $ ([0, 1 ], /?). Отметим, что линейное преобразование ЭД, из $ (|0. 1 ], /?) в R, определенное соотношением 1 Ц (о) = J <р' [и* (<)]» (О dt и является линейным и непрерывным и представляет собой вариацию 8J (и*). Упражнение 5.8. Пусть ф (х, у) — непрерывно дифференцируемая действительная функция на R2 и J — действительная функция, определенная на функциональном про¬ странстве ( [О, 1], /?2) [см. (3.136)] соотношением 1 J (и) = J <р [«! ((), (О] dt и £ ([0,1], R2), U где Ui и и2 — компоненты и. Покажите, что если д* — минимум J, то 1 У <Ѵ Ф І«* (О]. D <t))dt = О и для всех ѵ из $ ([0, 1], /?2), где \/ф обозначает градиент ф. В § 5.2 мы видели, что вторая производная играет важную роль при определении, какой из экстремумов является минимумом. Обобщим эти положения. Во-первых, будем называть а* экстрему¬ мом </, если ÔJ(«*) = O. (5.89) Во-вторых, будем говорить, что функционал J имеет вторую производ¬ ную в точке а*, если существует внутреннее произведение Р (см. § 2.11) на V такое, что 7(a) — </(«*) = ÔJ(a*)(a — а*) + Р (а —а*, а — а*) 4- + О (II а — а* II2) (5.90) для всех а, «близких» к а*. Квадратичная форма, образованная внутрен¬ ним произведением Р (см. § 2.11), является функционалом на V и назы¬ вается второй производной, или второй вариацией J в точке а*. Будем обозначать ее в виде ô2J (а). Итак, J(a) — J(a*) = ôJ(a*)(a — а*) + б2«/(а*)(а —а*) 4- О (||а — я* II2), (5.91) где бѴ(а*)(а — а*) = Р(а — а*, а —а*). (5.92) Если V — некоторый ненулевой вектор из V и е — малое действитель¬ ное число, то, предполагая, что SJ (а*) и Ô2J (а*) существуют, имеем «/(а* 4- е^) = Да*) + eôJ(a*)ü 4- s2ô2J(a*)ü 4- О (е2), (5.93) 220
где О (е2) обладает свойством 1іт^^- = 0. (5.94) е->0 ь Если а* есть минимум J, то SJ(a*) = 0, (5.95) и уравнение (5.93) превращается в J(a* + eü) - J (а*) + е20Ѵ(а*)гі + О (е2). (5.96) Так как £2 >0 и членом 0 (е2) можно пренебречь, то J(a* +^)~^(а*)>0, (5.97) откуда ôV(a*)ü^0 (5.98) для всех V и, следовательно, внутреннее произведение Р [выраже¬ ние (5.90)] должно быть положительным [см. уравнение (2.84)]. Таким образом, выражение (5.98) представляет собой еще одно необходимое условие того, что а* является минимумом J. Значение этого условия ста¬ нет ясным из § 5.7. Наконец, если квадратичная форма, образованная внутренним произведением Р на пространстве V, положительно опреде¬ ленна, т. е. существует а > 0 такое, что P(v, V) а II V II2 (5.99)1 для всех V из V, то можно показать, что положительной определенно¬ сти SV (а*) вполне достаточно, чтобы экстремум а* функционала J яв¬ лялся локальным минимумом J. Пример 5.7. Пусть ф (х) дважды непрерывно-дифференцируемая действительная функция на R и J — действительная функция, определенная на функциональном про¬ странстве $ ([0, 1], 7?) всех кусочно-непрерывных функций, преобразующих [0, 1] в R: 1 /(«) = J <p[u (t)]dt; «О([0,1 ],/?)• и Если и* g ([0, 1 ], R) и и — и* + ео — вариация и*, то 1 J (и* + eü) — j ф [и* (0 + еѵ (0] dt — 1 о = [ !ф [и* (/)] + е -^2- I v(t) -|- -^-у-1 и2 (/) + о (е2) 1 dt = J I dx h* (о ‘ 2 dx2 и* (о I о 4 7 1 1 = J (и*) + е J <₽' [и* (0J V (/) dt + -J- J <р" [u* (01 V2 (О dt + о (е*). о о 1 Если — локальный минимум J, то J ф' [w* (/)] v (t) dt =0 для всех ѵ из $ ([0, (j 1 1], /?) И j ф" [u* (0] V2 (t) dt ^0 для всех ѵ из $ ([0, 1 ], R). Отметим, что преобразование ЭД,, определенное соотношением 1 ЭД (у) = j ф' [u* (0J v (t) dt, и Сравните с § 2.15. 221
является линейным и непрерывным [оно представляет собой Ô./ (и*)]. Функция Р из ÿ ([0, 1], R) X $ ([0, 1], R) в R, определенная соотношением 1 Р (ѵ, w) — J ф" [u* (/)] V (t) w (t) dt, 0 есть внутреннее произведение на <£ ([0, 1], R) [квадратичная форма, образованная Р и представляющая собой ô2J («*)]. 5.6. ПРИМЕР Рассмотрим одну частную задачу управления. Так как она является первой задачей минимизации функционалов, мы будем решать ее очень подробно и постараемся с ее помощью проиллюстрировать и обосновать методы, которые используются в дальнейшем для получения общих результатов. Начнем с постановки задачи. Рассмотрим динамическую систему первого порядка вида x(t) = — x(t) + u(t) (5.100) с интервалом определения (—оо, +оо). Будем считать, что любая огра¬ ниченная по величине кусочно-непрерывная функция из (—оо, +оо) в R является допустимым управлением, т. е., что наша задача относится к задачам без ограничений (см. § 4.13). Пусть L (х, и) —непрерывная функция, определенная соотношением L (х, и) = 4- *2 + 4 и2, (5.101) и К (х, t) — функция, тождественно равная нулю, т. е. К(х, /) НЕ 0. (5.102) Примем t0 = 0; пусть х (0) = 1 (5.103) является начальным состоянием системы, а множество S — конечным состоянием системы, представляющим собой подмножество из R. Рассмо¬ трим случай, когда S состоит из единственной точки (0, Г), т. е. мы хотим попасть в точку х = 0 через заданное время t = Т. Таким образом, множество S дается соотношением 5={(х(7), Т):х(Т) = 0}. (5.104) Итак, мы рассматриваем задачу с закрепленным концом и с фикси¬ рованным временем (см. § 4.13). Функционал преобразования J (и) опре¬ деляется соотношением т J(«) = j +-§■ “2 (z)] (5.105) о где X (/)—фазовая траектория, удовлетворяющая уравнению (5.100), исходящая из х (0) = 1 и произведенная 1 управлением и (t). 1 X (Л — траектория движения системы, представляющая собой решение диффе¬ ренциального уравнения (5.100), когда и t) имеет вполне определенный вид. 222
Можно сформулировать задачу следующим образом. Найти допустимое управление и (/), переводящее х (0) = 1 в х (Т) = 0 и минимизирующее функционал преобразования J (и). Прежде всего мы видим, что эта задача подобна общей задаче, обсу¬ ждавшейся в предыдущем параграфе. Пространство V представляет собой SJ3 ([0, T], R) — множество всех кусочно-непрерывных функций на [0, Т] (см. § 3.15); подмножество А — совокупность управлений и, переводящих х (0) = 1 в X (Т) = 0. Имеется, однако, дополнительное ограничение, а именно: уравнение системы (5.100). Как увидим далее, для учета этого ограничения используется способ, очень похожий на метод множителей Лагранжа § 5.4. Отметим, что заранее не известно, существует ли реше¬ ние задачи г. Мы просто получим необходимые условия оптимума и затем укажем, что требуется еще доказать его существование. В данной задаче такая необходимость существует. Определим теперь необходимые условия, которым должно удовлетво¬ рять оптимальное управление. Для наглядности мы будем излагать мате¬ риал последовательными частями, нумеруя каждый шаг и сопровождая его эвристическими разъяснениями. Шаг 1. Предположение существования оптимума. Для того чтобы получить необходимые условия, которым должно удовлетворять опти¬ мальное управление, предположим, что оптимальное управление сущест¬ вует 1 2. Итак, считаем, что и* (f) — оптимальное управление и х* (t) — соответствующая ему оптимальная траектория. Иначе говоря, х* (/) и и* (/) удовлетворяют следующим условиям: 1) X* (/) = —х* (/) + w* (/); (5.106) 2) х* (0) = 1, X* (Т) - 0; (5.107) 3) если и (t) — любое допустимое управление, такое, что соответст¬ вующая ему траектория х (/) удовлетворяет условиям 1 и 2, т. е. X (/) = — X (0 + и (/), х(0)=1, х(Т) = 0, (5.108) то т j* = j (и*)=4 J [х*2 +“*2 (/)]dt < о т < J («) = -L j [X2 (t) + и2 (/)] dt. (5.109) ü В дальнейшем все оптимальные величины мы будем отмечать звездоч¬ кой справа сверху. По определению решения дифференциального уравнения (определе¬ ние 3.41) любая кусочно-непрерывная функция, отличающаяся от и* (/) лишь в счетном подмножестве точек на [0, Т], является оптимальным управлением. Для математической строгости мы часто к нашим утвер¬ ждениям должны добавлять фразу «за исключением, возможно, счетного множества точек из [0, Т]»; или мы должны говорить об эквивалент¬ ных классах функций, как в § 3.15. Однако мы, обратив внимание чита¬ теля на это обстоятельство, в дальнейшем будем опускать эти математи¬ ческие тонкости. Шаг 2. Возмущение. Как и при рассмотрении обычного минимума, для получения необходимых условий будем использовать метод возму- 1 В положении такого типа трудно определить, является ли А компактным. Даже в том случае, когда А не является компактным, задача может иметь решение. 2 Оптимальных управлений может быть несколько или не быть ни одного. 223
щений. Давая малые приращения и* (/), найдем условия, которым должно удовлетворять возмущение. Положим, что и (/) = w* (/) + ег] (/), (5.110) где т] (/) — кусочно-непрерывная функция на [0, Т] является возмуще¬ нием, или вариацией и* (/). Часто записывают u(t) = и* (t)+ôu* (/) (5.111) и называют ôu* (/) = ет] (/) (5.112) вариацией и* (/). Если X (/)—траектория, производимая управлением и (/), то в силу аксиомы 4.3 и определения динамической системы (см. § 4.5) можно написать X (t) = х* (/) + еф (/), (5.113) причем ф (/) ограничена на [0, 7]. Другими словами, малая вариация управления дает малую вариацию движения системы. Так как х (t) — решение уравнения (5.100), имеем х(/) = — *(0 + (5.114) = —X* (/) — еф (/) + и* (/) 4- ет) (/); (5.115) из уравнения (5.113) найдем X (/) = X* (/) + 8ф (/). (5.116) Следовательно, ф(О=~Ф(О + п(О (5.117) или, эквивалентно, (Ôx* (/)} = —ÔX* (0 + ôu* (t), (5.118) где ôx* (/) = еір (/) (5.119) есть вариация х* (/), соответствующая вариации ôu* (t) управления и* (t). Потребуем, чтобы возмущенное управление переводило х (0) = 1 в X (Т) = 0, т. е. должно выполняться условие ф(0) = ф(7) = 0. (5.120) В силу (5.117) это означает, что т q(T)=e~T jefri(i)dt = O, (5.121) о и поэтому возмущение ет] (t) не является совершенно произвольным. Например, можно принять, что т] (/) = е~1 cos (-у-), но г] (/) = е~* sin-^ в качестве возмущения рассматривать нельзя. Итак, сообщая управлению w* (/) малые изменения ет] (/), где г] (/) принадлежит к $([0, 7], 7?), т. е. является кусочно-непрерывной функ¬ цией из [0, Т1 в /?, удовлетворяющей соотношению т J e'i](t)dt = 0, (5.122) о 224
устанавливаем, что соответствующие изменений еф (/) траектории х* (і) являются решениями дифференциального уравнения еф(О = —еф(0+ ет](/), (5.123) причем ф(0) = 0. Эти возмущения показаны на рис. 5.6. Шаг 3. Гамильтониан. Перед тем, как вычислять влияние возмущения на величину функционала преобразования J, введем скалярную функ¬ цию Я, называемую гамильтонианом, которая поможет получить искомые необходимые условия. При этом мы введем дополнительную пере¬ менную, которая играет роль, ана¬ логичную множителям Лагранжа в § 5.4. Хотя на данном этапе та¬ кой прием может показаться искус¬ ственным, важность этого понятия будет ясна из дальнейшего изло¬ жения. Итак, будем считать, чтор(/) — некоторая, пока еще неопределенная кусочно-непрерывная функция, кото¬ рую будем называть дополнительной переменной (сопряженной перемен¬ ной, или множителем Лагранжа) х. Так как и х (t), и х* (/) являются решениями уравнения (5.100) в ре¬ зультате воздействия управлений и (/) и и* (/) соответственно, имеем —х (/) — X(t)+ и (/) = 0; (5.124) Рис. 5.6. Возмущения управления и соот¬ ветствующие им возмущения оптимальной траектории —х* (/) — X* (/) + zz* (0 = 0. (5.125) Следовательно, т j р (/) [—х(/) + и (/) —х(/)1 dt = и 7 = J [— р (t) х (О + p(t)u(t) — р (/)х(/)] dt = 0; (5.126) О т J р (t) [—х* (г) 4- U* (О - X* (0] dt = о г - J \-р (/) х* (/) + р (t) и* (t) — p(t) X* (/)] dt = 0, (5.127) о откуда т •/(«) = } + — P(t)x(t) + p(t)u(t) — р(/)х(/)] dt и 0 J(u*) = = J -Ï ±^-р(0^*(0 + р(^)и*(^)-р(0х*(/)] dt. о (5.128) (5.129) 1 Если р (t) определена, то она будет .«отвечать» за ограничения, наложенные урав¬ нением системы (5.100). 8 Атанс и др. 225
Если определить скалярную функцию Н (х, р, и) на R X R X 7?, положив Н (х, р, и) = L (х, и) + р (—х + и) = + р (—х + и\ (5.130) то уравнения (5.128) и (5.129) можно записать в виде т J (и) = J {Н [х (О, Р (0, и (01 —p(t) X (/)} dt\ (5.131) о т J(u*) = j [H [X* (/), р (/), (/)] — p (t) X* (/)} dt. (5.132) о Функцию H часто называют функцией Гамильтона (или просто га¬ мильтонианом). Из уравнений (5.131) и (5.132) непосредственно получим т J (u) — J (и*) = J {H [x(t), р(і), и (t)] — H [х* (t), p(t), «*(/)]} dt + Ü T + Jp (t) [X* (/) — x (/)]<//. (5.133) 0 Шаг 4. Вычисление J (и) — J (и*). Вычислим влияние возмущения на величину J. Сделаем это, используя различные уравнения возмущений шага 7, определение 7/, разложение Н в ряд Тейлора и интегрирование по частям. Прежде всего заметим, что для малого е справедливо H [X (/), р (/), и (/)] = H [X* (/), р (/), ц* (/)] + + [X* (/), р(0. [X (0-х* (01 + + [х* (t), p (t), и* (/)] [U (t)-и* (/)] + о (е) = (5.134) = H [X* (t), p (t), (/)] + [X* (t), p (/), u* (/)] eip (t) + + [X* (t), p (t), u* (/)] er] (/) + O (e), . (5.135) где O (e) — член, обладающий свойством lim °--- = 0, E->ü 6 и x(/) — X* (/) = (/); Ц(/) —w*(/) = 8T](0 (5.1369 по уравнениям (5.110) и (5.113). Далее, так как X* (/)— х(/) = —еф (/), (5.137) из уравнения (5.133) следует, что /(«) —J(«*) = e j{^-[x*(O, р(0, «*(0W(0 + Ô + [X* (0, P (0. u*(/)] n(o]^-e J р(01>(0^ 4- o(e). (5.138) 226
Упражнение 5.9. Запишите уравнение (5.138) через бх* (/), и* (t) и -^-бх* (/) и дока- dt . « дн ГЛ жите, что в этом уравнении будет отсутствовать член, содержащим , Почему в уравне- т нии (5.138) можно писать о (е) вместо J о (е) dt, как это следовало бы из (5.124)? У к а- о з а н и е: установите не является ли о (е) членом вида £2/(/), где f (/) — ограниченная кусочно-непрерывная функция /? Интегрирование по частям последнего слагаемого (5.138) позволяет получить 7 —J р (/) ip (t)dt - и т = р (0) (0) - р (Т) ф (л + Jpm (t)dt = <5-139) о т = J р (/) (/) Л (5.140) по уравнению (5.120). Итак, имеем (т 1Х* (/), р(/), u*(/)] + p(/)U(/)d/ + и ' т \ + J^k*(O. Р(0, U* (01 П(0 + 0(8), (5.141) о / где функция р (t) все еще не определена. Так как и* — оптимальное управление, то должно выполняться нера¬ венство J(u) —7(ц*)^0. (5.142) Поскольку 8 может быть как положительным, так и отрицательным, а членом О (е) можно пренебречь (см., например, упражнение 5.2), то получим, что (т j£k*(O. Р(0. u*(01 + P(0U(0^ + т \ + J к* (0. Р (0, «* Ц)1 Л (0 di j = 0. (5.143) о / Здесь мы впервые воспользовались оптимальностью и*, и поэтому урав¬ нение (5. 143) является предварительной формой искомого необходимого условия. Шаг 5. Дифференциальное уравнение для р (t). Сформулируем усло¬ вия, которым должна удовлетворять функция р (t). Потребуем, чтобы р (/) удовлетворяла определенному дифференциальному уравнению. Для того чтобы полностью определить р (/), останется лишь выбрать начальное условие р (0). 227
Потребуем, чтобы р (/) было решением линейного дифференциального уравнения вида Р(О=-^[х*У), Р(і), «*(0]= (5.144) = — (5.145) Во-первых, мы видим, что однородные части уравнений (5.145) и (5.106) являются сопряженными согласно определению § 3.25. Во-вторых, из уравнений (5.143) и (5.144) следует, что 7' J [X* (/), р (/), и* (/)] Î] (/) dt = О, (5 146) о когда р (/) есть решение уравнения (5. 144). В-третьих, х* (/) есть решение дифференциального уравнения і*(0 = ^[х*(0, Р(0, «*(/)!• (5.147) Таким образом, как х* (/), так и р (f) являются решениями диффе¬ ренциальных уравнений, в которые входит гамильтониан Н. Шаг 6. Основная лемма. Итак, получено соотношение (5.146), которое должно выполняться для каждой кусочно-непрерывной функции т] (/), удовлетворяющей соотношению (5.122). Какие условия оно накладывает на [х* (/), р (/), и* (/) 1? Мы сможем ответить на этот вопрос с помощью следующей леммы. Лемма 5.1. Пусть h (/) — кусочно-непрерывная функция на [0, Г]. Предположим, что т j h(t)a(t)dt = 0 (5.148) о для всех кусочно-непрерывных функций а (/) на [0, Т], удовлетворяю¬ щих условию т Ja(/)dZ = O. (5.149) и В этом случае h (/) — постоянная величина на [0, Т], т. е. ft(/)=c, /00, Т\. (5.150)1 Доказательство. Так как ft (/) кусочно-непрерывна, существует с из R такое, что т J h(t) dt = сТ. (5.151) и Если т J [ft(0 — с] d/ = 0, (5.152) и то функция а (/) = h (t) —с кусочно-непрерывна и удовлетворяет условию (5.149). 1 За исключением, возможно, счетного множества А точек из [0, Г]. 228
Таким образом, т — c]dt = 0 (5.153) о и т J — c\h(t) — c]dt = 0. (5.154) ô Из последних двух уравнений следует: 7' j‘[/i(/) — c]2dt = 0. (5.155) û На основании теоремы 3.8е получим h(t) — с = 0 (5.156) (за исключением счетного подмножества А точек t из [0, TJ), что и дока¬ зывает лемму. Если принять л(/) = е-*а(/), (5.157) гдеа (/) — любая кусочно-непрерывная функция, удовлетворяющая(5.149), то уравнение (5.146) запишется в виде т JIх* (О- Р(0> и* (t)]e-la.(t)dt — 0, (5.158) о откуда на основании леммы получим [%*(/), p(i), u*(/)] = е‘с, (5.159) где с = const. Шаг 7. Необходимое условие. Сформулируем искомое необходимое условие. Покажем, что существует решение р* (/) уравнения (5.145) такое, что функция Н [х*(0, Р* (0> и] по и имеет абсолютный минимум при и = и*. Пусть р (t) — решение уравнения (5.145), причем р (/) =0, тогда р(0 = —е'р-’х*(т)4т. (5.160) о Из выражения (5.159) следует, что существует постоянная с*, для которой -^-[х*(0, р(0, «*(01 = «*(0 + p(t)=e'c*. (5.161) Иначе говоря, t и* (0 — et J e~xx* (n)di: = efc* (5.162) о или, эквивалентно, t и* (0—etc* — et J £~Tx* (т)гіт == 0. (5.163) и 229
Будем считать функцию р* (/) единственным решением уравнения (5.145) с р* (0) = —с*, т. е. t р* (t) — — efc* — J е~~тх* (т) du. (5.164) о Рис. 5.7. (и) имеет абсо¬ лютный минимум при и — В этом случае гамильтониан Н [х* (/), р* (/), и], рассматриваемый как функция и, имеет абсолютный минимум при и = и* (t) для / из [0, Т]. Это утверждение надо понимать следующим образом: предположим, что — некоторый элемент из [0, Г], тогда х* (/J и р* (/г) — вполне опре¬ деленные числа, и мы можем рассматривать действительную функцию Hг (и) действительной переменной и, опреде¬ ленную как НА (и) Н [х* (/J, р*(/|), z/]= (5.165) = ^ÙL+-^ + p*(/I)[-x*(/1)+u]- (5.166) Наше утверждение сводится к тому, что и = и* (/х) есть абсолютный минимум ATj (и). Это утверждение иллюстрируется с помощью рис. 5.7. Для доказательства сделанного утвержде¬ ния прежде всего отметим, что H [х* (t), и] = + ^ + р* (t)l-X* V) + и] (5.167) представляет собой параболу, имеющую локальный минимум, являющийся одновременно и абсолютным минимумом. Если G (и) = Н [х* (/), р* (/), и], то tFI—“,<Z)1= <5Л68> = U* (0 4- p* (0 = (5.169) t = u*(t)— efc* — e* Çe-Tx*(т)б/т == (5.170) о -0 (5.171) на основании уравнений (5.163) и (5.164). Далее, >>°. <5Л72> так что и = и* (/) действительно является минимумом функции G (и) = = Н [х* (/), р* (/), и], и наше утверждение доказано. В заключение рас¬ смотрим следующую теорему, которая представляет собой искомые необ¬ ходимые условия для нашего примера. Теорема 5.2. Пусть и* (/) — допустимое управление, переводящее X (0) = 1 в X (Т) = 0. Необходимым условием оптимальности управления и* (/) является существование функции р* (/) такой, что: а) если X* (/) —траектория, соответствующая и* (/), то х* (/) и р* (/) являются решениями системы уравнений х*(0 = -^к*(0. Р*Ю, «*(01; дн (5.173) Р* (0 = ^-к* (О, Р* (О. «*(/)!• 230
б) функция Н [х* (/), р* (/), и], рассматриваемая как функция и, имеет абсолютный минимум при и = и* (/) для t из [О, Г], т. е. min Н [%*(/), р* (/), и] = H [X* (/), р*(/), ц*(/)]. (5.174) Дадим интерпретацию теоремы 5.2. Заданы оптимальное управление ц* (7) и соответствующая ему оптимальная траекториях* (/)для любого t из [О, Т]. Первая часть теоремы 5.2 гарантирует, что существует функ¬ ция р* (/), являющаяся решением уравнения (5.173), соответствующая X* (t) и и* (/). Таким образом, в каждый заданный момент времени, например, на интервале [О, T ], х* (/х), р* (/J и и* (/х) — это три вполне определенных числа. Вторая часть теоремы 5.2 утверждает, что число Н [х* (/х), р* (/J, ц* (/J] меньше или равно числу Н [х* (/г), р* (/J, г], где г — любое действительное число. Эта теорема, являющаяся для нашей задачи принципом минимума Понтрягина, в дальнейшем будет обобщена. Перед тем как подвести некоторые итоги и показать возможности практического использования необходимых условий, рассмотрим функцию Н [х* (/), р* (/), и* (/)]. В частности, имеем = **(0 + ^-| Р*(0 + ^г| «*(0, (5.175) U.4 ил I Up I UU [ где знак |* обозначает, что производные должны вычисляться при [х* (/), р* (/), ц* (/)]. Из уравнений (5.168), (5.171) и (5.173) следует, что Р* (/), ц* (/)] = 0, (5 л 76) и поэтому Н [х* (/), р* (/), и* (0 ] есть величина постоянная. Иначе говоря, для данной задачи гамильтониан Н вдоль оптимальной траектории — величина постоянная. Итак, мы начали с предположения, что оптимум существует; после этого подали возмущение на управление и рассмотрели результат воз¬ действия возмущения на траекторию. Затем мы ввели гамильтониан Н и дополнительную переменную р, которая в дальнейшем играла роль, аналогичную роли множителя Лагранжа. Далее мы выразили через га¬ мильтониан воздействие возмущения на величину J и потребовали, чтобы наша дополнительная переменная была решением линейного дифферен¬ циального уравнения; доказали лемму о функциях с нулевыми интегра¬ лами и, наконец, получили необходимые условия, устанавливающие воз¬ можность определения такой дополнительной переменной, при которой оптимальное управление минимизирует гамильтониан Н, рассматриваемый как функцию от и. Таким образом, мы свели задачу минимизации функ¬ ционала к обычной задаче отыскания минимума. Очень часто такое све¬ дение имеет большое практическое значение в решении задач управления. Посмотрим, как можно использовать необходимые условия тео¬ ремы 5.2. Прежде всего теорема устанавливает, что оптимум представляет собой решение х* (/), ц* (/), р* (/) уравнений (5.173) и (5.174), т. е. ’ х* (о=[**е). р* (о. «* (оі = - ** (/)+и* (0; (5.177) р*(/) = -^-[х*(0, р*(о, и*(/)1 = Р*(/)-х*(0; (5.178) min H [X* (/), р* (/)■ и] = H [X* (/), р* (0, «* (01 (5.179) и И х*(0)=1, х*(Т) = 0. (5.180) 231
По определению //, уравнение (5.179) можно записать в виде ^_X*2(Z) + _^U*2(Z)+p*(Z)[_x»(Z)+ U*(Z)] <^х*2(/) + 4-«2 + Р*(О1-^*(^) + «] (5.181) для всех и. Неравенство (5.181) эквивалентно соотношению -^ «*’-(/)+ р*(/) и* (/)< -^-и2 +р*(і)и, (5.182) откуда, в свою очередь, следует равенство u*(t) = — p*(t). (5.183) Отметим, что так как ^-[%*(/), Р*(О, «*(01 = 1, (5.184) уравнение (5.183) можно также получить из соотношения -g-[x*(O, P*U), u*(t)] = u*(t) + p*(t) = O. (5.185) Таким образом, решения уравнений (5.177), (5.178) и (5.183), удов¬ летворяющие граничным условиям (5.180), определяют оптимум. По¬ пытаемся найти все решения этих уравнений. Иначе говоря, мы хотим знать все три функции х (/), р (/), и (/), для которых х(/)-_=—%(/)-(-£/(/); (5.186) р(/) = р(/)-х(/); (5.187) u(t) = —p(t); (5.188) и х(0)=1, х(Т) = 0. (5.189) Итак, мы ищем решения системы x(t)= — x(t) — p(ty (5.190) ЙО = р(/) — х(/) с граничными условиями х (0) = 1 и х (Г) = 0. Решение такой системы единственно и выражается формулой х(/) = ^1_(х(0)[(/2 + 1)е-^ + + (/2 — 1)е^] +р(0)(е-і^'—(5.191) + р(0)[(/2- +(У2+ 1)е^ф, где х(0) =--- 1 и р(0) = -0<2+.1).е~^Г +j^~ l)g-'---. (5.192) eY —е у 232
Следовательно, если решение задачи управления существует, то оно должно иметь вид u*(t) = —zL. L- К2Г + (Г2+1>е-^ + (К2-1)Л;.7.. х ’ 2/2 I еѴ‘2Т _е-Ѵ2Г X [(]/2— 1)6-^' + (Vî + 1)«Г2/]|- (5.193) Таким образом, если мы докажем, что решение нашей задачи сущест¬ вует, то управление и* (/) выражается формулой (5.193). В последующих главах будут приведены другие примеры использования необходимых условий при определении оптимальных управлений. Упражнение 5.10. Требуется показать, что уравнение (5.191) действительно пред¬ ставляет собой решение системы (5.190), удовлетворяющее заданным граничным условиям. Используйте метод преобразования Лапласа, рассмотренный в § 3.23. Упражнение 5.11. В шаге 3 введите функцию Н (х, р, и), заданную как Н (х, р, и) = — L (х, и) + р (— X + и) вместо Н (х, р, и), и получите следующие необходимые условия. Пусть и* (/) — допустимое управление, переводящее х (0) = 1 в х (Т) = 0. Для опти¬ мальности и* (/) необходимым условием является существование функции р* (/) такой, что а) если X* (t) — траектория, соответствующая и* (/), то х* (/) и р* (/) — решения системы уравнений /(() = (X* (t), р* (t), и* (0]; ~ (5.194) ?(О = (О, 'р*(Ѵ> «*<0]; б) функция Н [х* (/), р* (/), и] имеет абсолютный максимум по и при и = и* (/) для t из [0, Т], т. е. max Н [х* (/), р* (/), и] = H [х* (t), р* (/), и* (£)]. (5.195) и Таким образом, наши необходимые условия могут быть получены как принцип макси¬ мума, а не минимума. Покажите, что отыскание решений уравнений (5.194) и (5.195) дает управление и* (0 в соответствии с формулой (5.193). ВАРИАЦИОННЫЙ ПОДХОД К ЗАДАЧЕ УПРАВЛЕНИЯ 5.7. НЕОБХОДИМЫЕ УСЛОВИЯ ДЛЯ ЗАДАЧИ С НЕЗАКРЕПЛЕННЫМИ КОНЦАМИ После общих замечаний, высказанных в § 5.5 и примере § 5.6, мы подготовлены к решению задачи управления на основе вариационных методов. Рассмотрим задачу с незакрепленным концом, минимизируя коор¬ динаты конечного состояния («стоимость»). Мы не встретим трудностей при доказательстве того, что оптимальное управление для этой задачи должно экстремизировать гамильтониан. Затем введем вторую производ¬ ную и эвристически покажем, что экстремум гамильтониана должен быть минимумом. В следующем параграфе необходимые условия будут усилены для получения локальных достаточных условий, которые окажутся полез¬ ными в гл. 9. Далее кратко рассмотрим задачу с закрепленным концом и отметим определенные трудности, возникающие из-за того, что вариации управления должны удовлетворять соотношениям, аналогичным (5.122). Для того, чтобы преодолеть эти трудности, мы должны изменить наше представление о задаче управления, что и приведет нас к принципу мини¬ 233
мума Понтрягина. Ниже наши рассуждения будут нестрогими. Более строгие доказательства приведены в соответствующей литературе х. Сформулируем поставленную задачу. Рассмотрим динамическую си¬ стему x(t) = f[x(t\ /], (5.196) где x(t) и f — /г-мерные векторы и u(f)—m-мерный вектор, причем О </л < п. Будем считать, что рассматриваем задачу без ограничений (см. § 4.13), т. е., что любая кусочно-непрерывная функция является допустимым управлением. Пусть tQ — начальное время и х(/о) = лго (5.197) является исходным состоянием системы. Множество S имеет вид Rn X X {/х}, где — заданное время, tx > /0. Другими словами, конечным состоянием может быть любой элемент из Rn. Пусть L(x, а, /) и К(х) (5.198) — «достаточно» дифференцируемые действительные функции. Рассмотрим функционал J (и), определенный как G J(u)= Kprft)] + J Ь[х(0, «(0. t]dt, (5.199) to где X (Z)—траектория, удовлетворяющая уравнению (5.196), начинаю¬ щаяся из х(/0) = и произведенная управлением и. Итак, задача формулируется следующим образом: Найти допустимое управление и (t), минимизирующее функционал J (и). Такая задача называется задачей с незакрепленным концом и фик¬ сированным временем. Мы получим необходимые условия, полностью аналогичные условиям теоремы 5.2, и будем двигаться шаг за шагом, точно так же, как и в § 5.6. Шаг 1. Предположение существования оптимума. Пусть а* (/) — оптимальное управление и х* (/) — соответствующая оптимальная траек¬ тория. Другими словами, а* (/) и х* (/) удовлетворяют условиям 1) x*(t) = /[ѵ*(/), а*(/), /]; (5.200) 2) x*(t.) = xQ, (5.201) 3) если и (t) — любое допустимое управление, причем соответствую¬ щая ему траектория начинается в точке х (/0) = х0, то t1 J* = J(u*) = H- JL[x*(t), и* (t), t]dt <J(u) = to tl = K{x(t1)] + L[x(t), u(t), t]dt. (5.202) tQ Шаг 2. Возмущение. Дадим возмущение управлению й* (/), положив й(/) = д*(/)^еп(/)_ (5.203) Если X (/) — траектория, производимая управлением и (/), то мы можем написать х(/) = X* (/) + 805(/), (5.204) 1 См. строгие доказательства в [179], [228]. (Прим. ред.). 234
так как малая вариация управления приводит к малой вариации дви¬ жения системы. Так как x(t) — решение уравнения (5.196), имеем х(/) = /|х(/), «(/), Л = (5.205) = /|х*(О + ед5(/), и*(/)4-8П(/), /]. (5.206) Дифференцируя выражение (5.204), получим а:(/) = x*(t) + еф (/). (5.207) Разлагая f\x* (t) J- eg6(/), «*(/) +ei] (/), /] в ряд Тейлора, найдем f\x* (/)-f-8$(0, «*(/) +ет](/), Л = =/іх*(/), «*(о, л+4rLe$(z)+^Len(z)+ о(е)’ (5-208) где -^-1 — якобиан f по х, вычисленный при \х* (t), и* (f), t] [см (3.87)]; — якобиан f по а, вычисленный при [х* (/), а* (/), Н, и О (е) - вектор, удовлетворяющий условию !іт-^Д= 0. (5.209) е->0 8 Вертикальную черту со звездочкой внизу мы будем в дальнейшем использовать для обозначения того, что функция должна вычисляться вдоль оптимальной траектории. Из уравнений (5.206) и (5.208) следует, что e$(0 = -^L<W) + #|.>”1(0+О(8), (5.210) или, эквивалентно, в”'»-|.Ч<-')+ (5.211) Так как траектория х (/) начинается в точке х (t0) = х0, то должно быть $(М = 0. (5.212) Предположим, что ф (/) — решение линейного уравнения <5’213> где Wo) = 0; (5.214) отсюда следует \ что x(t) = х* (/) + гф(/) = х* (/) + 8ф(/) + О (е), (5.215) и поэтому в дальнейших вычислениях мы часто будем заменять х(/) на X* (/) + 8ф (/) вместо более строгого выражения лг* (/) + ьф (/). Упражнение 5.12. Пусть член о (s) в уравнении (5.210) имеет вид е2ЛІ (/), где М (/) — ограниченная функция. Требуется доказать соотношение (5.215). Указание: рас¬ смотрите функцию ф (t) — ф (/), причем 1 [ф (О — ф (01 + + еЛІ (0; Ф (^о) — М5 (^о) = После этого найдите || X*(Z) + &ф (t) — [х* (t) + £ф (/)] ||. 1 См. [179]. Отметим, что выражение (5.215) может быть строгим без дополнитель¬ ных предположений (см. упражнение 5.12). 235
Шаг 3. Гамильтониан. Введем в рассмотрение гамильтониан и допол¬ нительную переменную. Пусть p(f) — некоторая, пока еще неопределен¬ ная, кусочно-непрерывная n-мерная векторная функция, которую будем называть дополнительным или сопряженным вектором. Так как и х(/), их* (t) являются решениями уравнения (5.196), имеем f[x(t), u(t), t\ — х(/) = 0; (5.216) f[x* (Z), а* (0, И — х*(0 = 0. (5.217) Тогда G f (р(0. u(t), t]—x(t)} dt = to tl tt = /І-m u(t), t])dt-\(p(t), x(t))dt- (5.218) to tn tl J (p(t), f \x* (t), u*(t), t] — x*(t)', dt = to '1 f' = J <p (/),/[** (0, #*(0, x*W;dt (5.219) to tn и, следовательно, ti J(U)= К[х(А)] -у $ {L[x(t\ u(t), t] + (p(t), f[x(ty u(t), /]) — to X(t))}dt (5.220) и G J(«*) = K[x*('i)] + f {L «*(0. Л + (Р(О. «*(/), /])- 10 — (p(t), x*(t))}dt. (5.221) Если определить скалярную функцию H (х, р, a, t), положив Н (х, р, u, t) — L(x, u, t) 4- (p, fix, u, t)), (5.222) то уравнения (5.220) и (5.221) можно записать в виде G J(u)= Klxtt,)] + f {H(x(t),p(t),u(t), t] — (p(t), x(t))}dt (5.223) to и G J(u*) - K |x* 0 4- J {H\x*(t), p(t), u*(t)]—{p(t), x*(t)}} dt. (5.224) 10 Функцию H называют гамильтонианом. Непосредственно получим, что вариация функционала имеет вид G J(u)-J(u*)=[K[x(t1)]-K[x*(t)]} + \ {Hlx(a p(tl 10 tl — H \x* (t), p(t), «*(/)]}d/ 4- J (p(t), x*(l) — x(t))dt. (5.225) to 236
Шаг 4. Вычисление разности J(a) — J (а*). Вычислим влияние воз¬ мущения на величину J. Для этого используем различные уравнения возмущений шага 1, определение Н, разложение в ряд Тейлора и интег¬ рирование по частям. Прежде всего, если 8 мало, то H |x(Z), р(/), #(/), t] = И |х*(/), р(/), #*(/), t] + + |х(/)-x*(z)l/ + \4r|.p’ І«(0-«*(01) + О(8). (5.226) где -^-1* обозначает градиент Н по х, вычисленный при \х* (/), р (/), а* (/), /], и |* — градиент Н по и, вычисленный при [х* (t), р (/), а* (/), /]. С помощью уравнений (5.203) и (5.215) получим //[х(0,Р(0, «(/),/] = // [лг*(/), р(/), «*(/), /Н- е/^-І (5.227) Далее из выражения (5.215) найдем К |х(/і)] = К[х*(/і)] + х(^~ х*(Л)^> + О(е) = = К \х* (ZJ] 4- + О(е)’ (5.228) где —j обозначает градиент К по х, вычисленный при х* (/J. Затем из уравнений (5.210) и (5.213) определим = eij, (/) + е -g- j, [#(/) - ^(/)] + О (в). (5.229) Откуда при помощи выражения (5.215) получим едб(/)= 8г|)(0+ 0(4 Таким образом, х* (Z)— X (Z) = — еір(/) + О(е). (5.230) (5.231) Подставляя полученные соотношения в выражение (5.225), получим /(«) —У(и*) = е/-^^, 4(/і)\ + ej t(0>^ + to fl ’ fl + e f(p(O, 0(8). (5.232) ! * P / j 10 f 0 Проинтегрируем член выражения (5.232), содержащий ф (/), по частям: fi f {P (/), ф(t) > dt = (P (Л), ф (Z,)) - {P (Zo), -Ф (/0)) - to fl — J (₽(0> (5.233) fo 237
Так как ф (/0) = 0, уравнение (5.233) можно записать в виде + е J [<^-|> + Р(/)’ '*’(Z)/ + \^I^ 0(8). (5.234) ^0 где /г-мерный вектор р (t) все еще не определен. Так как и* —оптимальное управление, то J(u) — 7(и*)^0 (5.235) и поэтому по аналогии с § 5.6, получим G 1.-р''>>' Ч’<'‘>/ + П\5ГI■ р''>■ f<z>/ + <о L + \Sr|v П('Л>р = °. (5.236) Шаг 5. Дифференциальное уравнение для р (t). Сформулируем усло¬ вия, которым должна удовлетворять функция р (/). Прежде всего потре¬ буем, чтобы она была решением дифференциального уравнения = Р<Л /]= (5.237) = <5-238> где —якобиан f по лг, а штрих (') обозначает транспонированную матрицу. Уравнение (5.238) есть линейное дифференциальное уравнение относительнор (t). Однородные части уравнений (5.238) и (5.213) являются сопряженными (см. определение § 3.25). Далее, из уравнений (5.236) и (5.238) следует: 1 = (5.239) to где p (t) — решение уравнения (5.238). Так как Н (х, р, и, t) = L (х, и, t) + (p, f(x, и, t)), имеем также х*(/) = /[х*(0, «*(0, t]= ^-lx*(t), p(t), /]. (5.240) Таким образом, опять обе функции х* (0 и p(f) являются решениями дифференциальных уравнений, содержащих гамильтониан Н. В отличие от задачи § 5.6 дополнительную переменную можно опре¬ делить полностью благодаря наличию в уравнении (5.239) члена, вклю¬ чающего конечную стоимость. Итак, будем считать, что/?* (/) является (единственным) решением уравнения (5.238) с граничным условием (5.241) Если принять: /НО. «’(O. '1. (5.242) 238
то из уравнений (5.239) и (5.241) можно заключить, что g Л(О)>Л = 0 (5.243) t о для всех кусочно-непрерывных функций т] (/). На следующем шаге из уравнения (5. 243) мы получим, что и* (f) есть экстремум Н [х* (/), р* (/), а, /], если Н рассматривать как функ¬ цию и. Далее мы получим, что этот экстремум должен быть минимумом. Для этого нам понадобится вторая вариация J, Шаг 6. Основная лемма. Докажем теперь следующую лемму. Лемма 5.2. Пусть h (/) — кусочно-непрерывная функция на и предположим, что G [/о, *11 J (й (/), а(/)) dt = 0 10 для всех кусочно-непрерывных функций а (/) на [/0, Тогда (5.244) Л(/) = о, te [/о, М. (5.245)1 Доказательство. Прежде всего из леммы 5.1 следует, что постоянная, т. е. h(t) = с\ te По, ^11- А(0- (5.246) Для доказательства этого заметим, что если (/) — любая кусочно¬ непрерывная функция, удовлетворяющая условию G Ja1(/)d/ = O, (5.247) to то полагая (5.248) О получим ~ ~ (Л(0, = ^і(0аі(0 (5.249) и G G J (ft (Z). a1 (t))dt = h^a^tjdt = 0. (5.250) Ï» to Таким образом, hr (f) = const = на [/0, /J по лемме 5.1. Анало¬ гичным образом можно показать, что каждая компонента h (/) есть по¬ стоянная величина на Ио, М- Но если с Ф 0, то можно выбрать функцию a(/) = f=^0 (5.251) такой, чтобы получить противоречие G G G J (Л (0, а (/)) dt = J (с, с) dt = J II с ||2 dt > 0; (5.252) t O G to это и доказывает лемму 5.2. 1 За исключением, возможно, счетного подмножества А из [/0, £х]. 239
Из леммы и уравнения (5.243) непосредственно следует, что = (5'253) Итак, Н [л:* (/), р* (/), и (t), /], рассматриваемая как функция и, имеет экстремум при и = а* (/) для t из [/0, /х]. Последний вывод пони¬ мают следующим образом: Пусть t — некоторый элемент из [/0, тогда х* (t) и р* (/) — вполне определенные векторы, и мы можем рассматривать действитель¬ ную функцию Н (и) от m-мерного вектора а, определенную как Н (и) == H [х* (t), Р*(0> Л- (5.254) Тогда и = a* (t) является экстремумом Р(а). Шаг 7. Необходимое условие. Как мы видели в § 5.5, необходимым условием того, чтобы экстремум функционала являлся его минимумом, служит неотрицательность его второй вариации [см. условие (5.98)1. Используем это обстоятельство. Предположим, что вторая вариация ÔV (а*) существует и 0Ѵ(и*)> 0. (5.255)1 Найдем ÔV (а*) в явном виде и используем формулу для получения (эвристическим способом) аналога теоремы 5.2. Во-первых, напомним, что #(/) = а* (0 + Eî] (0- (5.256) Во-вторых, предположим, что х(і) = x*(t) -b Еф(0 4- e2ê(Z) + о (е2), (5.257) где ф (/) — решение линейного дифференциального уравнения + (5.258) и Фао)-О; = (5.259) В-третьих, напомним, что приращение функционала выражается формулой J(u) - = К [х(/х)] — К [X* О + 4 J IH р* (t), и(Г), t]-H [х* (Z), p* (Z), «* (Z), /1} dt + t» il + J (P*(0. x*(0 — (5.260) to где p* (t) — решение дифференциального уравнения P*(0 = ~(5.261) удовлетворяющее граничному условию (5.262) 1 Далее, при обсуждении принципа минимума, мы увидим, что этого упрощения не требуется для получения искомого результата (см. теорему 5.3). 240
Теперь докажем, что вторая вариация определяется соотношением ô2J(«*)(« — «*) г|5(Л)\ + (5.263) д2К \ , дК „ ч где -ч-^г —якобиан — по х, вычисленный при х*(Л); ОХ* I ОХ ’ ‘ 4“т-| —якобиан по X, вычисленный при [лег* (/), р* (/), а* (/), /]; ох* I ОХ ’ 1 ѵ X X X - —якобиан 4" по «.вычисленный при [х* (t), р* (t), и* (/), /]; —якобиан пох, вычисленный при [х* (/), р* (/), а* (Л, Л и ох \ ou / I OU 1 V X /' 1- X /' X /' 3 якобиан по и, вычисленный при |х*(/), р* (/), #*(/), Л1- 1 Для иллюстрации принятых обозначений предположим, что п — 3, т — 2, и запи¬ шем в развернутой форме правую часть уравнения (5.263): Выделенные блоки матрицы, содержащей Н, соответствуют различным якобианам, входящим в уравнение (5.263). Фі (/і) ф2 (^і) Ч'з (^і) ~ д2К с)х~ д2К 1* д2К 1* дхі дх2 dxY дх3 * д2К I д2К д2К 1* дх2 дх, 1* дхі дх2 дх3 * д2К I д2К 1 д2К дх3 дх і 1* дх3дх2 2~ 1* дх^ * _ Фі (Л) ф2 (/]) фз (^і) - д2Н 1 д2Н 1 дг” 1 і д2Н 1 д!ІІ 1 ■ дх^ дХ' дх2 1* дхх дх3 L 1 дх, ди 1 1* дХі ди2 1* 1 1* 1 д2Н 1 д2И 1 д2Н 1 ! д2Н I 1 д2н 1 дх2 дх! * дх^ дх2 дх3 1* 1 дх2 ди 1 1 * дх2 ди2 1* 2 1* 1 д2Н 1 д2Н 1 д2Н I 1. дгН 1 1 д2Н I дх3 дхг 1* дх3 дх2 1* дх2 ! дх3 дих 1* дх3 ди 2 1* з I* 1 — - - 1. д2Н 1 д2Н 1 1 д2Н 1 ! д2Н 1 д2Н I dut дхі 1* dui дх2 ди% ди t ди2 1* 1 1 1 1* д2Н 1 д2И 1 д2н 11 д2Н • 1 д2Н 1 ди2 дхі 1* ди2 дх2 1* ди2 дх3 ди2 dut 1* ди^ 1 2 1* . 241
Следующие вычисления совместно с соотношениями (5.261) и (5.262) и с учетом того, что 1 =0, доказывают справедливость уравнения (5.263): X I* / + ^-/8i|5(/1) + e2I(/1), -g-|jei|,(/1) + e2|(/])]\+o(82)= (5.264) = e\^r| ’ + 82\1f| ’ + + 4 <4 (U > t (Л)) + ° (e2); (5-265) G j(p(O> x*(t) — X(t)}dt = (pttj, x*(t1) — x(tl)) — to t — $ {p(t), x*(t) — x(t))dt = (5.266)1 <0 = e(-p(/1), -ф (/,)> -f-e2 <—p (/x), I('i)) + + 8 j (p (/), (/)) dt + 82 J {p (/), I (0> dt + o (82); (5.267) p*(t), u(t), /] - H [л* (/), />*(/). «*(/), /] = =<<L ”»<')+'!б«>+<4£- L- '”('>>+ + 4 /et (0 + e2l (0. J, let (0 + (01> + + 4<84(0 + 82|(^ -4«)|ЛП(^)> + + 4\et’<Z)’ ^(^r)|j8t(0 + e2|(0|/+ O(e2)= (5.268) Так как мы приняли, что ô2J (zz) >0 и 82> 0, то /ш), 4Ц'ч,(/і)>+ д2Н I I д ( дН \\ Т I ^L| Ln(oJ/ - дх \ ди J I, ! ди2 I, J (5.270) 1 Так как x* (t9) = X (Ze). 242
для всех т] (/) 0. Прежде всего заметим, что в силу уравнения (5.258) и условия гр (/0) = 0 малые изменения т| (/) будут вызывать малые изме¬ нения гр (/). Обратное утверждение несправедливо; иначе говоря, можно выбрать больше изменения т) (/), для которого гр (/) будет мало. Причина этого в том, что т] (/) есть вход (или управление) системы с переменными параметрами, которая вначале находится в покое и выход которой равен гр (0* Это положение иллюстрируется рис. 5.8. Таким образом, для того чтобы неравенство имело место, члены уравнения (5.270), содержащие т] (/), должны быть положительны. В частности, член (5.271) «наиболее» зависим от т] (/), и поэтому он должен быть положительным для всех т] (t) 0. Очевидно, это возможно лишь в том случае, когда l(t) Рис. 5.8. Возмущение управления т| (/) воздействует на линейную систему гр (/) = I гр (t) 4- I т)(/). «Большому» сигналу т] (/) может соответ- I* uU I* ствовать «малый» 1|> (/) д2 H I матрица | положительно определенна 1 для t из [/0, /х]. Но если I положительно определенна, (5.272) то экстремум Н [х* (/), р* (/), и, /], рассматриваемый как функция от а, при и = и* (t) является минимумом. Таким образом, эвристически дока¬ зана следующая теорема. Теорема 5.3. Пусть a* (t) — допустимое управление и х* (/) — траек¬ тория системы (5.196), соответствующая а* (/), исходящая из х0 [т. е. х* (^о) = ко 1 • Необходимым условием оптимальности а* (/) является существование функции р* (/) такой, что а) х* (/) и р* (/) есть решения системы уравнений р* (о = —і** (о. р*(о. «*(0. и. (5.273) (5.274) удовлетворяющие граничным условиям X* (Ц = -Ѵо; Р* (/і) = -^-[х* (/,)!; б) гамильтониан Н [х* (/), р* (/), и, /], рассматриваемый как функ¬ ция и, имеет минимум (возможно локальный) при и = а* (/) для t из Прокомментируем эту теорему. Во-первых, мы не доказали ее строго; однако строгое доказательство, опирающееся на вариационные методы, довольно сложно, требует различных предположений (например, соответ- 1 См. § 2.15. 243
ствующую дифференцируемость функций) и, во всяком случае, находится вне рамок настоящей книги. Во-вторых, в противоположность теореме 3.2 мы показали лишь, что и — и* (t) является локальным минимумом Н 1-Ѵ* (О, Р* (О, ^1- На практике, как мы это увидим при обсуждении принципа минимума, и = и* (t) является абсолютным минимумом Н [лг* (/), р* (/), и, t], Таким образом, можно обнаружить необходимость другого математического аппарата, помимо основных вариационных принципов. Действительно, в последующем параграфе, где рассматривается задача с закрепленным концом, обнаружится трудность доказательства того, что оптимальное управление экстремизирует Н. Это и определит необходи¬ мость искать новый подход к решению подобного рода задач. Наконец, заметим, что полная производная от Н по времени вдоль оптимальной траектории равна частной производной Н по времени: dH [X* (/), р* (О, а* (О, / дН I , di I/ Х (0/ + <'’/ + <-гг “• <'>> + 4?-1. - <5-275> на основании уравнений (5.273) и (5.253). Это означает, что если Н от t явно не зависит, то Н постоянна вдоль оптимальной траектории [сравните с (5.176)]. Пример 5.8. Для иллюстрации характера трудностей, возникающих при проведении строгого доказательства вариационными методами, покажем, что из соотношения (5.270) для частного случая п = т — 1, т. е. случая, когда х (t) и и (t) являются скалярными функциями времени. Запишем уравнение системы х(0 =f[x(i), и (t), /]. д2Н I следует неотрицательная определенность - Уравнение возмущения (5.258) примет вид Ф (/) — a (t) ф (0 + b (О Î] (0, (5.277) где для удобства обозначим a(t) — - j и b(t) — | . При принятых предположениях уравнение (5.270) можно записать в виде 4f*L4'2<z,) + I [4^_|л2(/)'і’2та’ІЛ(Оті(О+'^'І.т13(/)]dt>Q (5278) to для всех 1] (/) =f= 0. Покажем, что из уравнения (5.278) следует п д2И I Допустим, 0 при t — t. В силу д2Н I непрерывности , можно пред¬ че положить, что в малой окрестности S точки t (т. е. на малом интервале около t) 4^1 < —а, а > 0. (5.280) ди2 U Покажем, что b (/) =/= 0 на любом подынтервале из S. Если b (/) = 0 на подынтер¬ вале Œ S, то, полагая г) (/) ^ 0 на дополнении к Si (т. е. г) (t) — 0 для t Ç [/0, іг ] — Sx) и принимая, например, т] (/) — 1 на Sx, найдем, что левая часть уравнения (5.278) окажется 244
отрицательной [так как гр (t) при таком выборе т] (t) тождественно равно нулю]. Таким образом, можно считать, что b (/) =/= 0 на S. Из выражения (5.277) следует, что П (0 = b"1 (0 гр (0 — Ь-1 (0 а (0 гр (/). (5.281) Ограничим выбор Л (0 функциями, которые равны нулю на дополнении к S (т. е. на [/0, /, ] — S) и для которых гр равно нулю в конечных точках S. Иначе говоря, если S = = [Z — е, t + 8], то Т) (0 = 0 для t < t — 8 и ?+ 8 < t а гр (Î — ‘е) = = гр (t -h 8) = 0. Для таких функций т] (t) уравнение (5.278) запишется в виде Н“е f ( H I I J ’ IF | Л (0 + 2 dTdù I* (<) [6’1 (Z) *(Z) ~(t} a (t) (0J + i—e (5.282) Проинтегрировав по частям член, содержащий гр (t), получим неравенство H-е 2 J [QW(O + S|*n4n]*>o. t—е где (5.283) (5.284) Полагая, что <р (t) — Ф (/, t — г) есть фундаментальное решение (матрица) урав¬ нения (5.277) и что ф (/) =j= 0, имеем t гр (/) = ф (t) J ф"1 (т) b (т) т] (т) du. (5.285) t— Е Так как q (/) =f= 0 и b (t) 4= О’ то можно считать, что для достаточно малого 8 -^>₽>0 (5.286) при t ИЗ [/ — 8, t 4- 8]. В силу непрерывности, можно также считать, что max I Q (t) ф2 (t) I < М < сю. (5.287) (€Û-e. ?+е] Уравнения (5.286) и (5.287) остаются справедливыми и при уменьшении 8, выбе¬ рем 8 настолько малым, чтобы — ар — + 2Л1е < 0, (5.288) где а определяется уравнением (5.280). Далее положим ті (/) = Ь"1 (/) ф (f) — sin • (5.289) 8 8 Тогда соответствующее решение гр (/) уравнения (5.277) запишется в виде t гр (t) = q (/'. У sin ?£L£L—É1 = ф çf) sin2 Л , (5.290) t—Q 245
и поэтому ф (t — е) = гр (t 4- е) — 0. При таком выборе т] (t) уравнение (5.283) будет иметь вид t+e У Q (і) ф2 (О sin4^—J/ _|_ ?—е д2Н I ф2 (/) л2 ди2 I* Ь2 (/) 82 . 9 2л (t — t) sin2 i - 8 ^>0. (5.291) Левая часть уравнения (5.291) вследствие условий (5.286) и (5.287) меньше, чем 2Ме — сф . 8 Таким образом, приходим к противоречию, которое и доказывает справедливость соотношения (5.279). Иначе говоря, считая, что неравенство (5.280) справедливо, мы ока¬ зались в состоянии отыскать управление т] (t), для которого неравенство (5.278) не выпол¬ няется. Это приводит нас к заключению, что условие (5.280) не может быть справедливо (см. [80]). 5.8. ДОСТАТОЧНЫЕ УСЛОВИЯ ДЛЯ ЗАДАЧИ С НЕЗАКРЕПЛЕННЫМ КОНЦОМ Усилим необходимые условия предыдущего параграфа, с тем чтобы получить некоторые локальные достаточные условия, которые будут использоваться нами в гл. 9. Ранее мы предполагали, что оптимальное управление и* существует, и нашли определенные условия, которые при этом должны удовлетворяться. Теперь допустим, что для управления и удовлетворяются определенные условия. На основании этого докажем оптимальность управления (локальную) а. Исследования покажут раз¬ личия между необходимыми и достаточными условиями. Рассмотрим динамическую систему вида х = /(х, a, t\ (5.292) где хи/ — /г-мерные векторы и и — m-мерный вектор, причем 0 <<т < п. Будем считать, что и не ограничено и t0—начальный момент времени, причем х(/0) = х0 (5.293) — начальное состояние. Множество цели S имеет вид Rn X {/J, где tr — фиксировано и tr > tQ. Функционал преобразования имеет вид G J (и) = К [at(G)1 + f L a(t), л dt, (5.294) где К и L — достаточно дифференцируемые действительные функции и X (t) — траектория, удовлетворяющая (5.292), исходящая из х(і0)=х0, являющаяся результатом действия управления и. Нашей задачей вновь является: Найти управление и (/), минимизирующее функционал преобразо¬ вания J (а). Прежде чем перейти к достаточным условиям, посмотрим, к чему приводят возмущения управления и (которое может и не быть оптималь¬ ным). Обозначим через х траекторию, удовлетворяющую уравнению (5.292), исходящую из X (/0) = х0 и произведенную управлением и. 246
Если и — возмущенное управление и: u(t) — и(t) 4 ет] (/), (5.295) то соответствующую и (0 траекторию х (0 можно записать в виде x(t) = x(t) 4- егр (t) + О (е), (5.295) где гр (0 — решение линейного дифференциального уравнения Ч>И-Й|ДЧ>(')+^|ЛЧИ (5.297) с начальным условием t(U = 0, (5.298) где значок |Л обозначает, что величина должна вычисляться вдоль х (0. Например, -|^|Л — якобиан от f по лг, вычисленный при [лг (0, а(0, /]. Полагая, что Н (лг, р, и, t) — гамильтониан данной задачи, т. е. H [х, р, и, t] — L \х, и, t] + (р, /(X, и, t\)y (5.299) и обозначив через р(0 решение линейного дифференциального уравнения Р(0= — Р(О. ЩІ), /]= (5.300) = <5-301> удовлетворяющее граничному условию = <5-302> мы, как и в предыдущем параграфе, можем заключить G где |Л обозначает, что величина вычисляется вдоль х; например -ч— — ІД градиент Н по отношению к иу вычисленный при [лг(0, p(t), u(t), /]. Итак, имеем 11 ÔJ(zz)(« —и) = е [\-^| , n(0zd/ (5.304) J \ OU IЛ ôv («) (« - «)=4 S |л *(Zi)/ + 247
Получив последние выражения, можно доказать следующую теорему. Теорема 5.4. Пусть и удовлетворяет условиям: а) -^-|Л = 0 для * из lZ0> 411 (5.306) б) для и, достаточно близкого к и. существует неотрицательная кусочно-непрерывная функция М (t) такая, что величина члена О (е2) в уравнении (5.303) удовлетворяет неравенству |О(е2)| (/,) И3 ЛШ+ I е I3 jh(W№ (5-307) в) существует положительное число kx такое, что <®. (5.308) о I для всех векторов ѵ из Rfl, т. е. симметричная матрица -у-у положи- ОХ" I а тельно определенна, если М (/х) > 0, и положительно полуопределенна, если М (/J = 0 х; г) существует положительное число k2 такое, что для всех ѵ из Rn, w из Rm и для / из [/0, /J. В выражении (5.309) ра- венство имеет место лишь при w = 0. Это означает, что матрица положительно определенна для t из [/0, /J и вся матрица размера п + + т X п + т, входящая в уравнение (5.309), положительно полуопре¬ деленна. В этом случае и есть локальный минимум J. Доказательство: Предположим, что условие б) удовлетворяется, если IIи— и\\ max I |ія(/) — u(t)\\} < ô. (5.310) Тогда, по условию а), для и, удовлетворяющего соотношению (5.310), получим /(«)—/(») > ÔV(м)(м— «)— |е|3j)t|>((i)ll3 W1) — -|е|3 j'hWlPWH- (5.311) to Используя соотношение (5.305) и условия в) и г), получаем, что J (и)-J (и) > 4 Н (*і) F м (^) 4-^2 -ÿ- J11П (О II2 м (/) dt - to G — I 8 |3||i|> ((,) ||3Л1 (^) — | е |3 (5-312) to 1 См. § 2.15. 24a
откуда j(и)[4— івіналі]ншмш + J [-^-ІеІІІпЮІі] (5.313) tb Но поскольку ф (/) есть решение уравнения (5.297) с начальным условием 4» (/0) -= 0, получим |8|ІІЧ>(Л)ІІ <-М|8| max ЦпЮІІ = Ihil (5.314) <£[Л>. «il для некоторого N > 0, которое не зависит от г). Так как k± и k2 положи¬ тельны, то существует ô0 такое, что 0<ôo<ô (5.315) и ^>Ô0. (5.316) Следовательно, J(u) — J (и) >0 (5.317) для всех и, удовлетворяющих условию || и — и i| <ô0. Итак, мы пока¬ зали, что и есть локальный минимум J. Следствие 5.1. Предположим, что М (t) 0. Для того чтобы и было локальным минимумом J, достаточно выполнения условий а) ^| 1 ди |л д2Н I б) -j-т положительно определенна; в) матрица размера п + т X п + т, входящая в уравнение (5.309), должна быть положительно полуопределенна. Следствие 5.2. Предположим, что динамическая система линейна, т. е. х(0 - д- В (/) и (0, х(/0) - лг0, (5.318) и функционалом преобразования J является квадратичная форма J («) = Y {X ((,), Fx (/,)) + y j [ 'X (t), Q (t) X (0) + («(/), R (0 U (0>] dt, (5.319) где F, Q (t) и R (t) — соответственно nXn, пХпитХт матрицы. Для того чтобы управление и было локальным минимумом функционала J, достаточно выполнения условий: а) /? (/) положительно определенна для I из По, /Д; б) Q (/) положительно полуопределенна для t из [/0, /Д; в) F положительно полуопределенна; г) и — решение уравнения Я(/)и(/) + ВД/)р(0==0, (5.320) где р (/) — решение линейного дифференциального уравнения р = (5.321) 249
удовлетворяющее граничному условию Упражнение 5.13. Докажите следствие 5.2. В § 5.7 мы показали, что если а* есть дН I п д2Н I j = 0 и матрица 1 положительно Как было принято выше, управление p(t1) = Fx(t1)f (5.322) где, в свою очередь, х (/)— решение уравнения (5.318), соответствую¬ щее и. Следствие 5.2. будет часто использоваться в гл. 9. оптимальное управление, то определенна. и удовлетворяет этим двум условиям и, кроме того, дополнительным условиям б), в) и г) теоремы 5.4, а затем доказано, что и является локальным оптимальным управлением. Поэтому дополнительные условия теоремы 5.4 были названы усиливаю¬ щими необходимые условия § 5.7. Упражнение 5.14. Рассмотрите систему первого порядка уЗ (t\ X (t) = — X (о + и (0 ; X (0) = х0 о с функционалом стоимости вида 1 J (и) = ў х2 (1) + у j [х2 (/) + и2 (t)]dt. о Предположим, что и* (/) — оптимальное управление, х* (/) — соответствующая оптимальная траектория, а возмущенные управление и траектория задаются следу¬ ющими соотношениями: U (0 = W* (0 + 8Î] (/) и X (/) = X* (0 + 8ф (/)• При этом необходимо: а) показать, что X (0 = - х* (0 — 4-х*3 (0 + и* (t) — е <р (t) [1 + X*2 (/)] + и + ет] (/) — е2<р2 (0 X* (0 — 6 ; О б) найти в выражении пункта (а) члены, соответствующие следующим членам уравнения (5.208): в) проверить уравнение (5.215) для этого частного случая; г) показать, что гамильтонианом данной задачи является выражение н (X, Р, и, 0 = -g- X2 + -Ь и2 — хр Ь х3р + up; д) показать, что члены уравнения (5.226) для данной задачи имеют вид =х*(0-Р(0-х*2(/)р(0; О (е) = -1- [1 - 2х* (0 P (t)] [X (0 - X* (О]2 + у,- [« (О - и* (/)12 - 250
--2p (t) [x (t) - x* (/)]’ = O J 1 1 2 == -y П — 2x* (/) P (/)] 82ф2 ОТ + -y eV (0 ~ y P ОТ е3Ф3 ОТ; е) определить члены, соответствующие обозначенным через о (в) в уравнениях (5.227), (5.228) и (5.230); ж) записать условие (5.232) в развернутом виде; з) показать, что р (/) должно быть решением линейного дифференциального урав¬ нения p(t) = —х* (0 + [1 + х*2 От] РОТ, а р* (/) должно быть единственным решением этого дифференциального уравнения, удов¬ летворяющим условию р*(1) = х*(1); и) используя условие (5.253), показать, что и* (/) и р* (t) должны быть связаны соотношением и* (/) =— р* (0; к) показать, что уравнение (5.263) для данной задачи имеет вид â2z/ 2|2/1ч( 9C/W)] Г1--2х*(0Р*ОТ 01 1 ÔV(u*)(u — u*) = eV (1) + е- I / , „J /dt>\ J\Ln(<)J L 0 iJLn(OJz J 0 л) показать, что x* (t) и р* (/) удовлетворяют системе уравнений //\ x* (t) ~ —х* (/) р* (/); Û р* (/) = —x* (t) 4- р* (/) + x*2 (t) р* (0 с граничными условиями х* (0) = х0; р*(1) =х*(1); м) предположив, что и — управление, для которого существует соответствующее р, причем и, р и x удовлетворяют необходимым условиям и кроме того соотношению х(0рОТ^-у Для t из [0, 1], показать, что и должно быть локальным минимумом J. Упражнение 5.15. Рассмотрите систему *i (t) = ~*2 (/); Хі (0) = gf, х2 (0 = — х2 (0 t2 + и (t)\ х2 (0) = g2 с функционалом стоимости 1 J (и) = j (t) t- + xf (t) + u? (/)] dt 0 и напишите в развернутом виде следующие уравнения: (5.208), (5.211), (5.213), (5.215), (5.225), (5.227), (5.228), (5.230), (5.236), (5.237). (5.239), (5.240)—(5.243), (5.263), (5.271), (5.273), (5.303) и (5.309). Упражнение 5.16. Повторите то же самое для системы ; (/) = —е~хг wx (t) +u(t)x (0 + и (t); x (0) = x0 с функционалом J (u) =- J k4 (0 + u2 (Z)] dt. 0 251
5.9. ЗАДАЧА С ЗАКРЕПЛЕННЫМ КОНЦОМ Рассмотрим задачу с закрепленным концом, пользуясь вариацион¬ ными методами. Пытаясь показать, что оптимальное управление должно экстремизировать гамильтониан, мы не можем решить задачу до конца, и это вынуждает нас искать другой подход к задаче управления. Рассмотрим динамическую систему »(/), t] (5.323) где х (/) и f — n-мерные векторы и и (/) — /77-мерный вектор, причем О <^т < п. Будем считать, что управление не ограничено, tQ — на¬ чальный момент времени, т. е. аг(/о) = лго, (5.324) и область цели имеет вид S = (Хр ^}, (5.325) где xt — заданный элемент из Rn и tx — фиксированное время tr > /0. Иначе говоря, мы хотим, чтобы наше движение начиналось в точке лг0, а заканчивалось в точке хг. Пусть L (х, и, t)— «достаточно» дифференци¬ руемая действительная функция и G J(u) = J L[x(/), u(t), t]dt (5.326) ^0 — функционал, где x (Z)—траектория, удовлетворяющая уравнению (5.323), начинающаяся в точке х (/0) -- -*о и произведенная управле¬ нием и (f). Задача формулируется следующим образом: отыскать допу¬ стимое управление и (t), переводящее х(/0) *ѵ0 в х (^) х± и мини¬ мизирующее функционал J (и) относительно всех таких управлений. Попытаемся получить необходимые условия, подобные тем, которые даются теоремами 5.2 и 5.3 с помощью пошаговых операций (аналогично § 5.6 и 5.7). Шаг 1. Предположение существования оптимума. Пусть и* (/) — оптимальное управление и x* (t) — соответствующая оптимальная траек¬ тория. Функции и* (0 и x* (/) удовлетворяют условиям x*(t) = f [x* (/), #*(/), /]; (5.327) х* (/0) = -Vo, х* (/х) = хг. (5.328) Если и (/)— любое допустимое управление, для которого соответ¬ ствующая ему траектория начинается в точке х(/0) = х0 и оканчивается в x(/J = хх, то G «/* = /(#*)= J L[x*(/), #*(/), t]dt < G </(«) = J L\x(t), a(t), t]dt. (5.329) t0 Шаг 2. Возмущения. Поступая так же, как и в § 5.7, получим соот¬ ношения u(t) = а*(/) + ет)(О’> (5.330) x(t) = х*(/) + 8ф(0 + О (е); (5.331) ^(0+ Wo) = 0» (5.332) 252
которые связывают возмущения управления с соответствующими им воз¬ мущениями траектории. Однако требуется, чтобы возмущенная траекто¬ рия заканчивалась в точке xY [т. е. х (/J = xj. Это означает, что 0(8). (5.333) Отметим, что ф(/) не зависит от 8, так как ф (/) является функцией только т| (/) (и оптимальной траектории), и поэтому ф(/і)-О. (5.334) Следовательно, вариация управления ет] (/) не может быть совершенно произвольной. Действительно, если Ф (/, /0) — фундаментальная матрица линейной системы (5.332), то т](/) должно удовлетворять уравнению 0 = J ф-'(/, /0)>| (5.335) to * это условие аналогично условию (5.121). Теперь можно ввести гамильтониан Н и дополнительную переменную р (/), точно так же, как в § 5.6 и 5.7. Пусть р (/) — произвольная кусочно¬ непрерывная функция и гамильтониан Н дается выражением Н(х, р, и, t)^L(x, и, t)+(p, /(х, а, /)). (5.336) На основе доказательств, аналогичных предыдущим, заключаем, что ti / х^-L’п(/)/Л=0 (5-337) to для всех т] (/), удовлетворяющих (5.335), где р (t) есть решение линей¬ ного дифференциального уравнения = РУ), /]= (5.338) = —«*(0- zl — (-^-І^*(0> «*(0. л) p(t). (5.339) Очень трудно показать, что существует решение этого уравнения р* (t), для которого -^-|х*(/), /?*(/), «*(/), /] =0. (5.340) Вопрос о существовании такого р* (t) весьма важен, так как он свя¬ зан с понятиями управляемости и нормальности вариационной задачи, но последний находится вне рамок настоящей книги. Советуем читателю самостоятельно рассмотреть этот вопрос и убедиться в тех трудностях, которые лежат на пути его решения. При этом рекомендуем воспользо¬ ваться работами [26] и [158]. Для преодоления этих трудностей примем другой подход к решению задачи, который и приведет нас к принципу минимума Понтрягина. Перед тем, как приступить к детальному исследованию этой новой поста¬ новки задачи, посвятим следующий параграф трем вопросам: обзору сде¬ ланного ранее, обсуждению общих результатов и рассмотрим другие причины (например, естественные ограничения в задачах и устранение жестких требований в отношении дифференцируемости L), служащие осно¬ ванием для перехода к новой точке зрения. 253
5.10. ОБСУЖДЕНИЕ ВАРИАЦИОННОГО МЕТОДА Основной целью настоящего параграфа является рассмотрение необ¬ ходимых и достаточных (локальных) условий, полученных в § 5.7 и 5.8. В заключение параграфа мы укажем причины, по которым целесообразно решать задачу управления, основываясь на другом подходе. Рассмотрим систему x(t) = f\x(t\ u(t\ /], (5.341) где состояние x(f) есть /г-мерный вектор и управление и (t) —т-мер- ный вектор, причем 0 << т < п. Будем считать, что управление неогра- ничено, что t0 — начальное время, при котором х(/0) = х0 (5.342) есть начальное состояние, а область цели имеет вид 5= (5.343) где tx — фиксированное время, tr > /0. Иначе говоря, мы имеем дело с задачей с фиксированным временем и незакрепленным концом. Предпо¬ ложим, что функционал имеет вид g J(«) = J L [*(/), »(/), t]dt, (5.344) G t. e. в него не входит «стоимость» конечного состояния, А? |лг (/Д 1 = ~ 0. Итак, задача заключается в том, чтобы отыскать и, минимизиру¬ ющее J (и). Так как мы собираемся иллюстрировать необходимые и до¬ статочные условия с помощью «символических графиков», напомним, что: 1. обозначает величину управления в момент времени t, / J, т. e. u (/) — элемент из Rm. 2. gjобозначает всю функцию управления на интервале [/0, /Д. Для упрощения мы часто будем писать просто а, имея в виду, что и = u[to, G1- (5.345) Имея дело с различными управлениями на [/0, /х], мы будем для их различения использовать верхний индекс, например, =■ GP (5.346) что для заданного значения і будет обозначать конкретную функцию управления, а вектор и1 (t) будет обозначать величину этой конкретной функции управления в момент времени /, ZÇ [/0, /Д. 3. Записывая $([/0, ^Д, Rm)> будем иметь в виду функциональное пространство 1 всех кусочно-непрерывных функций, преобразующих [?0, М в Rm. Так как это множество допустимых управлений, то в даль¬ нейшем вместо символа ^3 ([/0, /Д, Rtn) будем пользоваться символом U, т. е. U = {и : и есть допустимое управление} = $([/0, /Д, Rrn). (5.347) Конкретные функции управления и1 будем называть точками функ¬ ционального пространства U. 4. Говоря «а близко к а», будем иметь в виду, что расстояние в функ¬ 1 См. § 3.15, в частности (3.136). 254
циональном пространстве U между и и и мало. Напомним, что в § 3.15 [уравнение (3.124)1 мы определили расстояние d(u, и), положив d(u, а) = ||а— «|| = sup ||а(/) — «(/)||. (5.348) гб>, м Функция U[t0, G1 на Рис- 5.9 «ближе» к функции G], чем функ¬ ция u[tn, м Если к системе, которая при t = t0 находится в известном состоя¬ нии Хо, прикладывается управление и1 = u{to, /д, то в результате полу¬ чится вполне определенная траектория х1 = x\tQ, G], соответствующая и' и, следовательно, вполне определенная (скалярная) величина J1. Иначе говоря, имеем G Ji = J(a<) = J L \xi(t), а1 (О, Л dt. (5.349) ^0 Строго говоря, функционал J1 зависит от многих обстоятельств, и его следует записать как Ji = J(ui ) = J(ul, xQ, tlf /) (5.350) для того, чтобы отразить зависимость J1 от следующих факторов: началь¬ ного состояния х0, начального времени /0, конечного времени tly системы х (/) = fïx (/), и (t), t] и управляющей функции и1. г п Рис. 5.10. Символический график Рис. 5.9. Управление « «ближе» к и, чем управ- зависим0Сти функционала J (а) от « ление и Однако для фиксированных х0, 4, h и f величина J является функ¬ цией только элемента и1 из Ц. Таким образом, мы можем нарисовать символический график зависимости J (и) в функции от а, как показано на рис. 5.10. Подчеркнем, что «ось» U на рис. 5.10 представляет собой функциональное пространство U и что каждая «точка» и на «оси» U есть функция u[to, tl]. Функционал J (и), показанный на графике рис. 5.10, имеет: абсо¬ лютный минимум при а3, относительные минимумы при а1 и а5, относи¬ тельные максимумы при и2 и а4; перегиб при иь. Иначе говоря, J (и) обладает следующими свойствами: а) первая вариация J (а) равна нулю при и1» а2, а3, и4, а5 и а6; 255
б) имеют место неравенства: J(u3)<J (и3) J(u5)<J (и5) J(«2)> J(«2) (и*) для всех и1 «близких» »l; для всех и3 и3\ для всех и3 «близких» и5; для всех »2 «близких» и2\ для всех »4 «близких» и4. (5.351) Управление и3 оптимально глобально, а управления и1 и и5 назы¬ ваются оптимальными локально. Рассмотрим теперь поведение гамильтониана И нашей задачи с функ¬ ционалом, показанным на рис. 5. 10. Сначала мы обсудим свойства Н с аналитической точки зрения, а затем проиллюстрируем эти свойства символическими графиками. Гамильтониан нашей задачи имеет вид H(xt Р, и, t) = L(x, и, /) + (р, /(х, и, 0), (5.352) а каноническая система векторных дифференциальных уравнений запи¬ сывается в форме х(/)= Р(Ѣ «(0. d; (5.353) up р(/)=/?(/), «(/), t\ (5.354) co следующими граничными условиями: х(/0)=гХ0; (5.355) р(/і) = 0. (5.356) Нас особенно интересуют решения этих уравнений для управлений и1, . . ., а6, которые соответствуют экстремумам J (и) (см. рис. 5.10). Предположим, что а1, и2, . . ., и3 показаны на рис. 5.11, а и со¬ ответствующие им переходные процессы нашей системы (5.323) х1, X2, . . ., X6, исходящие из одного и того же начального состояния X (/о) — х0, изображены на рис. 5.11, б. Так как-^- =/(х, », /), траекто¬ рии X1, X2, .. ., X6 не зависят от дополнительной переменной. На рис. 5.11, в показаны решения уравнения (5.354) р1, р2, .. . , р6, соответствующие управлениям а1, »2, . . ., »6. Иначе говоря, рі = p[tot есть решение (линейного) дифференциального уравнения p(t) = -^[*‘(a p(t), u(t), /], (5.357) удовлетворяющее граничному условию pz (ZJ = 0 для і = 1, 2, . . ., 6. Так как управления а1, я2, . . ., »б соответствуют экстремумам J (и), p‘(t), /]=0 (5.358) для і — 1, 2, . . ., 6 и tQ Ио, Далее, так как я1, и3 и и5 — минимумы, и2 и »4 — максимумы J (и), а при »6 имеет место перегиб J (»), можно обнаружить следующие свойства матрицы размера т X т: 256
положительно определенна при [х'(/), р'(/), «'(/), /] для /= 1, 3, 5; (5.359) д2н отрицательно определенна при \x\t), pk(t), uk(t), /] для k = 2, 4; (5.360) д2Н не является ни положительно, ни отрицательно определенной Рис. 5.11. а) Экстремальные управления и1, . . ., и6, б) Со¬ стояния х1, ...» х6, соответст¬ вующие управлениям а), в) До¬ полнительные переменные р1, . . .,р6, соответствующие управ¬ лениям а) и состояниям б) при [х6 (0, 0е (0. «6 (0>- N. Можно отметить, что матрица - д2н ; д2Н - дх2 і дхди ~д2Н I д'2Н - _ дидх I dit2 (5.361) (5.362) = Q(x, р, и, t) обладает свойствами: а) Q положительно определенна при [.?(/), p'(t), ti'(t), /] для / = 1, 3, 5; (5.363) б) Q отрицательно определенна при [xk(t\ pk(t), uk(t), /] для k = 2, 4; (5.364) в) Q не является ни отрицательно, ни положительно определенной для p\t), t\. (5.365) 9 Атанс и др. 257
Эти результаты дают основания считать, что для t Ç [Zo, ZJ имеют место неравенства H\x\t\ рЦі), ^(Z), Z] /^(Z), яа(0, t] (5.366) для а = 2, 3, 4, 5, 6; H[x3(t\ p3(t), a3(Z), Z] </У [x3(Z), p3 (Z), #0(Z), Z] (5.367) для p = 1, 2, 4, 5, 6; tt[x6(Z), p5(Z), tt5(Z), Z] <H[x5(Z), p5(Z), #y(Z), Z] (5.368) для у = 1, 2, 3, 4, 6; H[x2(t), p2(t), Z]^tf[x2(Z), p2(Z), aô(Z), Z] (5.369) для ô = 1, 3, 4, 5, 6; H[x*(t), p4(t), t]^H[x*(f), p*(t), #e(Z), Z] (5.370) для 8 = 1, 2, 3, 5, 6. Ha рис. 5.12 для иллюстрации неравенств (5.366) показана зависи¬ мость H [х1 (Z), р1 (t), и (Z), Z] от и (Z). Плоскость и1и2 на рис. 5.12 пред¬ ставляет собой пространство Rm. H [х1 (Z), р1 (Z), и (Z), Z] имеет минимум при и (t) = и1 (Z). Несмотря на то, что и (t) — и3 (Z) является глобаль- Рис. 5.12. Гамильтониан H [х1 (Z), р1 (/), и (t), /] имеет минимум при и1 (/) и не имеет минимума при и3 (t) условия могут быть установлены ным минимумом J (а), гамильтониан H [х1 (Z), р1 (Z), и (Z), Z] при управле¬ нии и (t) = и3 (t) минимума не имеет. На рис. 5.13 показано, что Н [х4 (Z), p*(f), и (Z), Z] имеет максимум при и (t) = a4 (Z) [см. неравенство (5.370)1, ас помощью рис. 5.14 иллюстрируется перегиб Н [х6 (Z), р6 (Z), и (Z), Z], имеющий место при и (Z) = д6 (Z). Эти символические графики иллю¬ стрируют локальность необходимых условий теоремы 5.3. Минимум функ¬ ционала имеет место как в случае гло¬ бально оптимального управления, так и для управлений, локально миними¬ зирующих функционал. Они иллюстри¬ руют также то, что соответствующие для управления локально минимизи¬ рующих функционал. Эти символические изображения подчеркивают ло¬ кальный характер необходимых условий, которые не дают достаточной информации для определения оптимального управления. Например, все три управления а1, и3 и и5 удовлетворяют необходимым условиям тео¬ ремы 5.3. К выводу о том, что и3 оптимально глобально, можно придти, лишь вычислив J (и1), J (и3) и J (и5) и выбрав наименьшее из получен¬ ных чисел. Еще раз вернемся к рис. 5.10. Если ограничить допустимые управле¬ ния замкнутым множеством Q, показанным на рис. 5.10, то легко видеть, что J(tt7)<J(tt) для всех и из Q. (5.371) Однако и7 не является экстремумом Н, т. е. [х7 (Z), р7 (Z), и1 (t), t] =^= 0 и матрица ^^-Іх7 (Z), р7 (Z), и7 (Z), Z] может не быть положи¬ тельно определенной. Таким образом, если разыскивается минимум функ¬ ционала J (и) на множестве Q, необходимые условия не имеют места, 258
и использовавшиеся ранее вариационные методы оказываются бесполез¬ ными. Читатель должен иметь в виду, что и1 является граничной точкой Q и рассматривать это положение в свете результатов, полученных в § 5.2 и 5.3 с учетом замечаний § 5.5. Мы уже отмечали, что при получении соответствующих необходимых условий для задачи с закрепленным концом на базе вариационных методов, использовавшихся в задаче со свободным концом, возникают значитель¬ ные трудности. Эти трудности возникают прежде всего из-за отсутствия уверенности в том, что имеется достаточное количество вариаций [см. уравнение (5.335)]. Необходимо указать на дальнейшие причины, по кото- рым следует вести рассмотрение с другой точки зрения. Рис. 5.13. Гамильтониан Н [х4 (/), р4 (/), и (/), /] имеет максимум при а4 (t) Во-первых, мы требовали, чтобы L и f были «достаточно» дифферен¬ цируемыми, и, в частности, чтобы была определена. Это исключает критерий tx (5.372) который, как мы увидим в гл. 8, весьма важен. Поэтому ищем подход, не накладывающий жестких требований к дифференцируемости L и /. Во-вторых, рассмотрев поведение J (и) на Q (см. рис. 5.10), найдем что наши необходимые условия неприменимы в случае замкнутого огра¬ ничивающего множества Ч Таким образом, ограничения управления типа |uz(/)| і = 1, 2, ..., т (5.373) далеко не элементарны. Далее, если Q состоит из конечного числа точек, то вариационный подход вообще неприменим. Так как ограничения имеют исключительно большое практическое значение, следует попытаться найти метод, позволяющий легко их учитывать. Наконец, мы рассматривали только такие задачи, в которых множество S представляло собой либо все пространство либо единственную точку. Однако во многих за¬ дачах множество S является «гладким» и поэтому нужен метод, позво¬ ляющий рассматривать такие задачи. Всем этим требованиям удовлет¬ воряет принцип минимума Понтрягина, который требует относительно слабых предположений о дифференцируемости и очень хорошо подходит для задач с ограничениями, а также позволяет легко учитывать «гладкие» множества конечных состояний. 1 Вариационные методы можно распространить и на случай таких ограничений [54], однако доказательства этого очень сложны. 259
ПРИНЦИП МИНИМУМА ПОНТРЯГИНА 5.11. ВВЕДЕНИЕ Приступим к изучению знаменитого принципа минимума Понтрягина (см. [179]). При его изучении поставим перед собой следующие основ¬ ные цели: 1. Дать строгую и точную формулировку принципа минимума. 2. Дать эвристическое доказательство, основанное на доказательстве, приведенном в [179], и тем самым подойти к строгому доказательству. 3. Интерпретировать принцип минимума различными способами для того, чтобы показать глубину его содержания. В последующих главах книги рассматривается, как можно исполь¬ зовать принцип минимума для решения различных задач управления. Прежде всего еще раз сформулируем общую постановку задачи управле¬ ния. Далее мы выделим два частных случая задачи управления и сфор¬ мулируем необходимые условия оптимальности, которые в этих двух случаях составляют принцип минимума. Затем с помощью различных замен переменных будет показано, как принцип минимума для общего случая может быть получен на основе результатов для частных случаев. После этого производится эвристическое доказательство, основанное на строгом доказательстве из работы [179]. Наконец, прокомментируем по¬ лученные результаты и затем обсудим некоторые достаточные условия оптимальности. 5.12. ФОРМУЛИРОВКА ЗАДАЧИ УПРАВЛЕНИЯ Сформулируем задачу управления (см. определение 4.9) в том виде, в котором к ней можно приложить необходимые условия оптимальности. Читатель может найти этот параграф довольно формальным.Однако, необ¬ ходимо точно сформулировать предположения, при которых устанавли¬ вается принцип минимума. Предположим, что нам задана динамическая система порядка /г, которая на интервале (Тѵ Т2) описывается диффе¬ ренциальным уравнением x = f(x, и, /). (5.374) Будем считать, что Q — заданное подмножество из Rm и что область до¬ пустимых управлений U есть множество всех ограниченных кусочно-не¬ прерывных функций и (/) на (7\, Т2) таких, что tt(/)£Q для любого t из (7\, Т2); (5.375) а(/—)=«(/) для любого t из (Т1У Т2), (5.376)1 * * * Как обычно, переходную функцию системы будем обозначать через «(/„./г •*<))• (5-377) Пусть L (х, и, t) — действительная функция на Rn X Rfn X (Т19 Т2) и К (х, t) —действительная функция на Rn X (Т^ Т2). Наконец, пред¬ положим, что S — заданное подмножество из Rn X (Т19 Т2), так что эле¬ ментами S являются пары (х, /), состоящие из состояния системы х и точки t на интервале определения системы. 1 См. определение 3.24. Мы делаем это предположение, чтобы избежать необходимости добавлять фразу «за исключением, возможно, счетного подмножества» ко многим утвержде¬ ниям. Любая ограниченная кусочно-непрерывная функция на (7\, Т2), удовлетворяющая условию (5.375), эквивалентна, в смысле § 3.15, функции, удовлетворяющей этому пред¬ положению. 260
Сделаем теперь следующие предположения: I. Если (х, и, t), f2(x, и, f), . . ., fn (х, a, t) обозначают компоненты f (х, и, t), будем считать, что функции £(•*, a, t), ^(х, и, t), ^-(х, и, t), Z = 1, 2, п, (5.378) а также функции Цх, и, t), £(х, и, /), ^-(х, и, t) (5.379) непрерывны на Rn X Q X (Ть Т2), где Q обозначает замыкание Q в Rni (см. определение 3.9). Отметим, что мы не требуем непрерывности част¬ ных производных Д. и L по компонентам и. II. Если S — заданное подмножество из Rn X (Т19 Т2), то будем считать, что S относится к одному из видов: а) S == {лг!} X Т, где х1 — фиксированный элемент из Rn и Т — подмножество из (Т19 Т2); б) S = Rfl X Т, где Т — подмножество из (Т19 Т2); в) S = S, X Т, где S] — гладкое Æ-мерное многообразие, 1 < k < < п — 1, из Rn (см. определение 3.30) и Т — подмножество из (Т19 Т2); г) S = {(g* (Z), t) : t Ç (Т19 T2)}, где g (t) — непрерывно дифферен¬ цируемая функция из (Т19 Т2) в Rn, т. е. g (/) — кривая в Rn с непрерывно вращающейся касательной; д) S — гладкое k + 1-мерное многообразие, 1 < k < /г — 1 ъ Rn X X (7\, Т2), непрерывно дифференцируемое по t. Иначе говоря, имеется п — k функций gi (х, /), g2 (х, /), . . ., gn_k (х, /) на Rn X (Т19 Т2) таких, что: 1. S= {(х, t): gi(x, /) = 0 и g2(x, /) = 0 и ... и gn_k(x, /) = 0); 2. функции gL(x, t), ^-(х, t) и (х, t) непрерывны на Rn х (T lt с/*» Т2) для i = 1, 2, . . п — é; 3. векторы 4^- (х, Z), Z = 1, 2, . . п — k — линейно независимы в каждой точке из S. III. Если Æ (х, Z) — заданная действительная функция, определен¬ ная на Rn X (Т19 Т2), то будем считать, что: а) если б) если и функции S имеет вид Па, то Æ (х, t) = 0; S имеет вид ІІб, то К (х, t) не зависит от Z[t. е. /С (х, Z ее /С (х)] к (х), -^(х), ^-(х) непрерывны; в) если S имеет вид Пв, то /< (х, t) не зависит от t [т. е. R (х, t) — К (ж)] и функции К (х), (х), ЕЕА (х) непрерывны; г) если S имеет вид Иг, то К (х, t) не зависит отх [т. е., К. (х, t) — = К (/)] и функции К (t), (f), (t) непрерывны; д) если S имеет вид Ид, то функции К (х, t), (х, t), ^~(х, t). и ~dï^x' Z) непрерывны. При этих предположениях будем называть S множеством цели (мно¬ жеством конечных состояний) и К — функцией конечной стоимости. Мы подготовлены теперь дать определение, приводящее к формальной по¬ становке задачи управления. 261
Определение 5.8. Пусть /0 — элемент из (Тъ Т2) и х0 — элемент из Rn, тогда допустимое управление и переводит xQ в S [или, точнее, переводит (л:0, 60) в S], где S —множество цели, если множество {(#(/; »(/„,/]’ *о)> о : (5.380) встречает (или пересекает) множество S. Если и переводит хов S и tx — первый момент времени после /0, когда движение х (Z) = ф (/; u{t t ]f х0) вступает в S, а ~ х (^і) = Ф (^г U(tQ, g]’ Ло)’ (5.381) то вполне определенное число: ti 7(х0, Zo, ») = /<(х1, /J+ Jl[x(Z), a(Z), t]dt = (5.382) = K[$(tv; u{lo iiV x0), /J + j L [g6(/; «Uo, 6]> x0), u(f), t]dt (5.383) to называется величиной функционала (или, просто, стоимостью) управле¬ ния и, tx — конечным временем и хг — конечным состоянием. Если и не переводит х0 в S, то полагают J (х0, «)=оо. (5.384) Определение 5.9. Задачей оптимального управления (или просто зада¬ чей управления) для системы (5.374) при предположениях 1, 2 и 3 отно¬ сительно множества S, для функционала J (лг0, tOi и), области допусти¬ мых управлений U и первоначального состояния х0 в начальный момент времени t0 является отыскание управления и из 67, минимизирующего функционал преобразования J (х0, 60, и). Часто не указывают в явном виде зависимость J от х0 и t0 и записывают J (и) вместо J (лг0, 60, и). Поставив общую задачу управления, выделим два специальных слу¬ чая, которые будем называть «частным случаем 1» и «частным случаем 2». Укажем теперь дополнительные предположения, которые должны быть сделаны при определении каждого из случаев, и предоставим чита¬ телю самому их детально сформулировать. Частный случай 1. Список дополнительных предположений: а. Уравнение системы (5. 374) от t явно не зависит, т. е. уравнение системы имеет вид x = f(x, и). (5.385) б. Множество S определяется как S = {xj X (Л, Т2), (5.386) где хх — фиксированный элемент из Rn. Таким образом, частный слу¬ чай 1 представляет собой задачу с закрепленным концом и нефиксиро¬ ванным временем. в. Функция L явно от t не зависит (см. условия За), и функционал дается соотношением J(u) = Jl|x(/), u(t)]dt, (5.387) to где не зафиксировано. Частный случай 2. Список дополнительных предположений: а. Уравнение системы (5.374) явно от t не зависит: лг = /(л\ а). (5.388) 262
б. Множество имеет вид S = S1X(7\, Т2), (5.389) где S — или гладкое подпространство размерности k из Rnf или все Rn. Таким, образом, частный случай 2 также представляет собой задачу с нефиксированным временем. в. Функция L явно от t не зависит, а функция Æ тождественно равна нулю Іт. е. К (х, /) = 0]. Функционал дается соотношением ц ./(«)= Jl [*(/), а(/)] Л. (5.390) G Эти два случая отличаются друг от друга лишь видом множества S. В следующем параграфе для них будет сформулирован принцип минимума. Упражнение 5.17. Необходимо детально сформулировать частные случаи 1 и 2. 5.13. ПРИНЦИП МИНИМУМА ПОНТРЯГИНА Сформулируем принцип минимума Понтрягина. Будем считать, что все предположения § 5.12 остаются в силе. Прежде чем сформулировать теорему, введем некоторую дополнительную терминологию и обозначения. Определение 5.10. Пусть Н (х, р, и)— действительная функция n-мерного вектора х, /г-мерного вектора р и m-мерного вектора ил Н(х, р, u) = L(x, и) + (р, f(x, »)), (5.391) где f (х, и) — функция, определяющая систему [т. е. f (х, у) — правая часть уравнения состояния], и L (х, и) — подынтегральное выражение функционала; Н (х, р, и) называют гамильтонианом задачи и р — допол¬ нительным вектором. В силу предположения 1 из § 5.12 функции Н (х, р, и) и (х,р, и) непрерывны на Rn X Rn X Q, где Q есть замыкание Q в Rm. Далее, (х, р, и) является вполне определенной функцией и равна р, и) — f (х, и). (5.392) Предположим теперь, что х0 — начальное состояние и t0 — началь¬ ное время. Если и (/) —некоторое допустимое управление, ах (/) — траек¬ тория системы, исходящая из х0 = х (/0) и полученная за счет управле¬ ния и (/), то тогда для любой функции р (/) получим x(t) = ^{x(t\ p(t), «(/)] =/[*(/), «(/)]• (5.393) В дополнение к этому, если л — любой n-мерный вектор, то линей¬ ное дифференциальное уравнение вида р(/)= — p(t), »(/)] = ^[x{t),u(t)]-^\x(t), »(/)])'p(f) (5.394) имеет единственное решение р (/, л), удовлетворяющее начальному условию р(/0, л) = л. (5.395) Эти обстоятельства позволяют дать следующее определение: 263
Определение 5.11. Система дифференциальных уравнений порядка 2п х==^-(х’ р> = U); 1 Л/ / I (5.396) Р-- Р> = "О Р I называется канонической системой, связанной с основной задачей. Если и (/) — допустимое управление и х (/) — соответствующая траектория, то говорят, что любое решение р (/) системы (5.394) соответствует и (t) и X (t). Иначе говоря, р (/) соответствует и (/), если р (/) и х (/) — реше¬ ния канонической системы. Теорема 5.5. Принцип минимума для частного случая 1. Пусть (/)— допустимое управление, переводящее (х0, /0) в S = {xj X (Tlf Т2). Пусть х* (/) — траектория по (5.385), соответствующая и* (/), исходящая из (х0, /о) и встречающая S (в первый раз) при (хг, /х), т. е. х* (/J = = Хр Необходимым условием оптимальности и* (/) (для частного слу¬ чая 1) является существование функции р* (/), удовлетворяющей усло¬ виям: а) р* (/) соответствует и* (/) и х* (/), т. е. р* (/) и х* (/) являются решениями канонической системы: **(0 = 4^ [лг*(/), /?*(/), »*(/)]; дн (5.397) р*(а «*(оі и удовлетворяют граничным условиям х*(/0) = *о; •v*(/1)<S1; (5.398) б) функция Н [х* (/), р* (/), а], рассматриваемая как функция и на Q, имеет абсолютный минимум при и = и* (/) для t из [/0, /J, т. е. min Н [х* (/), р*(/), u] = H[x*(t)t p*(t), u*(t)] (5.399) и £ Q или, эквивалентно, #[х*(/), р*(/), й*(/)] <//[х*(/), р*(0, и] (5.400) для всех и из Q; в) функция H [х* (/), р* (/),. и* (01 равна нулю для t из [/0, /J: W[x*(Z), р*(/), «*(/)] = 0, /£[/0, М. (5.401) Теорема 5.6. Принцип минимума для частного случая 2. Пусть а* (/) — допустимое управление, переводящее (х0, /0) в S = Т2), и х* (t) — траектория, удовлетворяющая уравнению (5.388), соответствующая tt* (t), исходящая из (х0, /0) и встречающая S (в первый раз) при tr (т. е. л:* (Zi) = Xi. Необходимым условием оптимальности управления »*(/) (для частного случая 2) является существование функции р* (/), удовлет¬ воряющей условиям: а) р* (/) соответствует #*(/) и х*(/), т. е. р* (/) и х* (/) являются решениями канонической системы: х* = P* (z)> “* (5.402) P* = I** (z)> P* w> u* (z)] (5.403) 264
и удовлетворяют граничным условиям х*(/о)-лг0; лг* (Л) CS; (5.404) б) функция Н[х*(/), р* (/), и], рассматриваемая как функция и на Q, имеет абсолютный минимум при а* (/) для t из [/0, /J, т. е. min Н [х* (/), р* (/), и] - H [х* (/), р* (/), а* (/)] (5.405) и ей или, эквивалентно, Н [х* (/), р* (/), и* (/)] < Н [аг* (/), р* (/), и] (5.406) для всех и из Q; в) функция // [лг* (Z), р* (/), »*(/)] равна нулю для t из [/0, /J: Н [х* (/), р* (/), я* (/)] = 0; t Ç [Zo, /J; (5.407) г) если — гладкое подпространство из Rn размерности k, то век¬ тор p*(G) трансверсалей к Sj в точке х* (4): (р*(/і), х —х*(/х)) ~0 для всех х из М [л:* (/х)]; (5.408) где A4 [X* (/JJ — плоскость, касательная к Si в точке х* (/J, т. е. М [х* (ZJ] = |Х : [х* (Zj)], X — X* (Л)/ = 0 ДЛЯ 4=1,2, ..., п— где gг (х) == 0, g2 (х) = 0, . . . gn_k (х) — 0 — уравнения Sj (см. § 3.13). Итак, вектор р* (/J нормален к множеству цели Si в точке х* (/J. Если Si = Rn> вектор р* (/г) будет нулевым вектором, р* (/J = 0. Нетрудно заметить, что вторая теорема отличается от первой допол¬ нительным предположением г), где отмечается трансверсальность допол¬ нительной переменной к множеству цели. Пункт б) каждой из теорем можно сформулировать следующим образом. В любой конкретный момент времени, допустим /, из интервала I/o, /J, л:* (/), и* (/) и р* (?) являются вполне определенными векторами. Пункт б) теоремы утверждает, что число Н [х* (/), р* (/), а* (/)] меньше или равно числу Н [х* (/), р* (/), о], где о — любой вектор из Q. Мы сформулировали теоремы в том виде, в котором они будут исполь¬ зоваться в последующих главах. Для того чтобы иметь возможность рас¬ сматривать исключения, введем в формулировку теорем дополнительную постоянную р*. Будем рассматривать функцию §(х, р, и) вместо функ¬ ции Н (х, р, и), убедившись в том, что существует неотрицательная по¬ стоянная р*, р*^0и вектор р* (/) такие, что р* (о — 4г К р* и* Ро ] = = ~р0* 4гІх* »*(01) P* (О- Все остальные утверждения теорем 5.5 и 5.6 удовлетворяются при замене И на Исключения имеют место при р* = 0. Если р* =^= 0, то можно выбрать р* == 1 Ч 1 Мы можем это сделать, так как уравнение относительно р (t) линейно. 265
Задачи, которые мы будем рассматривать ниже, не являются исклю¬ чениями. Поэтому в дальнейшем не упоминается р* (за исключением § 5.15 и 5.16, где приводится эвристическое доказательство принципа минимума, и § 6.21 и 6.22, в которых и рассматриваются вырожденные задачи). 5.14. ЗАМЕНА ПЕРЕМЕННЫХ С помощью различных замен переменных покажем, как можно вывести принцип минимума для общей задачи управления из теорем 5.5 и 5.6. Предположения и обозначения § 5.12 снова остаются в силе. Начнем с того, что снимем требование, касающееся независимости системы и функционала от времени; затем рассмотрим случай, когда ко¬ нечное время фиксировано и в заключение рассмотрим задачу, в которой имеется конечная «стоимость». В каждом случае мы укажем дополни¬ тельные предположения и затем выполним замену переменных, которая сведет нашу задачу к одному из частных случаев. а. Система и функционал зависят от времени. Предположим, что уравнение системы имеет вид x(t) = f[x(t), #(/), /]. (5.409) Предположим, для начала, что множество цели S имеет вид S={x1}x(T19 Л), (5.410) где Хі — фиксированный элемент из Rn; и что L имеет вид L(x, и, t). (5.411) Функционал определяется соотношением ti J L[x(t)t u(t\ t]dt, (5.412) t0 где /і — нефиксированно. Как обычно, х0 и tQ обозначают начальные состояние и время. Мы хотим свести задачу управления для системы [см. уравнение (5.409)] и функционала (5.412), зависящих от времени, к одному из част¬ ных случаев — в данном примере, как это станет ясно из дальнейшего, к частному случаю 2. Мы сделаем это, введя дополнительные фазовую координату и уравнение состояния и применив затем принцип минимума к этой новой задаче. Пусть хп+1 обозначает вспомогательную переменную. Рассмотрим систему порядка п + 1 вида X (t) =- f [Л (/), « (Z), х„+1]; I ? (э.41о) хп+1 (/)=1 J и задачу управления для этой системы. Даны начальное время /0 и начальное условие х0 to [т. е., хп+1 (/0) = = /01 в пространстве Rn+1. Пусть S = Sj X (Tlf Т2) —множество S в І^п+і X ?\), где Si —прямая (одномерная), определенная уравне¬ ниями Хі — xlt J = 0, х2 — xlt 2 = 0, . . ., хп — хы = 0, где — ком¬ поненты вектора х± из уравнения (5.410). Найдем допустимое управле- х0 to ние и, переводящее этом функционал 7і(а): ^о) в S1X(Tі, T2) G Л(«) = J L[x(t), u(t), xn+1 и минимизирующее при (/)Ж (5.414) 266
Мы видим, что эта задача эквивалентна исходной задаче [для системы (5.409)] в том смысле, что если управление оптимально для одной из них, то оно будет оптимальным и для другой. Новая задача имеет точно такой же вид, как и частный случай 2. Таким образом, можно применить теорему 5.6 для доказательства того, что если и* (/) оптимально, то существуют функ¬ ции р* (/) и р*+1 (/), для которых удовлетворяются следующие условия: [** (/), p*(t), «*(/), Х*+1(О, р*+1(/)]; P*(t)=-^- [х*(0, «*(0. <+1(0, Р„*+1(0]; <+1(0=^г[х*(0, р*(0, »* (0, <+1(0, р:+і(/)]; Р*+1(0 = —^-[**(0. и*X*+1(Z)> Р*+1(0], где Нх (х, р, », хп+1, рп+1) дается соотношением Нх (х, р, и, хп+1, рп+1) = = L(x, «, хп+1) + (р, f (х, и, х„+1)) -і-р„+1-1 X* (to) = Хо x*+i (to) = fa X (t\) = Х\ Xn+l(t\) = ti’, (5.415) (5.416) (5.417) (5.418) 2) гамильтониан [х* (t), р* (t), и, х*+1 (t), р*+1 (/)], рассматри¬ ваемый как функция от и на Й, имеет абсолютный минимум при и — и* (t) для t из [Zo, /,]; 3) Нх [х* (t), р* (t), и* (t), х*+1 (t), p*+ï (/)] = 0 для t из [Zo, Zj; 4) п + 1 — мерный вектор Р*(Л) Рп+ЛЧ) трансверсалей к Sj при х} t, , так что р:+і(о = о. (5.419) Полученные результаты можно использовать для решения исходной задачи. При этом достаточно заметить, что вспомогательная переменная хп+1 представляет собой просто время t. Для исходной задачи опреде¬ лим функцию Н(х, р, и, t) n-мерных векторов х ир, /n-мерного вектора и и времени /, положив //(х, р, », /) = Л(х, », /) + (р, /(х, », /)). (5.420) Здесь Н называют гамильтонианом задачи, а функцию р —дополнитель¬ ной переменной. Теорема 5.7. Принцип минимума для задачи с закрепленным концом, зависящей от времени. Пусть »* (/) — допустимое управление, переводя¬ щее (х0, /0) в S = {xj X (Т19 Т2), и X* (0 —траектория, удовлетво¬ ряющая уравнению (5.409), соответствующая я* (/), исходящая из (х0, t0) и встречающая S в первый раз в точке і± [т. е. х* (/J = xj. Для того
чтобы u* (/) было оптимально [для функционала (5.412)], необходимо существование функции р* (/), удовлетворяющей условиям: а) р* (Z) соответствует и* (/) и х* (/), т. е. р* (/) и х* (/) являются решениями канонической системы х* (0 = [** (О, «* (О, Л; (5.421) Р* (0 = - -g- [х* (/), р* (/), «* (О, Л (5.422) и удовлетворяют граничным условиям X* (/о) - х0, X* (4) - Xf, (5.423) б) H [X* (О, Р* (О, рассматриваемая как функция и на Q, имеет абсолютный минимум при и = и* (/) для t из [/0, ZJ: min Я [х* (О, Р*(0, /] = 7/[х*(/), р*(0, и* (/), /] (5.424) uQ й или, эквивалентно, H [X* (0, р*(0, t] p*(t\ и. t] (5.425) для всех и из Q; в) функция H [X* (/), р* (/), и* (/), t\ удовлетворяет соотношениям Я[х*(/), р* (/), а* (/), t] = = - J [X* (T), р* (T), я* (T), T] dv, (5.426) ta H [x* (/J, p* (/J, a* (Q, /J - 0, (5.427) где tr — незаданное конечное время. Прежде всего существенное отличие теоремы 5.7 от 5.5 заключено в поведении гамильтониана вдоль оптимальной траектории. В задаче, не зависящей от времени (теорема 5.5), гамильтониан равен нулю вдоль оптимальной траектории, в то время как для задачи, зависящей от вре¬ мени, он со временем изменяется вдоль оптимальной траектории по урав¬ нению (5.426). Отметим далее, что при хп+1 (t) = t основным соотноше¬ нием, позволяющим вывести теорему 5.7 из условий 1—4, соответствую¬ щих оптимуму новой (дополненной) задачи, является //Jx, р, и, t, рп+1] = Н(х, p, t) + pn+1. (5.428) Это соотношение предполагает, что для данных значений X, р и t величина и из Q, минимизирующая Я, минимизирует также и Нг (независимо от ве¬ личины рп+1) и наоборот. Приведенное выше соотношение вместе с условием Р„*+1(0 = [■** (0. Р* (0, «* (0. Л, Р„*+1 (Q = о (5.428а)* 1 позволяет вывести условие в) теоремы 5.7. Для того чтобы проиллюстрировать эти положения, рассмотрим сле¬ дующий простой пример. 1 Так как дН1 - дН (Х' Р' Хгм) 1 d І\ d 4Х ■“ — -к • àxn+l дхп+1 268
Пример 5.9. Предположим, что уравнение системы имеет вид х ~ х 4* ut, где t$ — 0 — начальное время и х (0) = а является исходным состоянием. Пусть х1 — b — желаемое конечное состояние (т. е. S = {b} X (Тг, Т2) ] и пусть функционал преобразо¬ вания J (и) определяется соотношением ft J (и) ~ J (X2 + /2) dt, Іо т. е. L (х, и, t) — X2 4- t2. Выведем дополнительную переменную хп+1 и рассмотрим новую систему X — X 4- wxrt+1; хп+1 = 1. Для этой новой системы исходным состоянием будет Г X (0) — а I [хп+1(0) = О] и множество S превращается в прямую х — b = 0 на плоскости ххп+1 [см. рис. 5.15, где новое S — Sj X (7\, 74), a Sj — прямая х— b — 0]. Функционал стоимо¬ сти Jj (и) принимает вид І\ J\ J (х-> + хл+1) dt' и мы получим 0 Н^х, р, и, xn+v рп+і) =х2 + х^+і + Рис. 5.15. Область цели S в пространстве ххп+1 + Р (к + их„+1) + р„+1; Н(Х, P, U, t) = X2 + t2 4~ р (Х -Ь ut). Перечислим, сопоставляя друг с другом, необходимые условия новой задачи (осно¬ ванной на теореме 5.6) и исходной задачи (основанной на теореме 5.7) (см. табл. 5.1). Под¬ становка xn_|_j (f) — t в условия новой задачи приводит к условиям исходной задачи. Предположим теперь, что множество S имеет вид {(g(/),/):/e(T1, Т2)}, (5.429) где g (t) — непрерывно дифференцируемая функция /(т. е. S имеет вид 2г § 5.12). Таким образом, мы пытаемся попасть в движущуюся, а не в фик¬ сированную точку, минимизируя при этом функционал (5. 412). Введя вспомогательную переменную хп+1, получим другую задачу типа част¬ ного случая 2. Из теоремы 5.6 способом, аналогичным использовавшемуся при выводе теоремы 5. 7, может быть получена следующая теорема. Теорема 5.8. Принцип минимума для задачи с подвижным концом, зависящей от времени. Пусть а* (t) — допустимое управление, переводя¬ щее (лг0, to) в S = {(g (/), t) : t G (Tlf T2)}. Пусть x* (t) — траектория, удовлетворяющая уравнению (5.409), соответствующая и* (/), начинаю¬ щаяся в (лг0, t0) и встречающая S при Необходимым условием опти¬ мальности а* (0 [для функционала стоимости (5.412)], является суще¬ ствование функции р* (/), удовлетворяющей условиям: а) то же, что и пункт а [см. уравнения(5.421) и (5.422) ] теоремы 5.7, за исключением граничных условий х*(/о) = дго, Х^(^) = g (t^ (5.430) б) то же, что и пункт б [уравнения (5.421) и (5.425)] теоремы 5.7; в) функция Н [х* (0, р* (0, я* (0, удовлетворяет соотношениям H [X* (/), р* (/), «*(/), Л - \Р* Ui), I / — tl - f \х* (т), р* (т), «* (т), т] dr- (5.431) t H |х* (/J, р* (/,), и* Щ), /J = <p* (/,). |G>. (5.432) где tr — не заданный наперед конечный момент времени. 269
Таблица 5.1 Новая задача Исходная задача 1) X* (t) = [х* (/), р* (0, и* (/), х*+1 (0, Р*+1 (/)] = X* (0 + и* (t) х*+1 (0 Р* (0 = - -ÿ- [х* (0. р* (0. «* (/). х*+1 (0. Р*+1 (/)] = —2х* (<) - р* (<) х^+1(0 = 1 aS, И». «*(0. х*+1(0. Р*+1 (П,] = = -2х*+1 (О-Р* «)«* (0 1) x* (0 =~ [x* (/), p* (0, «* (t), H = = x* (t) + u* (t) t; P* 1** (0, P* (t), U* (t), /] - = —2x* (t) — p* (0 2) min Нх [х* (Z), р* (0. и, х*+1 (0, Р*+і(0] [х* (t), р* (t). и* (t), x*+i (t), pn*+1 (/)] = P2 (0 + x*2j (t) + + p* (/) [x* (0 + «* (0x*+1 (<)]} + + p*+i (0 2) mintf[x* (t). p* (t), и, Л = = Я[х*(<). P*(0. «*(0. /] = = x*2 (0 + /2 + p* (/) [x* (t) + u* (t) Z| 3) Hi [x* (t). p* (t), u* (t), x*+1(/), P*+i (0] = 0; x*2 (t) + x*^j (t) + P* (0 [x* (t) + + «*(Пх„*+1(0] =-P„*+1(0 3) tf|x*(0, P* (t), u* (t), /] = tt = — J ІХ* (T), p* (T), u* (t), t] dT t ti = — J [2t 4- p* (t) u* (t)] du; t 4> p*+i Oi) =° — 270
Существенным отличием этой теоремы от теоремы 5.7 является различное поведение гамильтониана вдоль оптимальной траектории. Величина есть в точности «касательный» вектор к кривой g (/) при и поэтому конечная величина гамильтониана (вдоль оптимальной траектории) есть скалярное произведение конечного значения дополни¬ тельной переменной и этого касательного вектора. Мы можем, наконец, предположить, что множеством S является или гладкое подмножество из Rn X (Тъ Т2) размерности (k + 1), 1 < k < < п — 1, непрерывно дифференцируемое по t (вида г, д § 5.12), или все пространство Rn X (Т19 Т2). В этом случае может быть доказана следую¬ щая теорема. Теорема 5.9. Принцип минимума для задачи, зависящей от времени, с движущимся множеством цели S. Пусть и* (/) — допустимое управле¬ ние, переводящее (х0, t0) в гладкое подмножество S размерности é+1 из Rn X (Тъ Т2) или в множество S = Rn X (Т19 Т2). Пусть х* (t) — оптимальная траектория (5.409), соответствующая а* (/), начинающаяся в (-*о, ^о) и встречающая S при Необходимым условием оптимальности (/) по отношению к функционалу (5.412) является существование функ¬ ции р* (/), удовлетворяющей условиям: а) то же, что и пункт а [см. условия (5.421) и (5.422)] теоремы 5.7 за исключением граничных условий (5.423), для данного случая имею¬ щих вид х* (/о) = *о> (х* G S; (5.433) б) то же, что и пункт б [уравнения (5.424) и (5.425)1 теоремы 5.7. в) 1. Если S — гладкое подмножество размерности k+ 1 из Rn X (Тъ Т2), то функция Н [х* (/), р* (/), я* (/), t] удовлетворяет соотношениям п—k Р*(0. «*(0, 0 = М- і,=Л G — J [** СО, Р*(Т), »*(т), Т]Л; (5.434) t n—k p*(ti), /х]= 2 а^[-Ѵ*(Л). Л], (5.435) г=1 где /і — конечное время, аі9 і = 1, 2, . . ., п — k — постоянные, и урав¬ нениями S являются gi(x, 0=0, g2(x, 0 = 0, . . . ,gn.k(x, 0 = 0. (5.436) 2. Если S = Rn X (Tlf T2), то функция H[x* (t), p* (/), «* (Z), И удовлетворяет соотношениям G //lx*(0, P*(0> «*(0> 0 = — P* (O, «*(O. ОЛ (5.437) t и H\x*(tr\ р*^\ »*(/х), /J = 0. (5.438) г) 1. Если S — гладкое подмножество размерности k + 1 из Rn X X (Tl9 T2), то вектор p* (/J трансверсалей к гладкому подмножеству из Rn, определенному уравнениями 0) = 0, g2(x, 0) = 0, ..., gn_k(x, 0) = 0 (5.439) 271
в точке х* (/і), т. е. X — х*(/1)) = 0 для всех х из М [лг*(/1)], (5.440) где М [лг* (/х)] — касательная плоскость к Stl в точке х* (ZJ; М|**('і)] =-- /х], х-х*(ф = 0, і=1,2, ..., n-k\ (см. § 3. 13). Таким образом, р* (^х) нормален к в точке х* (/J и, следова¬ тельно, является линейной комбинацией векторов lx* (/х), /Д, і = 1, 2, . . ., п — k. 2. Если S = Rn X (7\, Т2), то р* (/х) — нулевой вектор: р*(/і>0. Конкретный пример, иллюстрирующий эту теорему, рассматривается в § 6.3. При формулировке различных теорем неизбежны повторения, но мы идем на это с тем, чтобы в дальнейшем можно было точно указать формулировку принципа минимума в том виде, который нам нужен. б) Конечное время фиксировано. До сих пор мы рассматривали лишь такие задачи, где конечное время не было задано. Исключим это ограничение. Вновь будем считать, что уравнение системы имеет вид x(t) = f\x(t), u(t), /] (5.441) и xQ и /0 — начальные состояние и время. Предположим далее, что мно¬ жество S относится к одному из видов S = {xj X {/J = (хх, /х); S — *SX X {j •S = Rn X (/х}, (5.442) (5.443) (5.444) где —фиксированный элемент из (T lf Т2), > t0; хт — заданный элемент из Rn и Sx — гладкое подмножество размерности k, 1 < k < < п —1, из Rn. Иначе говоря, мы хотим перевести х0 в заданное под¬ множество из Rn за заданное время. Предположим также, что функцио¬ нал J (и) выражается соотношением ti J(и)= J L[x(t\ u(t\ t]dt, (5.445) t0 где — фиксировано. Сведем задачу управления системой (5.441) с функционалом (5.445) и множеством S, определенным одним из соотношений (5.442)—(5.444), к одному из частных случаев, а именно, к случаю 1. Для этого обозначим через хп+1 вспомогательную переменную и рассмотрим следующую систему порядка п + 1: x(t) = f[x(t\ u(t), хя+і(01; xn+i(t)= 1. Нетрудно убедиться, что задача перевода точки (5.446) х0 [т. е. х„+1 (/0) =' *0 J [или хп+1 (/х) = вдоль траектории, удовлетво- = /о], в точку ряющей уравнениям (5.446) таким образом, чтобы минимизировать функ- ционал т J1(u)= j L[x(t), u(t), xn+l(t)\dt, t9 (5.447) Л _ 272
где Т не фиксировано, эквивалентна нашей исходной задаче (для системы 5.441) в том смысле, что управление оптимально для одной из них в том и только в том случае, если оно оптимально для другой. Так как новая задача имеет вид, аналогичный частному случаю 1, можно использовать теорему 5.5 и вывести, как и прежде, вариант принципа минимума, при¬ менимый к нашей исходной задаче. В этом случае справедлива теорема. Теорема 5.10. Принцип минимума для задачи с фиксированным време¬ нем. Пусть а* (0 — допустимое управление, переводящее (х0, /0) а) во множество цели S = (х^ X {^}, или б) во множество цели S = S± X {^}, или в) во множество цели S = Rn X { Пусть х* (t) — траектория, начинающаяся из (х0, удовлетворяет уравнению (5.441), соответствует »*(/), и встречается с S при Необ¬ ходимым условием оптимальности и* (t) [по отношению к функционалу (5.445)] является существование функции р* (/), удовлетворяющей усло¬ виям: 1) то же, что и пункт а) [уравнения (5.421) и (5.422)] теоремы 5.7, за исключением граничных условий (5.423), которые для каждого из слу¬ чаев будут: а) х*(/0) = х0, х*(/1) = х1; (5.448) б) х* (/0) - х0> х* (/J б Si; (5.449) в) х* (/0) = АГ0, X* (/J — любое; (5.450) 2) то же, что и пункт б) [уравнения (5.424) и (5.425)] теоремы 5.7. 4) вектор р* (/J; б) трансверсалей kSjB точке х* (/J (см. пункт г теоремы 5.6); в) есть нулевой вектор; р* (/х) = 0, если множество цели S имеет вид 16 или 1в. Заметим, что условие 3 отсутствует. В предыдущих теоремах усло¬ вие 3 связывалось с поведением гамильтониана вдоль оптимальной траек¬ тории. Однако в данном случае соотношение /У[х*(/), р*(/), »*(/), Z] = //Іх*(/Х), р*(^і), «*(^)> М- t Р*(ТХ #*(т)> x]dx, (5.451) G соответствующее условию 3, удовлетворяется автоматически и не дает дополнительной информации. в) Присутствует конечная «стоимость». До сих пор мы полагали, что функционал не содержал члена, выражающего конечную стоимость (т. е. функция К была равна нулю). Снимем теперь это ограничение. Вновь будем считать, что уравнение системы имеет вид *(/) = a(t), t] (5.452) и х0 и t0— начальные состояние и время. Пусть множество S имеет вид S — Rnx(Tlt Т2\ (5.453) т. е. мы рассматриваем задачу с незакрепленным концом и нефиксиро¬ ванным временем. Будем считать, что Æ (х, t) —действительная функция на Rn X (Тъ Т2), причем 0, 0» z)’ dxdt (х’ ~dtr^x^ (5.454) 1 Мы будем рассматривать все три множества S одновременно, указывая результат для каждого из них, если эти результаты различны. 273
непрерывны. Предположим, что функционал J (и) выражается фор¬ мулой G J(a)= К[х(/1), М + J L \x(t), u(t), t]dt. (5.455) Сведем задачу управления системой (5.452) с функционалом (5.455) и множеством S (5.453) к задаче, в которой конечной стоимости нет. После этого мы сможем применить теорему 5.9 и получить соответствующую форму принципа минимума. Прежде всего отметим, что так как х (/0) = = Хо, ТО , /1] = К(ХО) /о)+ t]dt- (5-456) to Известно, однако, что ~ (Л |Х(О, /1} = 1Х(/), t}, х(/)> + |х(/), /] = (5.457) = \ЗГ|х(/)’ t}' «(0. + t\. (5.458) Следовательно, функционал J (и) можно выразить также соотноше¬ нием G f J(и) = К(х0, /о) 4- J U [*(/), #(/), t] + + [X (.'), n, f [x (t), U (0- IX (t), t]} dt. (5.459) Так как лг0 и /0 заданы, а Æ (лг0, ^0) — известная константа, то за¬ дача перевода (л:0, /0) в •$ вдоль траектории, удовлетворяющей (5.452), решается таким образом, чтобы минимизировать функционал J± (и) h Л(»)=Пцх(0, »(/), t] + \-^lx(f), t],f[x(t), u(t), /])-F to + ^-lx (/),/]) dt. (5.460) Она эквивалентна нашей исходной задаче в том смысле, что управ¬ ление оптимально для одной из них только в том случае, если оно опти¬ мально для другой. Так как теорема 5.9 применима к этой новой задаче, можно заклю¬ чить, что если а* (/) оптимально, то существует функция р* (/) такая, что 1) P*(0 = -^-[x*(Z), p*(t\ d= (б-461) U*W' Z>- u 0/ - '>]L-'М» <5л62> 2) />Г(/і) = 0; (5.463) 3) min[x* (/), pi(t), и, /] pi(t), u*(t), /], (5.464) u çl Й 274
где (х, р1У и, t) дается соотношением /Л (■*, Рі< и, t) = = [Г(л, и, /) + f (х, и, 1)У +- ^(х, Z)] + (Pi- f(x, и, 0) = = L(x, и, t)+\Pï + -^-. /(*, «> Z)/ + ^F(X’ Z)‘ <5-465) Рассмотрим функцию Н (х, р, и, t) = = Цх, и, t) + {p, /(х, и, t)}. (5.466) Если принять, что р*(/) = р*(Л 4[х*(Л, Л, (5.467) то в силу выражений (5.462) и (5.458) имеем Р* (Л = --^|х* (О- «*(Л, Л-^І**(/), Л/[**(Л, и* (О, Л + + (^i**(0, и*^ (])' ^-^*(л, п + та-[х*(/)’ /]}“ »*(0. л)'{р*(0--^[х*(Л. л} + + -^- 1**(Л, Л/[**(Л, «*(/), Л 4-^-ІхЧ/), Л = (5.468) = -^[х*(Л, «ЧЛ, Л-(^[х*(Л, «*(/), л)'р*(Л = (5.469) ==—^[^*(Л. Р*(Л, «*(Л, Л- (5.470) Так как [х* (О, Л явно от и не зависит, из выражения (5.464) следует, что min H [X* (t), р* (t), и, /] = H [X* (/), р*(Л, «*(Л> Л- (5.471) и £ Q Наконец, из выражений (5.463) и (5.467) получим Р*(Л) = ^-1^*(Л), ЛЬ (5.472) Для других видов множества цели доказательство проводится ана¬ логично. В результате сформулируем следующую теорему. Теорема 5.11. Принцип минимума для задачи с конечной «стоимостью» . Пусть а* (/) —допустимое управление, переводящее (х0, ^о): а) в множество S = Rn X (Тъ Т2); б) в множество S, являющееся гладким подпространством размер¬ ности k+ 1 из Rn X (Tlf Т2) х. Пусть X* (t)—траектория, удовлетво¬ ряющая уравнению (5.452), соответствующая и* (0, исходящая из(х0, tQ) и встречающая S при t±. Необходимым условием оптимальности 1 Разбор других случаев мы предоставляем читателю. 275
и* (t) [по отношению к функционалу (5.445)] является существова¬ ние функции р* (/), удовлетворяющей условиям: 1. То же, что и пункт а [уравнения (5.421) и (5.422)] теоремы 5.7, за исключением граничных условий (5.423), которые в данном случае имеют вид: а) X* (/о) = х0, X* (/J не задано; (5.473) б) х*(/0) = л0, х*(/і)€5. (5.474) 2. То же, что и пункт б [уравнения (5.424) и (5.425)] теоремы 5.7. За. Если S = Rn X (Tlf Т2), то функция Я[лг* (/), р* (0, (О, Н удовлетворяет соотношениям Н(х*(О, Р*(0» = Л1- — р*(т), я*(т), т] + [X* (т), т]|гіт; (5.475) tQ н [х* (Л), р* (^), и* (/,), /11 = — ^-\x*(ti), /J. (5.476) 36. Если S — гладкое подмножество размерности k + 1 из Rn X X (T19 T2), то гамильтониан удовлетворяет условиям H{x*(t), р* (/),«*(/)» Л = /J — t=l - j [x*(т)’ <т)’ “*(т)’ т] + [х*(т)’ т1)dT; (5-477> z k Щх*(Л), P*UJ, (5.478) где tx — конечное время; a(-, i = 1, 2, . . ., n — k — постоянные, a урав¬ нения множества S имеют вид gi (X, t) = 0, g2 (X, 0 = 0» ■ ■ ■’ Sn-k (x, t) = 0. (5.479) 4a. Если S — Rn X (Tlt T2), то p*(0) = 4f[x*<^’ <5-480) 46. Если S — гладкое подмножество размерности k + 1 из Rn x X (7\, 7\), T0 вектор p* (/J — ‘!^"[Л:* (^i)> ^1] трансверсалей к гладкому подмножеству Sti из Rn, определяемому уравнениями gi (a:, ti) =- 0, g2 (x, /J - 0, . . ., gn_k (x, /і) - 0 (5.481) в точке x* (/і) (сравните с теоремой 5.9). Мы видим, что наличие конечной стоимости сказывается прежде всего на поведении гамильтониана вдоль оптимальной траектории и на вели¬ чине дополнительной переменной в конечный момент времени. 276
Пример 5.10. Предположим, что К (х, /) = {с, х), где с —.заданный ненулевой вектор из Rn. Тогда для задачи со свободным концом [т. е. для S = Rn X (7\, Т2) ] усло¬ вия 3 и 4 теоремы 5.11 примут вид П 3. н\х* (/), р* (t), tr (t). Ч = — j (т)’ р*(т)’ и*(т)' т) dT; (5-482) t Я[х*(Ч).р*(Ч). «*(4). М =0; 4. p*(h)=C. (5,483) (5.484) I Пример 5.11. Предположим, что К (х, t) = гДе сі — постоянные и хъ 2 і=1 х2, . . ., хп — компоненты х. Тогда для задачи со свободным концом [т. е. S = Rn X X (Tp T2)J условия 3 и 4 теоремы 5.11 принимают вид G ) 3. H\x*(t), р (t), и* (t), ч = - f -^p[x* ^т)’ p*(т)’ TldT; Я[х«(Ч), р*(Ч). «*(4). М=0; 4. р*(Ч) = Сх*(/1), (5.485) (5.486) где С — диагональная матрица с элементами clf с2, . . ., сп, расположенными на глав¬ ной диагонали. Отметим, что мы включили конечную стоимость в минимизируемый интеграл. Вводя вспомогательную переменную хо(О = L [лг(О. и(0. Л хо(М -= 0, (5.487) можно свести задачи, содержащие интеграл, который надо минимизиро¬ вать, к задачам, имеющим только конечную стоимость. Этот прием и использовался Л. С. Понтрягиным. Его мы также будем применять в последующих двух параграфах. г) Таблица результатов (табл. 5.2). Все полученные нами результаты и некоторые дополнительные случаи собраны в табл. 5.2. Предполагается, что tQ и х0 = X —начальные время и состояние; явные ссылки на эти величины в таблице опущены. Звездочка * везде используется для обо¬ значения оптимальных величин. При составлении таблицы применены следующие понятия и обозначения: 1) ссылка на t часто опускается, например вместо х* (/) записы¬ вается х*, вместо р* (/) — р*; 2) функционал J (я) для конкретных задач выражается через кон¬ кретные Æ и L; 3) знаком I обозначены величины, которые должны вычисляться дн I вдоль оптимальной траектории; например, есть градиент гамиль¬ тониана Н по X, вычисленный при Іх* (/), р* (/), а* (/), Л; 4) знаком |*^ обозначены величины, которые должны вычисляться в конечный момент времени для оптимальных значений переменных. Например, —градиент К по х при [х* (Л), /J; 5) И* — гамильтониан, вычисленный вдоль оптимальной траектории. Обозначение Я* (/) используется с целью подчеркнуть то обстоятельство, что интерес представляет поведение гамильтониана вдоль оптимальной траектории в зависимости от времени. При дальнейших ссылках на таблицу мы будем часто использовать столбцы и строки для того, чтобы отыскать нужный элемент таблицы. 277
№ по пор. Постановка задачи Система Функционал Время Область конеч¬ ных состояний* £ x 4 KJ s s 5 X KJ O U f- 1 2 1 2 (п ‘х)! = х L = L (X, и), К =0 tx не задано X! gi (X) = 0, 1 = 1,2..., n — k H = H (X, p, u) = L (X, u) + (p, f(x, u)} др 1* дх I» //* - = //(X*, p*, «*) = — min H (X*, p*, tt) иЕЙ ИЛИ H (x*, p*, </7(x\ p*, «) для всех и из Q 3 L = L (X, и), К - К (х) Rn 4 L = L (X, и), К = 0 іх фиксировано Xi 5 L = L (X, а), К = К (X) S,: gi (x) = 0, i = l,2 n — k 6 0 ‘п 'х) ! = х L = L (X, и, /), К-0 tx не задано X1 ((? ‘я *x) f ‘d> + (; ‘И ‘x) 7 = (; ‘я ‘d ‘x) н = и -* = ^l др I* r дх 1* /7* = — H (x*, p*, tt*, t) — = min H (x*, p*, u, i) u e q или /7(х*, p\ «*, 0^ ^//(x*, p*. «, /) для всех и из Q 7 g(t) 8 L = L (X, и, /), К = К (х, t) St: gi (X, t) = 0, t= 1, 2 n — k I A J В J С I D J £ J F | G * Xj — фиксированная конечная точка; Rn — свободная конечная точка; S, — подпространство размерности k + 1. 278
Таблица 5.2 Необходимые условия Номер теоремы 3 4 Я*(0 = //* (/х) = 0 P* (^i> — условий нет 5.5 p* (/x) нормален в точке X* (Zj n—k к .) X* (G) ’ 5.6 " 4 dK 1 P (G) = — дх |ж»(G) 5.6 5.11 Я* (0 — H* (/х) — const P* (^i) — условий нет 5.10 n~~k л r (« = 2 « > +■^1 dx |x* (tt + X* (G) ) 5.10 5.11 t Н* (/х) = 0 P* (G) — условий нет / 5.7 Я*(0 = /р*(/і), 4г| X. I / -Иі.-; t H* (fi) = /р* Л), 5.8 л-- H* (f\- „ dSi H w-2«^ .(i--дГ n—k Л P* (G) = 2 + 4=1 + Æ| дх |ч, 5.11 5.9 1 H / J из Rn размерности k; g (t) — движущаяся конечная точка; S — подпространство из RnX(Tit Т2), 279
о. о Е О Е Постановка задачи Система Функционал Время Область конеч¬ ных состояний * i ® 4 CS 5 s S E U ь 1 2 9 X = f (X, U, t) L = L (X, и, 0, К = К (X, t) не задано Rn H = H (X, p. u, t) = L (X, и, t) + + p, f(x, u, t) X- ® 1 op 1- r dx p //* = = //(x*, p*, H*, = ■= min H {X*, p* u, t) u G Й ИЛИ tf(x*> p*, C H (x*, p*. u, t) для всех и из Q 10 L = L (х, и, t), к = о фиксировано X, 11 : gi (X) = 0, i = 1, 2, . . п — k 12 L = L (X, и, t), К = К (X) Rn А В С D E F G * Xi — фиксированная конечная точка; Rn—свободная конечная точка; — подпространство размерности fc-f-l- 5.15. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МИНИМУМА. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Дадим эвристическое доказательство принципа минимума, основан¬ ное на строгом доказательстве, приведенном в работе [179 Р. Основными нашими целями будет дать соответствующее введение и обосновать стро¬ гое доказательство, а также убедить читателя в справедливости принципа минимума. Короче говоря, мы хотим показать справедливость принципа минимума, не доказывая его формально. В этом параграфе будут тщательно сформулированы две теоремы, относящиеся к частным случаям 1 и 2 (см. § 5.12 и 5.13), которые тре¬ буется «доказать». Понимание теоремы и ее доказательства состоит глав¬ ным образом не в том, чтобы следовать за каждым утверждением теоремы и отдельными этапами обоснования доказательства, а в понимании резуль¬ татов и основных идей доказательства в целом. Этот процесс в высшей степени индивидуален и часто, в случае сложных доказательств, отнимает много времени. Поэтому советуем, чтобы, во-первых, заинтересованный читатель обращался непосредственно к книге Л. С. Понтрягина [179] и, во-вторых, пусть его не обескураживает, если некоторые из наших замечаний вначале покажутся «не имеющими никакого смысла». В конце концов, мы пытаемся изложить лишь наше понимание доказательства принципа минимума, и если оно покажется читателю трудным, то он может его опустить. 1 См. также [228]. 280
Продолжение табл. 5.2 Необходимые условия Номер зада¬ чи 3 4 1,1 н (Z1)== dt hJ -Sri,, 5.9 5.11 G w* (0 = //* ('1)~ t P* (^і) — условий нет 5.10 p* (/J нормален к Si при x* n — k p-w- 5.10 5.10 5.11 H из Rn размерности k\ g (0 —движущаяся конечная точ. / ка; S — подпространство из Rn (Tx J , Ts), Сформулируем теоремы, которые должны быть «доказаны». Будем считать, что предположения, сделанные в § 5.12, остаются в силе, и исполь¬ зуем обозначения этого параграфа. Мы будем рассматривать только част¬ ные случаи 1 и 2 [см. уравнения (5.385)—(5.390)]. Теорема 5.5П. 1 Принцип минимума для частного случая 1. Пусть и* (/) — допустимое управление, переводящее (лг0, в S = {хі) X (7\, Т2); •** (t) — траектория, удовлетворяющая (5.385), соответствующая и* (/), начинающаяся в лг0 и встречающая S при tr. Необходимым усло¬ вием оптимальности и* (?) (в частном случае 1), является существова¬ ние неотрицательной константы р* (р* ^0) и функции р* (/) таких, что а) р* (t) и х* (/) являются решениями канонической системы ** V) Iх* p* u*(z)’ ’ (5.488) P*(0 = - -g- >* (0, P* (0, «* (0. po J, (5.489) с граничными условиями X* (/0) = Xo, X* (/j) = (5.490) где гамильтониан И (x, p, n, p0) имеет вид H(x. p. u, pa) = pnL(x, ») + <p, f (X, u)); (5.491) ' Все теоремы, относящиеся к доказательству принципа минимума Л. С. Понтря¬ гина, имеют в виде дополнительного обозначения букв/ П. 281
б) функция Н [х* (/), р* (/), и, р*] от и на Q —имеет абсолютный минимум при # = #*(/) для t из (/о, т. е. min Н Гх* (О, р* (О, я, Ро] = н Г** (О, Р* (Л, и* (0, Pq 1 ; (5.492) «eQL J L J в) функция Н [х* (/), р* (Z), а* (/), р*] равна нулю для / из [/0, /J: H [-V* (О, Р* (О, я* (О, Р*] = 0, t С to, ^іі- (5.493) Теорема 5.6П. Принцип минимума для частного случая 2. Пусть и* (t) — допустимое управление, переводящее (х0, /0) в S = X (7\, 7%); X* (t) — траектория по (5. 388), соответствующая и* (t), начинающаяся из (х0, ^о) и встречающая S при tv Необходимым условием оптималь¬ ности и* (/) (в частном случае 2), является существование неотрицатель¬ ной константы р* (р* 0) и функции р* (t) таких, что а) р* (/) и X* (/) являются решениями канонической системы х*(0 = [х* (/), р* (t), U*(t), Ро]; (5.494) р* (О = — [х* (0> Р* (0> «* (0. Ро] (5.495) с граничными условиями X* (t0) = х0; X* (Q £ Sx, (5.496) где гамильтониан Н (х, р, а, р0) имеет вид H (X, р, и, Ро) = PqL (X, и) + (р, /(х, и)); (5.497) б) функция Н [х* (О, Р* (О, Р*] от а на й имеет абсолютный ми¬ нимум при и = а* (/) для t из Ио, М: min Н Гх* (/), р* (/), а, р*1 = Н Гх* (/), р* (/), а* (/), р$] ; (5.498) и е о L J L J в) функция H [X* (/), р* (/), (/), р*] равна нулю для t из Ио, н [л* (О, Р* (0, #* (0, Ро*] = о, / С ['о, ; (5.499) г) если — гладкое подмножество размерности k из Rn, то вектор р* (ZJ трансверсалей к Sx в точке х* (/J (см. § 3.13). Если S1==Rnt то р* (/х) есть нулевой вектор: р*(/і) = 0. Эти две теоремы отличаются от теорем 5.5 и 5.6, во-первых, наличием дополнительной постоянной р*, необходимой для того, чтобы можно было рассматривать исключения (см. обсуждение в конце § 5.13). Во-вторых, отметим, что отличие теоремы 5.6П от теоремы 5.5П состоит в дополни¬ тельном предложении (пункт г) теоремы 5.6П, где отмечается трансвер¬ сальность дополнительной переменной к множеству S. В следующем пара¬ графе мы «докажем» обе эти теоремы. 5.16. ЭВРИСТИЧЕСКОЕ ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МИНИМУМА Приведем доказательство принципа минимума, основываясь на гео¬ метрических представлениях. Прежде чем перейти к его подробному доказательству, рассмотрим порядок изложения. Разделим этот параграф на отдельные части, каждая из которых соответствует шагу доказательства. Поэтому план доказательства будет представлять собой список этих частей с кратким описанием содержания последних. 282
1. Замена переменной. Введем вспомогательную переменную х0 такую, что Хо (t) = L [х (t), у (/)] и заменим нашу задачу эквивалентной задачей в /?п+1. 2. Принцип оптимальности. Покажем, что любая часть оптимальной траектории должна быть оптимальной траекторией, и дадим геометри¬ ческую интерпретацию этого принципа. 3. Малые изменения начальных условий и их последствия. Будем в малых пределах изменять начальные условия и обнаружим, что буду¬ щий результат этих изменений описывается (приближенно) некоторой однородной линейной системой. Геометрически это будет рассматриваться как движение вектора вдоль оптимальной траектории. Построим «трубку», в пределах которой управление остается (приблизительно) оптимальным. 4. Движущиеся гиперплоскости. Рассмотрим систему, которая является сопряженной с однородной линейной системой, описывающей эффект малых изменений начальных условий. Геометрически будем рас¬ сматривать эту сопряженную систему как гиперплоскость, движущуюся вдоль оптимальной траектории, и обнаружим, что дополнительный вектор будет нормален к некоторой гиперплоскости, движущейся вдоль опти¬ мальной траектории. Этой гиперплоскостью окажется опорная плоскость выпуклого конуса, построенного на основе результатов возмущения оптимального управления. 5. Временные вариации оптимального управления. Будем изменять (в малых пределах) временной интервал, в течение которого приклады¬ вается оптимальное управление, и покажем, что результат этого можно рассматривать геометрически как луч, проходящий через конечную точку. 6. Местные вариации оптимального управления. Рассмотрим управле¬ ния, отличающиеся от оптимального лишь на малом отрезке времени и постоянные на этом отрезке времени. Эффекты, вызванные такого рода управлениями, приводят к определению конуса с вершиной в конечной точке. 7. Конечный конус. На основе временных и местных вариаций опти¬ мального управления построим выпуклый конус, вершиной которого является конечная точка. Покажем, что элементы этого конуса соответ¬ ствуют вариациям оптимального управления. 8. Доказательство теоремы 5.5П. «Докажем» теорему 5.5П. Для этого вначале покажем, что луч в направлении уменьшения функционала не встречает внутренней части конечного конуса. После этого определим гиперплоскость, отделяющую этот луч от конечного конуса. Эта гипер¬ плоскость определяет дополнительный вектор. 9. Условия трансверсальности. Изменим доказательство теоремы 5.5П. таким образом, чтобы была принята во внимание плоскость, касательная к множеству S. По сути дела, мы повторим пошаговый процесс доказательства теорем в § 5.6 и 5.7, с той лишь разницей, что в данном случае задача будет сложнее предыдущих. Иначе говоря, начнем с предположения, что опти¬ мальное управление существует. Далее, для упрощения заменим рассмат¬ риваемую задачу эквивалентной в (1). После этого установим свойство оптимальных траекторий, известное, как принцип оптималь¬ ности (2). Проделав это, рассмотрим эффекты возмущений оптимального управления (3-н7). И, наконец, «докажем» принцип минимума (8) и (9). В основном наше доказательство состоит в следующем: 1. Покажем, что имеется «достаточно» возмущений оптимального управления, позволяющих построить конус (с вершиной в конечной точке), обладающий свойством, выражающимся в том, что луч в направлении уменьшения функционала не встречает его внутренней части. 283
2. Покажем, что нормаль к гиперплоскости, отделяющей этот луч от конуса, можно «двигать назад» вдоль оптимальной траектории таким образом, чтобы определить дополнительный вектор, существование кото¬ рого было принято при доказательстве теоремы. 1. Замена переменной. Начнем с введения вспомогательной перемен¬ ной х0: x0(t) = L [лг(/), %о(^о) == 0- (5.500) Непосредственно видно, что G J(x0, /0, и)= §L[x(t), u(t)]dt — (5.501) to ti = J x0(t)dt = x0(G)- (5.502) to Если рассматривать следующую систему порядка п + 1: *о(О = L [X(/),»(/)]; I ( (o.oUo) x(t) = f[x(t)9 u(t)], J то частный случай 1 (см. § 5.12) можно перефразировать следующим образом: Дана система порядка п + 1 [уравнения (5.503)], начальное время t0 и начальное условие (0, х0) [т. е. х0 (/0) = 0] в Rn+1. Пусть S = S' X (Т19 Т2) —множество цели [в Rn+1 х (Т19 Т2)], где S' — прямая в Rn+1, проходящая через точку (0, хг) параллельно оси х0, и определяемая соотношениями х1 — *п = 0, х2 — %і2 = 0,.. ., хп — х1п = 0, (5.504) где х1/ — компоненты вектора Требуется найти допустимое управле¬ ние а, переводящее ([хо],^о) в S' х (Т19 Т2) и минимизирующее при этом Хо в конечный момент времени. Другими словами, мы хотим найти траекторию системы (5.503), исходящую из точки (0, л:о) и пересекающую прямую S' в точке, где коор¬ дината Хо минимальна. Напомним читателю, что необходимо попасть в заданную точку в фазовом пространстве, причем время прибытия не задано. Геометрический смысл задачи показан на рис. 5.16, где изображена оптимальная (*) траектория в /?п+1. Пространство состояний (фазовое пространство) системы часто будем изображать в виде плоскости xtXj9 а ось функционала х0 считать направленной вверх, чтобы установить понятия «вверх» и «вниз». Рис. 5.16, б аналогичен рис. 5.16, а за исклю¬ чением того, что мы «сжали» пространство состояний в единственную ось. Стрелки показывают направление движения точки в Rrl или в Rn+1 с возрастанием времени. Часто будем изображать ось времени в явном виде. В этом случае одна ось будет осью «стоимости», другая — осью пространства состояний и третья — осью времени. Далее мы будем иметь дело как с векторами из /?п+1, так и с векторами из Rn. Условимся обозначать элемент из через у и считать, что Уо, Уі, У 2, • • -, Уп являются компонентами у: Уо Уі (5.505) _//п_ 284
Можно определить (и + 1)-мерную векторную функцию g (у, и) с компонентами g0- glf . . gn, положив go (Уо, Уі,---, Уп, ll) = L (уи y2,..., yn, tl\, gi (Уо, Уі Уп, и) = fi (Уі, У2,--- yn, u); (5.506) gn(y0, Уі,---, Уп, «) = Іп(Уі, Уі,---, Уп, ч), и записать систему уравнений (5.503) в виде y(t) = g[y(t), u(t)]. (5.507) При обсуждении решений систем уравнений (5.503) и (5.507) будем сопоставлять векторы у (t) и (х0 (/), х (t)) и использовать те обозначения, которые наиболее удобны при рассмотрении. Подчеркнем лишний раз, что в данном параграфе у обозначает вектор размерности п + 1 их — вектор размерности п. Так как принцип минимума является необходимым условием, будем считать, что и* (/)—оптимальное управление и х* (/)—соответствую¬ щая ему оптимальная траектория в Rn. Пусть обозначает конечное время: X* (/*) = X! (5.508) (см. рис. 5.16), X* (t) —«стоимость», или значение функционала вдоль оптимальной траектории, т. е. х* (/) = j L [х* (0, «* (01 dt, /0 < t < /*. (5.509) Итак, в соответствии с принятыми обозначениями, у* (/) представляет собой траекторию в пространстве 7?п+1 решения системы уравнений (5.507), начинающуюся из (0, х0) и произведенную управлением и* (/) (см. рис. 5.16). Таким образом, имеем У* (*о) = Уо = (5.510) У*(0 = х0*(О x*(Q (5.511) у* (t*) = ■ J* 1 _ Г х0* (/*) ' (5.512) Г 0 1 где J* представляет собой минимум «стоимости», т. е. J* = J(x0, t0, и*). (5.513) В этом случае траектория у* (/) в Rn+1 оптимальна. Она соответ¬ ствует нашей задаче в ее новой формулировке. Заметим, что ничего не изменится при сдвиге начала отсчета вре¬ мени, так как ни система, ни функционал явно от времени не зависят. Иначе говоря, если принять t0 + т за начальный момент времени, то управление их, определенное как (5.514) 285
будет оптимально и произведет «ту же» траекторию, что и а* (где траек¬ тория рассматривается как множество точек в /?п+1). На рис. 5.17, а показаны управления и* и ят, а на рис. 5.17, б —движение в простран¬ стве, образованном функционалом, пространством состояний и временем. Траектории, произведенные управлениями и* и и\ имеют одну и ту же проекцию на плоскость функционал х пространство состояний. Рис. 5.16. а) Иллюстрация к задаче в про¬ странстве Rn+i- Плоскость X[Xj представляет собой пространство состояний (фазовое про¬ странство) системы, ось х0 — стоимость. Оптимальной траекторией в Rn+1 является J* (/). Проекцией у* (/) на пространство состояний (х,х/) является траектория х* (t). б) На этом рисунке пространство состояний сжато в одну ось х +2-мерном пространстве; добавлена ось времени, чтобы показать влияние сдвига по времени. Траектория, отмеченная звездочкой (*), получена от действия управления а*, а траектория, отмеченная индексом т,—от сдвинутого управления их- Проекции обеих траекторий на пло¬ скость х^х одинаковы и представляют собой траекторию, обозначенную j* мальной х. Начнем с того, что докажем оптимальность управления а* для любой точки оптимальной траектории. Для этого предположим, что у* = у* (/) = (х* (/), X* (/)) есть точка на оптимальной траектории, причем В этом случае управление u*t,t*] переведет эту точку в S . Если и —другое допустимое управление, переводящее у* в S', то обозначив через у (т) решение системы уравнений (5.507), удовлетво¬ ряющее начальному условию ў(О) = у*, (5.515)1 2 и полагая, что т — момент встречи с S', можно обнаружить Уо СО > J* = X* (О- (5.516) 1 Это утверждение часто называют принципом оптимальности (см. [20]). 2 Можно принять за начало т = 0, так как явная зависимость от времени отсутствует. 286
В противном случае [если условие (5.516) не удовлетворяется] управление я* не было бы оптимальным. Последнее нетрудно увидеть из рис. 5.18, где цифрой // обозначена траектория у (т). Убедимся теперь, что, как это показано на рис. 5.19, все траектории системы (5.507), начинающиеся из у0 = (0, х0) и встречающие S', должны Рис. 5.18. Траектория не может со¬ стоять из двух сегментов J и 77, так как это противоречит предположению о том, что а* есть оптимальное управ¬ ление Рис. 5.19. Иллюстрация возможных и невоз¬ можных траекторий в Rn+1 лежать «выше» оптимальной траек¬ тории. Проверим это утверждение, показав, что любая часть оптимальной траектории также является оптимальной в следующем смысле. Предположим, точки у* и у* принадлежат к оптимальной траектории, показанной на рис. 5.20, a S" — прямая, проходящая через точку у* параллельно оси функционала. Управление переводит у* в S". Рис. 5.20. а) Два управления, переводящие начальное состояние в прямую S'. Управле- ние U[ta сдвинуто относительно управления на т сек. б) Траектория, состоя¬ щая из у и у, невозможна, так как это противоречит оптимальности у* Если u{t t j — любое другое допустимое управление, переводящее у* в S", то при этом должно выполняться условие лго (/з) (/2) (где через /з обозначен момент времени, в который траектория y(tu ti\ , произведенная управлением и, встречает S"). Другими словами, предполагаем, что u*t есть оптимальное управление (рис. 5.20, а) и у* и — соответствующая ему оптимальная траектория (рис. 5.20, б). Будем считать, что /0 < G < < t2 < /* 287
и у* =у*(Л)= У* = У* (/2)= X* (/1)' х*(/і) X* (Л>) X* (/2) (5.517) — две точки на оптимальной траектории. Предположим, что S" — пря¬ мая, проходящая через точку у* параллельно оси функционала; пусть и(І t ! — любое допустимое управление (рис. 5.20, а), переводящее у* вЗ", т. е. траектория y((]> <я| (рис. 5.20, б) обладает свойством *Из) *0 (А.) ■г* (У или, эквивалентно, х(/ч) = х*(/2). Покажем, что Хо(/8)>х* (^)- Если уравнение (5.520) не удовлетворяется, то тогда х0(/8)<х* (^)- Если т (см. рис. 5.20) определено соотношением ^3 = ^2 Ф то уравнения (5.519) и (5.521) запишутся соответственно лг(/2 + т) = х* (Q; Хо(/2 4- т)< X* (t2). (5.518) (5.519) (5.520) (5.521) (5.522) (5.523) (5.524) Предположим, что в момент времени t3 мы приложим управление Ю((„, <Ч-т] = «(G+t, Г-н) (5.525) (см. рис. 5.20, а). Управление и имеет тот же вид, что ив*, но сдвинуто по времени: и (s + т) = и* (s), sÇ(/2, t*]. (5.526) Тогда управление и производит траекторию у, исходящую из точки [х0 (/2 + т), X* (/2)] и встречающую прямую S' при t* 4-т. Иначе говоря, если у (s + т) = (х0 (s + т), х (s + т)) для s £ (/2, t* ], то X (/* 4- T) = х* ((*) = Хр (5.527) Мы имеем (‘+х x0(t* + Т) = х0(/2 + T) + j L [x(s 4 т), »(s 4- т)] d(s 4- т) = (5.528) <2+^ г = х0 (/2 4-т)-t- J L [X* (s), w*(s)]ds= (5.529) ^2 = х0(/2-*-т) 4- X* (/*) — X* (/2) = (5.530) = Хо(/з) 4 Хо (/*) — Хо (/2); (5.531) 288
на основании условия (5.521) заключаем х0(/* + т) <%;(/*), (5.532) что противоречит оптимальности а*. Таким образом, утверждение (5.520) доказано. Мы показали тем самым эквивалентность оптимальности и* геометрическому свойству, состоящему в том, что все траектории у, встре¬ чающие S', должны лежать выше траектории, производимой оптимальным управлением и* (см. рис. 5.19). Геометрическая интерпретация оптимальности поможет нам построить вокруг оптимальной траектории «трубку», внутри которой управление а* приблизительно оптимально. Введение этой «трубки» позволит нам пре¬ одолеть Трудности, связанные с тем, что наши возмущенные траектории должны проходить через (см. § 5.9). 3. Малые изменения начальных условий и их последствия. Имея в виду построение «трубки», в которой и* приблизительно оптимально, изменим на малую величину исходное состояние (0, х0) и посмотрим, как это изменение «распространится» вдоль оптимальной траектории. Иначе говоря, рассмотрим новую начальную точку в Rn+1: (0, х0) + е (v0, V) + О (е)> (5.533) где 8 — малое положительное число и, как обычно, О (8) — вектор Іігп 1°-£И = 0. (5.534) Заметим, что решение системы (5.507), начинающееся из точки, опре¬ деляемой выражением (5.533), и произведенное управлением а*, имеет вид (хо (0. X* (О) + 8 (хо (0, X (0) + О (8), (5.535) где (хо (0, X (0) — решение линейной системы порядка п + 1 вида Хо = \ 44 “*X’ (5.536) Х(0 = (^[^*(0. »* (01). X (0 (5.537) с начальными условиями Хо (^о) — ѵ0; Х(/0) = ѵ. (5.538) (5.539) Отметим также, что систему (5.536), (5.537) можно записать в матрич¬ ной форме Xo(O . x(0. nI âZ.I dL оГ" . ) дх dL I "1 г ■ЦхТк Xo(Z) L X (о J ’ (5.540) где символ I* указывает, что функция должна вычисляться вдоль опти¬ мальной траектории. Если через Л* (0 обозначить матрицу размера п+ 1 X п+ 1, входящую в уравнение (5.540), а именно: 10 Атанс 2025 0 I dL I dL I # dL I _ I -XL I -XL L' 1 1» 0 І -a^l • ! àx I. (5.541) 289 л*(/)=
и через if (t) обозначить п + 1-мерный вектор (%0 (0, X (/)), а через § п + 1-мерный вектор (ѵ0, ѵ), то i|> (0 будет решением однородной ли¬ нейной системы порядка п + 1 4(0 = (5-542) удовлетворяющим начальному условию ^(/о) = g — (5.543) Это означает, что наша новая траектория в Rn+i имеет вид y’(t) + еі|)(0 -h О(е). (5.544) Если считать, что вектор g «приставлен» к начальной точке у0 = = (0, х0), то, как показано на рис. 5.21, вектор -ф (0 можно считать «при¬ ставленным» к точке у* (t). Таким образом, вектор ч|з (0 можно рас- Пространство состояний Рис. 5.21. Результат малых возмуще¬ ний начальных условий. Эффект малого возмущения eg может быть приблизительно описан с помощью распространения вектора 8ф (/), при¬ ставленного к траектории j* (/). Ма¬ лые возмущения опущены для упроще¬ ния чертежа. Вектор ф (/) есть реше¬ ние линейной системы (5.542) с началь¬ ным условием (5.543) Рис. 5.22. «Ширина» оболочки незна¬ чительно изменяется в зависимости от времени и приблизительно равна е2 сматривать как результат движе¬ ния (передачи) вектора g вдоль оптимальной траектории. Отметим также, что вектор О (8) в выраже¬ нии (5.544) зависит от /, и поэтому следует писать О (в, 0- Однако, ввиду предположения относительно глад¬ кости функций, можно убедиться в том, что lim sup / °(£’ 1 = 0. (5.545) e-»0 tQt0, GH 8 J Это означает, что зависимостью вектора О (8> О от /можно пренебречь. Геометрическая интерпретация последнего замечания показана на рис. 5.22, из которого видно, что траектория у* (/) + 8ф (/)+О(8) всегда лежит в узкой полосе [ограниченной кривыми (оболочкой) на рис. 5.22] вблизи кривой у* (t) + 8ф (/). Интерпретация этого замечания сводится к тому, что «ширина» полосы не изменяется значительно со вре¬ менем; порядок величины ее не превышает 8 вдоль всей траектории. Если Ф* (/, /0) обозначает фундаментальную матрицу системы (5.542) размера п + 1 X п + 1, то нетрудно заметить, что ф(/) = Ф*(/, (5.546) и ф(/*) = Ф*(/*, /0)g. (5.547) Таким образом, мы можем считать, что система (5.542) определяет линейное преобразование пространства п + 1 векторов, «приставленных» 290
к 5>0, в пространство п+ 1 векторов, «приставленных» к у* (/). Так как матрица Ф* (?, /0) — невырожденная, то и это линейное преобразование невырожденное. Любая часть оптимальной траектории есть оптимальная траектория. Если tx и /2 — элементы из [/0, /*], то точно так же можно определить линейное преобразование пространства п + 1 векторов, «приставленных» к У* (G), в пространство п + 1 векторов, «приставленных» к у* (/2). Действительно, если — вектор размерности п + 1, «приставленный» к у* (/.), то его изображение, полученное с помощью линейного преобра¬ зования, есть вектор Ф*(/2, Ші- (5.548) Таким образом, можно считать, что однородная ли¬ нейная система (5.542) описы¬ вает будущий эффект малых изменений оптимальной траек¬ тории в данный момент вре¬ мени. Малое положительное число 8 мы будем в дальнейшем рассматривать в качестве пара¬ метра. Иначе говоря, рассмат¬ ривая некоторые определенные величины, будем предполагать 8 выбранным настолько малым, что выполняются требования, предъявляемые к этим величи¬ нам. Например, если g и g—п + + 1-мерные векторы, «пристав- —— X, X Пространство состояний Рис. 5.23. Траектория у (t) от действия допу¬ стимого управления и «приблизительно выше» траектории у* (/) + еф (/), так как управление и* оптимально в пределах первой степени е в трубке относительно у* (і) ленные» к у0, то 8 считается «достаточно» малым для того, чтобы у* (0 + еф (0 и у* (t) + 8ф (/) были «близки» к у* (/), где ф (/) иф (/) — решения системы уравнений (5.542), удовлетворяющие начальным усло¬ виям ф (/0) = g и ф (/0) = g соответственно. Так как незначительные изменения начальных условий вызывают малые изменения решений дифференциального уравнения, то можно убе¬ диться, что все траектории системы (5.507), начинающиеся из точки (5.533) и встречающие S' также внутри области порядка 8, лежат «приблизительно выше»траектории, произведенной а*. Иначе говоря, если и—допустимое управление, производящее траекторию у, которая начинается из точки (5.533) и для некоторого t удовлетворяет условиям Х(/) = Хі + 8ХЬ и то У (0 = ko (О, <*(0L х0 (Г) — X* (/*) — ечро (к) > — I о (8) |. (5.549) (5.550) Таким образом, с точностью до членов высшего порядка относи¬ тельно 8 управление а* оптимально для новой исходной точки (5.533). Действительно, как показано на рис. 5.23, управление и* оптимально (в пределах первой степени относительно 8) в «трубке» около оптимальной траектории. Возмущения и управления и*, которые рассматриваются, • 291
не выведут нас из этой «трубки», и поэтому мы вправе предполагать, что J (и) приблизительно больше функционала J (и*) для любой точки в «трубке». Отметим, что эта трубка строится только для геометрической интерпретации. 4. Движущиеся гиперплоскости. Рассмотрим систему, сопряженную с однородной линейной системой ф (/) = А* (Оф(0, [уравнение (5.542)1 с целью выяснить, не имеет ли она полезной геометрической интерпрета¬ ции (см. § 3.25, определение сопряженной системы). Так как матрица — A'* (t) дается соотношением -л;(о = dfi dx! dfi 0 dL I dx 1 1 1 1 / *1 \ 0 dfz dxt dfz 0 ÆI V , dx |*/ J 1* dfn I дху 1* dx2 1* "__0_ — dL дХі dx2 i 1*1 и- dx2 dx2 _ dL 1 1 [ <3/1 dfz àfn 1 dxn 1* 1 dxn 1* dxn 1* dxn 1* (5.551) (5.552) непосредственно получаем, что система, сопряженная с (5.542), имеет вид Pe(/) ‘ о ! 0 >(0 . — -44 L dx 1*1 Y k dx 1*7 J _ P(0 . или, эквивалентно, Ро(О = О; (5.553) (5.554) (5.555) С одной стороны, из уравнения (5.554) непосредственно вытекает, что Ре (0 = const для любого t, с другой — гамильтониан Н (х, р, и, р0) определяется как Н (х, р, a, p0) = p0L(x, u) + (p,f(x, и)). (5.556) Поэтому соотношение (5.555) можно записать в виде = Pol- (5.557) Заметим также, что если р0 = const и р (/) — решение (5.557), то скалярное произведение , ф (0 / = const (5.558) для любого решения ф (/) уравнения (5.542). Если считать, что PQ — гиперплоскость, проходящая через у0 и удовлетворяющая уравнению / Ро х.Р(0. нормален к гиперплоскости Ро. 292
и принять, что Уо + — вектор размерности п + 1, то решение уравне¬ ния (5.553), удовлетворяющее начальному условию Ро (^о) — ло, Р (*о) — л, (5.560) определяет гиперплоскость Рь описываемую уравнением У — У*(0 > = 0. (5.561) Эта гиперплоскость проходит через точку 31* (t) и имеет то же скаляр¬ ное произведение с вектором ф (/), приложенным в точке у* (/), что и век¬ тор I в точке с гиперплоскостью Ро. В частности, если Ро перпен¬ дикулярна g, то Pt перпендикулярна ф(/). Гиперплоскость Pt можно рас¬ Рис. 5.24. Изображение движущейся гиперплоскости Pt. Вектор (л0, л) перпендикулярен к гиперплоскости Ро в точке у* (?0). Вектор g (или eg) изображает возмущение начального условия у* (t0). В момент времени t вектор (л0, р (t)) перпендикулярен к гиперплоскости Pt в точке у* (/). Система координат показана слева вверху. сматривать как результат движения (передачи) гиперплоскости Ро вдоль оптимальной траектории, как это показано на рис. 5.24. Заметим, что если л0 = 0, то уравнение Pt имеет вид (р (0> х — х* (/)) = о, (5.562) и, следовательно, не зависит от координаты функционала (5.562) в /?Л+1, т. е. Pt параллельна оси xQ. Это положение поясняет смысл исключе¬ ния р* = 0. Если сравнить соотношение (5.557) с (5.489), то можно заметить, что сопряженные переменные соответствуют движению некоторой гиперпло¬ скости вдоль оптимальной траектории. Таким образом, можно сформули¬ ровать следующий основной вопрос: Как можно определить гиперпло¬ скость, которая позволила бы доказать теорему? Прежде чем изложить ответ на этот вопрос, рассмотрим, каков общий путь определения гиперплоскостей, проходящих через данную точку у? Если предположить, что у — граничная точка выпуклого множе¬ ства С, то существует опорная гиперплоскость, проходящая через у (см. теорему 3.5). Поэтому введем в рассмотрение подходящее выпуклое множество C*t, имеющее у* (/*) = (/*, Х\) своей граничной точкой, а также опорную гиперплоскость, которая будет использована для доказа¬ тельства теоремы. По сути дела, мы определим выпуклые конусы Ct с вершинами в у* (/), рассматривая особый класс вариаций или возму¬ щений управления а*. Эти конусы всегда лежат с одной и той же стороны гиперплоскостей, определенных дополнительными переменными, и назы¬ 293
ваются конусами достижимости. Лучи конуса Ct* соответствуют возму¬ щениям и*, которые будут рассматриваться. В дальнейшем сосредоточим внимание на описании вариаций и*. 5. Временные вариации оптимального управления. Первый основной тип вариаций, который будем называть временными вариациями, состоит в изменении на малую величину конечного времени /*. В этом случае рассматривается результат приложения оптимального управления и* в течение нового временного интервала. Строго говоря, если т — произ- Рис. 5.25. Типичные временные вариации двух компонент (щ и uj) оптимального управлении а* (/): а) т2 отрицательно; б) ^положительно, компоненты и [т] (t) постоянны на интервале (/*, t* + exj] и равны компонентам и* (/*) вольное действительное число, то временная вариация и (т) управления и* определяется соотношениями #*(/), /0<^<^* + ет, т<(У »*(/), /о < t < ^*; л* (/*), /*</</* + 8Т (5.563) Две типичные временные вариации управления и* показаны на рис. 5.25, где тх>0 и т2 <0. Если 8 мало, то решение у (t) = (х0 (/), х (/)) системы (5.507), начи¬ нающееся из у0 = (0, Xq) и произведенное управлением я(т), обладает свойством у* (/* + 8Т) - у* (/*) + 8Ô [т] 4- О (е), (5.564) где Ô [т] —п + 1-мерный вектор, не зависящий от 8. Действительно, в силу предположения о дифференцируемости пере¬ менных и малости е можно показать, что Ô [т] = g [у* (/*), а*(/*)]т= (5.565) L[x*(/*), #*(/*)]' /[х* (/*), и* (/*)] L[xv и* (t*)]' /[Хь #*(/*)]_ (5.566) (5.567) »[т](0 = 294
Уравнения (5.564) и (5.565) можно истолковать как точную форму записи утверждения, что «дифференциал» есть лучшая аппроксимация первого порядка для приращения функции х. Будем рассматривать вектор Ô (т) [или 8Ô (т)] «приставленным» к точке у* (/*), как показано на рис. 5.26. Из уравнения (5.566) непо¬ средственно следует, что векторы Ô (т) для различных величин т распо¬ ложены на одном и том же луче (прямой) р, проходящем через точку Рис. 5.26. Иллюстрация луча р, производимого временными вариа¬ циями управления. Луч р проходит через точку у* (/*). Его направ¬ ление определяется наклоном у* (/) в точке у* (/*) у* (/*) и, по сути дела, они «заполняют» эту прямую. Далее, из (5.566) видно, что ô (т) есть линейная функция т, причем ô [°4ті + «2Т2І = [Tj 4- a2ô [т2] (5.568) для всех действительных чисел ар а2, тг и т2. Наконец, на основании выражения (5.566) можно заключить, что любому вектору ô вида м Ô = Е a,.ô [tJ І=1 (5.569) м соответствует возмущение uà управления а* I т. е. uà = и такое, что вектор 8Ô представляет собой разность (в пределах первого порядка относительно 8) между концом возмущенной траектории от действия и конечной точкой оптимальной траектории. Здесь принято, что М — произвольное конечное число, az — неотрицательные и ^—про¬ извольные действительные числа. 6. Местные вариации оптимального управления. Вторым основным типом вариаций, которые мы будем называть местными вариациями, являются управления, отличающиеся от и* на очень малом отрезке вре¬ мени и постоянные в пределах этого отрезка. Физически такая вариация представляет собой маленький импульс энергии управления. Более точно, если ш — элемент из ограниченного множества Q и / = (і — га, Ь] — полуоткрытый (слева) подынтервал из [/0, /*], правая точка которого не является разрывом и* и не есть /*, то местная вариация и [со, І\ управле¬ ния а* определяется как [»*(/), m tQi. (5-570) Иначе говоря, мы утверждаем, что у (і* 4- £Т) —у* (/*) # еу* (/*) т. 295
Типичный вид и [со, I] показан на рис. 5.27. Рассмотрим, что полу¬ чится, если управление и [<о, /] приложить к системе (5.507). Обозначим решение системы (5.507), начинающееся из у0 = (0, х0) и произведенное управлением и [со, /], через у (/) = (х0 (0, х (0)- Как показано на рис. 5.28, у (/) будет совпадать с оптимальной траекторией для /0 < < t < b — га, а затем мало отличаться от нее. Действительно, из пред¬ положения о дифференцируемости и о малости интервала / следует У (&) = У* (ty 4- г {y(b) — y* (&)} а 4- О (е). (5.571) Но так как у и 31* являются решениями системы уравнений (5.507), имеем ~L{x(b), со]~| У(Ь) = g[y(b), со] = ~ , ; (5.572) Рис. 5.27. Типичный вид местной вариа¬ ции управления. Управление и [œ, I] отличается от оптимального управления и* на бесконечно малом интервале вре¬ мени Так как и непрерывны L [лег (6), ш] = L [; Рис. 5.28. Влияние местной вариации управ¬ ления на оптимальную траекторию ‘ у* (/). В конце интервала / разность между траекто¬ риями приблизительно равна г£>ь (<«>) я- В ко¬ нечный момент времени t* вектор eÔ [со, / ] представляет собой результат возмущения (ю) я, рассматриваемого как возмущение «начальных» условий при t = b и длина га интервала / мала, имеем tr*(ô), ®] + 4г^-; (5.574) [X* (Ь), ®] 4- (5.575) и на основании соотношения (5.571) получим, что У (Ь) = У* (0 4' 6 {g- [у* (6), со] — g [у* (6), я* (&)]} а + О (е) (5.576) или, эквивалентно, х0(6) = хо* (&) + 8 [•** (6)’ <°1 — L [•** (fe)’ (&)П а + О (е); (5.577) X (6) = лг* (6) 4- е {/ [лег* (6), ю] — /[х*(&), и* (6)]) а 4- О (е). (5.578) Положение в точке b иллюстрируется с помощью рис. 5.28. Остающаяся часть возмущенной траектории у (t) получена в резуль¬ тате приложения к системе управления и* (6, Z* ], начиная с точки у (6). Вспоминая обсуждение однородной линейной системы уравнений (5.542) и, в частности, замечания, приводящие к уравнению (5.548), и обо¬ значив Ы®) = <»1 — «• (Ь), a* (b)], (5.579) 296
уравнение (5.576) можно записать в виде У (&) = У* (Ь) + (о) а + О (8). (5.580) Траекторию у (t) для t^> b можно выразить как У (0 = У* (0 + еф* (Л b) Іь (®) а -г о (е), (5.581) где Ф* —фундаментальная матрица системы (5.542) размера п + 1 X X п + 1. В частности, имеем У (/*) = у* (/*) 4- еФ* (/*, 6) Іь (ш) а + о (е). (5.582) Обозначив через ô [со, I] вектор Ф* (/*, Ь) (со) а, т. е. приняв, что ô[(o, = b)lb^)a = = Ф*^*’ найдем, что от управления и [со/] получается траектория у (/*) = у* (/*) + 8Ô [О), /] + О (8), где п + 1 — мерный вектор Ô [со, I] не зависит от 8. (5.583) (5.584) Упражнение 5.18. Проверьте уравнение (5.580). Указание: L [х (Ь), <о] = = L [х* (ô), со] + \ ^дх^’~L » х — х* + члены высшего порядка относи¬ тельно X (b) — X* (Ь). Необходимо пока¬ зать, что ||Х (ô) — X* (6)[|= О (в), так как интервал / мал. Будем считать, что вектор ô [со, I] (или 8Ô [со, /]) приложен в точке у* (/*), как это показано на рис. 5.28 и 5.29. Из уравнения (5.583) видно, что «направление» вектора ô [со, /] не зависит от длины интервала /. Иначе говоря, если, скажем, Г есть интервал (Ь — &а', Ь], то векторы ô [со, /] и ô [со, /'] расположены на одном и том же луче, проходящем через точку у* (/*), и различаются лишь по величине. Этот луч зави¬ сит только от точки b и вектора со. Выразим это, записав р[со, Ь], Та¬ ким образом, р [со, Ь] [см. уравне¬ ние (3.22а)] есть множество вида р[ш, Ь]={у:у = у* (/*)+₽ô[û),/]; р^О) (5.585) или, эквивалентно, Рис. 5.29. Результаты двух различных мест¬ ных возмущений. Траектория, отмеченная звездочкой *, оптимальна. Траектория / со¬ ответствует возмущению и [<&х/і], которое при t—t* дает вектор eô [ûj, /1]. Траекто¬ рия 2 соответствует возмущению и [<о2, /2], которое дает при t = t* вектор eô [<о2> /гі* Направления Ô [©р /х] и Ô [(о2, /2] опре¬ деляют два показанных луча. Отметим, что оба луча начинаются из у* (t*) Pl®. 6] = {У:У=У*(/*)+рФ*(Н, &)ІИ®); Р>0}. (5.586) Напомним, что ІИ®)- ~L[x*(b), <о] — L [х* (&), «*(&)]' _/[х*(&), ®]-/[х*(Ь), »*(&)]. (5.587) Обозначим конус с вершиной у* (/*), образованный всеми этими лу¬ чами, через Р. Другими словами, Р есть множество всех векторов у, для 297
которых существует œ из Q и точка b из [/0, /*], не являющаяся точкой разрыва и*, такие, что у располагаются на луче р [со, Ь]. Как показано на рис. 5.30, конус не обязательно выпуклый S поэтому «сделаем» его выпуклым. Рассмотрим выпуклую оболочку (см. определение 3.21) со(Р) множества Р, образованную множеством всех выпуклых комбинаций элементов Р (см. определение 3.20). Иначе говоря, у есть элемент со(Р) тогда, когда существуют действительные числа г2, . . ., гN (W может зависеть от у), 0 для всех /, причем Рис. 5.30. Типичный конус Р, получающийся в результате местных вариаций. Точка у* (/*) есть вершина конуса Р и Уі, Уч € Р- Тогда Уі = У* (H + М [©і, и вектора у 2, . . ., yN из Р, такие, что N У = S гіУі. (5.588) 7=1 Заметим, что множество со(Р) есть выпуклый конус с вершиной у* (/*). Упражнение 5.19. Требуется по¬ казать, что со(Р) есть конус с вер¬ шиной у* (/*). Указание: пусть у = гіУі + «гУг» 5^0, г + s = 1 Л], Уч = У* (z*) + М [®2, ЛЛ- Надо показать, что каждая точка на луче, соединяющем у и у* (/*), принадлежит со(Р). Если z — точка на этом луче, то z = у* (/*) + ₽ [У — У* (/*)], где р > 0. Далее нужно доказать, что z — у* (t*) + P^Piô Л] + (3s(32ô [<о2, /2]. Даль¬ нейшие доказательства выполняются по методу индукции. Если теперь предположить, что у есть элемент со(Р), то можно на¬ писать у = у* (/*) + 8Ô, (5.589) где у ô = S P/ô [w/J, (5.590) 7=1 и считать вектор Ô «приставленным» к точке у* (/*). Можно также пока¬ зать, что существует допустимое управление такое, что траектория у6 системы (5.507), начинающаяся из точки yQ (0, xQ) и произведенная управлением иъ, обладает свойством У6(**) = у + 0(8) = (5.591) = У* (/*) + eô + О (е) = (5.592) N = у* (/*) + е S М [®/, Л] + О (8). (5.593) 7=1 Строгое доказательство этого утверждения содержится в работе [179]. Оно требует введения понятий, использованных для описания возму¬ щений управления в работе [179]. Однако можно догадаться, что в силу 1 Это следует из произвольного характера Q и нелинейностей рассматриваемых систем. Например, Q может состоять либо из изолированной точки, либо конуса Р, состо¬ ящего из отдельных лучей. 298
линейности и однородности системы уравнений (5.542) управление Иъ будет отличаться от я* на конечном множестве малых подынтервалов из [/о, ^*1 и будет постоянно в пределах этих подынтервалов. Например, если предположить (см. рис. 5.31), что ô = ₽jÔ /J + p2ô [®2, /2], (5.594) где интервалы I х и /2 разделены, то приняв І1 = (Ь1 — га1, &>]; /г=(62 —8£z2, b2] и полагая, что интервалы /г = (Ьі—еРіЯі, ôj; Рис. 5.31. Построение вектора Ô [см. уравнение (5.594)] из двух элементов лучей р [<о1э ] и р [<о2, Z>2]. Управление, показанное на нижнем ри¬ сунке, можно использовать для получения луча, определяемого Ô [см. урав¬ нение (5.595)] ^2 = (Ь2— ер2а2, Ь2] — разделенные подынтервалы из 1/0, t* ], можно легко показать, что управление «в, определенное как «ô(0 = «* (о, /елил; ®2, t £ І2 (5.595) дает траекторию У6 (П = У* (И + eô + О (в). (5.596) Легко также проверить, что луч конуса со(Р), на котором распола¬ гается Ô, определяется соотношением (У : У = У* (И 4 8р [Ф* (/*, 1Ьі («О + + ФЛ^М^(®2)]- Р^°); (5.597) где векторы (<о(.) определяются при помощи выражения (5.579) и Ф — фундаментальная матрица системы уравнений (5.542). Упражнение 5.20. Покажите, что управление определяемое выражением (5.595), производит траекторию^, удовлетворяющую соотношению (5.596). Указание: исполь¬ зуйте выражение (5.548) и переходное свойство фундаментальной матрицы. 7. Конечный конус. Объединим эффекты, вызываемые временными и местными вариациями и*. В результате построим выпуклый конус с вер¬ шиной у* (/*), который будет играть важную роль в нашем «доказатель¬ стве» принципа минимума. 299
Напомним, что все векторы 8Ô (т), возникающие в результате времен¬ ных вариаций и*, лежат на прямой, проходящей через точку у* (/*). Обозначим множество всех этих векторов через р. Множество р + со(Р) = {у : у = у -4- у, у Ç со(Р), у2 £ р} = (5.598) ( м = Ь : У = У* (И + е S М [т,] + I 4 = 1 М ï + е S p;ô [<ùh I/]; ait p/SsOl (5.599) /=1 ) + есть выпуклый конус с вершиной 31* (/*) (рис. 5.32). Так как р выпукло по выражению (5.568) и конус со(Р) является выпуклым по определению, А Рис. 5.32. Построение выпуклого конуса р + со(Р) = Ct*. На этом рисунке луч р соот¬ ветствует временным вариациям (см. рис. 5.26), а выпуклый конус со(Р) соответствует местным вариациям (см. рис. 5.30). Выпуклый конус Ct* с вершиной у* (/*) построен как совокупность линейных комбинаций элементов р (типа у2) и элементов со(Р) (типа ух). Множество Ct* изображено при помощи двух (полу) плоскостей А и В, каждая из которых содержит луч р. Таким образом, каждая точка «дольки», вырезаемой плоскостями А и В, есть элемент Ct* то множество р + со(Р) выпукло. С другой стороны, если М N у* (/*) + е S а(Ь [Т/1 + е S P/Ô [®/. //] 4 = 1 1 = 1 есть элемент из р + со(Р), то типичный элемент луча, соединяющего эту точку с точкой у* (/*), имеет вид I м у* (/*) -+• V у* (/*) + е S a,ô [rj + I 4 = 1 N 1 + e S ₽/ô (©y, — У* (4*) , 7 3=0 (5.600) /=1 J или, эквивалентно, м у* (/*) + еѵ S a,.ô [TJ + ev S p,ô |ш;> /Д, y > 0 (5.601) 4 = 1 /=1 и, следовательно, является элементом из p + со(Р). 300
Итак, множество р + со(Р) есть выпуклый конус с вершиной у* (/*). Обозначим его через С>: Ct* = р -г со(Р). (5.602) Выпуклый конус С/*, показанный на рис. 5.32, является множеством всех векторов, исходящих из у* (/*) и лежащих между двумя полу¬ плоскостями А и В; каждая из полуплоскостей содержит луч р. Для элемента у из Ct* можно написать у - у* (/*) + eô, (5.603) где М N ô = S «,ô + S М [®/. //] (5.604) Г=1 и где вектор ô (или 8Ô) считается «приставленным» к точке у*(/*). Можно показать, что существует допустимое управление такое, что траекто¬ рия системы (5.507), начинающаяся из у0 = (0, лг0) и произведенная управ¬ лением ttô, обладает свойством У0(^)=У + О(е) = (5.605) = у* (/*) + 8Ô + о (е), (5.606) где tf — конечное время для управле¬ ния ttô. Строгое доказательство этого поло¬ жения содержится в работе [179]. Заметим, что управление иъ вызывает небольшое отклонение от конечного вре¬ мени /*, а также отличается от и* на множестве очень малых подынтервалов Например, для Рис. 5.33. Показанное управление со¬ держит местную и временную вариа¬ ции [см. уравнение (5.608)]. Такое управление дает элементы выпуклого конуса C*z, показанного на рис. 5.32 Ô = Ô [т] + Ô [о, /], из [/0, ^* ] и постоянно на них. (5.607) где т > 0 и I = (Ь — &а, Ь], нетрудно показать, что управление Û) - а* (/) .»*(/* / £ /; t$I и /0 </</*; /*</</*+ 8Т даст траекторию у6(/* + 8T) = y*(/*) + eô+ О(е). (5.608) (5.609) Возмущение иъ показано на рис. 5.33. В силу предположения, что любая часть оптимальной траектории также является оптимальной траекторией, для любого t из (/0, ] можно определить конус Ct аналогично тому, как был найден конус Ct*. Конусы Ct цля t из (/0, /* ] будем называть конусами достижимости. Если обозна¬ чить замыкание Ct через Ct (см. определение 3.9), то нетрудно убедиться, что множество Ct опять будет выпуклым конусом с вершиной у* (t). Можно также показать, что для t t Ф*(Л t)CtcC~ (5.610)1 1 Обычно эти соотношения являются равенствами, однако для доказательства прин¬ ципа минимума достаточно включения. 301
и, в частности, Ф*(^, t)CtczC(*. (5.611) Так как Ф* — фундаментальная матрица линейной системы (5.542), из уравнения (5.611) следует, что Ф* (Л **) Ф* О Ct cz Ф* (/, /*) Ct*. (5.612) и _ _ С'СФД/, /*)СЛ. (5.613) Соотношение (5.613) можно использовать для доказательства того, что конусы достижимости располагаются по одну сторону движущейся гиперплоскости, определяемой дополнительными переменными. Рис. 5.34. Гиперплоскость Pt* яв¬ ляется типичной опорной гиперпло¬ скостью для выпуклого конуса Ct* и разделяет Ct* и луч р,. Так как луч р есть элемент Cz*, гиперпло¬ скость Pt* содержит луч р. Век- Ро 1 р* (/*) точке у ). Выпуклый конус Ct* находится с одной стороны (P^t) от плоскости луч р находится с другой стороны (Р^)* Луч И на* правлен в сторону уменьшения тор нормален к Pt* в стоимости 8. Доказательство теоремы 5.5П. Мы подготовлены теперь к тому, чтобы приступить к доказательству теоремы 5.5П. Сначала убедимся, что луч в направлении уменьшения функционала, исходящий из у* (/*), не встречает внутренней части (см. определение 3.8) конуса С,*. Более строго, если (л — вектор размерности п + 1, 1 Ц - (5.614) 0_ то луч р, определенный как р = { у : у = у* (/*) 4- 8pg, р > 0 }, (5.615) не встречает внутренней части конуса Cz* (рис. 5.34). Утверждение относительно р докажем от противного. Предположим, что вектор у = у* (/*) ерці, р>0 (5.616) есть внутренняя точка (см. определение 3.4) конуса Cz*. Тогда суще¬ ствует возмущение и управления «*, производящее на интервале [/0, траекторию у (/) системы (5.507), для которой У (0 = У* (**) + + О (е). (5.617) 302
Вспоминая, что V* ■ у(Ъ = , у* (/*)=, .*1. (5.618) и ц выражается соотношением (5.614), мы можем записать выраже¬ ние (5.617) в виде J(и) = J* — 80 + о (е); х(?) = Хі + О (е), (5.619) При достаточно малом 8 управление и не выведет систему из «опти¬ мальной трубки», и поэтому »* оптимально с точностью до первого порядка относительно г. Но, согласно выражению (5.619), управление» приводит к снижению порядка 8 в функционале и к изменениям высшего порядка (относительно 8) положения конечной точки траектории системы в про¬ странстве Rn. Итак, если 8 очень мало, мы получаем противоречие, со¬ стоящее в том, что траектория у (/) оказывается «ниже» траектории у* (/) (с точностью до членов высших порядков х). Следовательно, у не может быть внутренней точкой Q*. Таким образом, луч ц не встречает внутренней части Cf*. Конус Cf* выпуклый, и поэтому его внутренняя часть i (Ct*) — от¬ крытое выпуклое множество в Rn+1. Так как луч р — выпуклое множе¬ ство, не встречающееся с внутренней частью i (Cf*) конуса Ct*, то на осно¬ вании теоремы 3.5 можно заключить, что существует опорная гиперпло¬ скость Pt*, отделяющая Ct* от луча р 1 2. Гиперплоскость Pt*, показанная на рис. 5.34, проходит через точку у* (/*) и обладает тем свойством, что луч р лежит в полупространстве Pt*, тогда как конус Ct* содержится в по¬ лупространстве Р~к (см. § 3.7). Другими словами, вектор размерности п + 1, который мы обозначим что гиперплоскость Рс* определяется уравнением существует ненулевой через Ро* р* (/*) такой, причем удовлетворяются условия (5.621) (5.622) 1 Детальное доказательство этого ключевого положения содержится в работе [179]. В нем используются некоторые сложные топологические доказательства. См., в частности, леммы 3 и 4 в работе [179]. При этом соотношение (5.163) также играет важную роль. 2 Согласно теореме 3.5 существует по меньшей мере одна такая гиперплоскость. На самом деле их может быть больше одной, и наше доказательство точно так же применимо к любой из них. Строго говоря, это доказательство справедливо лишь в том случае, если внутренняя часть Ct* не является пустой. Однако, если внутренняя часть пуста, желаемый результат можно получить, рассматривая лучи (Л (а) = (у :у = _у* (/*) + ePg, PSsa ), а > О, которые не встречают Cz*, переходя к пределам или используя понятия, содержащиеся в сносках на стр. 106 и 107 работы [179]. 303
где ц — направление, соответствующее выражению Ро* _/?*(/*)_ нормален к элемент конуса Q*. Вектор в точке у* (/*). Уравнение (5.621) означает, что (5.614), и Ô —любой гиперплоскости Pz* (5.623)1 так как ц — вектор, определенный по выражению (5.614). Найдем теперь дополнительные переменные на основе обсуждения движущихся гиперплоскостей в разделе 4 настоящего параграфа. При этом напомним, что система уравнений (5.542) линейна и однородна и имеет вид Ф(/) = Д*(Ш0> где A* (t) есть п + 1 X п + 1 матрица: (5.624) (5.625) Эта система описывает движение вектора вдоль оптимальной траек¬ тории. Вспомним, что система уравнений (5.553), являющаяся сопряжен¬ ной к (5.624), также линейна и однородна и имеет вид Ро(О -ASt) Ро(О" (5.626) Как отмечалось в § 4, она описывает движение гиперплоскости вдоль оптимальной траектории, и мы воспользуемся этим обстоятельством для определения искомых дополнительных переменных. Для удобства, как и ранее, обозначим через Ф* (/, /0) фундаментальную матрицу си¬ стемы (5.624), а через 4е* (/, /0) — фундаментальную матрицу сопряженной системы (5.626). Построим теперь дополнительные переменные путем отыскания ги¬ перплоскости, движение которой вдоль оптимальной траектории приводит к плоскости Pz*. Так как матрица Т* (/, /0) невырожденная, существует ненулевой вектор л0 л размерности п + 1 такой, что /о) л0 Я Ро Определим п + 1-мерную векторную функцию л0 л Тогда из уравнения (5.554) получим Ро (^) ро л0 для любого из уравнения (5.555) имеем • * , dL I * / df I \ ' : Ро* (О L р*(о J = т* (Л /о) (5.627) Ро (О /?*(/*) , приняв (5.628) (5.629) (5.630) 1 Если рд = 0, то гиперплоскость Pt* содержит луч р, и наша задача, по сути дела, не зависит от функционала. 304
Так как гамильтониан Н (х, р, и, р0) определяется соотношением Щх, р, а, р0) = р0Цх, и) + (р, /(х, а)), (5.631) то уравнение (5.630) можно записать в виде Р*(0 = —g- [х* (0, Р* (0. «* (0. Ро*]- (5.632) Покажем теперь, что р* и р* (t) удовлетворяют требованиям тео¬ ремы 5.5П. Сначала докажем, что и* минимизирует гамильтониан. Пред¬ положим, Ь — точка из (/0, t* ], не являющаяся разрывом и*, и о> — эле¬ мент из Q. Напомним, что (<о) выражается соотношением [см. (5.579)] Ы®)- ~L[x*(b), <a] — L[x*(b), и* (b)]' _/[х*(6), ©] - f[x*(b), и* (b)] (5.633) и Ф* (t, b) — фундаментальная матрица вида (5.624). Тогда для малого е вектор еФ*(/*, 6)Ы<о) (5.634) принадлежит к С\*, и, следовательно, в силу условия (5.622) имеем Ро \ _ р* (Ь) . Ф*(^*> Н(»)/>0- (5.635) Так как функция ф (/) = Ф* (/, Ь) (со) есть решение системы (5.624), являющейся сопряженной к (5.626), можно убедиться, что , 1ь(®)>>0 (5.636) или Н [х* (6), р* (&), О), Ро ] > н [х* (6), р* (6), «* (6), ро ]. (5.637) Так как со — любой элемент из Q, то мы доказали справедливость выражения (5.492), т. е. minН [х* (6), р* (6), и, ро*] = Н [х (&), р* (6), а* (6), р0*]. (5.638) u (Е £2 Последнее и является утверждением б) теоремы 5.5П. Покажем, что га¬ мильтониан равен нулю в конечный момент времени t*. При этом, если т — произвольное действительное число, то [см. условие (5.536)1 0(т) = L[x*(/*), »*(/*)]' /[х*(/*), «*(/*)]_ (5.639) Из условия (5.622) следует, что Цх*(/*), «*О \ /[х*(/*)> «*(/*)] z т >0 (5.640) или Н[х* (t*),p*(t*), «*(**), р0*]т>0. (5.641) Так как т может быть как положительным, так и отрицательным, то должно выполняться следующее соотношение: Н [х* (/*), р* (/*), «* (/*), ро*] = 0. (5.642) Покажем, наконец, что функция H [х* (t), р* (t), и* (t), р*] — постоянная на интервале [/0, t* ]. Для этого воспользуемся дополнительно 305
предположением, что множество точек, в которых и* непрерывно, обла¬ дает свойством:1 если ? £ [/0, ^*1 — точка, в которой и* непрерывно, то и* непрерывно для всех t из [/0, /*], достаточно близких к Л Это пред¬ положение справедливо, например, если и* имеет конечное число раз¬ рывов. Пусть tr и t2 — элементы из Ио, ], причем <Zt2w функция и* (0 непрерывна на интервале /2]. Покажем, что функция Н [х* (0, р* (0, и* (0, р*] постоянна на этом интервале. Так как х* (0, р* (0 и и* (0 непрерывны на этом интервале, множества /2]), {p*(O^G0> ^2І} и { и*(/):/6[/і, /2]} (5.643) ограничены и, следовательно, имеют соответствующие компактные замы¬ кания Хі Р\ и U\ (см. § 3.6). Функция H (х, р, и, ро) непрерывна на компактном множестве X1xP1xU1n имеет, в силу сделанных пред¬ положений, непрерывные частные производные по х и р на этом компакт¬ ном множестве. Определим действительную функцию т от х и р, приняв т(х, р) = inf Я(х, р, и, ро*). (5.644) Так как и* непрерывна на [/х, /2], то из соотношения (5.638) можно заключить, что т [** (О, Р* (О] = Н [•** (О, Р* (0, я* (0, Ро] (5.645) для t из [/ь /2] и поэтому функция т [х* (0, р* (0] непрерывна. Пока¬ жем, что производная от т равна нулю, и завершим тем самым доказа¬ тельство теоремы 5.5П. Предположим, что t и t' — различные точки из [/ь /2], тогда получим т [x*(t'),p* (/')] < Н [/ О'), Р* О'), «* (О, Ро], и поэтому т [х* (/'), р* О — т [X* (0, р* (01 < <я[х*0'),р*(0, »*0), ро*] - н [х* (0, />*0), «*0)> Ро*]. Если f > t, то из неравенства (5.647) можно найти т [х* (/'), Р* (<')) — т [х* (О, Р* (0] < t' — t (5.646) (5.647) (5.648) Н [х* (/'), р* (/), и* (/), р0*] -н[х* (t), р* «), и* (<), р*] (5.649) г — t Так как производные х*(0 и р*(0 существуют и и непре¬ рывны, то при t' t справа получается соотношение ^/n[x*(s), Р*(з)]|/+ <<<1*. ^*0)> + <-^-|ж. Р0)> = 0 (5.650) (так как х* (0 и р* (0 удовлетворяют каноническим уравнениям). Анало¬ гично при t' —t слева, имеем т [X* (s), р* (s)] |(_ =0. (5.651) 1 Общее доказательство, содержащееся в работе [179], требует несколько более слож¬ ных рассуждений. 306
Поскольку и непрерывны на X1xPlxU1u х* (0 и р* (О существуют, то существует и производная от т [х* (f), р* (0], и на осно¬ вании неравенств (5.650) и (5.651) можно заключить, что p*(s)l|( = 0. (5.652) Таким образом, с помощью соотношений (5.642) и (5.645) найдем Н[х*(і), tl* (t), ро*] =0 (5.653) ДЛЯ t из [/0, /* ]. Мы доказали, что р0* > 0 [см. соотношение (5.623)] и р* (0 — ре¬ шение канонической системы, соответствующее х* (0 и и* (0, входящим в соотношение (5.632), что а* (0 минимизирует гамильтониан как функ¬ цию и (утверждение б) теоремы [см. соотношение (5.637)]), и, наконец, что гамильтониан Н [х* (0, р* (0, и* (0, р0*] равен нулю. Таким образом, теорема 5.5П полностью доказана. 9. Условия трансверсальности. Теорема 5.6П отличается от 5.5П наличием условий трансверсальности (пункт г теоремы 5.6П). Покажем, как можно видоизменить «доказательство» основной теоремы для обосно¬ г * 1 Ро _р* (/*)]’ вания условия трансверсальности. Вначале отметим, что при доказательстве мы использовали следующие свойства ненулевого вектора г * 1 / Ро \ _р*(^*)]’ (5.654) (5.655) и для всех ô из Q*. Иначе говоря, любой ненулевой вектор, удовлетворяю¬ щий этим двум соотношениям, дает дополнительные переменные, соот¬ ветствующие требованиям теоремы. Если Si — гладкое подпространство размерности k из Rn и х* (/*) — конечная точка оптимальной траектории в Rn, причем х* (/*) £ то мы знаем, что «плоскость» М [х* (/*) I,1 касательная к Sx в точке х* (/*), есть вполне определенная ^-мерная плоскость из Rn, проходящая через х* (/*). Следовательно, множество всех точек (J*, х), где </* =х0 0 ) = = J (а*) и х^М [х* (/*)], есть é-мерная плоскость в Rn+X, проходящая через конечную точку у* (/*) = (J*, х* (/*)) нашей оптимальной траекто¬ рии в Rn+i, как показано на рис. 5.35. Обозначим эту плоскость через N [у* (/*)], тогда N [(У* (z*)] = ІГУ = (хо (<*), х), х£М [х*(^*)]|. (5.656) Каждый элемент N [_у* (/*)] можно также записать в виде у = y*(t*) + (5.657) 1 Если S, = ( X : g, (х) = 0, g.2 (X, = 0 gn_k IX) = 0), то М [х* (/*)] = х : U* (г*) 1. X — X* (<*) > = о для t = 1, 2, . . ., п — k] (см. § 3.13). 307
где X — n-мерный вектор, обладающий свойством \ = 1 = 1 > 2> • • • • п — k, (5.658) где (х) = 0, g2 (х) = 0, . . ., gn_k (х) = 0 — уравнения, определяю¬ щие Если принять, что М = М [л:*(/*)] = { х: существует у из N [у* (£*)], для которого у — у* (/*) = (0, х)}, то из уравнения (5.658) нетрудно заключить, что М есть а множество N = { у : у = (0, подпространство подпространство из Rn (см. § 2.5), х£М} — области цели. В пространстве Rn имеем множество цели Sx и оптимальную траекторию х* (/); у* (/)—оптималь¬ ная траектория в пространстве /?п+1. Плоскость М [х* (/*)], касательная к Sx в точке X* (/*), на нашем трех¬ мерном чертеже изображена в виде прямой линии. Плоскость М [у* (/*) ] есть проекция М [х* (/*)] на гипер¬ плоскость постоянной стоимости *0=4 О’) из Rn+1. Оба пространства N имеют размерность k §3.13). Отметим также что М и (см. 2Ѵ [у* (/*)] = у* (/* + N. (5.659) Рис. 5.36. Гиперплоскость Pt* является опор¬ ной для выпуклого конуса С** и для выпук¬ лого конуса N [>* (/*) ] и разделяет их. На этом трехмерном рисунке выпуклый конус N[y* (/*)] + ц изображается плоскостью, опре¬ деляемой прямой линией N [у* (/*)] и лучом ц (направленным в сторону уменьшения стои- мости). Так как луч р есть элемент и пря¬ мая N [у* (Z*)] —элемент N [у* (/*)]+р, гипер¬ плоскость Pj* должна содержать две прямые риЛ/ [у* (/*)]. Таким образом, выпуклый конус Ct* находится по одну сторону от Pt*, а выпук¬ лый конус N [>* (/*)] + ц — по другую. Вектор Ро _р* (/*) у* (/*). Так как У [у* (/*)] есть линия постоян¬ ной стоимости (см. рис. 5.35), то n-мерный век¬ тор р* (/*) перпендикулярен к плоскости N [у* (/*)] и, следовательно, перпендикулярен к плоскости М [х* (/*)], касательной к Sx в точке X* (/*). Это условие в точности является условием трансверсальности. Таким образом, знание области цели Sx и состояния х* (Z*) полностью определяет направление вектора р* (/*) нормален к гиперплоскости Pt„ в точке Следовательно, трансверсальности 5.6П эквивалентно условие г теоремы требованию Ро Ѵ = ° (5.660) для всех у из N (рис. 5.36). Так как N— подпространство из Rn+1, то множество АИу*(/*)] есть, очевидно, выпуклый конус с вершиной у* (/*). 308
Если снова принять, что р, — вектор размерности п + 1, определен¬ ный как 1~ О О (5.661) О и обозначить через р множество всех векторов 0 ц, 0 > О, то множество N [у* (/*)] + р = { у : у = Зі* (/*) + у + 0Ц, у С 0 > 0 } (5.662) является выпуклым конусом с вершиной у* (/*). Способом, аналогичным использовавшемуся ранее,1 можно показать, что выпуклые конусы Л/[у* (/*)] + р и СЁ* разделены. Итак, на основании теоремы 3.5 можно заключить, что для Ct* существует опорная гиперплоскость Pt*, разде¬ ляющая Ct* и N [у* (/*)] + р. Следовательно, существует * -1 Ро ненулевой вектор такой, что у Рм-/ о (5.663) для всех из А' и р > 0, и (5.664) для всех Ô из Ct*. Так как N есть подпространство из а 0 является элементом Л\ то уравнение (5.663) означает, что * і </().)]• ц><0. (5.665) Приняв в уравнении (5.663) 0 = 0, получим » (SW для всех у из N. Так как N есть подпространство из Rn+1, то у £ N предполагает, что и —у Q N. Таким образом, (5-бб7) для всех у из N. Это, согласно уравнению (5.660), и доказывает условия трансверсальности. Если множество цели Si есть все пространство Rnt то можно счи¬ тать, что множество N — все полупространство «ниже» гиперплоскости Уо— У* = Так как конус Ct* должен располагаться «выше» этой 1 См. работу (179], леммы 10 и 11. 309
г * л Ро ./?*(/*). должен быть вида * 1 Ро О , где р* > О, гиперплоскости, вектор т. е. р* (/*) должен быть нулевым вектором. Итак, теорема 5.6П пол¬ ностью доказана. Упражнение 5.21. Целью этого длинного упражнения является «провести» читателя по различным этапам доказательства принципа минимума для частной задачи оптими¬ зации. При этом будут устранены некоторые трудности, связанные с общим доказатель¬ ством. Для большей наглядности советуем читателю самостоятельно построить трехмер¬ ные изображения. Рассмотрим систему второго порядка вида 11 (0 = х2 (X); 12 (Z) = «(/), которая в начальный момент времени t0 = 0 находится в состоянии Хі (0) == 0, х2 (0) = 0. Предположим, что управление и (t) ограничено по величине | и (/)| 1 для любого t. Пусть имеем фиксированное конечное состояние Г21 Х1 L2 J и функционал (равный конечному времени) J (и) — J l-dt = і1г т. е. L (X, и) = 1. U Убедимся, что управление и* (t) = +1 для всего /, 0^ 2 переводит систему из начального состояния (0. 0) в конечное состояние (2, 2) и минимизирует J (и). Иначе говоря, управление и (t) — + 1, 0^ t^.2 оптимально по быстродействию. Очевидно, что Г = 2. Предположим, что х0 (t) = 1; х0 (0) = 0. В этом случае ось «стоимости» х0 есть ось времени. а) Рассмотрим пункт 1 доказательства. Пусть у (t) — трехмерный вектор: Покажите, что Г*о(О1 у(0= *і(0 , 1*2 (0. т'2 t У* (t) = ; t G [0,2] и начертите у* (t) в трехмерном б) Пользуясь пунктом 2 пространстве. доказательства, докажите, что допустимое управление и (t) = — Г, 0</<2; и(/) = +Г, 2 < t < 6; и (0 = 0; 6 < t < 8; переводит (0, 0, 0) в (8, 2, 2). Начертите соответствующее у (/) и убедитесь, что оно не оптимально. в) В соответствии с пунктом 3 доказательства покажите, что матрица 4# (0 уравне¬ ния (5.541) есть ГО 0 01 л*(0 = 0 о I 0 0 0 Докажите, что уравнение (5.542) сводится к уравнениям Фо (0=0; Фі (0 = Фг (О- Фг (0 = 0. 310
Покажите, что фундаментальная матрица Ф* (/, /0) для t0 = 0 равна Докажите также, что '1 0 0’ Ф»(Л t0) = Ф,(/, 0) = 0 1 t . О 0 1 Фо (0 = 5о: ѣ (0 = Ê! + 5^; Фг (0 = І2- Выбрав несколько различных значений g0 Si и ?2 таких, чтобы + 5? + &2< I- вычислите ф (/). Положите / = -у , 1, , 2, начертите векторы у* (/) и у (і) — у* (/) + 4~ £ф (/) для 8 — 0,01. Убедитесь, что у (/) принадлежит «трубке» вокруг^* (/) и 8 «регули¬ рует» толщину трубки. г) Следуя пункту 4 доказательства, определите, что представляет собой матрица —4*(0 [уравнение (5.551)]? Покажите, что уравнения (5.554) и (5.555) записываются в виде Ро (0 = о; Рі (0 = 0; р2 (0 = — Рі (0; и найдите гамильтониан (см. уравнения (5.556)]. Проверьте уравнения (5.557) и (5.558). Рассмотрите гиперплоскость Ро [см. уравне¬ ние (5.556)], описываемую уравнением Полагая Уі + У2 + Уз = 0- покажите, что вектор >0 (0)' " 1 ‘ Pi (0) = 1 _р2 (0) _ _ 1 нормален к Ро в точке (0, 0, 0). Покажите также, что скалярное произведение векторов 1 1 и ' 0 ' 1 +' ,1 — t _ 1 равно скалярному произведению векторов °1 Г1 1 и 1 1 1 Поясните, что это означает? Для этого воспользуйтесь движущимися гиперпло¬ скостями Pf. д) В соответствии с пунктом 5 доказательства покажите, что временная вариация управления равна и [т] (/) = 1, 0 С t < 2 4- 8т, где т может быть как отрицательным, так и положительным. Покажите, что так как t* = = 2, то у (2 4- 8Т) = 2 4- ex 2 + 28Т 4- у 82Т2 2 + ет 311
Покажите, что соответствующие члены уравнения (5.564) равны Проверьте уравнения (5.568) и (5.569). Нарисуйте луч р (в трех измерениях), про¬ ходящий через точку (2, 2, 2). е) Следуя пункту 6 доказательства, рассмотрите местные вариации управления: и [со, /] (О = ч-l, СО, t g /. Покажите, что должны выполняться следующие условия: —1 < со < + 1; О < b < 2. Пусть b — 0,5, га = 0,1. Вычертите траектории, получающиеся при со = 0,9; со = = 0,5; со = 0; со = —1. Повторите это для b = 1,0; га = 0,1. Покажите, что b у(Ь)= —уе2а2 + ^-е2иа2 . b — га 4- Еасо Проверьте уравнение (5.571) и докажите, что член о (е) в (5.571) равен Ю ^е2а2(й-- 1) О О (8)== Покажите, что вектор Ѣь (®) в уравнении (5.579) равен Іь (œ) = Рассчитайте векторы о(е) в уравнении (5.580) и вектор у (t*) по уравнению (5.582). Покажите, что вектор Ô [со, /] в уравнении (5.583) равен '10 0' ' 0 ' 0 Ô (со, /) = 0 1 2— b 0 = а (6-2)(1-со) 0 0 1 асо —а _ со — 1 Покажите, что типичный луч р [со, определяется множеством векторов: Р^о [см. уравнение (5.585)]. Так как —1 со << 1 и 0 ô <j 2, то можно построить множе¬ ство со(Р). Изобразите его на рисунке. Убедитесь, что конус выпуклый. ж) В соответствии с пунктом 7 доказательства покажите, что типичный элемент С** [см. уравнение (5.599) ] имеет вид 1 СЧ СМ 1 4- «£ Т ' 2т + Ре 0 (^ — 2) (1 — со) _ 2_ т со — 1 а^0, Р^0. Теперь начертите Ct*. Проверьте, что вектор Ô из уравнения (5.603) можно построить, используя формулу (5.604). Начертите несколько таких векторов Ô. Докажите усло¬ вие (5.606). Выберите вектор Ô и постройте вариацию вида (5.608). Вычислите члены о (в) в уравнении (5.609). 312
з) Следуя пункту 8 доказательства, постройте луч ц [уравнение (5.615)]. Пока¬ жите графически, что ц не встречает внутренней части С,*. Возьмите ’ т ] Г О ô = a 2т 4-р (Ь — 2) (1 — ©) , а^О, ₽>0. т (Ù — 1 Проверьте, что р* >» О, и подставьте =^= 1. Покажите, что из уравнений (5.621) и (5.622) следует рГ (2)^- у; р2* (2) <0. Докажите, что из уравнений (5.627) и (5.628) получается р* (/) = 1 = const; р* (0 =р* (2) = const; р2* (і) = р* (2) + 2р* (2) -р* (2)4 для t g [0, 2]. Покажите, что уравнения (5.635)—(5.637) и (5.642) удовлетворяются. 5.17. НЕКОТОРЫЕ ЗАМЕЧАНИЯ ПО ПРИНЦИПУ МИНИМУМА Принцип минимума представляет собой набор необходимых условий оптимальности. Действительно, если внимательно рассмотреть доказа¬ тельство, то можно убедиться, что эти условия являются необходимыми условиями локальной оптимальности. Иначе говоря, если предполо¬ жить, что и — управление, переводящее нашу начальную точку в множе¬ ство S для всех и, близких кив смысле нормы: II и — и II = sup II и (/) — и (/)|| <6, Ô > 0, (5.668)1 то удовлетворяется соотношение J(ti) (и). (5.669) Полагая параметр 8 в нашем доказательстве достаточно малым, можно показать, что существуют неотрицательная постоянная р0 и функцияр (/), при которых различные условия принципа минимума будут удовлетво¬ ряться для р0, р (/), и (t) и траектории х ((), соответствующей управле¬ нию u(t). Таким образом, принцип минимума по своей природе подобен условию локального минимума обычной функции, производная которой в точке минимума обращается в нуль. Рассмотрим каждое из необходимых условий. Мы начинаем с канонической системы (1), затем рассматриваем минимизацию гамильтониана (2); после этого обсуждаем поведение гамиль¬ тониана вдоль оптимальной траектории (3) и, наконец, рассматриваем условия трансверсальности (4). Номера 1, 2, 3 и 4 соответствуют утвер¬ ждениям принципа минимума и столбцам 1, 2, 3 и 4, имеющим заголовок «необходимые условия» в таблице 5.1. Пронумеруем замечания, чтобы упростить последующие на них ссылки: Замечание 1. Первое уравнение (для х) канонической системы есть в точности наша исходная система уравнений, которая не зависит от до¬ полнительной переменной р. Второе уравнение (для р) канонической системы описывает движение гиперплоскости (или, более точно, нормали 1 Это соотношение есть не что иное, как расстояние между и и и в функциональном пространстве кусочно-непрерывных функций (см. § 3.15). 313
к гиперплоскости) вдоль оптимальной траектории. Уравнение имеет много решений, каждое из которых соответствует движению некоторой гипер¬ плоскости (или, точнее, нормали к гиперплоскости) вдоль оптимальной траектории. Мы показали, что вследствие оптимальности существует решение этого уравнения, обладающее некоторыми дополнительными полезными свойствами. Было отмечено (см. определение 5.11), что канони¬ ческая система имеет решения вдоль любой траектории системы, а не только для оптимального управления. Замечание 2. Первое свойство дополнительной переменной р* (/), Ро состоит в том, что оптимальное управление должно минимизировать гамильтониан. Еще раз повторим, что эту минимизацию надо рассматри¬ вать следующим образом. В определенный момент времени, например /, на интервале Ио, /*], х* (/), я* (0 и р* (/) —три вполне определенных вектора и число Н [л* (/), р* (0, и* (0, р0* 1 меньше или равно числу Н [х* (/), р* (Z), û), р* ], где W — любой элемент из области ограниче¬ ний Й. Этим мы показали, что гамильтониан, как функция от и, имеет абсолютный минимум вдоль оптимальной траектории независимо от характера области ограничений. Замечание 3. Минимизация гамильтониана может быть истолкована геометрически, как утверждение: все направления, в которых можно двигаться от заданной точки оптимальной траектории, лежат по одну сторону от гиперплоскости, определяемой дополнительными перемен¬ ными. Замечание 4. Мы доказали лишь то, что гамильтониан минимизи¬ руется в точках непрерывности а*. Необходимое условие 2 должно вы¬ полняться для всех точек, за исключением счетного множества точек на интервале 1/0, /* ]. Как и ранее, в дальнейшем мы не будем это специально оговаривать. Отметим также, что точки, в которых гамильтониан нельзя минимизировать, должны быть точками разрыва и*. Замечание 5. Формулировка необходимых условий 1 и 2 не зависит от типа области S и от того, фиксировано время или нет. Для этого достаточно взглянуть на столбцы F и G табл. 5.1. Замечание 6. Необходимое условие 3, описывающее поведение гамиль¬ тониана вдоль оптимальной траектории, непосредственно зависит от того, является ли время свободным или нет. Временные вариации управления зависят от того, задано конечное время или нет, и поэтому вывод о равен¬ стве гамильтониана нулю в конечный момент времени следует из того, что конечное время не задано.Геометрически временные вариации соответствуют лучу р, как это показано, например, на рис. 5.32. Если конечное время фиксировано, то временных вариаций нет, и конечный конус есть просто со(Р) (см. § 5.16, пункт 6), как показано на рис. 5.32. В этом случае мы имеем дополнительную степень свободы при определении гиперплоско¬ сти Л*> что компенсируется знанием конечного времени. Таким образом, когда конечное время задано, Pt* может не содержать луча р (см. рис. 5.32), и поэтому мы можем показать, что гамильтониан должен быть постоянен вдоль оптимальной траектории лишь в случае, когда система и функционал явно от времени не зависят. Замечание 7. Как мы увидим в дальнейших главах, определение «достаточного» числа (т. е. 2п) граничных условий канонических уравне¬ ний является решающим при отыскании возможных оптимальных упра¬ влений. Так как начальная точка xQ известна, то в начальный момент вре- 314
мени мы имеем п условий. Если фиксирована конечная точка, то в конеч¬ ный момент времени также имеем п условий и нам не требуются никакие условия для дополнительных переменных. Если же пытаться попасть в об¬ ласть S, скажем гладкую область размерности k, то будем иметь только п — k условий (уравнения области) для лг* (/) в конечный момент времени. Однако условия трансверсальности дают необходимые нам k дополнитель¬ ных условий. Иначе говоря, чем свободнее состояние в конечный момент времени, тем более ограничен в этот момент дополнительный вектор. Эти «ограничения» даются условиями трансверсальности, что подтвер¬ ждается условием, согласно которому гиперплоскость Pt* должна содер¬ жать плоскость N [у* (/*)] (см. рис. 5.36). Далее, если конечное время фиксировано, то Pt* содержит плоскость N [31* (/*)], но может и не содер¬ жать луча р. Таким образом, имеется дополнительная степень свободы, которая компенсируется заданием конечного времени. Замечание 8. Иногда приходится сталкиваться с задачами управления, где область цели S оказывается лишь «куском» гладкой Æ-мерной обла¬ сти, как, например, в § 7.2. Если точка л:* (/*), в которой заканчивается оптимальная траектория, есть точка из S и в ней можно определить каса¬ тельную плоскость, то условия трансверсальности еще удовлетворяются. Если же точка х* (/*) есть точка S, в которой невозможно определить касательную плоскость, то в этом случае условий трансверсальности не существуют. Замечание 9. В ходе «доказательства» обнаружилось, что если ро* = О, то гиперплоскость Pt* содержит луч р. Следовательно, такая задача явно не зависит от функционала. Если же р0* =р 0, то гиперплоскость Pt* определяется уравнением \ nW ’ 3’-У*(^*)> = 0. (5.670) Но когда р* =р 0, уравнение (5.670) эквивалентно уравнению вида Оба эти уравнения определяют одну и ту же гиперплоскость Pt*. Таким образом, если р* =р 0, можно принять, что р* = 1. Так как задачи, которые мы будем рассматривать в дальнейшем, не являются исключениями (т. е. Ро + 0), то будем всегда полагать р* = 1, не оговаривая этого поло¬ жения особо. Замечание 10. Предположим, что мы хотим максимизировать, а не минимизировать функционал. К каким изменениям необходимых условий это приведет? Во-первых, непосредственно видно, что вид канонической системы не изменится. Во-вторых, в условии 2 минимизация Н заменится его максимизацией (т. е. в формуле «min» заменится на «шах»). Неравенства в доказательстве заменятся на противоположные. В частности, это будет означать, что конус достижимости расположится «ниже» оптимальной траектории. Однако луч р, соответствующий временной вариации, не из¬ менится, как не изменится и условие 3 (равенство гамильтониана нулю вдоль оптимальной траектории). Так как касательная плоскость к области цели не зависит от того, минимизируется или максимизируется функ¬ ционал, то условия трансверсальности не изменятся. По сути дела, единственным необходимым условием, отличающим максимизацию от 315
минимизации, является условие 2; условия 1, 3 и 4 могут, таким обра¬ зом, рассматриваться как условия «экстремума». Значение этих замечаний будет становиться ясным при изучении последующих глав книги, где будет показано, как можно использовать принцип минимума для решения разнообразных задач управления. Советуем читателю еще раз просмотреть § 5.10 в свете последних замеча¬ ний и нашего «доказательства» принципа минимума. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 5.18. ВВОДНЫЕ ЗАМЕЧАНИЯ В заключение настоящей главы рассмотрим некоторые достаточные условия оптимальности, которые усиливают необходимые условия, полу¬ ченные ранее, и основываются на некоторых предположениях относи¬ тельно поведения функционала. По сути дела, мы покажем, что если функционал удовлетворяет определенному дифференциальному уравне¬ нию в частных производных и если необходимое условие 2 удовлетворяется в соответствующей области, то можно доказать оптимальность процесса. В ходе доказательства будем комбинировать принцип оптимальности Веллмана [20] с леммой Каратеодори, способом, предложенным Кал- маном [112] х. Следующий параграф мы начнем с отыскания уравнения, описыва¬ ющего поведение функционала вдоль оптимальной траектории, исходя из предположения о достаточной гладкости функционала стоимости. Далее предположим, что это уравнение справедливо в пределах некоторой области, «заполненной» траекториями, соответствующими «управлению» и, которое функционально минимизирует гамильтониан нашей задачи. После доказательства необходимой леммы покажем, что «управление» и должно быть оптимально. Прежде чем приступить к развитию этих положений, тщательно сфор¬ мулируем задачу управления, которую собираемся рассматривать. Будем считать, что наша система имеет вид * (0 = f [X (/), и (/), /], t С (Л, Г2), (5.672) где область допустимых управлений U есть множество всех ограниченных кусочно-непрерывных функций и (/) на (7\, Т2): яля любого t из (7\, Т2), (5.673) где Q — заданное подмножество из Rm и u(t—) = u(t) для любого t из (Т19 Т2). (5.674) Примем, что L (х, и, f) —действительная функция на Rn X RfnX X (7"і, Т2) и R (х, t) = 0. Таким образом, функционал J имеет вид tx J(u)= u(f), t]dt. (5.675) to Будем считать, что множество цели S cz Rn X (ТТ2) и все предполо¬ жения § 5.12 остаются в силе. Выше, при определении задачи управления, фиксировались начальное время и начальное состояние. Теперь мы опре¬ делим семейство задач управления, рассматривая область X из Rn х (T lt Т2), содержащую S и считая, что начальная пара (х0, t0) принадлежит к X. Иначе говоря, мы имеем дело со следующей постановкой задачи: 1 Дополнительные сведения, связанные с проблемой достаточных условий, можно найти в работах [40], [43], [45], [131], [145], [148] и [164], где эта задача рассматри¬ вается с различных точек зрения. 316
Пусть X — заданная область из Rn X (Т19 Т2), содержащая S. Для каждого элемента (лг0, t0) из X необходимо найти управление и (х0, /о) из переводящее (х0, /0) в S и минимизирующее при этом функционал G J(x0, t0, и) — f L[x(t), u(t), t]dt. (5.676) /о Так как нас прежде всего интересует поведение J (лг0, и) как функ¬ ции xQ и /о, то будем часто опускать индекс 0 и просто писать G J (х, t, и) = Jl[a:(t), а(т), т]гіт. (5.677) t Причины этого станут ясны, когда мы в последующих параграфах получим достаточные условия. 5.19. УРАВНЕНИЕ ДЛЯ ФУНКЦИОНАЛА Найдем уравнение, описывающее поведение функционала вдоль опти¬ мальной траектории, в предположении, что этот функционал достаточно гладок. Для начала предположим, что (лг0, tQ) —данная исходная пара и и — допустимое управление, переводящее (х0, /о) в область S. Как обычно, обозначим через х (t) траекторию уравнения (5.672), исходящую из xQ и произведенную управлением и. Предположим также, что tx — первый момент времени после /0, когда X (/) встречает S. Если t Ç Uo, то управление и переведет в S точку (х (/), t) в силу переходного свойства дина¬ мических систем (рис. 5.37), и (5.678) поэтому ti J[x(t), t, и\ = Jà[x(t), а(т), x]dx t есть вполне определенное число для t из [/0, Если считать, что J (х, /) — непрерывно дифференцируемая функ¬ ция, определенная на области £ с X (7\, Т2) (см. рис. 5.37), удов¬ летворяющая условиям: 1. (х (/), t) œ 2 Для t из І^о, (5.679) 2. J [х(/), і] = J ïx(t), t, и] для t из По, /Д, (5.680) то можно получить для t из По, /х) следующую зависимость: [-(/)( а х(/)\ /] = (5.681) = Л, /1*(0> « (0, '1/ /]. (5.682) 317
Из выражений (5.678) и (5.682) имеем — L[x(t), u(t), = t],f[x(t), u(t\ t\y + ^[x{t\ /] (5.683) или, эквивалентно, t\ + L{x{t), u(t), /], f[x(t), u(t). /Г> = 0. (5.684) Но гамильтониан задачи имеет вид Н (х, р, и, t) = L(x, и, t) + (р, /(х, и, /)). (5.685) Поэтому для t из [/о, имеем [Л- (/),/] + H x(t),^{x(t), t\, u(t), t = 0. (5.686) Во-первых, заметим, что такая функция J (х, t) может и не существо¬ вать. Во-вторых, если и можно найти J(х, /), то нет гарантии, что функция времени [х (/), d — градиент J (х, /), вычисленный в точке (х (/), /), есть дополнительный вектор, соответствующий u(t) и х(0. Иначе говоря, мы не знаем, действительно ли существует зависимость x(t),-^-[x(t), /], «(/), t . d J dJ t~ ... дН dt jdx — dx (5.687) Более того, нам даже неизвестно, справедливо ли равенство J (х, t) = = J (х, /, и) для точек (х, f) в£, не принадлежащих заданной траектории. Таким образом, при установлении достаточных условий нам следует сде¬ лать предположения, которые позволят устранить эти затруднения. До сих пор мы рассматривали управление а, переводящее (х0, /0) в обратимся теперь к оптимальному управлению и*. Иначе говоря, пред¬ положим, что существует оптимальное управление и*, переводящее (х0, /о) в 5. Как обычно, обозначим через х* (/) соответствующую опти¬ мальную траекторию. Убедимся, что управление будет оптимально для любой точки X* (t) на оптимальной траектории (сравните с § 5.16). Мы знаем, что и* переведет (х* (/), 0 в S, и поэтому наше утверждение состоит в следующем: «/[х* (/), /, а*] < J[x*(0, Л и} (5.688) для всех допустимых а. Если это не так, то тогда существовало бы допу¬ стимое управление а, переводящее (х* (/), t) в S, причем J[x*(/), /, и}< J[x*(Z), /, а*]. Следовательно, допустимое управление f«*(T), Т £ I/o, (5.689) H; (5.690) переводило бы (x0, t0) в S, причем имело бы J(x0, /о, ul)<J(xQ, t0, место неравенство «*). (5.691) 318
Так как последнее неравенство противоречит оптимальности а*, то утверждение (5.688) доказано. По сути дела, мы получили следующий принцип, который часто называют принципом оптимальности х. Принцип оптимальности [20]. Если и*—оптимальное управление и л:* (/), t Q По, G) —оптимальная траектория, соответствующая и*, то участок и*, ограниченный подынтервалом [/, интервала [/0, /х], есть оптимальное управление для начальной пары (х* (/), /). Упражнение 5.22. Докажите более общую формулировку принципа оптимальности. Если —оптимальное управление и х* (/), [/0, tr ]—оптимальная траектория, соответствующая а*, то и часть а* на любом подынтервале [т0, тг] из [/0, /И (т. е. то <С ті ^і) является оптимальным управлением для начальной пары (х* (т0), т0) и области S (х(тг), тг). Эвристически этот вариант принципа оптимальности часто форму¬ лируют следующим образом: «Части оптимальной траектории оптимальны». Указа¬ ние: см. § 5.16, пункт 2. Пусть (x, t) — элемент области X, содержащей S (см. § 5.18). Обо¬ значим минимум (наибольшую нижнюю границу) функционала J (x, t, и) через J* (x, t): J*(x, t) = min J (x, t, я), (5.692) uÇ,U где U — множество допустимых управлений. Предположим также: 1) (x* (/), t) С X для t С I/o. Mi (5-693) 2) J* (x, t) непрерывно дифференцируема на X. (5.694) В силу оптимальности я* можно заключить, что Ç \х* (t), t] + H [x* (t), [x* (t), П. «* (0, /] = 0 (5 695) для t из [/о, Таким образом, при предположениях 1 и 2 уравне¬ ние (5.695) является дополнительным необходимым условием оптималь¬ ности. Упражнение 5.23. Покажите, что если J* (x, t) имеет непрерывные частные произ¬ водные второго порядка и удовлетворяет уравнению d+#[x,^(x. 0. «*(0. <] =0 (5.696) dJ* на всей области X, то функция р (t) — [х* (/), /] есть дополнительный вектор, соот¬ ветствующий #*(/) и х* (/). Указание: продифференцируйте выражение (5.695) по х. 5.20. ДОСТАТОЧНОЕ УСЛОВИЕ ОПТИМАЛЬНОСТИ Получим основное достаточное условие оптимальности. Сначала докажем следующую лемму Каратеодори (см. [40] и [112]). Лемма 5.3. Предположим, что для каждой точки (x, t) из X функция L (х, о, t) имеет, как функция со, нуль своим единственным абсолютным минимумом по отношению ко всем œ из Q при со = а°(лг, t). Иначе говоря, предположим, что 0 = L [x, (х, /), t] < L (х, о, 0 (5.697) для всех со из Q, со =£ a0 (x, t). Пусть и — допустимое управление, причем а) и переводит (лг0, /0) в 5; 1 Сравните с результатами § 5.16, пункт 2. 319
б) если х (t) — траектория, соответствующая и (t), то (х(/),/)£Х (5.698) для t из [^0, /Д; в) и удовлетворяет соотношению u(f) = и°[х(/), /] (5.699) для t из [/0, /х). Тогда и будет оптимальным управлением по отношению к множеству управлений и, производящих траектории, которые целиком располо¬ жены в X, и величина J lx(f), t, и] равна нулю для t из [/0, Л): J [х (t), t, и] = 0, t£ [Л, Л). (5.700) Другими словами, если и1 — управление, переводящее (х0, to) в 5 такое, что (х1 (t), t) £ X, где х1 (t)—траектория, соответствующая и1, то 0 = «/ (Хо, /о, w) J (х0, /о, ДО1). (5.701) Доказательство. В силу свойств (а)—(в) управления « имеем J(xe, t0, и) =J L [х(0, »°[х(/)], t\dt, (5.702) и поэтому из соотношения (5.697) следует /(лг0, ^о, ») = 0. (5.703) Если и1 — любое другое допустимое управление, переводящее (х0, /0) в S такое, что траектория х1 (/), произведенная а1, целиком лежит r Y ( ( а а с y ™ J (Хо, to, и1) =J L [хЧО, ^0 «>(/), t]dt^ (5.704)1 ^2 > J 7 [х1 (/), и» [X (Z), t}, /] dt > (5.705) ^0 = J(x0, /о, «), (5.706) и лемма доказана. Сделаем следующее замечание. Управление и согласно лемме может не быть оптимальным, так как управ¬ ление и2, переводящее (х0, /0) в 5 Рис. 5.38. Траектория (х2 (/),/) не лежит целиком в X, но встречает область S и может оказаться «дешевле» траектории £ (0, 0 вдоль траектории, не лежит целиком в X, как это показано на рис. 5.38. Функция L (х, и, t) нашей задачи может не удовлетворятьусловиям леммы, однако при определенных допущениях относительно гамильтониана можно заменить L (х, и, t) функцией L (х, и, /), которая наверняка удовлетво¬ ряет условиям леммы и таким образом позволяет получить искомые до¬ статочные условия. Сформулируем некоторые определения. 1 Отметим, что момент времени /2, когда (х1 (/), t) встречает S, не обязательно дол¬ жен совпадать с tx. 320
Определение 5.12. Пусть Н (х, р, и, t) —гамильтониан нашей задачи: H (х. р, и. t) L (х, иу t) + (р, /(х, и, /)). (5.707) Если для каждой точки (х, /) из X функция H (х, р, œ, t) имеет,как функция о), единственный абсолютный минимум по отношению ко всем œ из Q при м и (хУ р, t), то говорят, что функция Н нормальна по отно¬ шению к X или задача управления нормальна по отношению к X. В этом случае функцию и (х, р, t) будем называть //-минимальным управлением относительно X. Иначе говоря, и (х, р, t) есть //-минимальное управление относи¬ тельно X, если для каждой пары (х, t) из X Н |х, р, а(х, р, /), /] < Н |х, р, со, Ц (5.708) для всех со Ф и (х, р, /) из Q. Определение 5.13. Если Н нормальна по отношению к X и и (х, р, 0 есть //-минимальное управление по отношению к X, то будем называть дифференциальное уравнение в частных производных ^(х. t) - н[х, ^(Х, t), »(х,(х, /), /), -- О (5.709) с граничным условием е7(х, /) — 0 для (X, f)(S (5.710) уравнением Гамильтона—Якоби задачи по отношению к X. Теорема 5.12. Предположим, что Н нормально по отношению к X и что и (X, р, /) — //-минимальное управление по отношению к X. Пустьа(/) —допустимое управление, причем: а) #(/) переводит (х0, ^0) в S; б) если х(/) —траектория, соответствующая #(/), то (х(0, t)CX (5.711) для t из [/0, /j 1; в) существует решение уравнения Гамильтона—Якоби (5.709), удов¬ летворяющее граничному условию (5.710), причём «(() = « (х(/),|х(/), /], /) (5.712) для t из Uo, /,]. « Тогда и есть оптимальное управление по отношению к множеству управлений и, производящих траектории, целиком расположенные в X, причем J[x(Z), /, и] - J[x(/), /], / /J. (5.713) Иначе говоря, если и1— управление, переводящее (х0, /0) в 5 таким образом, что (х1 (/), t) ^Х (где х1 (/) — траектория, соответствующая и1), то J(*о, М = J(*0, /0, и) < </(х0, /0> я1)- (5.714) Доказательство: Рассмотрим функцию L (х, и, /), определенную как £(х, », t) = (X, t) -b H [х, (X, t), и, . (5.715) И Ата нс 2025 321
Покажем, что L удовлетворяет условиям леммы 5.3. Для доказатель¬ ства, во-первых, отметим, что L р, п (х, ^х, t), z), z] = = 4г(х> Z) + tf[x,-g(x, Z), «(x-g(x, Z), z), z] = (5.716) =0, (5.717) так как J есть решение уравнения Гамильтона—Якоби. Во-вторых, H [х, (X, Z), и (х, £ (X, t), t),t]<H [х, (X, Z), со, z] , (5.718) если <о =^= я (х,(х, Z), , так как Н нормально и «есть Я-мини- мальное управление. Следовательно, О = L [х, и (х, -^-(х, Z), /),/]<£(X, <0, t), (5.719) если ®¥=«(х,-|^(х, t), Использование леммы позволяет получить G j£[x(Z), u(t), t]dt = 0 (5.720) /о и G J L [X1 (Z), и1 (t), Z) dt = 0, (5.721) где я1 —другое управление, переводящее (х0, /о)в S таким образом, что (х1 (Z), Z) Однако L (X, я, t) = (X, t) + H [х, (X, Z), я, t ] = (5.722) = -g-(x, Z) + L(x, я, /) + /|£(х, Z),/(x, я, /)\. (5.723) Следовательно, £[х(0, «(Z), t} = L[x(t), Û(t), t] + -^j[x(t), t] (5 724) и L [X1 (Z), я1 (Z), Z] = L [X1 (Z), H1 (Z), Z] + -Jp [X1 (Z), Z] (5.725) [сравните с уравнением (5.715)1. Интегрируя два последних выражения, получим g G tx XX J L [X (Z), я (Z), Z] dt = J L [X (t), и (t), Z] dt + J |x (Z), Z] dt = (5.726) ^0 t0 tn = j(xo, Zo, «) —J(xu, Zo) -t- J[X(Z(), ZJ (5.727) 322
и j L |x* (Z), и1 (t), t]dt—'^L (X1 (t), u1 (Z), Z] dt + J ~ [х’ (Z), Z] dt = (5.728) ^0 ^0 io =J(x0, t0, u1)—J(x0, t0) + J [X1 (Z2), Z2], (5.729) Однако мы знаем, что {х (ZJ, t-ù Q S и (х1 (Z2), G) S; следова¬ тельно, на основании предположения в) и уравнений (5.727), (5.729), (5.724) и (5.725) получим J (х0, Zo, «) — J (х0, /0) = 0 (5.730) и J(x0. Zo, и1) — J(xa, /„):== 0 (5.731) доказана. Рис. 5.39. Если J удовлетворяет уравне¬ ниям (5.709) и (5.710) для X и S, то J и для справед- удовлетворяет этим уравнениям и Sx (обратное может не быть ливо) Если, Таким образом, теорема Отметим, что эта теорема представляет собой локальное достаточное условие оптимальности, в котором все утверждения сделаны лишь отно¬ сительно области X. Как показано на рис. 5.39, если Sx есть подмноже¬ ство S, содержащее (х (tj, /г), и — подобласть из X такая, что Si cz X X и (х (/), t) Ç X1 для t из [/0, ], то управление и будет опти¬ мальным для задачи с областью Sx по отношению к множеству управле¬ ний и, производящих траектории, целиком лежащие в X, так как функ¬ ция J (х, t) удовлетворяет уравне¬ нию Гамильтона—Якоби на Хх и граничному условию J (х, t) = 0 для (х, 0 6 Si- Иначе говоря, огра¬ ничения J не меняют того обстоятель¬ ства, что J удовлетворяет уравнению Гамильтона—Якоби, однако, расширить область X, скажем, до области Х2, то нет гаран¬ тии, что решение уравнения Гамильтона—Якоби на Х2 существует. Далее, если даже существует решение на Х2, то это решение может не быть продолжением/. Если область X есть Rn X (Tlf Т2), где (Tlt Т2) — область определения системы, то теорема дает глобальное достаточное условие оптимальности. Теорема 5.13. Предположим, что X = Rn X (Т19 Т2), Н нормальна относительно Rn X (Тъ Т2) и и (х, р, f) есть //-минимальное управле¬ ние относительно Rn X (Tlf Т2). Пусть и (0 — допустимое управление, причем а) и переводит (х0, /0) в S; б) существует решение J (х, t) уравнения Гамильтона—Якоби (5.709), удовлетворяющее граничному условию (5.710): »(/) = a(x(Z),-|^ [x(t), t}, z) (5.732) ДЛЯ t ИЗ [/0, 1 (х(/), t) автоматически является элементом Rn X (Tlf Т^. 323
Тогда и есть оптимальное управление и J[x(/). t, u\—-J\x(t), /], t Г:[/o, /il- (5.733) Мы обсудим эти достаточные условия в следующем параграфе, а в последующих главах книги будут рассмотрены примеры их применения. 5.21. НЕКОТОРЫЕ ЗАМЕЧАНИЯ ОТНОСИТЕЛЬНО ДОСТАТОЧНЫХ УСЛОВИЙ Рассмотрим достаточные условия, полученные в предыдущем пара¬ графе. Прежде всего заметим, что с достаточными условиями связаны два основных положения: 1. Нормальность относительно X. 2. Использование дифференциального уравнения в частных производ¬ ных Гамильтона—Якоби для оценки функционала. Предположение относительно нормальности в действительности уси¬ ливает необходимое условие 2 принципа минимума, а уравнение Гамиль- Рис. 5.40. «Заполнение» области «подхо- тона—Якоби представляет собой тре¬ бование к поведению функционала. Так как нормальность понимается сравнительно легко, сконцентрируем внимание на уравнении Гамиль¬ тона—Якоби. Отметим, что уравнение Гамиль¬ тона—Якоби, являющееся уравне¬ нием в частных производных, в ряде случаев довольно трудно решить (а иногда это и невозможно). Кон- дящими» траекториями кретное решение может представлять собой лишь функционал вдоль данной траектории, а не на всей области X. По этой причине, как мы увидим в дальнейших главах, уравнение Гамильтона—Якоби чаще всего исполь¬ зуется для проверки оптимальности управления, полученного при помощи принципа минимума. Мы уже отмечали, что теорема 5.12 представляет собой локальное достаточное условие, в котором все утверждения делаются относительно области X. При доказательстве мы полагали, что область X была задана априорно. На практике нам обычно задана начальная пара (х0, /0)- Попы¬ таемся подобрать подходящую область X, в которой можно применить эту теорему. В частности, если и (х, р, t) есть //-минимальное упра¬ вление и нам известны или оптимальный функционал J* (х, t) на области, или соответствующее выражение р* (х, /) для дополнительного вектора, то мы стараемся найти область X относительно (х0, /0), «заполненную» траекториями, произведенными управлениями и такими, что вдоль х(/) имеем »(/) - а(х(/), /Ь /) или и(х(/), р*[х(/), /], Z). (5.734) Типичный случай показан на рис. 5.40. Часто Н оказывается нормальным относительно Rn X (Т1У Т2), но глобального решения уравнения Гамильтона—Якоби найти нельзя. В таком положении иногда можно найти разделенные области Хь Х2, . . 324
. . Xt и решения J J 2, . . J, уравнения Гамильтона — Якоби такие, что J Х2 U U Xr = Rn X (7\, Т2), и достаточные условия при¬ менимы в каждой области X,. Этот процесс «сшивания» подходящих областей Х( часто приводит к глобальному доказательству оптимально¬ сти (см., например, § 7.2). Однако обычно мы должны сначала решить задачу определения области X. Поэтому эта процедура по сути дела является проверкой оптимальности управления, полученного при помощи принципа минимума. Проинтерпретируем геометрически полученные нами результаты. Во-первых, если функционал J (х, t, и) гладкий, то уравнение Л «(01 + н [х« (О. 77 \хи (/), «(/)], »(/), /] = О (5.735) описывает поведение J вдоль траектории хи (t) данной системы [см. (5.686) Г Таким образом, независимо от того, какое управление и при¬ водит к области S, функционал должен удовлетворять уравнению (5.735). Представим себе,1 что (х, /) — оптимальная поверхность функ¬ ционала и — оптимальное управление. Тогда наша оптимальная траектория (в /?п+1) определяет кривую /* (т) = J* [х* (т), т], лежащую на поверхности J* (х, /). Убедимся, что «направление» (т. е. касательный вектор) этой кривой /* (т) соответствует направлению наибыстрейшего убывания, совместному с ограничениями (т. е. дифференциальными урав¬ нениями движения и области Q). Иначе говоря, в точке (х* (т), т) можно определить «конус» касательных векторов: и вектор (х^-(т), 1) представляет собой направление наискорейшего убы¬ вания У* [х(/), t \ 2. Это означает, что dJ* ■ * / \ Ха* (т) — ~^\Х* (т), т] (5.736) для всех « £ й, так как п + 1-мерный вектор W* [X* (т), т| = Г-гН* 1 Г4 \х* (г), г] J (5.737) есть градиент J* в точке (х* (т), т) и направлен в сторону наискорейшего возрастания, противоположную направлению наискорейшего убывания. Из выражения (5.736) и определения гамильтониана можно получить необходимое условие: [а/* 1 г я і* 1 х* ,х* (т)> Ч. «* СО, tJ <// (т), [х* (т), т|, «, т] (5.738) для всех и из й. 1 К сожалению, хорошая геометрическая фигура должна быть четырехмерной, так как для изображения пространства состояния нужна по крайней мере плоскость, одна ось — для времени и одна — для функционала. 2 Как связан этот «конус» с конусом достижимости, введенным в § 5.16? 325
Таким образом, достаточные условия состоят из следующих требо¬ ваний: 1) в заданной области должно существовать единственное направле¬ ние наискорейшего убывания, совместимое с ограничениями вдоль опти¬ мальной поверхности «Л*; 2) кривая на поверхности J*, произведенная управлением, относи¬ тельно которого мы хотим доказать, что оно оптимально, всегда напра¬ влена в сторону наискорейшего убывания. Если эти требования удовлетворяются, то данное управление опти¬ мально. Более детальное изложение этих положений со ссылкой на задачу об оптимальном быстродействии содержится в § 6.7.
ГЛАВА 6 СТРУКТУРА И СВОЙСТВА ОПТИМАЛЬНЫХ СИСТЕМ 6.1. ВВЕДЕНИЕ В гл. 5 мы рассмотрели задачу оптимального управления для общего сличая уравнений системы, ограничений, функционалов и области S. Полученные результаты — это необходимые условия оптимальности, ос¬ нованные на весьма сильном принципе минимума. Содержание предыдущих четырех глав можно трактовать следующим образом: гл. 2 и 3 содержат математический аппарат, необходимый для формулирования, понимания и решения задач детерминированных систем; гл. 4 посвящена понятиям, определениям и свойствам динамических систем; гл. 5 содержит классические и современные вариационные методы, являющиеся основой теории оптимальных процессов. Цель оставшейся части книги — приложить эту теорию к проектированию оптимальных систем и тем самым проиллюстрировать логические и вычислительные приемы, связанные с формулировкой и решением задач оптимального управления. Основное содержание настоящей главы состоит в создании перехода между теорией и конкретными задачами проектирования, ко¬ торые мы будем рассматривать в гл. 7—10. Поэтому эта глава содержит интуитивные рассуждения, аналитические результаты и геометрические понятия. В ней рассматриваются задачи оптимального управления с кон¬ кретными критериями с целью показать, как можно использовать необ¬ ходимые условия для изучения свойств оптимального управления. Теоретические результаты гл. 5 можно использовать для получения- условий, которые должны иметь место при оптимальном управлении. Однако на практике задача состоит в том, чтобы найти оптимальное управление для данной задачи. При отыскании оптимального управления мы можем использовать необходимые условия, даваемые принципом мини¬ мума для того, чтобы выделить допустимые управления, возможно явля¬ ющиеся оптимальными. Другими словами, мы начинаем с отыскания класса управлений, называемых экстремальными, удовлетворяющих всем необходимым условиям, которые дает принцип минимума. Предположим теперь, что имеется задача, для которой можно найти экстремальные управления, т. е. управления, удовлетворяющие необходимым условиям. Возникает вопрос: как отыскать оптимальное управление (или оптимальные управления) среди экстремальных? Во- первых, надо доказать, что оптимальное управление существует. Во-вто¬ рых, надо установить, является ли оптимальное управление единственным. Но даже, если оптимальное управление оказывается единственным, то из этого еще не следует единственность экстремальных управлений, 327
так как необходимые условия, даваемые принципом минимума, по своей природе являются локальными. Читатель должен понять теперь всю важность любой информации относительно единственности экстремальных управлений и любой дополнительной информации относительно конкрет¬ ных свойств экстремальных и оптимальных управлений. Цель данной главы — дать такого рода результаты по отношению к различным крите¬ риям оптимальности. Для более простого и наглядного изложения наиболее важных ре¬ зультатов наши доказательства часто будут нестрогими. Данная глава распадается на четыре основные части: на задачи с минимумом по времени, с минимумом расхода топлива, с минимумом энергии и на вырожденные задачи. Задачи на минимум по времени (оптимальные по быстродействию) рассматриваются в § 6.2—6.10. В задачах на оптимальное быстродействие требуется перевести систему из начального состояния в область цели S за минимальное время. Задача на минимум расхода топлива рассматривается в § 6.11—6.16. Эта задача связана с минимизацией топлива, потребляемого для перевода системы из начального состояния в область S. При этом могут быть также заданы и ограничения на время переходного процесса. Задача на минимум энергии рассматривается в § 6.17—6.20. Задачи такого рода возникают, например, в том случае, когда управление космическим летательным аппаратом осуществляется электрическими двигателями. Ограничения по времени и в этом случае могут быть вклю¬ чены в условия задачи. В § 6.21 и 6.22 бегло рассматриваются так называемые «вырожден¬ ные» задачи. Мы определим вырожденные задачи в § 6.3 и 6.13 по отно¬ шению к задачам на оптимальное быстродействие и на минимум расхода топлива и тем самым дадим обоснование для рассмотрения материала, представленного в § 6.21 и 6.22. ЗАДАЧИ ОБ ОПТИМАЛЬНОМ БЫСТРОДЕЙСТВИИ 6.2. ФОРМУЛИРОВКА И ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ Класс задач оптимизации, для которого производится минимизация времени перехода из начального состояния в конечную область, относится к задачам, оптимальным по быстродействию. В этом параграфе точно сформулируем задачу управления, оптимального по быстродействию (задача 6.1а), которую рассмотрим на конкретном физическом примере. Большую часть этого параграфа посвятим обсуждению задачи с геометри¬ ческой точки зрения. Покажем, что оптимальная по быстродействию за¬ дача, по сути дела, сводится к отысканию: 1) первого момента времени, в который область достижимых состоя¬ ний встречает область S; 2) управления, которое это осуществляет. Теорию гл. 5 в этом параграфе мы не будем использовать; это будет сделано лишь в § 6.3. Задача 6.1а. Задача перехвата, оптимального по времени. Дана дина¬ мическая система с состоянием х(/), выходом у (/) и управлением а(/), определенная уравнениями лг(0-/[х(0, і] + В[х(Л Л#(0; у (0 = А [лг(/)]. (6.1) (6.2) 328
Предположим, что X (t) — ^-мерный вектор; y(t) — fti-мерный вектор; u(t) —r-мерный вектор и что ft г т > 0. (6.3) (6.4) Таким образом,/есть ft-мерная вектор-функция, В lx, t] — матрица- функция размера п X г и h есть /п-мерная вектор-функция. Будем счи¬ тать, что компоненты вектора управления u(t) ограничены по величине неравенствами I и, (/) I С т;, / -- 1 2 . . . , г. (6.5) Пусть г (/) — вектор с т компонентами. Условимся называть z(t) желаемым выходом. Пусть еЦ) - у(0 —г(/) — вектор ошибки. Пусть t0 — начальное время и лг(/0) — начальное состояние динами¬ ческой системы. Требуется найти управление, которое: 1) удовлетворяет ограничениям (6.5); 2) управляет системой таким образом, что в конечный момент времени е(Т)С-_Е. (6.6) где Е — некоторое заданное подмно¬ жество из Rni; 3) минимизирует время пере¬ хода Т — t0. Объясним неотмеченные особен¬ ности этой задачи при помощи сле¬ дующего примера. Пример 6.1. Предположим, что ракетой А необходимо управлять таким образом, чтобы уничтожить ракету В, как показано на рис. 6.1. Предположим, что в начальный момент времени t — t0 положение ракеты В есть z (/0) и ее траектория z(t) известна для *(ь вектор z (0 имеет три компоненты, определяющие положение ракеты В в про¬ странстве. Пусть у (/0) — положение ракеты А при t — /(). Ракету А несет самолет, и при t — tQ ракета выпускается для перехвата ракеты В. Уравнения движения ракеты А имеют вид (6.1) и (6.2), где выходу (/) есть вектор, изобража¬ ющий положение ракеты А. Состояние ракеты Рис. 6.1. Задача перехвата ракеты В ракетой А X (t) характеризуется ее положением, скоростью, количеством топлива, углом атаки и т. д. Управление и (t) обеспечивается системой управления, которая может использоваться для наведения ракеты, например, положением аэродинамических управляющих плоскостей (рулей) и величиной тяги. Ограничения на величину тяги и на положение рулей (из-за меха¬ нических упоров) имеют вид (6.5). Вектор ошибки е (t) = у (t) — z (t) есть просто разность между положениями ракеты А и ракеты В. Задача состоит в наведении ракеты А таким образом, чтобы она приблизилась к ракете В за минимально возможное время. Под словом «приблизилась» понимается, например, достаточно малая величина нормы ошибки е (Т) в конечный момент времени: е\ +el(T)sz(>, (6.7) где Ô мало. Это требование аналогично условию (6.6), где Е — множество, определенное как Е = [е (Г) : е'І (Г) + е\ (Г) + % (T) ôj. 329
Обсудим теперь задачу 6.1а примера 6.1. Мы покажем, что требова¬ ния к вектору ошибки можно преобразовать в требования к фазовым координатам, так как система, описываемая уравнениями (6.1) и (6.2), полностью наблюдаема х. Прежде всего требование е (T) Q Е можно заменить требованием к у ( t). Из У(0 e(t) е(Т)^Е следует У (Л С Г, (6.8) где Y — множество, определенное соотношением; Y = {у(Ту.у(Т) е(Т) z(T)\ e(t)QE], (6.9) Таким образом, Y зависит от Е и г(Т), и, следовательно, Y одно¬ значно определяется Е и z (Т). Мы хотим получить соотношение вида х (T) £- S, где S — область в пространстве состояний, соответствующая соотношению (6.8). Так как у (/) = h lx (/)] [уравнение (6.2)], при t = Т имеем y(T)==h[x(T)]. (6.10) Уравнение (6.10) единственным образом определяет у (Т) через х (Т). Для того чтобы единственным образом определить область S через мно¬ жество У, необходимо иметь взаимно-однозначное соответствие между состоянием х (t) и выходом у (t). Утверждение у (t) = h [лгх (/)] = = h lx2 (01 Для всех / должно означать, что х± (/) = х2 (t) &ля всех t. Если динамическая система, описываемая уравнениями (6.1) и (6.2), полностью наблюдаема, то каждому у (Т) соответствует единственное состояние 2 X (Т). Следовательно, область S в пространстве состояний можно определить соотношением S = (х(Т):3’(П = Л[х(Т)]; y(T)£Y}. (6.11) Следующая лемма суммирует эти результаты. Лемма 6.1. Рассмотрим задачу 6.1а. Заданы z (t), Т и область Е. Если система, описываемая уравнениями (6.1) и (6.2), полностью наблю¬ даема, то условие е (T) £ Е эквивалентно условию x(T)ÇS, (6.12) где S — вполне определенная область в пространстве состояний, опре¬ деленная как 5= {x(T):A[x(T)l = e(T) + ^(T); е(Т)^Е\. (6.13) Проиллюстрируем эти понятия следующим примером. Пример 6.2 Предположим, что xr (t) и х2 (/) — компоненты вектора состояния и у (t) = (t) + х2 (0 — выход полностью наблюдаемой динамической системы. Пусть z (/) — е~1 2 — желаемый выход; е (t) = у (/) — z (t) и Е {е (Т) : | е (Т) | 1}. Область S тогда определяется как S={(Xl(T}, х2(Т))-.\Х1(Т)+х2(Т)-е-т\^\}. (6.14) Область S есть функция времени Т. Область S показана на рис. 6.2, а для Т = 0,290 и на рис. 6.2, б для Т = 0,695. Оставшаяся часть параграфа посвящена геометрической интерпре¬ тации задачи нахождения управления, оптимального по времени, в виде движущихся со временем областей в пространстве состояний. Для того 1 См. § 4.15. 2 См. теорему 4.6. Действительно, если /с1 (У) есть обратный образ У, то справед¬ ливо: X £ Æ-1 (У) и у £ У. 330
чтобы зафиксировать эти положения и терминологию, дадим следующие определения: Определение 6.1. Область ограничений определяется как й = {u(t) : I Uj(t) I < mh / = 1, 2,. . г}. (6.15) й есть подмножество (параллелепипед) в г-мерном пространстве перемен¬ ных управления. Записывая и (/) £ й, мы подразумеваем, что в момент времени t компоненты вектора управления и (/) удовлетворяют неравен¬ ству I Uj (t) I < mf. Пусть Ио, T] —замкнутый интервал времени. Рассмотрим множе¬ ство управляющих функций п (см. § 4.4) таких, для которых в любой момент времени t из [Zo, Т] справедливо соотношение и (/) = U\tOt rj С Рис. 6.2. а) Область цели S, определяемая уравнением (6.14) при Т — 0,290. б) Область цели S при Т — 0,695 Определение 6.2. Область допустимых управляющих функций UT определяется как UT = {Щі0. Л : U[t0, T\(t)Q Й для любого /£ [/0, 71]}. (6.16) Множество UT есть подмножество функционального пространства $([/о, T’L Rr) Ігде I/o, 74, Rr) есть множество всех кусочно-непрерыв¬ ных функций из [/0, Т] в Rr (см. § 3.15)1. Таким образом, записывая подразумевают, что U[t0, т\ есть управляющая функция, которая в каждый момент времени удовлетворяет наложенным ограни¬ чениям [в частном случае — вида (6.4)]. Предположим теперь, что мы проводим следующий эксперимент. Имеем систему = t] ¥B[x(t), t] (6.17) которая в начальный момент времени t0 находится в состоянии х (/0). Приложим к системе управление ир0, т] Ç UT и рассмотрим поведение вектора состояния х (/) для / из 1/0, Т]. Вся траектория состояния х^ г] будет зависеть от начального времени /0, начального состояния х (/0) и прикладываемого управления Запишем: *[t0, л = x[to, г](х(/0), tOi U[t<H rj). (6.18) Тогда вектор состояния х (t) для некоторого t £ [/0, Т] будет равен ^(0 = Г] (/) = Ф [лг(/0\ t. (6.19) Если мы испробуем каждый элемент из то получим множество фазовых траекторий Х[г0, г]. Это приводит к следующему определению. 331
Определение 6.3 1. Под множеством достижимых состояний (в момент времени /) будем понимать подмножество At пространства состояний, определенное как А [/; /0; х('о); U Д z замкнута и ограничена для Рис. 6.3. Области достижимых состояний при возрастании t в случае движущейся области цели Точка х* (Г4) является первой общей точкой Аі и S/ = \х : существует r\cUT такое, что соответствующее решение х (/) системы (6.19), исходящее из х (/0)> есть х (t) = (6.20) 2 Границу А г обозначим через дА(. Предположим теперь, что область достижимых состояний At обладает свойствами: любых (6.21) т е. А; компактна); 2. Если t1 и t2 — произволь¬ ные моменты времени и t0 < t. < /2, (6.22) то имеет место соотношение вклю¬ чения (х(/0)} (=Д^с=Л/2. (6.23) Уравнения (6.22) и (6.23) означают, что множество дости¬ жимых состояний «растет» с уве¬ личением времени (рис. 6.3). Множества Лт\, Ат2, . . где /о < Л < Л < Т3 < Л < Л, обозначим своими границами 3 *. Мы объяснили ранее, что тре¬ бования к ошибке системы экви¬ валентны требованию достижения фазовой траекторией области S. Область S есть подмножество про¬ странства состояний и может за¬ висеть от времени. Чтобы подчеркнуть ее зависимость от времени, будем писать Sz. Пусть dSf обозначает границу St. Предположим, что область St замкнута. На рис. 6.3 показано движение области цели \ с увеличением времени; пунктирные кривые обозначают границы dSTi, dSr2, dST^ . . . областей цели ST1, S?2, St3, . . где t0 < 7\ < T2 С Т3 < Т4 С 7\. При внимательном рассмотрении рис. 6.3 становится понятной сущность управления, оптимального по быстродействию. При этом выяв¬ ляется следующее: 1. Области At и S, не имеют общих элементов для t < Т4 или точнее ЛП5/ - 0 для t [z0, Л), (6.24) где 0 — пустое множество и t' [/0, 7\] означает, что /0 < < Л- 2. При t Т4 области Ат4 и St4 имеют единственную общую точку (обозначенную х* (Т4) на рис. 6.3). 1 См. также § 4.20. 2 Это определение справедливо также для любой системы вида х=/ [х (/), И (0. Ч и любой области допустимых управлений Ut- 3 Для того, чтобы вычислить границу дАт множества Ат, мы должны приложить к системе (6.17) все элементы Ut- 332
3. Для / > T4 множество A, A St содержит более одного элемента пространства состояний. Так как область Ат4 есть множество достижимых состояний при Т4, производимых элементами Ut4, то существует допустимое управление w*Uo. TJ 1 t/r4, (6.25) производящее единственную траекторию TJ (6.26) такую, что **По, т4](^о) = х(/0); 1 *^,т4](Л) = х*(Л)-і } Единственность траектории следует из единственности решения системы дифференциальных уравнений. Далее, из рис. 6.3 нетрудно видеть, что состояние х* (74) принадлежит как границе Ат4, так и границе Sr4, т. е. x*(7\)C<W4; х* (Т4)С dSr4\ х*(Ті) - дАт4 A dSTe , (6.28) откуда следует: траектория х*р0, т\і оптимальна по быстродействию для начального состояния х (Zo) и области цели St; управление а*-/0, rj, производящее х*[/0. т\], оптимально по быстро¬ действию; время перехода Т4 — /0 ость минимально возможное время перехода. Такие геометрические интерпретации являются удобным инструмен¬ том, помогающим понять природу задачи управления, оптимального по быстродействию. Сведем эти важные результаты в следующую теорему. Теорема 6.1. Пусть Ut — множество допустимых управляющих функ¬ ций аро, /],* At обозначает множество достижимых состояний в момент вре¬ мени t и St—движущаяся область. Предположим, что области At и St замкнуты и ограничены для любого t t0; если 7\ и Т2 — два произвольных момента времени таких, что /0 < < 7\ < Т2, то \х (/о)) cz Ат, с Ат2- Пусть Qz обозначает подмножество пространства состояний, определенное как тогда: 1. Если Qt = 0 для всех t /( (6.29) (6.30) то управления, оптимального по быстродействию, не существует. Поэтому данная задача не имеет решения. 2. Если существует момент времени Т* такой, что Qt=0 для всех t-[t^ Т*]; Q^0, (6'31) то задача управления имеет решение и Т* есть минимальное время. В предыдущей теореме мы предполагали, что области At и St зам¬ кнуты для всех t tQ. Покажем, что если одна из областей At или St не является замкнутой, то решения задачи об оптимальном быстродействии может не существовать. Предположим, область At открыта; тогда возможен случай, когда состояние х* (Т4) не принадлежит Лг4. Таким образом, хотя соотношение дАт4(]д8т4 -x*(TJ (6.32) 333
имеет место, но Лг4А5г4-0. (6.33) Пусть е — бесконечно малое положительное число. Рассмотрим множество Qr4+e, определяемое соотношением Фт4+е = Лт\+е П^Т^Ч-е* (6.34) Как показано на рис. 6.3, множество Qr4+e не является пустым. Это означает, что можно найти управления, переводящие состояние х (/0) в область Sti на что требуется время Т4 + е, где 8 — сколь угодно мало (но не равно нулю). Можно найти управления, для которых время Т4 + е сколь угодно близко к Т4, но никогда не равно ему в точности ввиду урав¬ нения (6.33). Таким образом, хотя оптимального управления и не суще¬ ствует, тем не менее можно найти так называемые 8-оптимальные решения, вполне удовлетворительные с инженерной точки зрения. Однако в случае 8-оптимальных управлений нельзя использовать теорию гл. 5 потому, что все необходимые условия были получены для оптимальных, а не 8-опти¬ мальных управлений. Читатель должен представлять себе трудности, возникающие при попытке решить задачу управления, оптимального по быстродействию «в лоб», путем расчета областей достижимых состояний и попыток геоме¬ трически отыскать первую точку контакта At и SL. Эта задача почти нераз¬ решима, если размерность пространства состояний больше трех. В сле¬ дующем параграфе мы покажем, как использование принципа минимума сводит задачу, оптимальную по быстродействию, к решению системы дифференциальных уравнений с граничными условиями. В общем случае такое решение найти очень трудно, но это проще, чем вычисление обла¬ стей At. Упражнение 6.1. Дана система х (/) = и (t) с начальным состоянием х (0). Пусть I и (/) I 1 для всех t и z (t) — t2. Требуется найти управление и (/) такое, чтобы х (Т) — = z (Т) и Т было минимальным. Найдите множество начальных состояний {х (0)}, для которого решения не существует, и определите оптимальное по быстродействию управление для начального состоя¬ ния X (0) = 2. 6.3. ПРИМЕНЕНИЕ ПРИНЦИПА МИНИМУМА В предыдущем параграфе мы показали, что требования к ошибке (или выходу) наблюдаемой динамической системы могут быть выражены в форме области Stf движущейся в пространстве состояний. Была также выяснена геометрическая природа задачи об оптимальном быстродействии и отме¬ чены трудности, возникающие при ее решении прямым методом. В этом параграфе мы используем принцип минимума Понтрягина для того, чтобы развить систематический подход к решению задач об опти¬ мальном быстродействии. Ниже в первый раз на протяжении книги будет подробно показано использование принципа минимума и его резуль¬ таты. При необходимости будем повторять некоторые результаты, чтобы читатель оценил значение необходимых условий для решения оптималь¬ ных задач. Переформулируем задачу 6.1а таким образом, чтобы можно было использовать теорему 5.9 (принцип минимума для задач, зависящих от времени, с подвижной областью Sz). Затем представим результаты в виде трех последовательных шагов. При первом шаге мы сформулируем необ¬ ходимые условия так, как они используются в постановке задачи 6.16. При втором шаге получим соотношение между оптимальным управлением, оптимальной траекторией и соответствующим дополнительным вектором. Мы также определим понятия нормальной и вырожденной задач об опти¬ мальном быстродействии. При третьем шаге рассмотрим порядок, которому 334
надо следовать для определения управления (управлений), оптимального по быстродействию. Сформулируем точную постановку задачи об оптимальном быстродей¬ ствии. Задача 6.16. Управление, оптимальное по быстродействию, для подвижной области Sf, Дана система г = A [*(0. Л + 2 bit\x{t\ t\ /=і і = 1, 2, . . ., п или, эквивалентно, в векторной форме х (/) = f [х (Z), t]-t В \х (/), /] и (/). (6.35) Предположим 1) lx (/), t] и Ьц lx (/), /] непрерывны относительно х (/) и Z; о dfjx (/),/] dbu\x(t),t\ dbij[x(t)tt] UÛTinûnï_TT3ULÎ ™ 2) —d^t~ ’ di ’ ~дх^Г 9 di непрерывны no X (/) и t для i, k = 1, 2, . . ., n и / = 1, 2, . . r. Предположим далее, что компоненты u1 (/), и2 (t), . . ., ur (t) огра¬ ничены по величине соотношением I (t) I С 1, / = 1, 2, . . ., г для любого /Ï или, более компактно, I (6.36) а (0 6^. J Заданная гладкая область S определена соотношениями 1 2 ga [х, И = 0, а = 1, 2, ..., п — р; р 1 или, эквивалентно, г п (6.37) g\x, t] = О есть п — P-мерный вектор с компонентами ga. Будем считать, что 1) £а[х, П, , -dggнепрерывны по х и 2) векторы (градиенты) AL линейно независимы для всех (х, /) С S. Пусть t0 — заданный начальный момент времени и х (/0) — заданное начальное состояние системы (6.35). Функционал определен в виде т J (и) = j dt = T — /0, (6.38) где T — свободно. Найти такое управление а(/), чтобы оно: I. Удовлетворяло ограничениям (6.36). II. Переводило х (/0) системы (6.31) в область S. III. Минимизировало функционал J (и) [см. (6.38)]. Сделаем несколько замечаний по этой задаче: 1. Предположения относительно непрерывности приняты такими же, как и в § 5.12 для общей задачи управления. 2. Ограничения (6.36) отличаются от ограничений (6.5). Так как коэффициенты п хг матрицы В [х (/), I* (0, небыли специально 1 См. § 5.12. 2 Область типа 2, г из § 5.12. 335
оговорены, то в них можно включить постоянные из соотношения (6.5), не утрачивая при этом общности. Например, система уравнений МО - /| + Ь'ц |x(Z), t] и' (/), /=і (6.39) где (6.40) позволяет найти новые управляющие переменные и} (0, удовлетворяющие ограничениям (6.41) и новые коэффициенты Ьи- Іх (0, /], если положить, что Ьц(0 = Ь'ц (х (/), t]mh (6 42) и получить систему (6.35). Область ограничений, определяемая уравне¬ нием (6.36), есть единичный гиперкуб в г-мерном пространстве. 3. В общем случае функционал, который надо минимизировать, имеет вид т J («) J L[x (/), и (/), t] dt. (6.43) to Для задач на оптимальное быстродействие мы полагаем Л|х(/), а (/), t] = 1, (6.44) чтобы получить J (и) вида (6.34). Так как /0 известно и надо мини¬ мизировать величину Т — t0, то Т должно быть свободно. Отметим, что функция L lx (t), и (0, ПИ удовлетворяет всем требованиям непре¬ рывности и дифференцируемости § 5.12. Гамильтониан для системы (6.35) и функционала (6.38) Н Іх (0, р (0, и (0, /] в матричной форме имеет вид # [X (/), р (/), и (/), /] - 1 + {р (/), f [X (/), t] -j- В [X (/), t] и (/)) - - 1 i- (р (Z), /1* (О, Л/ + {р (0, в [X (t), Z] и (t)) = -= 1 + {f ІХ (Z), t], р (Z)) + (и (t), В' [X (Z), t] p (Z)), (6.45) где p (Z)— дополнительный вектор. В записи через компоненты векторов гамильтониан можно представить в виде H Н [л (t), р (t), и (t), Z] = = 1 ! S |Х (Z), Z] Pi (t) + S «. (Z) I £ bis [X (Z), Z] Pi (Z)! . (6.46) z = l u = l J Предположим, что a* (0 — управление, оптимальное по быстродей¬ ствию \ X* (0 — оптимальная траектория и Т* — минимальное время. По определению оптимальные величины должны удовлетворять условиям / = 1,2,..., г; (6.47) x*(Z0) = x(Z0); (6.48) X*(7’*)CS. (6.49) 1 Далее мы часто будем использовать слово «оптимальный» вместо «оптимальный по быстродействию». 336
Уравнение (6.49) в силу соотношений (6.37) означает, что g|x*(7*), 7*| - 0. (6.50) Рассмотрим теперь задачу об оптимальном быстродействии после¬ довательно по шагам. Содержание шага 1 состоит в изменении формулировки положений теоремы 5.9 применительно к задаче 6.16. Шаг 1. Утверждение 1 теоремы 5.9 предполагает, что существует (оптимальный) дополнительный вектор р* (/), соответствующий опти¬ мальному управлению я* (/) и оптимальной траектории х* (/). Существо¬ вание р* (/) есть необходимое условие. Нужно также, чтобы компоненты х* (/) и р* (/), k ■= 1, 2, . . ., п удовлетворяли каноническим уравнениям дН [X* (/), р* (/), и* (/), і\ (0 dH \x* (t), p'iz (t), u*(t), t\ âx* (t) (6.51) для k = 1, 2, . . ., n. Однако из выражения (6.46) имеем H [х* (t), р* (t), a* (0, t\ - - 1 + È fi [** (0. d A* (0 + S u* (4) { S Ьц |x* (r). /] p* (/)!, (6.52) 4=1 /=1 J и поэтому канонические уравнения имеют вид Xk (/) = fk [х* (о> d + S bkj [х* (/), /] р* (t) (6.53) /=і Pk (/) = == - У { w - У У ’ <б-54) ( dxk (P) J ( dxk U) J 4=1 / —1 ( = 1 k 1, 2, . . ., п Необходимо также Ісм. выражение (5.433)], чтобы Xk Со) = xk (4). (6.55) Замечание 6.1. Дифференциальное уравнение, полученное для р* (О, линейно относительно р* (/). Следовательно, если р* (/) удовлетворяет дифференциальному уравнению (6.54), то ему удовлетворяет и вектор Ср* (7), где С — произвольная постоянная. Утверждение 2 теоремы 5.9 состоит в следующем: /7|х*(/), р* (/), а*(/), /] = min Н [х* (/), р* (Г), »(/), /] (6.56) и (Z)é для ^ |70, 7* ] или, эквивалентно, /]</7[х*(/), р*(/), tt(/), Л (6.57) для всех и (t) Ç Q и [/0, 7*]. Из выражения (6.52) получим, что условие (6.57) сводится к неравенству 1 + s fi С** (о. d р* (о + Éu* (ois bu (x* (o, d p* (o| < 4 = 1 /=1 U = 1 J < 1 + È fi[x* (0> d Pi (0 + È “i (0 ! Ê bij |x* (/), d A* (/)! • (6.58) 4 = 1 / = 1 6=1 J 337
Так как первые члены с обеих сторон неравенства одинаковы, имеем È «* (/) ( È blt [лг* (/), t\ P* (/)) < È «/(/)( È Ьц [ж* (/), /] Р* (/)! (6.59) /=1 и=1 J =1 u=l J для всех и (О Ç Q и [Zo, Г* ]. В шаге 2 мы увидим, насколько важным является соотношение (6.59). Замечание 6.2. Если р* (t) удовлетворяет (6.59), то и вектор Ср* (t) удовлетворяет этому уравнению (С — произвольная постоянная). Утверждение 3 теоремы 5.9 [см. выражение (5.435) ] состоит в сле¬ дующем п — Н Я[х*(7*), 7*| = У еа^а|х^Г)' = а= 1 (6.60) где е есть п — p-мерный вектор с компонентами еъ е2і . . ., еп 3. Из вы¬ ражений (6.60) и (6.52) имеем 1 + у Ц/(7*), 7*] д*(7*) + і = 1 Г ( П Ï — jj + У У 7*]р*(7*) =у e?-ga|XX),r>l- (6-61) /=1 7 а=1 Замечание 6.3. Если область S не зависит от времени (т. е., если область цели является стационарной в пространстве состояний), то = a_L2 (6.62) и поэтому уравнение (6.61) принимает вид 1 + ÈA [лг* (7*), 7*]р*(7*) + t=l + t и* (7*) { S 6,- [х* (7*), Т*] р* (7*)1 = 0. (6.63) /=1 и=1 ) Замечание 6.4. Если р* (Т*) удовлетворяет уравнениям (6.61) или (6.63), то вектор Ср* (7*), где С — произвольная постоянная, не удов¬ летворяет уравнениям (6.61) или (6.63). Это противоречит замечаниям 6.1 и 6.3. Утверждение 4 теоремы 5.9 состоит в том, что вектор р* (Т*) дол¬ жен быть нормален к области S при t = Т*. Область S при t = Т* определена при помощи п — р уравнений: Й(Х, 7*) = 0; p„..B(x, 7*) = 0. Обозначим через hx(x, T*), h2(x, 7*), . . ., йп_3(л:, Т*) градиенты (векторы; каждый имеет п компонент): ha[x, 7*] = dga^x а = 1, 2, . . ., n —р. (6.65) 338
Необходимо, чтобы вектор р* (7*) был некоторой линейной комбина¬ цией этих векторов в точке х* (Т*). Иначе говоря, должно выполняться соотношение р*(Т*) = S kaha[x*(T*), Т*], (6.66) а = 1 где klt k2, . . ., — произвольные постоянные. Замечание 6.5. Если р* (Т*) удовлетворяет соотношению (6.66), то это относится также и к вектору Ср* (7"*), где С — постоянная, так как выражение (6.66) определяет направление вектора, а не его величину. Этим завершается получение необходимых условий для задачи 6.16. Напомним, что все сделанные утверждения имеют следующий вид: если и* (0 — оптимальное управление и л* (0 — оптимальное состояние, то необходимо, чтобы существовал вектор р* (0, удовлетворяющий урав¬ нениям (6.51)—(6.66). Шаг 2. Получим из неравенства (6.59) уравнение, которое связы¬ вает и* (0 с X* (0 и р* (0 для t - [/0, Т*]. Далее «исключим» оптималь¬ ное управление из всех уравнений. Определим функции <у* (0, <у* (0, . . ., <у* (0 при помощи уравнений <7/* (О = £ Ьіі [/ (/), /] а* (0. І = 1. 2, • • Г (6.67) 4 = 1 или эквивалентного им векторного выражения (0 = В' [лг* (0, /]р*(0, (6.68) где q* (0 — г-мерный вектор. Таким образом, вектор q* (t) получается при помощи линейного пре¬ образования (матрица которого есть В' [лг* (0, Л) из вектора р* (0. При использовании функций <у* (0 уравнение (6.59) запишется в виде £< (W(/)< (6.69) /=1 /=1 для всех \ tij (0| < 1, / = 1, 2, . . ., г и любого [/0, T* ]. Уравнение (6.69) означает, что функция ф[«(/)]= £«/(0?*(0 (6.70) /=1 достигает абсолютного минимума при (/) = «*(/). (6.71) При этом справедливо соотношение min ср [#(/)]= min SMO?/*(O=SI min MO?/* (Or (6.72) и(0ей a(t)GQ/=l /=1 J Замечание 6.6. Можно поменять местами min и знак £, так как функции (0, и2 (0, . . ., иг (0 ограничены независимо друг о,т друга. Иначе говоря, если, например, (0 = +1, то и2 (0, . . ., и (0 могут принимать любые значения, удовлетворяющие ограничениям по ве¬ личине. Заметим, что min (/)} = — \q* (4)|. (6.73) l«;(O |<1 339
Управление и* (/) будет минимизировать функцию Uj (f)q* (/). Сле¬ довательно, в силу условия (6.73) управления и* (/) должны быть функ¬ циями qj (/) вида: иі (0 + h если q* (/)< 0; и* (/) = — h если q* (t) > 0; ■ w* (/) неопределенно, если q* (t) = 0 (6.74) Для более компактной записи выражения (6.74) можно использовать функцию sign х: «* (0 = — sign {<7* (/)} = — Sign Ibl, [x* (/), /| рГ (0| (6-75) для / = 1, 2, . . ., г и / Г i/0, 7* ]. Уравнение (6.75) связывает компоненты оптимального по быстродей¬ ствию управления и* (t) с состоянием х* (/) и дополнительным векто¬ ром р* (/). Если р* (/) таково, что выражение (6.75) удовлетворяется, то это уравнение справедливо и для любого вектора ср* (/), где с > 0, так как sign {cj = +1. Уравнение (6.75) означает, что ut (t) есть вполне определенная функ¬ ция х* (t), р* (/) и /, если аргумент функции sign не равен нулю. Однако при q* (t) = 0 величину и* (/) из уравнения 6.75 определить нельзя. Выделим теперь два случая: первый назовем нормальным, а вто¬ рой — вырожденным. Определение 6.4. Нормальная задача об оптимальном быстродействии. Предположим, что на интервале [/0, 71* ] имеется счетное множество точек /1у, /2у, /Зу, . . ., tyi Г I/o, Т*\, у - 1, 2, 3, . . .; / - 1, 2, . . ., г (6.76) таких, что <7,*(0 — S Ьіі [х* (/), /] А*(0 = Z— 1 (0 в том и только в том случае, если / = ѵ/ (6.77) (не равна нулю во всех других случаях. В этом случае задачу об оптимальном быстродействии будем называть нормальной. На рис. 6.4 показана функция q* (/) и соответствующее и* (t), найден¬ ное по уравнению (6.75). Функция q* (/) равна нулю только в изолиро¬ ванные моменты времени, и поэтому управление, оптимальное по бы¬ стродействию, есть кусочно-постоянная функция с простыми скачками. Если все функции q* (/) имеют такие же свойства, то задача управления будет нормальной. Обычно говорят, что управление и? (/) «переключается» при / = ZY/ и что число переключений и* (/) равно наибольшему числу yj 1 Функция знака, записываемая как sign { }, определяется следующим образом. Пусть а = sign [b], тогда ее можно представить в следующем виде: а — + 1, если b > 0 а = — 1, если b < 0 а неопределенно, если b - 0. t Заметим, что sign [ab] — sign {a} sign {b}. 340
(или сю). Управление и? (/), показанное на рис. 6.4, переключается 4 раза. Следовательно, число переключений равно четырем. Определение 6.5. Вырожденная задача об оптимальном быстродей¬ ствии. Предположим, на интервале [Го, Т*\ есть один (или более) подынтервал [7\, Т2], из [/0, Т* ] такой, что <?,*(/) = S М** (0. *] Р* (П = 0 для всех tÇ\Tx, TJ,. <6.78) £ —1 Такую задачу называют вырожденной, а интервал |7\, T2\f (или ин¬ тервалы) — интервалом вырожденности. Рис. 6.4. Функция (/), дающая вполне определенное управление и- (t) Функция^* (/), показанная на рис. 6.5, равна нулюдля всех /из [7\, Т2] и поэтому соответствует вырожденной задаче. Таким образом, в случае вы¬ рожденной задачи существует по крайней мере один подынтервал времени, {п ) S Ьц |х* (/), /] рГ (/) ( не определяет оптимального управления как функции от х* (/) и р* (/). Рис. 6.5. Показанная на рисунке функция q* (/) соот¬ ветствует вырожденной задаче об оптимальном по быстро¬ действию управлении Последнее утверждение не означает, что оптимальное по быстродействию управление не существует или не может быть определено. Оно лишь означает, что необходимое условие //[**(/), р*(/), #*(/), /| С//[лг*(П, Р*(0, и(/)> /] не дает определенного соотношения между и* (/), х* (/), р* (/), /. Мы будем рассматривать вырожденные задачи в конце настоящей главы. 341
Рассмотрим нормальную задачу об оптимальном быстродействии. В этом случае уравнение (6.75) можно подставить в уравнения (6.52)— (6.54), (6.56)—(6.58), (6.60)—(6.61) и тем самым исключить и* (/) из всех необходимых условий. Поэтому все необходимые условия, сформулиро¬ ванные через и* (/), в шаге 1 сведутся к необходимым условиям, не зави¬ сящим от и* (/). Как мы увидим в шаге 3, это обстоятельство позволит нам найти управление, оптимальное по быстродействию. Сформулируем две теоремы, в которых подытожим эти идеи. Теорема 6.2. Релейный принцип. Пусть и* (t) — оптимальное по быстродействию управление для задачи 6.16, а х* (/) и р* (/) — соответ¬ ствующие ему фазовая траектория и дополнительный вектор. Если задача нормальная, то компоненты и* (t), и* (/), . . ., и* (t) управления а* (/) должны определяться соотношениями и* (/) = — sign IS bu [лг* (/), /] р* (Of / = 1, 2, . . ., г (6.79) и=і ) для Ио, 71* ] х. Уравнение (6.79) можно записать более компактно: а*(/) = — SIGN {</* (Г)} = - — SIGN {В' [X (/), t\p* (/)). (6.80)2 Таким образом, если задача нормальная, то компоненты управления, оптимального по быстродействию, есть кусочно-постоянные (или релейные) функции времени. Предлагаем читателю при помощи прямой подстановки доказать сле¬ дующую теорему. Теорема 6.3. Упрощенные необходимые условия. Пусть (/) — опти¬ мальное по быстродействию управление для задачи 6.16, х* (t)—со¬ стояние на оптимальной по быстродействию траектории и р* (/) — соот¬ ветствующий дополнительный вектор. Пусть 7* — минимальное время. Если задача нормальная, то необходимо, чтобы: а) удовлетворялась теорема 6.2; б) состояние л:* (/) и дополнительный вектор р* (/) удовлетворяли упрощенным каноническим уравнениям = fk [х* (t), /] — £ bé/ [x* (t), /] sign IS t>u [x* (t), P* (/)) (6-81) /=1 U=1 J pi w - - ₽<• «+ dxk w P* (0 (6.82) для k = 1, 2, . . n и tÇ [t0, T*]; в) гамильтониан (6.52) вдоль оптимальной траектории определялся уравнением н [ж* (о, р* (о, «* (/), = 1 + £ fi [** (о> d р* (о- (/). t\ Pi {t) T*]; (6.83) 1 За исключением счетного множества моментов переключения ZY/-. 2 Векторная функция SIGN { } определяется следующим образом: пусть аг, а2, . . ., . . аг — компоненты вектора а и Ьг, Ь2 Ьг — компоненты Ь\ тогда а = SIGN {&} может быть представлено в виде = sign \bj}9 /= 1, 2, . . ., г. 342
г) в конечный момент времени 7* выполнялось соотношение [см. выражение (6.61)] 1+ £М**(Г*)( Т*]р*(т*)- £ 2 ôt/[лг* (Т*), Т*]р*('Г*) = і=1 /=1 і=\ п—р = 2 е° aga[x*a^-:)’-—; (6.84) а=1 д) в начальный момент времени /0 х*(/0) = x(t0), (6.85) в конечный момент времени Т* ga[x* (T*), Т*] = О, а = 1, 2, . . п —₽; ₽^1; (6.86) P* (T*) = . (6.87) а=1 Дадим геометрическую интерпретацию теоремы 6.3. Предположим, что п = 3 и г = 2. Как показано на рис. 6.6, матрица размера 2x3 В' Іх* (/), /] связана с преобразованием, отображающим 3-мерный век- Рис. 6.6. Геометрическая управление а* (/) должно интерпретация того обстоятельства, что минимизировать скалярное произведение < и (/), <7* (/) > тор р* (/) в 2-мерный вектор q* (/) = В' Lr* (/), t] р* (/). Для того чтобы минимизировать скалярное произведение (а* (/), q* (t)), вектор управления и* (/) должен иметь максимальную величину и быть напра¬ влен, грубо говоря, противоположно вектору q* (/). Так, если q* (t) находится в первом квадранте, то вектор и* (t) должен «упираться» в угол А квадрата ограничений. Если q* (t) во втором квадранте, то «* (/) должен быть направлен в угол В и т. д. Необходимые упрощенные условия, даваемые теоремами 6.2 и 6.3, приводят к симметричному методу нахождения оптимального по быстро¬ действию управления. Это будет подробно рассмотрено в шаге 3. Сейчас мы хотим напомнить читателю, что теоремы 6.2 и 6.3 связывают опти¬ мальные величины и представляют собой необходимые условия. Если для данного управления и (t) и соответствующей траектории не выпол¬ няется любое из необходимых условий, то из этого следует, что и (t) не является оптимальным по быстродействию управлением. Следующий пример иллюстрирует результаты теорехМ 6.2 и 6.3 для конкретной системы. 343
Пример 6.3. Рассмотрим динамическую систему с фазовыми координатами jq (/), х2 (0» хз (О и управляющими функциями иА (t) и w2 (/), описываемую уравнениями *1 (/) = — х2 (0 + X, (/) и, (t); Х.2 (0 = х{ (/) - tx2 (t) 4- U2 (/); хз (0 = — <2%і (О — хз (О- Предположим, что управляющие функции их (t) и и2 (t) ограничены по величине неравенствами I «1(01^1; I «2 (01^1. Будем считать, что в начальный момент времени /0 — 0 система находится в состоянии Х1(0) = — 1; х2 (0) = — 1; Хз(0) = 10 Предположим, что область S описывается уравнениями gi U1, х2, х3, 0 = х3 =0; ё2 (Хр Х2, Х3, == X2 + х2 — і2 — 1 = 0. Последнее уравнение показывает, что область S есть расширяющаяся окружность в плоскости xtx2 с радиусом j/V2 4~ 1. Задача состоит в отыскании оптимального по быстродействию управления, переводя¬ щего систему из начального состояния (—1, —1, 10) в область S. Мы не знаем, суще¬ ствует ли оптимальное по быстродействию управление, а если существует, то является ли оно единственным. Будем считать, что это решение существует и оно единственно. Кроме того, исследуемая задача нормальна, и поэтому мы можем рассматривать необходимые условия. Гамильтониан данной задачи равен: н = н к, (о, 2 (0- хз (о> Pi (t), Рг (о. Рз (о, “і (о. «2 (о. а = = 1 — Х2 (0 Р1 (0 + Xj (0 Uj (t) P1 (t) + Xj (0 p2 (t) — /x.| (t) P-, (t) + + «2 (z) P2 (о — (0 Рз (0 — хз (О Рз (z)- Упрощенные необходимые условия определяются следующим образом: Из соотношения (6.79) имеем “і* (z) = — sign [х* (о); «*(0 =-signer (П); из уравнения (6.81) имеем xf (/) = -х* (t)-x* (/) sign {х* (Opf (*)}; X* (t) = X* (/) — tx*2 (t) — sign (p* (О}; x* (0 = - (O - < (o; из выражения (6.82) имеем рГ (0 = + Pl* (t) sign (х* (Пр* ~р* (t) + з/2х*2(/)р* (0; Р* (О = +рГ (Л + 2/х* (t)P* (ty, p* (0 - -1- p* <z>- Из уравнения (6.84) находим, что для минимального времени Т* 1 -Х.Г (Т*)р* (7-*)-|х* (Т*)рГ (Т*)| -|-xf (Г*)р* (7-*)- -Г*х2*2(Г*)рГ (Г*)-|р.; (Г*).-7-*-х*3 (7-*)/>* (7'*)-х* (7*)р3* (Г*) = -- t^o 4 е22Т^, где е2 — некоторая постоянная. В начальный момент времени /0 = 0 имеем х* (0) — —1; х* (0)^—1 и х£ (0) 10. Для минимального времени Т* должно быть X*2 (Г*)+х*2(т*) — Т’*2 — 1 =0; х3*(7'*)=о 344
и [по соотношению (6.87)] р* (Г*) (т*); Р* (г*) = kfi -.-k.^x* (т*); pf (T-") ; GO. где /?! и /г.» — некоторые постоянные. Шаг 3. В шагах 1 и 2 мы установили соотношения, которые должны выполняться для оптимального по быстродействию управления и* (/), состояния х* (/), соответствующего р* (/), и минимального времени Т*. Однако задача состоит в том, чтобы найти оптимальное по быстродействию управление, и поэтому возникает вопрос: как можно при помощи всех этих теорем отыскать оптимальное по быстродействию управление для задачи 6.16? Ответ на этот вопрос будет дан ниже. При этом каждый шаг нашего рассуждения будет озаглавлен, что даст возможность читателю проследить логическую связь между ними. Шаг За. Формирование гамильтониана. Начнем с того, что сформи¬ руем гамильтониан р (/), и (t), t\ для системы х (/) =f [х (/), О + t + В Іх (/), /] и (t) и функционала J (и) \ \ dt. Гамильтониан с по¬ мощью выражений (6.45) и (6.46) записывается в виде //[х(/),р(/), «(/), /]^ I - (/[x(/), ZI, р(о: + (»(/), В' [х(/)> /|р(/)), (6.88) где подчеркивается, что х (/), р (/), « (0—векторы, представляющие собой функции от времени. На этом шаге мы не накладываем ограничений ни на значения векторов x(f)t p(t), и (/), ни на величину t. Шаг 36. Минимизация гамильтониана. Гамильтониан Н [лег (/), р (/), а(/), t\ зависит от 2п + г + 1 переменных. Предположим, что мы за¬ фиксировали лг(/), р (/) и / и рассматриваем поведение гамильтониана (который теперь является только функцией и, так как лг(/), р(/) и t постоянны) при изменении и (t) в области ограничений Q. В частности, мы хотим найти управление, при котором гамильтониан имеет абсолютный минимум. Поэтому определим //-минимальное управление следующим образом. Определение 6.6. //-минимальное управление. Допустимое управле¬ ние (/) называется //-минимальным, если оно удэвлетворяет соотно¬ шению //[*(/), р(/)> я°(/), /] < //[лг(О, Р(0> «(О, Л (6.89) для всех и (/) Q и всех х (/), р (/) и t. Ранее было установлено, что //-минимальное управление «() (/) для гамильтониана типа (6.88) определяется уравнением (/) = — sign Ьц[х(і), /] A (Oj , (6-90) j - 1.2, или в векторной форме ао(/) = — SIGN jB'[x(/), (6.91) Подставим //-минимальное управление «“(/) в выражение (6.83): /] = 1 + {f[x(t), /],/>(/))- - (SIGN [В' [х (j), t]p(t)}, B'[x(t), t]p(t)). (6.92) 345
Следовательно, n н [X (/), Р (/), «о (/), t] = 1 + s fl I* (0. Л Рі (О - Z=1 г п - S S ь„ [X (/), /] Рі (/) . /—1 Z—1 (6.93) Правая часть выражения (6.93) является функцией только от х (t) и p(f). Определим функцию /7° lx (t), р (/), t] при помощи соотношения 77° [*(/), р (/), /] = min H[x(t\ p(f), u(t)t t]. (6.94) и (Oc Q Еще раз напомним читателю, что эти определения и уравнения не связаны явно с траекториями и оптимальными величинами. Шаг Зв. Ограничение х (t) и р (t). Потребуем, чтобы (пока еще не¬ определенные) векторы X (0 и р (/) удовлетворяли дифференциальным уравнениям х(/) = (6.95) п р (<М] (6 96) или, эквивалентно, дифференциальным уравнениям хк (0 = îk (()> H — É bkj [X (/), /] sign ! S btj [X (Z), t] Pi (/) /=1 ll=l i=l 4 ’ n гл ( dbg |x (Q, /] L I dxk (t) для k = 1, 2 n. Отметим, что дН° [x (t), p (t), ;] = dH [x (t), p(t), u(t), /] I dp(t) — dp (t) |n(/)=u°(Z) и ОТ0 [X (Q, p (Q, /] _ dH [x (t), p(t), u(t), ;] I dx(t) ~ dx(t) |u(0=u°(0 (6.97) (6.98) (6.99) (6.100) Шаг Зг. «Опыт». Нашей целью является отыскание оптимального по быстродействию управления и* (/), переводящего систему х (t) = = flx (t), t\ + B[x (/), /] и (t) из заданного начального состояния х (/0) в область S. Примем, что данная задача нормальна (см. определение 6.4). Промоделируем уравнения (6.97) и (6.98) на аналоговой вычислительной машине. В известный начальный момент времени t0 мы используем при¬ нятые нами начальные значения фазовых координат в качестве начальных условий системы уравнений (6.97). В качестве начальных значений функ¬ ций Рі (t0)f р2 (/0), . . ., рп (t0) будем использовать некоторые предпо¬ лагаемые величины. Пусть q} (/), / = 1,2,. . г — функции, определенные соотношениями п ЪЬи[х((), І=1 (6.101) 346
Предположим, что Ç/(^o)=£O Д^я всех / = 1, 2, . . г. (6.102) Уравнения (6.102), (6.101) и (6.90) означают, что числа «° (М = — Sign {<7/Со)) равны +1 или —1. Таким образом, решения уравнений (6.97) и (6.98) вполне определены, по крайней мере для 7, близкого к t0. Обозначим решения уравнений (6.97) и (6.98) через x{t) = x[t, t0, х(/о), Р(/о)1; 1 p(f) = p[t, t0,x(t0),p(tb)], ] ’ чтобы подчеркнуть их зависимость от известного начального состояния х (to) и предполагаемого начального значения р (70). «Опыт» состоит в следующем. Измеряя сигналы х (t) и р (/), в каждый момент времени получим и зарегистрируем сигналы <7/(0= £^/|х(0. ЛР.(О, 7 = 1.2, .... г; (6.104) І=1 ?,.(/), </;(/), ^(/),.. ., / = 1,2, г; (6.105) #°|х(0, р(7), /] = 1 + £ /,|х(0. /]?,(/) - £ |<7;(/)Г, (6.106) І=1 /=1 £а[-*(0. t], а = 1, 2, . . ., и —P; (6.107) dga I* ОТ. а = J 2, . . ., п - 0; (6.108) Ла|Х(0, 0 = а= 1, 2, . . ., п-0. (6.109) Используя конкретное (выбранное наугад) значение р (to), последо¬ вательно для каждого момента времени t из некоторого интервала [70, Т]9 зададимся следующими вопросами: Вопрос 1. Если (t) = 0, то qj (t) =/= 0? Если q, (t) = 0, то qf (t) 0? (и так далее). Если ответ на первый вопрос положительный, (т. е. «да»), то мы задаем второй вопрос. Если ответ отрицательный (т. е. «нет»), то мы изменяем величину р (t0) и повторяем снова первый вопрос. Вопрос 2. Если ответ на первый вопрос «да», то существует ли время Т, для которого удовлетворяются соотношения ga\x(T), Т] — Q (6.110) для всех а = 1, 2, . . ., п — р? Если ответ на второй вопрос «нет», мы изменяем р (t0) и начинаем все сначала. Если ответ «да», то задаем третий вопрос. Вопрос 3. Если ответ на второй вопрос «да», то существуют ли постоян¬ ные elt е2, . • ., такие, что удовлетворяется соотношение п-а Н°\х(Т), р (Т), /] = еа dga ‘У ? (6.111) а=1 Если ответ «нет», то надо изменить р (t0) и начать все сначала. Если ответ «да», то переходим к вопросу 4. 347
Вопрос 4. Если ответ на третий вопрос «да», то существуют ли постоян¬ ные kY, k2, . . kn_ü такие, что удовлетворяется соотношение <6.112) а= 1 Если ответ «нет», то надо изменить р (/0) и начать все сначала. Если ответ «да», то это означает, что мы нашли р (t0) такое, при котором ответы на все вопросы 1—4 положительны. В этом случае мы запоминаем при¬ нятое р (/0) и начинаем эксперимент сначала, пока не найдем все векторы р (Zo), для которых ответы на вопросы 1—4 положительны. Логическая последовательность вопросов показана на рис. 6.7. Рис. 6.7. Логическая диаграмма «опыта», которую можно использовать для отыскания оптимального по быстродействию управления Шаг Зд. Возможные управления, оптимальные по быстродействию. Формализируем результаты «опыта», проделанного в шаге Зг. Грубо го¬ воря, мы определили множество $0, являющееся множеством начальных значений р (/0), соответствующих заданному х(/0) и обладающее тем свойством, что ответы на все вопросы 1—4 будут положитель¬ ными (т. е. «да»). Ясно, что s$0 есть подпространство /г-мерного простран¬ ства Rn. Можно представлять себе как «выход» логического процесса, изображенного на рис. 6.7. Более точно s$0 определяется следующим образом. Определение 6.7. Пусть ~ область начальных состояний допол- нительной переменной р (/0), обладающая свойствами: 1) для каждого p(t0): Шэ соответствующие решения уравнений (6.97) и (6.98), обозна¬ ченные через лг(/) = х[/, /0, *(/0), Р (Ш р (П = р [Л /о, Х(/О), (6.113) удовлетворяют соотношению 9/(0 =" 12 ьи = 0, / = 1, 2, . . ., г (6.114) і=і 348
лишь на счетном множестве точек /; 2) существует время Т (зависящее от X (/0) и р (/0)), такое, что можно найти постоянные elf е2, . . еп р и k2, . . при которых соблюдаются следующие соотношения: п Н°[х(Т), р(Т), Т] = 2 ft[x(h Т\ Рі(Т)~ і-=1 г п n — fi XX XX XX ^Ь^[х(Т), Т\ Рі(Т) -= еа -, /—1 !=--! et—1 £а[х(?ѴЛ-О, сс = 1, 2, . . , п — р; (6.115) (6.116) (6.117) и-Р а-1 д£д[х(Л> Т\ дх (Т) Советуем читателю вернуться к теореме 6.3 и сравнить соотноше¬ ния (6.115) с (6.84), (6.116) с (6.86) и (6.117) с (6.87). В силу того обстоя¬ тельства, что функции qf- (t) равны нулю лишь на счетном множестве а также аналогичности уравнений (6.97) и (6.98) с уравнениями (6.81) и (6.82) получим следующую лемму. Лемма 6.2. Каждое решение х (t) и р (t)f t- [/0, Г], производимое элементом множества $0, удовлетворяет всем упрощенным необходимым условиям теоремы 6.3. Мы показали, что //-минимальное управление (/) (см. опреде¬ ление 6.6) дается соотношением [см. соотношение (6.91)1 я°(/)-—SIGN t]p(t)] для любых X (/), р (/) И t. Для X (0 = X (/), р (t) = р (/) и t [/0, Т], находим »°(0 = «°(/) = —SIGN(B'[x(/), /]р(/)}, Т]- X (О=Д (О (6.118) P (t)—p (t) Сравнивая выражение (6.118) с (6.91) и имея в виду лемму 6.2, полу¬ чим следующую лемму. Лемма 6.3. Каждое управление uQ (/), произведенное элементом из $0, удовлетворяет необходимым условиям теоремы 6.2. Заметим, что Н [*(/), Р(0> G < Н [*(/), р(/), а(/), /] (6.119) для всех и (/) Q и t ' [/0, T |. Уясним теперь смысл лемм 6.2 и 6.3 и полезность необходимых усло¬ вий при отыскании управления, оптимального по быстродействию. Для конкретности предположим, что существуют три различных упра¬ вления, оптимальных по быстродействию, переводящих систему из задан¬ ного начального состояния х (t0) в область S. Все три управления, по определению, требуют одного и того же минимального времени Т*. Обо¬ значим эти (оптимальные по быстродействию) управления через и* (/),«*(/), «з* (/)> t < |А>, ?’*]. (6.120) 349
Если провести «опыт» шага Зг, то определим множество $0. Предпо¬ ложим, что мы можем найти [по выражению (6.118)] пять различных управлений, соответствующих элементам s$0. Обозначим эти управления через »?(/), а°2(/), (6.121) а интервалы, на которых они определены, через [/о, ЛЬ ït0) Т2], [/0, Т3], [/0, Т4], [/0, Т5] (6.122) соответственно. Можно утверждать, что три из пяти управлений (6.121) будут тождественны трем управлениям, оптимальным по быстродействию [см. (6.120)]. Опять-таки для определенности предположим: «?(/) = «Г (/), 1\ = Т*, 7'*]; «0(/)=»2*(/), Т2=Т*, /£[/(>, 70; «§(/)=»з*(/), 7’з=7'*, /0/о,7'*]. (6.123) Возникает вопрос: Каково значение управлений аЦі) и иі (/)? Эти два управления должны быть локально оптимальными по быстродействию. Так как принцип минимума есть условие локальное, то оно не может отличить локальных оптимальных управлений от глобальных. Единствен¬ ный путь определить, какие из управлений іі\ (/), . . ., #5 (0 являются глобально-оптимальными, —это измерить и сравнить времена Т19 . . ., . . Ть и, таким образом, найти, что 7; = 72 = тз 7*; Т4>Т*; (6.124) Т5> Т*. По этой причине мы и подчеркиваем, что необходимые условия дают нам лишь управления, которые могут оказаться оптимальными. В следующем параграфе обсудим полученные выше результаты. Упражнение 6.2. Рассмотрите динамическую систему из примера 6.3. Используя теоремы § 5.13 и 5.14, получите необходимые условия оптимального управления для сле¬ дующих областей цели: a) S — начало координат трехмерного пространства; гп б) S — состояние хг = 1 _1_ в) S — плоскость хг = 0; г) S —движущаяся точка, описываемая уравнениями хг =t\ х2 = t2\ а'3 — sin/; д) S — движущаяся плоскость хг = / + t2 + /3. Упражнение 6.3. Рассмотрите задачу из примера 6.3. Для этого частного случая опи¬ шите «опыт», который вы проделали бы для определения возможных управлений, опти¬ мальных по быстродействию. (Указание: воспроизведите методику шага 3). Для дан¬ ного частного вида уравнений укажите пути упрощения поиска множества $0. Упражнение 6.4. Рассмотрите задачу из примера 6.3 полагая, что управляющие функции иг (t) и и2 (t) ограничены неравенствами — 1 «г (0 + 3; — 5 <0 и2 (t) < + 2, и получите упрощенные необходимые условия. 350
6.4. ЗАМЕЧАНИЯ В предыдущем параграфе были получены необходимые условия для оптимального по быстродействию управления и разработан идеализиро¬ ванный систематический способ определения управлений, одно из которых может оказаться оптимальным по быстродействию, а также установлено (см. теорему 6.2), что если задача нормальна, то компоненты управления, оптимального по быстродействию, являются кусочно-постоянными функ¬ циями времени. Мы не получили никаких результатов для вырожденной задачи, которая будет рассмотрена в § 6.21. Так как для нормальной задачи компоненты оптимального по быстро¬ действию управления должны быть кусочно-постоянными функциями времени, то одно из необходимых условий, а именно: Н [х* (/), р* (/), и* (0, /] < Н [х* (/), р* (/), и (О, Н; tt(/)(Q позволяет ограничить поиск оптимальных управлений классом | и, (7) | = 1, / = 1, 2, . . ., г. Это, пожалуй, наиболее полезный результат, полученный из принципа минимума, в то время как остальные необходимые условия дают скорее соответствующие граничные условия и условия трансверсальности. Читатель, вероятно, заметил,1 что гамильтониан H [х (/), р (0, и (/), t] = 1 +- (/ [X (/), /], р (/)) +- + («(/), В'[х(/), /]р(/)) 1 (6.125) и дифференциальные уравнения vzM_^[x(0, P(t), u(t\ Ч. Х{)~ dp(t) • . _ dH\x{t\ p(t), a (Z), t] dx(t) (6.126) полностью определены системой и функционалом и, таким образом, не зависят от граничных условий при /0 и области S. К тому же, Я- минимальное управление и0 (/) (см. определение 6.6), определяемое урав¬ нением а°(/) = —SIGN {В'(х(0, /]р(0} (6.127) независимо (функционально) от наложенных граничных условий. Таким образом, шаги За—Зв, описанные в § 6.3, совершенно одинаковы для лю¬ бой задачи об оптимальном быстродействии. Необходимые условия для гамильтониана и дополнительной переменной в конечный момент вре¬ мени Т* вместе с заданным начальным состоянием и уравнениями об¬ ласти S дают достаточно граничных условий для решения системы 2п дифференциальных уравнений. В § 6.3 мы показали пошаговый процесс, использованный для опре¬ деления управлений я°(0, результирующих траекторий х(/) и соответ¬ ствующих дополнительных переменных р (/), удовлетворяющих всем необходимым условиям. Для того чтобы выделить эти величины, дадим следующее определение. Определение 6.8. Экстремальные переменные. Управление и° (/) назы¬ вается экстремальным, если и°(/) и соответствующие ему траектория х(/) и дополнительная переменная р (/) удовлетворяют всем необходимым условиям [т. е. уравнениям (6.113) и (6.115)—(6.119)1. Будем также назы¬ вать х(/) и р (t) экстремальными траекториями состояния и дополнитель¬ ной переменной соответственно. 1 Это показано также в табл. 5.2. 351
Как было замечено в § 6.3, в общем случае может быть много экстре¬ мальных управлений. Каждое экстремальное управление дает траекторию, которая может быть оптимальной либо локально, либо глобально \ Так как экстремальное управление удовлетворяет всем необходимым усло¬ виям, можно отметить следующее. Замечание 6.7. Если оптимальное управление а* (z) существует и единственно и нет других локальных оптимальных управлений, то суще¬ ствует только одно экстремальное управление (/), которое и является оптимальным по быстродействию, т. е. и° (/) и* (/). Ясно, что предположение об отсутствии других локально-оптималь¬ ных управлений, сделанное в замечании 6.7, превращает принцип мини¬ мума в необходимое и достаточное условие. Замечание 6.8. Если имеется только тА различных оптимальных управлений и если есть т2 управлений, оптимальных локально, но не являющихся оптимальными глобально, то всего будет + т2 экстре¬ мальных управлений. Замечание 6.9. Если глобально-оптимальное управление не суще¬ ствует и есть т2 различных локально-оптимальных управлений, то имеется т2 экстремальных управлений. Следовательно, из существования экстремальных управлений не вытекает необходимость существования глобально-оптимального упра¬ вления. Замечание 6.10. Если оптимальное по быстродействию управление существует, то его можно найти, вычислив время Ту требуемое каж¬ дым из экстремальных управлений, и выбрав управление, минимизиру¬ ющее Т. Сделанные замечания приводят к заключению, что имея дело с зада¬ чей об оптимальном по быстродействию управлении (типа задачи 6.16), мы должны знать ответы на следующие вопросы: 1) существует ли управление, оптимальное по быстродействию? 2) единственно ли оптимальное управление? 3) является ли задача нормальной? 4) не содержится ли дополнительной информации в необходимых условиях для данных системы и области S? К сожалению, для произвольных нелинейных систем и областей S ответов на эти вопросы пока еще не получено. Имеется, однако, ряд результатов для класса линейных систем. Так как этот класс систем исклю¬ чительно важен, мы посвятим ему несколько параграфов, чтобы получить дополнительные результаты, имеющие большое значение как с теоретиче¬ ской, так и с практической точек зрения. 6.5. ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 1 2 В этом параграфе мы применим результаты, полученные для задачи 6.16 к случаю линейных систем с постоянными параметрами. На протяжении всего параграфа мы будем рассматривать в качестве области S начало координат фазового пространства. Такую задачу будем называть задачей о регуляторе, оптимальном по быстродействию. К этому типу относится большинство задач, которые рассматриваются в гл. 7. 1 См. также § 5.17. Локальные оптимальные по быстродействию управления могут соответствовать точкам типа «седло» 2 [179], [142], [17], [48], [144] и [166]. 352
Порядок действий будет следующим: 1. Сначала мы сформулируем задачу 6.1 в, чтобы ясно представить себе её точную постановку. 2. После этого с помощью теоремы 6.4 мы установим необходимые условия, которым должно удовлетворять управление, оптимальное по быстродействию. 3. Далее, с помощью теоремы 6.6 мы сформулируем порядок иссле¬ дования задачи на нормальность. 4. Теорема 6.7 позволит нам обосновать единственность оптималь¬ ного по быстродействию управления в случае, когда задача об опти¬ мальном управлении является нормальной. 5. Теорема 6.8 даст нам возможность сделать очень полезные вы¬ воды относительно числа переключений оптимального по быстродей¬ ствию управления. 6. Наконец, мы докажем теорему 6.8 относительно единственности экстремальных управлений. Рассмотрим следующую частную задачу. Задача 6.1 в. Задача об оптимальном по быстродействию регуляторе для линейной системы с постоянными параметрами. Дана динамическая система х(0 - Лх(/) + Ви (Z), (6.128) где состоянис системы х (/) есть гг-мерный вектор; матрица системы А есть постоянная матрица размера пХп; матрица коэффициентов при управляющих функциях («усилений») В есть постоянная матрица размера пХг; управление и (t) есть г-мерный вектор. Считаем, что система [уравнение (6.128)] полностью управляема и компоненты (t), и2 (f), . . ., иг (/) ограничены по величине: С 1, / - 1, 2, ..., г. (6.129) В заданный начальный момент времени /0 = 0 первоначальное состоя¬ ние системы равно: л(0) = |. (6.130) Найти управление и* (/), переводящее систему из 1 в 0 за минималь¬ ное время. Обозначим через 7Х, Х2, . . ., собственные значения матрицы системы Л, а через Ьъ Ь2, • • Ьг — векторы-столбцы матрицы В'. "tip ; ь> ; U U ! (6.131) Мы приняли, что система полностью управляема С Это, естественно, означает, что управления, переводящие систему (6.128) из любого началь¬ ного состояния I и начало координат 0, существуют. Напомним, что система уравнений (6.128) полностью управляема в том и только в том случае, если матрица размера пХ (ггі) G =[В\АВ\А* 1В\ . . . (6.132) содержит n линейно-независимых векторов-столбцов. Если выход у (t) линейной системы (6.128) связан с ее состоянием х (t) и управлением и (/) соотношением У (t) — Cx(t) + Du(t), (6.133) 1 См. § 4.15 и 4,16. 12 Атанс 2025 353
то управление, переводящее состояние в 0, может быть «продолжено» таким образом, чтобы оно переводило выход в нуль, а затем удерживало его в этом состоянии. Так, при t = Т* имеем х(Т*) - 0, (6.134) тогда = Du(T*\ (6.135) Если «продолжить» управление и (/), приняв, что и(/)^0 для любых (6.136) то получим для любого />Т*. (6.137) х(/) = О Ï У (0 - о і Сформулируем теперь необходимые условия для задачи 6.1в. Прежде всего составим для нашей задачи гамильтониан: H [х (/), р (0, и (/)] = 1 + {Ах (/), р (/)) + {Ви (/), Р (0) = = 1 + (Лх(0, p{t)} + {u{t\ B'p{t)}. (6.138) Полагая, что оптимальное по быстродействию управление и* (/) существует, для получения необходимых условий можно использовать теорему 5.5. Эти необходимые условия подытоживает следующая теорема. Теорема 6.4. Необходимые условия для задачи 6.1в. Пусть а* (/) — оптимальное по быстродействию управление, переводящее начальное состояние £ в начало координат 0. Обозначим через х* (/) траекторию системы (6.128), соответствующую и* (/), исходящую из | при t0 = 0 и попадающую в начало координат 0 за минимальное время Т* (т. е. х* (0) = I, х* (Г*) = 0. В этом случае существует соответствующий дополнительный вектор р* (/) такой, что: а) л* (/) и р* (/) являются решениями канонических уравнений х.(0= Ц*(0І ; (6.139) “•|і11 =-ѵи (6.140) с граничными условиями л;*(0) = |; лг*(Т*) = 0; (6.141) б) соотношение [см. уравнения (5.400) и (6.138)1 1 + (Лх* (0, р* (/)) + («* (П, В'Р* (0) < < 1 + (Лх* (/), Р*(0) + (»(0. В'Р*(0> (6.142) выполняется для всех допустимых управлений и (/) при t Ç [0, Г*]. Уравнение (6.142), в свою очередь, дает соотношение и* (?) = —SIGN {q* (/)} = —SIGN {Bp* (/)), (6.143) где q* (t) = B'p* (t). При помощи обозначений (6.131) уравнение (6.143) можно записать в выражении через компоненты: «* (0 = —sign {qf (0) = —sign {р* (/)>}, (6.144) /= 1, 2, .... r; 354
в) для всех t Ç [О, 7*1 имеет место соотношение [см. уравнения (5.401) и (6.138)1 Н [л* (/), р* (/), а* (/)] = 1 + (Лх* (/), р* (0) + + (»*(/), В'р*(0) = 0. (6.145) В оставшейся части параграфа мы исследуем свойства оптимального по быстродействию управления (такие, как единственность) на основе необходимых условий теоремы 6.4. Рассмотрим дифференциальное уравнение относительно дополнитель¬ ной переменной р* (/): р*(/) = —Л'р*(/). (6.146) Отметим, что уравнение (6.146) однородное, с постоянными параме¬ трами, сопряжено1 с уравнением (6.139) и не зависит от х* (/) и и* (/). Необходимые условия теоремы 6.4 не содержат дополнительной информации ни относительно начального значения дополнительной пере¬ менной р* (0), ни относительно конечного значения р* (Г*). Тем не менее, мы можем установить некоторые свойства р* (t) из уравнения (6.145) при помощи следующей леммы. Лемма 6.4. Дополнительная переменная р* (/) должна быть ненуле¬ вым вектором: р*(/)¥=0 для t С [0, 7*]. (6.147) Доказательство. Предположим, что р* (/) = 0. Тогда подстановка р* (/) = 0 в уравнение (6.145) приводит к противоречию: 1 = 0, а следо¬ вательно, р*(/)У=0. Так как уравнение (6.145) должно удовлетворяться для t £ [0, 7*1, то можно получить следующие соотношения: а) t = 0, 1 + (ЛІ, р* (0)) + (а* (0), В'р* (0)) = 0; (6.148) б) t = 7*, 1 + (к* (7*), В'р* (7*)) = 0. (6.149) Мы не можем, однако, решить уравнения (6.148) и (6.149) ни для р* (0), ни для р* (7*). Условимся обозначать неизвестное ненулевое начальное значение дополнительной переменной через л: л = р* (0); л^0. (6.150)2 Решение дифференциального уравнения (6.146) тогда запишется в виде р*(/) = е-л,/л. (6.151) Если подставить выражение (6.151) в соотношения (6.143) и (6.144), то получим а* (/) = —SIGN {В'е-Л''л}, (6.152) и, следовательно, и* (0 = —sign {<?* (/)} = —sign {(&., е~А'*л)], /=1, 2, ...,r, (6.153) 1 См. § 3.25. 2 Вектор л не следует путать с числом 3,1415 ... 355
где 7* (/) {Ьр е~А'*л) / - 1, 2, .. г. (6.154) По известным векторам Ь} можно найти матрицу е~А'1 (см. § 3.23). Таким образом, если задача нормальна (см. определение 6.4), то урав¬ нение (6.153) 1 однозначно определяет и* (/) через начальное значение л. Поэтому получим необходимые и достаточные условия нормальности задачи 6.1. Начнем с нахождения условий, при которых задача 6.1в вырождена. Предположим, что существует интервал времени [7\, Т2] такой, что для некоторого / на нем удовлетворяется соотношение <?*(/)-^ \bj> e~A>tn\ —0 для любого / £ [7\, 7\]. (6.155) Следовательно, ç* (/) — 0; <?*(/) —0; 7* (Z) — 0; ... для любого t <[ТЬ Т2]. (6.156) Так как А и eAt можно менять местами, то для t £ [7\, Т2] должны удовлетворяться соотношения <7* (/) = (e~A‘bj, л) := 0; q* (t) - (Ae~Albj, л) -= (е~АІАЬ/, л) = 0; q* (t) - {A-e~Atbt, л) - (e~AtÀ2bh л) -= 0; 1 ў)""1’* (/) ^дп-Уе-АІь^ = = 0 Пусть матрица G размера пхп определяется соотношением G,= Î ! t I Л&;.| U ! 1 ! I Тогда уравнение (6.157) можно записать в виде Gje~A л 0 для любого /£[Ті, Т2] или, эквивалентно, G} (е~А'*л) 0 для любого t ^[7\, Т2]. (6.157) (6.158) (6.159) (6.160) Так как матрица е~А'1 невырожденная 2 и по лемме 6.4 л 0, то существует ненулевой вектор л (л 0) такой, что G }л = 0. (6.161) На основании этого заключаем, что матрица Gf должна быть выро¬ жденной, т. е. det Gi = 0. (6.162) 1 За исключением счетного множества моментов переключения. 2 См. § 3.20. 356
Итак, мы показали, что из уравнения (6.155) следует (6.162), но уравнение (6.155) означает, что задача вырожденная. Поэтому, если задача вырожденная, то должно выполняться уравнение (6.162). Иначе говоря, уравнение (6.162) является необходимым условием вырожден¬ ности задачи 6.1 в. Предлагаем читателю самостоятельно проверить, что уравнение (6.162) является также и достаточным условием вырожден¬ ности. Сформулируем теперь доказанную теорему. Теорема 6.5. Необходимые и достаточные условия вырожденности задачи 6.1 в. Задача об оптимальном управлении 6.1 в вырождена в том и только в том случае, если для некоторого /,/=1,2, . . ., г матрица G, = [bj\ Ab^A^bj', . . .\An~'bi\ (6.163) является вырожденной. Упражнение 6.5. Докажите достаточность условий теоремы 6.5. Указание: используйте теорему 2.3 (Кейли—Гамильтона) и то обстоятельство, что Gj не зависит от х*(0, я* (t), р* (0 и t. Используя теорему 6.5, можно получить необходимые и достаточные условия нормальности задачи 6.1в. Прежде всего, если задача не выро¬ ждена и число переключений счетно, то ясно, что задача нормальна. Если det G} 0 для всех / = 1, 2, . . ., г, то задача не вырождена. Далее, если задача не вырождена, то в силу непрерывности и дифференцируе¬ мости элементов е~АЧ можно доказать счетность множества времен переключения и получить следующую теорему. Теорема 6.6. Необходимые и достаточные условия нормальности задачи 6.1в. Задача об оптимальном быстродействии 6.1в нормальна в том случае, если не вырождены все матрицы Gj, G2, . • Gr размера иХп: G1= ’ G2= [b^Ab^bè.. . ,!лп-Ч]; (б1б4) 6Г=[Ь,\АЬГ\А\\. • • \АП~'Ь]. . Упражнение 6.6. Докажите теорему 6.6. Легко заметить, что необходимые и достаточные условия теоремы 6.6 для нормальности задачи об оптимальном управлении 6.1в идентичны необходимым и достаточным условиям нормальности1 системы X (0 = Ах (/) + Ви (/). Таким образом, можно видеть, как понятие нормальности, развитое в гл. 4, возникает в задачах оптимизации. Установим взаимосвязь между нормальной системой и нормальной задачей об оптимальном по быстродействию управлении. Проверим, является ли данная система нормальной, и установим понятия нормаль¬ ности. Покажем, что если управляемая линейная система нормальна и если оптимальное по быстродействию управление и* (/) существует, то такое управление единственно. Перед тем, как приступить к формулировке и доказательству теоремы, напомним, что в задаче 6.1 в конечным состоя¬ нием является начало координат фазового пространства. Как установлено в упражнении 6.7, теорема может быть обобщена на случай, когда конеч¬ ное состояние х* (Г*) = Ѳ есть любое состояние в фазовом пространстве. 1 См. § 4.21. 357
Теорема 6.7. Единственность управления, оптимального по быстро¬ действию. Если в задаче 6.1в линейная система X (0 = Ах (/) + Bu (Z) нормальна (или эквивалентно, когда нормальна задача об оптимальном управлении), то оптимальное по быстродействию управление единственно (если оно существует). Доказательство. Предположим, что и* (/) и и* (f) — два различных оптимальных по быстродействию управления, переводящих начальное состояние g в 0 за (одно и то же) минимальное время Т*. Пусть х* (/) и х2* (/) — различные траектории, исходящие из g. Тогда X* (/) eAt g + J е~АхВи* (т)dx ; о X* (/) eAt g + j е~АхВи* (т)dx о При t = Т* должно быть х*(Т*)- Л*(Т*)-О. Так как матрица eAt невырожденная, получим: 7* у'* j e~AtBu? (t)dt = j e~AiBu* (f)dt. Q Q (6.165) (6.166) (6.167) (6.168) Используем выражение (6.168) и необходимые условия, чтобы уста¬ новить я* (/) = #*(/) для /£[0, Т*]. (6.169) Так как оба управления и* (t) и и* (t) предполагаются оптималь¬ ными, то существуют дополнительные переменные р* (/) = e~A>t и Р* (О = соответствующие и* (/) и и* (t), такие, что соотно¬ шения (/) —SIGN (6.170) я* (/) = —SIGN {В'е-Л'%} (6.171) однозначно определяют (ввиду нормальности) управления и* (t) и я* (/), за исключением, возможно, счетного множества моментов переключения. Это, в свою очередь [см. соотношение (6.142)], означает, что (Ви? (0, Р? (0) < (Ви? (/), р? (t)) (6.172) или эквивалентное ему (Bu* (t), е~А'^) < (Bu* (t\ е-А'%) (6.173) есть равенство при и* (/) = я* (/), или строгое неравенство при и* (t) ¥= «2* (0- Если выполняется равенство (6.168), то должно удовлетворяться и соотношение у* /л1; J e~AtBu?(t)dt\ = Æ, J е~А,Ви? (t)dt\ (6.174) 358
или эквивалентное ему {е~А'1лѵ Ви* (/)) dt = J (е~~А'1пг Bu*(t)}dt. (6. и о Из соотношений (6.175) и (6.173) непосредственно вытекает, что »!*(/) = »*(/) для /£[0, Т*]. Читатель должен отметить, что доказать единственность управления нам позволило предположение о нормальности задачи. Если бы задача не была нормальной, то могло бы быть (Ви* (/), е~А'1л^) (Bu*(t\ е~А^лх} при и* (0 + и* (0- Упражнение 6.7. Рассмотрите задачу 6.1 в в предположении, что область S— любое заданное состояние Ѳ, а не 0. Покажите, что оптимальное по быстродействию управление единственно (если оно существует), когда задача нормальна. Следующей мы докажем очень полезную теорему1 относительно «числа переключений» управления, оптимального по быстродействию. Напомним, что если задача нормальна, то компоненты оптимального управления есть кусочно-постоянные функции времени. Как показано на рис. 6.4, управляющая переменная в моменты переключения перескаки¬ вает с+1 на —1 ис —1 на +1. Следующая теорема дает верхнюю гра¬ ницу числа переключений для случая, когда собственные значения мат¬ рицы системы А — действительные числа. Как мы увидим в гл. 7, эта теорема исключительно полезна при проектировании систем, оптималь¬ ных по быстродействию. Теорема 6.8. Число переключений. Рассмотрим задачу 6.1в. Предпо¬ ложим, что система x(t) = Ax(t) + Bu(t) (6.176) нормальна и собственные значения À2, . . ., матрицы системы А — действительные числа. Пусть и* (/), / = 1, 2, . . ., г — компоненты (единственного) оптимального по быстродействию управления (если оно существует), a tyf-—моменты переключения (см. определение 6.4) кусочно¬ постоянных функций и* (t). Тогда максимальное число переключений у не превосходит п— 1 для всех / = 1, 2, . . ., г. Иначе говоря, каждое кусочно-постоянное управление и* (t) может переключаться (с +1 на —1 и с —1 на +1) не более п — 1 раз. Доказательство. Докажем эту теорему при дополнительном предпо¬ ложении о том, что Х2, . . ., различны. Если два или более зна¬ чений одинаковы, то теорема останется справедливой, и ее доказательство можно найти в работе [179] (гл. 3, теорема 10). Известно [см. соотношение (6.153)], что компоненты и* (t) оптималь¬ ного по быстродействию управления определяются уравнениями: u*(/) = —sign{(e-^^., л)}, л + 0; /=1, 2, . . ., г. (6.177) По определению моментов переключения tyJ имеем (e~Atyibj, л) = 0, ѵ/=1, 2, ... (6.178) 1 Эту теорему впервые доказал Веллман [19]. 359
Пусть А — диагональная матрица собственных значений: “Л 0 ... О' . о к ... О Л = _О О . . . Х„_ Л связана с матрицей системы А преобразованием подобия А = РАР. Пусть теперь еЛІ — диагональная матрица: ~ек‘( 0 ... О ' .. О е^і ... О еЛ‘ = _ 0 0 . . . еКп‘ _ Известно 2, что матрицы eAt и еАІ связаны соотношением еАІ P~'eAtP. Из последнего выражения заключаем, что e~At Pé~AtP~\ и поэтому соотношение (6.177) сводится к уравнению щ (/) = —sign {{Pe~AtP~'bj, л)} — —sign ! У] U-i J Постоянные зависят от элементов матриц Р и Р~1, от компонент вектора bj и от компонент вектора л. Очевидно, что число переключений равно числу нулей функции £/* (0 = £ P*/"***- (6.185) k=\ (6.179) (6.180) (6.181) (6.182) (6.183) (6.184) Но эта функция есть сумма п экспонент. Нетрудно заметить 3, что число нулей суммы п действительных экспоненциальных функций вре¬ мени не превышает п — 1. Следовательно, теорема доказана. Хотя теорема 6.8 была сформулирована для случая, когда в качестве области цели рассматривалось начало координат фазового пространства, из доказательства этой теоремы видно, что она применима и для случаев, когда область цели может и не быть началом координат. Возникает естественный вопрос: можно ли получить какие-нибудь результаты для случая комплексных собственных значений А ? Если любые из собственных значений А комплексны \ то число переключений конечно, но зависит от расстояния между начальным и конечным значениями. Для установления этого предположим, что два из собственных зна¬ чений А равны: = а + /ю; Х2 = а — jcù. (6.186) Тогда аргумент функции sign в уравнении (6.177) будет содержать член вида eat sin (со/ + ф). (6.187) 1 См. § 2.10. 2 См. § 3.21 и 3.22, в частности, уравнения (3.298), (3.319), (3.320), (3.322). 3 Строгое доказательство содержит лемма в работе [179]. 4 Собственные значения должны быть, естественно, комплексно сопряженными парами, так как А —действительная матрица. 360
Верхней границы числа нулей синусоидальной функции найти нельзя, если не задана ее область определения (т. е. временной интервал). Подытожим полученные результаты. Во-первых, мы сформулировали условия, при которых задача 6.1 в вырождена (теорема 6.5) и нормальна (теорема 6.6). Мы нашли, что требование нормальности задачи 6.1в экви¬ валентно требованию, чтобы система х (0 = Ах (0 4- Ви (/) была нормальна1. Во-вторых, при помощи теоремы 6.7 мы обосновали единственность оптимального по быстродействию управления. В-третьих, мы нашли верхнюю границу числа переключений (тео¬ рема 6.8) в предположении, что матрица А имеет действительные соб¬ ственные значения. Все полученные до сих пор результаты касались свойств управления, оптимального по быстродействию. Завершим этот параграф обсуждением свойств экстремальных управлений для задачи 6.1в. Напомним, что экстремальное управление (см. определение 6.8) есть управление, удовлетворяющее всем необходимым условиям. В соответ¬ ствии с постановкой задачи 6.1в и теоремой 6.4 сформулируем следу¬ ющее определение. Определение 6.9. Экстремальное управление для задачи 6.1 в. Допу¬ стимое управление uQ (I) называют экстремальным, если соответствую¬ щие ему траектории х (/) и переменная р (/) удовлетворяют соотношениям х (/) = Ах (О H (6.188) p(t) = — A'p(t); (6.189) X (0) = |, x(f)-0; (6.190) 1 4 (Ax(t), p (/)} 4 (««(/), B'p(t)) С 1 4 (Лх(0. p(0> 4- 4 B'p(t)) (6.191) для любых #(/) £ Q и t £ [0, Т\, причем 1 4- (Ax(/), 4- («°(0, B>(0) = 0. (6.192) B § 6.4 отмечалось (см. замечание 6.8), что каждое экстремальное управление соответствует глобальному или локальному оптимальному управлению. Докажем исключительно полезную теорему, устанавливаю¬ щую, что для нормальных систем существует только одно экстремальное управление, которое поэтому должно быть оптимальным по быстродей¬ ствию. Теорема6.9. Единственность экстремальных управлений для задачи 6.1 в. Предположим, что (/), 0 < t < 1\ и и^ (/), 0 < t < Т2 —два экстре¬ мальных управления для задачи 6.1в (см. определение 6.9). Если система X (t) = Ах (t) 4- Bu (/) нормальна и оптимальное по быстродействию управление и* (t) существует, то Т\==Т2==Т* (6.193) и #?(/) - u°2(t) - и* (Г). (6.194) 1 См. § 4.21. 361
Доказательство. Доказательство данной теоремы аналогично доказа¬ тельству теоремы 6.7. Предположим сначала, что экстремальные управ¬ ления и uQ2(t) различны и Л>Л. (6.195) Экстремальные траектории хг (/) и х2 (t) определяются соотноше¬ ниями x^t) eAt (6.196) (6.197) но из условия (6.190) имеем *і(Л)-х2(Т2) = 0, (6.198) и поэтому Л т2 I = — J е~Аі Ви* (t) dt = —J e~At Bu* (t) dt. (6.199) U Ü Управлению (t) соответствует (экстремальная) дополнительная переменная рх (t): Pi (0 = е~АЧ яі; (6.200) аналогично для (t) имеем р2(^) ■= е~лчл2. (6.201) Образуем скалярное произведение (g, л^): ?і (g, л,) = _/ді, Je~AIBu*(f) dt"} = <Ір J e~A'Bu*(f) dt> . (6.202) и и Так как лх — постоянный вектор, получим ?і т2 J — \е-л''лр — (е-л''лр Bu*(f)}dt. (6.203) о о Учитывая (6.200), имеем ?2 J - {р, (/), Ви* (/)) dt = J - (р, (/), Ви* (/)) dt. (6.204) о о Так как и\ (t) — экстремальное управление, из уравнения (6.191) найдем соотношение (p^t), Bu*(t)} < (^(0, BÛ*(tï) t e [0, f2], (6.205) 362
Так как система нормальна, последнее соотношение будет равен¬ ством при (0 = (0 и строгим неравенством при и\ (0 (0. Далее, поскольку система нормальна, соотношение = — SIGN {Æ'pJ/)}, t £ [0, TJ (6.206) однозначно определяет a® (t), за исключением счетного множества момен¬ тов переключения. Из соотношения (6.206) получим (рД/), Ди0(0)<0, t£ 10, TJ. (6.207) Неравенство (6.207) является строгим, если хотя бы одна из компо¬ нент (0 равна +1 или —1. Так как Т2 <С 7\, можно заметить, что допущение о нормальности предполагает справедливость неравенств Т2 -Çpx(t), (6.208) о о и ?2 Т2 J - (Д (/), Ви<{ (/)) dt > J - (р, (t). Ви% (/)) dt. (6.209) о о Из неравенств (6.208) и (6.209) для различных (0 и (0 получим соотношение тх т2 Bu^t)}dt>^-{p^t\ BÛ^t)}dt. (6.210) о о Но равенство (6.204) и неравенство (6.210) противоречат друг другу. Следовательно, іі\ (0 и (0 не могут быть различны, и поэтому 7\ = Т2 и (0 = и?2 (t). Так как экстремальное управление единственно и мы предполагали, что оптимальное по быстродействию управление и* (0 существует (оно единственно в силу нормальности), то должны удовлет¬ воряться условия (6.193) и (6.194), и теорема доказана. Эта теорема уста¬ навливает, что существует только одно оптимальное управление. Мы доказали теорему, считая, что конечной областью является начало координат фазового пространства. К сожалению, теорема не справедлива, если начало координат не является конечным состоянием системы. Иначе говоря, если мы хотим перевести систему из начального состояния |в конеч¬ ное состояние Ѳ 0 за минимальное время, то может оказаться больше одного экстремального управления. Предлагаем читателю самостоятельно найти причину этого, проделав следующее упражнение. Упражнение 6.8. Попробуйте воспроизвести доказательство теоремы 6.9. для случая, когда конечное состояние Ѳ =f= 0. Точно укажите место в логических построениях, где вы зашли в тупик. Не кажется ли вам, что для заданного конечного состояния Ѳ существует множество начальных состояний таких, для которых экстремальные управления един¬ ственны? Если да, то попытайтесь найти это множество начальных состояний. Продвинемся несколько дальше в некоторых особенностях доказа¬ тельства теоремы 6.9. Заметим, что мы не использовали то обстоятельство, что гамильтониан вдоль оптимальной траектории должен быть равен нулю. Таким образом, мы смогли доказать теорему 6.9, опираясь лишь на то, что экстремальное управление минимизирует гамильтониан. По этой 363
причине в гл. 7 редко будем использовать необходимое условие /7 [лс* (/), р*(/), #*(/)] - 0. В следующих четырех параграфах мы получим дополнительные резуль¬ таты относительно задачи 6.1в. В частности, в § 6.6 рассмотрим струк¬ туру разомкнутых и замкнутых систем, оптимальных по быстродействию, а в § 6.7 введем понятие минимальных изохрон и вновь обратимся к гео¬ метрическим свойствам управления, оптимального по быстродействию. В § 6.8 без точного доказательства обсудим проблему существования управления, оптимального по быстродействию, и рассмотрим теорему существования, наиболее полезную с инженерной точки зрения. В § 6.9 приведем уравнения Гамильтона—Якоби для задачи об оптимальном быстродействии и обсудим трудности, связанные с его решением. 6.6. СТРУКТУРА ОПТИМАЛЬНОГО РЕГУЛЯТОРА И ПРОБЛЕМА ОБРАТНОЙ СВЯЗИ В предыдущем параграфе были установлены наиболее общие резуль¬ таты, полученные в области задач об оптимальном по быстродействию регуляторе. В этом параграфе будет рассмотрен итеративный процесс, который может быть использован для определения управления, опти¬ мального по быстродействию. Эта методика аналогична уже рассмотрен¬ ной в шаге 3 в § 6.3. Далее отметим трудности, связанные с этим итера¬ тивным методом, и приведем библиографию, где описываются различные итерационные способы. Мы не будем глубоко вдаваться в итерационные способы решения, так как считаем, что они находятся вне пределов дан¬ ной книги, имеющей вводный характер. Наконец, определим задачу обратной связи и тем самым подготовимся к задачам, которые будут решены в гл. 7. Рассматривая задачу 6.1 в, будем считать, что система х (/) = Ах (/) 4- + Ви (/) нормальна и оптимальное по быстродействию управление суще¬ ствует (оно единственно согласно теореме 6.7). Ниже по шагам описан итерационный процесс, которому можно следовать при решении задачи 6.1 в. Дана нормальная линейная система с постоянными коэффициентами: х(/) = Ax(t)^ Bu(t\ х(0)- (6.211) Заданы ограничения на управления: I I < 1, j 1, 2, . . ., г для любого /. (6.212) Для нахождения оптимального управления, переводящего g в 0, можно поступать следующим образом: Шаг 1. Выбрать наугад начальное значение л такое, чтобы (g, л)^>0. (6.213) Шаг 2. Вычислить р (/) по соотношению р(/)=.-е-лчл. (6.214) Шаг 3. Вычислить управляющие переменные (t), и2 (/), . . ., ur (t) по уравнению «/(0 = —sign {(&/, р (/»}, (6.215) где bj — векторы-столбцы матрицы В. Шаг 4. Решить уравнение (6.211) для начального состояния | и управления, вычисленного в шаге 3. Так как л однозначно определяет 364
управляющий вектор, а g однозначно определяет траекторию (при задан¬ ном управлении), то состояние в каждый момент времени является функ¬ цией как g, так и л. Чтобы подчеркнуть эту зависимость, обозначим реше¬ ние уравнения (6.211) через „ (/). (6.216) Шаг 5. Просчитать х^ я (/). Если существует Т такое, что ^я(Т) = 0, (6.217) то управление, найденное в шаге 3, экстремально (см. определение 7.9) и по теореме 6.9 оптимально по быстродействию. Если условие (6.217) не удовлетворяется, то нужно изменить л в шаге 1 и так повторять весь процесс, пока не будет удовлетворяться это условие. Последний про¬ цесс — итеративный, так как для того, чтобы найти оптимальное по быстродействию управление, нужно начальное значение л изменять Рис. 6.8. «Разомкнутся» структура задачи об оптимальном быстродействии много раз. Первое и последующие значения л должны быть такими, чтобы выполнялось соотношение (6.213). Это соотношение непосредственно выте¬ кает из выражений (6.202); (6.203) и (6.208). Весь порядок расчета от шага 1 до шага 5 изображен на рис. 6.8 в виде блок-диаграммы. Двойные стрелки изображают «ход» векторных сигналов, одиночные — скалярных. Символ «реле» использован для обо¬ значения операции «sign» 1. Выходами «реле» Rlt R2, . . ., Rr являются управляющие переменные (/), и2 (/), . . ., ur(t). Блок, обозначенный «изменить л», «прогоняет» А л (/) и после «достаточного» времени решает, следует ли вводить в систему новое значение л. При этом воз¬ никают два вопроса: 1. Как долго следует ждать, прежде чем изменить л? 2. Как выбрать новое значение л, основываясь на значениях, которые уже использовались ранее и величину «промаха» между х^ n(t) и 0? Ответы на эти вопросы являются предметом многих исследований 2, которые основаны на применении итерационных методов; последних касаться не будем, так как они выходят за рамки данной книги. Заметим только, что эти способы сложны и требуют использования ЦВМ, обла¬ дающих большой памятью и высоким быстродействием. Рассмотренный способ есть способ управления без обратной связи. Иными словами, для заданного начального состояния g мы ищем опти¬ мальное по быстродействию управление и* (/), которое зависит от исход¬ ного состояния g и времени t. Это управление не зависит от текущих 1 Идеализированное поляризованное реле есть инженерная реализация функции sign. Этот символ и его смысл будут одинаковыми на протяжении всей книги. 2 См. [170], [16], [95], [57], [175], [123], [83] и [60]. 365
значений х (t) для t > 0. Недостатки метода управления без обратной связи хорошо знакомы инженеру. Дополнительная трудность, связанная с таким типом вычислений, состоит в следующем. Предположим, что соб¬ ственные значения матрицы системы А имеют отрицательные веществен¬ ные части, т. е. система устойчива. Тогда сопряженная динамическая система р (/) = —А'р (t) будет неустойчива, потому что собственные значения матрицы — А' имеют положительные вещественные части. Таким образом, малая «ошибка» в начальном значении дополнительной переменной л будет «усиливаться» с ростом времени и может вызвать значительные отклонения вычисленного управления от оптимального \ Поэтому полезно исследовать, можно ли получить оптимальное по быстродействию управление и* (/) (в момент времени t) как функцию состояния х* (/) (в тот же момент /). Если это возможно, то мы получим оптимальную систему с обратной связью, обладающую свойством: в лю¬ бой момент времени управление полностью определяется ее состоянием. Существует «функция переключения» h [х* (/) ] такая, что опти¬ мальное по быстродействию управление и* (t) выражается формулой а* (/) = —SIGN {h [х* (/)]}. (6.218) Уравнение (6.218) часто называют законом управления с обратной связью. Далее приводится эвристическое подтверждение уравнения (6.218). Пусть X* (/)— состояние на оптимальной траектории из | в 0. Обо¬ значим через р* (0 величину дополнительной переменной в тот же момент времени. Очевидно, что удовлетворяется соотношение X* (Т*) = 0 = вл<г*^) г* х* (/) - J е~А SIGN {В’р* (т)} dr t (6.219) Так как матрица еА (T*-ty> невырожденная, то имеем у* х* (t) = J е~А <Х~»В SIGN {Вр* (т)) dr. (6.220) Но t P* (т) = е-А’ (t-оp* (6.221) Время Т* — /, требующееся для перевода х* (/) в 0, должно быть функцией от X* (0, т. е. T* = t — а [х*(0]; (6.222) на основании (6.222) и (6.221) приходим к выводу, что выражение (6.220) определяет соотношение между х* (t) и р* (f), которое можно записать в виде (6.223)1 2 Так как к* (t) = —SIGN {В'р* (/)}, из формул (6.223) и (6.218) получим h [X* (/)] - В'р* [X* (/)]. (6.224) 1 Если сопряженная система моделируется на аналоговой машине, то дополни¬ тельные ошибки будут вызываться насыщением усилителей и усилением собственных шумов и дрейфа. 2 Это соотношение может и не быть однозначным. Иначе говоря, данному х* (t) могут соответствовать более чем одна р* (/), дающие оптимальное управление (см. [123]). 366
Итак, существование функции переключения доказано. Все задачи, которые будут рассмотрены в гл. 7, связаны с отысканием этой функции переключения. Как мы увидим дальше, функция переключения будет определяться с помощью «гиперплоскостей переключения» в пространстве состояний (или фазовых координат) системы. Блок-схема оптимальной системы с обратной связью показана на рис. 6.9. Функции (/), х2 (0, • • -, хп (О измеряются в каждый момент времени и вводятся в подсистему, обозначенную «ВМ» («вычислительная машина»). Выходами ВМ являются функции переключения /г ! [х(/)1, h2 [х (/)], . . ., hr lx (/)], которые затем подаются на идеальные реле Ru R2, . . ., Rr для получения управляющих переменных, оптимальных по быстродействию. Получение функций hx lx (t) ], . . ., hr [лег (/) ] и их инженерная реализация является основой задачи об оптимальном по Рис. 6.9. Структура оптимальной по быстродействию системы управления с обратной связью быстродействию управлении. Изложение некоторых способов отыскания функций переключения и описание типов нелинейных функций, необхо¬ димых для технического осуществления оптимальных по быстродействию систем, содержит гл. 7 данной книги. 6.7. ГЕОМЕТРИЧЕСКИЕ СВОЙСТВА УПРАВЛЕНИЯ, ОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ В § 6.2 мы обсуждали геометрическую природу задачи об оптималь¬ ном по быстродействию управлении при помощи областей достижимых состояний. Далее мы перешли от геометрических соображений к аналити¬ ческим результатам, полученным из необходимых условий, даваемых прин¬ ципом минимума. В этом параграфе попытаемся дать геометрическую интерпретацию необходимых условий. Ограничим наше обсуждение зада¬ чей 6.1в и будем предполагать, что задача нормальна в соответствии с определением 6.4. Заметим также, что материал настоящего параграфа представляет собой конкретизацию замечаний § 5.21. Рассмотрим поверхность минимального времени, и будем трактовать оптимальное по быстродействию управление как управление, заставляю¬ щее систему двигаться по поверхности минимального времени в направ¬ лении наискорейшего убывания. После этого мы окажемся в состоянии установить соответствие между дополнительной переменной и градиентом поверхности минимального времени. Наши рассуждения по своей природе будут эвристическими, так как мы прежде всего заинтересованы в том, чтобы дать геометрическую интерпретацию необходимых условий. 367
Пусть X — состояние в пространстве фазовых координат. Предпо¬ ложим, что существует оптимальное по быстродействию управление (единственное), переводящее х в 0. Обозначим минимальное время, тре¬ бующееся для перевода х в 0, через Т* (х). (6.225) Покажем, что минимальное время Т* (х) зависит только от состоя¬ ния X и не зависит явно от времени, т. е. ^ = 0. dt (6.226)1 Это утверждение справедливо, так как инвариантность во времени системы X (/) = Ах (t) 4- Ви (/) предполагает, что минимальное время может быть только функцией состояния. Иначе говоря, если х есть состоя¬ ние системы при t — 0 и минимальное время, требующееся для пере¬ вода X в 0, есть Т* (х), а х — состояние системы при t = t0, то оптималь- Рис. 6.10. Поверхность мини¬ мальной стоимости Т* (х) (минимального времени) в функции от X ное управление переведет х в 0 в момент вре¬ мени t0 + Т* (х) [см. уравнения (4.266) и (4.267)]. Поскольку время, требующееся для пере¬ вода системы из 0 в 0, равно нулю и мы рас¬ сматриваем решения только для положитель¬ ных времен, то очевидно, что 7* (х) обладает свойствами: Т* (х) = 0, если X =- 0; (6.227) Т*(х)>0, если х^0. (6.228) В дальнейшем для градиента функции Г* (х) по X будем использовать обозначение дТ* (X) дх дТ* (х) - дхг дТ* (х) (6.229) Рассмотрим далее некоторые свойства функции Т* (х). Полезно счи¬ тать 7* (х) поверхностью минималного времени задачи 6.1 в и предста¬ влять ее наглядно так, как это показано на рис. 6.10. Определим понятие минимальной изохроны 2. Определение 6.10. Минимальные изохроны. Пусть S (т) — множество состояний, из которых можно перейти в 0 за одно и то же минимальное время т, т 0. Будем называть S (т) т-минимальной изохроной. Эта функция S (т) определяется соотношением S (т) == [х : Т* (х) — т; т 0}. (6.230) 1 Авторы столкнулись с тем, что это уравнение сбивает с толку слушателей, которые читают его как «частная производная времени Т по времени равна нулю» и которые не понимают смысла частной производной. Мы надеемся, что читатель, изучивший § 3.12, не впадет в аналогичное заблуждение. 2 Понятие минимальной изохроны будет использоваться в гл. 7, 8 и 10. 368
Допустим, что S (т) обозначает множество состояний, из которых можно перейти в начало координат при помощи оптимального по быстро¬ действию управления за время, меньшее или равное т: 5 (т) = {х : Т* (х) < т; т 0}. (6.231) Из уравнений (6.230) и (6.231) заключаем, что S (т) есть подмно¬ жество из S (т). Можно убедиться х, что S (т) является границей S (т) и что S (т) замкнуто. Докажем, что множество S (т) строго выпуклое. Пусть х± и х2— два различных состояния на т-минимальной изохроне: Рис. 6.11. Иллюстрация вы¬ пуклости S (т) х} Q 5(т), х2 С 5(т). (6.232) В силу нормальности мы знаем, что суще¬ ствуют единственные оптимальные управления: и* (/)=- —SIGN [В'р* (/)), переводящее х1 в 0, и я* (0 = —SIGN {В'р* (/)} [отличное от и* (/)], переводящее х2 в 0. Таким образом, должны быть справедливы уравнения х, = Je~AtB SIGN (Bp* (/)} Л; (6.233) Ü х.2 Je-^BSIGN {В'р* (/)} dt. (6.234) ù Предположим, что х — состояние на (открытом) отрезке, соединяю¬ щем хх и х2, как показано на рис. 6.11. Выберем 0 <сс < 1 (6.235) и рассмотрим состояние х, определенное соотношением X = аХі + (1 —а) х2, а Q (0, 1). (6.236) Из соотношений (6.236), (6.234) и (6.233) получим х = Jе~АВ [aSIGN [В’р* (/)] (1 — а) SIGN {В’р* (/)}]dt. (6.237) и Пусть теперь и* (/) = —SIGN [В'р* (/)} — оптимальное по быстро¬ действию управление, переводящее х в 0, и т' — соответствующее мини¬ мальное время (т. е. Т* (х) = т')- Покажем, что т' <т. (6.238) Чтобы доказать это, заметим х = J e-AtB SIGNfS'p* (/)] dt. (6.239) U 1 Строгое доказательство, см. в работе [201 ]. 369
Из выражения (6.237) следует, что управление au* (0 + (1 — а) и* (Z) = aSIGN {В'р* (/) + (1 — а) SIGN \В'р* (0) (6.240) переводит х в 0. Однако это управление не является оптимальным по быстродействию, поскольку оно не является вектором, компоненты кото¬ рого есть функции типа sign. Для доказательства этого предположим, что в некоторый момент времени t мы имеем 1 " +1 " — 1 — 1 “ — 1 «!*(/) = «2* (0 = (6.241) — 1 — 1 Отсюда можно получить “ 2а — 1 - — 1 — 1 «»!*(/)+ (1 -а) »*(/) = (6.242) —1 Но так как 0 <Za <1, имеем неравенство — 1 <2а — 1 < 4-1, (6.243) и поэтому управление (6.242) не может быть оптимальным по быстродей¬ ствию (почему?). Если это управление не оптимально и переводит х в 0 за время т, то оптимальное управление потребует, чтобы т' <т. Таким образом, утверждение (6.238) доказано. Мы убедились, что 5 (т) есть гра¬ ница S (т). Следовательно, состояние х = ах{ 4- (1 — а) х2, а £ (0, 1) является элементом внутренней части S (т), и поэтому множество S (т) строго выпукло. Подытожим наши рассуждения следующей леммой. Лемма 6.5. т-минимальная изохрона S (т) есть граница замкнутого и строго выпуклого множества S (т). Упражнение 6.9. Докажите, что функция T* (х) для задачи 6.1 в непрерывна. Упражнение 6.10. Докажите, что S (т) замкнуто и S (т) есть граница S (т). Отметим, что т-минимальные изохроны «растут» с увеличением т. Предположим, что ij и т2 — два произвольных времени, причем (6.244) Тогда можно показать, что (6.245) Упражнение 6.11. Докажите соотношение (6.245). 1 Такой момент времени / существует, потому что управления я* (/) и «2* (/), по пред¬ положению, различны. 370
Соотношение включения (6.245) означает, что минимальные изох¬ роны увеличивают свое «расстояние» от начала координат с увеличе¬ нием времени, причем это возрастание является «гладким». Для поясне¬ ния этого положения дадим эвристическое геометрическое доказательство. Предположим, что g — начальное состояние при t = 0, и будем считать, что для перевода g в О при помощи оптимального управления и* (/) требуется время 0 < t < т. Таким образом, g £ S (т). На рис. 6.12 показана оптимальная траектория лг*, соединяющая g с 0. Пусть 8 >> 0— малое положительное время. Рас¬ смотрим состояние X* (в) при і=г. Градиент Рис. 6.13. Оптимальное по быстродей¬ ствию управление а* (0) дает вектор X* (0), который направлен, насколько можно точнее, в направлении наиско¬ рейшего убывания Рис. 6.12. Минимальные изо¬ хроны $(т) и $(т — е), 8> 0. Оптимальная по быстродействию траектория из х* (е) к 0 является частью оптимальной по быстро¬ действию траектории из g к 0 По принципу оптимальности 1 управление и* (/) для 8 < t < т есть оптимальное управление, переводящее х* (е) в 0 за минимальное время т — 8. Таким образом, л:* (s) S (т — s). Так как фазовая траектория непрерывна, то при 8 —> 0 состояние лг* (е) стремится к g. Если повторить этот эксперимент для всех g £ S (т), то можно обнаружить, что изохроны S (т) и S (т — 8) «приближаются друг к другу все ближе» при 8 —> 0. Обсудим теперь геометрические свойства оптимального по быстро¬ действию управления а* (/). Предположим, что g — начальное состоя¬ ние, причем g £ S (т). На рис. 6.13 показано, что существует область Х% дт* фазового пространства, где градиент —' определен для всех х £ Х^, Другими словами, компоненты вектора-градиента ѴТ* (лг) == " дТ* (X) ~ дх± дТ* (X) _ дх ~~ дТ* (X) - дхп _ (6.246) являются вполне определенными функциями для всех х Q Х%. Градиент Г* дТ* (х} при х = I, т. е. вектор —определяет направление наиболее быстрого изменения функции Т* (х) в точке |. Как показано на рис. 6.13, 1 См. § 5.16 и 5.19. 371
градиент нормален к кривой S (т) в точке х = | и направлен «от начала тт дТ* (х) I ( координат». Направление вектора âx^l (показан штриховой ли¬ нией на рис. 6.13) устанавливает направление «наискорейшего убывания» на поверхности Т* (лг) в точке g. Итак, если построить поверхность 7* (л:) и положить на нее шарик в точке |, то он начнет катиться вниз по поверх- дТ* (х} I ности Т * (х) в направлении вектора âx“| При t = 0 имеем лг(О) = Л|гВя(0), я(0)£Й. (6.247) Направление и величина вектора х (0), очевидно, зависят от век¬ тора который определяется состоянием |, и от вектора Ви (0), вели¬ чина и направление которого могут выбираться в пределах наложенных ограничений и (0) Ç Q. Если «перепробовать» все управления и (0) из Q, то получится множество векторов {х (0)}, которые образуют конус /(. Будем считать, что этот конус показан на рис. 6.13. Таким образом, огра¬ ничение и (0) Г- Q определяет область направлений на рис. 6.13, и мы не дТ* (х) I можем сделать так, чтобы вектор х (0) был направлен вдоль -1 . Однако имеется вектор х* (0), направленный в сторону наискорейшего убывания при наложенных ограничениях. Обозначим через и* (0) управляющий вектор такой, что лг* (0) - АІ + Ви* (0). (6.248) Рассмотрим, чем отличается вектор х* (0) от всех остальных воз¬ можных векторов X (0)? Нетрудно увидеть, что х* (0) удовлетворяет соотношению (см. рис. 6.13) /л- (0). Ц \ < /х (0), ]и \ (6.249) для всех X (0) К. Аналогично из уравнений (6.248) и (6.249) находим, что для всех и (0) (- Q !- Ви* (0), < /лі -і- Ви(0), |х= \ (6.250) или <“• «»■в |„s> < <“ (»)•в |„s> <6-251 > Итак, вектор управления и* (0), удовлетворяющий (6.251), устанав¬ ливает направление наискорейшего убывания (совместимого с ограни¬ чениями) вдоль поверхности минимального времени Т* (лг) в точке х = 1. При этом управление и* (0), удовлетворяющее (6.251), должно удовлетво¬ рять также и соотношению (а*(0), В'л) <(я(0), В'л), (6.252) где л — произвольный вектор, направленный «наружу» и нормальный к минимальной изохроне S (т) в точке |, т. е. с>° ,6ЖІ> для любой положительной константы с. Физически и* (0) должно быть оптимальным управлением в точке X = |, потому что оно заставляет состояние системы или изображающую точку в фазовом пространстве двигаться, максимизируя скорость изме- 372
нения минимального времени. Если а* (0) — оптимальное управление, то из необходимых условий известно, что существует переменная р* (0), при которой имеет место соотношение 1 4 (ЛІ, р* (0)) + (я* (0), В'р* (0)) < I + <л g, р* (0)) + + (а(0), В'р*(0)) (6.254) для всех и (0) Ç Q или эквивалентное ему (а* (0), В'р* (0)) < (и (0), Яр* (0)). (6.255) Из сравнения соотношений (6.255), (6.253) и (6.252) сделаем следую¬ щее важное замечание. Замечание 6.11 х. Если и* (0) — оптимальное управление при х* (0) = = g, то начальное значение р* (0) должно иметь то же направление, что дТ*(х) I и градиент—I если оно сущест¬ вует. То же самое можно высказать и иначе. Начальное значение р* (0) должно быть внешней нормалью к изо¬ хрон е S (т) при х = g. Обсудим далее важный случай, когда начальное состояние является «углом» минимальной изохроны. Пред¬ положим, что I л S (т), и, как пока¬ зано на рис. 6.14, является углом изо¬ хроны; пусть и g2—состояния вблизи I на изохроне S (т). Будем говорить, что Рис. 6.14. Если I является углом ми¬ нимальной изохроны, то направление наискорейшего убывания неопреде¬ ленно находится «справа» от g, а g2—слева. Утверждение « g находится в углу изохроны S (т)» означает, что градиент дТ* (х} —-г—— при X = g не определен. Как показано на рис. 6.14, векторы дТ* (X) I дТ* (X) I дх дх |х.|2 g2 слева от g, однако определены для всех gx справа от g и для всех lim £х->£ f дТ* (X) I дх (6.256) im[^L| I I дх |ж=ь| Таким образом, при х = g мы не можем найти направление наиско¬ рейшего убывания просто по градиенту при х — g, так как последний не определен. Это означает, что оптимальное по быстродействию управ¬ ление в этой точке нельзя определить при помощи геометрического дока¬ зательства, приведенного в предыдущем обсуждении. Если, однако, р* (0) есть вектор, соответствующий g и а* (0), то соотношение (6.255) остается в силе. Мы просто утратили соответствие между р* (0) и нормалью к мини¬ мальной изохроне 1 2. В предыдущем обсуждении мы ограничились начальными состоя¬ ниями, расположенными на данной минимальной изохроне. Заметим, что те же замечания в силу принципа оптимальности (§ 5.16) справедливы 1 Геометрическая интерпретация, содержащаяся в этом замечании, является исходной точкой итерационных способов, описанных в работах [166] и [57]. 2 Это соображение, по сути дела, показывает, что теория Гамильтона—Якоби слабее принципа минимума. Пока поверхности минимального времени не имеют «углов», оба теоретических подхода эквивалентны. Сила принципа минимума Понтрягина и обнару¬ живается как раз в тех задачах, где градиент минимального времени не определен повсюду; по крайней мере, это справедливо с практической точки зрения. 373
относительно любого состояния х* (0 на оптимальной траектории к началу координат. Подытожим наши выводы следующим замечанием. Замечание 6.12. Пусть х* (/)— состояние на оптимальной траекто¬ рии и пусть р* (/) — соответствующая дополнительная переменная. Пред¬ положим, что X* (Z) £ S (Т). Тогда р* (/) — внешняя нормаль к S (Т) дТ* (х) I в точке X* (/) в случае, если градиент —определен. Следующее упражнение поможет конкретизировать идеи данного параграфа. Упражнение 6.12. Рассмотрите систему (0 = х2 (/); х2 (О = «(/); |и(0|=^1. (6.257) В § 7.2 будет доказано, что минимальное время Т* (хг, х2), необходимое для пере¬ вода любого состояния (хх, х2) в (0, 0), определяется соотношениями Г* (X], х2) = х2 -f- 4хх -f- 2х2, если Xj > — х2 | х2 |, — X, + ]/—4xj + 2х|, если Xj < х2 | х2 |; } I х21, если Xj = g- х2 I х21- (6.258) Начертите минимальную изохрону S (4). Вычислите градиент дТ* (хг, х2) дх - дТ* (хг, х2) - дх} для X = 0 4 дТ* (хь х2) _1 +/2 L дх2 J исходящим из точки х. Для всех | и | 1 вычислите по уравнению (6.257) при X и начертите их исходя¬ (6.259) Начертите этот вектор, [ Гхі 11 множество векторов < . > І_Х2 J щими также из х т. е. постройте область /<, показанную на рис. 6.13). Убедитесь, что Г41 оптимальное управление при х должно быть равно —1. Повторите для точки х = I. Минимальная изохрона S (4), которую вы нарисовали, имеет два «угла». Вычислите гра¬ диенты по обе стороны угла и удостоверьтесь, что градиент имеет скачок в двух точках. 6.8. СУЩЕСТВОВАНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В этом параграфе мы приводим обсуждение теоремы 6.10, которая гарантирует существование оптимального по быстродействию управления к началу координат из любого начального состояния в фазовом про¬ странстве. Вопрос о существовании оптимального управления при движении из произвольного начального состояния в произвольную область S исключи¬ тельно сложен. Полезно рассмотреть частный вопрос о существовании оптимального управления к началу координат с эвристической точки зрения. Предположим, что нам задана полностью управляемая динамическая система и управление ограничено по величине соотношением и (/) £ Q. Используя предположения об управляемости системы, мы можем найти по крайней мере одно управление, которое переведет любое начальное состояние £ в 0 в течение конечного времени. Может, однако, оказаться, что начальное состояние | настолько далеко от начала координат, что перевести | в 0 могут лишь управления, не удовлетворяющие ограниче- 374
нию и (t) Ç Q. В этом случае существуют начальные состояния, которые не могут быть переведены в 0 управлениями, удовлетворяющими ограни¬ чению. Можно высказать следующее замечание: для заданной полностью управляемой динамической системы х (/) = f [лг (/), и (/) ] и области ограничений Q n-мерное фазовое пространство Rn можно разделить на два подпространства и Rn—Yq со следующими свойствами: 1. Если g £ то существует хотя бы одно допустимое управление, переводящее | в 0 в течение конечного времени. 2. Если I Q Rn — то не существует оптимальных управлений, переводящих | в любой из элементов в течение конечного времени (и поэтому g нельзя перевести в 0 при помощи допустимого управления). По сути дела, ограниченные управления не дают достаточного «толчка» для того чтобы перевести состояния из Rn — вѴй и, следовательно, в начало координат. С физической точки зрения управление и (t) может прибавлять или отнимать энергию от динамической системы. Если представить себе состоя¬ ние X = 0, как состояние с нулевой энергией, то можно заметить, что системы, для которых множество Rn — не является пустым, по сути дела неустойчивы. По этой причине можно полагать, что устойчивая, полностью управляемая динамическая система характеризуется соотно¬ шением = Rn, а для неустойчивой, полностью управляемой системы имеется cz Æ , но у= R„. Теорема \ полезная для подтверждения этого и гарантирующая суще¬ ствование оптимального по быстродействию управления к началу коор¬ динат из любого начального состояния, может быть сформулирована сле¬ дующим образом. Теорема 6.10. Рассмотрим оптимальное по быстродействию управле¬ ние для управляемой системы х (/) = Ах (t) + Bu (t) в соответствии с задачей 6.1в. Если собственные значения А имеют не положительные (отрицательные или нулевые) вещественные части, то оптимальное по быстродействию управление к началу координат существует для любого начального состояния из Rn. Строгое доказательство этой теоремы можно найти в [179]. Рассмо¬ трим суть доказательства на примере системы с различными действитель¬ ными собственными значениями и с единственной управляющей перемен¬ ной и(/) == 4 = 1, 2, ..., и; ^ = х,(0); і= 1, 2, п. (6.260) Решение системы (6.260) для любого и (t) дается формулой х{ (t) = (6.261) 1 Соответствующие ссылки, относящиеся к теоремам существования, будут даны в § 6.10 и 6.23. 375
Предположим, что мы нашли допустимое управление и (/), для кото¬ рого (Т) = х2 (Т) = • • •== хп (Г) = 0. Это означает, что соотношение т I, = — рМ?/(/)А (6.262) удовлетворяется для всех і = 1, 2, . . ., п. Так как \и (/) | < 1, можно сделать вывод, что т ^е-кі'Ь.и(і) dt о т J е-М I bi I dt = - -IM - 1) (6.263) для i = 1,2, . . ., n. Предположим, что одно из собственных значений, на¬ пример положительно [это означает, что система (6.260) неустойчива 1. Из (6.263) получим ІЁіІ !)’ (6.264) откуда е-х.т < J _ ММ. (6.265) I *11 Очевидно, что соотношение (6.265) не может удовлетворяться для любых действительных положительных и конечных Г, если для началь¬ ного значения координаты справедливо неравенство IÊJ^-М-. (6-266) Таким образом, если > 0 и | £х| -МЦ то нельзя найти Т такое, что Xj (Т) =-- 0 и, следовательно, оптимального управления не существует. Если все собственные значения \ не положительны, то легко пока¬ зать, что уравнение (6.263) может быть справедливо для любых |^| и і = 1,2, . . ., /г, так как можно подобрать достаточно большое значение Т. Это, в свою очередь, означает, что оптимальное по быстродействию управ¬ ление существует для всех начальных состояний системы (почему?) х. Пример 6.4. Рассмотрим оптимальное по быстродействию управление для системы X (/) = ах (t) + и (t), I и (t) I 1, х(0)=£. (6.267) Если 0, то (по теореме 6.10) оптимальное по быстродействию управление к состоя¬ нию X = 0 существует для всех Если а^> 0, то система неустойчива. Найдем область начальных состояний Ч'д, для которой существует оптимальное по быстродействию управ¬ ление. Если оптимальное по быстродействию управление и* (t) существует, то | и* (0 | = 1 и мы имеем g — — j e~atu* (t) dt, о 1 См. работу [179]. 376
откуда найдем J е atu (/) dt о j* I г atu (t) I dt I e at I \u (t) | dt ô ô (6.268) Чтобы соотношение ного т, необходимо иметь (2.268) выполнялось для некоторого конечного положитель- IÊI Таким образом, область начальных значений Tq, для которой существует оптималь¬ ное управление в начало координат, определяется соотношением ^й = Й:|§1<4-. «>0|. (6.269) Если I I -і-, то оптимального управления не существует. Таким образом, об¬ ласть 'Pq представляет собой открытое множество, содержащее начало координат. Упражнение 6.13. Рассмотрите управление к началу координат (0, 0) для следующих систем второго порядка, полагая | и (t) | 1: а) х\ (t) = Xj (t) + х2 (/); х2 (0 = — хг (t) + х2 (/) + и (t); б) xi (Z) = х2 (0; х2 (Z) = х2 (/) -J- и (/); в) х’і(0 =х2(0; і2(0 =Хі(/) +«(/)■ Для каждой из систем найдите область исходных состояний 'Fq, для которой такое управление {и (0, 0)] существует (примите, что если существует допустимое экстремаль¬ ное управление, то оптимальное управление существует). 6.9. УРАВНЕНИЕ ГАМИЛЬТОНА—ЯКОБИ В §5.19 мы обсуждали изменение минимального времени вдоль оптимальной траектории, а в §6.7 рассматривали геометрические свойства оптимального управления для задачи 6.1в. В данном параграфе мы свя¬ жем эти представления воедино и изучим уравнение Гамильтона—Якоби для задачи об оптимальном быстродействии. Нашей целью будет показать, как можно использовать общие результаты гл. 5 для задачи об оптималь¬ ном быстродействии 6.1в. На протяжении всего параграфа мы будем иметь дело с оптимальным по быстродействию управлением нормальной системой х (/) 4- Ви (0 с областью цели 5 = 0 (начало координат). При этом используем следующие обозначения: если нам задано состояние х, то через Г* (х) обозначим минимальное время, требующееся для перевода х в 0, а че¬ рез и* — значение оптимального управления в состоянии х. Конкретные задачи данного параграфа состоят в следующем: 1) показать, как можно использовать уравнение Гамильтона—Якоби для проверки, может ли данная функция Т (х), найденная в результате решения задачи об оптимальном управлении, быть равной Т* (л:); 2) указать на трудности, которые возникают в случае, если пред¬ положение о том, что данное управление оптимально, неверно; 3) отметить трудности, связанные с определением оптимального по быстродействию управления непосредственно из уравнения Гамильтона— Якоби. 377
Перейдем к обсуждению использования уравнения Гамильтона— Якоби, рассматривая его как необходимое условие. Из общей теории § 5.19 можно вывести следующую лемму. Лемма 6.6. Пусть х* — состояние на оптимальной по быстродействию траектории и и* — значение оптимального управления при х*. Так как дТ* (х) ——- — 0 для любых X, необходимо, чтобы Г* (х) удовлетворяло соот¬ ношению 1+\лх*' +\и*’в = 0 (6-270) ат* (X) I при условии, что —_ * существует. Упражнение 6.14. Докажите лемму 6.6. Указание см. уравнение (5.695) Эта лемма полезна в том случае, когда задача об оптимальном управ- , лении уже решена и мы хотим узнать, может ли данная функция Т (х) оказаться выражением, определяющим минимальное время как функцию состояния. Если данная функция не удовлетворяет уравнению (6.270) хотя бы в одной точке, то Т (х) можно немедленно исключить из числа возможных вариантов минимального времени. Покажем это на следующем примере. Пример 6.5. Предположим, что линейная система описывается следующими урав- нениями: ’ X, (0 ' "о Г X, (0 + ’ 0 ’ u(t) |u(/)|sSl. (6.271) . х2 (0 . _о о. . х2 (() . 1 Можно убедиться, что оптимальным является управление 1 u* = —1, если X = ха = I ; * 1 Г1! и* = — 1, если х = х^ = . (6.272) (6.273) Предположим, что каким-то образом мы нашли соотношение т (X) = Т (хьх2) = -L-х] + х|, (6.274) (6.275) (6.276) (6.277) которое выражает минимальное время как функцию от состояния. Эта догадка небезосно¬ вательна, потому что Т (х) > 0 для всех х, Т (0) = 0 и Ііш Т (х) = оо. I Х 1-Х» Покажем теперь, что наша догадка неправильна. Прежде всего вычислим градиент Т (х). Из соотношения (6.274) находим, что этот градиент равен Г дТ (X) 1 дТ (X) дхі дх дТ (X) _ дх2 Вычислим его при х = ха и х — х^: дТ(х) I Г 1 дх 1х=ха L 4 дТ (х) I _ Г 1 дх І-=-6“ L 2 При X — ха левая часть уравнения (6.270) раі '+хіооЖ]’ Ш/ " ’К »1 [1]} = 1+2 —4 = —1=^0. (6.278) 1 См. § 7.2. 378
Можно заключить, что Т (х) по соотношению (6.274) не может быть формулой, выра¬ жающей минимальное время, потому что при х = ха уравнение (6.270) не выполняется. Посмотрим, что получится, если испытать Т (х) в точке х= х0. В ней левая часть выра¬ жения (6.270) равна: , ■ /1° ПГ11 Г11\ ( Г1 1+\|<>о]Ы- М/-Т' + <6.279) Это означает, что Т (х) удовлетворяет необходимому условию леммы 6.6 при х = Xg, и на основе этого испытания мы можем заключить, что Т (х) может быть минимальным временем. Однако испытание при х = ха исключает эту возможность. Предположим теперь, что при определении оптимального управления допущена ошибка. Например, мы полагаем, что и* = + 1, если X = xg = (6.280) Тогда вместо выражения (6.279) мы получим /ГО 11 Г 1 1 Г 1 1\ ( Г 1 11 L 1 ’ 9 /+1 [0’ *1 9 =1+1+2=4*°’ (6.281) Xu I V w I I 1 I I £ [yr I J Z* |y и можно было бы исключить Т (х) из рассмотрения. Верно, что Т (х) 4= 7* (х), но на основе выражения (6.281) нельзя делать заключение, так как неверно выбрано значение и* = /1 для Xg. Иначе говоря, если допущена ошибка при определении оптимального закона управления, то в ходе такой проверки можно исключить из рассмотрения правильную зависимость Т* (х). Практически эта лемма не очень полезна, так как инженеру чаще всего нужно построить оптимальную систему с обратной связью, а не проверить, равно ли данное Т (х) оптимальному Т* (л:) или нет. Тем не менее использование уравнения Гамильтона—Якоби в качестве необхо¬ димого условия имеет значение в теоретических исследованиях и для про¬ верки правильности результатов, получаемых при использовании прин¬ ципа минимума. В гл. 5 уравнение Гамильтона—Якоби в основном рассматривалось как достаточное условие. Обсудим теперь проблему решения уравнения Гамильтона—Якоби и отыскания оптимального управления. При этом советуем читателю вернуться к теореме 5.12 и внимательно ее еще раз просмотреть. Мы знаем, что гамильтониан задачи об оптимальном быстродействии 6.1в равен: Н[х, р, и] = 1 + (Лх, р) +- (а, В' р). (6.282) Так как система х = Ах + Ви нормальна, то, согласно определению 5.12, нормален и гамильтониан, и поэтому //-минимальное управление равно: й = — SIGH {В'р}. (6.283) Из соотношений (6.283) и (6.282) получим Я(х, р, и) - 1 4 (Лх, р) — (SIGH {В'р}, В'р) - п п г п = 1 + S S a^iPk — S S biiPi !=i і=і і=і Рассмотрим уравнение в частных производных (уравнение тона—Якоби): (6.284) Гамиль- (6.285) 1 + Предположим, что мы оказались в состоянии найти решение T (х) (6.286) 379
дифференциального уравнения в частных производных (6.285), причем 1) функция (6.287) Т (0) =•• 0; 2) управляющий вектор и - — SIGN [в' . I J Подстановка этого решения в уравнение системы дает: х (/) = Ах (t) — BS1GN ІВ' дТ}Х^)] 1 • ѵ 7 ѵ ( дх (t) J Решение этого уравнения x(t) с начальным условием х(0) = обладает свойством х[Т(£)] = 0. (6.288) (6.289) (6.290) (6.291) Иначе говоря, решение Т (х) уравнения Гамильтона—Якоби (6.285) определяет управление и [см. соотношение (6.288)], которое, в свою очередь, производит траекторию х (/), достигающую начала коор¬ динат за время Т (|), где | — данное начальное состояние. Если это так, то управление и (/) будет оптимально по быстродействию, по крайней мере по отношению к близким к нему управлениям, т. е. и (/) будет опти¬ мальным локально. Поясним это на очень простом примере. Пример 6.6. Предположим, что нам задана система первого порядка x(/)=2u(Q; |«(0|^1; х (0) = g. (6.292) Требуется перевести произвольное начальное состояние 5 в 0 за минимальное время. Гамильтониан для этой задачи имеет вид H (х, р, и) = 1 + 2ир, (6.293) где //-минимальное управление и определяется соотношением и — — sign {р}. (6.294) Уравнение Гамильтона—Якоби для данной задачи имеет вид 1-2|^^| = °. (6.295) Определим две области и Х2 (одномерного) фазового пространства следующим образом: Х1 = {х:х>0}; Х2 = {х:х<0}. (6.296) Легко убедиться, что функция (6-297) есть решение дифференциального уравнения в частных производных (6.295) для всех х g £ (J Х2, так как для (6.298) для (6.299) 380
Заметим, что _ неопределенна (6.300) и Т(0)=0. (6.301) Рассмотрим управление и, определенное как . /д?(х)1 и = — signj—, (6.302) откуда — 1, хЕХ,; (6.303) u=+l. X Е Х2; (6.304) и неопределенно при х = 0. Предположим, что £ g Хх, т. е. g > 0. В результате подстановки (6.305) выражения (6.303) в формулы (6.292) получим X (t) — —2; (6.306) Из соотношения (6.297) x(t) = l-2t; имеем (6.307) (6.308) Следовательно, ХІТШІ = =0. (6.309) Далее, для любых t Е [0, T (<;) ] имеем х(0 =6—20 0. (6.310) Это означает, что х(0еХі. (6.311) Таким образом, постоянное управление и — —1 (6.312) оптимально по быстродействию для любых х Ç Хѵ По аналогии доказывается, что управление и=+1 (6.313) оптимально по быстродействию для всех х Ç Х2. Мы выбрали области Хг и Х2 такими, чтобы было вполне определенным. Для данной системы мы не встретили никаких трудностей при отыска¬ нии оптимального управления с помощью уравнения Гамильтона—Якоби, так как было достаточно просто: 1) угадать решение уравнения Гамильтона—Якоби, удовлетворяю¬ щее граничным условиям; 2) определить две области и Х2; 3) установить, что х [Т(|)] = 0. Если же мы попытаемся найти оптимальное управление для систем более высокого порядка, то сразу столкнемся со следующими трудностями 1. Почти невозможно найти решение уравнения Гамильтона—Якоби для систем выше второго порядка. 1 Следующие замечания являются выводами авторов из их опыта по части решения различных задач об оптимальном быстродействии. 381
2. Для системы n-го порядка необходимо подразделить фазовое пространство по крайней мере на 2п областей Xlf Х2, . . Х2п, указать которые для систем выше второго порядка исключительно трудно. Поэтому в настоящее время проектирование оптимальных систем с обратной связью чаще всего производится при помощи необходимых условий принципа минимума, а не достаточных условий, определяемых уравнением Гамиль¬ тона— Якоби. 6.10. КОММЕНТАРИИ И ЗАМЕЧАНИЯ В предыдущих параграфах мы анализировали задачу об оптималь¬ ном быстродействии с различных точек зрения. Нашей целью было свя¬ зать математические и геометрические аспекты проблемы таким образом, чтобы читатель оценил их значение. Можно заметить, что наиболее «сильные» теоремы были сформулиро¬ ваны для задачи о линейном оптимальном по быстродействию регуляторе с постоянными параметрами (см. задачу 6.1в). Некоторые из этих теорем относятся и к оптимальному по быстродействию управлению к началу коор¬ динат линейной системой с переменными по времени коэффициентами х (0 - А (/) х (і) + В (/) и (/) (6.314) при условии, что задача об оптимальном быстродействии нормальна. В частности, теорема 6.7 и упражнение 6.7, которые устанавливают единственность оптимального управления, справедливы и для системы с переменными параметрами (6.314) х. Кроме этого, теорема 6.9 (кото¬ рая устанавливает единственность экстремального управления в случае, если начало координат является конечным состоянием) также справед¬ лива для системы (6.314) 1 2. Теорема относительно числа переключений (теорема 6.8) и наиболее полезная теорема существования (теорема 6.9) не имеют прямых аналогов для систем с переменными параметрами, потому что они сформулированы в терминах собственных значений (постоянных) матрицы системы А. Если обратиться к нелинейной задаче об оптимальном быстродей¬ ствии (задача 6.16), то в современной литературе можно найти очень мало 3 полезных результатов, если иметь в виду общие характеристики или теоремы. Трудности не являются принципиальными, они связаны скорее с тем обстоятельством, что мы не можем написать аналитических выражений для решений нелинейных дифференциальных уравнений. Теоретические результаты для задачи об оптимальном быстродей¬ ствии в гл. 7 будут использованы при расчете оптимальных по быстро¬ действию систем. Целью гл. 7 является отыскание оптимального по быстро¬ действию управления в функции от состояния, т. е. решение задачи об оптимальной по быстродействию обратной связи. Нам кажется, что прежде чем читатель сможет оценить общие понятия задачи об оптимальном быстродействии, ему следует познакомиться с подробным решением неко¬ торых конкретных задач. Различные упражнения гл. 7 предназначены для иллюстрации геометрических представлений, обсуждавшихся в преды¬ дущих параграфах. В гл. 7 мы будем, насколько это возможно, приво¬ дить практическую реализацию оптимальных по быстродействию законов управления, чтобы можно было оценить относительную сложность необ¬ 1 См. [179], стр. 204. 2 См. [179], стр. 204 и 205. 3 Нелинейная задача об оптимальном быстродействии с теоретической точки зрения рассматривается в работах [89], [169], [62], [145], [190] и [208 ], где обсуждается, воснов- ном, проблема существования решения. 382
ходимой аппаратуры. Мы советуем читателю, уставшему от общих поня¬ тий и теорем, пропустить оставшуюся часть данной главы и перейти к гл. 7. Упражнения, приведенные ниже, предназначены для того, чтобы познакомить читателя с оптимальным по быстродействию управлением линейными системами с переменными параметрами. Упражнение 6.15. Для каждой из следующих систем найдите необходимые и доста¬ точные условия нормальности задачи об оптимальном быстродействии. Считайте, что все переменные коэффициенты являются бесконечно дифференцируемыми функциями времени. Используя определения 6.4 и 6.5 и материал, предшествующий теореме 6,5 рассмотрите си¬ стемы: в) х± (I) = х2 (t) + Ьг (t) и (/); i2 (0 = хз (0 + b2 (0 и (0, I и (Z) I < 1; хз (t) = хг (0 + b3 (/) и (Z); г) Хі (Z) = а (0 х2 (/); х2(0= — a(t)xr (t) + «(0, I и (01=^1. Упражнение 6.16. Докажите теорему 6.7 для системы х (t) = A (t) х (/) + В (t) X X и (t). Указание: см. [179]. Упражнение 6.17. Докажите теорему 6.9 для системы х (t) = А (0 х (/) + В (t) и (t). Указание: см. [179]. ЗАДАЧИ НА ОПТИМУМ РАСХОДА ТОПЛИВА 6.11. ВВЕДЕНИЕ1 В этом и последующих пяти параграфах рассматриваются задачи на оптимум расхода топлива. Целью этого изучения является «перекинуть мост» от теоретических результатов главы 5 к конкретным практическим системам, которые рассматриваются в гл. 8. Основным источником таких задач являются проблемы управления самолетами и космическими летательными аппаратами, начиная от про¬ стейших задач управления положением спутника и включая такие слож¬ ные задачи, как задача встречи космических летательных аппаратов на орбите и задача «мягкой» посадки. Во всех этих случаях управляющие силы и моменты появляются за счет расхода топлива или рабочего тела, запасы которых ограничены. Задачи на оптимум расхода топлива сложнее задач об оптимальном быстродействии. Дополнительные усложнения возникают как в аналити¬ ческой части задачи, так и при практической реализации системы. Некото¬ рые из причин этих дополнительных осложнений рассматриваются в § 6.15 и гл. 8. Сейчас лишь отметим, что экономия топлива составляет основу таких задач, хотя при проектировании часто бывает необходимо рас¬ сматривать и другие параметры (такие, как время переходного процесса). 1 Имеется большое число работ, где рассматривается общая задача на оптимум рас¬ хода топлива, интересный материал содержится в [166]. 383
6.12. ОБСУЖДЕНИЕ ЗАДАЧИ И ОГРАНИЧЕНИЙ Часто представляет интерес поступательное или вращательное дви¬ жения некоторой массы, а также сложное движение. Управление осуществляется механизмом, потребляющим топливо и производящим тяги или моменты, а в ряде случаев одновременное действие тяги и момента. Потребляемое топливо может уходить из системы (ракета, реактивный двигатель, двигатель внутреннего сгорания) или оставаться в системе (например, в случае ядерного реактора). Вообще, в каждой задаче на оптимум расхода топлива будем считать, что стоимость управления свя¬ зана с уменьшением полезной массы. Предположим, что управляемая система описывается уравнением лг(/) = /|х(/), д(0, П, (6.315) где X (t) — вектор состояния; и (/) — вектор управления; t — время. Допустим, что вектор управления и (/) есть результат потребления топлива. Условимся обозначать скорость изменения количества топлива в момент времени t через ср (/)• Тогда общее количество топлива F, израс¬ ходованного на временном интервале |/0, /х], равно: G F — j ф (/) dt. (6.316) ( о Будем измерять скорость потока топлива неотрицательными величи¬ нами, т. е. ф (/) ^ 0 для любого /. Для большинства физических систем существует соотношение между скоростью потока (расходом) топлива ф и управляющим вектором и типа Ф = h (я). (6.317) Это соотношение может быть определено экспериментально. Для определенности в данной главе (и в гл. 8) будем считать, что уравнение (6.317) имеет вид Ф = 2С/І^/І> с;С>0, (6.318) /=1 где и19 и2, . . ., иг — компоненты управляющего вектора и; Cj — положительные коэффициенты пропорционально¬ сти. Соотношение (6.318) означает, что увеличение расхода топлива при¬ водит к возрастанию величины управляющего вектора и. Если выражение (6.318) представляет связь и с ф, то можно заметить, что топливо, которое расходуется за время [/0, /х], определяется соотношением 1 G г F = J‘2 C/IU/(Z)I^- (6.319) /о / = 1 Типичная задача на оптимум расхода топлива может быть сформули¬ рована следующим образом: 1 В гл. 10 мы рассмотрим иное соотношение между F и и, а именно: іі F = J У(t) H h u-n (t) dt. U 384
Заданы система х (/) = f {х (/), и (/), t\ и ограничение и (/) Г Q; начальное состояние х (/0) и область S. Требуется найти допустимое управ¬ ление, переводящее x(tQ) в S таким образом, чтобы минимизировать коли¬ чество топлива F. Если мы имеем дело с задачей, где масса топлива F сравнима с мас¬ сой всей системы (например, управление разгонными ступенями ракет), то мы должны включить массу в состояние (в число фазовых координат) системы. Предположим, например, что масса системы при t = /0 равна /И (/0). Тогда скорость изменения массы пропорциональна расходу топ¬ лива, и поэтому можно написать дифференциальное уравнение вида = (6.320) Таким образом, массу в каждый момент времени можно вычислить по соотношению М (/) =- М (/„) — ( С, I Ы/(т)|] dr. ù U-i J (6.321) В таких примерах управление, выполняющее поставленную задачу с минимальным расходом топлива, автоматически должно минимизиро¬ вать разность М (/0) — М (t2). Если масса F потребляемого топлива пренебрежимо мала по сравне¬ нию с массой М (/о) управляемой системы, то достаточно считать, что система имеет постоянную массу. Такое предположение уменьшает число фазовых координат на единицу и упрощает уравнения. Во всех задачах гл. 8 мы будем использовать это предположение. 6.13. ФОРМУЛИРОВКА ЗАДАЧИ И ПОЛУЧЕНИЕ НЕОБХОДИМЫХ УСЛОВИЙ В этом параграфемы точно сформулируем задачу на оптимум расхода топлива, получим необходимые условия оптимальности расхода топлива, используя принцип минимума, и определим нормальную и вырожденную задачи, а также установим принцип «включено—выключено» (теорема 6.11) для нормальной задачи на оптимум расхода топлива. Задача на оптимум расхода топлива, сформулированная ниже, аналогична задаче об оптимальном быстродействии, представленной в виде 6.16. В обеих этих задачах (см. 6.16 и 6.2а) управляемая система, ограничения на управление и области S одинаковы. Таким образом, чита¬ тель сможет сравнить необходимые условия для этих двух задач. Так как многие из необходимых условий похожи, а логическая последователь¬ ность, по сути дела, та же, что и в § 6.3, будем излагать материал более сжато. Задача 6.2а. Задача об оптимальном расходе топлива при управлении к подвижной области S. Дана система /=1 Z — 1, 2, ... и или в векторном виде х(0 - /|х(/), /] + В [х(0, /]«(/)• 13 Атанс и др (6.322) 385
Предположим, что компоненты их (/), и2 (/), . . иг (/) управле¬ ния и (/) ограничены по величине соотношением |г/ДО|<1, /=1, 2, ...г, 1 или, в более компактной записи, (6.323) #(/) £ Q. Заданная гладкая область S определяется уравнениями (6.37) (см. задачу 6.16). Будем считать, что система (6.322) и область S удовлетво¬ ряют предположениям, сформулированным в задаче 6.16. Пусть t0 — начальное время их(/) — заданное начальное состояние системы (6.322). Одновременно с этим задан функционал («стоимость» топлива) в виде Т ( г ) /(«) = j <2с/ІМ0І \dt, су>0. (6.324) to U=1 J Найти управление u(f), которое 1) удовлетворяет ограничениям (6.323); 2) переводит систему из состояния х (Zo) в область S; 3) минимизирует функционал для топлива J (и) (6.324): а) если Т не задано; б) если Т = Tf фиксировано. Для нахождения необходимых условий рассмотрим сначала случай, когда время Т не задано. Теорема 5.9 дает необходимые условия для задачи с незаданным временем. Прежде всего образуем гамильтониан для системы (6.322) и функцио¬ нала (6.324). Гамильтониан имеет вид p(t), u(t), t]= 'Zcj\ui(t)\ + /==1 + (/[*(0. Л, p(t)) + {B[x(f), p(f)) (6.325) или, эквивалентно, H[x(t),p(t), u(f), /]= S cz| u, (0| + /=1 n r n + S fi ix (0, n pi (0 + 2 Б ьц [X (/), o u, (ty Pi (/). (6.326) t=l /=1 t=l Заметим, что гамильтониан задачи на оптимум расхода топлива линеен относительно Uj(t) и | (01 [для задачи об оптимальном быстродей¬ ствии Н линейно зависел только от (/)]. Предположим, что и* (/) — управление, оптимальное по расходу топлива, а х* (t) — соответствующая ему траектория и Т — первый момент времени, когда Л*(Т) С S. (6.327) Используем обозначение Т вместо Г* для обозначения времени при¬ бытия в S вдоль траектории, оптимальной по топливу. Символ Г* сохра¬ ним для обозначения минимально возможного времени прибытия в S. Из формулировки задач 6.2а и 6.16 ясно, что Т удовлетворяет неравенству 7^7*. (6.328) 386
Используем теперь результаты теоремы 5.9 для получения необходи¬ мых условий в задаче управления на оптимум расхода топлива. Утвержде¬ ние 1 теоремы 5.9 гарантирует существование дополнительной перемен¬ ной р* (т), соответствующей и* (/) и х* (/). Гамильтониан, вычисленный при х* (/), р* (/) и и* (/), равен н іх* (о, р* (о. и* (о. п = 2 с,-1 «; со I + + 2 /, I** (0. П Р * (0 + 22 b{j \х* (/), /] и* (/) P * (/). (6.329) І=1 /=11=1 ' ' Так какл* (t) = и р* (t) = — то находим, что х* (t) и р* (/), k — I, 2, ... п должны удовлетворять каноническим уравнениям X* (/) = fk [х* (t), /] + 2 hi [** (0. d u* (0; /=1 (6.330) P* (0 = Zjl dxk^ i pî(0 (6.331) для k = 1, 2, ... n. Можно заметить, что канонические уравнения (6.330) и (6.331) иден¬ тичны каноническим уравнениям (6.53) и (6.54) для задачи об оптималь¬ ном быстродействии. Гамильтонианы (6.329) и (6.52) отличаются только первыми членами. Утверждение 2 теоремы 5.9 состоит в том, что неравенства /7[лт*(/), р*(/), и* (0, t] <//[**(/), р*(/), u(/), t] (6.332) имеет место для всех u Ç Q и t Ç [/0, Т1. Из уравнения (6.329) находим, что соотношение (6.332) сводится к уравнению t n k ( п ) 2 сі Iи* с) I + 2 fi [** (0. <1 р* (0 + 2 «* со 2 Ьц [/ (/), р(* (•/) < /=1 г=1 /=1 U=1 ) < 2 с/І«/І + 2 ft [** (0, d р<* (0 2 «/ (0І2 Ьр [ж*(о, /] р* (о!, /=1 і=л /=1 U=1 ) (6.333) которое, в свою очередь, дает соотношение É Cj I и* (/) I + 2 «Г (012 bu [X (о, л P- (/)} < 1=1 І=1 U=i J «s 2 сі I ui(ОI + 2 «/ (0 !2 bu [x* (/), /] p* (o) (6.334) /=1 /=1 U=1 J для любых и Q и t [/0, Т]. 387
Для задачи на оптимум расхода топлива утверждение 3 теоремы 5.9 принимает вид г п 2с' I иі (л I + SI** (Л, Г] Р* (Т) + /=і і=і г < п 1 П-р -т 2 «,* (Л 2Ьіі І** (Л. Т] р* (Т) - [х* (7), f], (6.335) /=1 I і=1 ) а=1 где еа — постоянные и ga lx, t] = 0, а = 1, 2, . . ., п — р есть уравне¬ ния области S. Наконец, утверждение 4 теоремы 5.9 означает, что рЧТ) = S Ма|ж*(П Т], (6.336) а=1 где kr, k2,. . .kn_^ — некоторые произвольные постоянные и Аа[х, а-1, 2, ...п-р. (6.337) Читатель может заметить, что уравнение (6.336) идентично уравнению (6.66) для задачи об оптимальном быстродействии, за исключением того, что Т* заменено на Т. До сих пор мы просто повторяли логическое развитие шага 1 § 6.3 для задачи на оптимум расхода топлива с незаданным конечным време¬ нем Г. Предположим теперь, что конечное время, равное Tf, было задано заранее. В этом случае можно использовать таблицу 5.1 (ряд 11) для определения необходимых условий задачи на оптимум расхода топлива с фиксированным временем. Предлагаем читателю самостоятельно убе¬ диться, что уравнения (6.330), (6.331) и (6.334) остаются неизменными, а уравнение (6.336) примет вид Р*(Л)= S Ма(^*(Л). ЛІ- (6.338) а=1 Эта задача имеет решение, когда заданное время Tf больше или равно минимальному времени Т*, т. е. Tf^ Т*. (6.339) В заключение рассмотрим необходимые условия в виде следующей леммы. Лемма 6.7. Необходимые условия для задачи 6.2а. Если оптимальное по расходу топлива управление и* (0 существует, то получаемые траек¬ тория х* (/) и соответствующая дополнительная переменная р* (0 должны удовлетворять следующим условиям: а) если Т не задано, то необходимые условия выражаются соотноше¬ ниями (6.330), (6.331), (6.334), (6.335) и (6.336); б) если задано T = Tf, то необходимые условия выражаются соотно¬ шениями (6.330), (6.331), (6.334) и (6.338). Теперь рассмотрим соотношение (6.334) более детально. Используя соотношение (6.334), как это сделано в шаге 2 § 6.3, получим уравнение, которое связывает оптимальное по расходу топлива управление и* (0 с траекторией х* (f), соответствующей р* (0. 388
Определим функции q* * (/), У* (0, • • • > Я* соотношениями q* (t) ■- S bi:\x* (/), /| t = l, 2, ...r. (6.340) /•==1 Таким образом, функции g* (/) являются компонентами л-мерного вектора q* (/), определенного как #* (/) - В |х* (/), /1 р* (/) (6.341)1 Используя уравнения (6.340), из (6.334) можно найти Е Ci II U* (/) I 4 и* (/) С Е S !| и, (/) I -+ и< (/) ^-1 (6.342) I--1 I СІ J -1 l SJ для всех I ut (t) I < 1, j = 1, 2, . . ., г и любого t £ [/0, T] или [Zo, T/]. Уравнение (6.342) означает, что функция ф|а(/)1 - È с, {|«,(0| + имеет абсолютный минимум при «, (0 = «’ (0- Используя замечание 6.6, находим тіпф[»(/)1= min É е! Il u'(t) I + u; (/) u (t)<Q ииц2|'=1 I СІ = È Cj min !| Uj(t) j 4- U, (0-^7^! • 7=1 j Uj (O| < 1 I t I (6.343) (6.344) Можно утверждать, что * (/) 1 I U;(/) I b U, (0-4— = . , , I ' если 1- < (0 (6.345) Так как минимум имеет место при и: (t) = u?(t), находим, что и* (t) связаны с q* (/) [и, следовательно, с х* (t) и р* (t) по (6.340)] следующим образом: <?,* (О u*(t) -- 0 если — 1 < с ■ < 1; 4,* (П Z/* (/) = -J 1. если — <С—1; / ѵ ’ с f (/) = — 1, если —> + 1; ! (61346) (0 О < и* (/)<- - 1, если — 1; (0 — 1 < и * (t) С 0, если — = + 1. 1 Уравнения (6.340) и (6.341) идентичны (6.60) и (6.68). Величины, отмеченные звездочкой *, в уравнениях (6.340) и (6.341), относятся к траектории, оптимальной по расходу топлива, а в (6.67) и (6.68) — к траектории, оптимальной по быстродействию. * 389
Чтобы записать соотношения (6.346) в компактной форме, определим функцию «зоны нечувствительности», обозначаемую далее через dez {а}, следующим образом: а = dez \b\. Это означает, что а = 0, если а = sign {&}, если О < а < 1, если — 1 С а < 0, если (6.347) Уравнение (6.346) можно теперь записать в компактной форме: ( я* (t) 1 ( 1 Д ) И* (/) = _ dez (-7—J = — dez j— £ Ьц [аг* (()> t} р* (')J • (6.348) Рис. 6.15. График функции q*\ I ui I 4" иі\ ! в зависимости \ с/ / <h ОТ —- для I Uj I 1 сі Строгое доказательство того, что управление (6.346) действительно ми¬ нимизирует функцию ф [и (/)], очень длинно имало полезно для понимания задачи. Для иллюстрации уравнения (6.345) . , и (6.346) лучше всего начертить возмож- ItyrUj Cj ( ные значения функции j | и, (t) | + Uj (t) х X — ? для всех и, (/), удовлетворяющих ci J ограничениям по величине | иу (/) | < 1, что и сделано на рис. 6.15. В соответствии с ве¬ личиной tij (t) значения функции 11 и, (f) | + /а = Uj (ч—с—[ в зависимости от —— при¬ надлежат затененной области. Как показано на рис. 6.15, управление, определенное соот¬ ношениями (6.346), дает минимальное зна¬ чение, соответствующее выражению (6.345). С другой стороны, управление Uj (t) = = sign I— I максимизирует ф [и (/)]. I сі J Заметим, что соотношения (6.346) однозначно определяют величину и знак оптимального по расходу топлива управления и* (t) через х* (/) и р* (/) при условии, что Qj (0 с. Если = 1, то можно указать знак, но нельзя найти величину управления оптимального по расходу топлива. Эти соображения приводят к определению нормальной и вырожденной задач на оптимум расхода топлива. Определение 6.11. Нормальная задача на оптимум расхода топлива. Предположим, что на интервале По, Т], когда время перехода не фиксировано, или на интервале 1/0, 71/], при фиксированном времени, 390
имеется счетное множество моментов времени т17, т2/, . . ту/, тѵ/0/о> Т] или Г,]; (6 349) у = 1, 2, ... / = 1, 2, ... г Ѵ ' таких, что * п =-^1>Ьц\х*(Л /]А*(/)| = 1; (6.350) / г=1 в том случае, если / = ту/ для всех / = 1,2, . . ., г. Тогда задачу на оптимум расхода топлива будем называть нормальной. Моменты вре¬ мени ту/ будем называть моментами переключения. q* (О На рис. 6.16 показаны функция — и соответствующее управле- с' h* (01 ние и*(0, определенное по уравнению и* (/) = —dez\-^—>. Заметим, <7* (/) * Рис. 6.16. Функция —— дает управление и. (/) = я ( М = —dez |— 1 , являющееся кусочно постоянной функ- I Cj ) циеи времени, которая может принимать три различных значения (—1; 0; +1) я* (О что функция —-— равна +1 или —1 всего в шести изолированных точках на оси времени. В этом случае оптимальное по топливу управление есть кусочно-постоянная функция времени, и ее значения равны -4-1,0 или —1. о ж <7,* (О « Если все функции -— обладают свойствами, аналогичными показанным сі на рис. 6.16, то задача на оптимум расхода топлива будет нормальной. Кусочно-постоянные управления и* (/) принято называть управлениями типа включено—выключено или управлением с т ремя уровнями +1,0 и—1. Число переключений управления, показанного на рис. 6.16, равно шести. Читатель, видимо, догадался, что вырожденная задача возникает Я* (О С; = 1 в течение конечного интервала времени. в том случае, если Это действительно имеет место. Введем следующее определение. Определение 6.12. Вырожденная задача на оптимум расхода топлива. Предположим, что на интервале [/0, Г] или [/0, Tf] имеется один (или более) подынтервал [7\, Т2] такой, что я* (0 cj для всех t £ [Tlt T2]. t]p* U) = 1 (6.351) п 391
Такую задачу будем называть вырожденной, а интервалы [7\, T2\t — интервалами вырожденности. Функция —, показанная на рис. 6.17, соответствует вырожденной задаче на оптимум расхода топлива. Имеются два интервала вырожден¬ ности: 1т2, т3] и [т5, т6]. За исключением моментов переключения тх, т4 и т_, управление и. (/) однозначно определено значением —-—, если t $ |т.„ т3| и / г [т5, т6]. Для t С- рг2, т3| известно, что и* (/) не положи¬ тельно, а для t с |т5, т6|—что и* (/) не отрицательно. Однако необходимые условия, даваемые принципом минимума, не позволяют определить//*(/) через л* (/) и р* (/) на интервалах вырожденности. Рис. 6.17. Иллюстрация условия вырожденности Как и в § 6.3, это не означает, что оптимального по расходу топ¬ лива управления не существует. Это лишь означает, что необходимое условие Н [лг* (f),p* (/) к* (/), И < Н [х* (t)р* (t), и* (t), Л не позволяет установить однозначного соответствия между оптимальным по расходу топлива управлением и* (/), оптимальными траекторией х* (/) и допол¬ нительной переменной р* (/). Вырожденные задачи на оптимум расхода топлива обсудим в §6.22. Сформулируем следующую теорему (которая аналогична теореме 6.2) для нормальной задачи на оптимум расхода топлива: Теорема 6.11. Принцип релейного управления («включено—выклю¬ чено»)1. Пусть а* (/) — оптимальное по расходу топлива управление для задачи 6.2а, а х* (/) и р* (/) — соответствующие ему траектории состоя¬ ния системы и дополнительной переменной. Если задача нормальна (см. определение 6.11), то компоненты и* (/), (/), . . ., ц* (/) управле¬ ния и* (/) должны определяться уравнением и* (0 = - dez{^- [ж* (о, d Рі (0} > (6.352) j 1, 2, ... г для /Е [/0, Т] или /С [/о, Tf]. Уравнение (6.352) можно записать более компактно: я* (/) = — DEZ {С1В [х* (/), і] р* (/)}, (6.353)1 1 Векторная функция DEZ { } определяется следующим образом: Пусть аи а2, ... аг — компоненты вектора а и Ьъ b.2, . . . Ьг — компоненты вектора Ô; тогда a = DEZ{&} означает, что а; = dez {bj}, / = 1, 2, . . . г, где скалярная функция dez [bj] определяется уравнением (6.347). 392
где q 0 . . . .0 О q .... О (6.354) О 0 .... q Таким образом, если оптимальная по расходу топлива задача нор¬ мальна, то компоненты оптимального управления являются кусочно¬ постоянными функциями времени и могут принимать только три значе¬ ния + 1, 0, и —1 (т. е. переключаться между +1, 0, и —1). Если задача на оптимум расхода топлива нормальна, управление п* (/) можно «исклю¬ чить» из необходимых условий, устанавливаемых леммой 6.7. Таким путем мы получим упрощенные необходимые условия для нормальной задачи на оптимум расхода топлива и теорему, подобную теореме 6.3. Сделать это предлагаем самому читателю. Упражнение 6.18. Используя теорему 6.11 и лемму 6.7, получите теорему, устанав¬ ливающую упрощенные необходимые условия для нормальной задачи на оптимум расхода топлива (аналогичную теореме 6.3). Упражнение 6.19. Рассмотрите систему и области S, описанные в примере 6.3. При- т мите, что минимизируемый функционал равен {| их (01+ | w2 (0 I) а Т не задано. о Получите упрощенные необходимые условия, полагая, что задача нормальна. До сих пор мы следовали в наших рассуждениях порядку § 6.3 до примера 6.3 включительно. Читатель припоминает, что остальная часть § 6.3 была связана с задачей использования необходимых условий для отыскания оптимального управления. Аналогично можно поступить при решении задачи на оптимум расхода топлива. Во-первых необходимо найти управление, которое минимизирует гамильтониан абсолютно (Н — минимальное управление, определение 6.6); во-вторых, найти канониче¬ ские уравнения, определяющие х (/) ир (/), и, наконец, определить началь¬ ное значение р (/0) таким образом, чтобы получившееся состояние, допол¬ нительная переменная и управление удовлетворяли необходимым усло¬ виям. Так как все это детально рассматривалось в § 6.3, мы приведем ниже только ход рассуждений: 1. Формируем гамильтониан: // - Н (лг(/), р(/), И (/), /] = (01 + / = І -I 'f\x(J), /]. p(0) + («(/). В |x(/). t\p(t)}. (6.355) 2. Определяем //-минимальное управление м" (/): «°(0- — DEZ jC-IB [х(0> 0р(0!- (6.356) 3. Обозначаем Н° - //°[х(/), p(t), Z] - p(t), и° (/), /1 (6.357) при U (t) ~ «° (О- 4. Рассматриваем дифференциальные уравнения •'('Ь’ОпО (6.358) (6-359) 5. Выберем наугад начальное значение р (t0) при заданном начальном состоянии X 393
Для данного х (t0) и предполагаемого р (t0)f решая уравнения (6.358) и (6.359), получим Х(0 = Х[Л /о, х(/о), р(/о)]; 1 p(iï = p[t, t0, Х(/о), P tfo)]- J Мы можем теперь повторять эти действия и изменять р (/0) до тех пор, пока не будут удовлетворены все необходимые условия. Предлагаем читателю самостоятельно составить список вопросов, как в § 6.3, и по¬ строить логическую диаграмму в виде блок-схемы, подобную приведен¬ ной на рис. 6.7. Упражнение 6.20. Формализуйте шаги, связанные с предыдущим обсуждением, при помощи «опыта», аналогичного описанному в шаге За § 6.3. Сформулируйте и докажите леммы, аналогичные леммам 6.2 и 6.3. Продумайте значение существования многих управ¬ лений, удовлетворяющих начальным условиям. Итак, мы установили, что для задачи на оптимум расхода топлива компоненты оптимального управления представляют собой кусочно-по¬ стоянные функции времени и могут принимать (в каждый момент времени) значения +1, или 0, или —1. Таким образом, оптимальные управления имеют периоды, когда и = 0, и за счет этого экономится топливо. В сле¬ дующем параграфе мы специализируем эти результаты для случая опти¬ мального по расходу топлива управления линейной системой с постоян¬ ными параметрами. 6.14. ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ В этом параграфе мы воспользуемся результатами предыдущего пара¬ графа для случая линейных систем с постоянными параметрами. При этом будем рассматривать задачу с фиксированным временем перехода. Иначе говоря, рассмотрим задачу отыскания оптимального по расходу топлива управления, которое переводит заданное начальное состояние | в задан¬ ное конечное состояние Ѳ в течение установленного времени Tf. Для того чтобы мотивировать выбор задачи с фиксированным временем, сделаем ряд замечаний относительно задачи с незаданным временем перехода. Предположим, что динамическая система описывается дифференциаль¬ ным уравнением х(/) - Лх(/) + Яа(/), (6.361) где X (/) — состояние системы и и (t) — управление. Будем считать, что начальное состояние х (0) = g 4= 0, и прикладываем управление и (0 = 0 для всех t > 0. (6.362) Тогда свободное решение х° (t) уравнения (6.361) запишется в виде х°(0 = (6.363) Предположим, что все собственные значения матрицы А имеют отри¬ цательные вещественные части. Это означает, что система устойчива и не обладает интегрирующими свойствами. В этом случае решение (/) будет приближаться к нулю, точнее 1ітлг°(/) = 0. (6.364)1 t —> оо Ясно, что если мы хотим найти оптимальное по расходу топлива управление, переводящее любое начальное состояние g в 0 для устойчивой системы, и не указываем времени перехода, то оптимальным по расходу 1 См. § 3.26. 394
топлива управлением будет и* (0 = О, и время перехода будет бесконеч¬ ным. Строго говоря, управление и* (/) = 0 лишь 8-оптимально, так как оно не переводит | в 0 в течение конечного времени. Тем не менее нетрудно видеть, что постановка такого рода задачи с незаданным временем не ведет к полезному решению. С другой стороны, если одно или больше собственных значений А имеют неотрицательные вещественные части, то задача об оптимальном по расходу топлива переходе в начало координат с незаданным временем перехода оказывается нетривиальной. Если в задаче на оптимум по расходу топлива дано конечное время перехода T fy то она может иметь нетривиальные решения независимо от того, каковы собственные значения матрицы А. Именно поэтому точная формулировка задачи 6.26 включает заданное время перехода. Задача 6.26. Задача об оптимальном по расходу топлива регуляторе для линейной системы с постоянными параметрами с заданным временем перехода. Дана динамическая’ система х (/) - Ах (0 + Ви (0, (6.365) где X (0 — я-мерный вектор; А—матрица системы размера пХп с постоянными коэффициен¬ тами; и (t) — г-мерный вектор. Предположим, что система (6.365) полностью управляема и что ком¬ поненты (t)f и2 (і)9 . . ., ur (t) управления и (0 ограничены по вели¬ чине соотношением |wz(0| < 1, / = 1, 2, ... г для любого /. (6.366) Заданы начальное время t0 = 0 и начальное состояние системы (6.365): х(0)= I. (6.367) Заданы конечное состояние 0 (необязательно 0) и конечное время Tf (большее, чем минимальное время Т*, требующееся для перевода | в 0). Необходимо найти оптимальное по топливу управление и* (t)9 переводя¬ щее систему (6.365) из | в Ѳ за время Tf и минимизирующее функционал Tf F (и) = F — (6.368)1 и /=і В этом параграфе мы приводим различные теоретические результаты, полученные для данной задачи. Будем применять способ, аналогичный тому, который использовался в § 6.3, и поэтому читатель сможет провести аналогии и найти различия между двумя оптимальными задачами. В част¬ ности, установим необходимые условия в теореме 6.12; достаточные усло¬ вия нормальности задачи в теореме 6.13; единственность оптимального по расходу топлива управления в теореме 6.14 и единственность экстре¬ мальных управлений в теореме 6.15. Таким образом, нашей целью является продублировать последовательность § 6.5 в отыскании теоретических результатов для задачи на оптимум расхода топлива. При помощи принципа минимума легко получить необходимые усло¬ вия для задачи 6.26. Предлагаем читателю проверить следующую теорему, просто просмотрев формулировку леммы 6.7. Теорема 6.12. Необходимые условия для задачи 6.26. Пусть и* (0— оптимальное по расходу топлива управление, переводящее | в Ѳ. Обозна¬ 1 Для упрощения (6.324) и дальнейших вычислений мы приняли cj = 1. 395
чим через х* (/) траекторию системы (6.365), соответствующую и* (/), исходящую из g при /0 — 0 и попадающую в состояние Ѳ в заданный момент времени Tf [т. е. х* (0) = |, х* (Tf) = Ѳ]. Тогда существует соответ¬ ствующий вектор р* (/) такой, что а) х* (/) и р* (/) являются решениями канонических уравнений X* (/) - Лх* (/) 4- Ви* (/); (6.369) р*(0 - — Л'р*(0> (6.370) с граничными условиями Х*(0) - I; X* (Tf) - Ѳ; (6.371) б) соотношение 2ІІ«/*(0І 4 {Ах* (t), р* (/)) н- {и (/), Bp(t)\ < /=-і + {Ах (/), р (/)) + {u(t) B'p*(t)> (6.372) /=і выполняется для всех допустимых и (/) и t G [0, Tf]. Последнее соотно¬ шение, в свою очередь, дает уравнение и* (/) — DEZ \q* (/)) = — DEZ {В'р* (/)} (6-373) или, в записи через компоненты, il* (/) = — dez [q* (/)} — — dez | p* (O' L / - 1.2, . .. r. (6.374) Можно заметить, что необходимые условия не дают нам явной инфор¬ мации относительно граничных значений р* (/). Иначе говоря, мы не знаем ни р* (0), ни p* (Tf). Необходимые условия не дают нам никакой информации относительно величины функции Гамильтона вдоль опти¬ мальной траектории. Так как система инвариантна по времени и функ¬ ционал не зависит явно от /, то известно \ что гамильтониан должен быть постоянным, т. е. г 2 I и* {t) I + {Ах* (t), р* (0) 4 {и (/), В р* (/)) = /=1 — у =- const для t 6 [0, Tf], (6.375) но мы не знаем величину постоянной у. Рассмотрим вектор р* (/), который является решением линейного однородного уравнения вида р*(0 —Л'р*(/); (6.376) это уравнение то же самое, что для задачи об оптимальном быстродействии [см. уравнение (6.140) в теореме 6.4]. Если обозначить через л----р*(0) (6.377) начальное значение дополнительного вектора, то известно, что Р* (/) = (6.378) Так как фундаментальная матрица е~АЧ невырожденная, то началь¬ ное условие л - 0 (6.379) 1 Определение функции dez { ) см. соотношения (6.347). 396
означает, что р* (/) = 0 для любого /6 [О, Tf\. (6.380) Отсюда, в свою очередь, следует [по уравнению (6.373)], что й*(/)==0 для любого /€[0, Tf\. (6.381) В § 6.5 мы пришли к выводу (см. теорему 6.6), что задача об опти¬ мальном быстродействии нормальна тогда, когда нормальна система X (/) = Ах (/) + Ви (/) *. Получим теперь условия нормальности для задачи на оптимум расхода топлива. Сначала, как и в § 6.5, получим необходимые условия вырожденности задачи на оптимум по расходу топлива (см. определение 6.12), а затем преобразуем их в достаточные условия нормальности. Понятие нормальности будет существенным при доказательстве теорем единственности. Прежде всего мы установили теоремой 6.12, что оптимальное по рас¬ ходу топлива управление и* (/) должно быть связано с соответствующим дополнительным вектором р* (t) соотношением и* (О = — dez {(bj, р* (())}, (6.382) / = 1, 2, ... г которое означает, что и* (0 = 0, если |(&„ /?*(/)>]<!; «Г(о = + і. если <&/> р* (ок — 1'. и* (0 = — 1, если р* (/)) >4-1; 0 С и* (0 < 4- 1, если (&;, р* (/)) = — 1; — 1 < и* (t) < 0, если (bj, р* (0) = 4- 1 • (6.383) В случае вырожденной задачи на оптимум расхода топлива необходимо, чтобы на интервале управления [0, Tt] существовал хотя бы один интер¬ вал 1/1( /2] Для некоторого /, когда р* (Z))| = 1 для всего (2]. Для определенности предположим, что выполняется соотно¬ шение р* (/)) = 4- 1 при всех /€[Л, /2]> (6.384) и изучим следствия (6.384). Так как функция (времени) (Ь/, р* (/)) по¬ стоянна, то все ее производные по времени должны быть равны нулю. Путем последовательного дифференцирования . по времени уравнения (6.384) получим набор уравнений (АЬ„ />*(/)) = 0; (A*bh р* (/)) = 0; {Ап~'Ьі, р*(/)> = 0; (Л"&;, р* (/)) = 0. для всех t 6 [/j, /21 (6.385) 1 См. § 4.21. Еще раз напомним, что физический смысл нормальности системы состоит в том, что любая компонента управляющего вектора может влиять на все фазовые коор¬ динаты (или переменные состояния). 397
Выберем первые п уравнений и перепишем их следующим образом: ~ ^—АЬ/—> - *-А2Ь^ Р*Щ = 0. (6.386) <-An~'bt^ _ *—Anbj—> _ Определим теперь матрицу О/1 размера пХп как матрицу, столбцами которой являются векторы &у, Л&;, ... Oy = [ôz^&;-; \АП~'Ь]. (6.387) Уравнение (6.386) сведется тогда к уравнению 6;Л/(/) = 0 для всех /2Ь (6.388) Но из соотношения (6.384) следует, что р* (/) 0. Поэтому для выполнения условия (6.388) необходимо, чтобы матрица О;Л была выро¬ жденной. Таким образом, должно быть det (буЛ') = (det Л) (det G/) = 0. (6.389) Уравнение (6.389) выполняется, если или det Л = 0, (6.390) или (и) det Gt = 0. (6.391) Если det Gj = 0, то G, вырождена; это означает, что система х (/) = = Ах (t) + By (/) не является нормальной системой (см. определе¬ ние 4.15). Итак, если линейная система х (/) = Ах (/) + Ви (/) не является нормальной, то задача на оптимум расхода топлива вырождена. Предположим теперь, что система нормальна (б/ ф 0 для любого /). Задача может оказаться вырожденной, если det Л = 0, т. е. когда матрица системы Л вырождена. Л может быть вырождена в том случае, если хотя бы одно из собственных значений Л равно 0 (почему?). Это означает, что система обладает способностью интегрировать. Таким образом, мы доказали следующую теорему. Теорема 6.13. Достаточные условия нормальности задачи 6.26 или необходимые условия вырожденности задачи 6.26. Достаточным условием нормальности задачи 6.26 является det (б/Л ) 0 для всех / = 1, 2, ... г, (6.392) где G^ определяется уравнением (6.387). Далее, если задача 6.26 выро¬ ждена, необходимо, чтобы det (О'., Л') = 0 для некоторых / = 1,2».. г. Итак, если система х (/) = Ах (/) + Bu (t) нормальна и Л — невыро¬ жденная матрица, то задача 6.26 является нормальной задачей на опти¬ мум расхода топлива согласно определению 6.11. В общем случае нельзя доказать, что соотношение (6.392) является также и необходимым условием нормальности задачи на оптимум расхода 1 Отметим, что точно такая же матрица была использована в задаче об оптимальном быстродействии [см. (6.158)]. 398
топлива. Как мы увидим в гл. 8, существуют системы, для которых задача на оптимум расхода топлива для одних начальных условий вырождена, а для других — нормальна. В задаче об оптимальном быстродействии мы показали, что для нор¬ мальной задачи оптимальное управление единственно (см. теорему 6.7 и упражнение 6.7). То же справедливо и для задачи на оптимум расхода топлива. Другими словами, если задача на оптимум расхода топлива нор¬ мальна, то оптимальное управление (если оно существует) единственно. Следующая теорема строго устанавливает этот результат. Заметим, что ее доказательство аналогично доказательству теоремы 6.7. Теорема 6.14. Единственность оптимального по расходу топлива управления для задачи 6.26. Если задача на оптимум по расходу то¬ плива 6.26 нормальна, то оптимальное управление (если оно существует) единственно. Доказательство. Предположим, что и* (/) и и* (/) — два различ¬ ных оптимальных по расходу топлива управления, переводящих | в Ѳ за одно и то же время Tf. Пусть х* (/) и х* (/) — различные траекто¬ рии, начинающиеся из ?. Так как оба управления и* (/) и и* (/) предпо¬ лагаются оптимальными по расходу топлива, то имеем т г T г S Si"/*= J SI"*(оIdt- и /=1 и / = 1 Решения х* (/) и х* (/) выражаются уравнениями х* (t) — eAt х* (/) = е- | + е~АхBu* (x)dx\ и J е~Ах Ви* (т)гіт. и г (6.393) (6.394) (6.395) При t — Tt должно выполняться конечное условие х* (Tf) -= х* (Tf) = Ѳ, (6.396) и поэтому имеет место следующее (векторное) равенство: т т \ e~AtBu* (t)dt = e~At Bu* (t)dt. и и (6.397) Пусть р* (t) соответствует и* (t) и х* (t). Полагая л = р* (0), имеем р*(/) = е~л''л. (6.398) Из необходимых условий известно [см. (6.372)], что É \и* (/)| + (Ах* (t), p*(t)) + (Bu* (t), p*(t)) < /=1 < É I "/* I + P* (0) + СВ«* (0. P* (0). (6.399) так как соотношение (6.372) справедливо для всех и (t) и, в частности, для и* (/). Мы предположили, что и* (/) и и* (/) различны, а задача на оптимум расхода топлива нормальна. Предположение о нормальности означает, что неравенство (6.399) является строгим, если только и (/) и (/). (6.400) 399
Поэтому выражение (6.399) сводится к строгому неравенству 2 I «*(/)! + (Ви* (/), р* (0)<2 + Р*(/)) (6.401) /=1 /=1 в случае, если имеет место условие (6.400). Если проинтегрировать обе части выражения (6.401), то для различ¬ ных U* (0 и и* (/) получим j + J (Яя* (о, р* (оп/< и /=1 и TJ ' Tf <J 21 «;*(/) I d/ r J (Bu* (t), p'^dt. (6.402) и /=1 и В силу выражения (6. 393) Td J {Bu* (f), р* (t)) dt < J (Bu*(t\ p*(t))dt. (6.403) ü U Рассмотрим равенство (6.397), откуда образуем скалярное произве¬ дение: <^г, e~AtBu* (/) dt^ - j'e-At Ba* (t) dy>. (6.404) где л = p* (0). Так как л — постоянный вектор и по выражению (6.398) имеем л: = e+A'zp* (/), то можно видеть, что равенство (6.404) сводится к уравнению Tf [ {Ви* (/), р* (/)) di = J {Ви* (/), р* (/)) dt. (6.405) и и Таким образом, предположение о том, что управления и* (t) и и* (/) различны и оптимальны по расходу топлива, привело к противоречивым соотношениям (6.403) и (6.405). Следовательно, и* (0 = и* (0 для всех /€ [0, Tf] (за исключением, возможно, моментов переключения). Таким образом, оптимальное управление единственно. Читатель, видимо, заметил, что получить строгое неравенство (6.402) нам позволило предположение о нормальности системы. Если задача не является нормальной, то соотношение (6.402) не будет строгим неравен¬ ством, даже если и* и и* различны. Итак, в этом параграфе мы сформу¬ лировали задачу на оптимум по расходу топлива (задача 6.26) и необхо¬ димые условия в теореме 6.12; получили достаточные условия нормаль¬ ности задачи на оптимум по расходу топлива (теорема 6.13) и использо¬ вали нормальность при доказательстве теоремы 6.14. Было бы интересно знать, имеем ли мы дело с задачей, решение кото¬ рой единственно (если оно существует). Однако с точки зрения отыска¬ ния оптимального по расходу топлива управления при помощи необходи¬ мых условий было бы еще более полезно установить, одно ли управление удовлетворяет всем необходимым условиям (т. е. единственно ли экстре¬ мальное управление). Мы уже обсуждали важность единственности экстре¬ мальных управлений для случая задачи об оптимальном быстродействии. 400
Напомним эти положения, чтобы мотивировать теорему единственности, которую мы докажем в этом параграфе несколько позднее. Предположим, что оптимальное по расходу топлива управление един¬ ственно. Это, естественно, означает, что поверхность, характеризующая расход топлива, имеет вполне определенный абсолютный минимум. Мы не знаем, есть ли другие относительные минимумы. Если имеется много управлений, удовлетворяющих всем необходимым условиям теоремы 6.12, то, кроме абсолютного минимума, может иметь место и относительный (локальный) минимум. В этом случае, чтобы отличить управление, соот¬ ветствующее абсолютному минимуму, мы должны вычислить расход топ¬ лива, требующийся для каждого управления, удовлетворяющего необхо¬ димым условиям, и сравнить эти расходы. Естественно, что управление с наименьшим расходом топлива и будет искомым оптимумом. Следующая теорема устанавливает, что предположения, которые гарантируют един¬ ственность оптимального по расходу топлива управления, также гаран¬ тируют существование только одного управления, удовлетворяющего начальным условиям. Эта теорема (вместе с теоремой 6.12) окажет нам значительную помощь в процессе отыскания оптимального управления. Сформулируем строго теорему единственности. В формулировку тео¬ ремы для полноты мы включили также необходимые условия. Теорема 6.15. Единственность экстремальных управлений для задачи 6.26. Пусть Tf — заданное положительное время, | — начальное состояние и О — конечное состояние, необязательно начало координат. Предположим, что и (і) и и (/) — два допустимых экстремальных управ¬ ления. Более строго, предполагаем, что: а) решения системы х (О их (/) таковы, что x(t) соответствует х (/) = А х (/) Bu(t\ х(0) = |; (6.406) х(/) соответствует х(/) Ax(t) -|- Bu(t\ х(0) = (6.407) x(Tf)-x(Tf)-0; (6.408) б) существуют соответствующие дополнительные переменные р (/) и р (?) [первая соответствует и (t) и х (/), вторая — и (t) их (/)], удов¬ летворяющие следующим дифференциальным уравнениям p(t) = + А 'р (/); р (0) = л (неизвестное); (6.409) p(t) =■ — A'p(t); р (0) = л (неизвестное), (6.410) так что р (/) = е~А f л; (6.411) р(/) = ё~А (6.412) в) имеют место следующие соотношения (почему?) для всех « (t) é Q и / € [0, 7Д: ІІМОІ + (Bu{t), Р(/)) (Л«(0, 0(0); /-1 (=1 (6.413) 2 |и, (/)| -t- (£«(/), />(/)) <2 -f- (Bu(f), pit)). ■ /=1 (6.414) 401
Если задача на оптимум расхода топлива нормальна (см. определе¬ ние 6.11), то «(/)=»(/) для всех t6 [0, Tf], (6.415)1 Последнее и означает единственность экстремального управления. Q^x(T!)^eAT‘ Bu(t)dt ; Доказательство. Из выражений (6.406)—(6.408) находим ті и (6.416) Ѳ = x(Tf) = еА1 ' J л - g -Ь J e~AtBu(t)dt . (6.417) ATf Так как матрица e z невырожденная, получаем векторное Tf . lf J e~At Buifidt =У e~At Bu(t)dt U U равенство (6.418) Помножим скалярно обе части равенства (6.418) сначала на на л и получим (как?) соотношения If ~ ~ ~ е At Bu(t)) dt = J (л, e AtBu(t))dt\ U AtBu(t)) dt = J (л, e~At Bu(t)) dt. Ü U Отсюда ввиду соотношений (6.411) и (6.412) получим Tf ~ . Tf J (p(t), Bu(t))dt = ^ (p(t), Bu(t)}dt- U U T T f f J (p(t), Bu(t))dt=\ (p(t), Bu(t))dt. л, а затем (6.419) (6.420) (6.421) (6.422) и о Допустим теперь, что и и и отличны друг от друга. Если два экстре¬ мальных управления различны и задача на оптимум по расходу топлива нормальна, то из соотношения (6.413) при и (0 и (/) найдем 2 I и, (О I -+ (Я« (/), р (0) < 2 I «/ Ч)I + {Bu (t), p(t)). (6.423) /=1 /=1 Это неравенство должно выполняться для любых допустимых управ¬ лений и (/), в том числе и для и (/) = и (t). Используя аналогичные рассуждения, из условия (6.415) заключаем, что должно иметь место нера¬ венство г г 2 I «/ (И I + {Ви (/), р (t)) < 2 I (0 I 4 {Ви (t), р (t)/. (6.424) / = 1 і=\ 1 За исключением, возможно, моментов переключения. f 402
Складывая неравенства (6.423) и (6.424), получим неравенство ptf)) + p^<(Bu(t\ p(t\) + (Bu(t), p(t)}, (6.425) которое справедливо при и (/) =4 и (t). Выражение (6.425), в свою очередь, дает неравенство J [<В«(0, p{t)) 4- {Bu(t), p(ty)]dt<_ О Tf < J ((£«(/), P(O) + (B»(t). p(t))]dt. (6.426) U Таким образом, из предположений о нормальности задачи и о том, что и и и различны, вытекает строгое неравенство (6.426). С другой сто¬ роны, необходимые условия требуют, чтобы удовлетворялись соотноше¬ ния (6.421) и (6.422). Складывая правую часть соотношения (6.422) с левой частью соотношения (6.421), а также их левые части, получим следующее равенство: Tf J р(0) -J- p(t))]dt = О Tf -J [(BÙ(f), p(t)) 4- (Ba(t), p(t))]dt. (6.427) U Но соотношения (6.426) и (6.427) противоречат друг другу. По этой причине и и и не могут быть различными. Таким образом, единственность экстремальных управлений доказана. Обе рассмотренные теоремы единственности основывались на том, что задача об оптимуме расхода топлива предполагалась нормальной. В тео¬ реме 6.13 мы изложили достаточное условие нормальности задачи. Заме¬ тим еще раз, что это условие не является необходимым. Может оказаться, что задача нормальна даже тогда, когда не выполняется достаточное условие. Возможно также, как мы увидим в гл. 8, что задача для неко¬ торых начальных условий нормальна, а для других — нет. В следующем параграфе сформулируем несколько других классов задач на оптимум расхода топлива, которые представляют собой матема¬ тическую формулировку иных физических положений. Упражнение 6.21. В § 6.5 мы доказали (теорема 6.8), что если собственные значения матрицы А — действительные числа, то каждая функция (&/, р* (0) имеет не более п — 1 нулей. Используйте эту теорему, чтобы установить верхнюю границу числа переключений для нормальной задачи на оптимум расхода топлива. Упражнение 6.22. Попробуйте показать, что соотношение (6.392) в теореме 6.13 является также необходимым условием нормальности задачи 6.26. Почему этого нельзя сделать? Можно ли установить дополнительные предположения, при которых соотноше¬ ние (6.392) станет необходимым условием? Упражнение 6.23. Еще раз рассмотрите линейную систему х (t) — Ах (t) 4- Bu (t)\ начальное состояние £, конечное состояние Ѳ и конечное время Tf связаны уравнением £ = а т ' ~ е /Ѳ. Найдите оптимальное по расходу топлива управление. Объясните физический смысл ответа. Является ли это оптимальное управление единственным и в том случае, когда матрица А вырождена? Упражнение 6.24. Достаточные условия теоремы 6.13 получены для задачи 6.26. Предположим, что в формулировке задачи 6.26 мы заменили конечное состояние Ѳ произ- 26* 403
вольной областью S, и рассматриваем задачу об оптимальном расходе топлива при пере¬ воде JbS в течение заданного или незаданного времени. Как вы считаете, останется ли в этом случае соотношение (6.392) достаточным условием нормальности? Объясните данное положение. Упражнение 6.25. Рассмотрите линейную систему с переменными параметрами вто¬ рого порядка: X. (/) = х2 (Л; 1 . ' 2 (6.428) Считайте, что | Uj (t) | sc 1 для всего 'и х(/0) = £ задано, а функционал для расхода г/ топлива имеет вид J | и It) | dt(Tt —фиксировано; и дане конечное состояние 6. Можете ли и вы получить достаточные условия для a (t), b (/), с (/), при которых задача на оптимум рас¬ хода топлива нормальна? 6.15. ДОПОЛНИТЕЛЬНЫЕ ФОРМУЛИРОВКИ И ФУНКЦИОНАЛЫ В этом параграфе мы кратко рассмотрим различные варианты форму¬ лировок задачи на оптимум расхода топлива. Необходимость таких вариан¬ тов возникает из-за внутренней связи между временем перехода и израс¬ ходованным топливом. Может случиться, что в одном случае мы захотим зафиксировать время перехода априори; во втором случае мы захотим указать лишь верхнюю границу времени перехода, а в третьем наложить ограничения по расходу топлива и потребовать минимального по времени решения. В любом из конкретных положений проектировщик должен выбрать формулировку, которая лучше всего подходит для данной задачи и при этом получается возможно более простой закон управления. Чтобы проиллюстрировать эти положения, мы сформулируем ряд задач об оптимальном управлении, в которых система, область ограни¬ чений управления, начальное состояние и область S для всех задач одинаковы, а затем установим особенности каждой из формулировок. Дана система с зависящими от времени коэффициентами: x(t) = f [*(/)] -f В1Х (/)] и (/). (6.429) Дана область ограничений Q в Rr: Q- (и(/):|г//(/)| <1, / = 1, 2. ... г}. (6.430) Заданы функционал для расхода топлива Т г F (и) = j 5} (6.431) и /=1 и начальное состояние |, а также область S (в фазовом пространстве /?п). Найти допустимое управление, переводящее | в S, которое: минимизирует функционал для расхода топлива F (и) при незадан¬ ном Т (задача 6.2в); минимизирует функционал F (и) при T —Tf, Tf— фиксировано (задача 6.2г); минимизирует функционал F (и) при T <Tf, Tf — фиксировано (задача 6.2д); минимизирует время Т при ограничении F (и) С Ф, где Ф — задан¬ ная положительная постоянная (задача 6.2е); минимизирует функционал 7[ т ) J (и) -- kT -4- F (и) — J sZ? д- I Uj ( t) IZ dt, и I J где T не задано и k — заданная положительная постоянная (задача 6.2ж). 4 04
Мы уже обсуждали задачу с незаданным временем 6.2в и задачу с фиксированным временем 6.2г. Задачи 6.2д и 6.2е, по сути дела, проти¬ воположны друг другу. В задаче 6.2д мы хотим минимизировать расход топлива для заданного верхнего предела времени перехода, в то время как в задаче 6.2е — минимизировать время при заданном верхнем пределе расходуемого топлива. Наконец, в задаче 6.2ж представляет интерес мини¬ мизация линейной комбинации из приведенного времени и потребляемого топлива. Лучший путь выделить сходства и различия этих пяти задач состоит в том, чтобы рассмотреть необходимые условия. Если сделать это, то обна¬ ружится, что для каждой задачи вид или характер оптимального управ¬ ления остаются теми же самыми, а различия учитываются условиями трансверсальности. Условимся использовать индексы в, г, д, е, ж для величин, относя¬ щихся к задачам 6.2в; 6.2г; 6.2д; 6.2е и 6.2ж соответственно. Итак, пере¬ ведем каждую задачу в задачу с нефиксированным временем, добавив к n-мерному фазовому пространству еще одну переменную (см. § 5.14). Задача 6.2в является задачей с нефиксированным временем и поэтому в переформулировке не нуждается. В задачах 6.2г и 6.2д определим дополнительную переменную х,г+1, положив хп+і (/) - /, (6.432) причем хп+1 удовлетворяет дифференциальному уравнению вида Хп+1 (/) = 1 (6.433) и начальному условию хп+1 (0 = 0. (6.434) В задаче 6.2г определим область Sa в п + 1-мерном пространстве как 5г-= !(х, x„+l):xÇS и хп+І = Tf}. (6.435) В задаче 6.2д определим область Sd в п + 1-мерном пространстве как Sd=i(x; xn+1):x^S и xn+1 Q [0, Г,]}. (6.436) В задаче 6.2е ограничен расход топлива, и для него определим допол¬ нительную переменную хп+1 (/), как Г г хп+1(/) j S (6.437) и / = ] В этом случае хп+1 удовлетворяет дифференциальному уравнению *я+1(0 = 2 IMZ)I (6.438) /=1 и начальному условию xn+î (0) - 0. (6.439) Для этой задачи (6.2е) определим область Se в п + 1-мерном про¬ странстве в виде xn+1):xQS и х„_1 |0. ф]). (6.44Э) Задача 6.2ж относится к задачам с нефиксированным временем без дополнительных ограничений и поэтому переформулировать ее не тре¬ буется. 405
Запишем теперь для каждой из задач функции Гамильтона. Легко видеть, что они определятся соотношениями Н,= 2|«/(0І + (/[^(01, p(t)) + (B[xp(f)',-, (6.441) /=1 Нг = 2 |«/(0І + (f]x(t)],p(t)) 4- (В [X (t)]ti(t),p[t)) -h \ (6.442) /=1 нд = s I «/ (01 + {f \x (/)], p (/)) + (B\x (/)] и (/), p (/)) 4- 1 • A, (/); (6.443) /==1 Ht = 1 4 (/ |x (01. P (0) + {В [X (/)] и (/), p (/)) 4 2 |«/ (0I Phi (/); (6.444)’ A = * + 2 I «/(01 + (/l*(0L P(0> 4 (B|x(0J»(0. p(0>- (6.445) /=1 Далее, мы покажем, что дополнительные переменные рп+1 (і), входя¬ щие в уравнения (6.442)—(6.444), являются постоянными: ₽"+' <'> - - -dSiF - °’ (6'446) Л+-0; (6'447) Рп+М)- (6-448) олп+і \Ч и поэтому Рп-\Л (^) “ ^2 9 pdn+i(t) — kd; ■ (6.449) РпЦ-1 (() = где k3, kd и ke — некоторые постоянные. Таким образом, различные функции Гамильтона даются следующим уравнением, которое написано таким образом, чтобы указать общие элементы всех гамильтонианов: 0 + 21 /=1 uz(/)|; Н. + 2 1 /=1 |«/(0І; нд • = </ lx (01. Р (0) + (В [X (/)] и (0, Р (0) + + 2 1 /=1 + (0І; (6.450) не 1 ~ь ke 2 І«/ (01; /=і нж 21 /=і «/(01- 1 Первый член появился из-за того, что в задаче 6.2е функционал стоимости равен \*dt, так как мы ищем решение, оптимальное по быстродействию. е 406
Читатель, видимо, заметил, что функциональная зависимость каждого из гамильтонианов от состояния х (/) и дополнительной переменной р (/) одинакова во всех сформулированных задачах. Различия между этими пятью задачами отражают только пять констант, входящих в функции Гамильтона. Легко видеть, что управление, абсолютно минимизирующее гамиль¬ тониан (т. е. //-минимальное управление), определяется уравнением а°(0 - —DEZ [В' [х(0] P (0Î (6.451) для задач 6.2в, 6.2г, 6.2д и 6.2ж, а для задачи 6.2е — уравнением ««(/) = —DEZ [J- В' [X (t)]p (/)}. (6.452) Таким образом, если каждая из задач нормальна, то оптимальное управление (если оно существует) должно быть «трехуровневой» (+1,0 и —1) кусочно-постоянной функцией времени. Это, конечно, не означает, что оптимальные управления одинаковы, так как в общем случае они различны. Однако для каждой нормальной задачи «вид» оптимального управления одинаков. Мы здесь не будем обсуждать остальных необходимых условий. Нам кажется, что читателю более полезно сделать это самостоятельно. В этом случае он обнаружит, что канонические уравнения окажутся (функцио¬ нально) теми же самыми, так же как и некоторые из условий трансверсаль¬ ности (например, дополнительная переменная в конечный момент времени должна быть нормальна к S). Оптимальные управления для каждой из за¬ дач будут различны из-за того, что различны постоянные k, k$ и ke. Упражнение 6.26. Рассмотрите задачи 6.2в—6.2ж: а) выпишите необходимые условия; б) объясните сходства и различия в необходимых условиях; в) предположите, что одна из задач оказалась вырожденной; как вы думаете, следует ли из этого, что и все остальные задачи окажутся вырожденными? Объясните это положение; г) покажите, что оптимальное управление для задачи 6.2г будет то же, что и для задачи 6.2в или для задачи 6.2г; д) рассмотрите задачу 6.2ж. Как вы думаете, можно ли подобрать значение постоян¬ ной k таким образом, чтобы оптимальные управления для этой задачи и для задач 6.2в—■ 6.2е были одинаковы? Упражнение 6.27. Предположим, что система (6.429) есть линейная инвариантная во времени система X (/) = Ах (/) + Bu (t) и область S — единственное состояние Ô. Попробуйте найти необходимые или достаточные условия нормальности для каждой из задач, а также условия нормальности, являющиеся одновременно необходимыми и достаточными. Попробуйте найти условия, гарантирующие единственность оптимального управления. Попытайтесь найти условия, гарантирующие единственность экстремального управ¬ ления. Кратко обсудим теперь для каждой из задач структуру оптимальной системы управления с обратной связью. Будем считать, что все задачи нормальны. В § 6.6 мы без точных доказательств обсуждали существо¬ вание функций переключения. Те же аргументы можно привести и для задач на оптимум расхода топлива. Необходимо убедиться, что для каждой задачи существует функция от состояния системы х (/) (она может зави¬ сеть также и от остальных переменных), которая и будет определять управление до тех пор, пока задача является нормальной. Для определен¬ ности укажем: 1. Для задачи 6.2в существует векторная функция переключения he [х (/), S] такая, что оптимальное управление выражается в виде ae*(/)-DEZ(Ae[x(/), 5]}, (6.453) и поэтому система с обратной связью инвариантна по времени. 407,
2. Для задачи 6.2г функция переключения зависит от состояния х (/), области S и времени Tf — t, которое требуется для перевода х (/) в S. Таким образом, оптимальное управление и* (t) выражается как и* (/) = DEZ {he lx(Z), S, t, Tf], (6.454) и система управления с обратной связью оказывается зависящей от вре¬ мени. 3. Для задачи 6.2д функция переключения в общем случае зависит от времени Tf—t, требующегося для перевода х (/) в S. Таким образом, оптимальное управление и* (0 выражается в виде (t) = DEZ {hd [лг(0. 5, ^Л)}. (6.455) 4. Для задачи 6.2е функция переключения в общем случае зависит от топлива, израсходованного на интервале [0, /], т. е. от t г F (t) = J 2 ІМТ)І (6.456) о /=і и от верхнего предела по топливу Ф. Итак, оптимальное управление выра¬ жается как функция #*(/) - DEZ [hF [х(/), S, Л(/),Ф]. (6.457) В этОхМ случае система явно от времени не зависит, хотя и надо иметь в виду ее зависимость от F (/). 5. Для задачи 6.2ж функция переключения зависит только от состоя¬ ния X (/) и области S. Таким образом, система с обратной связью будет для задач 6.2в—6.2ж при условии, что задачи нор.мальны инвариантна по времени, и для любого заданного значения константы /г оптимальное управление будет выражаться в виде - DEZ {йж [*(/), S]). (6.458) Структура системы с обратной связью для задач 6.2в—6.2ж показана на рис. 6.18. Мы предполагаем, что задача нормальна. В каждом случае фазовые координаты (переменные состояния) xr (t), х2 (/), . . ., хп (/) вводятся в систему, обозначенную «ВМ» (вычислительная машина). Допол¬ нительными входами в машину являются область S, время /, время Tf, топливо F (/) по функционалу (6.456), предел по расходу топлива Ф. Выходами машины являются компоненты hr, h2, . . ., hr функции пере¬ ключения й, функциональную зависимость которой от состояния и т. д. л,08
иллюстрируют уравнения (6.453)—(6.458). Операция «dez» выполняется нелинейными элементами /??, 7??, . . R!r\ характеристики которых представляют собой характеристики поляризованных реле с зоной нечув¬ ствительности. Блок-схема показывает структуру системы управления с обратной связью. О различиях между задачами «заботится» машина, которая выдает соответствующие функции переключения. В гл. 8 мы детально рассмотрим ряд задач на оптимум по расходу топлива и проиллюстрируем решения блок-схемами полученных опти¬ мальных систем, а также обсудим их особенности с инженерной точки зрения. В следующем параграфе мы подытожим основные положения § 6.11 — 6.15 и приведем ряд упражнений. Цель этих упражнений дать возмож¬ ность читателю «прочувствовать» геометрические свойства задач на опти¬ мум по расходу топлива. Нам кажется, что основные геометрические понятия § 5.21 и обсуждение геометрических представлений, связанных с оптимальными по быстродействию системами в § 6.2 и 6.7, дают доста¬ точно исходной информации для того, чтобы читатель смог рассмотреть эти понятия для задач на оптимум расхода топлива самостоятельно. 6.16. КОММЕНТАРИИ В предыдущих пяти параграфах мы обсуждали задачу на оптимум расхода топлива. В § 6.15 мы привели пять различных формулировок, отражающих взаимосвязь между временем перехода и потребляемым топливом. Общей характеристикой всех формулировок является то, что функ¬ ция Гамильтона линейна относительно управляющих переменных щ (/) и | и,- (7)1. По этой причине из необходимых условий следовало, что опти¬ мальное управление (если оно существует) должно быть кусочно-постоян¬ ной функцией времени с тремя уровнями (+1,0 или —1) при условии нормальности задачи (см. определение 6.11). С физической точки зрения управления, оптимальные по расходу топлива, экономят его на тех временных интервалах, где никакого управ¬ ления не прикладывается. Система управляется таким образом, чтобы «сжигание» топлива всегда приводило к наиболее эффективному движе¬ нию при заданном количестве топлива. Это, естественно, тот случай, когда задача нормальна. В гл. 8 (см. § 8.10) мы увидим, что в частных вырожденных задачах оптимальное управление оказывается не с тремя уровнями (+1, 0, —1), а с пятью уровнями (+1, + /г, 0, —k, —1, где 0 < k < 1). Общие теоремы существования для различных сформулированных задач до настоящего времени не доказаны Г Это существенное ограниче¬ ние, так как нельзя быть уверенным в том, что решение существует. Мы покажем на конкретных примерах в гл. 8 некоторые из способов, кото¬ рые можно использовать на практике. Читатель может опустить остаток гл. 6 и рассмотреть конкретные задачи на оптимум расхода топлива в гл. 8. Упражнение 6.28. Рассмотрите задачу 6.2в и обсудите ее геометрическую интерпрета¬ цию аналогично § 6.2. При этом может быть полезно: определение переменной х0 (t) = t г ~ И использование ПОНЯТИЯ о достижимых состояниях в новом (п + 1)-мер- U / = 1 ном пространстве. Обсудите существование и единственность управлений, оптимальных по расходу топлива в терминах свойств области S и множеств достижимых состояний в (п + 1)-мерном пространстве. Упражнение 6.29. Повторите упражнение 6.28 для задач 6.2г—6.2ж. 1 См. [43]. 409
Упражнение 6.30. Еще раз рассмотрите задачу 6.2в. Пусть F* (X) обозначает мини¬ мальное количество топлива, требующееся для перевода состояния х в S (если время не задано). Найдите множество состояний, которые требуют одинакового минимального коли¬ чества топлива для перевода в область S. Воспроизведите основные положения § 6.7 для отыскания геометрических свойств управления, оптимального по расходу топлива. Упражнение 6.31. Напишите дифференциальное уравнение в частных производных Гамильтона—Якоби для каждой из задач 6.2в—6.2ж. ЗАДАЧИ НА МИНИМУМ ЭНЕРГИИ 6.17. ВВЕДЕНИЕ R В этом и последующих трех параграфах мы рассмотрим различные стороны задачи о минимуме энергии. Термин «минимум энергии» отражает тот факт, что часто надо минимизировать величину, связанную с энергией электрического сигнала. Мы изложим строгие формулировки различных задач о минимуме энергии в § 6.18 и 6.20 и рассмотрим один интересный пример в § 6.19. Далее изучим конкретный класс задач о минимуме энергии в гл. 9, обосновав выбор функционала с точ¬ ки зрения управления. В оставшейся части настоящего параграфа для пояснения причин интереса к такого рода задачам мы внимательно рас¬ смотрим два примера. Пример 6.7. Найдем сигнал, который передает заданное количество энергии в нагрузку. Конкретно, рассмотрим простую /?С-цепочку, показанную на рис. 6.19. Подсоединим сопро¬ тивление RH к выходу /?С-цепочки. Пусть (/) обозначает напряжение на сопротивлении нагрузки RH, а и (t) — входное (или управляющее) напряжение. Прежде всего, напишем дифференциальное уравнение первого порядка для цепочки: RRhCxi (t) 4“ (R + Ru) хі (О == Rhu (f)- Рис. 6.19. /?С-цепочка из примера 6.7 (6.459) Примем, что , RRHC ’ RC * (6.460) Тогда уравнение (6.459) запишется в виде х1 (t) — —ax1 (t) 4- bu (t). Предположим, что при t — 0 конденсатор С не заряжен, т. е. (0) = 0. Энергия Ен, рассеиваемая на RH за время [0, 7], равна т о (6.461) (6.462) (6.463) Энергию, подводимую ко входу, найдем по балансу энергии. Энергия Ея, рассеиваемая на сопротивлении R: т Er = Д’ f 1« Ю - *1 (0J2 dt. (6.464) L\ J 0 Энергия Ес, запасаемая конденсатором, в свою очередь, равна т Ес = С J xj (t) X! (t)-dt (6.465) и 410
^так как мгновенная мощность, подводимая к конденсатору С, равна СТаким образом, энергия, подводимая ко входу, равна Eex = EH + ER+Ec. (6.466) Если подставить соотношения (6.460) и (6.461) в выражение (6.466), то после алгебраи¬ ческих преобразований получим Т Бвх = 4г [ [U2 (Z) —X, (0 и (()] di. (6.467) A J о Теперь можно поставить следующую задачу о минимуме энергии. Дана система, описываемая уравнением (6.461) (см. цепочку на рис. 6.19). Предпо¬ ложим, что (0) = 0. Требуется найти вход и (/), который передает заданное количество т энергии Ен —— ^і(0 dt сопротивлению нагрузки и минимизирует при этом входную Ен J о энергию т £«=4- [ [«2 (0- u(t) x,(01 dt, 1\ J „ 0 где T задано. В этом примере величина т Евх = J и2 (t) dt (6.468) U связана (но не пропорциональна) с энергией, подводимой входным (или управляющим) сигналом и (t). Если бы отсутствовал конденсатор С, то величина Евх по выражению (6.468) была бы пропорциональна входной энергии. Рис. 6.20. Схематическое изображение двигателя постоянного тока с управлением по цепи возбуждения: хг (/) — угловое перемещение; J — момент инерции нагрузки; т (/) — мо¬ мент (вращающий); іа — постоянный ток якоря; ср (/) — магнитный поток; L — индуктив¬ ность обмотки возбуждения; R — сопротивление обмотки возбуждения; и (/) — напря¬ жение возбуждения Пример 6.8. Рассмотрим регулирование положения ротора двигателя постоянного тока с управлением по току возбуждения, показанное на рис. 6.20. Управляющее напря¬ жение и (t) прикладывается к обмотке возбуждения. В результате 1 дифференциальное уравнение, связывающее поток ф (/) с управляющим напряжением и (t) (приблизительно), запишется в виде Лф (0 + 7?ф (0 = М (0, (6.469) где ki — коэффициент пропорциональности. Предположим, что Ія — постоянный ток якоря. Тогда момент Л4 (0 будет связан с потоком ф (0 уравнением М (t) = Іг2Ія<р (t). (6.470) Будем считать, что трение пренебрежимо мало. В этом случае выходное угловое смещение xY (t) удовлетворяет дифференциальному уравнению Jxi{t) = М(/), (6.471) где J — момент инерции нагрузки и ротора. 1 Детальный вывод дифференциальных уравнений можно найти, например, в [84]. 411
Предположим также, что индуктивность возбуждения пренебрежимо мала, і. е. L = 0. (6.472) В этом случае система описывается дифференциальными уравнениями (/)=х2(/); x2(t) = ku(t), (6.473) где k — коэффициент пропорциональности. Допущение о малости L позволяет считать, что величина Т Евх = J и2 (/) dt (6.474) Ü пропорциональна энергии управления, которую дает входной сигнал. Для такой системы можно легко сформулировать задачу о минимуме энергии следующим образом Дана система уравнений (6.473) с начальными условиями (0) = х2 (0) = 0. Найти управление и (t), которое переводило бы исходное состояние в (Ѳг, 0) в течение заданного времени Т и при этом минимизировало функционал (6.474). Мы решим эту задачу в § 6.19 Целью двух последних примеров было показать, что функционал I J (и) = J ы2 (t) dt (SAIS) и часто связан с энергией сигнала и (t). С математической точки зрения функционал J (и) дает оценку величины «стоимости» управления. То обстоя¬ тельство, что подынтегральная функция и2 (/) есть квадратичная функция от и (/), имеет то очевидное значение, что мы не сильно «наказываем» систему в случае, если и (/) мало, но «строго наказываем» ее за большие управляющие сигналы и (/). В следующем параграфе сформулируем и решим весьма общую задачу о минимуме энергии. Вначале мы получим необходимые условия, а затем используем их для отыскания оптимального управления. 6.18. ЛИНЕЙНАЯ ЗАДАЧА С ЗАДАННЫМИ КОНЕЧНЫМ СОСТОЯНИЕМ И ВРЕМЕНЕМ ПЕРЕХОДА 1 В этом параграфе мы рассмотрим задачу о переводе начального состоя¬ ния линейной системы с переменными параметрами в начало координат 0 в течение заданного времени Tf. Будем считать, что управление по вели¬ чине не ограничено. Сначала сформулируем задачу, а затем получим необ¬ ходимые условия и, наконец, найдем оптимальное управление в виде фундаментальной матрицы. Точная формулировка этой задачи выглядит следующим образом. Задача 6.3а. Задана линейная, полностью управляемая система с переменными коэффициентами х (0 - А (/); х (/) --г- В (/) и (t), (6.476) где X (/) — состояние (n-мерный вектор); А (/) — матрица системы размера пХп; и (0 — управляющий вектор (размерности г); В (/) — матрица усилений размера пХг. Заданы начальное время /0 и состояние х(/0)=-|. (6.477) 1 См. 1104], [159], [149], [32], [153], [156], [6], [50], [75], [76], [107], [138], 1182], [184], [186], [193] и [202]. 412
Кроме того, задано конечное время Tf и конечное состояние 0. Пред¬ положим, что управление не ограничено. Дана положительно определен¬ ная симметричная матрица N (t) размера п + г X п Ь г, вида мал _ LiW' (0 : R (/) J (6.478) где Q (Z) — положительно определенная матрица размера пХп; R (t) — положительно определенная матрица размера /гХг; М (Z) — матрица размера пХг. Имеем функционал 1 /л* о L х /J х (0‘\ -И (/)./ dt — = 4") 1^(0. Q(0x(/)) •+• («(/). /?(/)«(/)) +2(лг(/), Л4(t)х(0)1 dt. и (6.479) Требуется найти управление, которое 1) переводит состояние g в 0 за фиксированное время Tf\ x{TfY-^ ; (6.48Э) 2) минимизирует функционал J (а) [см. выражение (6.479)1. Здесь следует обсудить выбор функционала J (и). Предположение о том, что N (Z) положительно определенна, гарантирует, что функционал J (и) положителен, если x(Z)^#(Z)^O для всех Z^[Z0, Tf], (6.481) Из предположения о положительной определенности N (Z) следует также, что Q (Z) и R (Z) положительно определенны (6.482) и, следовательно, существуют инвертированные матрицы jV’^Z), Q-1^) и R-^t). (6.483)1 Получим теперь на основе принципа минимума необходимые условия для этой задачи. Прежде всего образуем гамильтониан: H = H[x(t), p(t), a(t), Z]=4-<x(z)’ Q(t)x(t)) + + /?(/)«(/))+ (x(Z), 7И(/)«(/)) + + (A (/)*(/). />(/)) +(В (/)«(/), p(0). (6.484) Гамильтониан является квадратичной функцией от управления и (Z). Используя принцип минимума, можно доказать следующую теорему. Теорема 6.16. Необходимые условия для задачи 6.3а. Если и* (Z) — оптимальное управление и х* (Z) — оптимальная траектория, произве- веденная управлением (/), то существует соответствующая допол¬ нительная переменная р* (Z), удовлетворяющая условиям: а) состояние х* (Z) и дополнительная переменная удовлетворяют диф¬ ференциальным уравнениям вида х* (Z) - A (Z) х* (Z) В (Z) я* (Z); (6.485) р* (О - — Q (Z) х* (Z) — М (Z) я* (Z) — А ' (Z)р* (Z) (6.486) 1 См. § 2.15. 413
с граничными условиями х*(/)-|; х*(7\)-0; (6.487) б) для любых и (/) G Rr (так как и (t) не ограничено) и / £ [/0, Tf] справедливо соотношение вида Д-(х*(О, Q (/)**(/)) 4-^ («*(/), *(0«*(0> + 4 (а:* (/), М (I) и* (/)) 4 (Д (О х* (/), р* (/)) 4 4 W)«*(0. р*(/)) <4>-(х*(і), <?(0**(0) + + 4-<и(П, /?(/)«(/)> 4 U*(0, Ж(/)»(/))4 4 (Д (/)**(/), р*(0) + <В (/)»(/), р*(Ф (6-488) или, эквивалентно, Ц-<«*(/), R (/) «*(/)) 4- (х* (t), + + {B(t)a*(t\ р* (/)) <^-(«(/), R (/) «(0> + 4 (**(/), M(t) u(t)) 4 (B (/)«(/), /?*(/)}- (6.489) Упражнение 6.32. Проверьте теорему 6.16. Указание: используйте табл. 5.2, строку 6. Будем теперь применять второе необходимое условие (6.489) для полу¬ чения уравнения, которое единственным образом связывает управление и* (0 с X* (/) и р* (/). Этот шаг полностью аналогичен тому, который мы предпринимали для задач на оптимум по быстродействию и расходу топ¬ лива. Однако вскоре читатель обнаружит, что в этом случае мы не полу¬ чим вырожденных задач. Уравнение (6.489) означает, что функция ф [«(/)] = Ц-<«(0. R(0»(0)4 + + p*(t)) (6.490) имеет абсолютный минимум при и (/) = и* (/). (6.491) Так как и (/) не ограничено и ср [и (/) ] есть гладкая функция от и (t), « дф[«(О1 л можно наити минимум, полагая • =■• 0. Но -^И1 = /?(/)и(/)4Л1(/)а:*(/)4 B'(t)p*(t), (6.492) откуда сразу следует R (/) я* (/) 4- М (/) х* (/) + В' (/) р* (/) = 0. (6.493) Благодаря тому, что R (t) — невырожденная матрица [см. условие (6.483)1, получим и* (/) - — R1 (/) [М 4- В' (/)р* (/)]. (6.494) Для уверенности в том, что уравнение (6.494) определяет минимум, д2Ф Іи (01 нужно только проверить, является ли матрица —~ размера гХг 414
положительно определенной. Прямым вычислением с помощью уравне¬ ния (6.492) находим, что матрица ДХ'“(о" (6-495) положительно определена в силу предположений относительно задачи 6.3а. Теперь можно утверждать наверняка, что уравнение (6.494) одно¬ значно выражает и* (/) через х* (/) и р* (/). Так как соотношения (6.488) и (6.489) одинаковы, то уравнения (6.494) можно получить путем нахождения минимума функции Н [х* (/), р* (/), и (/), t] по и (/), так как = Л (0 « (0 + М (/) X* (о + В (t)p* (/) (6.496) и матрица а‘НІ>'(');Л'>“('1' <6'497) положительно определенна. Отметим три следующих обстоятельства. Замечание 6.13. Предположение о том, что R (t) [а не jV(/)] поло¬ жительно определенна, привело нас к уравнению (6.494). Далее, поло¬ жительная определенность/? (/) гарантирует, что уравнение (6.494) опреде¬ ляет единственный минимум (а не максимум или седловую точку) функции /7[х*(/), р*(/)а(0> П при »*(0- Замечание 6.14. Оптимальное управление и* (t) есть линейная функ¬ ция х* (/) и р* (/). Это происходит благодаря линейности системы, ква¬ дратичному характеру функционала и отсутствию ограничений величины управления и (/). Замечание 6.15. Задача нормальная, так как а* (/) однозначно опре¬ деляется х* (/) и р* (/). При я*(0 Ѵ=«(0 (6.498) второе необходимое условие сводится к строгому неравенству вида H[x*(t), p*{ty и* (t), /]</7[х*(/), р* (/),»(/), /]. (6.499) Следующий шаг состоит в подстановке выражения (6.494) в канони¬ ческие уравнения (6.485) и (6.486). В результате этого получается система 2п дифференциальных уравнений (упрощенных канонических уравнений) х* (/) - | Д (/) — Д (/) R1 (/) М (/)]х* (/) — Р* (О - (/) + м (t) R1 (О М (01 ** (0 + + [—Д' (/) + М (t)R-1 (О В’ (t)]p* (t). Для удобства определим матрицы ѴѴИ, IV12, W2i> W22 п X п, положив Wn(0 = WM = -B(t)R^(t)B' W21(t)=-Q(t) +MVïR-^Mtty, W22 (t) = -A! (0 + M (t) R1 (0 В' (/). Теперь уравнения (6.500) и (6.501) можно записать в виде ' X* (0 1 ГІѴП (0 і ѴИ12 (О I Г X* (/) 1 р* (о L іѵ2Г(7) і’іѵ22 (о J L р* (о J ' (6.500) (6.501) размера (6.502) (6.503) 415
Пусть Y (/і /0) — фундаментальная матрица системы (6.503) раз¬ мера 2пХ2я. Разделим матрицу Y (/, /0) на четыре матрицы размера пХп следующим образом: иг// /ч r^ii^ ^о) ! ^12 Ml (Л ^о) - [ ‘ (6’504) Решение (6.503) можно записать в виде x*(/)- Yn(/, M^(U + ^i2(7 МР*(/о); (6.505) Р*(0 = ^2і (Л Л))х*(Л;Н ^22 (Л ^о)Р*(М- (6.506) Необходимо, однако, чтобы х* (/0) = 1; •** (Tf) = 0. Из выраже¬ ния (6.505) получим ^12(Л, Мр*(/0)^-^в(Л. Ш- (6.507) Если матрица Yl2 (7\ /0) невырожденная, т. е. detY12(7y /о)^0, (6.5С8) то уравнение (6.507) можно разрешить относительно р* (/0) и подставить значение рЧ^) =--^(Th toïWutT), /о)s ((>.509) в уравнения (6.505), (6.506) и (6.494), что дает X (/) = I Yn (t, /0) _ Т12 (?, /Ü)Y11(7’;, Zu)|l; (6.510) X (/) - [Y21 (/, Zo) - Y22 (/, (о) Yn1 (Th t0) Yn (7’,, (0)] 1 (6.511) И и* (/) = — /?“'(/) (jf (/) [Yn (/, Z0)-Y1.(Z, to)Wnl(Tf, ^YntT}, ru)] + + [Y21(/, /o)-Y22(/, /ü)Y^1(7’/, /o)Yn(7\ ?o)|!t (6.512) Матрица Y12 (Tf, /0) не зависит от начального состояния. Она зави¬ сит от матриц А (/), В (t), М (/), /? (/), от начального времени /0 и от конечного времени Tf. Поэтому можно сформулировать следующую теорему. Теорема 6.17. Если оптимальное управление существует и матрица Y12 ^о) невырожденная, то оптимальное управление единственно и определяется уравнением (6.512). При этом существует только одно экстремальное управление. Доказательство. Если Y12 (7^; /0) невырождена, то из выраже¬ ния (6.509) следует, что существует единственное начальное значе¬ ние р* (/0), соответствующее |, t0 и Tf. Таким образом, х* (t) и р* (/) единственны, а поэтому и единственно управление u* (I). Это устанавли¬ вает единственность экстремального управления. Если, кроме того, опти¬ мальное управление существует, то оно должно быть равно и* (/) и по¬ этому и является единственным. Если же матрица YJ2 (Tf, /0) вырождена, то может существовать много начальных значений р* (/0) таких, что выполняется соотношение ' WntTf, t0)p* (Z0) = -Y11(7’/, /о) I (=1, 2, ... (6.513) В этом случае экстремальные управления не единственны; возможны другие оптимальные решения вместе с относительно оптимальными реше¬ ниями. Насколько известно авторам, необходимых или достаточных условий, а также необходимых и достаточных условий, из которых следо¬ вала бы невырожденность Y12 (Tf, t0), в литературе по управлению до настоящего времени не имелось. 416
Существует много направлений, по которым можно двигаться дальше. Можно найти функционал J (и*) и показать, что он удовлетворяет уравнению Гамильтона—Якоби; можно сформулировать задачу о движе¬ нии из заданного начального состояния в другое состояние или в область S, можно получить частные результаты для инвариантных во времени систем и т. д. В каждом случае линейность управляемой системы, квадратичный характер функционала и отсутствие ограничений управления по величине приведут к линейным уравнениям, при помощи которых легко получить развернутые уравнения для необходимых условий. С целью иллюстрации метода определения оптимального управления в следующем параграфе мы рассмотрим частный случай управления, отно¬ сящийся к системе второго порядка. Упражнение 6.33. Покажите, что предположение о положительной определенности матрицы N (/) по выражению (6.478) дает достаточное условие локальной оптимальности экстремального управления. Указание: см. § 5.8. Упражнение 6.34. Допустим, что оптимальное управление и* (t) существует и оно единственно. Покажите, что минимальное значение J (и*) [(см. функционал (6.479) ] выра¬ жается в виде = G (t0; 77)|), (6.514) где G (/0; 7\) —матрица размера пХп, не зависящая от £. Напишите уравнение для G (/0; Tf). Указание: подставьте выражения (6.512) и (6.510) в соотношение (6.479). Матрица G (/0; Tf) будет выражаться через интеграл от матрицы, зависящей от времени. Покажите, что из предположения о положительной определенности N (t) вытекает также положительная определенность матрицы G (/0; Tf). Покажите, что минимальное значение функционала J (и*) есть решение уравнения Гамильтона—Якоби. Упражнение 6.35. Рассмотрите линейную инвариантную во времени систему вида x(t) =Ax(t) + Bu(t) (6.515) с начальным состоянием х (0) = g. Предположим, что нам задана функция от времени Z (/), состояние Ѳ и время Tf такие, что г(0)=_-|; z(Tf)--=G. (6.516) Представим себе z (t) в виде желаемой траектории движения от | в Ѳ. Цель управ¬ ления — перевести систему, описываемую уравнением (6.515), из £ в Ѳ и сделать это так, чтобы X (/) было близко к z (t). Определим поэтому ошибку е (t), приняв e(t) = z(t)—x(t) (6.517) и рассмотрев функционал Tf («)=4“ J (°’Qe + (и Ru dt< <6-5i8> 0 где Q и R— положительно определенные постоянные симметричные матрицы; Tf задано. Найдите необходимые условия для оптимального управления. Полагая, что оптималь¬ ное управление существует, рассмотрите единственность оптимального и экстремального управлений. Покажите, что необходимо точно знать z (t) для всего [0, 7^]. Упражнение 6.36. Рассмотрите задачу, сформулированную в упражнении 6.35, и пред¬ положите, что z (t) есть решение известной однородной линейной системы z(t) =Fz(t); г(0) (6.519) для которого z(Tf) = Q. Покажите, что оптимальное управление tt* (t) требует знания матрицы F, но не требует знания всего решения z (t) для t £ [0, Tf]. 6.19. ПРИМЕР1 В этом параграфе мы рассмотрим различные виды управления с мини¬ мальной энергией для системы второго порядка. Уравнения движения системы могут описывать электродвигатель постоянного тока с управ- * 14 1 Материалы этого параграфа частично основаны на работе [86 J. 14 Атанс и др. 417
лением по цепи возбуждения, рассмотренный в примере 6.8. Далее полу¬ чим оптимальный закон управления для двух связанных критериев и под¬ робно рассмотрим некоторые особенности решений. Пусть имеем систему вида (6 52О) х2(0 = u(t)\ х2(0) = g2. J Будем считать, что величина управления и (/) не ограничена. ■ Мы хотим найти управление и (/), которое, во-первых, переводит начальное состояния (|х, £2) в (0, 0) за время Tf, т. е. (6.521) и во-вторых, минимизирует функционал Го Е =■ Е (и) = J и2 (t) dt, (6.522) 2 о7 где Tf задано. Чтобы найти оптимальное управление, начнем с отыскания управле¬ ния, удовлетворяющего необходимым условиям (т. е., экстремального управления). Первый шаг состоит в написании гамильтониана для системы (6.520) и функционала (6.522), который выражается в виде Н = (/) 4 х2 (0 Р1 (0 + и (t)p2 (/). (6.523) Экстремальное управление должно минимизировать гамильтониан. Так как он является квадратичной функцией от и (/), то экстремальное управление можно найти, полагая = 0 и проверяя, положительна ли 02/7 вторая производная Так как (6.524) и <6-525) то приходим к выводу, что экстремальным является управление ^(0 = -Р2(0; ^[0, Tf]. (6.526) Дополнительные переменные рг (t) и р2 (/) должны удовлетворять диффе¬ ренциальным уравнениям Pi(0 = -^=°; (6.527) OXi (t) = = (6-528) Пусть Л1 = Pl (0); л2 = р2 (0) (6.529) обозначают начальные значения дополнительных переменных. Решая уравнения (6.527) и (6.528), получим Рі (0 = = const; Р2 (^) — 2 ■■1 ■ л j t, (6.530) 418
Таким образом, экстремальным будет управление вида и (/) = —л2 + [0, Tf], (6.531) Из уравнения (6.531) вытекает, что оптимальное управление (если оно существует) должно быть линейной функцией времени с начальным значением и (0) = —л2 и наклоном Следующий шаг состоит, оче¬ видно, в определении nj и л2 через £2 и Tf. Подставим управление (6.531) в уравнения системы (6.520) и, проин¬ тегрировав, получим *1(0 = Ê1 + lit л2/2 + -g-Л,/3; Х2 (0 = +4" Л1*2- (6.532) Так как необходимо, чтобы (7^) = х2 (Tf) = 0, то из выраже¬ ний (6.532) и (6.521) находим, что лх и л2 однозначно определяются соот¬ ношениями ^1=^(2^ + ^^); (6.533) 1 f л2 =^(3£,+2^7». (6.534) Tf Экстремальное управление выражается формулой « (0 = - (3^1 + ^2Tf) + А (2^ i2Tf) t. (6.535) 7 f 1 f Управление (6.535) удовлетворяет необходимым условиям и, следо¬ вательно, является единственной функцией от g2, Tf и /. Мы также убедились, что для данной задачи оптимальное управление существует. Таким образом, можно заключить, что оптимальное управление един¬ ственно и выражается соотношением вида (6.535). Найдем теперь минимальную энергию Е*, требующуюся для оптималь¬ ного управления. Для этого подставим соотношение (6.535) в функцио¬ нал (6.522) и, проинтегрировав, получим Е* = Е* (£1( g2, Tf) = (3^ -Ь 3^7} + (6.536) Tf Для иллюстрации того, что выбор конечного времени Tf весьма кри¬ тичен, выберем начальные состояния Ві = 1, £2 1 и рассмотрим график зависимости Е* (1, —1, Tf) от Tfi как это показано на рис. 6.21. При значениях Tf << 2 энергия весьма велика, а затем энергия достигает точки перегиба при Tf = 3, и для Tf >> 3 минимальная необходимая энергия убывает медленно. Для Tf очень больших Е* ^2^/^. На рис. 6.22 показаны оптимальные траектории из начального состояния (1, —1) в (0, 0). Обратим внимание на значительные изменения, происходящие с увеличением Tf. Из рис. 6.21 видно, что прирост энергии между Tf = 3 и Tf = 10 очень мал. Траектории же отличаются существенно. С ростом Tf значительно возрастает перерегулирование. Это обсуждение обнаружи¬ вает исключительную важность чувствительности оптимальных задач к изменениям параметров. Очень часто малые изменения некоторых параметров (например, Tf) могут вызывать либо большие, либо малые изменения минимума функционала (или стоимости). В инженерных рас¬ четах должны учитываться эти положения. 419
Проверим далее, что минимальная энергия положительна для всех £і ¥= £2 ¥= 0- Выражение (6.536) можно записать в виде скалярного произведения Ъ, Tf) = (6.537) Матрица, входящая в скалярное произведение, положительно опре¬ деленна для любых значений Tf (сравните с упражнением 6.34). Таким образом, Е* 0. Рис. 6.21. График зависимости энергии Е* (£р Tf) от конечного времени Tf Рис. 6.22. Поведение оптимальных траек¬ торий, исходящих из (1, —1) при изме¬ нении Tf Если допустимы большие значения Tf, то управление можно осуще¬ ствить при помощи очень малого количества энергии. Легко видеть, что g2, 7}) = 0 (6.538) и limu(/) = 0, ^[0, T/l- (6.539) ту-» OO Но если управление и (/) мало, то траектория будет иметь очень большие перерегулирования (см. рис. 6.22). Из рис. 6.21 видно, что кривая Е* в зависимости от Tf имеет точку х гт х ^Е* Ь, Tf) перегиба. Легко обнаружить, положив = 0, что точка перегиба имеет место, когда удовлетворяется соотношение l.Tf = -3^. (6.540) Покажем теперь, что если сформулировать задачу о минимуме энер¬ гии как задачу с незаданным конечным временем, то необходимое усло¬ вие, состоящее в равенстве нулю гамильтониана в конечный момент вре¬ мени, определяет эту точку перегиба. Напомним, что гамильтониан [см. выражение (6.523)] равен н = 4 u2(0 + x2(/)p1(/) + u(/)p2(Z). (6.541) Пусть Т — неизвестное конечное время. Тогда необходимо, чтобы |«2(П \-х2(Т)Р1(Т)±и(Т)р2(Т)^0 (6.542) 420
и, кроме того, х2 (Т) = 0 и и (/) = — р2 (/) для всего t Ç [О, Т]. Следо¬ вательно, и (Т) = —р2 (Т), и поэтому соотношение (6.542) сводится к урав¬ нению |иа(П = 0 (6.543) или эквивалентному и (Т) = 0. Из соотношений (6.544) и (6.531) получим —л2 = 0. (6.544) (6.545) Из выражений (6.545), (6.533) и (6.534) можно найти, что начальные значения и £2 и конечное время Т должны удовлетворять уравнению Yâ (6^ + 2^Т) = 0. (6.546) Уравнение (6.546) удовлетворяется в двух случаях: Т — оо (6.547) или UT = -3^. (6.548) Таким образом, необходимые условия для задачи с незаданным конеч¬ ным временем привели к уравнениям (6.547) и (6.548). Мы показали, что случай, когда Т = оо, соответствует абсолютному минимуму Е*, т. е. Е* = 0. Отметим также, что уравнение (6.548) то же самое, что и (6.540), и поэтому соотношение (6.548) дает точку перегиба, а не минимум. Это, конечно, возможно, потому что, как мы уже отмечали (см. § 5.17, заме¬ чание 10), необходимое условие /7 = 0 соответствует экстремальным точ¬ кам, которые могут быть точками минимума, максимума, перегиба или седловыми точками. Отметим также, что задача о минимуме энергии с незаданным временем не имеет оптимального решения. Причина в том, что при Т = оо имеем и (t) = 0 для всех /, и нулевое управление никогда не переведет начальное состояние (|х, £2) в (0, 0). Можно найти оптималь¬ ные решения для задачи с заданным сколь угодно большим (но конечным) временем Tf и сделать Е* сколь угодно малой, но не равной нулю. Пре¬ дельное решение не может удовлетворять граничным условиям, и поэтому оптимальное решение не существует. Однако 8-оптимальное решение существует. Продолжим рассмотрение конкретных задач оптимального управле¬ ния, описываемых системой уравнений (6.520) по отношению к различным критериям преобразования. Цель оставшейся части данного параграфа — показать существование относительного минимума в некоторых задачах оптимизации. Для определенности поставим следующую задачу. Рассмотрим систему уравнений (6.520), т. е. систему Хі (/) = х2 (t); %і (0) = 1 ? (6.549) х2(/) = и(/); х2(0) = £2. J Рассмотрим также функционал т т А (и) --= kT + ^Д u2(t)dt = J [é +2.«2(/)J dt, (6.550) о о где Т не задано и k > 0. 421
Найдем управление, переводящее систему, описываемую уравне¬ ниями (6.549), из начального состояния (gx, g2) в (0, 0) и минимизирующее функционал (6.550). Очевидно, мы имеем дело с задачей с закрепленным концом и незаданным временем перехода. Функционал J^u) представляет собой 1 линейную комбинацию эквивалентного времени и потребляемой энергии. Эту задачу можно решить двумя способами. Один метод решения состоит в том, чтобы получить необходимые условия и продолжать реше¬ ние непосредственно. Другой метод состоит в том, чтобы решить постав¬ ленную задачу, полагая Т фиксированным и построить график зависи¬ мости J1 (и) от конечного времени 7, а затем найтѴі конечное время, для которого стоимость минимальна. Если приступить к задаче, полагая Т заданным, то член kT в функ¬ ционале Jг будет известной постоянной, и поэтому минимизация функ¬ ционала (6.550) с фиксированным Т эквивалентна минимизации энергии т ~ J и2 (t) dt. Поэтому управление, определяемое соотношением (6.535), о останется оптимальным и минимальное значение функционала [см. соот¬ ношение (6.536)] равно Л (Êi. h, T)^kT + ^ (зй + + $Т2). (6.551) Очевидно, что Jr является функцией конечного времени Т. Чтобы найти конкретное значение конечного времени Т, скажем Г* такое, что J1 (U U Т*) < J1 (h, U T)t (6.552) необходимо определить сначала экстремальные точки J± (£х, g2, Г), по¬ лагая, dJ1 т} = 0. (6.553) Отсюда получим (6.554) где для упрощения уравнений принято £ = 4-, ₽>0. (6.555) г Из выражения (6.554) после некоторых алгебраических преобразова¬ ний находим, что конечными временами, при которых функция Jг (gx, g2, Т) имеет экстремум, являются четыре решения уравнения г4 - р2 (Й?2 + 6^2? + 9й) = 0. (6.556) Обозначим эти четыре корня через Т19 Т2, Т3, Т4. Извлекая из обеих частей уравнения (6.556) квадратные корни, находим T1 = |(p^ + l/p4i+i2pU; т2 = 4 - /р2Й+ 12р^); Гз = 4 (-PÊ2 + Ѵр2Й- 12р^); = 4 “ ^W-!2PÊi) • (6.557) Сравните с задачей 6.2д. 422
Выделим теперь положительные конечные времена, соответствующие локальным минимумам Jt (£ь g2, Т). Условия —T)>Q (6.558) и Т > 0 (6.559) можно использовать для доказательства, что конечное время Т, (і = 1,2,3,4) соответствует локальному минимуму только в том случае, если О<т(. < —зф- (6.560) Ъ2 ИЛИ Т, > —6-І3-. S2 Если Ті удовлетворяется неравенству о< —зф-< ^< —бф-, (6.561) S2 S2 то это время соответствует локальному максимуму. Теперь покажем, что из необходимых условий для исходной задачи вытекают выражения (6.557). Прежде всего гамильтониан Нх [для системы уравнений (6.549) и функционала (6.550)1 равен о 1 Н1 = и2 U) + Piit) + u{t) p2(t), (6.562) , 2 где k p2 • Управление, минимизирующее гамильтониан, равно и (/) = —р2 (/). (6.563) Нетрудно видеть, что уравнения (6.527)—(6.535) остаются теми же самыми, только Tf заменяется на Т. Так как теперь мы рассматриваем задачу с незаданным временем, то необходимое условие Н± = 0 при t = Т дает соотношение 9 1 -ў + 4 (Т) + х2 (Т)Р1 (Т) -4- и (Т) р2 (Т) = 0. Но так как х2(Т) = 0 и и (Т) = —р2 (Г), то получим М(Т)=±А. (6.564) Из соотношений (6.564), (6.535), (6.533) и (6.534) находим Т2 = ± (fô2T + 3PL). (6.565) Отсюда видно, что четыре корня уравнения (6.565) в точности равны четырем конечным временам Т19 Т2, Т3, определяемым соотноше¬ ниями (6.557). Иначе говоря, из необходимых условий следует, что конеч¬ ные времена выражаются соотношениями (6.557). На основе предыдущего рассмотрения можно заключить, что необхо¬ димое условие Н = 0 дает нам только конечные времена, экстремизирую- щие Jх (£і, g2, ^). Это опять-таки вызвано тем, что необходимое усло¬ вие Н = 0 для задачи с незаданным временем является экстремальным условием (см. § 5.17, замечание 10), а не условием локального минимума. Продолжим отыскание оптимального решения. Идея этого состоит в том, чтобы определить, какие из четырех положительных времен Т19 423
T2, T3, T4 действительны, положительны и соответствуют локальному минимуму <71 (&!, £2, Т). После алгебраических преобразований можно придти к следующим выводам: 1) если и ^0 (6.566) или (6-567) то минимуму соответствует только время 7\. Следовательно, оптимальное управление единственно и конечное время равно 7\; 2) если Ё2 < 0 и < 0 (6.568) или Rt2 Ê2>0 и (6.569) то минимуму соответствует только время Т3\ оптимальное управление единственно, а конечное время равно Т3\ 3) если ?2>0 и - -^<^<0, (6.570) то времена 7\ и Т3 соответствуют двум локальным минимумам, тогда как Т2 соответствует локальному максимуму. В этом случае существуют два экстремальных управления, и поэтому может быть два оптимальных управления; 4) если Rt2 |2<0 и (6.571) то времена 7\ и Т3 соответствуют двум локальным минимумам, тогда как Т4 соответствует локальному максимуму. В этом случае существуют два экстремальных управления и, возможно, два оптимальных управ¬ ления. В двух последних случаях (3-м и 4-м) возможна неединственность оптимальных управлений. Убедимся 1 что существует множество (кри¬ вая) Гр на фазовой плоскости такая, что если (gx, |2) 6 Гр, то имеются два различных оптимальных управления. Одно из этих управлений тре¬ бует малого времени перехода и большой затраты энергии, а другое — большого времени перехода и малых затрат энергии (почему?). Область Гр определяется соотношением г₽ = {&, У : Л + (Зй н- 3^27\ + 12^1) = = 4-^3+ 4(3^-) -З^Тз + ЙТІ)), (6.572) Р Т з ) где 7\ и Т3 определяются уравнениями (6.557). Мы надеемся, что этот детально рассмотренный пример проиллюстри¬ ровал шаги, связанные с отысканием оптимальных управлений, и значе¬ ние необходимых условий принципа минимума. Следующие упражнения предназначены для того, чтобы познакомить читателя с дополнительными свойствами простых задач об оптимальном управлении. 1 См. [86]. 424
Упражнение 6.37. Пусть 0 = 12 и £2 = 2. Начертите J1 (glt g2, Т) в зависимости от Т для следующих значений — —10; |х = —5; £х — —4; — —3; = —1; — 0; = 1; — 5. Найдите изменения в функции стоимости. Для [3 = 12 и £2 = 2 определите значение — 5і такое, что (£ь 2) Ç [см. соотношение (6.572)]. Начер¬ тите два оптимальных управления и соответствующие им оптимальные траектории на фазовой плоскости. Упражнение 6.38. Рассмотрите систему уравнений (6.520), предположив, что конеч¬ ным является состояние (Ѳх; Ѳ2). Найдите управление, переводящее (g§2) в (Ѳ/, Ѳ2) и мини¬ мизирующее функционал (6.522) при фиксированном времени Tf. Обсудите единственность решения. Положите Іі= 1,|2= —Iй найдите условия для конечного состояния (Ѳх; Ѳ2), при которых задача с незаданным временем Tf имеет решение. Упражнение 6.39. Рассмотрите систему уравнений (6.520), полагая, что конечное состояние есть (Ѳг; Ѳ2). Найдите управление, переводящее (£х; £2) в (Ѳх; 02) и минимизи¬ рующее функционал (6.550) с незаданным временем. Обсудите единственность решения. Упражнение 6.40. Рассмотрите систему вида Л'і (0 = х2 (/); Xt (0) = Êj; | } (6.573) Х2 (0 — Х2 (0 + и (0» Х2 (0) = 5г- J Найдите управление, переводящее (£ь £2) в (0, 0) и минимизирующее функционалы: Tf а) Е (и) = j J и2 (0 dt, (6.574) о где Tf задано; т б) (а) = f [fe + у (')] dt, (6-575) о где Т не задано, k > 0. Упражнение 6.41. Повторите упражнение 6.40 для систем, описываемых уравнениями: а) Л (0 = Х2 (t); х2 (0 = х2 (/) + u(t); (6.576) б) іі(П = хг (0; (0 = —(t) + и (t); (6.577) в) Іі (/) = х2 (t); Х2 (0 = = - 2%і (0 - Зх2 (Г) + и (t); (6.578) г) І1 (/) : — x2(t); х2 (t) = = л-! (0 + и (t). (6.579) Упражнение 6.42. Рассмотрите систему уравнений (6.520), считая что конечным является состояние (0, 0). Найдите управление, переводящее (gx, £2) в (0, 0) и минимизи¬ рующее функционалы: а) rf J2(u) = ±f [х?(0+«2(0] dt, (6.580) где Tf задано; б) 0 1 rt ■t3 («) = y [ И (0 4- x2 (П + “2 (о] dt, 0 'Tf, Л (“) = y j [fe 4- *1 (0 4- “2 (0] dt, (6.581) где Tf задано; в) (6.582) о где Tf не задано, k^> 0. Упражнение 6.43. Повторите упражнение 6.42 для системы, описываемой уравне¬ ниями (6. 577). 425
6.20. ОГРАНИЧЕНИЯ УПРАВЛЕНИЯ ПО ВЕЛИЧИНЕ1 В § 6.18 мы рассмотрели задачу об оптимальном управлении линей¬ ной системой по квадратичному критерию преобразования. Мы полагали, что компоненты управляющего вектора не ограничены по величине. Это предположение позволило нам выразить аналитически экстремальные управления. В этом параграфе мы рассмотрим задачу 6.3а при дополнительном предположении о том, что компоненты (t)f и2 (/), . . ., иг (/) вектора управления и (t) ограничены по величине соотношением \иі (/) I < 1; j = 1, 2, . . ., г. (6.583) Мы покажем, что компоненты оптимального управления являются непрерывными функциями времени и что существуют интервалы времени, в течение которых компоненты оптимального управления постоянны. Непрерывность компонент оптимального управления довольно сильно отличает их от оптимальных кусочно-постоянных управлений для нор¬ мальных задач на оптимум по быстродействию или по расходу топлива. Мы покажем также, что данная задача о минимуме энергии является нор¬ мальной. Точная формулировка задачи выглядит следующим образом. Задача 6.36. Дана линейная, полностью управляемая система х (/) - А (/) х (/) + В (/) и (/); X (/0) = I (6.584) и функционал Tf Л«) = 4 J [(*(/), Q(/)x(/)) +(«(/), Я (/)«(/)) + о +2 (л:(0, a(ty)]dt, (6.585) где матрицы Q (t), R (t), М (t) удовлетворяют предположениям, сформу¬ лированным в задаче 6.3а. Конечное время Tf задано. Предположим теперь, что управление ограничено по величине соотношением I W/ (/)| <1, / = 1, 2, . . ., г. (6.586) Требуется найти управление, которое: 1) удовлетворят ограничению (6. 586); 2) переводит систему, описываемую уравнениями (6.584), из началь¬ ного состояния I в 0 за время Tf\ 3) минимизирует функционал (6.585). Так как система и функционал те же, что и для задачи 6.3а, то гамиль¬ тониан для задачи 6.36 определяется соотношением (6.484), канониче¬ ские уравнения — зависимостями (6.485) и (6.486) и граничные условия соотношениями (6.487). То обстоятельство, что гамильтониан должен быть минимальным вдоль оптимальной траектории, устанавливается при помощи соотношения (6.489), которое должно (и для задачи 6.36) выпол¬ няться для всех допустимых управлений. Иначе говоря, необходимо, чтобы соотношение I (и* (/), R (/) «* (/)) + (X* (/), М (t) и* (/)) + (в (/) «* (О, Р* (/)> < < I (»(/), R (о « (/)> + (х* (t), М (0 и (t)) + (В (/) и (/), р* (t)) (6.587) 1 Дополнительные материалы содержатся в [103], [153], [155], [99], [128], [186] и [6]. 426
выполнялось для всех и (/), удовлетворяющих условию \и( (01 <1, 7 = 1,2,-. г. Обозначим компоненты вектора w* (0, определяемого соотношением w* (/) = RA (/) [Л/ (О х* (/) + В' (0р* (/)] (6. 588) через w* (/), w* (0, • • -, (0- Тогда уравнение (6.587) можно записать в виде |(«*(0- /?(/)«*(/))+(«*(/), <^(и (/), R (/) и (/)> 4 (и (О, R (О w* (0>. (6-589) Добавив к обеим частям неравенства (6.589) одну и ту же величину J R(l)w*(t)), получим ([и* (0 + w* (/)], R (/) [«* (.') 4 W* (01) < < ([»(/) +w*(01. R(t)\u(t) + W*(O1> (6-590) для всех и (t) с |м; (/) | < 1, j — 1, 2, . . ., г. Докажем теперь, что из необходимого условия (6.590) следует «*(/) = —да* (/), если (6 591) и* (0 = — sign {w* (/)}, если \w* (/)| > 1J Для доказательства соотношений (6.591) поступим следующим об¬ разом. Пусть а (0 = и (/) + w* (0- (6.592) Тогда из неравенства (6.590) следует, что функция Я51# (01 = <0(0, 7? (00(0) (6.593) имеет минимум при а* (7) = и* (0 + w* (0- (6.594) Так как R (/) положительно определенна для любого /, то собствен¬ ные значения dr (/), d2 (/), . . ., dr (/) матрицы R (t) положительны T Пусть D (t) — диагональная матрица собственных значений. Известно, что существует ортогональная матрица P (t) (т. е. P' (t)P (t) = /), для которой D(t) = P\t)R{t)P(t). (6.595) Но ф[и(О1 = <0(О, /?(О0(О) = (0(0, P(t)D{t)Pf(t)a(t)) = D(t)P’ (0а (0) = (&(0. D(t)b(t)) (6.596) где b (і) =Р' (0 a (t). '_1 (6.597) Но так как P (t) и P' (t) обе ортогональны, то (&(/), &(0) = <0(0, 0(0) (6 598) или, эквивалентно, 2 &/(()= É «/(О- (6-599) /=1 /=1 1 См. § 2.15. 427
Теперь докажем соотношения min ф [«(/)] = min(a(Z), R(t)a(t)} = min S dj(t)tf(t) = % dj (t) min b2, (t). и (0 a(O b(t)—P'(t)a (() j=l j=l b (() (6.600) Из соотношения (6.600) следует, что если а* (/) минимизирует (а (Z), R (t) а (Z)), то компоненты b* (Z), b* (t), . . b* (t) вектора &* (t) = Р' (z) a* (Z) (6.601) также минимизируют скалярное произведение Имея в виду соотношения (6.598), можно прийти к выводу, что вектор P (t) Р' (t) a* (t)~ = а* (I) минимизирует скалярное произведение (a (t),a (Z)). Таким образом, мы доказали, что если (a*(0, Æ(Z)a*(Z)) <(a(Z), R(t)a(t)), ТО (a*(/), а*(/)) < (a(t) (6.602) Изменив доказательство, можно установить, что если а* (/))<(«(/), а (/)), то (a* (/), R (/) а* (/)) < {а (/), R (/), а (/)). (6.603) Но так как (a(0, a(t)} = <[a(Z) +- w*(Z)], l«(0 + w* (01) = É [«/(0 + w* (Z)]2, (6.604) получим, что min (a (Z), a(Z)) = 2 min [ut (t) + w* (Z)]2. (6.605) «(O /=1 1«/(О1 Cl Чтобы минимизировать положительную величину [u;-(Z) 4- wf (Z)]2, нужно положить Uj (t) = —w* (t), когда | w* (Z) | < 1; u, (Z) = +1, когда да/ (0 <—1 и ui (0 ——1> когда w* (t) > +1. Следовательно, управле* ние it* (Z) должно выражаться соотношениями (6.591) ввиду полученных зависимостей (6.602) и (6.603). Определим теперь функцию sat ( J сле- дующим образом: = sat {«/J, что означает х, = у,, если I у, I < 1; ) /с ел_. <6-606) Можно также определить векторную функцию SAT { } в виде X = SAT {у}. (6.607) Последнее означает, что xt = sat {z/z}> 4 = 1,2,.. ., r. Из соотношений (6.591) и (6.588) заключаем, что оптимальное управ¬ ление и* (/) однозначно выражается через состояние x(f) и дополнитель¬ ную переменную р* (/) следующим образом: (/) — SAT [R1 (i) [М (/) л:* (/) + В (/)р* (/)]}. (6.608) Заметим, что в отличие от функций SIGN и DEZ функция SAT дает нам вполне определенное и* (/). По этой причине вырожденных случаев для задачи на минимум энергии (6.36) не возникает при условии, что мат¬ рица R (t) положительно определенна. Отсюда же следует, что компоненты оптимального управления Uj (/) являются непрерывными функциями вре- 428
мен и. Компоненты управлений, оптимальных по быстродействию и рас¬ ходу топлива, являются кусочно-постоянными функциями времени. В § 6.18 мы видели, что оптимальное управление для задачи 6.3а (без ограничений на управление) записывается в виде «* (0 = - R-' (/) [УИ (/)Ха (/) + В (f)p*A (/)]. (6.609) Мы показали, что оптимальное управление для задачи 6.36 равно: «в = — SAT {/?-’(/) (0 + в (t)Рв(0]і - (6.610) Индексы А и В использованы для того, чтобы отличать оптимальные величины для каждого из случаев. В § 6.18 мы подставили оптимальное управление в канонические уравнения и смогли выразить управление в виде функции от |, /0 и Tf [см. (6.512)1, предполагая, что оптимальное управление единственно. В случае управления с ограничениями можно подставить выраже¬ ние (6.608) в канонические уравнения (6.485) и (6.486) и получить х* (/) = А (Z) х* (0 - В (/) SAT I/?-1 (/) [М (/) х* (/) + ' + В'(0Р*(01}; p*(t) = — Q(t)x*(t) — — M(t) X (6.611) X SAT (Z?"1 (/) [Af (/) X* (/) + В' (f)p* (/)]} К сожалению, эта система 2п дифференциальных уравнений нели¬ нейна. По этой причине нельзя получить аналитическое решение, кото¬ рое бы в явном виде устанавливало зависимость управления ив (0 от Tf и /0. Вместо этого приходится искать решение (или решения), удовле¬ творяющее граничным условиям х* (tQ) = 1 и х* (Tf) = 0 путем итераций на вычислительной машине. Предположим, что мы решили задачу 6.3а и нашли оптимальное управление u* (t). Очевидно, что в общем случае компоненты управле¬ ния Ua (0 могут и не удовлетворять ограничениям, которые наклады¬ ваются в задаче 6.36. Рассмотрим управление вида »(/) = SAT {«$(/)}. (6.612) Иначе говоря, пропустим каждую компоненту Ua (0 через ограни¬ читель, который выполняет операцию sat { }, и тогда управление u (t) удовлетворит ограничениям задачи 6.36. Возникает вопрос: является ли управление и (t) оптимальным для задачи 6.36? Иначе говоря, возможно ли соотношение UB (t) = SAT {ua (0), t € Ko, 7>] ? (6.613) В общем случае ответ получается отрицательным. Уравнение (6.613) справедливо только в том случае, когда иА (t) никогда не выходит за ограничения. Это, однако, имеет место лишь в очень малой области фазо¬ вого пространства. Более подробную информацию можно найти в ра¬ боте [103]. Этим завершается рассмотрение задачи о минимуме энергии. В гл. 9 мы рассмотрим расчет линейных систем с квадратичным критерием пре¬ образования и задачу со свободным концом (т. е. случай, когда х (Tf) не задано). Следующие упражнения предназначены для того, чтобы про¬ иллюстрировать некоторые из трудностей, связанных с решением задач о минимуме энергии при наличии ограничений управления по величине. 429
Упражнение 6.44. Рассмотрите систему вида %і(0=х2(0; х1(0) = ?1; (6.614) i2 (0 =«(0; *2(0)=£2 (6.615) При I и (О I 1. Определите управление, переводящее систему (6.614) из (gx, £2) в (0, 0) и минимизи¬ рующее следующие функционалы: Tf а) J1 (и) = J -і- и2 (Z) dt, где Tf задано; (6.616) о т б) J2 (и) = J рг + u2(oj dt, где Т не задано, /г> 0, (6.617) о Tf в) J3 (и) = j -і- [х^ (t) + и2 (/)] dt, где Tf задано; (6.618) о Tf г) J4 (и) = j -i- [xj (t) + (0 ~F u<2 (O] dt, где задано; (6.619) о T д) </6 (u) — j £ k + ~^~xi (0 + (0 J где T не задано, 0. (6.620) о Для случаев a), в) и г) нарисуйте графики оптимального управления и оптималь¬ ные траектории из исходного состояния (1, 1) для следующих значений Tf. Tf ~ = ]/~6-H 1, Г; =4; Tf=§\ Tf = 10. Что получается, если Tf < Кб + 1 ? Существует ли значение Tf, при котором оптимальное управление не является постоянным на любом подынтервале из [0; Tf]? Упражнение 6.45. Рассмотрите систему (0 = х2 (0; хх (0) = £х; х2 (/) = х2 (t) + и (/); х2 (0) = £2 (6.621) при |u(/)|^ 1. Найдите управление, переводящее (£х, £2) в (0» б) и минимизирующее: а) функционал (6. 617); б) функционал (6.620). Объясните единственность решений. Нарисуйте оптимальные траектории из началь¬ ного состояния (1, 1) для k= 1, k= 5, k = 10 и k= 100. Упражнение 6.46. Рассмотрите систему вида хі (0 = х2 (ty, х1 (0) = £х; х2 (0 = х2 (0 + и (ty х2 (0) = g2 (6.622) при I u(t) 1. Найдите управление, переводящее систему (6.622) из (£х, s2) в (0, 0) и мини¬ мизирующее функционал (6.617). Найдите множество начальных состояний, для которых решение существует. Рассмотрите единственность решения. ВЫРОЖДЕННЫЕ ЗАДАЧИ 6.21. ГАМИЛЬТОНИАН — ЛИНЕЙНАЯ ФУНКЦИЯ УПРАВЛЕНИЯ1 В § 6.3 мы дали определение вырожденных задач об оптимальном управлении (см. определение 6.5). Напомним, что задача вырождается, 1 Дополнительные материалы по этому вопросу см. в работах [104], [102], [211], [176], [94], [184], [186] и [14]. В частности, в работе [104] подробно рассматриваются вырожденные задачи с многочисленными примерами. 430
если аргумент функции sign { } тождественно равен нулю на конечном интервале времени. В этом случае необходимое условие //(х*, р*, а*, /)</7(х*, р*, и, t) не дает информации относительно связи и* с х* и р*. Ниже будут рас¬ смотрены вырожденные задачи с более общей точки зрения. В данном пара¬ графе разбираются задачи, для которых гамильтониан является линейной функцией управляющей переменной и (/), а в следующем параграфе — задачи, для которых гамильтониан является линейной функцией управ¬ ления и его модуля | и (/)|. В общем случае решение вырожденных задач более сложно, чем реше¬ ние нормальных задач оптимизации. Эти трудности возникают из-за того, что необходимое условие, состоящее в том, что гамильтониан минимизи¬ руется (по отношению к управлению) вдоль оптимальной траектории, не позволяет получить достаточно определенного выражения для оптималь¬ ного управления. При отсутствии такой информации мы должны пользо¬ ваться другими необходимыми условиями, пытаясь найти вполне опреде¬ ленное выражение такого рода. Эти положения будут проясняться по мере рассмотрения теории оптимального управления. К сожалению, в настоящее время общие результаты, относящиеся к существованию вырожденных решений задач оптимизации, весьма ограничены. Необходимы дополнительные исследования природы, свойств и других характеристик вырожденных решений. Поэтому в данном пара¬ графе рассмотрим эти положения достаточно поверхностно. Далее станет очевидно, что вырожденные решения связаны со сложными вычислитель¬ ными операциями. Рассматриваемый метод будет довольно примитивным, но, сообщая его читателю, мы надеемся продемонстрировать как следует подходить к вырожденным задачам. Чтобы избежать усложнения обозначений, будем рассматривать инва¬ риантные по времени задачи с единственной управляющей переменной. Для задач с многими управляющими переменными основные понятия не изменятся. Кроме этого, мы будем рассматривать задачи с закрепленным концом (задано конечное состояние) как с заданным, так и с незаданным временем перехода. Сформулируем задачу, которая может иметь вырожденное решение. Задача 6.4а. Дана инвариантная во времени система х,(/) = fL [X (/)] 4- [х(/)] (6.623) i = 1, 2, ... , n или в векторных обозначениях *(/) = /[*(/)] 4-- b[x(t)] u(t), (6.624) где X (t) — n-мерный вектор состояния и и (t) — скалярная управляющая переменная. Предположим, что и (/) ограничена по величине соотношением \и (/)| < 1 для всего t, (6.625) Даны начальное состояние х (0) = конечное состояние Ѳ и функ¬ ционал J(u)~ § {foïx(t)] b0[x(f)]u(t)\dt, (6.626) о где /0 [х (t) ] и Ьо [х (0 1 — скалярные функции состояния и Т может быть задано или не задано. 431
Найти допустимое управление, переводящее систему (6.624) из | в Ѳ [х(Т) = Ѳ] и минимизирующее функционал J (и). Отметим, что скалярное управление и (t) входит линейно как в урав¬ нение системы (6.623), так и в подынтегральную функцию функционала (6.626). Для упрощения выкладок примем х0 (0 = fo [х(/)] + 6о [х(/)] и (t), х0 (0) = 0 (6.627) и запишем гамильтониан Н, используя скаляр 1 Ро (0 = Ро — const 0. (6.628) Итак, гамильтониан для задачи 6.4а равен Н S Л [x(/)J Р/ (0 + «(/)£ Мх(/)]рД0- (6.629) /=о z=o Отметим, что гамильтониан есть линейная функция от и (t). Если определить функции а и |3, положив а [X(/), р (/), Ро] = S А [X(01 P, (0; (6.630) і=0 ₽ [X (Z), P (t), Ро] = S bt [х (/)] Pi (t), (6.631) 1=0 то гамильтониан Н можно записать в виде Д = а[х((), p(t), р0] + и(0Р(х((), р((), Ро]. (6.632) Дополнительные переменные (/), і = 1, 2, . . . , п определяются соотношениями и поэтому для і=0, 1,2, . . ., п имеем л (') - - É р, т - р (') ]>,<') ■ '6ИЗ> /=0 /=0 Установим теперь необходимые условия для задачи 6.4а. Теорема 6.18. Необходимые условия для задачи 6.4а. Если и* (/) — оптимальное управление, а л:*(/) —соответствующая оптимальная траекто¬ рия, то существуют дополнительная переменная р* (/) и константа р* 0 такие, что а) для і = 1, 2, . . ., п х- (t) = A [х* (/)] + bi [х* (Z)] u* (0; рГ (0 = - 2 Pi (0 - « * (0 £ рГ (0dbi^^ (6-634) и X* (0) = g, X* (T) = Ѳ; (6.635) б) для t [0, T ] и любых и (t), удовлетворяющих ограничению \и (0| < 1, выполняются следующие соотношения [см. уравнения (6.630)— (6.632) ]: а[х*(0, Р*(0. Ро*] Ф и*(0₽[х*(0> Р*(0> Ро*] < <а[х*(0, р*(0, Ро] +«(/)₽[х*(/), р*(0, ро*]; (6.636) 1 См. § 5.15 и 5.16. 432
= — sign S в) если Т не задано, то а [х* (/), р* (0, Ро] V и* (t для любого t £ [О, Т]. Если Т фиксировано, то СС>*(0, Р*(0. Ро*] +«*(/)₽ [л для любого t £ [О, Т]. Нетрудно видеть, что из соотнои и* (t) = — sign {р [л:* (п bi Если скалярная функция 1 Р Іх* (/), р* (/), р* 1 не равна нулю, то уравнение (6.639) позволяет получить вполне определенное соотношение для управления и* (/). Если, однако, Р [л:* (О, р* (0, Ро] Для всех 6 (6.640) где (/ь /2] — подынтервал из [0, Т], то функция sign { ] неопределенна. Действительно, если выполняется соотношение (6.640), то необходи¬ мое условие (6.636) сводится к следующему: u*(0-0<t/(0-0 (6.641) для всех t Ç (/ь t2]. Последнее является тождеством для всех и (/) (даже для тех, которые не удовлетворяют ограничению |и(/)| < 1)- Такой случай называется вырожденным. Определение 6.13. Оптимальные и экстремальные вырожденные управ¬ ления. Будем говорить, что задача 6.4а вырождена, если оптимальное управление и* (t), траектория х* (t) и соответствующая р* (/) обладают следующим свойством. Существует по крайней мере один (полуоткрытый) интервал (/х, t2] в [0, Т] такой, что S Pi (t)bi [лг* (/)] 0 для любого t £ t2]. (6.642) i=0 В этом случае интервал (/ь /2] будем называть интервалом вырожден¬ ности, функцию U(*lt t2j — вырожденным оптимальным управлением и траекторию x(*lt /.] — вырожденной оптимальной траекторией. Если можно найти экстремальное управление и (t) (т. е. управление, удовлетворяющее всем необходимым условиям теоремы 6.18), при кото¬ ром соответствующие х (0 и р (t) удовлетворяют соотношениям 2 Pt (0 bi [X (/)] = 0 для всех t £ (0, /2]> і=0 Po(t) = Ро^0, то управление u{tit /2j называют вырожденным экстремальным управле¬ нием, а траекторию X(iit /2] — вырожденной экстремальной траекторией. [х со, Р*(а ро] - о (6.637) * (Р), р*(0, Ро] = с = const (6.638) дения (6.636) следует, что (0, /?*(/), Ро*]} = [х*(/)]рГ (о). (6.639) Эту функцию часто называют функцией переключения. 433
Естественно, что из существования вырожденного экстремального управления не вытекает необходимость вырожденности оптимального управления. В таких случаях нужна дополнительная информация (т. е. единственность) для того, чтобы сделать заключения относительно опти¬ мального управления. Рассмотрим, что представляют собой вырожденные экстремальные управления. Пусть перед нами поставлена задача 6.4а. Попытаемся найти экстремальные управления. Первый шаг состоит в том, чтобы записать гамильтониан и канонические уравнения. Предположим далее, что мы рассматриваем случай, когда конечное время не задано и нам нужно иссле¬ довать, возможно ли получить экстремальные управления. Проведем это исследование следующим образом. Предположим, что 1 п S btpt =0, для любого t Ç f/1( /2]. (6.643) 1=0 Так как рассматривается задача с незаданным временем, то должно выполняться п п Н = S fiPi + и S Ьір1 = 0 для любого t Ç- (/-t, /2]. (6.644) î=0 r=o Таким образом, уравнения (6.643) и (6.644) требуют, чтобы п 2 fiPi — 0 Для любых t £ (Zp t21. (6.645) t=0 Но из выражения (6.643) следует, что п дУ VI 7_! Ьірі 0 для всех V = 1> 2, . . . и всех t £ (tlt /2]. atу (6.646) Аналогично из выражения (6.645) следует, что Î flPt - 0 (6.647) і=0 для всех у = 1, 2, ... и любого t Q (/ъ /2]. Канонические уравнения записываются в виде Xl = fl + ubt-, V дЬ dbi • о 1 о (6.648) л = - L Рі~д^-u L = °’b 2> • • • ’п- i=<J /=о Пусть в выражении (6.646) у = 1, тогда 2 * * -4 2 ь‘Р< = S (Pib+Pi S w М=°- <6-б49> і і \ і / 1 Далее мы опускаем зависимость х (t) от переменных с целью упрощения урав¬ нений (6.643)—(6.675). п 2 Для упрощения уравнений под мы понимаем 2 • Далее, в уравнениях (6.649) — і і=0 (6.675) мы опускаем утверждение «для любых (/ь t2\». 434
Подставим соотношение (6.648) в уравнение (6.649) и после алгебраи¬ ческих преобразований получим і І +“2 'б'650» і І Но коэффициент при и в полученном выражении (6.650) равен нулю (почему?). Итак, получим S % Р'(”'-S7 -~ О' (6-651> і І Далее в выражении (6.647) положим у = 1 и получим, что 0 “ 4 2Лр; = 2 +р‘% ^7 х') = = 2 2 (р'А^7~р^^г) + +и2 2(рЛ^“р'/‘-£г) = =ü2 2p'(''’'-27-/'-Sr)= 0- (6-652) і / Откуда следует, что или и = 0, (6.653) или S (6'654) І / Но уравнения (6.654) и (6.651) одинаковы. Итак, уравнение (6 652) удовлетворяется для и 0. Иначе говоря, из зависимостей (6.652) не следует, что и = 0. Соотношения (6.643) и (6.645) приводят к одному и тому же уравне¬ нию (6.654). Поэтому можно сделать вывод, что уравнения (6.646) и (6.647) позволяют получить тот же самый набор соотношений при у = 1, а сле¬ довательно, для всех у = 2, 3, ... Таким образом, для наличия вырожденного экстремального управ¬ ления необходимо (но недостаточно), чтобы для любого t £ (/р t2} удов¬ летворялись соотношения 2 bipi = 0; (6.655) i SAp<=0; (6.656) i S EXX-'-O-0- <6-657> i i Пусть теперь в выражении (6.646) у = 2, тогда = “ (6 658) і І 435
После алгебраических преобразований получим V V V п ( — h. Ôfk dfi -4- f. dbk 4- f dbi dfi 4- \ i dxjdxk ' dxkdxj 'k dxkdxj ' i / k d2f* l ; df'dbl f < d2bi \ i ’ i'k dxkdxj 'k dxkdxj ' І'k dxkdxj ) . „ V V Vn (f dbk dbi h dfkdbi ! h dbidfi 4- 2d 2d 2dPt\ri dxj dxk i dxjdxk ' k dxkdxj ' i / k , i , d2fi . dfi dbi fe d2bi \ n nrm 4- bibb ~4—ч Ьь ~—ч fif k 3—3— ) — 0 (6.659) 1 R dxkdxj * dxkdxj 111 * dxkdxj / ' или в виде: S p,4'2l (x) + и 2 Р,Ф21 4) = 0. (6.660) / i В общем случае коэффициент 2 Pt®2i (•*) не равен нулю1 для любого t Ç (/i, /2]. Итак, если s Pi®* (X) =# О, (6.661) i то можно решить уравнение (6.660) относительно и и получить S Рі^гі W U = _^ (6.662) 2 Ріф2і W Если 2р,ф2і4) = о, (6.663) то уравнение (6.660) сводится к следующему: S Р4г< (•*■) = 0- (6.664) і Полагая в выражении (6.646) у — 3, находим 4- 2рАг(х)==0- (6-665) Читатель должен оценить трудности, связанные с громоздкими обо¬ значениями при определениях высших производных. Предположим, что последовательное дифференцирование по времени, фигурирующее в уравнении (6.646), приводит к системе уравнений 7=1: £ (X) = 0; і у = 2: Sptt2/W = 0; ,CCCCÀ i (6.666) 7 = n — 1: S Pi4(«-1) i {x} = 0. 1 Это можно показать, предположив, что 60(х), Ьг (х), . . ., Ьп (х) — константы (т. е. не зависят от х), тогда 5? Рі ф2< (X) = SSL Pibjbk, ; значение этого коэффи- i i i k ццента, конечно, может быть и ненулевым. 436
Иначе говоря, в каждой производной по времени коэффициент при и оказался равным нулю. Нетрудно видеть, что п — 1 соотношение (6.666) будет линейно относительно так как дифференциальные уравнения (6.648) линейны относительно pt. Здесь (х) = / — в ВВДУ соотношения (6.651); ф2/ (л:) есть выражение в (6.666), которое вместе с соотношениями (6.655) и (6.656) дает нам всего п +1 уравнений, которые линейны относительно р0, р19 . . рп. Эти урав¬ нения можно записать в виде fo(X) fl(X) /2 (x) Ux) ~ Po - 0 — • (X) ЬЛх) bM • • bn (x) Pi 0 tio(*) til (•*) tl2 (X) •• tln(*) Pi 0 ^20 (X) tai(*) ^22 (X) •• feW Рз = 0 o(jf) t(«-i) iW t(n-l)2(x) •" • t(«-Dn (•*■)_ _ Pn _ ô или в виде Ро _ Р . - 0. Так как п + 1 — мерный вектор Ро _р _ 0, ТО чтобы п + 1 X п + 1 матрица G (лг) была вырождена t С (^і> Итак, условие det G(x) = 0 для любых t £ (/ь /2] (6.667) (6.668) необходимо, для любого (6.669) необходимо для существования вырожденного экстремального управления в случае, если последовательное дифференцирование по времени приводит к системе п + 1 соотношений вида (6.667). Предположим теперь х, что последовательное дифференцирование по времени приводит к уравнению, в котором коэффициент при и не равен нулю. Для определенности будем считать, что последовательное диффе¬ ренцирование по времени привело к системе уравнений у=1: S £,41,-(*) = 0; ' ѵ = 2: S PÏÏn (х) = 0; і (6.670) 7 = m: S (*) = 0; « 7 = /n+l: S/MWo dx) 4- «EpAm+n i (x) = 0. (6.671) где S P ,Ф(т+1) i (X) =£ 0. i (6.672) 1 В противном случае, повидимому, может быть бесконечное число оптимальных уравнений, хотя это предположение не доказано. 437
Уравнение (6.671) можно разрешить относительно и и получить 2 І W U = s- г-r- . (6.673) yj ₽/Ф('П+1> i i Соотношение (6.673) дает необходимое условие вырожденного экстре¬ мального управления. По сути дела, мы нашли соотношение между и, Ро> Рп рп я *о> хі> х2» • • •> хп- Ограничение величины |и| < 1 на¬ кладывает на переменные ограничения вида S М(т+1)ЛХ) і (6.674) Дополнительно в виду соотношений (6.655), (6.656) и (6.670) должны удовлетворяться т 4- 2 уравнений (т 1) S Р if і U) = 0; i S Pibi (X) = 0; IWiz (*) = 0; i (6.675) S PiVml (X) = 0. i В любой конкретной задаче нужно исследовать, удовлетворяются ли все эти соотношения. Если одно из них не выполняется, то это пред¬ ставляет собой нарушение необходимых условий, и поэтому вырожденных экстремальных уравнений не может быть. Если необходимые условия удовлетворяются, то могут существовать вырожденные экстремальные управления. Пример 6.9. Рассмотрим гармонический осциллятор и функционал Х1 (о = хг (0; 1 *2 (0 = — (0 + “ (0- 1 и (/) 1 sg 1, J т (6.676) [хі(0 +х2(°] dt' 0 (6.677) где Т не задано. Проверим, может ли эта задача иметь вырожденные экстремальные управления. Для этого запишем гамильтониан я = -Ь Рох1 (0 + 4" рох2 (0 +Х2 (0 Рі <0— -Х!(/)р2(0+«(0Р2 (0. (6.678) где Ро~ const 0, (6.679) Р1 (0 = ~ ~d^t) = - Р°Х1 (/) +Рг (Z) (6.680) P2(t) = -^7K=-P^2(t)-PAt). (6.681) С/Л2 (/J Предположим, что p2(Q=0, для любого / С (^і> *2І- (6.682) 438
Тогда, поскольку мы имеем дело с задачей с незаданным временем, должно выпол¬ няться следующее соотношение: 4“ ?0Х1 <0 + Р°Х2 + Х2 Р1 (<) ~ *1 (Z) Р2 W = 0 (6.683) Рис. 6.23. Вырожденные дуги ха и хь для любого /2]. Но из условия (6.682) следует, что р2 (0 =0 для любого t £(fb /2], (6.684) и поэтому из уравнения (6.681) находим р0х2 (t) = — p1(t) для любого t g (fi, f0]- (6.685) Если p0 = 0, (6.686) то из соотношения (6.685) вытекает, что Рі (0 ~ 0 для любого t Ç (fx, f0]. (6.687) Но уравнения (6.682), (6.686) и (6.687) не могут Ро Рі _ Р2 _ не может быть равен нулю, а следовательно, pQ=j=ü Поэтому примем р0 = 1. (6.688) Тогда соотношение (6.685) сводится к уравнению х2 (0 = —Рі (0 Для любого t £ (fx, f2] (6.689) или -у-*1 (f) = -^-*2 (О Для любого t g (fi, f2]. (6.690) Из последнего выражения следует, что x1(t)= ±x2(t} для любого fÇ(fP f2]. (6.691) Дифференцируя выражение (6.689), находим х2 (f) = —Pi (f) = Xi (f) для любого t Ç (fi, f2]. (6.692) Из уравнений (6.692) и (6.676) имеем и (t) = 2%i (f) для любого f g (flt f2]. (6.693) Ввиду ограничения | и (t) | 1 и соотношения (6.691) приходим к выводу, что выро¬ жденное управление может быть экстремальным, когда 1*1(01=5 іХ2(/)і^4": X1(Z) ± Х2(°- (б-б94) Это показано на рис. 6.23; прямые ха и хь часто вызывают вырожденными траекто¬ риями или вырожденными дугами. Нетрудно видеть, что если подставить соотношение (6.693) в уравнения системы (6.676), то получим хі (0 = х2 (0 (6.695) х2 (t) = ХХ (f) ДЛЯ любого f Ç (fl, f2]. Можно заметить, что решение системы (6.695), начиная с исходного состояния х} (0) = — 51» х2 (0) = g2, запишется в виде +4"e-<(Si-Ê2); Х2 (/) = 4- е* (g, + ?г) - 4" е~' - Ь)- (6.696) Если £і — 52» то решение (6.696) неустойчиво, и устойчиво, когда |х — —£2. Харак¬ тер решения показан на рис. 6.23 стрелками на вырожденных траекториях ха и хь- Таким 439
образом, для этой задачи в зависимости от начальных условий (£х, £2) и конечного состоя¬ ния (Ѳх, Ѳ2) экстремальные управления могут оказаться вырожденными. Пример 6.10. Опять рассмотрим гармонический осциллятор ix(f)=x2(f); ] (6.697) ч (О = -x1(0 4-u (0, Iu (0 I1, J но с функционалом т J ІЦ) = -у- j (0 dt, где Т не задано. (6.698) о Проверим, могут ли быть вырожденными экстремальные управления. Для этого запи¬ шем гамильтониан: Н = -^-Ро*1 (О + х2 (0 Р1 (0 - хі (О Р1 (О + « <0 Р2 (0, (6.699) 1 -е р0 = const 0; (6.700) Рі^^-^ТТГ^-РЛ^+Гг^’ (6.701) (6-702> Предположим, что р2(/)~ О для любого t Ç (fi, f2], (6.703) тогда -i- poxj (t) + x2 (f) px (t) = 0 для любого i g (fi, f2J. (6.704) Ho p2 (f) = 0 для любого t Ç (fx, f2], (6.705) и поэтому из уравнения (6.702) имеем Pi (0 — 0 Для любого t Ç (fx, /2]. (6.706) Таким образом, из соотношения (6.704) следует Ро= 1; (6.707) Xi (t) = 0 для любого t (tlt f2], (6.708) и поэтому Xi (t) = 0 для любого t (fx, /2]. (6.709) Из уравнений (6.709) и (6.697) находим х2 (0 = 0 Для любого f£(fx, f2]» (6.710) и поэтому и (t) = 0 для любого t Ç (fx, f2]. (6.711) Итак, можно сделать вывод, что вырожденное управление и (/) = 0 может быть экстремально, если хх (/) = х2 (/) = 0 для любого t g (fb /2]. (6.712) Это означает, что экстремальное управление не будет вырожденным для любой точки фазовой плоскости за исключением, возможно, начала координат. Последние два примера конкретно иллюстрируют общие понятия, введенные в этом параграфе. Пример 6.9 является типичным, так как во многих вырожденных задачах можно найти экстремальное вырожденное управление как функцию от состояния. Если подставить это управление в систему дифференциальных уравнений, то получим систему однородных уравнений [таких, как (6.695)], решение которых определяет выро¬ жденные траектории. До сих пор мы рассматривали задачу с незаданным временем перехода. Если рассмотреть задачу с фиксированным конечным временем, то известно, что гамильтониан вдоль оптимальной траектории есть некоторая (неиз¬ вестная) постоянная с [см. уравнение (6.638)]. 440
Нетрудно видеть, что для определения, может ли задача иметь выро¬ жденное экстремальное управление при фиксированном времени, следует воспроизвести основные положения, изложенные выше. Будем по-преж¬ нему считать, что имеет место условие (6.643), т. е. ^ЬіРі = 0 для любого t Q (/р ^2]. (6.713) і—0 Теперь соотношение (6.644) заменяется уравнением п п Н = 2 fiPi + и 2 ^іРі = с Для любого t £ (/„ t2\. (6.714) t—0 i=0 Поэтому уравнение (6.645) заменяется на п 2 f.pi = c для любого / £ (/ь /2]. (6.715) 4=0 Однако должны выполняться уравнения (6.646) и (6.647), т. е. можно следовать рассмотренным выше путем, но заменяя 0 на с в уравнении (6.656) и т. д. Итак, знание конечного времени Т вводит в уравнения (неизвестную) постоянную с, но если Т не задано, то с — 0. В каждом случае имеется баланс между неизвестными величинами и известными соотношениями. Упражнение 6.47. Рассмотрите полностью управляемую систему Х1 (О = а11Х1 (О 4- «12Х2 (0» I (6 716) Х2 ОТ = «21Х1 (0 + а22Х2 (0 “b U J I и (t) I С m и функционал J (и) = у I [*1 (0 + хі (/)] dt, где Т не задано. (6.717) и Покажите, что управление w (О = —(<*12 + <*2і) хі (0 — («и + «22) Х2 ОТ (6.718) может быть экстремальным вырожденным управлением. Постройте на плоскости возмож¬ ные вырожденные экстремальные траектории и покажите, что они не зависят от значений а21 и я22. Можете ли вы объяснить причины этого? Указание: см. работу [104], пример 2. Упражнение 6.48. Рассмотрите систему *1 (0 = *2 ((); 1 і2(0 = -х2(0-х|(/) + «((), [и(0|<1 / (6.719) и функционал т J (и) — j \-dt, где Т не задано. 0 (6.720) Пусть (£х, £2) — начальное состояние и (Ѳп Ѳ2) — конечное состояние. Покажите, что экстремальных вырожденных управлений нет. Упражнение 6.49. Рассмотрите систему хі (0 = х2 (0; х2 (0 = х3 (0; із (t) = и (О. 1 U (t) 1 < 1 (6.721) и функционал т j J [*1(/) + (0 + ** (°]л- и (6.722) 441
Пусть начальное состояние есть (£1Э ?2, £3) и конечное состояние (0, 0, 0). Рассмотрите существование экстремальных управлений для случаев, когда Т задано и когда оно не задано. Можете ли вы найти область из Р3, для которой экстремальное управление должно быть вырожденным? 6.22. ГАМИЛЬТОНИАН — ЛИНЕЙНАЯ ФУНКЦИЯ УПРАВЛЕНИЯ И ЕГО АБСОЛЮТНОГО ЗНАЧЕНИЯ В § 6.13 мы обсуждали вырожденную задачу на оптимум по расходу топлива (см. определение 6.12). Вспомним, что вырожденная задача на оптимум по расходу топлива возникает в случае, когда аргумент функции dez { } тождественно равен +1 или —1 на конечном интервале времени. В этом параграфе мы бегло рассмотрим подобный тип задач. Такие задачи возникают, когда функция Гамильтона линейна относительно управле¬ ния и (0 и его абсолютного значения | и (0|. Прежде всего сформулируем задачу 6.46, решение которой может оказаться вырожденным. Далее мы нестрого рассмотрим вырожденный случай для задачи 6.46 и укажем вычисления, которые можно исполь¬ зовать для определения, являются ли экстремальные управления выро¬ жденными. Задача 6.46. Дана инвариантная во времени система Хі (0 = h [X (/)] 4 bL[x (/)]«(/), Z = l, 2, ..., и, (6.723) где X (0 — n-мерный вектор состояния и и (0 — скалярная управляю¬ щая переменная. Предположим, что управление и (0 ограничено по величине соот¬ ношением I и (0 I < 1 для любого t. (6.724) < Даны также начальное состояние х (0) = g, конечное состояние Ѳ и функционал т = $ (/о [X (01 + &о IX (011 и (01! dt, (6.725) и где fQlx (0] и &01х (0]—скалярные функции состояния. Конечное время Т может быть задано или нет. Найти допустимое управление, которое переводит систему, описы¬ ваемую уравнениями (6.723) из g в Ѳ (х (Т) = Ѳ), и минимизирует функ¬ ционал J (и). Гамильтониан для системы (6.723) и функционала (6.725) имеет вид Н = Pofo [X (01Н- РоЬо [X (01 I « (01 + « (0 Е Рі (0 fi [X (0] + r=l n + «(0Sp<(0Mx(01, 1=1 (6.726) где р0 = const 0. (6.727) Гамильтониан линеен относительно | и (01, если Ро 7^ 0 (6.728) И [X (()] 0» (6.729) 442
поэтому будем считать, что выполняются соотношения (6.728) и (6.729) и примем р0 = 1. (6.730) Теперь гамильтониан можно записать в виде и = I/o I* (01 + È Рі (0 fi \х (0]| + I t—1 J S рі (w + ьо [X (/)] I и (/) 1 + и (0 ‘-1 . (6.731) k üo 1Л UJJ Экстремальное управление должно минимизировать гамильтониан Н. Поэтому найдем //-минимальное управление, которое определяется соотношением ^Pi(t)bi[x{tn “(/) = -dezt— J’ (6.732) где функция dez { } соответствует определению (6.347). Экстремальное управление для задачи 6.46 будет вырожденным, если аргумент функ¬ ции dez { } равен +1 или —1 на конечном интервале времени, скажем (t19 t2] из [0, Т]. Следовательно, если S рі (*) ьі woi ,=1 h trim = =!=1 для любого t £ (/], t2], (6.733) ь'О 1Л (/JJ то экстремальное управление может быть вырожденным. Уравнение (6.733) вместе с остальными необходимыми условиями можно использовать для проверки существования вырожденных экстремальных управлений в задаче 6.46. Необходимые условия существования вырожденного экстремального управления для задачи 6.46 можно получить с помощью следующих действий: 1. Определить необходимые условия для задачи 6.46 и записать их в виде канонических уравнений. 2. Принять, что для любого t £ (/n t2] п £рДОМ*(О1-М*(ОІ = 0 (6.734) f=l и Д ( 0 Т не задано; /о [*(/)] + S рДОМ^ОІ = (6.735) /=1 сипы, 1 задами. 3. Принять, что для любого t2] и k = 1, 2, . . ., 1 Sp,- (0 bi [X (/)] - b0 [X (/)]J = 0 (6.736) и \f0 lx (/)] 4- g ft (/) fi [X (/)]) = 0. (6.737) 4. При помощи последовательного дифференцирования найти систему уравнений, которые являются необходимыми для существования выро¬ жденных экстремальных управлений. 443
5. Заменив уравнение (6.734) на п S Pi (/)Ш (/)] + М*(/)] = О, г=1 (6.738) проделать то же самое еще раз. Пример, иллюстрирующий существование вырожденных оптималь- в § 8.10. ных управлении для задачи на оптимум по топливу, приводится Упражнение 6.50. Рассмотрите систему Xi (t) = х2 (/); I х2 (Z) = и (t), I и (О I С 1 / и функционал (Т не задано, k 0) т (6.739) +a2lx22(0 + |U(0|]df (6.740) Пусть (£і, В2) — начальное состояние и (0, 0) — конечное состояние, управлений для возможность существования вырожденных экстремальных случаев: а) б) в) г) Исследуйте следующих k >0: k >0: k >0: k >0: аг = а2 = 0; аг — 1, а2 — 0; ал = 0, а2 — 1; — 1 > (6.741) (6.742) (6.743) (6.744) Д) е) ж) k = 0: k = 0: k = 0: ах = 1, а2 — 0; а{ = 0 а2 = 1: «! = а2 = 1. (6.745) (6.746) (6.747) о Упражнение 6.51. Повторите упражнение 6.50 для каждой из следующих систем а) X. (t) = х2 (Z); I M ' 2 k h (6.748) *2 (0 = ~x2 (0 + w (0; J г) (О = *2 (0; I •^2 (0 ~ (О 4~ и (О; / (6.751) б) X. (t) = x2 (Z); I У 7 2 v f (6.749) x3(/) =x2(/)+«(/); J Д) (0 = х2 (/); х2 (О = —2хі (0 —Зх2 (t) -f- и (/). (6.752) в) X1 ! (6.750) x2 (0 = -*1 (0 + и (0; J Упражнение 6.52. Рассмотрите систему т J (и) = J[ 1 + е~\х' I I и (t) |] dt, и уравнений (6.739) с функционалом (6.753) где Т не задано. Исследуйте возможность существования вырожденных экстремальных управлений для конечного состояния (0, 0). * * * 6.23. НЕКОТОРЫЕ ЗАМЕЧАНИЯ ОТНОСИТЕЛЬНО СУЩЕСТВОВАНИЯ И ЕДИНСТВЕННОСТИ ОПТИМАЛЬНЫХ И ЭКСТРЕМАЛЬНЫХ УПРАВЛЕНИЙ В предыдущих параграфах данной главы мы рассмотрели различные оптимальные задачи и указали, что вопрос о существовании оптимального управления 1 для данной конкретной задачи является весьма сложным и на него нужно получить ответ, прежде чем использовать принцип мини¬ 1 Проблемы существования для различных задач оптимизации рассмотрены в рабо¬ тах [118], [43], [62], [33], [79], [178], [120], [132], [93], [169], [145] и [190]. 444
мума. Мы хотим предостеречь читателя, что утверждение типа: «Я имею дело с физической задачей, и поэтому оптимальное решение должно существовать» нельзя использовать для доказательства существования оптимального управления. Напротив, первым и основным необходимым условием того, что математическое описание является достоверным пред¬ ставлением физической ситуации, как раз и является наличие решения математической задачи. Другими словами, для данной задачи об оптимизации необходимо проверить, существует ли решение, чтобы быть уверенным в справедли¬ вости математической модели. Довольно часто перевод физического про¬ цесса и совокупности конкретных условий в их математическую форму оказывается недостаточно точным, и поэтому физическое обоснование может оказаться весьма зыбким по отношению к математической поста¬ новке вопроса о существовании решения. Когда инженер формулирует задачу об оптимизации, он обычно пытается найти экстремальные управления, т. е. управления, которые удовлетворяют всем необходимым условиям. Очевидно \ что существова¬ ние оптимального управления предполагает наличие по крайней мере одного экстремального управления. Однако существование экстремаль¬ ных управлений не предполагает необходимости существования опти¬ мального управления. Довольно часто отсутствие оптимального управления можно подозре¬ вать на том основании, что нельзя найти управлений, удовлетворяющих всем необходимым условиям. В таких случаях можно найти управления, которые удовлетворяют всем, за исключением одного, необходимым усло¬ виям. Этот факт часто связан с отсутствием оптимального управления. Далее перейдем к вопросу единственности оптимального управления. Нетрудно видеть, что существование оптимального управления и един¬ ственность экстремальных управлений предполагают единственность опти¬ мального управления. Однако из единственности оптимального управле¬ ния не следует единственность экстремальных управлений. Напомним, что управление, оптимальное по быстродействию, в слу¬ чае нормальной линейной системы было единственным для любого конеч¬ ного состояния Ѳ (см. теорему 6.7 и упражнение 6.7). Однако экстре¬ мальные управления были единственными только для конечного состоя¬ ния Ѳ = 0 (см. теорему 6.9 и упражнение 6.8). Итак, неединственность оптимального управления предполагает неединственность экстремальных управлений. Обратное утверждение может оказаться неверным. Пусть в задаче об оптимизации мы нашли, что оптимум существует не только для всех заданных конечных времен Т, но также и для пре¬ дельного случая Г —> оо. Нетрудно видеть, что существование оптималь¬ ного для любых Т (включая Т —> оо) управления предполагает суще¬ ствование оптимального управления и в том случае, когда Т не задано. Обратное утверждение может оказаться неверным. Предположим, что оптимальное управление существует для всех фиксированных конечных состояний Ѳ в Rn. Пусть S — замкнутая область в Rn. Тогда из существования оптимального управления для всех О f Rn следует наличие оптимального управления к компактной области S, являющейся подмножеством из Rn. Обратное утверждение опять-таки может не быть справедливым. Последнее замечание полезно в случае, когда область S не является гладкой, и поэтому возникают затруднения при использовании условий трансверсальности. В таких задачах наиболее надежный путь состоит 1 См. также замечания 6.7—6.10. 445
в том, чтобы решить задачу с закрепленным концом (с заданным конеч¬ ным состоянием) и затем потребовать, чтобы фиксированная конечная точка принадлежала области S. Это положение мы обсудим более подробно в следующем параграфе. 6.24. СВЯЗЬ МЕЖДУ ЗАДАЧАМИ С ФИКСИРОВАННЫМИ И НЕФИКСИРОВАННЫМИ ГРАНИЧНЫМИ УСЛОВИЯМИ В этом параграфе мы рассмотрим следующие вопросы. 1. Решение задач с нефиксированным временем путем решения сна¬ чала задачи с фиксированным, но произвольным конечным временем. 2. Решение оптимальных задач с областью S (из Rn) путем решения сначала задачи с фиксированным, но произвольным конечным состоянием. Прежде всего рассмотрим задачу оптимизации с фиксированным конечным временем. Для простоты рассмотрим инвариантную во времени систему, описываемую уравнением -*(/)-/[х(0> к(/)]; x(0) = g. (6.754) Пусть Ѳ — заданное конечное состояние в Rn и т J (и) — J L [*(/), a(t)]dt (6.755) О — функционал. Предположим, что мы зафиксировали конечное время Т и нашли оптимальное управление я* Г], переводящее систему (6.754) из начального состояния g в Ѳ (х* (Т) = Ѳ) и минимизирующее функцио¬ нал (6.755). Тогда минимальное значение J (»), обозначенное через J*, зависит от следующих величин х: начального состояния g; конечного состояния Ѳ; конечного времени Т. Поэтому обозначим минимальное значение функционала через J* = J* (I, ѳ, Т). Будем считать, что при t = 0 мы всегда, двигаясь из начального состояния g, хотим попасть в то же самое конечное состояние Ѳ, варьи¬ руя конечное время Т для того, чтобы можно было изучить вариации мини¬ мальной стоимости с изменением Т. При этом будем считать: 1. Если T Q [7\, Т2] (6.756) (т. е., если 0 < 7\ < Т < Т2 < оо), то можно найти оптимальное управ¬ ление и*, ту 2. Если Те [7\, Т2], (6.757) то оптимальное управление не существует. В этом случае можно начертить график J (g, Ѳ, Т) в зависимости от Т для T Ç [Т!, Т21, оставляя неизменными g и 0. Предположим, что этот график похож на график рис. 6.24, а. Из него находим, что функция J* (g, 0, Т) имеет: 1) абсолютный минимум при Т5 и относительный минимум при 7\; 2) абсолютный максимум при Т3 и относительный максимум при Тб; 3) точку перегиба при Т4. 1 В общем случае оно зависит и от начального времени, которое мы выбираем рав¬ ным нулю. 446
Гамильтониан для данной задачи имеет вид p(t), «(/)] = Л[х(/), «(/)] + </[х(/), а(/)|, р(/)). (6.758) По предположению, для каждого T Ç |71( Т2] существует опти¬ мальное управление rj а, следовательно, оптимальная траектория X*) Г) и соответствующая им переменная p*Q Г]. Для каждого Т £ £ [7\, Т21 имеем х* (7) - Ѳ, (6.759) и поэтому можно рассмотреть функцию //[Ѳ, р*(Т\ я* О (6.760) В общем случае для двух различных времен Т^Т из [7\, Т2] (6.761) получим соотношения X* (71) = х*(Т) - Ѳ; p*(f)^p*(f); я* (Т) и* (Т); /7(Ѳ, p*(f), a*(T)]=£/7[0, p*(f), «*(Л1« (6.762) Я[Ѳ, р* (Т), и* (T)\ в зави- изобразить Рис. 6.24. Типичное поведение J* (g, Ѳ, Т) и Н [Ѳ, р* (T), «* (71) ] в зависимости от конечного времени Т Можно видеть, что величина гамильтониана будет неявно зависеть от конечного времени Т, Если ‘ симости от Т для Т £ [7\, Т2], то получится график, похожий на рис. 6.24, б. Таким образом, гамильто¬ ниан будет равен нулю в точках экстремума функции J* (I, Ѳ, Г). На рис. 6.24, б имеем m р*(Л)> u*(Tk)]=0 для k = 3, 4, 5, 6, 7. (6.763) Уравнение (6.763) яв¬ ляется одним из необходимых условий для задачи с неза¬ данным временем. Можно видеть, что это условие вы¬ деляет экстремальные точки функции J* (g, Ѳ, Т), и по¬ этому требуются дополни- тельные вычисления для выделения абсолютного минимума (£, Ѳ, Т) (на рис. 6.24, а Т5). Советуем читателю вернуться к доказательству принципа минимума (§ 5.16) и к замечаниям 6 и 10 § 5.17. Полезно также просмотреть материал § 6.19. Целью этого обсуждения было указать, что часто можно решить задачу с незаданным временем, решая сначала задачу с фиксированным временем и рассматривая затем минимум функционала в зависимости от конечного времени. Таким образом, приходим к стандартной задаче минимизации, и поэтому можно использовать материал § 5.2. 447
В оставшейся части настоящего параграфа покажем, как можно зачастую решить задачу оптимизации для случая замкнутой области S, решая сначала задачу для конечного состояния Ѳ и требуя затем, чтобы Ѳ было элементом S. Рассмотрим систему (6.754) и функционал (6.755) с фиксирован¬ ным Т. Пусть S — компактная область S в Rn. Предположим, что опти¬ мальное управление существует для всех Ѳ Q Q, где Q — подмножество из Rn, содержащее S: S с= Q с= Rn. (6.764) Функционал 7* (g, Ѳ, Т) опять-таки зависит от начального состояния g, конечного состояния Ѳ и конечного времени Т. Если зафиксировать время T, то можно нарисовать график зависимости 7* (g, Ѳ, Т) для всех Ѳ из Q. Если потребовать теперь, чтобы конечное состояние принадлежало к области S, то можно найти, как показано на рис. 6.25, значение минимума функционала для каждого О из S. Если найти функционал J* (g, S, Т) = min Г (g, О, Т), (6.765) ѳ G 5 то он, естественно, будет решением и задачи управления для области S. Можно видеть, что определение J* (g, S, Т) сводится к минимизации начальное состояния g и конечное Рис. 6.25. Стоимость J* (g, Ѳ, Т) для Ѳ g S фиксированных g и T скалярной величины 7* (g, Ѳ, Т) при алгебраическом ограничении Ѳ Q S; следовательно, можно использовать- материал § 5.3—5.5. Покажем, что необходимое условие перпендикулярности р* (Т) к области S эквивалентно отысканию экстремальных точек 7* (g, Ѳ, T) для Ѳ £ S. Для определенности предположим, что S есть гладкая гипер¬ поверхность в Rn, описываемая уравнением S = {X : g (х) = 0}. (6.766) Если Ѳ £ S, то должно быть g (0) = 0. (6.767) Обозначим для простоты величину 7* (g, Ѳ, Т) через 7* (Ѳ). Чтобы найти экстремальные точки 7* (Ѳ) при ограничении g (Ѳ) = 0, можно использовать приемы, описанные в § 5.4. Итак, обозначим через X мно¬ житель Лагранжа и рассмотрим функцию 7*(Ѳ) + Х£(Ѳ). (6.768) Предположим, что точки ѳ*, ѳ*, ..., ѳ* 1’2’ ’ m (6.769) экстремальны (т. е. являются точками минимума, максимума, седловыми и т. д.). Тогда (см. теорему 5.1) существует число X*, соответствующее каждому Ѳ(., і = 1, 2, ..., т, такое, что Ѳ(* и X* являются решениями системы п + 1 уравнений (в случай «гладкой» задачи): <М*(Ѳ) А , dg (Ѳ) —âe~ " à~ô9~ = 0> £(ѳ) = °- (6.770) 448
Другими словами, для каждого і = 1, 2, . . ., т имеем + X* А<Э>1 =0; £(0)| =0. (6.771) св Іѳ=ѳ* - æ Iu=t)* І8=ѳ* Обратимся теперь к условию трансверсальности, которое устанавли¬ вает, что вектор р* (Т) должен быть нормален к S в точке Ѳ*. Так как область S описывается уравнением g (х) = 0, (6.772) градиент (вектор) при х = Ѳ равен 1 . (6.773) дх I х==о Пусть с — ненулевая константа; тогда при Ѳ = Ѳ* должно быть p*(n = c4FI *• (6-774) ох I х=Ѳ* Так как мы предположили, что рассматриваем «гладкую» задачу, то (6.775) Таким образом, для х* (/), близкого к Ѳ*, и близкого к Т, имеем Р*(Л (V* (X) ~дх x=ü* (6.776) Из выражений (6.776) и (6.774) находим dî* (X) с dg (X) дх Xz= ѳ* дх (6.777) = О х*=Ѳ* Так как 0* принадлежит к S, из соотношения (6.772) получим = 0. (6.778) Сравним теперь систему п + 1 уравнений, определяемых соотноше¬ ниями (6.777) и (6.778), с системой п + 1 уравнений, определяемых соот¬ ношением (6.771). Мы видим, что они одинаковы. Следовательно, поскольку точки Ѳ*р Ѳ*2, . . ., Ѳ* удовлетворяют соотношениям (6.771), они удовлет¬ воряют также и уравнениям (6.777), (6.778), если Ѳ* _ g* ] __с I 4 = 1,2,.. ., m. (6.779) Итак, мы доказали, что необходимое условие нормальности р* (Т) к S выделяет экстремальные точки (Ѳ), 0 Г- S. Чтобы найти точку, соответствующую абсолютному минимуму, необходимо выполнить допол¬ нительные вычисления. Советуем читателю перечитать раздел 9 § 5.16 и замечания 7, 8 и 10 § 5.17, чтобы лучше усвоить смысл условий транс¬ версальности. Если множество S не является «гладким» (например, множество цели может состоять из изолированных точек) х, то мы почти вынуждены решать задачу с закрепленным концом (с фиксированным конечным состоянием). В таких задачах мы можем оказаться не в состоянии определить пло¬ скость, касательную к области цели, и поэтому нормаль к множеству цели может быть неопределенной (см. замечание 8 § 5.17). 1 Простые задачи на оптимум по быстродействию и по расходу топлива для та¬ кой области цели решены в работе [8]. 15 Атанс и др. 41)
6.25. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Как было указано во вступлении к настоящей главе, нашей целью было перейти от «теоретического» материала гл. 5 к «прикладному» мате¬ риалу гл. 7—10. Первый шаг решения оптимальной задачи состоит всегда в отыскании экстремальных управлений, т. е. управлений, удовлетворяющих необхо¬ димым условиям. Была отмечена важность таких теоретических резуль¬ татов, как существование и единственность экстремальных управлений, существование вырожденных управлений и т. д. Мы решили также ряд конкретных задач. Целью последних четырех глав является не только проиллюстриро¬ вать теорию при помощи конкретных задач, но и, кроме того, дать набор примеров, показывающих структуру оптимальных систем с обратной связью, типы нелинейностей, которые надо реализовать, показать аналитические трудности, возникающие для систем высоких порядков, и относительную сложность оптимальных устройств. Часто мы будем рассматривать, исходя из оптимальных систем, системы, близкие к опти¬ мальным. Нам кажется, что инженер сможет оценить достоинства и недо¬ статки оптимальных систем только в том случае, если он хорошо знаком как с теорией, так и с ее техническими приложениями (измерительными средствами и вычислительными машинами). До сих пор мы имели дело лишь с общей теорией, далее будем рассматривать достаточно подробно конкретные системы.
ГЛАВА 7 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО БЫСТРОДЕЙСТВИЮ 7.1. ВВЕДЕНИЕ В этой главе на примерах простых систем детально изучим задачу об управлении, оптимальном по быстродействию. В § 6.1—6.10 мы рассматривали лишь общую постановку и решение такой задачи. Здесь же рассмотрим проектирование и расчет конкретных систем управления с обратной связью, оптимальных по быстродействию. Изучение конкретных оптимальных по быстродействию систем оказало огромное влияние на все развитие современной теории управления. В 1950 г. были опубликованы две статьи Гопкина [96] и Макдональда [157], относительно эффективного использования реле и нелинейной обратной связи для улучшения работы сервомеханизмов второго порядка. Для обоснования того, что управление действительно являлось опти¬ мальным по быстродействию были использованы геометрические доказа¬ тельства. Позднее Бушау [38] распространил эти результаты на другие системы второго порядка. Появилось много статей (например, [27], [28], [39], [41], [52], [105], [133], [134], [165], [173], [181], [187], [195] и [200]), в которых рассматривались оптимальные по быстродействию системы управления второго и более высоких порядков. Изучение систем второго и третьего порядка привело к развитию более хорошо обоснован¬ ной математически теории задач на оптимум по быстродействию (см. [19] и [140]). Между тем устройства, оптимальные по быстродействию, появи¬ лись и в учебниках (см., например, [203], гл. 11, [198] гл. [15—17], [42] гл. 9 и [81 ] гл. 10). Применение принципа минимума еще более повысило интерес к задачам об оптимальном быстродействии. Основными задачами данной главы будут: 1. Проиллюстрировать использование необходимых условий для пол¬ ного расчета оптимальных по быстродействию систем с обратной связью. 2. Рассмотреть такие геометрические понятия, как «линии» и «поверх¬ ности переключения». 3. Исследовать типы нелинейных преобразований, требующихся для получения оптимальных по быстродействию систем с обратной связью. 4. Обсудить относительную сложность конструкции регуляторов, оптимальных по быстродействию. 5. Проиллюстрировать на конкретных примерах и упражнениях раз¬ личные теоретические положения, рассмотренные в общем виде в предыду¬ щих главах. Доказывать единственность экстремальных управлений мы часто будем геометрически, не прибегая к теореме 6.9. Эти доказательства можно использовать для обоснования единственности в тех частных слу¬ чаях, для которых невозможно установить общих теорем (например, для
нелинейных систем). Однако будем опираться на теорему 6.10, которая гарантирует существование оптимальных по быстродействию управлений, приводящих систему к началу координат. Во многих упражнениях читателю предлагается самому получить решения задач с различными конечными множествами S, так что он смо¬ жет познакомиться с некоторыми свойствами необычных систем управ¬ ления. Следует отметить, что задачи, рассматриваемые в этих упражне¬ ниях, не имеют большого смысла с инженерной точки зрения; тем не менее, они иллюстрируют различные важные случаи, которые могут воз¬ никнуть в других, реальных и поэтому более сложных задачах. В большинстве задач, которые мы рассмотрим, имеется одна вход¬ ная переменная и (/). Так как задачи, рассматриваемые в этой главе являются нормальными, то управления, оптимальные по быстродействию будут кусочно-постоянными. Поэтому введем удобные сокращенные обо¬ значения для изображения постоянных величин кусочно-постоянного управления. Эти обозначения определены ниже и будут использоваться на протяжении настоящей и следующей глав книги. Определение 7.1. Управляющая последовательность. Мы будем исполь¬ зовать обозначение и2, и3, ... ,) где щ — постоянные, полагая и (0 = для t0 << t < tlf и (t) = и2 для tr << t < Z2; и (t) — u3 для t2 < t < t3. Множество u2, z/3, . . .} будем называть управляющей последова¬ тельностью. Например, утверждение: «используется управляющая после¬ довательность { + 1, —1}» означает, что сначала прикладывается управ¬ ление и (t) +1, а затем — управление и (t) --= —1. Так как системы, которые мы будем рассматривать, инвариантны во времени, можно будет найти оптимальное управление как функцию состоя¬ ния и, таким образом, решить задачу об обратной связи (см. § 6.6). Управления, оптимальные по быстродействию, будут кусочно-постоян¬ ными функциями времени и в то же время они являются функцией от состояния системы. Найдем множества, или области фазового простран¬ ства, в пределах которых управление постоянно. Эти области окажутся разделенными кривыми — в двумерном пространстве, поверхностями — в трехмерном пространстве и гиперповерхностями — в n-мерном простран¬ стве. Разделяющие множества называются кривыми переключения, поверх¬ ностями переключения, гиперповерхностями переключения и т. д. Эти положения будут поясняться по мере чтения главы. Пока лишь отметим, что форму кривых и поверхностей переключения определяют нелинейные операции, которые должны осуществляться для получения оптимального управления. В каждом параграфе этой главы мы, в общих чертах, будем действо¬ вать по следующей схеме: 1. Точно формулировать задачу. 2. Записывать гамильтониан. 3. Определять //-минимальное управление (см. § 5.3). 4. Получать уравнения относительно дополнительных переменных. 5. Определять управляющие последовательности, которые могут ока¬ заться оптимальными. 6. Находить управляющие последовательности, удовлетворяющие граничным условиям. 452
7. Определять кривые переключения и т. д., разделяющие фазовое пространство на различные области. 8. Доказывать справедливость оптимального закона управления. Конкретные задачи, которые мы будем рассматривать в данной главе, можно классифицировать следующим образом. В § 7.2—7.6 рассматри¬ вается управление системами с действительными полюсами (илк собствен¬ ными значениями); в § 7.7—7.9 разбирается управление системами с ком¬ плексными полюсами (собственными значениями); наконец, в §7.12— 7.16 рассматривается управление системами, передаточные функции кото¬ рых содержат также нули. Естественно, имеется множество других задач об оптимальном быстродействии, решения которых описаны в литературе по теории управления 1. Материал, включенный в настоящую главу, дает достаточно основных сведений для того, чтобы позволить заинтере¬ сованному читателю взяться за решение подобных задач. Наконец, необходимо предостеречь читателя, что критерий максимума быстродействия во многих случаях не является наилучшим критерием. Например, если вы хотите вести свою машину от светофора до светофора с минимальной затратой времени, то должны как можно быстрее разго¬ няться и резко тормозить. Такое «оптимальное по быстродействию» управление имеет ряд недостатков, а именно: 1. Необходимо точно знать динамику машины. 2. Необходимо точно знать условия ускорения и торможения для того, чтобы заранее рассчитать момент включения тормоза (иначе машина проскочит на красный свет). 3. Происходит повышенный износ резины. 4. Потребление бензина будет высоким. 5. Вам могут вручить квитанцию о штрафе или отобрать права. Можно видеть, что критерий минимума времени не всегда является наилучшим, и поэтому проектировщик должен тщательно обдумать выбор критерия, наиболее подходящего для данного конкретного случая. ОПТИМАЛЬНЫЕ ПО БЫСТРОДЕЙСТВИЮ СИСТЕМЫ 7.2. УПРАВЛЕНИЕ ОБЪЕКТОМ, КОТОРЫЙ ПРЕДСТАВЛЯЕТ СОБОЙ ДВА ИНТЕГРАТОРА В этом параграфе мы решим задачу об оптимальном управлении для объекта с двойным интегрированием. Рассмотрим ее достаточно подробно, так как полученные выводы будут в дальнейшем неоднократно использо¬ ваться. Задачу решим для следующих конечных состояний: 1) начала координат фазовой плоскости; 2) всей оси координат; 3) отрезка прямой. Объект с двойным интегрированием часто представляет собой дви¬ жение инерционной нагрузки в устройствах без трения (см. также при¬ мер 6.9). Например, если через т обозначить массу (или момент инерции) тела, через у (/) — его положение (или угол поворота), а через v (t) — прикладываемую силу (или момент), то при отсутствии трения и грави¬ тационных сил его движение будет описываться уравнением второго порядка вида ту (/) = v (/). (7.1) Передаточная функция системы имеет вид 1 См., например, [63]. [64], [173], [174], [122], [129], [197], [1], [48], [65], [29b [66] и [179] (гл. 1 и 3). 453
Определим управление и (£), положив и (/) = тогда уравне¬ ние (7.1) запишется: ÿ (t) = и (Z). (7.3) Определим переменные состояния (фазовые координаты) как У) = У (0 — выход; J х2 (0 = У (0 — скорость на выходе J ' ’ ' и получим систему в виде À (0 - %2(0; х2 (О = и (/). (7.5) Будем считать, что управление ограничено по величине соотношением I и (Z) I < 1 для всех t. (7.6) Это ограничение, как мы уже отмечали в гл. 6, следует из физических ограничений на величину тяги и момента, которые могут давать реаль¬ ные устройства. Рассмотрим первую задачу. Задача 7.1. Дана система (0 - х2 (/) х2 (0 = (0; I а (01 < 1- (7.7) Необходимо определить допустимое управление, переводящее систему (7.7) из любого начального состояния (|х, £2) в начало координат (0, 0) на наименьшее возможное время. Прежде чем приступить к ее решению, заметим: система (7.7) нормальна, и поэтому вырожденные управления не могут быть оптимальными (см. теорему 6.6); оптимальное управление существует (теорема 6.10) и является един¬ ственным (теорема 6.7); так как конечным состоянием является начало координат, то экстре¬ мальное управление единственно (теорема 6.9). Метод решения этой задачи будет состоять из следующих шагов: 1. Определения //-минимального управления, т. е. управления, ми¬ нимизирующего гамильтониан. 2. Составления уравнений для дополнительных переменных при неизвестных начальных значениях. 3. Определения управляющей последовательности (см. определе¬ ние 7.1), представляющей возможное оптимальное управление. 4. Построения траекторий движения на фазовой плоскости для и = = +1 и и = —1. 5. Определения кривой переключения. 6. Нахождения закона управления 7.1, являющегося решением поставленной задачи 7.1. 7. Составления блок-схемы реализации полученного закона управ¬ ления. Для задачи 7.1 функция Гамильтона имеет вид // = 1 +х2(0Р1(0 + ^(/)р2(0 (7.8) //-минимальное управление, т. е. управление, минимизирующее гамиль¬ тониан, равно и (0 - -sign [р2 (t)} = Л = ±1. (7.9) 454
Дополнительные переменные удовлетворяют уравнениям (7.10) Пусть Jtj и л2 — начальные значения дополнительных переменных, т. е. = Рі (0); л2 = Рг (0). (7.11) Тогда из уравнений (7.10) находим Pi (t) = л, = const; /а / (7.12) р2 (t) = л2 — n±t. Из соотношений (7.12) видно, что р2 (0 есть прямая на плоскости р2 (0, t. На рис. 7.1 показаны четыре возможных вида р2 (t) и соответ¬ ствующие им //-минимальные управления и (t) = —sign {р2(0} Из рис. 7.1 Рис. 7.1. Четыре возможных вида р2 (0 = я2—и соответствующие им управления и (t) = —sign {л2 —л^} также видно, что управление, оптимальное по быстродействию, является кусочно-постоянной функцией времени и может переключаться не более одного раза (сравните с теоремой 6.8), так как задача нормальна. Таким образом, приходим к выводу, что оптимальными могут быть только че¬ тыре управляющих последовательности: {+1}; {-1}; {+1; -1); {-1; +1}. (7.13) Выделить эти четыре возможных последовательности мы смогли с помощью двух необходимых условий, а именно, уравнения (7.9) и (7.12). Так как на конечном интервале времени оптимальное управление постоянно, и (/) = А = ±1, то уравнение (7.7) можно решить, полагая и (t) = А = const, для начальных условий *і(0) =£,; х2(0)=Ь (7.14) 455
и получить соотношения х2 (/) = |2 + Д/; (7.15) л-1(/) = В1-и2/ + 4"А/2' (7-16) Далее, исключая время /, находим xi = à <7л7> где t - А (х2-Ь). (7.18) Уравнение точки (£іЛ2) на (7.17) есть уравнение траектории, начинающейся из плоскости ххх2 Для управления и А. Эти траектории, Рис. 7.2. Вынужденные траектории на фазовой плоскости. Сплошные кривые соответствуют и = 1, пре¬ рывистые — и — —1 Рис. 7.3. Линия переключе¬ ния для объекта с двойным интегрированием являющиеся параболами, показаны на рис. 7.2. Сплошные траектории соответствуют и = А = +1; штриховые — управлению и = А = —1; стрелки показывают направление движения для положительного времени. Наша цель состоит в том, чтобы перевести любое начальное состояние в (0, 0), т. е. в начало координат фазовой плоскости. Так как управление должно быть кусочно-постоянным, мы можем найти геометрическое место точек, которые могут быть переведены в (0, 0) при помощи управления и “ ± 1. Эти две траектории, приводящие в (0, 0), обозначены на рис. 7.2. через у+ и у_. Укажем точные определения. Определение 7. 2. Кривая у+ есть геометрическое место точек (хъ х2), которые могут быть переведены в (0, 0) при помощи управления и = +1: ѵ+ = [(%!, х2):хі = 4~ х2'> х2 < о! • (7.19) 1 z ) Определение 7.3. Кривая у_ есть геометрическое место точек (хь х2), которые могут быть переведены в (0, 0) при помощи управления и = —1: у, = !(хі, х2):хі — х2; х2^о). (7.20) I 4 I 456
Определение 7.4. Кривая у, называемая линией переключения, есть объединение кривых у+ и у_: Т = [(Х|. = *21-ЧI j T+Uï- <7-21) Кривая у показана на рис. 7.3. Она делит фазовую плоскость на две области (или два множества) /?_ и R+. Определение 7.5. Пусть R. есть множество состояний (х1( х2), удов¬ летворяющих условию R. - |(л-1, л-,):*, > - 4 А'21 л'21 } ’ (7-22) т. е. R_ состоит из всех точек справа от кривой у. П)сть /?+ — множество состояний (хь х2) удовлетворяющих условию Рис. 7.4. Различные траектории, получающиеся при положении четы¬ рех возможных управляющих по¬ следовательностей /?+ --- ((хь х2):Хі < х21 х2 |j , (7.23) т. е. R+ состоит из всех точек слева от кривой у. Докажем, что если начальное состоя¬ ние S -= (|ъ |2) принадлежит кривой у+, то и + 1 есть управление оптимальное по быстродействию (рис. 7.4). Рассмотрим четыре управляющих последовательности (+1}, (-1}, {+1, -Ц и {-1, +1}. По определению управляющая последо¬ вательность {+1} дает траекторию ЕО, достигающую начала координат, а управ¬ ляющая последовательность {— 1}—трае¬ кторию ЕЛ, которая никогда не достигнет начала координат. Управляющая после¬ довательность {4-1, —1} дает траектории типа ЕВС, не достигающие начала коор¬ динат, а последовательность {— 1, 4-1} —траектории типа Е£)В, также не достигающие (0, 0). Следовательно, если начальное состояние нахо¬ дится на кривой у+, из всех управляющих последовательностей только последовательность {4-1} может перевести состояние S в 0. Итак, мето¬ дом исключения мы показали, что управляющая последовательность {+1} оптимальна по быстродействию. Используя аналогичные рассуждения, можно доказать, что если начальное состояние принадлежит кривой у_, то оптимальным по быстро¬ действию является управление и —1. Таким образом, мы нашли опти¬ мальный закон управления для начальных состояний, принадлежащих кривой переключения у. Рассмотрим теперь начальное состояние X, принадлежащее области R_ (см. определение 7.5). Если использовать управляющую последова¬ тельность {4-1}, то получим траекторию ÀG, которая никогда не достиг¬ нет начала координат. Если приложить последовательность {4-1; —1}, то получится траектория типа ХНІ, не достигающая начала координат. Однако, если использовать последовательность {— 1, 4-1}, то можно достичь начала координат вдоль траектории XJO при условии, что пере¬ ход от управления и =--- —1 к и 4-1 произойдет в точке J, т. е. точно в тот момент, когда траектория пересечет линию переключения у. Это 457
справедливо для любого состояния из 7?_. Итак, методом исключения мы пришли к выводу, что последовательность {— 1, +1) оптимальна по быстродействию для любого состояния из R_, причем управление переклю¬ чается си = —1 на и = +1 на линии переключения у. Совершенно ана¬ логично можно показать, что последовательность { + 1, —1} оптимальна по быстродействию для любого состояния из /?+ при условии, что управление переключается с и = +1 на и —1 на линии переклю¬ чения у. Полученные нами результаты можно сформулировать в виде закона управления. Закон управления 7.1. (решение задачи 7.1.). Оптимальное по быстро¬ действию управление и* как функция от состояния (хх, х2) равно и* = и* (%!, х2) = + 1 Для всех (хх, *2)Çï+U^+- u* = u* (xx, x2) = — 1 Для всех (xx, x2) Cï-U R- и, следовательно, u* является единственным. Этот закон управления опре¬ деляет величину оптимального управления и* для любого состояния на фазовой плоскости. Отметим, что при его доказательстве мы использовали: 1. Существование управления, оптимального по быстродействию. 2. Однозначное соответствие управляющей последовательности на¬ чальному состоянию. Это эквивалентно единственности экстремальных управлений. 3. Тот факт, что из существования оптимального управления и един¬ ственности экстремальных управлений следует единственность оптималь¬ ного управления. (7.24) Рис. 7.5. Реализация оптимальной по быстродействию си¬ стемы управления объектом с двойным интегрированием Далее покажем, каким образом может быть реализован закон управ¬ ления 7.1. Мы можем спроектировать нелинейную систему управления с обратной связью, которая преобразует фазовые координаты хх и х2 и формирует правильное управление и*. Такая практическая реализа¬ ция показана на рис. 7.5. Фазовые координаты (переменные состояния) хг (/) (выход) и х2 (/) (скорость изменения выходной координаты) изме¬ ряются в каждый момент времени. Сигнал х2 (t) подается на нелиней¬ ность М, на выходе которой имеем *2 (0 1*2 (01- Сигнал z(t) == x^t) +-±~x2(t)\x2(t)\ (7.25) после инвертирования управляет реле R. Реле представляет собой техни¬ ческую реализацию операции sign. 458
Сигнал на выходе реле обеспечивает управление, оптимальное по быстродействию, так как если (%! (О, х2 (0) С то —2 (0 <0; если (Xj (/), х2 (/)) Q R+, то —г(/) > 0. Основная трудность возникает тогда, когда состояние (Xj (/), х2 (0) оказывается на линии переключения у. Из уравнений (7.25) и (7.21) можно видеть, что при (t), х2 (/)) £ у имеем z (/) = 0. В этом случае входной сигнал реле равен нулю. Однако так как реле является физи¬ ческим элементом с малой (но не равной нулю) инерционностью, оно переключится не в точности на кривой у, а несколько позже, и поэтому, когда действительно произойдет переключение реле, состояние системы уже не будет нахо¬ диться на кривой у, и сигнал на входе реле не будет равен нулю. Именно поэтому систему, показанную на рис. 7.2, мы называем техни¬ ческой реализацией закона управления. Физи¬ ческие свойства применяемых технических средств устраняют неопределенность функции sign (0), и поэтому практические системы 1 оказываются «почти» оптимальными («квазиоп¬ тимальными»). Перейдем далее к реализации нелинейно¬ сти N. Прежде всего заметим, что связь между входом и выходом N совпадает с линией пере¬ Рис. 7.6. Две оптимальные по быстродействию траекто¬ рии на фазовой плоскости самостоятельно оценить ключения у. Можно сконструировать нелиней¬ ность N, используя множительное устройство и генератор модуля (чтобы получить сигнал х2 (0 I х2 (0 I) или кусочно-линейную аппрокси¬ мацию на диодах. Предоставляем читателю результаты аппроксимации в порядке выполнения упражнения. На рис. 7.6 показаны две оптимальные траектории к началу коорди¬ нат. Стрелками показано направление движения для положительного времени. Оптимальные траектории составлены из отрезков парабол. Найдем теперь минимальное время. Для каждой точки (хх, х2) фазо¬ вой плоскости существует время = /* (хх, х2), которое является наи¬ меньшим временем, требующимся для перевода (хх, х2) в (0, 0). Выра¬ зим в функции от хх, х2 и покажем, что оно является решением урав¬ нения Гамильтона—Якоби. Метод вычисления состоит в том, что вычис¬ ляется время, требующееся для перевода хх, х2 на линию переключения у, а затем — время движения от точки пересечения траектории с кривой у до точки (0, 0). В результате получим /* (хх, х2) = /* х2 "J/4”4хі 2x2 , — х2 4~ — 4хі + 2x2, |х21, если если хі > 2" х21 х21; если хі< 2“Х2|Х2|; 1 ! t Xi = — — X2|x2|. (7.26) Упражнение 7.1. Получите выражения (7.26). Подробное обсуждение несовершенства оборудования содержится в [198], гл. 15. 459
Рассмотрим теперь множество состояний (хп х2), которые могут быть переведены в (0, 0) за одно и то же минимальное время /*. Из соотноше¬ ний (7.26) находим -4-*2+4-<z*~a'^ 4-^2—4- для %!> 2"А'2|х2|; для А'1< 2-х2|х2|; (7.27) ДЛЯ А} — 9 Х2 I А'2 I. I Определение 7.6 \ Пусть S (/*) — множество состояний, которые можно перевести в (0, 0) за одно и то же минимальное время Множе¬ 5(0,5) ' 5(1,0) V 5(1,5) 5(1,0) 5(1,5) Рис. 7.7. Три минимальные изох¬ роны для объекта с двойным инте¬ грированием ство S (/*) называют минимальной изох¬ роной. Состояние (хь х2) принадлежит к S (t*) в том и только в том случае, когда х2 и t* удовлетворяют уравне- нию (7.27). Каждое множество S (/*) есть замк¬ нутая кривая на фазовой плоскости. На рис. 7.7 показаны три минимальные изо¬ хроны. Каждая кривая S (/*) дифферен¬ цируема во всех точках за исключением двух точек пересечения с линией пере¬ ключения у. Из соотношений (7.27) легко вывести следующее свойство минимальных изохрон. Пустъ (7.28) рассмотрим минимальные изохроны S (7*) и S (/2*). Предположим, что тогда (4 Л2)<3(/*), (л, х2) и К- х2) -1 Y, (7.29) Упражнение 7.2. Выведите неравенство (7.29). Это свойство, попросту говоря, состоит в том, что минимальные изохроны «растягиваются» с увеличением времени /*. Упражнение 7.3. Рассмотрите изохрону S (/*, х2) как границу множества S (/*, х2). Покажите, что множество S (/*, х}, х2) замкнуто, ограничено и выпукло. Пока¬ жите, что множество S (/*, —хп х2) является множеством достижимых состояний из (0, 0) за время /* для управления, удовлетворяющего ограничению | и (/) | 1. Убедимся, что уравнение Гамильтона—Якоби 1 2 удовлетворяется вдоль оптимальной траектории. Прежде всего, минимум стоимости для нашей задачи соответствует минимальному времени Z* (хх, х2): 7* (х, і) -= /* ОН, а:2). (7.30) Минимальное время выражается соотношением (7.27). В общем случае уравнение Гамильтона—Якоби имеет вид и—и* (7-31) х х* = 0. 1 Сравните с определением 6.10. 2 См. § 5.18—5.21 и § 6.9. 460
Для данной задачи имеем Н = 1 + х2рх + ир2, (7.32) и поэтому примем, что “ дхг ’ Р2 ~~ дх2 Так как оптимальное управление равно: и* = 4- 1, если (хь л-2) - /?+; и* = — 1, , если (хъ х2) С Я-’» zz* —sign {х2}, если (хь х2)£у, то уравнение Гамильтона—Якоби запишется в виде аг . , а/* а/* п . і . . ir-i = если ^>—2-^І^2І; 4-+1+^^r-+-£L=0- если *><-4^іа'2і; ОI иЛ] УЛ2 л Af* rit* rit* 1 ~дГ ! 1 + —sign k2)= 0, если %! = 2~х2|л-2|. (7.33) (7-34) Из уравнений (7.26) получим 2 у/~4%1 2х; а/-" ах. (7.35) 1 I I 1 если х± > 2~х21 х21; если%! < ^-л-2|х2|; . а/* дх2 О ( 1 ■ | 4xt 4- 2х, -1 Г ?*2 |/—4Х] + 2х; sign Ю, I если если если если Хі — X, |х2|; (7.37) Рассмотрим множество состояний — у Х2 %і т. е. множество точек справа от линии переключения. Из уравнений (7.35) — (7.37) получим 1 -I 2x2 _ 1 2X2 .. = о. (7.38) ]/" 4%! + Чх} |/ 4х( + 2х2, Аналогично для < і-х2|х2|, т. е. для (хх, х2)^Т?+ имеем 1 . 2х- — 1 л 2х'2 —- - 0, (7.39) |/ — 4хд -J- 2х; J/ 4Х; + 2х2 461
и, наконец, для х± = ^-х2|х2|, т- е- Для состояний на кривой у, получим 1 + х20 — sign (х2) sign {х2} = 1 — 1=0. (7.40) Из последних соотношений (7.38)—(7.40) следует, что уравнение Гамильтона—Якоби удовлетворяется для любых (хп х2) и что закон управления 7.1 действительно является оптимальным по быстродействию. Отметим, однако, что уравнение Гамильтона—Якоби необходимо прове¬ рить для каждой из областей R+, R_ и у отдельно. Это является типич¬ ной особенностью многих систем, оптимальных по быстродействию х. В заключение сформулируем основные результаты. Мы рассмотрели задачу об оптимальном по быстродействию управлении объектом с двой¬ ным интегрированием при переводе его из любого начального состояния в начало координат. Сначала мы использовали необходимые условия для получения четырех управляющих последовательностей, которые надо рассматривать как возможные оптимальные управления. Далее мы пока¬ зали, что каждому состоянию (хъ х2) соответствует единственная управ¬ ляющая последовательность, переводящая его в (0, 0), и, таким образом, получили закон управления 7.1. Мы выразили минимальное время t* перехода из произвольного начального состояния (xlf х2) в (0, 0) в виде функции от (хь х2) и ввели понятие минимальной изохроны. Наконец, показали, что минимальное время t* есть решение уравнения Гамиль¬ тона—Якоби, доказав таким образом оптимальность закона управле¬ ния 7.1. Читатель, видимо, заметил, что мы так и не нашли неизвестных начальных значений дополнительных переменных и л2 из уравне¬ ния (7.12). Таким образом, мы смогли найти оптимальное управление как функцию состояния, используя лишь то обстоятельство, что опти¬ мальное управление должно минимизировать гамильтониан и информацию, которую дает «характер» р2 (t) (см. рис. 7.1). Мы не использовали также того, что гамильтониан должен быть равен нулю вдоль оптимальной траек¬ тории. Именно это условие и необходимо использовать для нахождения Лі и л2. Сделать это предоставим читателю в одном из упражнений в конце настоящего параграфа. Далее рассмотрим задачу о переводе произвольного начального состоя¬ ния в область S за минимальное время. Обсудим сначала задачу о дости¬ жении оси из произвольного начального состояния за минимальное время. Задача 7. 2. Дана система (7.5) и область S, заданная в виде S — {(^і, х2) : х2 — 0, — сю «<%! (7-41) 2 Требуется найти управление и (t), удовлетворяющее ограничению I и (01 < 1, которое переводит произвольное состояние в S за мини¬ мальное время. То обстоятельство, что мы пытаемся достичь области, а не точки, не повлияет на некоторые из результатов, которые получены с помощью принципа минимума. Например, гамильтониан Н остается неизменным: Н = 1 + х2 (0 Р1 (0 + и (t) р2 (/). (7.42) Управление и (t), минимизирующее гамильтониан, выражается урав¬ нением (7.9), т. е. и (0 = —sign \p2(t)}. (7.43) 1 См. также замечания в конце § 6.9. 2 Область S обладает тем свойством, что в любой ее точке можно определить един¬ ственную нормаль к ней. 462
Теми же самыми остаются и уравнения относительно дополнительных переменных: Р1 (0 = Лп (7.44) Ръ (О — *^2 (7.45) Условия трансверсальности требуют, чтобы в конечный момент вре¬ мени tr дополнительный вектор р (G) был нормален к вектору q, который принадлежит гиперплоскости, касательной к области S. В нашей задаче областью S является прямая, и поэтому в качестве q можно использовать вектор (7-46) Таким образом, из условия ?) = 0 (7.47) следует, что kp, (G) + 0р2 (G) = 0, (7.48) откуда находим Рі (*і) = 0. (7.49) Но pj (/) = Лі = const в любой момент времени, а следовательно, Л! = 0 и р2 (0 = л2. (7.50) Итак, р2 (/) есть ненулевая (почему?) постоянная, положительная или отрицательная, для любого момента времени. Из последнего уравне¬ ния, а также из уравнения (7.43) следует, что оптимальное управ¬ ление есть и = +1 или и — —1 и что переключения не происхо¬ дит. Таким образом, только по¬ следовательности { + 1} и {— 1} могут быть возможными оптималь¬ ными управлениями. Нетрудно убедиться, что оптимальное управ¬ ление как функция от состояния формулируется в виде следующего закона управления. Закон управления 7.2 (реше¬ ние задачи 7. ). Управление, опти¬ мальное по быстродействию, как Рис. 7.8. Оптимальные по быстродействию траектории к области цели S (ось хх) функция состояния (хх, х2) определяется в виде и* = и* (хх, х2) = —sign {х2}, (7.51) и, следовательно, и* единственно. Из рис. 7.8 показаны траектории, оптимальные по быстродействию, для области цели S. Упражнение 7.4. Проверьте закон управления 7.2. Упражнение 7.5. Дано состояние (хр %2). Найдите минимальное время требую¬ щееся для попадания в область S [см. зависимости (7.41)]. Покажите, что является решением уравнения Гамильтона—Якоби для этой задачи. Нарисуйте блок-схему опти¬ мальной си стели. Проанализируем сходства и различия между задачей о попадании в отдельную точку и задачей о попадании в множество S. Гамильтониан, уравнения относительно дополнительных переменных и уравнение Н- минимального управления (в функции от дополнительной переменной) 463
одинакова для обеих задач. Единственное отличие имеет место при вычис¬ лении дополнительных переменных в конечный момент времени. Эта дополнительная информация позволяет сделать вывод, что только две управляющие последовательности { + 1) и {— 1} могут быть оптималь¬ ными управлениями для области S, в то время как для точки оптималь¬ ным управлением может оказаться одна из четырех управляющих после¬ довательностей {+1); {-1}; {+1, -1}; {-1, +1). Рассмотрим теперь задачу о достижении замкнутого интервала на оси Aj за минимальное время. Зідача 7.3. Дана система (7.5) и область Sa, определенная для а >> О соотношением Sa = {(*і> *2) ‘ х2 0’ — а < хі < а! • (7.52) Найти управление и (/), удовлетворяющее ограничению \и (/) | С 1, которое переводит произвольное начальное состояние в S за минималь¬ ное время. Отметим, что единственную нормаль к замкнутому множеству S можно определить везде, за исключением двух точек (—а, 0) и (а, 0). Если конечное состояние оптимальной траектории принадлежит внутрен¬ ней части Sa, i (Sa), то условия трансверсальности выполняются. Если конечным состоянием является одна из точек (—а, 0) или (а, 0), то в этих точках нельзя определить единственной касательной к Sa и поэтому нельзя установить никаких условий трансверсальности. Поэтому, если конечное состояние принадлежит внутренней части 5а, то оптимальными управлениями могут быть только две последовательности { + 1} и {— 1). Если конечное состояние принадлежит границе Sa, т. е. dSa, то все четыре последовательности {+!}, {— 1), { + 1, —1}, {— 1, +1} можно рассматривать в качестве возможных оптимальных управлений. Определим замкнутое множество G, показанное на рис. 7.9, и мно¬ жества G+ и G_ при помощи соотношений С+ = {(%!, х2) : (хг, x2)QG и х2 < 0}; G. = {(%!, x2):(%i, x2)QG и х2>0}. (7.53) Так как множество Sa задачи 7.3 есть подмножество из оси хг (мно¬ жества S задачи 7.2) и закон управления 7.2 определяет оптимальное управление по отношению к области S, то существует множество состоя¬ ний {(Xj, х2)) такое, что управление (7.51) является оптимальным по отношению к области Sa. Нетрудно убедиться (рис. 7.8 и 7.9), что таким множеством является множество G. Следовательно х, оптимальным управ¬ лением для любого элемента из G является и* = и* (хх, х2) = —sign {х2} Для всех (хп х2) Q G. (7.54) Интересно отметить топологическое подобие области G линии пере¬ ключения у. 1 См. также замечания § 6.23 и 6.24. 464
Определим, далее, два при помощи соотношений Q- = ((хі, множества Q_ и Q+, показанные на рис. 7.9 х2) : х. —-1-х2|хг| + + (7.55) 1, +1}. Когда же конечная точка (Sa), то могут быть оптимальными и {— 1). Следовательно, для эле- видеть [см. уравнение (7.18)], В общем случае возможны четыре управляющих последователь¬ ности 1 + 1}; ! — 1}; { + 1, —1} и {- принадлежит внутренней части Sai і лишь две последовательности {+1} ментов из Q+ и Q_ и двух конечных состояний (—а, 0) и (+а, 0) надо рассматривать четыре последователь¬ ности. Выберем произвольное состоя¬ ние X — (х15 х2) из Q_ и попробуем приложить каждую из четырех после¬ довательностей. С помощью рис. 7.2 и 7.9 нетрудно убедиться, что толь¬ ко управляющая последовательность {— 1, + 1} может перевести состояние (%і, х2) Q-в (а> Ô), или в (—0). Чтобы достичь состояния (а, 0), управление и надо переключить с и = — 1 на u = +ï в точке Z=^(z1, г2) на кривой Г+ (рис. 7.9), а чтобы достичь состояния (—а, 0), это нужно выполнить в точке Y (г/г, у2) (см. две траектории XZA и XZYB, пока¬ занные на рис. 7.9). Обе точки (—а,0) и (а, 0) принадлежат области 5а. Л что из любого состояния Q_ переход в точку (а, 0) занимает меньше вре¬ мени, чем в точку (—а, 0). Аналогично можно доказать, что если (х1Ух2) Q Q+, то только управ¬ ляющая последовательность ( + 1, —1} может перевести (xlt х2) в (—а, 0) или в (а, 0) и что состояния (—а, 0) можно достичь быстрее, чем со¬ стояния (а, 0). Подытожим это обсуждение следующим образом. Пусть Г+ и Г. — две кривые, показанные на рис. 7.9, заданы соотношениями Г + -- [(xi, х2):хі -=-4-^2 4 а, (7.56) I z ) Г_ х2) : Хі = — 4" + — а, *2 > О] ; (7.57) Г - Г+и5аиГ- (7.58) Предположим, что R_ — область состояний выше кривой Г, т. е. R. = G_ U Q-, (7.59) a R+ — область состояний ниже кривой Г: R+--G+(jQ+. (7.60) Решение задачи 7.3 выражается в виде следующего закона управления: 465
Закон управления 7.3. (решение задачи 7.3). Оптимальное управле¬ ние как функция состояния равно и* = и* (хь х2) = + 1 для всех (х19 х2) С U Г+; 1 и* = и* (хь х2) = — 1 для всех (хь х2)£/?_иГ_.| (7-61) Таким образом, оптимальное управление единственно, траекторий к множеству Sa Некоторые из оптимальных Рис. 7.10. Оптимальные по быстро¬ действию траектории к области Sa показаны на рис. 7.10. Упражнение 7.6. Спроектируйте нелиней¬ ную систему, реализующую закон управле¬ ния 7.3. Упражнение 7.7. Найдите минимальное время перехода в Sa. Покажите, что оно является решением уравнения Гамильтона— Якоби для этой задачи. Начертите минимальные изохроны и покажите, что кривые Г+ и Г_ сое¬ диняют точки минимальных изохрон, в которых последние не имеют производных (т. е. «углы» изохрон). Упражнение 7.8. Для объекта с двойным интегрированием рассмотрите область Sp: (%i, х2) Ç Sp, если ах = 0, |х2|^(3. Найдите оптимальный закон управления. Упражнение 7.9. Для объекта с двойным интегрированием рассмотрите область (%i, х2) Ç если I хг I ô I х21 ô. Найдите оптимальный закон управления. Полезно дать беглую физическую интерпретацию фазовых координат. Рассмотрим объект с передаточной функцией G (s) = — . Пусть у (/)— выход объекта и v (Z), |ѵ (Z)| < М — его вход. Предположим, что нам задан опорный сигнал г (0 = r0 + rjt + -і- r2/2. (7.62) Обозначим через е (/) сигнал ошибки: е (0 = г (0 - у (0, (7.63) тогда очевидны соотношения е(/) = г(О-ў(/);| ё(/) = г (/) — «/(/),] но ÿ(0 = ѵ(0; = ri + r2/; ■ г(/) = г2. (7.64а) (7.646) Таким образом, дифференциальное уравнение сигнала ошибки имеет вид е (0 = r2 — V (t). (7.65) Определим управление и (t) соотношением и (t) = г2 — V (Z) (7.66) 1 См. также замечания § 6.23 и 6.24. 466
и получим е (/) -= и (t). (7.67) Если коэффициент г2 ограничен: \г2\ < М' СМ. (7.68) то управление и (t) ограничено соотношением г2 — М С и (0 < г2 k М. (7.69) Следовательно, переменные состояния (фазовые координаты) ,ѵх (/) и х2 (О можно определить с помощью соотношений Xi x2(t) = 'e(t). (7.70) Точно так же, как мы это делали выше, будем стараться умень¬ шить е (/) и е (t) до нуля за минимальное время. Отметим, что таким спо¬ собом можно спроектировать следящую систему, выход которой будет отрабатывать ступенчатый, линейно-нарастающий или параболический сигнал в течение минимального времени. Отличие состоит в том, что при г2 линия переключения будет несимметрична. Упражнение 7.10. Положите в уравнении (7.68) г2 = 1 и М =3 Уравнение (7.69) запишется в виде —2 и (t) Д-4. Найдите оптимальное управление и* (е ,е), уменьша¬ ющее начальную ошибку е (0) и е (0) до 0 за минимальное время. Параграф завершается рядом упражнений. Так как уравнения объ¬ екта с двойным интегрированием исключительно просты, его можно использовать для того, чтобы продемонстрировать многие интересные аспекты оптимальных по быстродействию систем, избежав неоправдан¬ ных вычислений (хотя некоторые из упражнений, безусловно, нетриви¬ альны). Следующие шесть упражнений иллюстрируют различные аспекты управления, оптимального по быстродействию, для случая конечного состояния, являющегося точкой на фазовой плоскости. Упражнение 7.11. Это упражнение иллюстрирует связь между начальным со¬ стоянием и начальным значением дополнительных переменных. Рассмотрим сначала задачу 7.1. Пусть (лх,л2)— начальное значение дополнительного вектора, соответствую¬ щее начальному состоянию (gx, g2). Используя уравнения (7.8), (7.12). (7.24) и (7.26) и то, что гамильтониан равен нулю вдоль оптимальной траектории, докажите: 2 J/^bl 4- 2^2 г +1 у 4?1 + 2^ для всех (gx, g2) g /?_; и л2 = ——1 £2лх для всех (gx, g2) Ç у+. Найдите аналогичные уравнения для случая (£х, £2) Ç R+ и (^ХД2) € V— Представьте, себе, что эти уравнения определяют нелинейное преобразование N плоскости £х, £2 в пло¬ скость лх, л2 [т. е. л = N (I)]. Постройте изображения УѴ (/?_) и N (/?+) на плоскости лх, л2. Для изучения задачи «чувствительности» рассмотрите два множества (круга) на пло¬ скости gx, §2: = {(gi, Ь) : Œi - 2)2 + & + 2)2 ^0,04}; л2 = {(&i> h) ■■ (Si -2)2 + 5^0.04} и найдите их отображения N (Лх) и N (Л2) на плоскости лх, л2. Можно ли сделать какие- либо выводы относительно изменений (лх, л2), вызываемых малыми изменениями (£х, £2)? Глх“| Г£ХІ Покажите, что вектор нормален к минимальной изохроне в точке везде, 1Я2 1 1^2 J где такая нормаль определена. Указание: см. уравнения (7.35), (7.36) и (7.37). 30* 467
Упражнение 7.12. Это упражнение иллюстрирует изменение траекторий на поверх¬ ности минимального времени. Прежде всего повторите материал § 6.7 и снова рассмотрите задачу 7.1. Начертите на фазовой плоскости две траектории, начинающиеся из (2; 0) и (2,2; 0). На том же чертеже нарисуйте различные минимальные изохроны, используя уравне¬ ние (7.27). С помощью чертежа сделайте выводы относительно углов между вектором, каса¬ тельным к оптимальной по быстродействию траектории, и касательной к минимальной изохроне. Упражнение7.13. Это упражнение довольно громоздко, так как требует решения, полу¬ чаемого с помощью итераций. Рассмотрите эксперимент, описанный в шаге За §6.3, и еще раз рассмотрите задачу 7.1. Опишите итерационный процесс, который можно использовать для отыскания оптимального управления из произвольного начального состояния (^, Н2) Иначе говоря, предположим, что мы не знаем закона управления 7.1. Назначьте любое про¬ извольное значение (лх, л2), например л20) и время /*, например /*, затем найдите управление по формулам (7.9) для 0 /0*, проинтегрируйте систему уравнений (7.5) и вычислите «состояние» при t — . На основе «расстояния ошибки» от начала координат назначьте новые значения (лх, л2) и действуйте так до тех пор, пока «случайно» не будет найдено «почти оптимальное» управление. Проделайте это для начального состояния (2, 0) и определите число итераций, требующееся для отыскания управления, «достаточно» близ¬ кого к оптимальному. Как вы полагаете, полезны ли для этой задачи результаты упраж¬ нений 7.11 и 7.12? Упражнение 7.14. Рассмотрите систему (7.7). Докажите, что существует единственное оптимальное управление, переводящее любое начальное состояние (£х, g2) в любое конеч¬ ное состояние (0х, Ѳ2). Можно предполагать, что оптимальное по быстродействию управле¬ ние существует. Упражнение 7.15. Это упражнение показывает неединственность оптимального управ¬ ления в случае, когда конечным состоянием является не начало координат. Рассмотрите систему (7.7). Пусть (Ѳ15 Ѳ2), Ѳ2^ 0 — произвольное состояние в верхней полуплоскости. Предположим, что (?х и Q2 — следуюіцие множества на фазовой плоскости: 9і = I (хі> хъ): —2" х2 + —2~ в; —2~ + “2“ Ѳ? х2 ; 92 ~ ^(Х1’ Х'1) • 2~ 9~ ^2 Х1~2~ х2 4" 2~ 0 ^=х2 j • Покажите, что имеется два оптимальных управления, переводящих начальное состоя¬ ние (£х, £2) в (Ѳх, Ѳ2) в случае, если (gx, £2) Ç Qi U Qz* В противном случае существует одно и только одно оптимальное управление. Указание: воспроизведите доказатель¬ ство теоремы 7.9. Получите аналогичные результаты для конечных состояний (Ѳх, Ѳ2), Ѳ2 0. Проверьте полученные аналитические результаты, испытывая четыре управляющих последовательности (7.13) сначала для (Ѳх, Ѳ2) = (1, 1), а затем для (Ѳх, Ѳ2) = (1, —1). Выразите единственное оптимальное по быстродействию управление как функцию от состоя¬ ния. Составьте блок-схему оптимальной системы. Упражнение 7.16. Это упражнение показывает, что поверхность минимального вре¬ мени может быть только кусочно-непрерывной. Рассмотрите систему (7.7) и конечное состоя¬ ние (1, 1). Пусть (£х, £2) — произвольное заданное начальное состояние. Обозначим через /*(£х, g2) минимальное время, требующееся для перевода (£х, £2) в (1,1). Найдите уравнение, выражающее минимальное время (Іі> £2)- Далее, нарисуйте геометрические места состоя¬ ний (минимальные изохроны), требующие одинакового времени для перевода в (1, 1), для следующих значений Z*: /* =0,5; 1 ; 2,0; 3,0; 3,9; 4,0; 4,1; 5,0; 6,0. Является ли поверх¬ ность /* (£х, 52) непрерывной? Почему это так? Следующие пять упражнений относятся к случаю достижения некоторой конечной области. Упражнение 7.17. Это упражнение показывает, что если область цели состоит из двух изолированных точек, оптимальное управление необязательно единственно. Рассмотрите систему (7.7) и замкнутое, невыпуклое множество S, определенное соотношением S = {(%!, х2) : = 0,2; х2 — 0 или хх = — 0,2; х2 = 0. Иначе говоря множество S составлено из двух изолированных состояний (—0,2; 0) и (0,2; 0). Покажите, что оптимальное управление существует для любого начального состояния (£і> Іг)- 468
Покажите также, что а) оптимальное управление единственно, если ?>~г^+0’2& б) для всех остальных исходных состояний существует два экстремальных упра¬ вления. Найдите оптимальное управление (оптимальные управления). Нарисуйте минималь¬ ные изохроны и покажите, что они не являются границами выпуклых множеств. Почему отсутствуют условия трансверсальности? Упражнение 7.18. Рассмотрите систему (7.7) и область цели Si = {(х15 х2) : = х2, |*і 1}. Найдите оптимальное управление. Повторите для области S-2 “= {(*і, Х2) : = —х2, 1«! I sg 1}. Обсудите единственность оптимального и экстремальных управлений. Упражнение 7.19. Это упражнение показывает, что линия переключения необяза- іельно является частью оптимальной траектории. Рассмотрите систему уравнений (7.7). Предположим, что областью цели является единичная окружность с центром в начале координат: 3 = {(хр х2) : ХІ+ 4 = *!• Выразите оптимальное управление как функцию состояния для начальных состояний внутри и вне единичного круга. Указание: следует искать выражение линии пере¬ ключения в параметрической форме. Начертите несколько различных минимальных изо¬ хрон и покажите, что в отличие от рис. 7.7 минимальные изохроны не имеют «углов» на линии переключения. Следует ли из этого, что существует взаимно-однозначное соответствие между начальными значениями (лл, л2) и исходным состоянием (^, £2)? Упражнение 7.20. Это упражнение иллюстрирует задачи, возникающие в случае, когда область S не является границей выпуклого множества. Рассмотрите систему уравне¬ ний (7.7). Пусть Sjl и S2—два круга: si Ч(л xiY- S2 = Ібі. О :6i + 02+x2 s=ij- Предположим, что конечной областью является их объединение S = Sj J S2. Выра¬ зите оптимальное управление как функцию состояния. Обсудите единственность оптималь¬ ного и экстремального управлений. Следующее упражнение показывает, как можно учесть неидеальносгь одной из ком¬ понент при анализе системы. Упражнение 7.21. Рассмотрите систему управления, показанную на рис. 7.5. Счи¬ тайте, что идеальное реле R заменено на реле Rd с зоной нечувствительности, т. е. считайте, что вход [—z (/)! и выход [и* (/)] реле Rd связаны соотношениями если I—z(t) |^0,2; и* (/) = sign { — z (t)}, если I — z (t) I >0,2. Проанализируйте влияние неидеальности реле на работу системы. Указание: постройте область около линии переключения. Будет ли в системе ошибка? Возникнет ли предельный цикл? Можно ли изменить нелинейность N таким образом, чтобы устранить ошибку? 7.3. УПРАВЛЕНИЕ ОБЪЕКТАМИ С ДВУМЯ ПОСТОЯННЫМИ ВРЕМЕНИ В этом параграфе мы рассмотрим оптимальное по быстродействию управление объектом, передаточная функция которого имеет два дей¬ ствительных полюса и не имеет нулей. В основном рассмотрение ведется так же, как и в предыдущем параграфе. Однако такая система имеет характеристики, существенно отличные (из-за отсутствия способности интегрировать) от объекта с двойным интегрированием. Тем не менее читатель вскоре увидит, что структура оптимальных систем в основном остается такой же, как и для объекта с двойным интегрированием. Мы покажем далее, что это действительно является наиболее общей характе¬ ристикой всех нормальных систем второго порядка. 469
Рассмотрим систему, описываемую дифференциальным уравнением второго порядка: - (Ч + Х2)М- 4 ККУ (О = Ки (/), (7.71) где у (Z) — выход; К — коэффициент усиления; и (/) — управление, которое мы считаем ограниченным по величине соотношением I u (Z) I < 1, (7.72) а %х, Х2 действительны, различны и не равны нулю (А^ À2 0). В прак¬ тике сервосистем об объекте, описываемом уравнением (7.71), говорят, что он имеет передаточную функцию вида 44 = G (S) = , ГТ7 ГД (7-73) U (s) ѵ 7 (s — Al) (s — Л2) v 7 с действительными полюсами s = и s = X2. » Для того чтобы получить удобные фазовые координаты, используем два линейных преобразования. Пусть уг (0 = у (0; у2 (0 = у (О. (7-74) где уг и у2 удовлетворяют системе уравнений Уі (0 = У2 (0; I (7 75) У2 (0 = —^і^ъУі (0 + (^1 + У2 (t) + (t)- J Уравнение (7.75) можно записать в виде ' Уі (0 ' ’ 0 1 ‘ ■ 0 ■ - Уг (0 - Xj н Л.2_ ,УЛІ). 1 -у , (7.76) (7.77) или в векторном виде У (0 - Ау(і) 4- u(t). Очевидно, что собственными значениями матрицы А являются Ах и к2. Если через Л обозначить диагональную матрицу (7.78) то * 1 существует невырожденная матрица Р: Г1 1 Р= ІЛ V и обратная ей матрица (7-79) (7.80) (7-81) такая, что Л - Р'АР Используем теперь преобразование подобия 2 и определим г (0 в виде г(0 = />-13’(0 (7.82) 1 См. § 2.9. 1 См. § 4.9. 470
Компоненты вектора г, zr (/) и г2 (/), удовлетворяют дифференциаль- ным уравнениям \ 1 (7.83) г2 (/) = X2z2 (/) +^-_^ «(/). Удобно определить фазовые координаты хг (t) и х2 (Z), положив х1(0---Х? (ѴХ1) г^/): x2(t)--=^~^ г2(/). (' Тогда хг (t) и х2 (t) будут удовлетворять дифференциальным урав- нениям xi (0 = ^іхі (0 + (0; Х2(О = À2x2 (/) + Х2и (/). (7.85) В дальнейшем мы будем пользоваться исключительно фазовыми коор¬ динатами (/) и х2 (/). Отметим, что х± (t) и х2 (t) связаны с уг (/) [или У (01 и с Уъ (0 [или У (01 известными линейными преобразованиями. В частности, если хг (t) = х2 (t) = 0, то yr (t) = у2 (t) = 0, и наоборот. Точная формулировка задачи выглядит следующим образом. Задача 7.4. Дана система (7.85). Требуется найти допустимое управ¬ ление, переводящее систему (7.85) из произвольного начального состоя¬ ния (£i, ê2) в начало координат (0, 0) за минимальное время. Заметим, что система уравнений (7.85) нормальна. Отметим также, что оптимальное по быстродействию управление существует (теорема 6.10) и единственно (теорема 6.7). Будем поступать совершенно аналогично тому, как это мы делали в предыдущем параграфе. Запишем гамильто¬ ниан задачи. Обозначим через pr (t) и р2 (t) дополнительные переменные, тогда получим н = 1 + Х1х1 (0 Р! (/) + к2х2 (t) р2 (/) + и (0 (Хх рг (t) -h À2p2 (Z)}. (7.86) Управление u (t), при котором гамильтониан Н имеет абсолютный минимум, равно: и (0 = —sign (0 + К2р2 (t)}. (7.87) Дополнительные переменные рт (t) и р2 (t) удовлетворяют дифферен¬ циальным уравнениям (7.88) Пусть лх и л2 — начальные значения дополнительных переменных, т. е. Л1 = Р1 (0); п2 = Р2 (0)- (7.89) Тогда решением уравнения (7.88) будет p^f) = ярТ11*; I p2(t) = л2е~^. J (7.90) 471
Подставляя (7.90) в (7.87), получим u(t) = — sign + к>п2е~Кгі} = — sign {<?(/)}. (7.91) Функция q (0 = + X2n2e“À2/ имеет не более одного нуля. Следовательно, в качестве возможных оптимальных управлений можно рассматривать четыре управляющих последовательности 1 I -I- 1}; { — 1}; { -t- 1, —1}; { — 1; 4- 1} (7.92) так как управление должно быть кусочно-постоянным, решим уравне¬ ние (7.85), полагая и (t) = А - ±1, (7.93) и получим решение + Л) Д; J (і) - Й, + Л) /■' - А. I Исключая t из уравнений (7.94) и полагая а - у-’ (7.95) найдем 4 Л-2(О —Л + (|2 - Л) [ Г- <7-96) В дальнейшем будем считать, что 0 ►> > Х2. Уравнение (7.96) описывает траекторию на фазовой плоскости хлх2. Траектория начи- Рис. 7.12. +1 -вынужденные траек¬ тории. С возрастанием t все траекто¬ рии стремятся к состоянию (—1,—1) Рис. 7.11. —1-вынужденные траекто¬ рии. С возрастанием t все траектории стремятся к состоянию (1, 1) нается из состояния (£х, g2) и продолжается под воздействием постоянного управления и (t) = А. Если собственные значения Àj и Z2 отрицательны, то траектории, производимые управлением и (t) = —1, которые мы будем называть —1-траекториями, стремятся к состоянию (1, 1) на фазовой плоскости. Траектории, производимые управлением и (t) = +1, которые мы будем называть + 1-траекториями, стремятся к состоянию (—1, —1). — 1-траектории показаны на рис. 7.11, а + 1-траектории показаны на рис. 7.12. 1 См. также теорему 6.8. 472
Отметим мимоходом, что уравнение (7.96) не зависит1 от коэффи¬ циента усиления К. Таким образом, характер вынужденных траекторий À на фазовой плоскости зависит только от отношения . Перейдем теперь к решению оптимальной задачи. Читатель обнару¬ жит, что этот подход очень похож на использовавшийся ранее в § 7.2. Так как начало координат фазовой плоскости является желаемым конечным состоянием и мы должны достичь его, используя управление и - +1 или и —1, то выделим две вынужденные траектории, проходя¬ щие через начало координат. Обозначим эти Более точно сформулируем следующее опре¬ деление. Определение 7.7. Кривая у+ есть гео¬ метрическое место начальных состояний, которые могут быть переведены в (0, 0) управляющей последовательностью {+1) : кривая выражается уравнением Т+ = (е,. л-2) : — 1 -F (л-2 1) = 0; л\>0; х2>о]. (7.97) Кривая у_ есть геометрическое место состояний, которые могут быть переведены в (0, 0) управляющей последовательностью {— 1). Кривая имеет вид У- [(-ѵ„ ' (л2- у л-j < 0; л., < 0j. (7.98) траектории через у+ и у_. ния для объекта, представляю¬ щего собой два апериодических звена Кривые 7+ и у. показаны на рис. 7.13. Покажем теперь, что для любого состояния на кривой 7+ управляю¬ щая последовательность { + 1| оптимальна по быстродействию по отно¬ шению к началу координат. Выберем произвольное состояние на кривой и рассмотрим четыре управляющих последовательности (7.92). Исходя из вида вынужденных траекторий, показанных на рис. 7.11 и 7.12, можно сразу заключить, что только управляющая последовательность | + 1| может перевести это состояние в начало координат. Следовательно, постав¬ ленную цель выполняет лишь последовательность {+ 1}, которая и должна быть оптимальным управлением. Аналогично можно доказать, что для любого начального состояния, принадлежащего кривой у_, оптимальным управлением, переводящим систему в начало координат, является после¬ довательность {— 1}. Итак, мы получим закон управления в виде: если (х1( х2) Ç ѵ+, то и* = +1; 1 если (%!, х2) С то —1- J Определение 7.8. Объединение кривых и будем называть линией переключения 7. Линия переключения имеет вид У = (щ. х3):х2 [(1 -^1^1)“- 1П. (7.100) V I Л1 I ) Это соотношение получено из уравнений (7.97) и (7.98). 1 Это одна из причин того, что мы имеем дело с координатами хх и х2, которые, по сути дела, нормированы. 47 3
Обозначим через R+ множество состояний справа от кривой у, а через R_ — слева от нее. Очевидно, что R+ = {(*і. *2) : х2 < рі-р [(1 4-1 Xj I )“ — 1 J ; 7?_ = [(х1,х2):х2>|^т[(1 4 IxJ)0- 11]. I I*11 JJ (7.101) (7.102) Покажем теперь, что для любого состояния из R+ оптимальным управлением будет последовательность (+1, —1} при условии, что пере¬ ключение с и = +1 на и = —1 происходит на кривой у_. Рассмотрим опять четыре управляющих последовательности { + 1}; {— 1}; {+1; —1} и {— 1; +1}. Последовательности {+1} и {—1} дадут траектории, стре¬ Рис. 7.14. Реализация оптимальной по быстродействию системы управления объектом, представляющим собой два апериодических звена мящиеся к (1, 1) и (—1, —1) соответственно, минуя точку (0, 0). Управ¬ ляющая последовательность {— 1; +1} даст траектории, не попадающие в начало координат. Среди траекторий, производимых последователь¬ ностью {+1; —1), имеется только одна, проходящая через начало коор¬ динат. Эта траектория получится в том и только в том случае, если мы будем прикладывать управление и = +1 до тех пор, пока + 1-траектория не пересечет кривой у_, и в этой точке мы должны приложить управле¬ ние и = —1. Аналогично, для каждого состояния из R_ оптимальной управляющей последовательностью является {— 1; +1} при условии, что переключение с и = —1 на и = +1 происходит на кривой у+. Подыто¬ жим результаты в виде следующего закона оптимального управления. Закон управления 7.4 (решение задачи 7.4). Оптимальное управление в зависимости от состояния (хх, х2) выражается в виде и* = и* (Xj, х2) = +1 для всех (хь х2) С Ѵ+ U R+; 1 j и* и* (хх, х2) = —1 для всех (хі, *2) Е V- U J где у+, /?+, у_, R- определяются уравнениями (7.97), (7.101), (7.98) и (7.102) соответственно. Оптимальное управление единственно. Блок-схема реализации этого закона управления показана на рис. 7.14. Фазовые координаты хг (Z) и х2 (/) измеряются (или вычис¬ ляются). Сигнал хт (t) подается на нелинейность N, на выходе которой получается a(0 = ^j[(l ^ІХііГ-Ц. (7.104) Сигнал х2 (t) вычитается из a (t) для того, чтобы получить сиг¬ нал b (t) = а (t) — х2 (t). Если b (t) положителен, то (хх, х2) Ç R+i а если b (/) отрицателен, то (хх, х2) £ /?_. Таким образом, сигнал имеет 474
правильную полярность, и его можно использовать для управления идеальным реле /?, выходом которого является оптимальное управле¬ ние и* (t). Покажем теперь другое преимущество использования хх (t) и х2 (/) в качестве фазовых координат. Напомним, что вначале мы определили переменные состояния ух (t) и у2 (/) с помощью уравнения (7.74), т. е. Уі(/) = 1/(0; У2 (0 = У У) (7.105) Иначе говоря, в качестве фазовых координат можно использовать выход у (/) и его производную у (t). Из соотношений (7.80), (7.82) и (7.84) находим, что хх (t) и х2 (t) связаны с уг (t) и у2 (t) зависимостями хі(0== I (0 + ^іУі (01; Х2(0 = [—М21/1(0 + M2(0b (7.106) На рис. 7.15 в виде блок-схемы показано линейное преобразование, необходимое для того, чтобы получить (/) и х2 (t) из yr (t) и у2 (t). Рис. 7.15. Блок-схема линейного преобразования пере¬ менных и у2 в переменные хг и х2 4- ^2) J ] — (7.107) Подставим теперь уравнение (7.106) в (7.100), чтобы получить уравнение линии переключения у на плоскости уг у2. Уравнение линии переключе¬ ния будет иметь вид "д7" ( ^2^г) = + ^іУч) Для произвольных значений а из уравнения (7.107) невозможно полу¬ чить функциональную зависимость между у2 и у± в явном виде. Отсюда следует, что если мы измеряем состояние (у^ у2) и хотим узнать, нахо¬ дится ли оно на линии переключения, то мы не можем найти простую нелинейность, на которую можно было бы подать, например, сигнал уг и сравнивать сигнал на ее выходе с y2t чтобы решить, каким должно быть оптимальное управление. Попытаемся теперь найти минимальное время /*, требующееся для перевода начального состояния (хх, х2) в (0, 0) при использовании опти¬ мального закона управления (7.103). Рассмотрим начальное состояние 475
X = (хь х2), как показано на рис. 7.16, и оптимальную траекторию X WO к началу координат, где = w2) находится на линии переключения у. Пусть и — А* = ± 1 — управление, действующее на объект на траекто¬ рии WO; t2 — время движения от W до О; tx — время движения от X до W. Из уравнений (7.94) и (7.96) получаем: Рис. 7.16. Оптимальные тра¬ ектории для объекта из двух апериодических звеньев 1 Л* 1 Л* t2 = -т— log —TV --- -j— log —-rs- ; (7.108) i Â] ь u>! -|- A* /.2 w., ->■ A* ’ ' 0 + (7.109) A* —sign {w,} —- —sign {ш2); (7.110) 1 , w, — A* 1 . Ш., — A* ,7 1 1 n z> = Vlog-^v - : (7111) u>2 = A* + (x2-A*)(-^^-)a, (7.112) так как на траектории XW и = —А*. Общее время движения равно -г t2. (7.113) Очевидно, что Мы хотим выразить только в функции от хх и х2, и поэтому должны исключить из соот¬ ношения (7.114) wt. Используя уравнения (7.109) и (7.112), находим, что wlt хг и х2 связаны соотношением 0_-ЛЧ-[2Л> ^(х,-Л>)(^;)“](Х^Т.--)”. (7.115) К сожалению, для произвольных значений а из уравнения (7.115) невозможно выразить в виде явной функции х± и х2 и поэтому нельзя получить выражения для /* в замкнутой форме. Для конкретных значе¬ ний Хх, Х2, а следовательно а, величину t* можно найти из соотноше¬ ний (7.114) и (7.115) при помощи цифровой вычислительной машины. Упражнение 7.22. Пусть Хх = —1, Х2 = —2. Тогда a = 2 и уравнение (7.115) ока¬ зывается квадратным уравнением. Выразите через хх и х2 и получите аналитическое выражение для /*. Найдите уравнения минимальных изохрон (см. определение 7.6) и начер¬ тите минимальные изохроны для t* — 0,5; 1,0; 1,5 и 2,0. Покажите, что выражение, полу¬ ченное для £*, является решением уравнения Гамильтона—Якоби. Упражнение 7.23. Рассмотрите систему уравнений (7.85) с ограничением управле¬ ния \и (t) 1, если задана область: S = {(хх, х2) : = 0х, —сю < х2 < сю}. Покажите, что управление U = sign {хг} является оптимальным по отношению к S. Упражнение 7.24. Рассмотрите задачу 7.4. Найдите связь между начальными значе¬ ниями (лх, л2) и начальными условиями (£х, g2). Указание. См. упражнение 7.11. Упражнение 7.25. В задаче 7.4 примем Хх — —1,Х2= 1. Найдите область начальных состояний V, для которой оптимальное управление к началу координат существует. Ука¬ зание. См. § 6.8. Упражнение 7.26. Повторите упражнение 7.25 для Àx = 1, Х2 = 2. Упражнение 7.27. Рассмотрите систему уравнений (7.85) при \и (/) | 1. Пусть Лх — —1, Х2 = —2 и (Ѳх, Ѳ2) — заданное конечное состояние (необязательно начало координат). Найдите множество Q такое, что если (Ѳх, Ѳ2) Ç Q, то оптимальное управле¬ ние к (Ѳх, Ѳ2) существует для любого начального состояния (£х, §2). Повторите это для а) Хх = —1; Х2 = +1; б) Хх = 1; Х2 = 2. 476
7.4. УПРАВЛЕНИЕ ОБЪЕКТОМ, ОПИСЫВАЕМЫМ ПЕРЕДАТОЧНОЙ ФУНКЦИЕЙ ТРЕТЬЕГО ПОРЯДКА С ДВУМЯ ИНТЕГРИРУЮЩИМИ И ОДНИМ АПЕРИОДИЧЕСКИМ ЗВЕНЬЯМИ Исследуем теперь задачу управления объектом третьего порядка, который описывается передаточной функцией с двумя интегрирующими и одним апериодическим звеньями. Мы разовьем методы, использовав¬ шиеся в предыдущих параграфах, для того чтобы найти закон оптималь¬ ного управления и реализовать его в виде оптимального управляющего устройства, которое окажется довольно сложным. Рассмотрим систему третьего порядка, описываемую дифференциаль¬ ным уравнением (0 « d“y (/) Ku(f\ (I 1 1 ^-^-№(0, (7.116) где у (/) — выход; К — коэффициент усиления и и (/) — управление. Предположим, что управление и (t) ограничено по величине |и(0| < 1 (7.117) и постоянная а — действительное положительное число: а > 0. (7.118) В теории автоматического регулирования говорят, что система (7.116) имеет передаточную функцию ^4 = G(s) = ^-4-t-. (7.119) и (s) ѵ 7 s2 (s Д- a) v 7 Существует много физических систем, которые достаточно точно опи¬ сываются передаточной функцией вида G (s) = Например, такой передаточной функцией обладает двигатель с управлением по цепи воз¬ буждения при постоянном токе якоря. В этой системе выход есть угловое перемещение, управление — напряжение возбуждения, постоянная а появляется из-за наличия индуктивности, а ограничение | и (t) | < 1 является следствием насыщения усилителя входного напряжения. Дру¬ гим примером является задача управления глубиной погружения тор¬ педы, для которой передаточная функция G (s) является хорошей аппрокси¬ мацией динамики системы. В этой системе выходом является глубина, а управление — это угол отклонения руля глубины 1 (ограниченный меха¬ ническими упорами). Определим переменные уг (/), у2 (0 и y3(t), положив і/і(0 = і/(0; 1/2(0 = 1/(0; і/3(0 = і/(0- (7.120) Эти переменные удовлетворяют векторному дифференциальному урав- которое можно более компактно записать в виде Ay(t) т »(/). (7.122) 1 См. [181]. 477
Собственными значениями матрицы А размера 3x3 являются 0,0, —а. Так как два из этих собственных значений одинаковы, то при помощи пре¬ образования подобия эту матрицу можно записать в виде жордановой канонической формы Обозначив через J (Л) жорданову каноническую форму Л, запишем ГО 1 О'] У(Л)- ООО (7.123) 0 0 — а Так как существует невырожденная матрица Р: и обратная ей то имеет место соотношение J(A)^PlAP Определим вектор-столбец z (/), положив (7.124) (7.125) (7.126) (7.127) Очевидно, что z (/) удовлетворяет дифференциальному уравнению z (0 = J (Л) z (t) 4 Р~хи (0 или, эквивалентно, системе уравнений z1(0 = z2(Z)--^-«(0; і2(0 = -^и(0; z3(0 = —az3(/) -I- Ku(t). (7.128) (7.129) Для упрощения выражений в качестве фазовых координат Х} (t), х2 (0 и х3 (t) примем •*і (0 = zi (0; zi 2 х2 (0 = -%■ г2 (0; (7.130) x;i(0 = -^-z3(0. Эти переменные нений удовлетворяют системе дифференциальных урав- (/) = ах2 (t) — au (Z); x2(t)=au(t); (7.131) х3 (t) = — ах3 (/) + au (t). См. § 2.10. 478
В дальнейшем в данном параграфе мы будем пользоваться исключи¬ тельно этими переменными. Рис. 7.17 иллюстрирует линейное преобра¬ зование, с помощью которого осуществляется преобразование перемен¬ ных уі в xt. Отметим, что если хг = х2 = х3 — 0, то Уі = У 2 = Уз = 0. (7.132) Сформулируем задачу оптимального управления системой (7.131). Задача 7.5. Дана система (7.131). Найти управление (удовлетво¬ ряющее ограничению |и(/)|<1), которое переводит произвольное на¬ чальное состояние (ёх, £2, £з) в начало координат (0, 0, 0) за мини¬ мальное время. Рис. 7.17. Блок-схема линейных преобразований переменных у, у и у в переменные хг, х2 и х3 Заметим, что система (7.131) нормальна и оптимальное управление существует и единственно (почему?). Порядок, в котором мы будем решать эту задачу, будет тем же самым, что и в § 7.2 и 7.3. Гамильтониан Н для этой задачи (для системы 7.131) имеет вид Н = 1 + ах2 (0 (0 — ах3 (0 р3 (0 + + au (t) [-Р1 (0 + р2 (0 + р3 (/)]• (7.133) Так как а — положительная постоянная, управление, минимизи¬ рующее Н, равно и (t) = —sign {—Pi (0 + Pi (t) + Pi (0). (7.134) Дополнительные переменные pt (t), i = 1, 2, 3 удовлетворяют системе уравнений Р1 ~ dxt (t) (7.135) Используя известное обозначение Пі = Л(0); і = 1, 2, 3, (7.136) 479
решим уравнения (7.135) и получим Функция (0 Р2 (О — 2 — aJTj/, Рз (О = ЗТз^г- (7.137) — р1 (/) + р2 (/) + р3 (/) = —Л! + л2 — anrt + л3^ (7.138) может иметь не более двух нулей независимо от величины л15 л2 и л3. Отсюда сразу же делаем вывод, что оптимальными могут быть шесть управ¬ ляющих последовательностей ( + 1}; {-1}; { + 1, -1); {-1; +1}; {4-1, -1, +1}; {-1, +1, -1}. Далее решим уравнение (7.131), полагая и (/) = Д = ±1. Получается решение: х± (/) = 4- t2at ч- -і- Да2/2 — Да/; х2 = £2 -Ь Ла/; хло-а3-д)е-аг+д, где, как обычно, I = х, (0), і = 1, 2, 3. Исключая / из уравнений (7.141), получим Х1 = £1 — (х2 — £2) 4 2” А (х2 — b'j)» = (g3 — Д) Us-L-) Д (7.139) (7.140) (7 141) (7.142) (7 143) (7.144) Эти два уравнения определяют траекторию в трехмерном пространстве состояний (фазовом пространстве), исходящую из (£ь £2, £3) под воздей¬ ствием управления и = Д. Уравнение (7.143) выражает проекцию траек¬ тории на плоскость xtx2f а (7.144) — на плоскость х2х3. Отметим, что траектории не зависят от величины а1. На рис. 7.18 показаны кривые, соответствующие уравнению (7.143); сплошные кривые соответствуют Д = +1, штриховые Д = —1. На рис. 7.19 показаны кривые, соот¬ ветствующие уравнению (7.144); сплошные кривые для Д = 4-1, штрихо¬ вые — для Д = —1. Рассмотрим две траектории, проходящие через начало координат (0, 0, 0) трехмерного фазового пространства. Одна из этих траекторий получается при и = Д = +1 (назовем ее конечной + 1-траекторией), другая (конечная — 1-траектория) при и = Д = — 1. Теперь сформули¬ руем определение. Определение 7.9. Обозначим через {Уз'} множество состояний (%і, х2, х3), которые переводятся в (0, 0, 0) управляющей последователь¬ ностью {4-1}- Множество {і/^} есть конечная + 1-траектория, которая определяется как {ѵ+} = |(Х1, х2, х3) : = -^*2 —*2, *з == 1 — е~Хг, х2<о|. (7.145) Это обстоятельство является причиной выбора xt в качестве фазовых координат. 480
Определение 7.10. Обозначим через {УГ} множество состояний (хь х2, х3), которые переводятся в (0, 0, 0) управляющей последователь¬ ностью ( — 1}. Множество {У?} есть конечная —1-траектория, которая опреде¬ ляется как ! У 2 і == ^(хі, *2, *з) : хх = — x2 — x2, X3 — —1 4- <?*2, x2 0 j. (7.146) Определение 7.11. Обозначим через {У2} сумму {У 2 } и {У Г}. Для Д* = _sign {х2} (7.147) найдем, что {Кг) = [(хі, х2, х3) : Хі = -Ь Д*х2 — х2, х3 = Д* — к*е = = И|иЮ- (7.148) Из предыдущих определений следует, что {У2} есть кривая в фазовом пространстве такая, что любое состояние из {У2} может быть переведено в начало координат при помощи управления и = Л* = —sign {х2}. (7.149) Проекции {У2} на плоскости хх х2 и х2 х3 показаны на рис. 7.20 и 7.21 соответственно. Рис. 7.18. Проекции вынужденных трае¬ кторий на плоскость х2; сплошные траектории соответствуют и = +1, пунк¬ тирные и= —1. Стрелками показано направление движения состояния при положительном времени Рис. 7.19. Проекции вынужденных трае¬ кторий на плоскость х2, х3. Сплошные кри¬ вые соответствуют и==+1, пунктирные и — —1. Стрелками показано направле¬ ние движения состояния при положи¬ тельном времени Рассмотрим множество состояний, которые можно перевести в начало координат управляющей последовательностью {— 1, +1). Очевидно, что переключение управления с и = —1 на и = +1 должно произойти на множестве {У[так как {У£} — множество всех состояний, которые могут быть переведены в начало координат (0, 0, 0) управлением и = — +Ц. Если состояние (хх, х2, х3) можно перевести в начало координат 16 Атанс и др. 481
управляющей последовательностью {— 1, +1}, то существует состояние (х12, *22, х32) Е {V2J такое, когда состояние (хь Хо, х3) лежит на траек¬ тории, получающейся под воздействием управления и = —1 и заканчи¬ вающейся в точке (х12, х22, х32) Q {WJ. следующего определения. Определение 7.12. Обозначим через (VJ множество состояний (хр Обобщим эти рассуждения в виде Рис. 7.21. Проекция множества (кривой) {Ѵ3} на плоскость х2, х3 Рис. 7.20. Проекция множества (кривой) {У2} на плоскость хх, х2 х2, х3), которые могут быть переведены в начало координат управляющей последовательностью {—Д*, Д*}. Состояние (хх, х2, х3) {У3} в том и только в том случае, если х12 = хх — (х22 — Х2) g-A* (*22 —*2); (7.150) х32 = (х3-г-А*)ед‘(^=-^>—А*, (7.151) где (Хі2, х22, -^32)6 {^2}» (7.152) т. е. [см. уравнение (7.149)] *12= 4“А*Х22 —*22; (7-153) х32 =■- А* — A*e-û^22 (7.154) И Д* = —sign {х22}. (7.155) Отметим, что состояния, принадлежащие к множеству {VJ, опреде¬ лены в параметрической форме через состояния (х12, х22, х32) из {К2}. Можно исключить х12, х22, х32 из уравнений (7.150)—(7.154) и получить соотношение, связывающее хь х2 и х3. Из уравнений (7.150) и (7.153) находим х22 = ± 1 ‘ X2 1 2 -1-+ Ь* (Х1 + х2) . (7.156) Чтобы исключить произвол в выборе знака, используем уравнение (7.155) и запишем выражение (7.156) в виде х22 = —А* 1 ’ X2 1 2 -у- + Д* (Хі + х2) • (7.157) 482
Из соотношений (7.151) и (7.154) заключаем, что х3 - —Д* 4- Д*е~Л* (^22-^) (2 — e~à*x^Y Подставив выражение (7.157) в формулу (7.158), получаем шение (7.158) соотно- х3 = —Д* + Д* ехр |Д*х2 4 X2 1 2 ——(- Д* (xj 4 х2) (7.159) Это соотношение устанавливает связь между переменными хх, х2, х3, где (хх, х2, х3) Ç Iи Д* = ± 1. Остается определить Д* как функцию от хь х2 и х3. На рис. 7.22 пока¬ зана проекция IѴ2} на плоскость %іХ2 Уравнение проекции имеет вид Хі = sign{х2} xl — x2. (7.160 Из рис. 7.22 видно, что траек¬ тории, принадлежащие к {и заканчивающиеся в точках Jyÿ’}, получаются при Д*=+1. Траек¬ тории, принадлежащие к и заканчивающиеся в точках из 7 Проекция (і//) Траектории, лри- адлежащие к [Vf]и соответствующие Л = -/ Проекция 2^ -2 Траектории, при¬ надлежащие к (Vf) и соответствующие Л * — Уравнение проекции {на плоскость xf хг х< —fésign^ к? -*2 Рис. 7.22. Проекции траекторий, принадле¬ жащих к { Ѵх} на плоскость хх, х2 получаются при Д* = —1. Это означает, что если состояние (хп х2, х3) принадлежит к {Ѵх} и две координаты хг и х2 удовлет¬ воряют соотношению %1> l— Sign (х2} х2 — х2, (7.161) то Д* — 4-1. Если же координаты хх и х2 удовлетворяют соотношению Х\< ?>-sign {х2]х22 — х2, (7.162) то Д* = —1. Следовательно, Д* = sign + -і- sign {x2} 4 + (7.163) Итак, мы нашли выражение для Д* через хТ и х2. Если подставить уравнение (7.163) в соотношение (7.159), то получится уравнение, выра¬ жающее х3 в виде явной функции от х± и х2. В уравнении (7.159) появляются члены вида ]/ ^ + Д*(Х1 + х2). (7.164) Так как переменные х19 х2 и х3 должны быть действительными вели¬ чинами, используя соотношение (7.163), получаем условие Х'о ( 1 1 + sign ІХ1 4—2“ sign (^2} *2 + *2? (*і “b хг) 0. (7.165) 483
Упражнение 7.28. Покажите, что уравнение (7.165) удовлетворяется для всех хг Х22 х2 и х2. Указание: исследуйте знаки функций -у + (%і + х2) и — (хг + х2) на плоскости хг х2. В заключение сформулируем полученные выше результаты. Если переменные xlf х2 и х3 удовлетворяют уравнениям (7.159) и (7.163), Tojq, х2, х3) Q {VJ. Множество {V J есть поверхность1 в трехмерном фазовом пространстве. Легко показать, что эта поверхность обладает следующими свойствами: 1. О с= {V2} с= {VJ. 2. (VJ гладкая, непрерывная, действительная. 3. {VJ однозначна; каждой паре (хь х2) соответствует только одно х3, при котором (хь х2, х3) J {VJ. 4. {VJ симметрична относительно начала координат фазового про¬ странства. 5. Поверхность {VJ разделяет фазовое пространство на две части. Последним свойством мы воспользуемся при выработке стратегии управления для систем, оптимальных по быстродействию. Условимся обозначать черех хг = {хи, х21, х31) состояние, принад¬ лежащее {VJ. Очевидно, что если (xn, х21, х31) £ {VJ, то х31 = —Д* -Ь Д* ехр |Д*х21 X2 1 2 -у- + А* (хп + х21) (7.166) где А = sign 4 2~ sign (х2і} Хц 4~-^21 j • (7.167) Выберем произвольное состояние (хъ x2f х3) и проведем через него прямую, параллельную х3. Эта прямая пересечет поверхность {Ѵх} в точке (хп, х21, х31), причем хп = хх и х21 = = х2. Координата х31 определяется уравнениями (7.166) и (7.167). Этот случай показан на рис. 7.23. Если х3— *зі > (7.168) Рис. 7.23. Проекция состояния (хр х2, х3) на поверхность {VJ то будем говорить, что точка (хх, х2, х3) расположена выше поверхности I V J, а при *з~ *31 < 0 (7.169) будем говорить, что точка (хь х2, х3) расположена ниже поверхности {VJ. Если х3 — *зі = 0, (7.170) то (х1? х2, х3) принадлежит {VJ. Рассмотрим состояния, которые не принадлежат поверхности {VJ. Предположим, что нам задано состоя¬ ние X = (%і, х2, х3) выше поверхности {VJ. В состоянии х мы можем выбрать одно из двух управлений и = +1 или и =■- —1. Легко убедиться, 1 Эту поверхность часто называют поверхностью переключения. 484
что траектория, получающаяся при приложении и = 4-1» никогда не пересечет поверхности {Ѵі}» тогда как траектория, получающаяся при и =—1, пересекает {VJ. Аналогично, если х лежит ниже {VJ, то траектория при и = +1 пересекает {Ѵх}, а при и = —1 — нет. Из этого можно сделать вывод: управляющая последовательность {— 1, +1, —1} переводит в начало координат состояния, расположен¬ ные выше {VJ, а последовательность {4-1, —1, +1) —состояния, рас¬ положенные ниже поверхности {VJ. Заметим, что обе последовательности {4-1, —1, +1) и I — 1, 4~1, —1} могут оказаться оптимальными управ¬ лениями [см. последовательности (7.139)1. Найдем теперь оптимальную по быстродействию управляющую после¬ довательность для каждого из состояний фазового пространства. Методы, которые мы будем использовать, аналогичны методам двух предыдущих параграфов. Рассмотрим шесть последовательностей (7.139) и покажем, что существует только одна управляющая последовательность, переводя¬ щая данное начальное состояние в начало координат. Таким образом, мы докажем оптимальность управления методом исключения. Рассмотрим состояние X на кривой {VÿJ (определение 7.9). По этому определению управляющая последовательность {4-1} переводит X в начало координат. Посмотрим, что произойдет, если мы будем использовать последовательности {—1}, {— 1, 4-1} или {— 1, 4-1, —1}. Прикладывая вначале и = —1, мы получим вынужденную —1-траекторию. Если Y — произвольная точка на этой траектории, то легко показать, что точка Y лежит ниже поверхности {VJ. Но мы показали, что если точка Y лежит ниже {V]}, то Для перевода этого состояния (т. е. Y) в начало координат надо прикладывать управляющую последовательность {4-1, —1, 4-1}. Следовательно, если мы начали с того, что приложили управление и = = —1, то управляющей последовательностью, которая переведет X в начало координат, будет {— 1, 4-1, —1, 4-1}. Очевидно, эта последо¬ вательность не оптимальна, и поэтому управляющие последовательности {— 1}, {— 1, 4-1) и {—1, +1, —1} не могут быть оптимальными по быстро¬ действию. Рассмотрим теперь две оставшиеся последовательности {4~1, — 1} и {+1, —1, 4-1}. Управление и = 4-1 переводит X в X', причем X 4 {W~). В точке X управление переключается на и = —1, и полу¬ чается вынужденная —1-траектория. Если Y' — произвольная точка на этой траектории, то Y' лежит ниже поверхности {VJ. Используя те же аргументы, можно показать, что управляющие последовательности {4-1, — 1} и {4-1, —I, 4-1} не могут перевести X в начало координат. Таким образом, рассуждая методом исключения, приходим к выводу х: Если состояние принадлежит к {У^}, то и = 4-1 является опти¬ мальным по быстродействию управлением. Аналогично можно показать, что если состояние принадлежит к [УГ[» то оптимальным является управление и = —1. Подытожим эти выводы, сформулировав закон управления. Закон управления 7.5а. Если (х15 %2, х3) Ç {У2}, где {У2} соответ¬ ствует определению 7.11, то и* = А* есть оптимальное управление. Отметим, что на линии {У2), А* определяется уравнением (7.147). Рассмотрим далее состояние X на поверхности {Ух}. Для опреде¬ ленности предположим, что для данного конкретного состояния А* = 4-1 [уравнение (7.163)1. Тогда оптимальной управляющей последователь¬ ностью будет {— 1, 4-1}. В самом деле, управляющая последовательность 1 Этого доказательства можно избежать, воспользовавшись единственностью экстре¬ мальных управлений (см. теорему 6.9). Мы выбрали геометрическое доказательство для того, чтобы читатель смог лучше разобраться во всех связанных с этим вопросом понятиях. 485
{—1, +1] переводит X в (0, 0, 0) по определению. Управляющие после- довательности { + 1} и {— 1} дают траектории, не проходящие через начало координат. Последовательность (+1, —1} не может перевести X в начало координат, так как это противоречит предположению о том, что Д* = +1. Управляющая последовательность { + 1, —1, +1) при и = +1 перево¬ дит X в состояние Y выше поверхности ( Ѵх}. Наконец, управляющая последовательность | — 1, +1, —1} противоречит предположению Д* = = +1. Пользуясь, как и ранее, методом исключения, мы доказали, что оптимальной должна быть последовательность {— 1, чение с и =— 1 на и= + \ происходит на кри¬ вой |Ѵ2}« Обобщим все это в виде следующих законов управления. Закон управления 7.56. Если (хх, х2, х3) £ (см. определение 7.12), то и* = —Д* яв¬ ляется оптимальным по быстродействию упра¬ влением. Д* + 1} если переклю- определяется уравнением - Ъ U=+f Л U—-1 1 Хг *2 2 2 h -2- -2 Yf -1 Рис. 7.24. Проекции оптимальных по быстродействию траекторий на пло¬ скость xlt х2 Xq 4 и=-1 3 (7.163). и—1 1 -2 и~+1 2 Хо и — ~1 Хі и=-1 1 2 Рис. 7.25. Проекции оптималь¬ ных по быстродействию траекто¬ рий на плоскость х2, х3 *5 Закон управления 7.5в. Если состояние (хх, х2, *з) расположено над поверхностью {Ух}, то и* = —1 является оптимальным управлением. Если состояние (хх, х2, х3) расположено под поверхностью {Ѵх}, то опти¬ мально управление и* — +1. Таким образом, порядок действий должен быть следующим. Предполо¬ жим, что состояние расположено выше поверхности {Ух}; в этом случае управление и = —1 дает траекторию, которая пересечет {Ѵх}, скажем, в точке (хХ1, х21, х31). В этот момент управление переключается с и = —1 на и — +1. Далее траектория будет расположена на поверхности {Ѵ\} и пересечет {Ѵ2] в точке (х12, х22, х32). Если в этот момент управление пере¬ ключится с и = +1 на и = —1, то траектория пойдет вдоль {Ѵх}, пока не попадет в начало координат. Можно проверить, что в точке (хп, х21, х31) величина Д* равна — 1 и в (х12, х22, х32) снова Д* = —1. На рис. 7.24 и 7.25 показаны проекции некоторых оптимальных траекторий. Так как законы управления 7.5а—7.5в дают оптимальное по быстро¬ действию управление для любого состояния (хх, х2, х3), можно спроекти¬ ровать систему, которая будет автоматически обеспечивать оптимальное управление объектом. Схема должна определить, находится ли точка (хх, х2, х3) выше или ниже поверхности )УХ}. Для этого вычисляется про¬ екция (хх, х2, х3) на поверхность {Ух} (см. рис. 7.23). Таким образом, вычисляется состояние (хх, х2, х31) £ {Ѵх}, и разность /п(0 = х3 —х31 (7.171) 486
управляет идеальным реле, выход которого является оптимальным управ¬ лением и (t). Полная блок-схема оптимальной по быстродействию системы показана на рис. 7.26. Фазовые координаты хъ х2 и х3 измеряются, напри¬ мер, при помощи устройства, показанного на рис. 7.17. Координаты Xj и х2 используются для определения А*, которое, согласно соотноше¬ нию (7.163), выражается как А* = sign {а} = sign^ + х2 -f- -|-х21 х2 |j. (7.172)1 Чтобы получить А*, сигнал х2 пропускается через нелинейность выход которой равен ~^~х2 |х2|. Реле R1 выполняет операцию sign над сигналом а. Сигнал b в соответствии с уравнением &=-j-x2-|-A (хі + х2) (7.173) получается в результате пропускания х2 через квадратичную нелиней¬ ность ?Ѵ2, выход которой равен -^-*2, и суммирования результата с сигна- Рис. 7.26. Оптимальная по быстродействию система управления объектом с передаточной функцией G (s) = -~2-— jp лом A* (Xi + x2). Сигнал b затем подается на нелинейность Л/з, после которой получается сигнал, пропорциональный ]/&. Два нелинейных элемента имеют экспоненциальную зависимость выхода от входа. Таким образом, подвергая сигналы хг и х2 многократным линейным и нелинейным алгебраическим преобразованиям, можно получить сигнал х31. Сравне¬ ние х31 с измеренным сигналом х3 дает сигнал —т (t) [см. уравне¬ ние (7.171)]. Реле R выполняет над сигналом —т (t) операцию sign, и на его выходе получается сигнал, являющийся оптимальным управле¬ нием и* (/), который и используется для управления системой G (s). Система, показанная на рис. 7.26, довольно сложна. Полезно сравнить ее со схемами, показанными на рис. 7.5 и 7.14, чтобы оценить сложность оптимальной системы третьего порядка по сравнению с системами второго порядка. Для этой системы оказалось возможным получить уравнение 1 Так как-і- sign {х2} х2 = | х2 |. 487
поверхности {V!} в явном виде и спроектировать аналоговый нелинейный регулятор. Как мы увидим далее, явное выражение для [1/J можно полу¬ чить далеко не всегда. В литературе по управлению поверхность часто называют по¬ верхностью переключения, так как реле переключается тогда, когда состояние системы достигает поверхности {V,}. Если построить или промоделировать систему, показанную на рис. 7.26, то неизбежные шумы и неидеальность оборудования приведут к тому, что реле будет пере¬ ключаться чуть-чуть выше или ниже поверхности переключения, и поэтому действительный переходный процесс системы будет только близок к теоре¬ тическому. Следовательно, в реальной системе может существовать пре¬ дельный цикл вокруг начала координат, параметры которого будут зависеть от величины отклонений характеристик реального оборудования от идеализированных теоретических. Наконец, эта техническая реализация просто моделирует поверхность переключения {Ѵ\}, и если все компоненты идеальны, то как только со¬ стояние системы окажется на поверхности {Ѵ\}, сигнал т (t) будет равен нулю. Таким образом, если все компоненты идеальны, то необходимо добавить блок, который вырабатывает оптимальное управление при jVi), и еще один, дающий оптимальное управление, когда х^(У2}- Однако из-за неидеальности оборудования состояние не может все время оставаться ни в {Ѵ\}, ни в {Ѵ2}. Таким образом, любая реализация будет лишь близка к оптимальной, и действительные траектории будут только близки к поверхности переключения. В следующем параграфе мы распространим идеи данного параграфа на системы с произвольным числом действительных полюсов. Упражнение 7.29. Рассмотрите объект с передаточной функцией (7j74> который можно представить в фазовом пространстве в виде іі (/) =х2 (0; (t) = Х3 (/); і3(0 =«(0- Управление удовлетворяет ограничению |и(0|^ 1. (7.175) (7.176) Следуя методике настоящего параграфа, найдите оптимальное по быстродействию управление, переводящее систему в начало координат. Упражнение 7.30. Рассмотрите неустойчивую систему 1 с передаточной функцией (7Л77> которую можно представить в фазовом пространстве в виде [см. уравнения (7.131)] *1(0 = — *2(0 т“(0; *2 (О = — « (0; *з (0 = *3 (0 — и (0. (7.178) где управление и (/) ограничено по величине: |u(0|^ 1. (7.179) Найдите множество начальных состояний, для которых существует оптимальное управление, переводящее систему в начало координат (0, 0, 0). Найдите оптимальный по быстродействию закон управления. 1 См. § 3.26. 488
7.5. УПРАВЛЕНИЕ ОБЪЕКТОМ, ИМЕЮЩИМ ПЕРЕДАТОЧНУЮ ФУНКЦИЮ С ДЕЙСТВИТЕЛЬНЫМИ ПОЛЮСАМИ 1 Мы продемонстрировали различные способы синтеза оптимального по быстродействию управления для систем второго и третьего порядка. Теперь рассмотрим оптимальное управление объектом с N действитель¬ ными полюсами. Исследуем систему УѴ-го порядка, которая описывается линейным дифференциальным уравнением тР- + dN~v-{!} + •••+ аі + ад(/) = (7-180) dt at at где у (О — выход системы; К — коэффициент усиления и и (t) — управ¬ ление. Предположим, что управление ограничено по величине: (7.181) В теории автоматического регулирования говорят, что система (7.180) имеет передаточную функцию ^77 = G (s) = — —— . (7.182) и (s) s + aN-\ s1 -j- • • • 4- aAs 4- a0 Будем считать, что G (s) имеет N различных действительных отри¬ цательных полюсов и может быть записана в виде ,1 + 5.' <7Л83> где si — действительные числа и 0< s1 < s2 < • • •< 8дг. (7.184) Мы рассматривали сведение системы М-го порядка вида (7.180) к системе N уравнений первого порядка в § 3.24. Предположим, что это преобразование выполнено, а также выполнено преобразование по¬ добия, и система с передаточной функцией (7.183) приведена к виду 21(0 = — «1^1(0 + r1U(t\, z2 (/) = — s2z2 (/) + r2u (Z); 185) zN (0 = — snzn (0 4 rNu (/). Переменные zx (/), г2 (^), . . zN (/) являются линейными комбина¬ циями у (/), у (f), . . ., у^-ѵ (t), а постоянные г19 . . ., rN зависят от и Л. Введем новые переменные х19 х2, . . ., xNi приняв x.(/) = 2(.(/)JL; i =1.2, . . N. (7.186) Новые переменные удовлетворяют дифференциальным уравнениям вида + siu (О’, * = 1, 2, . . ., УѴ. (7.187) В дальнейшем в данном параграфе мы будем пользоваться исключи¬ тельно этими переменными. Рассмотрим задачу. Задача 7.6. Дана система уравнений (7.187), требуется найти допу¬ стимое управление, переводящее любое начальное состояние (£ь |2, . . ., ^) в начало координат (0, 0, . . ., 0) за минимальное время. 1 Материал данного параграфа основан на работах [1], [2], [197] и [144]. 489
Основная идея решения этой задачи состоит в том, чтобы распростра¬ нить способы, рассмотренные в предыдущем параграфе, с трехмерного на Af-мерное пространство. Обозначим через А* величину оптимального управления на последнем участке траектории и определим ряд множеств • • -, {Ѵ\}, которые представляют собой геометрические места точек фазового пространства, обладающие тем свойством, что управ¬ ление должно переключаться с +1 на —1 (или с —1 на +1), если траекто¬ рия пересекает любое из этих множеств {Ѵуѵ_і}, {Кѵ_2}, . . {ѴД. Множество {Ѵі} окажется гиперповерхностью, и мы найдем параметриче¬ скую систему уравнений, которые ее определяют. Основной целью данного параграфа является изложение порядка действий, которые должна выпол¬ нять оптимальная по быстродействию управляющая система с обратной связью. Гамильтониан Н для оптимального по быстродействию управления системой [уравнение (7.187)] имеет вид N N н = 1 - S ЗД (0 Рі (О + « (О S siPi (/). (7.188) Управление, минимизирующее абсолютно гамильтониан Н, опреде¬ ляется выражением: ( N А «(О = — sign S . (7.189) Дополнительные переменные pi (t) являются решениями уравнений Pdt) =—= (7.190) для і = 1, 2, . . ., N. Следовательно, р,(0 = t-1,2,. . N, (7.191) где р.(0) - л4.; і - 1, 2, . . ., N. (7.192) Таким образом, выражение (7.189) сводится к виду (N 1 u(t) = — sign ! S stn,eSz4 . (7.193) u=i J N Легко показать, что функция S sp-e5^ обладает свойствами: г=1 1) имеет не более N — 1 нулей при любых значениях лх, л2, . . ., 2) не может быть тождественно равна нулю на конечном интервале времени х. Отсюда следует, что оптимальное управление есть кусочно-постоянная функция времени, которая «переключается» не более N — 1 раз. Пусть и — А - ± 1; (7.194) подставим и = А в уравнение (7.187), и тогда получим х.(/) = (g. — A)e-s<'4-Д; ( = 1,2 N, (7.195) где I = хД0); < = 1,2, ...,7Ѵ. (7.196) 1 Это исключает возможность вырожденных управлений [так как система (7.187) нормальна ]. 490
Из этих уравнений можно исключить t и получить уравнение траекто¬ рии в /Ѵ-мерном пространстве, исходящей из (|ь g2, • • -, и производи¬ мой управлением и = Д. Например, из системы (7.195) при і — 1 получаем Z = T-,°g-F=4- (7.197) Si Хг — ZA Подставляя выражение для t в уравнения (7.195) при і = 2, 3, . . ., N получим Л x, = A + (^-A)(-|^-)S' ; £ = 2,3, (7.198) Последние N — 1 уравнений описывают траекторию в Af-мерном про¬ странстве. Из уравнения (7.195) получим 1ішхД/) = Д; Z = 1, 2, . . .,7Ѵ. (7.199) /->оо Это означает, что траектория, полученная от управления и = +1, стремится к точке (или состоянию в фазовом пространстве) (1, 1, . . ., 1), а траектория от управления и = —1 — к точке (—1, —1, . . ., —1) про¬ странства состояний. Получим теперь последовательность множеств {^-2 h • • -, (Ѵ2), 1 Ѵі}, аналогичных кривым и поверхностям переключения, рас¬ смотренным в § 7.4, обобщив методы предыдущего параграфа. Сначала мы дадим формальные определения, а затем их проанализируем. Определение 7.13. Пусть {Ул_і} — множество состояний, которые могут быть переведены в начало координат 0 пространства состояний с помощью управления и = Д* - ± 1 (7.200) (иначе говоря, с помощью управляющей последовательности { + 1} или же {—1}). Состояние, принадлежащее множеству {ѴЛі}, будем обозначать через АГ/ѵ-л, а его компоненты — через хіч N_lf где і = 1, 2, . . ., N. Через обозначим время, требующееся для перевода х^ в 0, при использо¬ вании управления и = Д*. Из уравнения (7.195) находим, что xbN^ определяются соотношениями xlt = А* — А (7.201) для і = 1, 2, . . N. Определение 7.14. Пусть {Кѵ_2} — множество состояний, которые можно перевести в множество {Ѵ^} с помощью управления и = —Д*. Состояние, принадлежащее к {Уд/.зр будем обозначать через xN_2, а его координаты — через xitN_2, гДе / = 1, 2, . . ., AZ. Обозначим через ^_2 время, требующееся для перевода xN_2 в xN^ £ {Ѵ^}. Коорди¬ наты X/, дг-2 определяются соотношениями Xi. N-2 = — А* + (хг, N_! 4 А*) (7.202) для 4 = 1,2,.. ., N, где х^^ удовлетворяют уравнениям (7.201). Определение 7.15. Пусть {Кѵ_3} —множество состояний, которые можно перевести в множество {Ѵдг_2} с помощью управления и = Д*. Состояние, принадлежащее к |Ѵдг_3}, будем обозначать через xN_3, а его координаты — через xitN_3, где і = 1, 2, . . ., N. Обозначим через время, требующееся для перевода xN_3 в xN_2Q\VN_2}. Координаты xitN_3 определяются соотношениями: xz. N_3 = А* 4- (X, N_2 4 A*) es^-3 (7.203) для Z=l,2,.. ., TV, где xit7V_2 удовлетворяют уравнению (7.202). 491
Аналогично можно определить необходимое количество такого рода множеств. В общем случае имеем следующее определение. Определение 7.16. Пусть —множество состояний, которые можно перевести в множество (Ѵдг_я+і} с помощью управления и = = А* (—Состояние, принадлежащее к будем обозначать через xN_R, а его координаты — через xitN_R, где і = 1, 2, . . ., N. Обозначим через tN_R положительное время, требующееся для перевода xy_R в xN_R+1 Q {Ѵдг-я+ib Координаты xhN_R определяются соотноше¬ нием n-r = (- 1)*+1Д* + ta ,ѵ-Л+1 - (- 1)Л+,Д*] (7.204) для і = 1, 2, . . ., N. В частности, для R = N — 1 имеем: Определение 7.17. Пусть {Ѵх} — множество состояний, которые можно перевести в {Ѵ2| с помощью управления и = (—1)N А*. Состояние, при¬ надлежащее множеству {Ѵ\}, будем обозначать через xlf а его компо¬ ненты— через xitl, где і = 1, 2, . . ., N. Обозначим через tY время, требующееся для перевода хг в х2С{72}. Координаты х£(1 определяются соотношениями X,., ! (- 1)ѴД* ■ ta. 2- (- 1)'ѴД*] (7.205) для г = 1, 2, . . ., N. Таким образом, мы определили в общей сложности N — 1 множеств {VjI, |Ѵ2}, • • -, iKv_2}, іКѵ-іі- Из определений ясно, что множество [І/J зависит от {Ѵ2), а | , в свою очередь, зависит от {Ѵ3} и т. д. Из определений следует, что траектория, начинающаяся в произвольной точке xN_R G ( VN_R] и произведенная управлением и = (—1)/?+1 А*, будет оставаться в множестве {Ѵдм?} Д° тех пор, пока она не попадет в точку {Ѵд)_я+1}. Иначе говоря, множества {VJ, / = 1, 2, . . ., N — 1 состоят из семейств траекторий. Исключим теперь из уравнений (7.201)—(7.205) переменные xiiN_19 xi,N-2 , • • -, хі, 2 и получим соотношение, связывающее переменные хІЛ и времена /2, . . ., tN_x. Для упрощения уравнений введем новые переменные z2, . . ., zN_l9 положив 2і = еЧ /-1,2,..., N — 1. (7.206) В записи через эти новые переменные уравнения (7.201)—(7.205) после несложных преобразований примут вид A*xz> у-і — 1 — A Xt, дг_2 = 1 + (A Xi, /Ѵ-4 4~ 1) 2’ A'?Xi, ДГ—3 = 1 -f- (A Хі, д)_2 — 1) z^_3‘, (7.207) дЧ^-я = (- i)s+1 + ІдЧ, „-«.и -(- i)s+1] Д*А'<. 1 = (- 1)" -Г [д4. 2 - (- if] для i = 1, 2, . . ., N. Путем последовательного исключения получим соотношения: Для N нечетного А Хі і — — 1 + 2ziz—2 (ziZ2) 1 -J- 2 (Z]Z2z3) 1 — • • — — 2 (zxz2 • • • zN_3)Si 4- 2 (zxz2 • • • zN_2)s‘ — (zxz2 • • • z^p. (7.208) 492
Для М четного А*хЛ 1 = 4- 1 _ 2г?‘ 4- 2 (г&У1 — 2 (z^z^1 + ... — — 2 (^1г2 • • • Z/v-з) 1 + 2 (z1z2 • • • zN_2} 1 — (z^ • • • 4v_i)i » (7.209) где f = 1, 2, . . ., M. Определим переменные w}, j = 1, 2, . . N — 1 при помощи урав¬ нений = Zf, W2 ZiZ2\ ^3 (7.210) ^V-l — Z1Z2Z3 ’ * * ^N-2^N-1' Для N нечетного- получим Д*хг, i + 1 = 2o’i‘ — 2wÿ -j + 2w%_2 — Шіѵ-Г, (7-211) i= 1,2,.. ., N. Для N четного имеем A**,-, j — 1 = — + 2ws2* 4- 2^X-2 — (7.212) i = 1, 2, . . ., N. Мы указали, что все времена tlf t.2, . . положительны. В этом случае l<zy, / = 1, 2,..., TV— 1, (7.213) где Zj определяются уравнением (7.206). Уравнения (7.213) и (7.210) дают неравенства ï<w1<w2<.. .<wn_2<wn_1. (7.214) Подытожим теперь полученные результаты. Если вектор хА с ком¬ понентами х1Л, х12, . . ., xlf N принадлежит к множеству (Ѵі), то существуют переменные wlt w2, . . wN_lf удовлетворяющие неравенству (7.214), и А* = +1 или А* = —1 такие, что для нечетного N удовлет¬ воряются соотношения (7.211) и для четного N—соотношения (7.212). Наоборот, если дан набор конкретных значений w19 w2, . . ., wN_^ удовлетворяющих неравенству (7.214), и значение А*, то формулы (7.211) или (7.212) определяют вектор состояния хх, который принадлежит мно¬ жеству {Ѵі}. Способом, подобным описанному выше, можно найти выражения для компонент xiyN_R вектора xN_R, который принадлежит к VN_R. Мы, однако, можем получить эти выражения, преобразовав уравнение мно¬ жества {УД. Если состояние xN_R принадлежит множеству { то его движение в направлении начала координат будет описываться набо¬ ром времен tN_R, /ЛГ_^+1, • • Предположим, что в урав¬ нение (7.210) мы подставили = w2 = • • • = wN_R^ = 1. (7.215) Тогда из уравнений (7.215) и (7.210) получаем Zi = z2 = • • • = 1, (7.216) а из уравнений (7.216) и (7.206) находим Л ~ ^2 = ’ • • = — 0. (7.217) 493
Следовательно, если состояние xN_R принадлежит к множеству где R = 1, 2, . . ., N— 1, то его компоненты xL N_R, і = = 1, 2, . . N должны удовлетворять следующим уравнениям: Для N нечетного и і = 1, 2, . . N A xi, n-r 1- 1 = 2^1Z — %w2 4- • • • + (7.218) Для N четного и i = 1, 2, . . N A %, уѵ-я — 1 ■= — 2^і' + 2wi — • • • 2wx-2 — wù-i, (7.219) где переменные w удовлетворяют соотношениям 1 = &yx -- w.2 = • • • = wN_R_i < wN_R < wR_R+l < .< w^. (7.220) Уравнения (7.218), (7.219) и (7.220) можно упростить. Для R четного и і = 1, 2, . . ., N А*хь n-r + 1 ^n-r — 2wn-R+1 + • • • + 2^-2 — (7.221) для R нечетного и і = 1, 2, . . ., N А хі, n-r — 1 — — 2w/lj—R 2^—Я4-1 — ... Ц- 2шд’_2 — i, (7.222) где переменные wN_R, wN_R+l, . wN_r удовлетворяют неравенствам 1 <C WN-R WN-R+1 WN-1> (7.223) где, в свою очередь, R = 1, 2, . . ., N — 1. Пример 7.1. Предположим, что объект описывается передаточной функцией 1 G(S) (s + 1) (s + 2) (s +3) (s +4) ’ (7.224) УѴ — 4 (четное) и sx = 1, s2 — 2, s3 = 3, s4 = 4 [сравните уравнение (7.224) с (7.183)]. Следовательно, если хѵ есть состояние, принадле¬ жащее к { Ѵі), то для компонент х1Д, х2Д, хзд, х4Д справедливы уравнения Д*х1д — 1 = — 2&ух + 2w2 — w3t Д**2)1 — 1 = — + 2^2 wl> Д **3д — 1 = — 2w^ + 2^2 — ^з*, (7.225) Д**4Д — 1 = — 2w* + 2&2 — где 1 < < ш2 < w3. (7.226) Если x2 — состояние, принадлежащее множеству {Ѵ2}, то для компонент хх,2, х2і2, хз,2> *4,2 справедливы соотношения [уравнение (7.221), где R = 2, N = 4] А **і,2 + 1 — 2^2 — ^з’> Д **2,2 + 1 = 2^2 — г^з*, Д**з>2 + 1 = 2^2 — (7.227) Д**4.2 + 1 =2и,2 —4 где 1 < w2 <Z w3. (7.228) Если х3—состояние, принадлежащее множеству {Ѵ3}, то по уравнению (7.222) при R = 3, N = 4 для компонент х1>3, х2,з» *з,з> *4,з получим где I < іе/3, Д*х1і3— 1 = — w3\ Д**2|з“ 1 = — ^з’, д**з.з-1 = — даз’> Д x4,3-l=~w3> (7.229) (7.230) 494
Используя определения и уравнения множеств {Ѵ\), (Ѵ2), . . ., . . {Ѵдг-i), можно обнаружить их некоторые важные свойства, позво¬ ляющие лучше понять геометрический смысл задачи. Свойство 1. Множество [Vj], j = 1, 2, . . N— 1 симметрично относительно начала координат. Чтобы обнаружить это, рассмотрим уравнение множества {У^-д} в виде (7.221). Приняв А* = +1, получим (Xî,N~r) + 1 — 2Wn—R —2Wn— 7^4-1 + • • • + 2Wm~2— i- (7.231) При A* = —1 имеем — (xi, n-r) + 1 — 2ww_R — 2wn—я-|_і 4- • • • + 2wn—2 — 1. (7.232) Сравнивая выражения (7.231) и (7.232), сразу получим (хі, n—rÏ* = (хі, n—rY~> (7.233) откуда и следует симметричность {У^_#} относительно начала коорди¬ нат. Физически это означает, что состояния, расположенные на этом множестве симметрично относительно начала координат, требуют для перевода в начало координат одного и того же времени Ч Свойство 2. В М-мерном фазовом пространстве множество {Ууѵ-4 есть кривая или одномерное многообразие 1 2; множество {Ѵуѵ_2} — по¬ верхность, или двумерное многообразие. Множество {Ѵ/ѵ-#} является /^-мерным многообразием; множество {Ух}— гиперповерхностью, или N — 1-мерным многообразием. Так как множество {Ѵ\} есть гиперповерх¬ ность, то она делит пространство состояний (фазовое пространство) на две части. Свойство 3. Множества {У/}, j = 1, 2, . . ., N — 1 являются «глад¬ кими» и «непрерывными», так как они образованы семействами гладких и непрерывных траекторий. Свойство 4. Множества {У/}, j = 1, 2, . . ., N — 1 являются «бес¬ конечными» в продолжении. Это означает, что если в уравнении (7.221) положить I xlf I = 00, то по уравнению (7.223) имеем wN~R = 00 и, следовательно, \xk, N_R | = оо для k = 2, 3, . . ., N. Свойство 5. Начало координат 0 содержится в множестве {Ѵн-1}; множество {Ѵуѵ—і} содержится в {VN_2} и т. д. Иначе говоря, Ос(М с {Ѵл,_2} с ... с {Ѵ2) с {Ѵх). (7.234) Это свойство непосредственно вытекает из определения множеств. Свойством 5 мы воспользуемся в настоящем параграфе несколько ниже. Свойство 6. Мы отметили, что гиперповерхность {Ух} делит про¬ странство состояний на две части. Удобно установить понятия «сверху» и «снизу» 3 по отношению к гиперповерхности {Ух}. Чтобы сделать это, 1 Например, сравните симметричные состояния на линии переключения у+ и у" для системы второго порядка, рассмотренной в § 7.2 и 7.3. 2 Предположим, что в n-мерном эвклидовом пространстве мы имеем п переменных уъ у2, . . ., уп и т параметров ах, а2, . . ., ат, т < п. Пусть Уі = fi (»1, а2, • • -, М; I = 1, 2, . . ., п, где функции fi независимы. Говорят, что точки, удовлетворяющие этим уравнениям, обра¬ зуют /n-мерное многообразие в n-мерном пространстве. В частности, если т= 1, то одно¬ мерное многообразие называют кривой, если т — 2, то двумерное многообразие называют поверхностью, и если т = п — 1, то п — 1-мерное многообразие называют гиперповерх¬ ностью (см. также § 3.13). 3 Так же, как это мы сделали в § 7.4 для системы третьего порядка. 495
предположим N нечетным, и поэтому состояние хг cz {Vj) удовлетворяет уравнению (7.211), которое мы запишем в развернутом виде: Д -j- 1 = 2ші1 — 2w2l 2^тѵ—2 — i, (7.2351) Д %2,i 4~ 1 “ 2^і2 — 2ü^22 -r * ’ * 4~ 2йУуѵ—2 — Шуѵ—і» (7.2862) & 4- 1 = 2WiN 1 — 2W2N 1 4- * • • 4~ 2w^—2 — ^N—1’, (7.235^-3) Д*xNt ! 4- 1 =: 2^ — 2W2N 4- • • • 4- 2wSn-2 — (7.235^ Пусть мы имеем некоторое состояние х: Рис. 7.27. Абстрактное изображение проекции состояния х на гиперпо¬ верхность {(точка хх) Х1 х2 ХЛГ-1 XN и хотим узнать, где находится х — сверху или снизу от гиперповерхности {Уі}. Положим в уравнениях (7.235J, (7.2352), . . (7.235^) •^1,1 “ Х1, -^2,1 ~ -^2> • • • , — xn-i> (7.236) тогда получим из них 7V — 1 уравнение, из которых найдем N — 1 пере¬ менную wlf w2f . . wN^ и Д* = 4-1 или Д* = —1, имея в виду нера¬ венства 1<Ші<Ш2< ••• <^дг_1. (7.237) Подставим значения wlf w2, • • -, Wm-i и Д* в уравнение (7.235^ и получим значение Значение xNtl сравним с величиной последней компоненты xN состояния х. Если xN — *л;і>0, (7.238) то будем считать, что состояние х находится сверху от гиперповерхности (Уі). Если — (7.239) то X Q }, и если Хдг — J 0, (7.240) то будем считать, что состояние х находится снизу от гиперповерхно¬ сти {Ѵі}. Эти соображения иллюстрирует рис. 7.27. Так же, как и в § 7.4 (рис. 7.23), на нем изображена прямая, проходящая через точку х — = (%і, х2, . . ., xN) параллельно оси xN, которая благодаря свойству 2 пересекает гиперповерхность {VJ в точке хг = (х19 х2, . . -, xN_ly xNfl). Сравнение х^ с xNf х показывает, где находится точка х — сверху или снизу от гиперповерхности {}. Аналогичным способом можно проверить, принадлежит ли хг из {Ѵ2} к {Ѵ2} и т. д. Свойство 7. Если N нечетно, то состояние (1, 1, . . ., 1) находится выше, а состояние (—1, —1, . . —1) ниже гиперповерхности {Ѵі}. 496
Если W четно, то наоборот, состояние (1, 1, . . ., 1) находится ниже гипер¬ поверхности а состояние (—1, —1, . . ., —1) выше нее. Полное доказательство данного утверждения мы опускаем, ограничимся иллю¬ страцией этого положения на примере системы третьего порядка. Пример 7.2. Рассмотрим систему третьего порядка с передаточной функцией С|і)- <■ + .,)(■+■.>« + ..) :°<*<*-<‘- (7.241) Уравнение поверхности (У,} ' можно найти из соотношения (7.211), положив N =3 (нечетное): Д*Х1, 1 + 1 =2и’і1 — «’I1; (7.242) Д*х2> , + 1 =2wp — (7.243) Д*х3, 1 + 1 = 2а>р — wÿ. (7.244) Покажем, что точка (1, 1, 1) находится выше поверхности {Ѵх}, для чего восполь¬ зуемся методом, описанным в свойстве 6. Рассмотрим состояние хх = (1, 1, х3|1), принад¬ лежащее поверхности {Ѵх}, и покажем, что 1 —х3, і> 0. Первый шаг состоит в подста¬ новке значений jq, і = 1 и х2, і = 1 в соотношения (7.242) и (7.243) соответственно: Д* + 1 =2шр — (7.245) Д* + 1 =2шр — wsÿ. (7.246) Напомним, что А* выбирается таким, чтобы удовлетворялись неравенства 1 < < ш2. (7.247) Предположим, что мы выбрали А* = —1, тогда 2Ш,1 = йУп1; 1 (7.248) 2^2 = ws22. I Очевидно, что 1 1 w2 ~ 2 Sl ~ 2Ss (7.249) и, следовательно, 1 1 2S1 = 2S2 , (7.250) что невозможно, так как 0 < sx < s2. Таким образом, выбор является неправильным, и для подстановки в уравнения (7.245) и (7.246) мы должны выбрать А* =+1. (7.251) Получаем соотношения 2 =2^р — ш*1; (7.252) 2 = 2йУр— ws22 (7.253) или 1 1 = [2 (игр — 1)] s‘ = [2 (ир — 1)] s* . (7.254) Отметим, что для произвольных значений sx и s2 решить уравнение (7.254) относи¬ тельно wt невозможно. На следующем шаге следует найти х3і х [по уравнению (7.244)], для которого при А* = +1 получается соотношение х3' ! = — 1 + 2w\* — Ws2\ (7.255) Мы должны показать, что 1 — Хз, 1 > о (7.256) Ч Так как N = 3, гиперповерхность {Ѵх} есть просто поверхность в трехмерном про¬ странстве состояний. 497
или, эквивалентно, что 1 О)2> [2 («4» — 1)] s>. (7.257) Вид уравнений (7.254) и (7.257) подсказывает целесообразность введения функции _1_ g(wx, s) = [2(^-1)] s , (7.258) рассматриваемой как функция s с >> 1 в качестве параметра. По определению будет (7.259) иметь место равенство g («Ù. Si) = *2 1 g(wf,sl)=g(wf,S2)=w!. мы должны показать, чт g (^і, s3) < g (Ші, s Нетрудно обнаружить 1 і m g (шх, s-»0 Рис. 7.28. График функции g(w1, s) в зависимости от s lim g (шь s) также 4г g *)= (7.260) (7.261) (7.262) (7.263) и 0 S а [su>i log ï s2), о 2) при s2 < s3 , что s) = 0 = > 1, : 2(^-1)]. _1_ [2 (^-1)1 s Так как > 1 hs>0, член • ;—в уравнении (7.263) всегда s2 (^ — 1) телен. Убедимся, что существует только одно s — s, для которого log— 1) log2 (ш* — 1), т. е. 4г g s)|?=°- Эти соображения позволяют установить характер функции g (ш15 s). Как положи- (7.264) (7.265) показано на рис. 7.28, g (wlb s) как функция от s начинается с нуля, достигает максимума при s = s, а затем убывает, асимптотически стремясь к при s -> оо. Очевидно, что для любого s3 > g (^І. «з) < g (И»1. S2)- Упражнение 7.31. Рассмотрите передаточную функцию (7.241), положив sx = 1, s2 = 2, s3 = 3. Повторите шаги, перечисленные в примере 7.2, и покажите, что = 3, w2— 4, х3>1 = —11. Убедитесь, что точка (1, 1, 1) находится сверху от поверхности {}, так как точка (1, 1, —11) принадлежит к {Ѵх}. Нарисуйте график функции _1_ g(3, s) = [2(3’-l)]s для 0 < s < сю и убедитесь, что он похож на график рис. 7.28. Свойства множеств {Ѵі), {У2}, . - (Кѵ-іі мы используем при формулировке оптимального по быстродействию закона управления для объекта N-ro порядка с передаточной функцией (7.183). Закон управления 7.6 (решение задачи 7.6). Дано произвольное состояние X. Оптимальное по быстродействию управление и*, переводя¬ щее X в начало координат 0, определяется следующим образом: 498
если X выше (VJ, то а* = (—1)ѵ; если х ниже {Ѵх}, то и* = —(—1)ѵ; если лг^Уі}, то и* = (—1)ѴД*; если х£{Ѵ2}, то и* = —(—1)ѴД*; если xQV^tJ, то и* = (—1)R+]A*; если х^(Ѵ/Ѵ_2}> то и* = —А*; если x^fV^J, то и* = Л*. Элементы доказательства. Из определений множеств {Ѵ}-} следует, что если состояние (или изображающая точка в фазовом пространстве) принадлежит к множеству {VyV_/J, = 1, 2, . . N — 1, то управле¬ ние, переводящее х в начало координат, переключается в точности R — 1 раз. В частности, если состояние х принадлежит к гиперповерх¬ ности {Уі}, то управление переключается N — 2 раз. Напомним, далее, что поскольку система имеет N действительных собственных значений, то оптимальное по быстродействию управление может переключаться не более W — 1 раз. Рассмотрим состояние гі 1 _ 1 _ которое, по свойству 7, расположено выше {V J при N нечетном. Если нечетно, то закон управления устанавливает, что и* = —1. Попробуем доказать это утверждение. Приложим в точке 1 управление и = +1. Так как все траектории, производимые управлением и = +1, стремятся к 1, то система останется в исходном состоянии 1 навсегда. Следовательно, мы обязаны приложить управление и = —1 при 1 и произвести траекто¬ рию, которая попадет в множество {VJ. Если по достижении {VJ управ¬ ление переключается с и = —1 на и = +1, то общее число переключений будет равно N — 1, что, очевидно, не противоречит необходимым условиям. Следовательно, если N нечетно и состояние х выше (VJ, то управление должно быть и = —1. Аналогично доказывается, что если х выше { (и поэтому ввиду свойства 5 не принадлежит к {VJ, • • -, {Ѵд^}), т0 управление и = (—1)N переводит х в (VJ, а если х ниже {V J, то и = = —(—1)Л^ переводит х в {VJ. В каждом случае число переключений в точности равно N — 1. Следующий шаг состоит в доказательстве того, что если состояние хг принадлежит {VJ, то управление должно быть равно и = (—1)Л^А*. Предположим, что N нечетно и что для хх £ {Ѵх} значение А* = = —1. Согласно закону управления в точке хг мы должны приложить к системе управление и = +1. Такое управление дает траекторию, распо¬ ложенную в гиперповерхности (VJ и попадающую в {Ѵ2} в точке, в кото¬ рой управление должно переключиться на —1 и т. д. Эта управляющая последовательность требует в точности N — 2 переключений. Предполо¬ жим, что в точке хг мы приложили и = —1. Получившаяся в результате траектория не будет лежать в гиперповерхности {VJ; она будет располо¬ жена ниже {VJ (поскольку она стремится к состоянию —1, расположен¬ ному ниже {Ѵі}). Поэтому управление должно переключиться си = —1 на и = +1 для того, чтобы вернуть состояние в {VJ. Однако, такая 499
управляющая последовательность требует в точности переключений и, следовательно, не может быть оптимальной. Эту процедуру можно повто¬ рить и доказать, что если x^_R £ {Ѵ/ѵ-д}, то управление и~ = (—1)Я-нд* переводит xN_R в 0 пру помощи R — 1 переключений, в то время как приложенное в точке xN_% управление и — —(—1)К-НД* переводит xN_R вверх или вниз от {Ѵх); такое управление не может быть оптимальным, потому что оно потребует по крайней мере W переключений. Тем самым геометрическое доказательство завершено. Из этих рассуждений непосредственно вытекает, что управление, требующее минимального числа переключений, является оптимальным по быстродействию. Это, конечно, справедливо лишь для объектов с дей¬ ствительными собственными значениями. Рис. 7.29. Блок-схема вычислений, требующихся для отыскания оптимального по быстродействию управления для системы УѴ-го порядка На рис. 7.29 в виде блок-схемы показаны вычисления, которые необходимо выполнить для отыскания оптимального управления. Фазовые координаты xlt х2, • • -, xn-i и xn измеряются и первые N — 1 из них используются для вычислений wlt w2, . . wN_Y и Д* по уравнениям A*Xj + 1 = 2wp — 2wS2l + • • • + 2wSK-2 — WSN'_f, A x2 -b 1 — 2w{2 — 2w22 4" • • • 4‘ 2шд'_2 — n—ь Д*Хдг-і + 1 = 2u>ijV“1 — 2w\N~r + • • • + 2^a^?2 — ^-’î1 или A Xi — 1 — —2ü2?i 1 4~ 2w2* — • • • ~t" 2Wjv—2 — \ x2 — 1 — —2W[2 4~ 2zæ?22 — N нечетное (7.266a) N четное (7.2666) A*X^_j — 1 = —2w\N 1 4" 2^2jV~1 — • • • 4" ^Wn-2 — где 1 < < w2 < • • • < wN_2 < wN^. (7.267) Вычисленные значения и Д* подставляются в урав¬ нение A хм, 1 4“ 1 — 2^1^ — 2w2N 4- • • • 4~ 2wmL.2 — wnL-i (7.268a) N нечетное или A 1 — 1 = —2w\N 2w2N — ... 4~ 2w$-2 — wnL_\. (7.2686) N четное 500
Вычисленное значение J сравнивается с измеренной величиной xN. Если полученная разность 'xN — xN^ положительна, то измеряемое состояние находится выше гиперповерхности {} (см. свойство 6), а если Хдг — Х/ѵ, г отрицательна, то ниже {Йх}. Умножение разности xN — xN і на (—1)Л дает сигнал правильной полярности, прикладываемый к реле /?, выход которого и* (0 является управлением, оптимальным по быстро¬ действию. Очевидно, что система, показанная на рис. 7.29, определяет, где находится измеряемое состояние — выше или ниже гиперповерхности іVil4, и вырабатывает управление, которое переводит состояние х в гиперповерхность {Ѵх} за минимальное время. Обычные ошибки в вычи¬ слениях и задержки во времени почти всегда приводят к тому, что переклю¬ чения управления будут происходить чуть-чуть выше или чуть-чуть ниже {Ѵ\}, и поэтому траектории близки, но не принадлежат мно¬ жествам {Vj I, {Ѵ2}, • • -, ( Vtf-ib После N — 1 переключений состоя¬ ние близко к началу координат. Степень точности будет зависеть от скоро¬ сти и точности используемых вычислительных средств. Именно поэтому практическая реализация, показанная на рис. 7.29, не включает логи¬ ческих операций для множеств (У2), {Ѵ3}, . . ., 7.6. НЕКОТОРЫЕ ЗАМЕЧАНИЯ В предыдущих параграфах мы рассмотрели задачу об оптимальном управлении для двух систем второго порядка, для одной системы третьего порядка и одной системы N-ro порядка. Эти системы обладали следующими общими свойствами: 1) были линейными, нормальными и инвариантными во времени; 2) их передаточные функции не имели нулей; 3) полюса передаточных функций были действительными не положи¬ тельными (не обязательно различными) числами; 4) управление осуществлялось одной управляющей переменной и (/), ограниченной по амплитуде \и (/) | < 1; 5) желаемым конечным состоянием было начало координат, которое является точкой равновесия системы, и поэтому по достижении начала координат достаточно выключить управление для того чтобы система осталась в покое (т. е. в начале координат). Метод решения был для всех задач почти одним и тем же. Отметим основные этапы синтеза оптимального управления. 1. Прежде всего мы сводили систему дифференциальных уравнений к системе уравнений первого порядка, используя в качестве переменных состояния выходной сигнал у (/) и достаточное число его производных. Например, для системы М-го порядка мы использовали N — 1 производ¬ ную выходного сигнала. 2. После этого выбирали удобную систему переменных состояния (фазовых координат) с помощью ряда невырожденных линейных преобра¬ зований, которые приводили матрицу системы к ее жордановой канони¬ ческой форме. Для системы с двойным интегрированием (§ 7.2) это преоб¬ разование не было необходимым, потому что матрица системы уже пред¬ ставляла собой жорданову каноническую форму. 3. Затем к полученной системе переменных состояния применялся принцип минимума. Мы рассматривали гамильтониан, определяемый уравнениями, справедливыми для дополнительных переменных, и отыски¬ вали управление, которое абсолютно минимизирует гамильтониан. Мы 1 Гиперповерхность {} часто называют гиперповерхностью переключения. 501
обнаружили, что для нормальных систем оптимальное по быстродействию управление должно было быть кусочно-постоянным и могло переключаться не более N — 1 раз для системы УѴ-го порядка. В результате всего этого мы отыскивали управляющие последовательности, которые могли ока¬ заться управлениями, оптимальными по быстродействию. 4. Далее методом исключения выбирали управление, оптимальное по быстродействию. Мы рассматривали каждое состояние в фазовом про¬ странстве и исследовали каждое из управлений, которое могло быть оптимальным. Среди всех управляющих последовательностей, переводя¬ щих произвольное состояние в начало координат, выделялась одна, ко¬ торая и давала закон управления. Побочным результатом этих мето¬ дов явились понятия линии переключения для системы второго порядка, поверхности переключения для системы третьего порядка и гиперпо¬ верхности переключения для системы порядка 2Ѵ. Иначе говоря, мы определили множества состояний, разделяющие фазовое пространство на две различные области, в одной из которых оптимальное по быстродей¬ ствию управление было равно +1, а в другой —1. 5. И, наконец, реализовывали оптимальный по быстродействию закон управления, моделируя линию (поверхность или гиперповерхность) переключения и определяя, где находится состояние — выше или ниже линии (поверхности или гиперповерхности) переключения. При помощи реле получался оптимальный управляющий сигнал, который воздейство¬ вал на вход системы. При отыскании оптимального по быстродействию управления для системы М-го порядка мы определили множества {VJ, {Ѵ2}, . . ., {Ѵ^}, включая гиперповерхность переключения, состоящие из траекторий си¬ стемы, которые соответствуют постоянному управлению и = А = ±1 по требованиям принципа минимума. Множества {VJ состоят из траекторий системы в том случае, если ее полюса не имеют мнимых частей и конечным состоянием является начало координат. Существует много задач (см., например, упражнение 7.19), для которых линия переключения не является траекторией системы, если областью S является точка, отличная от начала координат. В сле¬ дующем параграфе мы увидим, что линия переключения для системы с комплексными полюсами не состоит целиком из траекторий системы даже в том случае, когда конечным состоянием является начало коор¬ динат. Следующие три упражнения иллюстрируют оптимальное по быстро¬ действию управление для некоторых систем с действительными полюсами. Упражнение 7.32. Рассмотрите объект второго порядка, описываемый дифферен¬ циальным уравнением -^Д- + =ku V’ <7-269) где а > 0, k > 0 и | и (/) | 1. (7.270) Такой объект имеет передаточную функцию Д4 = G (s) = k . (7.271) и (s) s (s + a) Обычно говорят, что этот объект представляет собой интегратор с апериодическим звеном. Используя фазовые координаты (/) и х2 (/), удовлетворяющие дифференциаль¬ ному уравнению (/) >2 (t) (7.272) 502
найдите связь между переменными хг (t) и х2 (/) и выходной координатой у (/) и ее произ¬ водной у (t). Покажите, что для того, чтобы перевести любое исходное состояние системы в начало координат (0, 0), оптимальное управление, как функция xt и х2, получается из уравнения и* =sign{-j-ii-j-(l — е~ах')— x2j. (7.273) Упражнение 7.33. Определите оптимальное по быстродействию управление к началу координат для объекта третьего порядка, описываемого дифференциальным уравнением d3y + (S 4- s ) d2y (t) 4- s s dy (t) - ku (П 17 274} HsiTs2) -н SiS2 — — Ли (г), (7.274) где 0 < Si. < s2, k > 0, I и (t) I 1. (7.275) Такой объект имеет передаточную функцию вида = = +»■>(. + .,) ■ (7И6> Указание: для решения задачи надо найти аналитическое выражение поверх¬ ности переключения { Ѵ1}. Упражнение 7.34. Найдите оптимальное по быстродействию управление к началу координат для объекта =ц(0, I“<O1=SS1. 7.7. УПРАВЛЕНИЕ ГАРМОНИЧЕСКИМ ОСЦИЛЛЯТОРОМ1 До сих пор мы рассматривали задачу об оптимальном управлении для систем с действительными собственными значениями матрицы системы. В этом параграфе мы рассмотрим систему второго порядка с чисто мнимыми собственными значениями. Пусть система описывается дифференциальным уравнением ^L + ^y(t) = Ku(t), (7.277) где К > 0 и управление удовлетворяет ограничению \u(t)\ < 1. (7.278) В теории и практике автоматического регулирования такая система описывается передаточной функцией = G (s) = -у#—7- • (7.279) и (s) ѵ 7 s2 4~ ' 7 Определим фазовые координаты (переменные состояния) как yAt) = У«); У2 = (7-280) Вектор у (t) удовлетворяет матричному дифференциальному урав¬ нению у 1(0 о Г Уі (О' + 0 _й(0 _ —О)2 0 _У2 (0_ Ku(t) Введем более удобные координаты хг (t) и х2 (/), приняв (0 — Уі (0» Х2 (0 = У2 (0 • (7.281) (7.282) 1 Первым эту задачу решил Бушау [38]. Дополнительными источниками являются работы [5], [9], [39], [41] и [122]. 503
Эти координаты (которые мы и будем использовать на протяжении всего параграфа) удовлетворяют векторному дифференциальному урав¬ нению ’ X. (/) ■ 0 со ■Ч (О' + 0 ' . х2 (0 _ —со 0 х2 (/)_ Рассматривая матрицу системы А О со А - —со 0J, легко убедиться, что ее собственными значениями являются ^2 = j®- (7.283) (7.284) (7.285)1 Впервые в настоящей главе мы столкнулись с матрицей с комплекс¬ ными собственными значениями. Как мы увидим, это обстоятельство существенно изменяет форму линии переключения и метод ее получения. Существует много физических систем, дифференциальные уравнения которых можно привести к виду (7.283); две из них рассмотрены ниже. Пример 7.3. Рассмотрим массу т, подвешенную на пружине, имеющей коэффициент упругости k (рис. 7.30). Пусть у (/) обозначает линейное перемещение от положения равно¬ весия (например, нуля) и f (/) (|/(0І^^) ограниченная по величине прикладываемая сила. Дифференциальное уравнение для у (t) имеет вид т d dfi~ + ky (7.286) Уравнение (7.286) можно преобразовать к виду (7.277) [и, следовательно, к виду (7.283)], выбрав со2 = — , К = — , u(t)= . (7.287) tn tn F К тому же общему классу колебательных звеньев относятся маятники (при малых перемещениях) и крутильные маятники. Рис. 7.31. Симметричное тело, под¬ верженное одновременному вращению относительно трех связанных с ним осей. Угловые скорости равны yr (Z), У г (0 и Уз (і) т Рис. 7.30. Система, состоящая из пружины и массивного тела Пример 7.4. В этом примере рассмотрим уравнения движения вращающегося в про¬ странстве тела с одной осью симметрии. Мы встретимся с такой же системой и в последую¬ щих частях книги (см., например, § 10.7). На рис. 7.31 показано такое тело с одной осью симметрии. Введем оси /, 2 и 5, связанные с телом и проходящие через центр массы. Из рис. 7.31 очевидно, что ось 3 есть ось симметрии тела. Обозначим через /3 момент инерции относительно оси 5, а через / — момент инерции относительно осей 1 и 2. Через ух (t), у2 (t) и у3 (/) обозначим угловые скорости вращения 1 В соответствии с принятой терминологией j — Y— 1. 504
относительно осей 7, 2 и 3 соответственно. Предположим, что мы укрепили на теле реак¬ тивный двигатель с ограниченной тягой f (/), (/) | F на расстоянии с от центра масс, и поэтому момент cf (t) может управлять величиной углового ускорения у2 (/). Тогда 1 угловые скорости уъ (/), у2 (/) и у3 (t) удовлетворяют системе дифференциальных уравнений іуі (0 = (/ — /3) уг Ѵ)уз (О; ІУ2 (О = (/з - /) У1 (і)Уз (П -Ь4(П; ІзУз (/) -- О- Из последнего уравнения имеем Уз (/) = const -= Т]3. Следовательно, если выбрать = (/ —/з) (7.288) (7.289) (7.290) то получим следующие дифференциальные уравнения для угловых скоростей уг (/) и у2 (t) Уі (0 ='СОў2 (/); у2 (1)=-аУ1(1) (7.291) Если принять Д = -4“ F и и (t) = так что 1 и (0 | 1, / г (7.292) то новые переменные х1 (/) и х2 (/), определенные как Xi(t) х2 (t) = у2 (t), (7.293) Л Л будут удовлетворять дифференциальным уравнениям *і (/) = (ûx2 (t); Х2 (0 = —(0*1 (0 + U (t), которые тождественны уравнениям (7.283). (7.294) Полезно рассмотреть некоторые свойства гармонического осцилля¬ тора, который описывается уравнением (7.283). Прежде всего отметим, что матрица системы А (7.284) косо-симметрична 2. Рассматривая невоз¬ буждаемую систему [и (t) = 0 в уравнении (7.283)] Х1 (1) 0 со (t) Лю. —со 0 (7.295) можно показать, что фундаментальная матрица Ф (/) равна COS (Jit Sin (lit Ф(/) = . / 4 —Sin (Jit COS (!it . Нетрудно убедиться, что Ф(/) — ортогональная матрица 3. Поэтому, если положить *1(0) = £1-, х2(0) = и то решение уравнения (7.295) запишется в виде (7.296) (7.297) (7.298) 'Хі (О' COS <àt sin со/ ‘ -Х2 0). — —Sin <üt cos со/ Л. 1 Смотри [85], [5], [9] и [72]. 2 См. уравнения (2.99) и (2.100). 3 См. уравнения (2.104)—(2.109). 505
Итак, получим *î(0 + *1(0 = ÊÎ + = const. (7.299) Это означает, что траекториями движения невозбуждаемой системы являются окружности в плоскости х^2 с центром в начале координат (0, 0) радиуса ]/"ёі + как показано на рис. 7.32. Движение направлено по часовой стрелке, что отмечено соответствующими стрелочками на траекто¬ риях. Физический смысл этого состоит в том, что гармонический осцилля¬ тор является консервативной системой. Это очевидно из примеров 7.3 Рис. 7.32. Траектории гармони¬ ческого осциллятора при отсут¬ ствии управления (и = 0) Рис. 7.33. Угол Ѳ = (at опреде¬ ляет время движения от (£ь g2) до (хь х2) и 7.4. Время /, требующееся для перехода из начального состояния (|ь g2) в состояние (хъ х2) по дуге окружности, можно определить по формуле / = -£-. (7-300) где Ѳ — угол, показанный на рис. 7.33. Мы можем теперь сформулировать задачу об оптимальном по быстро¬ действию управлении гармоническим осциллятором. Задача 7.7. Дана система \(0' 0 со \ (О' + ■ 0 .«(0. Л(0. —со 0 _х2(0. Управление и (/) ограничено по величине, т. е. И0|<1. (7.301) (7.302) Найти допустимое управление, которое переводит систему (7.301) из любого начального состояния (|х, g2) в начало координат (0, 0) за минимальное время. В этом параграфе мы воспользуемся в основном той же методикой, которой мы следовали ранее. Однако в данном случае верхней границы числа переключений оптимального управления не существует. По этой причине мы не сможем выделить последовательности, которые могут ока¬ заться оптимальными по быстродействию. Этот недостаток информации скомпенсируется дополнительной информацией, даваемой необходимыми условиями относительно максимальной величины времени, в течение ко¬ торого оптимальное управление может быть постоянным. Поэтому мы снова окажемся в состоянии найти линию переключения для этой задачи. Из-за того, что она окажется сложнее предыдущих, мы потратим несколько больше времени на рассмотрение квазиоптимальных устройств, в кото- 506
рых используются более «простые» линии переключения. Приступим те¬ перь к решению поставленной задачи. Гамильтониан данной задачи имеет вид н - 1 + сох2 (/) Р1 (/) — (ùXi (/) р2 (/) + и (/) р2 (/). (7.303) Управление, абсолютно минимизирующее гамильтониан, равно: и (/) = — sign (р2 (/)) • (7.304) Дополнительные переменные рѵ (і) и р2 (і) определяются уравнениями и—'■й- которые можно записать в векторной форме (7.305) ■рі(0‘ 0 со Рі (0 .р2 (0. —со 0 _Р2 (0. (7.306) Система (7.306) имеет тот же вид, что и система (7.295). Этого сле¬ довало ожидать потому, что матрица системы А косо-симметрична. Исполь¬ зуя уже знакомые обозначения Р1(0Г — Р% (0) — ЗХ2, (7.307) находим >1 (О' _р2 (0: — cos со/ sin со/’ —sin со/ cos со/ л 1 (7.308) и, в частности, р2(() ==■ - sin со/ 4 jt2cosco/. (7.309) Функция р2 (t) равна сум¬ ме двух синусоид, и поэтому сама является синусоидой вида р2 (t)-=-asïn (со/ + а). (7.310) На рис. 7.34 показан ти¬ пичный вид р2(/) и управления и (/), полученного по уравне¬ нию (7.304), откуда можно сде¬ лать следующие выводы: Рис. 7.34. Синусоидальная дополнительная 1. Оптимальное управление переменная р2 (/) и управление и (/) = — sign ДОЛЖНО быть КуСОЧНО-ПОСТОЯН- ной функцией времени и пе¬ реключаться между двумя значениями и (/) = + 1 и и (/) = — 1. 2. Оптимальное управление может оставаться неизменным не дольше, чем в течение — единиц времени. 3. Верхней границы числа переключений оптимального управления не существует. 4. Функция р2 (і) не может быть равна нулю на конечном интервале времени, так как для этого должно быть = л2 = 0, откуда, в свою очередь, имеем рх (/) = р% (/) = 0 для всего времени /, и, следовательно, гамильтониан // не будет равен нулю, как этого требует принцип мини¬ мума. Таким образом, возможность существования вырожденного управ¬ ления исключена, т. е. рассматриваемая задача нормальна. 507
Отсутствие верхней границы числа переключений управления для этой системы второго порядка существенно отличает ее от систем второго порядка (для которых оптимальное управление переключалось не более одного раза), рассмотренных ранее в § 7.2 и 7.3. Как мы увидим далее, линия переключения для систем с комплексными собственными значениями существенно отличается от линии переключения для систем с действитель¬ ными собственными значениями. Следующий шаг состоит в том, чтобы найти решение системы (7.301) при постоянном управлении и = Д = + 1. Если начальным состоянием является точка — хі (0)’, ~ Х2 (0), то решением системы (7.301) будет Х1 (0 = ( 51 — -^-) COS <at 4- ç2 sin -I- A ; X2(/) = — (li ^-) Sin Co/ + 12COS coZ (7.311) (7.312) (7.313) или cox, (/) = (co£, — Д) cos ®Z + cog2 sin w/ 4- Д; cox2 (/) = —(co|, — Д) sin co/ 4- cog2 cos co/. Возведём обе части этих уравнений в квадрат, почленно сложим их и после преобразований получим (<ох,(/) —Д]2 г [сох2(/)]2 = (соЁ, — Д)2 4-(cog2)2. (7.315) (7.314) Это уравнение не содержит времени, и, таким образом, представляет собой уравнение траекторий на плоскости сох,—сох2‘. Очевидно, что эти Рис. 7.35. Сплошные окружности представ¬ ляют собой траектории гармонического осциллятора при u = + 1, пунктирные — при и ==—1. Состояние движется по часовой стрелке траектории представляют собой окружности на плоскости а)х1 — сох2 с центрами в точке (Д, 0). Следовательно, если и = +1, то траектории представляют собой окружности с центром в точке (1, 0), а если и = —1, то цент¬ ром окружности будет точка (—1, 0). Эти траектории показаны на рис. 7.35. Из уравнения (7.314) легко получить аналитическое выраже¬ ние для времени, требующегося на переход из точки (со^, со£2) в точку (coxj, сох2), когда управле¬ ние и = Д. Это выражение имеет вид I = 1 (œxx — A) соg2 — сох2 (œgj — A) (û (œx2) (û)g2) 4-(cùXj — A) (œgi — A) ‘ Данная сложная формула имеет очень простую интерпретацию на плоскости 0)%! — о)х2. Как показано на рис. 7.36, время можно опреде- (7.316) 1 С этого момента мы будем пользоваться плоскостью cùXj—œx2, а не ххх2. Можно, конечно, ввести новые переменные zx = (ùXi и z2 = œx2, но это не добавит ничего нового к изложению. ) 508
лить, измерив угол Ѳ = со/ дуги окружности между точками (со^, со£2) и (соХр сох2), причем центр дуги расположен в точке (А, 0). На рис. 7.35 отмечены две окружности Г+ и Г_, проходящие через начало координат плоскости coxj — сох2; на рис. 7.37 они показаны от¬ дельно. Эти окружности можно рассматривать как множества, или гео¬ метрические места точек: Г+ {(сохр —1 )2 4 (сол'2)2 = 1 ]; (7.317) Г_ = {(сохп сох2) : (сохх 4 I)2 4 (cox2)2 1). (7.318) Любое состояние из Г+ можно перевести в начало координат при по¬ мощи управления и = 41- В частности, точку (2, 0) можно перевести в начало координат за сек, так как длина дуги полуокружности Рис. 7.36. При и — Д = ± 1 угол Ѳ = ю/ определяет время, требующееся для перевода точки (œgp с42) в œx2) равна точно л рад. Из рис. 7.37 видно, что управление и = 41 переводит точку А из Г+ в начало координат быстрее, чем за — сек. На перевод в представляют собой две вынужден¬ ные траектории, проходящие через начало координат фазовой плоско- СТИ. Полуокружность — нижняя половина окружности Г_р уі. — верхняя половина окружности Г__ начало координат точки В из Г+ потребуется более сек, что прямо противоречит требованию, вытекающему из необходимых условий, согласно которому оптимальное по быстродействию управление не может оставаться постоянным дольше, чем — сек. Эти рассуждения приводят к следующему определению. Определение 7.18. Пусть у°^ есть множество состояний, которые могут быть переведены в начало координат управлением и = 41 не более, чем за — сек. Очевидно, что = {(соХр сох2) : (сох1—I)2 4- (сох2)2 = 1, cox2<JO}. (7.319) Как показано на рис. 7.37, кривая есть часть окружности Г^, расположенная ниже оси сохр т. е. у°_ — полуокружность, расположен¬ ная ниже оси сохѵ Определение 7.19. Пусть у2_ есть множество состояний, которые могут быть переведены в начало координат управлением и = —1 не более, чем за сек. Очевидно, что = {(û)xp шх2) : (сох1 -г I)2 -г- (сох2)2 = 1, <ох2>>0}. (7.320) 509
Как показано на рис. 7.37, полуокружность есть часть круга Г_, расположенная выше оси Докажем, что кривые и образуют оптимальный путь в начало координат. Закон управления 7.7а. Для данного состояния (шлд, сох2) £ f оптимальное по быстродействию управление единственно и равно и* = и* (сох15 сох,) = +1 для всех (сох^ сох2) Q у0^ и* = и* (сол^, сох,) = —1 для всех (юхр сох2) Ç у2_. Доказательство. Это утверждение нетрудно доказать, воспользовав¬ шись существованием и единственностью оптимальных и экстремальных управлений. Мы, однако, проведем геометрическое доказательство. Точка А расположена на кривой у^ (рис. 7.38). По определению, управление и = +1 переведет точку А в О вдоль дуги АО, которая при¬ надлежит к у^. Предположим, что в точке А мы прикладываем управление и = —1. Получится траектория, являющаяся дугой окружности с цен¬ тром в точке (—1, 0), максимальная длина которой равна л рад (на рис. 7.38 дуга АС равна л рад). Очевидно, что дуга АС не содержит начала координат О. Предположим теперь, что мы переключили управление с и = —1 на и = +1 в некоторой точке D дуги АС. Траектория, соответ¬ ствующая и = +1, есть дуга окружности с центром в точке (1, 0), макси¬ мальная длина которой равна л рад (на рис. 7.38 дуга DE равна л рад). Так как дуга DE не содержит начала координат, мы переключим в точке Е управление с и = +1 на и = —1 и получим в результате дугу EF, кото¬ рая опять не содержит начала координат, и т. д. Итак, если в точке А мы прикладываем управление и = —1, а затем управляющую последо¬ вательность в соответствии с принципом минимума, то мы не можем попасть в начало координат, так как все более от него удаляемся. Остается выяснить, почему не может быть оптимальной траектория ADGO, где точка G принадлежит кривой у2_. Для того чтобы получить траекто¬ рию ADGO, необходимо подать на систему управляющую последователь¬ ность I—1, 4-1, —1}. Из рис. 7.34 видно, что длины дуг AD и GO про¬ извольны (в пределах от 0 до л), но дуга DG должна быть равна точно л рад, что для траектории ADGO не соблюдается. Следовательно, траек¬ тория ADGO не может быть оптимальной, поскольку она не удовлетворяет необходимым условиям. Из всех этих рассуждений следует, что для любой точки А на оптимальным по быстродействию может быть только и = = 4-1, поскольку не существует других последовательностей, удовлетво¬ ряющих необходимым условиям и переводящих точку А в начало коорди¬ нат. Доказательство завершается аналогичным рассмотрением точек кри¬ вой у2_. Определение 7.20. Обозначим через множество состояний, кото¬ рые можно перевести в точки кривой у^_ управлением и = —1 за время, не превышающее сек. Множество состоит из дуг окружностей с центром (—1, 0) длиной л рад, заканчивающихся в точках кривой у^_. Множество показано на рис. 7.39. Определение 7.21. Обозначим через /?+ множество состояний, кото¬ рые можно перевести в точки кривой у^_ управлением и = 4-1 за время, не превышающее сек. Множество состоит из дуг окружностей 510
с центром (+1, 0) длиной л рад, заканчивающихся в точках кривой у2_. Множество показано на рис. 7.39. Определение 7.22. Обозначим через у]_ множество состояний, кото¬ рые можно перевести в точки кривой у°_ управлением и = —1 точно за — сек. Кривая у!_ показана на рис. 7.39 и представляет собой полуокруж¬ ность, расположенную выше оси coXj с центром в точке (—3, 0): == {(ЮЛ'г сол'о) : (cùx1 + З)2 H (сол'о)2 1 ; сох2>0). (7.321) Определение 7.23. Обозначим через у^_ множество состояний, кото¬ рые можно перевести в точки кривой у^_ управлением и = +1 точно за И ООЛЗСТИ И t\ I -^-сек. Кривая у^_ показана на рис. 7 39 и представляет собой полуокруж¬ ность, расположеннўю ниже оси сохг с центром в точке (+3, 0): {(wx!> wx2) : (cda:1— З)2 4- (сох2)2 = 1; сох2 < 0). (7.322) На базе этих определений можно сформулировать следующий закон управления. Закон управления 7.76. Если задано состояние (сох^ сох2) £ £ /?+ U то оптимальное управление является единственным и равняется и* = и* (сохр сох2) = +1 для всех (соХр сох2) £ R^; и* = и* (соХр сох2) = —1 для всех (соХр сох2) Ç Доказательство этого закона управления очень похоже на доказа¬ тельство закона управления 7.7а. Выбрав точку из надо показать, что единственной управляющей последовательностью, удовлетворяющей необходимым условиям принципа минимума, является следующая. Управление и = —1 прикладывается до тех пор, пока не будет до¬ стигнута кривая у^_, а затем нужно переключить управление на и = Ч-1 и прикладывать его до тех пор, пока не будет достигнута точка (0, 0). Читатель может самостоятельно провести доказательство этого с помощью построений, аналогичных рис. 7.38. Обобщим эти понятия в виде ряда определений. 511
Определение 7.24. Обозначим через у^, / = 1, 2. . . полуокружности единичного радиуса, расположенные ниже оси coxj, с центрами в точках (2/ +1, 0): ~ {(û)xp сох2) • [сох^— (2/4 I)]2 + (сох2)2 = 1; <ох2 > 0}. (7.323) Определение 7.25. Обозначим через у£, / = 1,2... полуокружности единичного радиуса, расположенные выше оси сох^ с центрами в точках (—2/ — 1, 0): у£ = {(°^р сох2) • 4 (2/ 4- I)]2 -I- (<ox2)2 = 1; <ox2> 0}. (7.324) Эти кривые y^_ и у{_ показаны на рис. 7.40. Определение 7.26. Обозначим через RL, j =- 1, 2,. . . множество со¬ стояний, которые можно перевести в точки кривой у^у1 не дольше, чем за сек управлением и = —1, а через /?+, / = 1, 2,. . . множество со¬ стояний, которые можно перевести в точки кривой у^1 не дольше, чем за сек управлением и = 4-1 • Множества RL и R+ показаны на рис. 7.40. Из последних определений следует, что кривая у!__ есть геометрическое место всех состояний, которые можно перевести точно за сек в точки кривой у^-1 управлением и = —1, а кривая у^ — геометрическое место состояний, которые можно также перевести точно за сек в точки кри¬ вой у^"1 управлением и = +1. Иначе говоря, кривую у£ можно получить из кривой у^"1, повернув каждую точку кривой у^1 вокруг центра (—1, 0) на угол, равный 180°; кривая у^_ получается аналогичным образом, но центром в этом случае является точка (+1, 0). Определим линию переключения у соотношением U U 4L Ѵ+ U ï_- (7.325) Если принять Я- = U 7?L; /=0 Я-}- — U (7.326) то R_ будет представлять собой множество точек, расположенных выше линии переключения у, a R+ — множество точек, расположенных ниже у. Можно сформулировать оптимальный по быстродействию закон управления для задачи 7.7 следующим образом. Закон управления 7.7 (решение задачи 7.7). Оптимальное по быстро¬ действию управление как функция состояния (сохь сох2) определяется следующим образом: п* = и* (сохь сох2) =41 для всех (сохь сох2) Ç Я+ U Y+ и* = н* (сохь <ох2) = —1 для всех (сохь сох2) £ Я-U У-, где Я+, Я-, У+ и у_ определяются уравнениями (7.325) и (7.326). Опти¬ мальное управление единственно. Мы опускаем доказательство этого закона управления, потому что основные идеи его были изложены при обсуждении законов управления 512 (7.327)
7.7а и 7.76. Доказательство опирается на единственность экстремальных управлений и существование оптимального управления к началу коорди¬ нат. Итак, если начальное состояние находится выше линии переключе¬ ния у, то оптимальным по быстродействию является управление и* = = —1; если начальное состояние ниже кривой у, то оптимальным является управление и* = +1. На рис. 7.41 показаны две различные траектории в начало координат. Рассмотрим рис. 7.41 более внимательно. Линия переключения у показана пунктиром; сплошными линиями изображены две оптимальные по быстродействию траектории. Рассмотрим траекторию ABCDEFO', управление, за счет которого получена эта траектория, переключается Рис. 7.40. Полуокружности у{^_ и у£_, j— = 0, 1, 2, ... и области и / — = 1, 2, . .. Рис. 7.41. Линия переключения у показана пунктирной кривой. R_ — область состояний выше линии переключения, /?+ — ниже ли¬ нии переключения. Сплошными кривыми по¬ казаны две оптимальные по быстродействию траектории ABCDEFO и QHIJКО пять раз (в точках В, С, D, Е и F на линии переключения). Легко видеть \ что отрезок АВ целиком принадлежит множеству отрезок ВС при¬ надлежит множеству отрезок CD — множеству и т. д. Дуги окружностей ВС, CD, DE и EF имеют длину точно л рад, а дугй АВ и FO короче л рад. Таким образом, управляющая последовательность удовле¬ творяет необходимым условиям. Заметим, что единственным участком траектории, совпадающим с кривой у, является отрезок дуги FO, который действительно принадлежит кривой у^. Для оптимальной траектории GHIJKO только дуга КО содержится в линии переключения у и при¬ надлежит кривой у2_. Таким образом, единственным участком линии переключения у, который может содержать оптимальные траектории, есть объединение кривых у2_ и у®_. Другими словами, кривые у^_ и у{_ для j = 1, 2,. . . не являются частями оптимальных траекторий. Это обстоятельство существенно отличает рассматриваемый случай от систем второго порядка с действительными собственными значениями, для кото¬ рых вся линия переключения совпадает с траекториями, оптимальными по быстродействию 1 2. Имеется и еще одно отличие гармонического осциллятора от систем второго порядка, рассмотренных в § 7.2 и 7.3. Для последних оптимальное 1 См. Определение 7.26. 2 См. § 7.2 — определение 7.4 и рис. 7.3 и 7.6, а также § 7.3 — определение 7.8 и рис. 7.13 и 7.16. 17 Атанс и др. с-іо
по быстродействию управление требовало наименьшего числа переклю¬ чений \ а для гармонического осциллятора это не справедливо. Как видно из рис. 7.37, точка В на окружности Г+ (которая может быть пере¬ ведена в начало координат управлением и = +1) принадлежит множе¬ ству и оптимальное по быстродействию управление, переводящее В в начало координат, переключается один раз. Иначе говоря, для гармони¬ ческого осциллятора управление, требующее минимального числа пере¬ ключений, не обязательно является оптимальным по быстродействию. Упражнение 7.35. Покажите, что постоянное управление и = +1 переводит состоя- /1 lx Зя ние (1, 1) в плоскости —юх2 в начало координат за сек, тогда как оптимальное г « к Зя по быстродействию управление требует только —— сек. Рис. 7.42. Блок-схема оптимального по быстродействию управляющего устройства для гармонического осциллятора. Характеристика нелинейности N соответствует (повторяет) линии переключения у (JX< Поскольку закон оптимального управления с обратной связью найден, можно спроектировать оптимальное по быстродействию управляющее устройство. Такое «устройство» показано на рис. 7.42. Мы видим, что струк¬ тура системы рис. 7.42 похожа на структуру управляющих устройств для двух предшествовавших систем второго порядка, показанных на рис. 7.5 и 7.14 в том смысле, что требуется только один нелинейный элемент. Нели¬ нейность N, изображенная на рис. 7.42 (зависимость выходной коорди¬ наты от входной), представляет собой линию переключения у. Однако ее техническая реализация (например, с помощью диодов) затруднительна. Поэтому рассмотрим способы управления, близкие к оптимальным (см. примеры 7.5 и 7.6), т. е. устройства, построенные на основе оптимальных, но с более простыми нелинейностями. Так как гармонический осциллятор является основной и очень важной системой, полезно рассмотреть его минимальные изохроны. Так же, как и раньше1 2, мы определим минимальную изохрону S (/*) как множество состояний, которые можно перевести в начало координат за одно и то же минимальное время /*. На рис. 7.43 изображены мини¬ мальные изохроны гармонического осциллятора, соответствующие /*. Прежде чем обсуждать свойства изохрон, полезно привести метод их по¬ строения. На рис. 7.44 показана типичная оптимальная траектория АСО в области Предположим, что минимальное время, которое требуется для перевода А в О, равно fA. Мы хотим построить минимальную изо¬ хрону S (/д), которая проходит через состояние А. Для этого: 1 Это верно и для систем Л/-го порядка, рассматриваемых в § 7.5. 2 См. определение 7.6. 514
1. Начертим окружность радиуса, равного 2, с центром в точке А и найдем точку ее пересечения с окружностью Г_|_, т. е. точку В. Легко показать, что минимальное время /* можно определить по углу со/* (из подобия треугольников доказывается, что величина угла со/* равна сумме углов ANC и С МО). 2. Начертим окружность радиуса, равного 2, с центром в точке В, которая начинается из точки D на кривой у1^ и касается границы мно¬ жества /?+ в точке Е. Дуга DAE есть часть изохроны S (/д) в области так как по построению любая точка дуги DAE требует одного и того же Рис. 7.43. Минимальные изохроны для гар¬ монического осциллятора Рис. 7.44. Построение минимальных изохрон S (/д) и S (/^) Выберем теперь другую точку в /?+ с оптимальной траекторией FCO и найдем минимальную изохрону S (/*), где /* — минимальное время, за которое F можно перевести в начало координат. S (/*) получается построением, аналогичным описанному выше. Окружность радиуса, равного 2, с центром в точке F пересекает кривую в точке G. Время /* определяется углом со/* (опять-таки подобие треугольников используется для того, чтобы доказать равенство со/* сумме углов FNC и С МО). Дуга HFI есть дуга окружности радиуса, равного 2, с центром в точке G. Эта дуга есть часть минимальной изохроны S (^) в 7?^, причем точка Н принадлежит кривой у2_, в точка I — кривой у°_. То же построение можно использовать для любого начального состояния из На рис. 7.45 показаны построения для исходного состояния Æ из Оптимальной является траектория KPQO. Минимальное время /* можно найти по углу со/* (используя подобие треугольников, можно доказать, что угол со/* равен сумме трех углов КМР, PNQ и QMO). Для того чтобы найти S (/*), начертим окружность радиуса, равного 4, вокруг точки Æ и найдём ее пересечение с окружностью Г_, т. е. точку L. Минимальная изо¬ хрона S (/*) есть дуга SKR окружности радиуса 4 с центром в точке L, где S — точка касания S (/*) с границей (штриховая линия), а точка R принадлежит кривой у^_. Эти методы можно обобщить и построить минимальную изохрону, проходящую через любую заданную точку на плоскости сохх — сох2- Ниже мы укажем последовательность действий для построения минималь¬ ной изохроны. 515
Определение 7.27. Пусть Ст, m 2, 4, 6, . . . — множество состоя¬ ний: (cœvj)2 -т (сох2)2 <т2, т — 2, 4, 6, . . .. (7.328) Иначе говоря, С2 — множество точек круга радиуса, равного 2, с центром в начале координат и т. д. Изложим методику построения изохрон для состояний ниже линии переключения, так как изохроны для состояний выше линии переключения строятся симметрично. Пусть задана точка А ниже линии переключения. Если А С2 П 7?^_, то изохрона S (^) есть дуга окружности радиуса, равного 2, с центром, расположенным на верхней половине окружности Г+, а если A Ç 7?^ — С2, то изохрона S (7*) есть дуга окружности радиуса, равного 2, с центром, расположенным на нижней половине окружности Г+. Если А £ С4 Г) то изохрона S (/*) есть дуга окружности ра¬ диуса, равного 4, с центром, расположенным на верхней половине окруж¬ ности Г+, а если А £ 7?^_ — С4, то изохрона S (Z*) есть дуга окружности, радиуса равного 4, с центром, расположенным на нижней половине окруж¬ ности Г+. В общем случае, если A Q С2- ГІ R^ / = 1, 2, . . ., то изо¬ хрона S (/*) есть дуга окружности радиуса 2/ с центром, расположенным на верхней половине окружности Г^. Для А С 7?^ — С2/, j = 1, 2,. . . изохрона S (/*) есть дуга окружности радиуса 2/ с центром, расположен¬ ным на нижней половине окружности Г+. Упражнение 7.36. Разработайте ваши собственные правила построения минимальной (7л \ / 7л \ 8сіГ ) И S \ ”4аГ / Теперь мы в состоянии сделать выводы относительно минимальных изохрон гармонического осциллятора и сравнить их с минимальными изохронами для объекта с двойным интегрированием (§ 7.2, рис. 7.7) х. Читателю следует обращаться к рис. 7.43, чтобы проверить справедли¬ вость следующих заключений: 1. Минимальные изохроны в множестве С2, т. е. в круге радиуса, равного 2, с центром в начале координат, состоят из двух дуг, симметрич¬ 1 А также для системы из упражнения 7.22. 516
ных относительно кривых и [см., например, изохроны S (“îw ) на Рис‘ 7-43]. Эти изохроны имеют «углы» на кри¬ вых и Ï4-- Последнее означает, что каждая из минимальных изохрон S (Z*), 0 < /* < -^-дифференцируема везде, за исключением точек сопря¬ жения дуг, принадлежащих кривым и ïl- В этсьм отношении изохроны S (/*), 0 < /* < — «похожи» на изохроны системы с двойным интегриро¬ ванием (см. рис. 7.7). 2. Минимальные изохроны S * = 1, 2, 3,. . . представляют собой окружности с центром в начале координат радиуса 2Л Очевидно, что окружности дифференцируемы везде и не имеют углов. 3. Минимальные изохроны S (/*), /* > =^= і = 1, 2,. . . состоят из дуг четырех окружностей. Как видно из рис. 7.43 (изохроны S S S (ï)’ ЭТИ ИЗОХРОНЫ дифференцируемы везде. Иначе говоря, все минимальные изохроны S (/*), /* > — не имеют «углов» ни на линиях переключения, ни где-либо еще х. В этом смысле изохроны при /* отличны от изохрон при t << а следовательно, отличны и от изохрон систем с действительными значениями. 4. Центры всех окружностей, дуги которых образуют изохроны, лежат на окружностях Г+ и Г_ (см. рис. 7.37). Следовательно, при «боль¬ ших» значениях /* изохроны «стремятся» к «чистым» окружностям. Это свойство позволяет проектировать хорошие системы, близкие к опти¬ мальным (см. примеры 7.5 и 7.6). Обратим теперь наше внимание на задачу об управлении, близком к оптимальному, которая, по сути дела, состоит в том, чтобы заменить сложную нелинейность Af, показанную на рис. 7.42, нелинейностью, которая реализуется более просто. Поскольку связи между входом и выхо¬ дом нелинейности N (см. рис. 7.42) идентичны линии переключения, задачу о субоптимальном управлении можно рассматривать как задачу об аппроксимации линии переключения. Рассмотрим два примера, иллю¬ стрирующих такую аппроксимацию. Пример 7.5. Напомним, что линия переключения у была определена как Y = Г Û yd U [ Û уі]. (7.329) L/=o U L/=o J Рассмотрим кривую ~ (y+U Y-> |“*i|sS2; (7.330) I cûx2 = 0, I (ùjq I > 2. (7.331) Кривая у показана на рис. 7.46. Кривые и у^_, / = 1, 2, . . .в этом случае заменены осью û)xx. Управление и — —1 используется для любого состояния выше, а и — +1 — ниже кривой у. Типичные траектории, производимые таким субоптимальным управлением, показаны штриховыми линиями на рис. 7.46. Очевидно, что этот субоптимальный закон управления переводит любое исходное состояние в начало координат; иначе говоря, закон управления устойчив. 1 Это, естественно, означает, что для каждой точки S (/*), Z* > можно определить единственную опорную прямую. 517
Практическая реализация этого субоптимального закона идентична системе, по¬ казанной на рис. 7.42, с той лишь разницей, что нелинейность N (см. рис. 7.42) заменена нелинейностью N (рис. 7.47). Нелинейность N реализуется намного проще, чем нелиней¬ ность N. Для того чтобы решить, на- сколько целесообразна такая субопти- Рис. 7.46. Линия переключения у для субопти¬ мальной системы из примера 7.5. Управление и = — 1 выше и и = +1 ниже линии переклю¬ чения. Пунктирными кривыми показаны траек¬ тории, получающиеся при субоптимальном зако¬ не управления мальная система, нужно вычертить минимальные изохроны, соответству¬ ющие кривой у, и сравнить их с мини¬ мальными изохронами рис. 7.43. Раз¬ личие между временами / и /* пока¬ зано на рис. 7.48. На этом рисунке показано относительное увеличение времени перехода из состояний, рас¬ положенных на оси со^!. Очевидно, что время перехода в обоих случаях одинаково для состояний | (их1 | 2, I <*>хі I — 4, I ах! | = 6. . ., потому что для них значения кривой у тождест¬ венны значениям кривой у. Из рис. 7.48 видно также, что максимальное относительное увеличение времени не превышает 4,3%, а для точек, доста¬ точно удаленных от начала коорди¬ нат, время t стремится к /*. Послед¬ нее следует из того обстоятельства, что минимальные и субоптимальные изохроны с удалением исходного состояния (от начала координат) стремятся к одним и тем же окружностям. Для многих практических систем увеличение времени переход¬ ного процесса на 4,3% вполне приемлемо, и поэтому такое субоптимальное устройство часто оказывается весьма полезным. Пример 7.6. Предположим, что мы аппроксимируем линию переключения у кривой у: (Y+ U Y— ПРИ I œxj I 1; (ùx2 == — 1 при (ùa'i > 1; cùx2 = 4- 1 при сох1< —1 (7.332) ft(t) Рис. 7.47. Характеристика нелинейности N, необходимая для построения субоптимальной системы из примера 7.5 Кривая у показана на рис. 7.49. Суб¬ оптимальный закон управления для нее формулируется следующим образом: Управление и = —1 используется для всех состояний выше, а и = +1 — ниже кривой у. Типичные траектории, соответствующие такому субоптимальному закону управ¬ ления, показаны штриховыми линиями на рис. 7.49. Этот закон управления также перево¬ дит любое исходное состояние в на¬ чало координат, и поэтому закон управления устойчив. Реализация такого закона идентична реализации оптималь¬ ного закона управления, показан¬ ного на рис. 7.42, с той лишь разницей, что нелинейность N за¬ менена нелинейностью W, изобра¬ женной на рис. 7.50. Нелинейность N реализовать еще легче, чем нели¬ нейность N. Однако в общем случае время переходного процесса будет больше, чем с нелинейностью N. Следующие четыре упражнения связаны с субоптимальным и опти¬ мальным управлением гармоническим осциллятором. 518
Упражнение 7.37. Пусть t — время, требующееся для перевода произвольного исход¬ ного состояния на оси coxj при помощи субоптимальной системы с нелинейностью N. Нари¬ суйте график-^-. 100% в зависимости от | (ùxa |, аналогичный рис. 7.48. Покажите, что мак¬ симальное значение -^--100% больше, чем -^-.100% Упражнение 7.38. Покажите, что в случае, когда вся линия переключения у аппрокси¬ мируется осью (ûx1 (субоптимальный закон управления есть и = —sign {сох2}),4произ¬ вольное исходное состояние может быть переведено не в начало координат, а только в зам¬ кнутый сегмент | | 1, (ох2 = 0. Упражнение 7.39. Покажите, что закон управления и = —sign {сох2+ sign {œx1}} даст предельный цикл, проходящий через точки (0, 1) и (0, —1). Упражнение 7.40. Дан гар¬ монический осциллятор с переда¬ точной функцией G (S) = ■ • Рис. 7.49. Линия переключения у для субоптималь¬ ной системы из примера 7.6. Управление и = —1 выше у и и = Ч~1 ниже нее. Пунктиром показаны траектории, соответствующие этому субоптималь¬ ному закону управления Пусть и (/), I и (/) I 1 — уп¬ равление на входе объекта, а Рис. 7.50. Характеристика нелиней¬ ности N, требующаяся для получе¬ ния субоптимальной линии пере¬ ключения у у (t) — его гыход с произвольными начальными условиями у (0) и у (0). На вход систе¬ мы подается ступенчатый сигнал г (/) = г, постоянный при /^0 и ограниченный соот¬ ношением I г I 1. Определите си нал ошибки е (t) — г (Z) — у (/) и получите оптималь¬ ное управление как функцию от е (t) и е (t) такое, чтобы ошибка е (/) и ее скорость е (t) обращались в нуль за минимальное время В следующих трех упражнениях рассматривается задача об оптималь¬ ном по быстродействию управлении гармоническим осциллятором, когда конечное состояние (Ѳ ь Ѳ 2) не обязательно является началом координат. Упражнение 7.41. Рассмотрите систему (7.301) с ограничением управления (7.302). Пусть (Ѳх, Ѳ2) — произвольное конечное состояние и (£х, £2) — произвольное начальное состояние. Покажите, что оптимальное по быстродействию управление, переводящее систему (7.301) из любого начального (^, £2) в любое конечное состояние (Ѳ1Э Ѳ2) существует. Упражнение 7.42. Рассмотрите систему (7.301) при œ = 1, с ограничением управле¬ ния (7.302). Предположите, что желаемым конечным состоянием является (1, 1). Найдите оптимальное управление с обратной связью, переводящее систему из произвольного началь¬ ного состояния в состояние (1, 1). Постройте линии переключения. Рассмотрите единствен¬ ность экстремальных управлений. Указание: см. упражнение 7.15. Нарисуйте неко¬ торые минимальные изохроны и исследуйте непрерывность поверхности минимальных времен. Указание: см. упражнение 7.16. Упражнение 7.43. Повторите упражнение 7.42 для состояния (1, —1). Последние три упражнения относятся к случаю, когда S является некоторой областью пространства состояний. Упражнение 7.44. Рассмотрите систему (7.301) при ш = 1 и ограничении управле¬ ния (7.302). Рассмотрите замкнутое, невыпуклое множество S, определяемое соотношением S = Кхі» хг) : хі ~ Ь х2 = 0 или = — 1, х2 = 0} 519
[т. е. область S состоит из двух изолированных точек (1, 0) и (—1, 0). Покажите, что опти¬ мальное управление к S существует для любого исходного состояния. Единственно ли оно? Единственны ли экстремальные управления? Найдите оптимальный закон управления. Нарисуйте минимальные изохроны. Указание: см. упражнение 7.17. Упражнение 7.45. Рассмотрите систему (7.301) при со = 1 с ограничением управле¬ ния (7.302). Областью цели S является область S = х2) : 4-х| (0,5)2]. Покажите, что оптимальным законом управления является закон, показанный на рис. 7.51. Указание: см. [179] и сравните с упражнением 7.19. Покажите, что линия переключения не состоит из оптимальных траекторий. лючения у. Пунктиром показаны оптимальные по быстро¬ действию траектории к области цели S Упражнение 7.46. Повторите упражнение 7.45 для следующих областей: si = {(хѵ хі) : хі +х2 = (Ьб)2}; s2 = ((хр Х2) : + х2 = 22). Найдите оптимальный по быстродействию закон управления для состояний внутри и вне окружностей. 7.8. УПРАВЛЕНИЕ УСТОЙЧИВЫМ ГАРМОНИЧЕСКИМ ОСЦИЛЛЯТОРОМ С ДЕМПФИРОВАНИЕМ1 В предыдущем параграфе мы рассмотрели физические системы, кото¬ рые описывались уравнениями типа гармонического осциллятора. Мы пола¬ гали, что в системах, рассмотренных в примерах 7.3 и 7.4, трение отсут¬ ствовало. Если в тех же системах имеется вязкое трение, то их называют гармоническими осцилляторами с демпфированием. Кратко рассмотрим оптимальное по быстродействию управление такими системами. Исследуем систему второго порядка, описываемую дифференциальным уравнением + 2а -М- + (а2 + œ2) у (() = Ки (7.333) где у (t) — выход; и (0 — управление с обычным ограничением: I и (t) I < 1 для t 0; (7.334) 1 См. работы (39], [42] и [122]. 520
К — положительный коэффициент усиления; а и со — постоянные, причем а > 0; со > 0. (7.335) В теории регулирования система (7.333) описывается передаточной функцией = G (s) = ——А—-г. (7.336) и (s) v (s + a)2 4- со2 ' 7 Искушенный читатель знает, что полюса G (s) являются комплексно сопряженными числами s = — а ± /со. (7.337) На рис. 7.52 показано изображение G (s) на плоскости s. Постоянную со иногда называют собственной частотой, а постоянную а — коэффициентом демпфирования. Обозначим через уЛѴ-УѴУ УЛ^-У^ (7.338) фазовые координаты системы. Эти координаты удовлетво¬ ряют векторному дифференциальному уравнению Рис. 7.52. Рас¬ положение на плоскости s полюсов устой¬ чивого гармони¬ ческого осцил¬ лятора с демп¬ фированием 4(0 0 1 .«/г(0. — (a2 со2) — 2a 0 Удобно ввести новую пару координат (/) и х2 (/), применив соот¬ ветствующее линейное преобразование, а именно: xi (0 — 1 со 0 >і(0' (0. a 1 .й (0. (7.340) Эти новые переменные удовлетворяют векторному дифференциаль¬ ному уравнению 4(0 4(0 a со X1 (t) + 0 ' со — a л2(0. u (0_ (7.341) Упражнение 7.47. Проверьте уравнение (7.341). Упражнение 7.48. Покажите, что если вращающееся тело из примера 7.4 подвержено трению, то дифференциальные уравнения относительно скоростей имеют вид (7.341). Отметим, что если в уравнении (7.341) положить a = 0, то получится дифференциальное уравнение гармонического осциллятора без демпфи¬ рования. Матрицу системы (7.341) можно представить в виде суммы диагональной и косо-симметричной матриц: — a со — со a (7.342) Диагональная матрица соответствует действительным частям полюсов или собственных значений, а косо-симметричная — мнимым частям полю¬ сов или собственных значений. 521
Сформулируем теперь задачу об оптимальном по быстродействию управлении гармоническим осциллятором с демпфированием. Задача 7.8. Для системы (7.341) найти управление и (/), удовлетво¬ ряющее ограничению \ и (/)| < 1 и переводящее произвольное исходное состояние (£ь g2) в начало координат (0, 0) за минимальное время. Будем решать эту задачу методами § 7.7, и поэтому не будем излагать деталей решения. Гамильтониан Н имеет вид 11 = \ — ах± (/) рг (t) 4- сох2 (/) pt (/) — — (/) р2 (0 — ах2 (/) р2 (/) + u(t)p2(t). (7.343) Управление, абсолютно минимизирующее гамильтониан, имеет вид и(0= - Sign {p2(t)}. (7.344) Дополнительные переменные рг (/) и р2 (t) удовлетворяют вектор¬ ному дифференциальному уравнению Р1 (0 а со Рі (0 4(0. — со а Р-2 (0. (7.345) Фундаментальная матрица системы (7.345) равна Пусть W) cos <ùt sin со/’ — sin со/ cos со/ cos со/ sin со/ — sin со/ cos со/ (7.346) (7.347) = еа/ Очевидно, что М (/) — ортогональная матрица Г Поскольку допол¬ нительный вектор р (t) выражается как р (0 = eatM (0 л, л = р (0); (7.348) IIP (011 = ^ НИ, (7.349) то это означает, что вектор р (/) движется по спирали, раскручивающейся от начала координат плоскости рхр2. Интересующая нас функция р2 (/) выражается соотношением р2 (0 = eat (hj cos со/ -г- л2 sin со/). (7.350) Поскольку а >> 0, функция р2 (/) есть произведение возрастающей экспоненты на синусоиду. На рис. 7.53 показан типичный вид функ¬ ции р2 (/) и управления и (/), определяемого соотношением (7.344) как функция от р2 (/). Отметим следующие свойства управления и (t): 1) u(t) должно быть кусочно-постоянно и переключаться между значениями и = +1 и и = —1; 2) и (/) не может оставаться постоянным дольше, чем — сек; 3) не должно существовать верхней границы числа переключений; 4) исключено существование вырожденного управления. Заметим, что эти необходимые условия оптимального управления аналогичны условиям § 7.7. 1 См. уравнения (2.109)—(2.111). 522
Перейдем к решению уравнения (7.341) для управления и-Д = ± 1. (7.351) Если принять, что £х = хх (0); В2 = х2 (0), (7.352) то после громоздких алгебраических преобразований можно получить х(Z) = cos<oZ -f- l2e-2al x (Ù1V/ CO 1 (0 X sin <o/ — A K a2 e~at sin (<o/ + гр) 4- A; (7.353) -M-2 + a2- x2 (0 = - &~at sin <*t + Ье-аІ X x cosw/ — A M e~al cos(a>/ 4- гр) 4- A (7.354) где ф = arc tg . (7.355) Заметим, что Птх,(()-Л; 1ітх,т.-Д^. (7 356) оо Уравнениям (7.353)—(7.355) соответствуют логарифмические спирали, et2 4- м2 v X (О Рис. 7.53. Типичный вид р2 (/) и управления, соответст¬ вующего уравнению (7.344) К сожалению, из-за трансцендентности уравнений (7.353) и (7.354) исклю¬ чить из них время и получить фазовые траектории невозможно. Сформулируем определение. Определение 7.28. Обозначим через у°_ множество состояний, которые можно перевести в начало координат управлением и = Д = +1 не дольше, чем за сек, а через у2_ — состояния, переводимые в начало координат за то же время управлением и = —1. Очевидно, что эти кривые у^_ и у2_ образуют путь в начало координат, удовлетворяющий необходимым усло¬ виям оптимальности. Вид кривых у0_ и у2_ показан на рис. 7.54. С помощью аргументов, аналогичных приведенным в § 7.7, можно показать (методОлМ исключения), что у0_ и у2_ являются оптимальными траекториями, ведущими в начало координат. Приемом, аналогичным использовавшемуся в § 7.7, построим после¬ довательность кривых у^_ и уі_, / = 1, 2,. . . Определим кривую у1_ как 523
множество всех точек, которые могут быть переведены в точки кривой у°_ ровно за сек управлением и — —1. Точно так же определим кри¬ вую у*_ как множество всех точек, переводимых в точки кривой у2_ ровно за — сек управлением и = + 1. Итак, имеем следующие определения. Определение 7.29. Кривые yÿ, j = 1, 2,. . . есть множества точек, которые можно перевести управлением и = —1 в точки кривых у^-1 ‘ллятора с демпфированием. Оптимальным является управление и* ~—1 для состояния выше линии переключения и и* —+1 — ниже нее ровно за сек. Кривые у^_, j = 1, 2,. . . есть множества точек, перево¬ димых управлением и = +1 в точки кривых у'у1 ровно за сек. Кривые у^_ и у£ показаны на рис. 7.54. Определение 7.30. Линия переключения у есть объединение кри¬ вых у^_ и у£: У = ( Ü Vi! U ! Ü VlL (7.357) (/=о Л (/-о J Закон управления 7.8 (решение задачи 7.8). Оптимальное по быстро- „ / со2 + a2 Û)2 + а2 \ действию управление как функция состояния ( хь х2 \ определяется по следующим правилам: г-. / о2 + а2 о2 4- а2 \ * 1 Если ( — х2 ) выше линии у, то и* = —1. / со2 + а2 со2 + а2 \ * I 1 Если ( —— Хі, ! х2 ] ниже линии у, то и* = +1. \ Û) (О ‘ Т-. / со2 + а2 со2 + а2 \ л п * » 1 Если ( —— хп х2 ] Q уо то и* — 1 • \ Cù n (Ù / + с / со2 + а2 о2 + а2 \ г л ™ * 1 Если ( î xt, 1 х2 ) Ç- у0 , то г = —1. \ co 1 œ - • — Сравним рис. 7.54 с рис. 7.40 и исследуем роль постоянной а. Из рис. 7.54 нетрудно видеть, что при а —-> 0 угол Ѳ 0, и кривая у рис. 7.54 превращается в кривую у, идентичную рис. 7.40. При а >> 0 размер у<_ и уў растет с ростом номера /. Это является естественным следствием уве¬ личения размера спиральных траекторий, который определяется чле- —at ном е 524
Упражнение 7.49. Аппроксимируйте кривую у и получите субоптимальное управ¬ ление. Указание: просмотрите еще раз примеры 7.5 и 7.6. Возьмите значения со — 5 и а = 1 и постройте точную кривую у и ее аппроксимации, которые вы предлагаете. Опреде¬ лите, насколько хороша каждая из аппроксимаций, построив для этого графики отношения прироста времени перехода в (0; 0) к его минимально возможному значению. Упражнение 7.50. Рассмотрите систему, которая описывается дифференциальным уравнением (/) а со _х2 (/) J L” « а 0 ъ (О ч (0. (7.358) . « (0 для а > 0, со > 0. Эта система представляет собой неустойчивый гармонический осцилля¬ тор, поскольку собственные значения матрицы системы равны а + /со и а — /со. Прежде всего найдите область начальных состояний, для которых возможно достичь начала коорди¬ нат (так как система сама по себе неустойчива, то существуют такие исходные состояния, когда ограниченное управление «недостаточно» для перевода их в начало координат). Для найденной области управляемых состояний найдите линию переключения и оптимальный по быстродействию закон управления. Указание: кривые у/|_ и для этой системы уменьшаются с ростом номера /; см. также [42]. 7.9. УПРАВЛЕНИЕ ГАРМОНИЧЕСКИМ ОСЦИЛЛЯТОРОМ ПРИ ПОМОЩИ ДВУХ ВХОДНЫХ ПЕРЕМЕННЫХ1 В предыдущих параграфах настоящей главы мы рассматривали задачи об оптимальном управлении динамическими системами, когда управление осуществлялось единственной переменной и (/), удовлетворяющей огра¬ ничению I и (/) I < 1. В этом параграфе мы рассмотрим задачу об оптималь- ном управлении динамической си¬ стемой с двумя управляющими переменными ur(t) и и2 (О» ко¬ торые удовлетворяют ограниче¬ ниям I их (Z) I < 1 и I и2 (t) I < 1. Мы постараемся на примере этой простой системы показать чита¬ телю, что способы, развитые для случая единственной управляю¬ щей переменной, нетрудно рас¬ пространить и на случай несколь¬ ких управляющих переменных. Хотя законы управления и ока¬ зываются сложнее, однако основ¬ ные понятия не представляют каких-либо принципиальных труд¬ Рис. 7.55. Космическое тело с одной осью симметрии ностей. Система, которую мы рассмотрим в настоящем параграфе, представ¬ ляет собой вращающийся космический летательный аппарат, описанный в примере 7.4. Для полноты изложения мы еще раз составим дифферен¬ циальные уравнения его движения. Рассмотрим тело в пространстве с единственной осью симметрии 2, показанное на рис. 7.55. Выберем три основные оси тела /, 2 и 3 и обозна¬ чим через (t), X2 (t) и х3 (t) угловые скорости (в радісек) относительно этих трех осей соответственно. Пусть /ь /2 и — моменты инерции относительно тех же осей. Известно 3, что при отсутствии внешних момен¬ 1 См. работы [5], [9] и [179]. 2 Существует много спутников и возвращаемых космических кораблей нецилиндри¬ ческой формы с единственной осью симметрии, например, капсулы Меркурий, Джеминай и Аполлон, а также другие проекты космических станций. 3 См. работу [85], гл. 5. 525
тов дифференциальные уравнения для угловых скоростей (Z), *2 (О и х3 (/) имеют вид 4*і(0 = (4-4)*2(0*з(0; 4*2 (О — (4 11) *3 Х1 (О» 4*з (О = (А — 4) *і ( О х2 (О- (7.359) Обычно они называются уравнениями движения Эйлера. Если на тело действуют внешние моменты, то дифференциальные уравнения движения принимают вид 4*і(0 = (4 — 4) *2 (0*з (0 + *і(0; 4*2 (0 - (4 - 4) *3 (0 *1 (0 + *2 (0; 4*з (0 = (Л — 4) *і (0 *2 (0 + *з ( О, (7.360) где тх (/), т2 (/) и т3 (і) — моменты относительно осей /, 2 и 3 соответ¬ ственно, которые представляют собой компоненты вектора момента Г*1(01 т(0= *2(0 (7.361) T3(0J Рассмотрим тело, показанное на рис. 7.55. Поскольку ось 3 есть ось симметрии, моменты инерции Iх и /2 равны, т. е. 4-4-/. (7.362) Пусть теперь J ъ J2 и J 3 — три реактивных двигателя, укрепленных на космическом аппарате так, как это показано на рис. 7.55. Очевидно, что двигатель J3 создает момент т3 (/) только около одной оси 3; J2 — мо¬ мент т2 (/) около оси 2 и J! — момент (/) — относительно оси /. Пред¬ положим, что двигатели жестко прикреплены к аппарату и могут разви¬ вать тягу в обоих направлениях. Пусть с — расстояние между плоскостью, проходящей через дви¬ гатели Jt и Jи плоскостью, в которой расположены оси 1 и 2, а с3 — расстояние двигателя J 3 от оси 3 (для цилиндра с равно половине его высоты, а с3 — его радиусу). Если (t), f2 (0 и f3 (t) — тяги, развиваемые двигателями 4, А и 4 то Ь(0 = с/1(0; т2(^) = с/2(0: T3(0 = c3f3(0. (7.363) Воспользовавшись уравнениями (7.363) и (7.362), приводим уравне¬ ния движения (7.360) к виду À(0 = ±7/ix3(0x2(0 + -T-f1(0; (7-364) ^(/) = -^^з(0^і(0 + -^/2(0; (7-365) '3 (7.366) Исследуем эти уравнения. Предположим, что в момент времени t = 0 три скорости были равны: *1(0) = ^; x2(0) = U х3(0) = £3. (7.367) 526
Очевидно, что если тяга /3 (Z) известна, то уравнение (7.366) можно проинтегрировать и получить: t х3(0 = Ёэ + (7.368) О Таким образом, скоростью х3 (т) можно управлять независимо от ско¬ ростей xL (t) и х2 (t), и поэтому х3 (Z) можно рассматривать как известную функцию времени. Из-за того, что величина х3 (/) фигурирует в выраже¬ ниях (7.364) и (7.365), скорость х3 (t) влияет на скорости1* х± (/) и х2(/) • Рассмотрим задачу об оптимальном управлении скоростью, вытека¬ ющую из некоторых физических соображений. Предположим, что рас¬ сматриваемый аппарат является возвращаемой капсулой и что постоянное его вращение вокруг оси симметрии требуется с точки зрения устойчи¬ вости. Предположим, что скорость х3 (t) установлена равной желаемой величине (например, £3) при помощи одного только двигателя J3. Если капсула вращалась также осносительно осей 1 и 2, то при х3 = £3 скорости (О и х2 (/) не будут равны нулю. Поэтому желательно сделать скорости %і (/) и х2 (Û равными нулю за минимальное время, поддерживая при этом неизменной скорость х3 (Z) = g3. Другим примером является оби¬ таемая космическая станция с искусственной гравитацией, получаемой путем вращения станции с постоянной скоростью вокруг оси симметрии. Здесь также может потребоваться уменьшить до нуля угловые скоро¬ сти х± (t) и х2 (0 за минимальное время 2 * *. В обоих случаях требуется поддерживать скорость х3 (0 неизменной, a х1 (/) и х2 (t) уменьшать до нуля. Если принять в уравнениях (7.366) и (7.367) /з(0 = 0, (7.369) то будем иметь х3(/) = L = const. (7.370) Считаем, что тяги /х (/) и f2 (t) двигателей Jх и J2 ограничены по величине: ІМОКЛ І/2(0КЛ (7.371) т. е. двигатели J Y и J 2 одинаковы. Примем / — /з t со — / Із, (7.372) k=^-F-, (7.373) (7.374) (7.375) Подставив эти величины в уравнения (7.364) и (7.365), получим х± (t) = ох2 (/) + kUi (0; ! Х2(0= — СОХі(0+^и2(0- I (7 ’) Это происходит благодаря хорошо известному гироскопическому эффекту. 2 Это необходимо для того, чтобы исключить эффекты, вызываемые изменениями гравитации. Если эти изменения значительны, они могут отрицательно сказаться на людях и оборудовании. 527
В этой системе уравнений угловые скорости (/) и х2 (t) можно считать переменными состояния (фазовыми координатами) системы, а величины иг (/) и и2 (/) — управляющими переменными, которые ввиду уравнений (7.371), (7.374) и (7.375) удовлетворяют ограничениям І^і (01 < h’ |«2 (01 < 1 Для любого t. (7.377) Теперь сформулируем физический смысл задачи управления: необ¬ ходимо найти тяги (/) и f2 (/), уменьшающие скорости (/) и х2 (0 до нуля за минимальное время. Эта постановка эквивалентна математи¬ ческой задаче 7.9. Задача 7.9. Дана система, которая описывается дифференциальным уравнением: где ’■МО' 0 со Л (ІУ 1 А Ч (О' _л-2(0_ — со 0 Л-2 (/). Т к .«2 (0. (7.378) (7.379) Найти управления (/) и и2 (t), которые переводят любое началь¬ ное состояние х,(0) =Іі; х2(0) = |2 (7.380) в начало координат (0, 0) за минимальное время. Сравнивая уравнение (7.378) с (7.301), легко заметить, что матрица систем одна и та же. Поэтому систему (7.378) можно рассматривать как недемпфированный гармонический осциллятор. Используем принцип минимума для определения необходимых усло¬ вий, которым должно удовлетворять оптимальное управление. Гамильто¬ ниан задачи об оптимальном по быстродействию управлении для си¬ стемы (7.378) выражается уравнением /7=1-4- сох2(/)р1(/)-сох1(/)р2(/)4- + ^і(/)РіЮ + ^2(0Р2(0, (7.381) где дополнительные переменные рг (/) и р2 (t) являются решениями дифференциальных уравнений = = “л№ = -j^-= (7.382) которые могут быть записаны в виде рі(0 0 со~ >1(0' _р2(0. — со 0 _р2 (0_ (7.383) Замечаем, что уравнение (7.383) тождественно уравнению (7.306), и поэтому фундаментальная матрица Фі (0 системы (7.383) определяется уравнением (7.296), откуда pr (t) = лг cos со/ + л2 sin (7.384) р2 (/) = — Лі sin со/ + л2 cos со/, (7.385) где Лі = Рі(0); л2-р2(0). (7.386) 528
Управления иА (t) и и2 (t), абсолютно минимизирующие гамильто¬ ниан //, для положительного k выражаются соотношениями МО — sign {Pt (/)}; (7.387) «2 (0 = — sign {р2 (/)}. (7.388) Из последних уравнений следует, что функции pr (t) и р2 (0 являются синусоидами частоты со, и, кроме того, функция р2 (t) с точностью до про¬ извольной постоянной равна производной по времени от p1 (t). Это поло¬ жение можно сформулировать следующим образом: «синусоида р2 (t) на 90° опережает по фазе синусоиду (/)». На рис. 7.56 показаны две такие синусоиды рг (t) и р2 (Z) и управления (/) и и2 (Z), найденные и, / \ / іГ/2и X ïï/ü 3ïï/2ü \ 1 / 1 " \ t \ \ (--) (-+) (++) (+-) (--) (-+) (++) р2}и2 /7 \ \ 7Г/2о 'Зтг/2и 2я/и \ и \ \ ' t 1 pAt) Рис. 7.56. Две синусоиды рг (t) и р2 (/) и два кусочно¬ постоянных управления uv (t) — — sign (/)} и и2 (/) = = —sign {р2 (/)} по уравнениям (7.387) и (7.388). При внимательном рассмотрении рис. 7.56 обнаруживаются следующие обстоятельства, вытекающие из необходимых условий принципа минимума: 1. Каждое из управлений иг (/) и и2 (/) является кусочно-постоянной функцией времени, переключающейся между значениями +1 и —1. Верхней границы числа переключений не существует. 2. Поскольку синусоиды изменяют свою полярность через сек, то каждое из управлений может оставаться постоянным не дольше, чем л сек. Û) 3. Интервал времени, в течение которого остаются неизменными обе управляющие переменные (t) и и2 (/), не превышает сек. 4. Если управление (/) постоянно на интервале tx < t < /2, где t2 — tr — , то управление и2 (/) должно переключаться точно при /3 = + -і- (/2 — /х) и наоборот. 5. Как видно из рис. 7.56, последовательность полярностей управле¬ ний должна быть ( ), (- +), (++), (+-), ( ), (-+)(++)(+-), (7.389) 529
где символ ( ) означает, что на конечном интервале времени имеет место = —1, и2 = —1, а символ ( h) означает, что = —1, и2 = = +L и т. д. Последовательность (7.389) означает также, что полярность управлений в данный момент времени определяет их полярности в после¬ дующий момент времени. Например, если в данный момент времени оба управления положительны (4—h), то следующим должно переключиться с +1 на —1 управление и2, и получится (4 ). Комбинации ( ) или ( Н) непосредственно после (4- 4-) исключаются. Как мы увидим, эта информация позволяет найти оптималь- (ЪДл^) ный п0 быстродействию закон управления методом исключения, хорошо знакомым по / предыдущим параграфам. I 6. Вырожденного управления не суще- / \ ствует (почему?). I \ Следующий шаг состоит в решении си- стемы уравнений (7.378) для постоянных I управлений “•«)-л.-±і; Р-390) Рис. 7.57. Угол Ѳ определяет И2 (й Д2 -1- (7.391) время перехода, поскольку Ѳ = Решение, выраженное через начальные условия хг (0) = х2 (0) = g 2, имеет вид œxi (/) = (cù^i — &Д2) cos со/ +- (со£2 4- бДД sin со/ 4- М2; | сох2 (/) = — (со^ — &Д2) sin со/ 4- (cog2 4- &Дг) cos со/ — J (7.392) Возведя в квадрат и сложив, получим соотношение [сохх (/) - 6Д2]2 + [сох2 (/) 4- £Д 1 ]2 = = (со^ - &Д2)2 4- (û)g2 4- бДі)2. (7.393) Это соотношение означает, что оптимальные траектории представляют собой окружности на плоскости сох 1“Сох2 с центрами в точках (&Д2, —причем радиус окружностей зависит от начальных условий. Движение всегда направлено по часовой стрелке. Время /, требующееся для перехода из начального состояния (со£р со£2) в состояние (сохь сох2) вдоль окружности с центром в точке (6Д2, —MJ, равно / = 1 ягг|ст (œxx — /?Д2) (cog2 4- feAQ — (сох2 4- feAJ (cogi — feÂ2) ( ~q4 œ ® (œx2 4-/гДх) (œg2 4/?Дг) + (coXi —/?Д2) (cogi — ^A2) ’ ' ' T. e. время перехода / можно найти, измерив угол Ѳ на рис. 7.57. Итак, / = ±. (7.395) Далее будем, как и в § 7.7, рассматривать плоскость сох1-сох2. Определение 7.31. Обозначим через Г++ множество состояний (cdXj, сох2), которые можно перевести в начало координат (0, 0) управ¬ лениями «1 = 4’1и^2 = 4-1, а через Г+_ — множество состояний, пере¬ водимых в (0, 0) управлениями иг = 4-1 и и2 = —1. Через Г_+ обозна¬ чим множество состояний, которые можно перевести в (0, 0) управлениями иг = —1 ии2 = 4-1, а через Г — множество состояний, переводимых в (0, 0) управлениями иг = —1 и и2 = —1. Множества Г+ + , Г+_, Г_+ и Г представляют собой окружности, проходящие через начало коор¬ 530
динат с центрами, расположенными в точках (&, —&), (—k, —&). (é, &) и (—k, k) соответственно: г++ = {(соХі, cùx2) : (œXi — k)2 H- (cox2 + k)2 = 2k2}\ (7.396) Г+_ = {((ùXi, cox2) : (cûXj -h k)2 + (cox2 4- k)2 = 2k2}\ (7.397) Г_+ = {(û)xx, cox2) : (coxx — k)2 + (œx2 — k)2 = 2£2}; (7.398) Г__ = {(œxx, œx2) : (œxx 4- k}2 + (cox2 — k)2 = 2k2}. (7.399) Г++, Г+_, Г_+ и Г__, проходящие через начало координат (k= 1) Четыре окружности Г++, Г+_, Г_+ и Г для k = 1 показаны на рис. 7.58. Следующий шаг состоит в отыскании участков этих окружностей, которые производятся управлениями, удовлетворяющими всем необхо¬ димым условиям принципа минимума. Рассмотрим точки А и В на окружности Г++, отмеченные на рис. 7.58. Обе точки можно перевести в начало координат управлениями иг = 4-1 и и2 = —1. Время, требующееся для перевода в начало коор¬ динат точки Д, превышает сек (см. рис. 7.57, где изображена связь угла Ѳ со временем). Для перевода в О точки В требуется менее сек. Так как одно из управлений должно переключаться не л менее одного раза в течение сек, тра¬ ектория АО не может быть оптимальной по быстродействию. Эти рассуждения приводят нас к следующему определению. Определение 7.32. Обозначим через множество состояний (сохх, cùx2), которые можно перевести в начало координат (0, 0) не более чем за сек управлениями = 4-1, и2 = 4-1; через — управлениями = 4-1, и2 — —1; через — управлениями = —1, и2 = 4-1 и через у2 — управлениями = —1, и2 = —1. Множества и у2 представляют собой четверти окружностей Г++, Г+_, Г_+ и Г соответственно: = {(соХр cûx2) : — kÿ 4- (wx2 4- &)2 = 2é2, (7.400) сохх < 0, —2k < cox2 < 0}; = {(®Xp œx2) : (<0Xj kÿ + (ou2 4- kÿ = 2k2, (7.401) —2k < coxx < 0, cox2 0} ; = {(œXp cdx2) : (coXj — kÿ 4- (co*2 — &)2 = 2£2, 0 < (oxx < 2k, cox2 < 0}; (7.402) y0 = {(<ûXp œx2) : (cûXj 4~ kÿ 4~ (û)X2 — kÿ = 2k2, 0 < coXp 0 < cox2 < 2k]. (7.403) Четверти окружностей и Y? Для k = 1 показаны на рис. 7.59. 531
Закон управления 7.9а. Для состояний (œx1; их2) Ç U V'^_U U Y—+ U y2 оптимальными по быстродействию управлениями являются и* = +1, и* = +1 для (сохр wx2) Q у0! ; «1* = +1. U* = —1 для (шх., cox,) Ç- у® ; * 1 * ,1 ч г п Г (7.404) и* = — 1, и* = +1 для (сохр сох2) £ у2_+; и* = —1, и* = —1 для (сохр сох2) £ у® . Упражнение 7.51. Докажите справедливость закона управления 7.9а. Указание: возьмите точку (например, на у^_+) и покажите, что из всех управлений, удовлетворяющих всем необходимым условиям, только управления = +1 и — 4-1 переводят это состоя- и уі_4- (и = 1) и четыре области/?++, /?+_, R__ nR ние в начало координат и поэтому они должны быть оптимальными по быстродействию. Аналогичным об¬ разом проводилось доказательство закона управления 7.7а. Так как кривая яв¬ ляется оптимальной траек¬ торией движения в начало координат, то должны суще¬ ствовать состояния, для ко¬ торых часть кривой яв¬ ляется частью оптимальной траектории движения к на¬ чалу координат. Поскольку полярности управлений для кривой у°++ равны (Ч—h), управления, которые перево¬ дят исходные состояния в точки кривой Ѵ°|_ + , должны иметь полярности ( Н), т. е. и± = —1, и2 = + 1. Таким образом, можно найти множество состояний, переводимых в точки кривой управлениями иг = —1, и2 = +1 за время, меньшее или равное секх\ В частности, можно найти множество состояний которые могут быть переведены в точки кривой управлениями = — —1, и2 = +1 точно за сек. Эти соображения приводят к следу¬ ющему определению. Определение 7.33. Обозначим: через множество состояний, переводимых в точки кривой точно за сек управлениями иг = —1, и2 = +1. через у* множество состояний, переводимых в точки кривой JT il точно за — сек управлениями = —1, и2 = —1; П Аналогичным образом были определены множества и (см. определения 7.20 и 7.21). 532
через у^_ множество состояний, переводимых в точки кривой у2 точно за сек управлениями = +1, и2 = —1; через множество состояний, переводимых в точки кривой у® точно за сек управлениями иг = +1, и2 = +1. Эти кривые получены путем поворота на 90° против часовой стрелки кривых у°_ Т? > V+- вокруг центров: кривая у]_+ поворотом у°_ + вокруг (£, k); кривая у]__ поворотом у2_+ вокруг (—k, k); кривая у^__ поворотом у2 вокруг (—fe, —k); кривая у^ + поворотом у °^_ вокруг (&, —k). Определим последовательность таких кривых. Определение 7.34. Обозначим через у'_+, ѴІ__, и ?++» /г = 1, 2, 3,. . . кривые, построенные следующим образом: кривая у^+ — вращением кривой у{р^_ вокруг точки (£, k); кривая у{ — вращением кривой у^ вокруг точки (—k, k); кривая у' — вращением кривой у^І вокруг точки (—k, —fe); кривая у'++ — вращением кривой y^"J_ вокруг точки (k, —k). Уравнения кривых уІ_+> VL_> > У^-р j' == 1, 2, 3,. . . имеют вид Ѵ^+ = ®х2) : (“*1 — b)2 + [<ох2 + (2/ + 1) £]2 = 2/г2; œx1<0; —(2/ + 2) k < сох, < — 2jk\; (7.405) у{|__ — {(0)%!, сох2) ’• + (2/ + 1 ) k]2 + (сох2 + &)2 = 2k2; — (2/ + 2) k < cox} <—2jk; со.ѵ2^0); (7.406) y£+ = {(coxj, cox2) : [сохд — (2/ + 1 ) k\2 -f- (cox2 — k}2 = 2k2; 2jk < <0%! < (2/ + 2) k; cox2 < 0}; (7.407) yî__ ~ {(coxb cox2) : (coXi + k)2 + [co.v2 — (2/ + 1) &J2 = 2k2; 2jk < cox2 < (2/ + 2)k\. (7.408) Кривые y^_+, у{|__, T-+» V-- поюзаны на рис. 7.59. Теперь можно найти четыре линии переключения: °° 1 т+_ = Û ті_; ѵ_+= Û ѵі_+; + /=о + V = U ïL_- /=0 (7.409) 533
Эти четыре линии переключения делят всю плоскость (ûx1 — сох2 на четыре области (или множества) 7?+ + , ^?+_, R_ + , как показано на рис. 7.59. Иными словами, /?++ — множество точек слева от кривой у++ и ниже кривой у+_; R+_ — множество точек слева от кривой у__ и выше кривой у+_; R__ — множество точек справа от кривой у__ и выше кривой у_+; R-+ — множество точек справа от кривой у++ и ниже кривой у_+. Закон управления 7.9. Решение задачи 7.9. Оптимальное управле¬ ние и* как функция от состояния (œx!, сох2) определяется следующим образом: и* = 4- 1, и* = + 1 для всех (<0%!, сох2)Е R++ U у++; и* — + 1, и* — — 1 для всех (cûjq, сох2)Е /?+_ U у+_; w* = — 1, и* = + 1 для всех (coxj, сох2)Е /?_+ U у_+; и* = —1, и* = — 1 для всех (сохх, сох2)Е /?__ U у__ Оптимальное управление я* единственно. Упражнение 7.52. Докажите справедливость закона управления 7.9. На рис. 7.60 показаны различные оптимальные по быстродействию траектории, идущие в начало координат для k = 1. Отметим, что после- довательность полярностей управлений соответствует последовательности (7.389). Рис. 7.60. Некоторые оптимальные по быстродей¬ ствию траектории к началу координат Перейдем к технической реализации закона управле¬ ния 7.9. Блок-схема опти¬ мальной по быстродействию системы с обратной связью показана на рис. 7.61. Си¬ стема управления измеряет сигналы сох х и сох2, опреде¬ ляет, к какой из областей (/?++, /?_+, /?__) при¬ надлежит состояние ((0%!, сох2), и на основании этого вырабатывает оптимальные управления и* (t) и и* (/) в соответствии с законом уп¬ равления 7.9. Заметим, что для состояний из R и + и* = —1, а для состоя¬ ний из /?+_и и* (Z) = = +1 независимо от значе¬ ния (f); для состояний из 7?+_ и R U* У) = —1» а ДЛЯ СОСТОЯНИЙ из и R I- и* (0 == +1 независимо от и* (/). Таким образом, для схемы, показанной на рис. 7.61, имеем если sign {т (/)) = 4-1, то (а)хх, если sign [т (Z)} = —1, то (сохх, если sign {п (Z)} = 4- 1, то (сох^ если sign {п (/)} = —1, то (û)xx, сох2) Е R+ + U R_ +; U2 — 4 1 ; сох2) Е R+_ U и* = — 1; о>х2) Е R-+ Б R++; “ 4" 1 î (ûx2)E/?__U /?_+; и* = — 1. (7.411) 534
Как показано на рис. 7.61, сигнал ых1 подается на нелинейность УѴ15 а сигнал сох2 — на нелинейность N2. Нелинейности и N2 одинаковы. Зависимость между входным и выходным сигналом каждой из них соответ¬ ствует линиям переключения у_+ и у+_ (или у__ и у++). На рис. 7.62 показана система ручного управления, оптимального по быстродействию. Переменные состояния (фазовые координаты) шХі и сох2 измеряются и подаются на входы X и Y осциллографа, на экране которого нарисована линия переключения. Оператор определяет, к какой области принадлежит состояние, и нажимает соответствующие кнопки, управ¬ ляющие реактивными двигателями \ Рис. 7.61. Блок-схема оптимального по быстродействию управляющего устройства для вращающегося космического тела Построим для нашей системы минимальные изохроны. Напомним что минимальная изохрона S (/*) есть геометрическое место точек, кото¬ рые могут быть переведены в начало координат за одно и то же мини¬ мальное время /*. Различные минимальные изохроны1 2 показаны на рис. 7.63 для k = 1. Обозначим через S (Z*) множество, границей кото¬ рого является S (/*): dS(t*) - S(/*). (7.412) Из рис. 7.63 видно, что множества S (/*) являются замкнутыми и выпуклыми. Заметим также, что множества S (Z*) имеют углы, располо¬ женные на кривых , Y? • Это означает, что в открытой области фазовой плоскости ((ùxJ2 + (сох2)2 < 4Z?2 (7.413) каждое из множеств S (^*), /* имеет четыре нерегулярных точки 3, которые являются точками пересечения минимальных изохрон S (/*) с кривыми Ѵ+-_, и • 1 Мы реализовали эту систему на аналоговой вычислительной машине, испытали свои способности в оптимальном по быстродействию управлении и нашли, что после минут¬ ной тренировки мы смогли управлять системой оптимально, по крайней мере для со < < 3 радісек. Для больших значений со время реакции человека слишком велико. 2 Метод построения этих изохрон аналогичен методу, описанному в § 7.7. Подробное описание построений см. в работе [5]. 3 См. определение 3.22. 535
(coxj2 + (wx2)2 4£2, (7.414) В области являющейся замкнутой, множества S (/*), f* замкнуты, выпуклы и регулярны (т. е. не имеют углов). Нетрудно заметить, что свойства изохрон на рис. 7.63 аналогичны свойствам изохрон на рис. 7.40. Наконец, нетрудно показать, что после того, как состояние было Рис. 7.63. Минимальные изохроны состав¬ лены из круговых дуг. Пунктирные кри¬ вые — линии переключения Вход отклонения Рис. 7.62. Оптимальное по быстродейст¬ вию ручное управление переведено в начало координат, при отсутствии возмущений его будут удерживать в этом состоянии управления их = и2 = 0. Упражнение 7.53. Так же, как и в примере 7.5, рассмотрите следующие аппроксима¬ ции кривых у+ + , т_+, 4+ (дХг — 0 Y+- CÙX2 ~ 0 Y-+ сох2 = 0 при — 2k œxo 0; при сох2 <—2/?; при — 2k (вх1 0; при сох! < — 2k; при 0 2k ; при > 2k, (7.415) у2 при (ÙJQ = 0 при 0 œx2 -с 2k; œx2 > 2k Проанализируйте получившуюся субоптимальную систему и покажите, что она устойчива. Вычислите относительное увеличение минимального времени перехода в начало координат из точек, расположенных на оси ых^ и постройте график в зависимости от ісохіі- Сравните ваши результаты с графиком рис. 7.48 при k = 1. Упражнение 7.54. Повторите упражнение 7.53 для следующих аппроксимаций линий переключения: > У4-_[_ при — ол'2 0; а)хг = — k 4- 1 при (ûx2 < — k; при — k œx1 0; cûx2 == k Ÿ2 — 1 при cùXj < — k; 536
f Y~-|- при 0 cù%1 sC k; [ (ÛX2 ~ — k 1^2 + 1 При (ОЛ\ > k’, ~ ( y2 при 0 sC cor <r k; у__ ^ < _ 2 ( (ùXi = k K2 — 1 при cùx2 > k. Упражнение 7.55. Рассмотрите систему (7.416) (7.417) (7.418) іі (/) ' 0 1 ' Xi (t) -L ’«! (0’ X (0. .-10. _x2 (0. .«2 (0. где Ы0І^2. Найдите линии переключения и оптимальный по быстродействию закон управления к началу координат. Упражнение 7.56. Рассмотрите систему (демпфированный гармонический осцилля¬ тор с двумя управляющими функциями) (7.419) где (7.420) Воспользовавшись результатами § 7.8, найдите оптимальный по быстродействию закон управления к началу координат. Следующее упражнение иллюстрирует линии переключения для систем с действитель¬ ными собственными значениями с двумя управляющими переменными. Упражнение 7.57. Рассмотрите систему второго порядка (О (0_ 2X2. Считайте, что управляющие функции ограничены по -ч (О _*2 (0_ «і (/) «г (/)_ (7.421) = А (7.422) _*2 где А и В — матрицы размера величине: Найдите оптимальный по быстродействию закон управления с обратной связью к началу координат (0, 0) для следующих случаев: В каждом из случаев проверьте, является ли система нормальной. Если оптимальное управление не является единственным, то объясните почему. 7.10. УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПЕРВОГО ПОРЯДКА В предыдущих параграфах настоящей главы мы изучали задачу об управлении простыми и сложными линейными системами. В этом параграфе рассмотрим задачу об оптимальном по быстродействию управлении нели¬ нейной системой первого порядка с переменными параметрами. Исследуем систему, которая описывается нелинейным дифферен¬ циальным уравнением первого порядка: г (О + g [%(/), t] = Ku(t\ (7.423) где X (/) — скалярное состояние системы; g lx (/)• П —некоторая нелинейная функция состояния и времени; и (/) — скалярное управление; К — положительный коэффициент усиления. 537
Будем считать, что управление и (0 ограничено по величине: \и (01 < 1 для любого t. (7.424) Пример 7.7. Рассмотрим точку массы т, движущуюся со скоростью v (t) в среде. Обозначим через f (0 силу, прикладываемую к точке. Дифференциальное уравнение отно¬ сительно скорости имеет вид mv(t) + d\v(t)]==f(t), (7.425) где d [и (0] —сила сопротивления движению. При отсутствии трения имеем d [и (/)] = 0, (7.426) и поэтому у(/) = -^-НО (7.427) Следовательно, система ведет себя подобно интегратору. Для трения, изменяющегося по линейному закону d [у (/)] _ аѵ (/), а > 0, (7.428) система ведет себя подобно апериодическому звену. Если d[v(t)] = av (t) • |ц (0|, а > 0, (7.429) то сила сопротивления имеет квадратичную зависимость. Мы решим следующую задачу об управлении, оптимальном по быстро¬ действию Задача 7.10. Дана система, которая описывается нелинейным диффе¬ ренциальным уравнением первого порядка: x(0 + g[х(0, d = (7.430) где \и (0| < 1. Найти управление, как функцию от состояния, которая переводит любое исходное состояние х (0) = I в 0 за минимальное время, при усло¬ вии, что такое управление существует. Гамильтониан задачи об оптимальном по быстродействию управлении системой (7.430) равен /7 = 1 — gr [х(/)> t]p(t) 4- Ku(t)p(t), (7.431) где р (0 — дополнительная переменная (скалярная). Далее, '7-4321 Управление, абсолютно минимизирующее гамильтониан, определяется соотношение і u(t) = — sign {р(0}. (7.433) поскольку К положительно. Рассмотрим дифференциальное уравнение относительно р (t). Из уравнения (7.432) имеем ^Д>_= h[x(t), t]dt, (7.434) где h[x(t), t]= dg[dxx§ П. (7.435) Интегрируя обе части уравнения (7.435), получим t logp(/)= J /г[х(т), xldx-1-с, (7.436) где с — постоянная интегрирования. 538
Из соотношения (7.436) найдем p(t) = р (0) ехр И h [х (т), т] ch}. Іо Независимо от h [х (£), /1 expK h [х (т), т]й(т? > 0 для t < оо, (о J откуда следует (7.437) (7.438) 1 (7.439) sign (р(0) =Sign (р(0)}. Поскольку р (0) 0, функция р (t) не может обратиться в 0 ни на каком конечном интервале времени t. Следовательно, управление, опреде¬ ляемое соотношением (7.433), может быть равно u (t) = + 1 для всех t (7.440) или и (t) = — 1 для всех t (7.441) и переключаться не может. Следующий шаг состоит в определении оптимального по быстродей¬ ствию управления в функции от состояния системы. Закон управления 7.10 (решение задачи 7.10). Оптимальное по быстро¬ действию управление, переводящее произвольное исходное состояние системы (7.430) в ноль за минимальное время, равно ц* = — sign {х} (7.442) при условии, что такое управление существует. Доказательство. Пусть х (0) > 0. Очевидно, что первый момент времени h, для которого х (/*) = 0, есть минимальное время, требующееся для перевода х (0 в ноль и X (/) > 0 для любого /, 0 < t < /*. (7.443) Поскольку X (t) положительно, из уравнения (7.442) следует, что и (/) = —1. Рассмотрим далее два дифференциальных уравнения: х(/) = -£[х(/), /]-К; (7.444) = і] + К- (7.445) Пусть х_ (/) — решение уравнения (7.444), а х+ (t) — решение уравнения (7.445). Покажем, что X- (t) <х+ (/) для любого t из 0 < / < (7.446) откуда и будет следовать оптимальность управления и = —1. Очевидно, что при t = 0 наклон функции х_ (t) меньше наклона х+ (/) (так как —К следовательно, существует 8 такое, что X- (/) <Zx+ (t) для любого t из 0 < t <С 8, как это показано на рис. 7.64. Предположим теперь, что момент времени tlt 0 < <£*, для которого X- (/) << х+ (0 для любого t из 0 < t << tx\ X- (^) = Х+ О X- (0 >х+ (/) для любого t из іг < t <Zt1 4- ô. . (7.447) существует (7.448) 1 Предполагается, что h[x (т), т] —ограниченная функция. Это всегда имеет место в физических системах, которые описываются уравнением (7.430). 539
Отсюда следует, что наклон х+ (t) в точке [т. е. х+ (/х) ] меньше наклона х_ (/) в точке [т. е. х_ (/)]: (^і) х+ (М- (7.449) (7.445) имеем Рис. 7.64. Решения х+ (t) и х_ (t) при х (0) > О выбрано произвольно, приходим *-(^)==-£[х-О /J-Æ; ] ? (7.450) Л+ (Л) = £І*+(^і)*, 61 + A. I Но x+(Q = x_(Q, и поэтому x+(Q — х_(/1)-2К>0 (7.451) или х+(/1)>х^(/1). (7.452) Но уравнения (7.452) и (7.449) противоречат друг другу. Так как tx к выводу: X- (t) <<х+ (0 для любого t. (7.453) Аналогичное доказательство для х (0) <0 окончательно устанавли¬ вает справедливость закона управления 7.10. Упражнение 7.58. Покажите, что для системы х (/) = и (t), | и (t) | 1 минимальное время, требующееся для перевода любого исходного состояния х (0) = £ в ноль, равно - Н |. (7.454) Упражнение 7.59. Дана система і(/) = —ах(0 +«(0; 1 ? (7.455) I и (t) I 1; а > 0. ) Покажите, что минимальное время, требующееся для перевода любого исходного состояния X (0) = £ в ноль, равно /*=± l°g(a|g| + 1). (7.456) Покажите, что /* есть решение уравнения в частных производных Гамильтона—Якоби. Упражнение 7.60. Дана система X (0 = bx (t) + Ки (0, I и (/) I < 1, b > 0. (7.457) Покажите, что оптимальное по быстродействию управление существует только для начальных состояний х (0) = 5, удовлетворяющих неравенству I Ê I < V • (7-458) Иначе говоря, если | £ то управления и (t), | и (/) | ^ 1, переводящего состояние системы в ноль, не существует. Следовательно, не существует и управления, оптимального по быстродействию. Упражнение 7.61. Дана система X (0 = — ах (t) I X (t) I + и (t), а > 0, | и (/) | 1. Покажите, что минимальное состояния X (0) = £, равно время, требующееся для перевода в ноль начального /* =—arctg(/a I g l). V a (7.459) (7.460) 540
7.11. УПРАВЛЕНИЕ ДЛЯ ОДНОГО КЛАССА НЕЛИНЕЙНЫХ СИСТЕМ ВТОРОГО ПОРЯДКА 1 В этом параграфе мы рассмотрим задачу об оптимальном управлении для класса нелинейных систем второго порядка, описываемых дифферен¬ циальным уравнением ÿ(t) + f[y(t)] = Ku(t), (7.461) где у (/) — выход; и (О — управление, ограниченное соотношением I и (t) I < 1 для всего t (7.462) К — положительный коэффициент усиления; f ІУ (01 — нелинейная функция от производной выхода по времени у (t). Если sign {f [у (ОН = sign {!/(01 для всех //(0=^=0, (7.463а) то система устойчива; если Sign {f [Z/(О]) = —Sign {£/(/)} для всех y(t)^ 0, (7.4636) то система неустойчива. Уравнение (7.461) описывает движение тела под воздействием нели¬ нейной силы сопротивления. Если у (/) — положение и у (I) — скорость тела, то f [у (t) ] представляет собой силу сопротивления, которая зависит только от скорости. Очевидно, что такая функция f [у (t) 1 соответствует уравнению (7.463а), поскольку энергия рассеивается, и движение является устойчивым. В дальнейшем, для определенности будем считать, что имеет место соотношение (7.463а). Примем, что ^і(0-//(0; x2(t) = ÿ(t). (7.464) В этих координатах уравнения системы запишутся в виде (/) = х2 (/); ^2(0 = -/k2(0] + u(/). (7.465) Рассмотрим следующую задачу. Задача 7.11. Для системы (7.465) найти управление и (/), удовлетво¬ ряющее ограничению | и (t) | < 1 и переводящее любое исходное состоя¬ ние в начало координат (0, 0) плоскости (хг х2) за минимальное время. Здесь мы впервые сталкиваемся с оптимальным управлением нелиней¬ ной системой второго порядка. Цель данного параграфа — показать как можно графически спроектировать оптимальную по быстродействию систему с обратной связью. При этом, как и ранее, воспользуемся необхо¬ димыми условиями для установления того, что экстремальные управле¬ ния могут переключаться не более одного раза. Сделав этот вывод отно¬ сительно числа переключений, выделим четыре управляющих последова¬ тельности (+1}, {— 1}, {+1, —1), {— 1, +1) , которые могут оказаться оптимальными управлениями. При отыскании оптимального управления будем поступать так же, как и в § 7.2 и 7.3. Мы составим список операций, которому надо следовать при расчете оптимальной системы с обратной связью, опираясь исключительно на 1 Материал этого параграфа основан на работах [145] и [146]. 541
экспериментальные данные, и проиллюстрируем понятия, связанные с расчетом, на примере конкретной нелинейной системы. Приступим к решению поставленной задачи. Гамильтониан задачи имеет вид Н = 1 + х2 (/)(0 — f [х2 (01 р2 (0 + U (0 р2 (/). (7.466) Управление, абсолютно минимизирующее гамильтониан, определяется соотношением u (Z) = — sign {р2 (0} (7.467) Дополнительные переменные рх (t) и р2 (і) являются решениями диф¬ ференциальных уравнений = - лГ7Л = °-- П (t\- дН - п th ч- (/)| п (tX ~ Р1 ( > + ""дх2(іГ Рі ( )-- Необходимо предположить, что (0 сУЩествУет ПРИ любых х2(г). Пусть Л! = рг (0); л2 = р2 (0). Из уравнений (7.468) находим р1 (/) = л1 = const. (7.468) (7.469) (7.471) (7.470) Теперь мы должны решить уравнение (7.468). Рассмотрим функцию ^dx2(t)^9 которая является функцией от х2 (/) и, следовательно, функцией от времени t. Определим функцию h (0, положив Очевидно, что h (t) является вполне определенной, хотя и неизвестной функцией времени. Подставив уравнения (7.471) и (7.470) в (7.468), полу¬ чим дифференциальное уравнение Р2 (0 = — яі 4“ (ОРгЮ, решение которого имеет следующий вид: (7.472) р2(/) = ехр У h (т) dx о я2 — лг J ехр о — У Л(о)do dr?, (7.473) о J где тиа — некоторые переменные интегрирования. Докажем, что функ¬ ция р2 (/) может обращаться в 0 не более одного раза. Для любой функ¬ ции h (t) непосредственно получим a (t) = ехр J h (т) о 0; оо; 0(т) = ехр — J h (о) do L о 0; 0 оо; (7.474) ехр h (о) do dx>0, 542
причем с (t) монотонно возрастает с ростом t. Если л2 > 0 и лх < О, то л2 — пхс (t) > 0 для любого t, и, следовательно, р2(0>0 для любого t^Q. При л2 = 0 и лх <С О имеем р2(0)-0 и р2(0>0 для ^>0. Если л2 <С 0 и л1 О, то л2 — лАс (/) <С 0 для любого t, следовательно, Рг(0<0 для любого /^0. При л2 = 0 и лх > 0 имеем р2 (0) — 0 и р2(0<0 Для любого />0 Если л2 > 0 и лх > 0, (7.475а) (7.4756) (7.476а) (7.4766) (7.477а) (7.4776) (7.478а) (7.4786) (7.479а) то функция л2 — лхс (/) монотонно убывает с ростом t, и, поскольку р2 (0) = л 2 > 0, то существует единственный момент времени tr > 0 такой, когда Р2(^) = 0. (7.4796) Если л2<0 и лх<0, (7.480а) то функция л 2 — лхс (0 монотонно возрастает с ростом /, и поскольку р2 (0) = л2 <0, то, в свою очередь, существует единственный момент времени /2 > 0, когда р2(/2) = 0. (7.4806) Итак, мы показали, что для всех возможных значений лх и л2 функ¬ ция р2 (t) может обращаться в нуль не более одного раза \ и поэтому на основании уравнения (7.467) только четыре управляющих последова¬ тельности { + !}, {-1}, {+1, -1}, {-1, +1} (7.481) можно рассматривать в качестве возможных оптимальных управлений. Нетрудно заметить, что для этой нелинейной системы мы пришли к тем же выводам относительно управляющих последовательностей, как и для линейных систем второго порядка, рассмотренных в § 7.2 и 7.3. Поэтому способ отыскания оптимального по быстродействию закона управ¬ ления и его доказательства аналогичны описанным в § 7.2 и 7.3. Первый шаг состоит в том, чтобы «решить» дифференциальные урав¬ нения %і (t) = х2 (/); ] . Ѵ (7.482) MO^-flMOl + A, 1 где Д = ±1 (7.483) при Xj (0) = х2 (0) = Из выражения (7.482) видно, что решение х2 (t) будет J ■_-f]T2(^-+à=t + c’ <7-484) J —I 1^2 Ц ) J + А 1 Случай = л2 = 0 исключается (почему?). 543
где с — постоянная интегрирования. В общем случае вычислить интеграл невозможно. Решение уравнения (7.484) можно получить графо-аналити¬ ческим способом или при помощи численного интегрирования на цифро¬ вой вычислительной машине. Во всяком случае решения уравнений (7.482) при Д = +1 можно записать в виде ! (7.485) 4(0 = 4(£і, U0J а при Д = —1 в виде (Z) = хг (g2, 0; 1 (7.486) хг(о = хгаіл2> oJ Из уравнений (7.485) и (7.486) время t можно исключить и получить уравнения траекторий на фазовой плоскости: Х2 = Q (Х1 , 11, £2). J Траектории можно получить графически (с помощью метода изоклин) на цифровой вычислительной машине или моделируя систему на аналого¬ вой вычислительной машине и наблюдая траектории на экране осцилло¬ графа. Через начало координат (0, 0) проходит единственная траектория, производимая управлением и = +1. Обозначим через у+ множество исходных состояний, которые могут быть переведены в (0, 0) управлением и = +1, а через у_ множество состояний, переводимых в (0, 0) управлением и = —1. Как и ранее, определим линию переключе¬ ния у как объединение кривых у+ и у_, (у = Y+ U Y-)- Линия переключения у делит фазовую плоскость на две области: и /?+. Обозначим через множество состояний справа от линии переключения у (/?_ = = {(хі, х2): если (%і х2) £ у, то %і > хі}). Аналогично обозначим через 7?+ множество состояний слева от линии переключения у (/?+={(%!, х2): если (хь х2) Q у, то %і <%і)). Пользуясь методом исключения § 7.2 и 7.3, установим следующий закон управления. Закон управления 7.11 (решение задачи 7.11). Оптимальное по быстро¬ действию управление и* как функция от состояния (хх, х2) определяется следующим образом: и* = и* (хх, х2) = 1 для всех (хх, х2) С U Y+ ц* = w* (хх, х2) = — 1 для всех (хх, х2) Ç /?_ U Y-- Следовательно, оптимальное управление и* единственно (если оно существует). Линия переключения у может быть похожа на кривую, показанную на рис. 7.65. Так же, как и ранее, можно реализовать оптимальный по быстродействию закон управления в виде блок-схемы, показанной на рис. 7.66. Связь между выходом и входом нелинейности N идентична линии переключения у. 544 Рис. 7.65. Возможный вид линий переключения у+ и у_ для нели¬ нейной системы второго порядка (7.488)
В настоящем параграфе мы хотели показать, насколько просто опре¬ делить закон управления после того, как установлено, что оптимальными могут быть только четыре управляющих последовательности (7.481), И поэтому управление может переключаться не более одного раза. Действительно, можно не использовать уравнения системы, если целью инженера является проектирование системы по блок-схеме, показанной на рис. 7.66. Шаги, которым надо следовать при проектировании опти¬ мальных по быстродействию систем, приведены ниже. Если удалось показать, что оптимальное по быстродействию управ¬ ление может переключаться не более одного раза, то следует: 1. Промоделировать систему на аналоговой машине. 2. Подать сигнал ад (/) на вход X, а сигнал х2 (t) — на вход Y двух¬ координатного осциллографа или самописца. Рис. 7 66. Блок-схема оптимальной по быстродействию системы с обрат¬ ной связью. Характеристика нелинейности N повторяет линию пере¬ ключения, показанную на рис. 7.65 3. Подать на вход системы управление и = +1 и настроить началь¬ ные условия таким образом, чтобы траектория проходила через начало координат1. Эта траектория и будет кривой у+. 4. Повторить шаг 3, прикладывая и ■= —1. В результате получится кривая 5. Проделав эти операции, вы располагаете графиком линии пере¬ ключения у. 6. Закажите инженеру по оборудованию нелинейный элемент с характеристикой, соответствующей графику линии переключения из достаточного числа диодных ячеек. 7. Включите нелинейность в систему так, как показано на рис. 7.66, и оптимальная по быстродействию система готова. В заключение параграфа мы приведем кривые для некоторых кон¬ кретных систем. Рассмотрим единичную массу, подверженную нелиней¬ ному трению. Если у (t) — положение и у (Z) — скорость и если сила трения зависит от квадрата скорости, то дифференциальное уравнение системы таково: y^ + y{t)\y(t)\^u(tY \u(t)\< 1, (7.489) где и (0 представляет собой силу, прикладываемую к массе. Мы записали силу сопротивления в виде у (t) \у (t) | для того, чтобы показать ее направ¬ ление, которое противоположно движению. Полагая У = Хі', У = х2, 1 Часто более удобно задачу об отыскании линии переключения решать в «обратном» времени, см. [300] (прим. ред.). 18 Атанс и др. 545
находим, что переменные состояния (фазовые координаты) системы удо¬ влетворяют системе дифференциальных уравнений %і (/) = х2 (/); ] 1к' 2Ѵ' (7.490) х2(/) = —х2(/)|х2(0| + н(/). J На рис. 7.67 показаны траектории этой системы при и = +1 (сплош¬ ные линии) и при и = —Ï (штриховые). Как видно из рис. 7.67, все траек¬ тории, соответствующие и = +1, стремятся к прямой х2 = +1, а все траектории при и — —1 к прямой х2 — —I. Траектории, проходящие через начало координат, обозначены у+ и у_. Они показаны на рис. 7.68 Рис. 7.67. Траектории на фазовой плоскости для системы у + у I у | = и. Сплошными линиями пока¬ заны траектории, соответствующие и = 4-1, штри¬ ховыми и — —1. Стрелками показано направление движения состояния кривые — если оптимальные по бы¬ стродействию траектории к началу координат фазовой плоскости вместе с областями R+ и 7?_. Оптимально управление и = + 1, если точка (xb х2) находится в области 7?+, и и = —1 в области На рис. 7.68 показаны также некоторые оптимальные траектории. Упражнение 7.62. Постройте графически оптимальную линию переключения для нелинейной системы второго порядка 4- Ü/ (0J3 =и (t) (7.491) в случае, если конечным является состояние у = у — 0. Упражнение 7.63. Дана система Ў(і) +/ІЎ (0. F (01 = « (0. I « (0 I «Si- (7.492) Найдите число переключений оптимального управления. Считайте, что функция f дифференцируема как по у (/), так и по у (t). Упражнение 7.64. Дана система ÿ (t) 4- Ку (0 + ay3 (t) = и (/), I и (t) I 1, (7.493) которая описывает движение колебательной системы, состоящей из массы и «нелинейной» пружины. Найдите оптимальный по быстродействию закон управления к состоянию у = — у = 0 для К — а — Указание: свободный переходной процесс в системе (7.493) — колебательный. Поэтому верхней границы числа переключений оптимального управления не существует. Так как система (7.493) представляет собой нелинейный осцилля¬ тор, следует воспользоваться способами, описанными в § 7.7—7.9. Упражнение 7.65. Предложите способы реализации субоптимальных управлений для системы из упражнения 7.64. Указание: используйте способы, подобные рассмотрен¬ ным в § 7.7, примеры 7.5 и 7.6. 546
7.12. УПРАВЛЕНИЕ ОБЪЕКТОМ С ПЕРЕДАТОЧНОЙ ФУНКЦИЕЙ, СОДЕРЖАЩЕЙ ДВА ИНТЕГРИРУЮЩИХ ЗВЕНА И ОДИН НУЛЬ 1 В предыдущих параграфах настоящей главы мы находили оптималь¬ ные по быстродействию законы управления для объектов, передаточные функции которых содержали только полюса. Иначе говоря, мы изучали объекты, правая часть дифференциальных уравнений которых являлась функцией только от управления и (/). В этом и двух последующих пара¬ графах мы рассмотрим задачу об оптимальном по быстродействию управ¬ лении объектами, передаточные функции которых содержат нули. Вначале рассмотрим два простых примера, а затем в § 7.14 обобщим полученные результаты. Как мы увидим, задача оптимального управле¬ ния объектами с нулями в передаточной функции отличается от задачи оптимального управления объектами, передаточные функции которых нулей не содержат. При отыскании оптимального управления для объек¬ тов, передаточная функция которых содержит нуль, в этом и двух после¬ дующих параграфах мы будем поступать следующим образом: 1. Сформулируем задачу об оптимальном управлении выходом системы и его производными и потребуем, чтобы выход и его про¬ изводные переводились в нуль за минимальное время и после этого удерживались в нуле. 2. Найдем соответствующие переменные состояния (фазовые коорди¬ наты) системы, пользуясь методами гл. 4. 3. Сформулируем задачу об оптимальном управлении для новых фазовых координат. Покажем, что в пространстве состояний суще¬ ствует область G (которая может состоять из единственного состояния) такая, что состояния, не принадлежащие к G, можно перевести в G за минимальное время и после этого удерживать в области G, прикладывая соответству ющее управление. 4. После отыскания G получим оптимальный закон управления к об¬ ласти G. Этот шаг будет связан с расчетом линий переключения и т. д. Предупредим читателя, что решение задачи об оптимальном по быстро¬ действию управлении объектом с нулями в передаточной функции намного сложнее, чем решение задачи для объектов, передаточные функ¬ ции которых содержат только полюса. Рассмотрим объект с выходом у (t) и управлением и (/), который описывается линейным дифференциальным уравнением = u(/) + ₽u(/). (7.494) Будем считать, что управление ограничено по величине: |w(OI < I Для любого t. (7.495) В теории регулирования о системе, которая описывается уравне¬ нием (7.494), говорят, что она имеет передаточную функцию вида =- H (s) = . (7.496) Эта передаточная функция содержит один нуль при s = —[3 и два полюса при s = 0. Выделим следующие случаи: 1. Р> 0. (7.497) 1 См. работы [4], [63], [68], [92], [93], [98], [147] и [201]. 547
Из уравнения (7.497) следует, что нуль расположен в левой полупло¬ скости s, как показано на рис. 7.69, а. Такой нуль называют минимально¬ фазовым. 2. ₽ < 0. (7.498) Из уравнения (7.498) следует, что нуль расположен в правой полу¬ плоскости s, как показано на рис. 7.69, б. Такой нуль называют немини¬ мально-фазовым. 3. 0 - 0. (7.499) Из уравнения (7.499) следует, что нуль расположен в начале коорди¬ нат, как показано на рис. 7.69, в. Передаточная функция H (s) для урав¬ нения (7.499) имеет вид = (7.500) функции Минимально-фазовый нуль Не минимально-фазовый нуль q\ а) Я) Рис. 7.69. Расположение полюсов и нуля на плоскости s для передаточной G(S)=±+1. s2 Иногда пытаются заменить H (s) передаточной функцией //1(s) = T (7.501) и в этом смысле свести уравнение (7.494) к уравнению = (7.502) а затем решать задачу, пользуясь уравнением (7.502). Мы покажем не¬ справедливость такого сокращения нуля с полюсом. Итак, в данном параграфе рассмотрим следующую задачу: Задача 7.12а. Дана система, которая описывается уравнением (7.494). Найти управление и (t), удовлетворяющее ограничению |и(/)| С 1, которое переводит у и у в ноль за минимальное время и удерживает их в нуле после этого при отсутствии последующих возмущений. Для корректного решения задачи необходимо выбрать соответству¬ ющие переменные состояния (фазовые координаты). Используя мето¬ дику § 4.10, определим переменные состояния (/) и х2 (/), положив хх(/) = y(t) — hQu(ty, (7.503) х2 (0 - У (?) - М (0 ~ thu (/). (7.504) Следующий шаг состоит в том, чтобы найти дифференциальные урав¬ нения относительно новых переменных состояния (фазовых координат). Из соотношения (7.503) получим у(0 = *і(0 + М(0. (7.505) 548
Подставляя уравнение (7.505) в соотношение (7.504), находим -Ц (0 = x2(t) + hlU (0. (7.506) Дифференцируя соотношение (7.504), имеем і/(0 = х2 (0 4- hoû(t) +hiu(t). (7.507) Из уравнений (7.507) и (7.494) получим х2 (t) = —hou (0 — hxu (t) -t- u (t) + pu (t). (7.508) Заметим, что уравнение (7.506) не содержит производных от и (t), тогда как в уравнение (7.508) они входят. Цель преобразований — вы¬ брать hj и /і0 такими, чтобы уравнения относительно хг (t) и х2 (t) не содержали производных от и (t). Если в уравнении (7.508) положить йо = 0ий1= 1, (7.509) то уравнения (7.506) и (7.508) примут вид х.(0 = х, (/) + „(/); I (7 510) х2 (0 = р« (0, J а уравнения (7.503) и (7.504) запишутся в виде МО = у(0; 1 x2(0 = f/‘(0-u(0. J (7-511) Заметим, что переменная состояния (фазовая координата) хг (t) есть просто выход у (t), тогда как х2 (0 равна разности между скоростью выходной координаты у (t) и управлением и (t). Задача состоит в том, чтобы за минимальное время перевести в нуль у и у и удерживать их после этого равными нулю. Предположим, что выход у и его скорость у переведены в нуль. Пусть t* — первый момент времени такой, когда у(/*) = ^(^)==0. (7.512) Следовательно, если y(t) = y(t) = O для всего (7.513) то из уравнения (7.511) вытекает, что переменные состояния должны удовлетворять соотношениям *1(0 = 0; x2(t) = ^u(t) для любого t > /*. (7.514) Подставляя соотношения (7.514) в уравнения (7.510), находим *і(0=0; -0х2(/) для любого t > /*. Отсюда следует х1(0 = х1(/*) = О; x2(0 = x2(/*)«H>a-f) для любого t >> t*. (7.515) (7.516) (7.517) 549
Но поскольку Х2 (I) = —U (t) И \и (01 < 1, должно быть = (7.518) откуда на основании уравнения (7.517) имеем = —x2(/*)éHH/-O (7.519) для любого t > /*. Эти соображения приводят нас к следующим выводам. Для того чтобы перевести в нуль выход и выходную скорость за минимальное время, достаточно перевести за минимальное время фазовую координату хг в нуль, а фазовую координату х2 — в замкнутый сегмент —1 < х2 < +1. Далее, если /* — минимальное время, то для того, чтобы удержать у (/) — = у (I) = 0 при t >> /*, необходимо приложить управление и (0 - — х2 (/*) t>t*. (7.520) Если и (t), определяемое уравнением (7.520), удовлетворяет ограни¬ чению \и (01 < 1 для t > /*, ТО у (0 = у (t) = 0 для любого t > t*. Мы, однако, еще не решили задачу до конца. Чтобы сделать это, сформу¬ лируем задачу об оптимальном управлении более точно, пользуясь пере¬ менными состояния (фазовыми координатами), а не выходными перемен¬ ными. Определение 7.35. Область G определяется соотношением G= {(х1} х2):хх = 0, |а'2| < 1}. (7.521) Область G показана на рис. 7.70. Поскольку она представляет собой замкнутый отрезок прямой, то эта область замкнута и выпукла. По отношению к области G задача 7.12а экви¬ валентна следующей задаче. Задача 7.12. Дана система хх(0 = х2 (0 + ^(0; х2(/) = р«(0, где \и (0| < 1. (7.523) Найти управление и (/), которое: а) переводит состояние системы в область G, определяемую соотношением (7.521) за минимальное время; б) удерживает состояние в G после этого. Очевидно, что эта задача эквивалентна задаче равлении, сформулированной относительно у и у. Рассмотрим теперь отдельно каждый из трех случаев: р > 0, [3 <0 и р = 0. Случай 1. Передаточная функция объекта имеет минимально-фазо¬ вый нуль: р > 0. Мы должны оптимально управлять системой, переводя ее в область G. Для отыскания управляющих последовательностей, которые могут ока¬ заться оптимальными управлениями, будем двигаться по пути, который указывает принцип минимума. Заметим, что при Р > 0 система (7.522) нормальна г. Гамильтониан И для задачи об оптимальном по быстродействию управлении системой (7.522) равен /7^ 1 + x2(0p1(/) + ^(/)[P1(0 + PP2(0L (7.524) / • G 0 / х1 -/ Рис. 7.70 Область цели G на плоскости xlt *2- Область G пред¬ ставляет собой замк¬ нутый интервал — 1 х2 ^ + 1 об оптимальном (7.522) 1 См. § 6.5, теорема 6.6, а также § 4.21. 550
где Рі(0 = 0; p2(t) = -РЛ), (7.525) или Pi (?) = лх; р2 (0 = л2 — л/, (7.526) причем лі = Рі (0); л2 = р2 (0). (7.527) Управление, абсолютно минимизирующее гамильтониан, равно u(t) = —sign + рр2 (0} = —sign {Лі -t- рл2 — Рл^}. (7.528) Итак, в качестве возможных оптимальных управлений следует рас¬ сматривать только четыре управляющих последовательности: { + 1}, {-Ц, { + 1, -1}, {-1, +1}. (7.529) Определение линий переключений и оптимального по быстродей¬ ствию управления к области G обосновывается точно так же, как и в § 7. 2. Сначала решим уравнение (7.522) при постоянном управлении и = & = ±1, (7.530) тогда получим х1(о = в1 + ^ + А/ + Ц-л^г;1 ( / . Ou 1 ) x2(t) = l2 + р А/, где 5і = (0); Ь = х2 (0). (7.532) Исключив время t из уравнений (7.531), получим уравнение траекто¬ рий на плоскости ххх2: (7-533) р р р р Траектории, показанные на рис. 7.71 при Р = 1, представляют собой параболы, вершины которых расположены на прямой х2 = —А (7.534) независимо от величины р х>. Следуя доказательству § 7.2, можно определить линии переключения следующим образом. Определение 7.36. Обозначим через у+ множество состояний, которые можно перевести в состояние (0, —1) управлением и = +1, а через у_ — множество состояний, переводимых в (0, +1) управлением и = —1. Уравнения кривых у+ и у_ можно найти из соотношения (7.533): Ѵ+ = |(*і, х2) : = + 2^(х2 + I)2; х2<—1;0>о|. (7.535) V- =- |(хг, х2):хх = — -^-(х2 — I)2; x2ssl;0>o}. (7.536) Кривые у+ и показаны на рис. 7.72 для р = 1. Можно определить линию переключения у как объединение кри¬ вой области G, определяемой уравнением (7.521), и кривой у_: Ï = V+UGU V- (7.537) О Это нетрудно установить, вычислив дх2 = Р . дхг I = 0 дХі Дх2 + 1 ’ дх2 |хя=-д 551
Линия переключения у делит фазовую плоскость на две области и /?_, определенные ниже. Определение 7.37. Обозначим через /?_ множество состояний справа, через R+ — слева от линии переключения у: = {(%і, х2) .'если (хь х2) Q у, то хх <xj; (7.538) R_ = {(%!, х2) : если (х^ х2) £у, то хх>Хі}. (7.539) Теперь мы можем сформулировать закон оптимального управления для любого состояния на фазовой плоскости. стрелками показано направление движения “ » Р ~ сплошные кривые состояния для положительного времени оптимальные по быстродействию траекто¬ рии к области цели G Закон управления 7.12а (решение задачи 7.12, часть а, р > 0). Опти¬ мальное управление и* как функция от состояния (хх, х2) определяется следующим образом: и* = и* (%!, х2) = 4-1 для всех (х1( х2) £ Я+ U ѵ+; 1 и* — и* (хг, х2) =—1 для всех (xlt xa)Ç/?_UY-- / Управление и* единственно. Упражнение 7.66. Докажите закон управления 7.12а. Указание: см. задачу 7.3. Закон управления 7.12а определяет управление, которое переводит состояние в область G за минимальное время или, что то же самое, пере¬ водит в нуль выход у и скорость выхода у за минимальное время. Он, однако, не дает решения всей задачи об удерживании состояния системы в области G после ее достижения (или, что то же самое, об удерживании у и у равными нулю). Мы установили, что если — минимальное время, то (хх (/*), х2 (^*)) Ç G и управление и (/), определяемое уравнением (7.520), а именно: и(і)==—х2(^)е-^^\ (7.541) удержит состояние в G, если|и(0| < 1. Но так как |х2(/*)| < 1 и Р > 0, то I « (01 = I х2 (/*) 11 <?-3 <'-*•> I < іх2 (Г*) I < 1, (7.542) 552
и поэтому I U (t) I < 1 для любого t > /*. (7.543) Поскольку управление (7.541) удержит состояние в G при t *> £*, то при t > t* мы получим у (t) = у (t) = 0. Эти положения дают полное решение поставленной задачи. Закон управления 7.12 (решение задачи 7.12 при 0 > 0). Оптимальное управление как функция от состояния системы определяется следующим образом: и* = и* (хъ х2)=4-1 для всех (xît x2)Ç7?+Uv+; и* = м*(хх, х2) = —1 для всех (хх, х2) Ç U V-’» и* — w*(xx, х2) =—х2 для всех (хх, x2)£G. (7.544) Различные оптимальные по быстродействию траектории показаны на рис. 7.72. Заметим, что существуют исходные состояния, которые могут быть переведены в область G без переключения управления (например, траектории А ВО и F И О). Существуют исходные состояния, которые могут быть переведены в G одним переключением управления (например, траектории GDEO и IJKO). Полезно нарисовать графики оптимальных управлений, переводящих исходное состояние в G и затем удерживающих его в этой области. Рас¬ смотрим исходное состояние А (рис. 7.72). Оптимальным путем из А в G является траектория АВ, производимая управлением и = —1. Точка В принадлежит множеству G. Для исходного состояния А точка В = = (0, —0, 5). На рис. 7.73 показано управление и (/), равное 1 на интервале 0 < t < tB, где tB — момент достижения точки В = (0, —0, 5). Согласно уравнению (7.541) управление и (t) должно быть равно: u(t) = 0,5^” (^в); t>tB, (7.545) так как построения проводились для р = 1. Поскольку и (t) = —х2 (t), при t t> tB получим х2(0 = —0,5е~ ('“"'в); (7.546) . В результате получится траектория ВО, которая достигнет начала координат при t = оо. Рис. 7.73. График оптимального по быстродействию управления, с помощью которого получена траек¬ тория АВО (см. рис. 7.72). При любом t ів выход у (t) и его производная у (t) тождественно равны нулю Рис. 7.74. График оптимального по быстродействию управления, с по¬ мощью которого получена траектория CDEO (см. рис. 7.42). При любом t ів выход у (t) и его производная у (/) тождественно равны нулю Рассмотрим теперь на рис. 7.72 исходное состояние С. Оптимальной является траектория CDE, где Е = (0, —1); управление и = —1 вдоль траектории CD и и = +1 вдоль траектории DE. При t = tE система находится в состоянии Е = (0, —1). При t > tE управление равно: ы(0 = е-('“Ч t>tE, (7.547) 553
и, следовательно, х2(0 = -е-(<-Ч t>tE, (7.548) Управление и (/) при t^>tE представляет собой затухающую экспо¬ ненту, как показано на рис. 7.74. При t^>tE получается траектория, которая принадлежит к области G. Упражнение 7.67. Спроектируйте практическую реализацию закона управления 7.12. Случай 2. Передаточная функция объекта имеет неминимально¬ фазовый нуль: Р < 0. Если р < 0, то уравнения (7.524)—(7.533) имеют место, поскольку при их выводе относительно р не делалось никаких специальных предпо¬ ложений, кроме р =/= 0. Следовательно, задача остается нормальной. На рис. 7.75 показаны траектории системы при р = —1. Для того чтобы обнаружить изменения траекторий при замене положительного р отри¬ цательным, рис. 7.75 следует сравнить с рис. 7.71. Так как область G, соответствующая определению 7.35, не зависит от р, то можно отыскивать управление, которое переводит любое исходное состояние в область G за минимальное время. Этот шаг связан с определением линий переключения. Определение 7.38. Обозначим через множество состояний, которые можно перевести в (0, —1) управлением и = +1, а через у_ — множество состояний, которые можно перевести в (0, +1) управлением и = —1. Кривые у+ и определяются'соотношениями т+= Rxi, х2):Хі = ^-(хх + I)2; х2^—1; 0<ОІ; (7.549) Рис. 7.75. Траектории на плоскости х19 х2 при р — —1. Сплошные траектории соот¬ ветствуют и = Д = +1, пунктирные и = Д = —1. Стрелками показано направ¬ ление движения при положительном времени Т- = {(-Ч, *2): = — 2^-— I)2; х2<1, 0<о}. (7.550) Заметим, что определение 7.38 идентично 7.36. Однако из-за того, Рис. 7.76. Линии переключения у+ и у_ для s — 1 объекта G (s) = ——. Изображенный на этом рисунке закон управления переводит в нуль любые исходные у и у за минималь¬ ное время. Оптимальные по быстродействию траектории к области цели показаны сплош¬ ными линиями что вид траекторий при р>0 и р <0 различен, уравнения (7.549) и (7.550) отличаются от уравнений (7.535) и (7.536). Кривые у+ и у_, определяе¬ мые уравнениями (7.549) и (7.550), показаны на рис. 7.76. Они построены для р = —1. 554
(7.554) Кривую у можно определить как Т = Т-ь U G U Y-; (7.551) эта кривая опять разделяет фазовую плоскость на две области. Определение 7.39. Обозначим через R+ состояния, расположенные выше, а через R_ — ниже кривой у: /?+=- {(%і, х2) : если (хь х2) Ç V, то х2>х2}; (7.552) R_ = {(%і, х2) • если (хь х2) ç у, то х2<х2}. (7.553) Закон управления 7.126. Если р < 0, то управление, переводящее любое исходное состояние (х1, х2) $ G в G за минимальное время, опре¬ деляется следующим образом: u* = u*(xlf х2)=+1 для всех (xn x2)^/?+UT+î u*^u*(xlf х2) =—1 для всех (хь x2)£7?_|JV-- Это управление единственно. Упражнение 7.68. Докажите закон управления 7.126. На рис. 7.76 показаны различные оптимальные траектории области G. До сих пор различия между объектами, передаточные функции ко¬ торых минимально-фазовая ((3 0) и неминимально-фазовая ([3 < 0) не было. Различие состоит в том, что если р < 0, то не существует упра¬ вления, удерживающего состояние в G при любом />/*. Покажем это. Предположим, что при t == t* состояние (Xj (/*), х2 (t*)) Ç G, т. e. Xi (t*) = 0, |x2 (£*) | < 1. Чтобы удержать состояние в области G, мы должны приложить управление u(Z) = —х2(/*)е-3<^*) при />/*. (7.555) Но так как р < 0, член является возрастающей функцией времени, и поэтому существует момент времени t* такой, что = 1. (7.556) Величина определяется соотношением = +T10gl%2(/*)|- (7.557)1 На временном интервале t* < t < t± фазовые координаты удовлетво¬ ряют уравнениям *і(0 = 0; Х2 (0 = х2 (/*)е~Р и поэтому при t ■= tr имеем Хі(/і) = 0; |x2(G)| = 1. (7.558) (7.559) Следовательно, если |х2(/*)| =£ 0, то состояние можно удержать в G лишь в течение конечного интервала времени t* < t < tr. Это означает, что закон управления 7.126 позволяет перевести у и у в 0 за минимальное время и удержать их в этом состоянии лишь в течение конечного интервала времени /* < t < Возникает естественный вопрос. Что происходит при t >» Оче¬ видно, что не существует управления, удовлетворяющего ограничению \и (/)| < 1 и удерживающего состояние в области G. Следовательно, при На первый взгляд может показаться, что поскольку Р < 0, то tr < t*. Напомним, однако, что I х2 (/*) | 1, и поэтому log |х2 (/*) 0. Если I х2 (/*)|= 1, то G = /*. 555
t^> tr состояние «убежит» из G. Закон управления 7.126 опять вступит в силу и обеспечит возврат состояния в область G. В результате полу¬ чится предельный цикл, который означает, что у =£ у 0, как показано на рис. 7.77 (для р = —1). Из этого рисунка видно, что если состояние щиеся при использовании для объекта s — 1 с передаточной функцией —%— закона управления, показанного на рис. 7.76 переведено в G при t = t*, в этот момент времени %1(Р) = 0; х2(^*)>0, причем (7.560) то для t > tr предельным циклом будет замкнутая петля /СР7СР. Если %1(/*)^0; х2(^*)<0, (7.561) то предельным циклом будет зам¬ кнутая петля EQEQ. . . Если точки Е и /С заданы как Е - (0, — 1); К = (0, + 1), (7.562) то можно показать, что при р = —1 точки Р и Q определяются как /> = (2, —1); Q = (—2,+1). (7.563) На рис. 7.78 показано управле¬ ние, вызывающее предельный цикл. Заметим, что при 0 <3 t < /* управление переводит состояние в G; на интервале t < управление представляет собой возрастающую экспоненту, которая удерживает состояние в G. При t > tx управление переключается между значениями +1 и —1 каждые Т сек, результатом чего является предельный цикл. При р — —1 период переключения управления Т равен 2 сек. Рис. 7.78. Вид управления u (t), переводящего координаты у и у объекта _L R с передаточной функцией G (s) ——при р<;0 в нуль за минималь¬ ное время /*. Управление u (t) на интервале [/*, /х] представляет собой возрастающую экспоненту; при /х управление кусочно-постоянно. Оно соответствует предельному циклу, показанному на рис. 7.77. Мы показали, что если|х2 (^*)| ¥= то предельный цикл неизбежен. Предположим, что при t — /* имеем Х1(/*)^х2(/*)-0. (7.564) Если в этом случае принять и(/) = 0 для любого />>/*, (7.565) то получим ^і(0 *2(0 = 0 для любого / (7.566) 556
откуда следует у (t) ~ у (/) — 0 также для любого t > /*, (7.567) что и требуется по условиям задачи. Мы оказались перед задачей перевода у и у в нуль за минимальное время и удержания их в этом состоянии в дальнейшем. Закон управле¬ ния 7.126 переводит у и у в нуль за минимальное время, но приводит к пре¬ дельным циклам, и поэтому у и у не могут быть все время равны нулю. Однако, если мы достигли начала координат фазовой плоскости, то управ¬ ление и — 0 удержит у = у = 0. Следовательно, начало ляется единственным элементом G, который одновременно координат яв- удовлетворяет Рис. 7.79. Линии переключения Г+ и Г. обоим условиям задачи управления. Таким образом, закон управления 7.126 в общем случае не оптимален, и поэтому мы должны найти новый закон управ¬ ления, который переводит любое исход¬ ное состояние за минимальное время в начало координат (0, 0). Далее следуют знакомые определе¬ ния линий переключения, областей на фазовой плоскости и оптимального за¬ кона управления. Определение 7.40. Обозначим через Г+ множество состояний, которые можно перевести в начало координат (0, 0) управлением и = +1. Обозначим через Г_ множество состояний, которые можно перевести в (0, 0) управлением и = —1. Из уравнения (7.533) имеем Г-}- — [ (xi, х2) : (х2 Н—; х2 0; P <Z 0І ; (7.568) ( Р \ / ) г_ = [(%!, х2) X, < 0; ₽ < oj. (7.569) Кривые Г+ и Г_ показаны на рис. 7.79 для р = —1. Кривая Г - Г+иГ_ (7.570) есть новая линия переключения. Определение 7.41. Обозначим через R+ множество состояний, распо¬ ложенных выше линии переключения Г, а через R_— ниже линии пере¬ ключения Г: R+ — *2) • Ç%2 Н—2“ 1 1? P<coj; (7.571) R- = {(хь х2) : < -у х2|х2|^ , P<oj. (7.572) Сформулируем теперь решение задачи 7.12 при р <0. Закон управления 7.12в (решение задачи 7.12 при р < 0). Управле¬ ние как функция состояния (хь х2), переводящее у и у в 0 за минимальное время и удерживающее его в этом состоянии, определяется следующим образом: г/* = и* (хь х2) — 1 для всех (хь х2) £ Г+; и* = и* (хь х2) —1 для всех (хь х2) £ R__ (J Г_. Это управление единственно. Упражнение 7.69. Докажите закон управления 7.12в. Упражнение 7.70. Нарисуйте реализацию закона управления 7.12в. (7.573) 557
Итак, мы установили, что в случае неминимально-фазового нуля область G состоит из единственной точки — начала координат фазовой плоскости, а затем нашли закон управления, переводящий состояние системы в начало координат. Случай 3. В передаточной функции объекта имеем р = 0. Если р = 0, то передаточная функция принимает вид = (7.574) Выход у (/) есть решение дифференциального уравнения \u(t)\ < 1. (7.575) Переменные состояния (фазовые координаты) системы определяются уравнениями (7.511): хі(/) - £/(/); х2(/) - y(t)- u(t). (7.576) Для этих переменных справедливы дифференциальные уравнения Хі(0 = х2(0 + «(0;| 577 х2(0 = 0. J Эти уравнения получены из уравнений (7.510) при р = 0. Область G та же, что и раньше: G = {(%!, х2); = 0; | х21 < 1}. (7.578) Из уравнений (7.577) находим *1(0)=^, х2(0) = |2, «(0 = А=±1; (7.579) «,(/)=!.. I ( 8) Так как координата х2 (t) постоянна, а целью управления является достижение области G, для которой |х2| < 1, то, очевидно, что при |х2(0)| = I Ъ I > 1, (7.581) задача решения не имеет. Иначе говоря, если справедливо неравенство (7.581), то не существует управления, переводящего у и у в нуль. Если Ы0)| = |£2|< 1, (7.582) то легко показать, что управление и = —sign [лД (7.583) переводит и х2 в G за минимальное время, а если (xn х2) £ G, то постоян¬ ное управление и = —х2 (7.584) удержит состояние в G. При І^(^)І — R2| = 1 (7.585) решение существует, когда ^і(0)-^<0, а х2(0)-£2 = +1 (7.586) или Хі(0)-^>0, а х2(0)£2 —1. (7.587) 558
При этих условиях уравнение (7.583) дает оптимальное по быстродей¬ ствию управление к области G, а уравнение (7.584) — управление, удер¬ живающее состояние в области цели G. Обозначим через С+, С__ и С следующие множества состояний: С+={(х1, х2): — I <х2 < 4-1; <0} (7.588) С- ={(%!, х2): —1<х2<+1; %і>0}; (7.589) C = C+UC_UG. (7.590) Множество С называют областью управляемых состояний. Закон управления 7.12г (решение задачи 7.12 при 0 = 0). Управление как функция от состояния (хь х2), переводящее у и у в нуль и удержива¬ ющее их в этом состоянии, единственно и определяется следующим об¬ разом: и* =■. ц*(хх, %2) = +1 Для всех (хъ и* и* (хѵ х2) = —1 для всех (хх, х2)^С_; и* = и* (хь л'2) = —х2 для всех (хх, х2) Ç G. Если (xb х2) £ С [см. уравнение (7.590)], то управления (оптималь¬ ного или какого-либо другого), переводящего у и у в нуль и удержива¬ ющего их в этом состоянии, не существует. Область управляе¬ мых состояний и некоторые из оптимальных траекторий пока¬ заны на рис. 7.80. Рассмотрим несправедли¬ вость замены системы = \u(t)\< 1 (7.592) системой г/(/)-u(t); \u(t)\< 1, (7.593) которая эквивалентна замене передаточной функции пере¬ даточной функцией Легко показать (см. § 7.10), что для системы (7.593) управление Рис. 7.80. Оптимальные по быстродействию траектории к области G для объекта с пере- даточной функцией G (s) =—р . Управляемыми являются не все состояния «(/) = —sign {«/(/)}, u(t) = 0, (7.591) (7.594) z/(0 ¥= о 1 é/(0 = о J переводит у в нуль за минимальное время и после этого удерживает его в том же состоянии независимо от величины у (/), поскольку у (/) не входит в состояние системы (7.593). Мы, однако, установили, что в системе (7.592) в общем случае невозможно уменьшить у (f) до нуля в случае, когда пере¬ менная х2 (/) = у (Z) — и (/) по абсолютной величине превосходит 1 (I х2 (О I > 1), или, эквивалентно, когда |#(0| > 2. Итак, заменив си¬ стему (7.592) системой (7.593), считают, что рассматривают управляемую систему. Последнее неверно, если | у (/) | >>2. Таким образом, неожиданно возникают проблемы устойчивости системы. 559
Кратко перечислим результаты, полученные в данном параграфе. Мы установили, что при наличии в передаточной функции системы мини¬ мально-фазового нуля р > 0 на фазовой плоскости существует конечная область G, и задача состоит в следующем: 1. Перевести состояние системы в G за минимальное время при помощи кусочно-постоянного (релейного) управления. 2. Заставить систему оставаться в области G при помощи управления, представляющего собой затухающую экспоненту. Если передаточная функция содержит неминимально-фазовый нуль, то задача состоит в пере¬ воде исходного состояния в начало координат фазовой плоскости при по¬ мощи постоянного (релейного) управления. Если р = 0, то существуют неуправляемые состояния. 7.13. УПРАВЛЕНИЕ ОБЪЕКТОМ, ИМЕЮЩИМ ПЕРЕДАТОЧНУЮ ФУНКЦИЮ С ДВУМЯ ИНТЕГРИРУЮЩИМИ ЗВЕНЬЯМИ И ДВУМЯ НУЛЯМИ В этом параграфе мы рассмотрим задачу об оптимальном управлении объектом, передаточная функция которого содержит два нуля и два полюса. Основная цель изучения этой системы — дать конкретный пример применения более общей теории, развитой в § 7.14. Мы сконцентрируем внимание в основном на определении области G и на показе трудностей, которые при этом возникают. Рассмотрим области конечных состояний на конкретных примерах. Прежде чем приступить к ним, заметим, что более общие понятия в § 7.14 являются прямым продолжением материала настоящего параграфа. Рассмотрим объект, выход которого у (/) связан с управлением и (/) дифференциальным уравнением второго порядка ÿ (/) = ц(/) + b^t) 4 bou(t). (7.595) Будем считать, что управление и (/) ограничено по величине: |и(/)|<1 для любого /. (7.596) Объект (7.595) описывается передаточной функцией -^4- = #(*) = + b\s + bn = (s + + . (7.597) и (s) v 7 s2 s2 V 7 Таким образом, нули расположены в точках s = —рг и s = —132; при этом — Рі ’ Рг» = Рі 4~ Рг- (7-598) Будем считать, что постоянные Рі и р2—действительные числа. Рассмотрим следующую задачу. Для системы (7.595) найти управление и (/), удовлетворяющее ограничению |и(/)|<1 и переводящее выход системы у и скорость выхода у в нуль за минимальное время и затем удер¬ живающее их в этом состоянии. Определим переменные состояния (фазовые координаты) уравнениями *і(0 = у(0 —ло«(О; I х2(0 = */(0 — I (7.599) Из уравнений (7.595) и (7.599) находим, что фазовые координаты удовлетворяют дифференциальным уравнениям Х1(/)-х2(/) + М(^); (7.600) х2 (/) = и (/) 4- bYu (/) 4- bQu (/) — hou (/) — (/). (7.601) 560
Замечаем, что (t) не зависит от ù(t) и и (t). Чтобы х2 (t) также не зависела от и (/) и и (Z), следует выбирать /г0=1, (7.602) Уравнения (7.599) принимают вид *і(0 = — 1 x2(0 = ÿ(0-«(0-W)- (7’603) Дифференциальные уравнения (7.600) и (7.601) преобразуются к виду *i(0 = x2(t) + Ihu (0; I x2(t) = bou(t). I Предположим, что при t = t* имеем </(/*) = ў(/*)^0 и хотим найти управление и (/), t > t*, для которого 1/(0 = і/(0 = 0 ПРИ любом t > t*. (7.604) (7.605) (7.606) Подставляя уравнения (7.605) и (7.606) в уравнение (7.603), находим, что фазовые координаты должны удовлетворять соотношениям Хі (0 = —и (/); x2(t) = —и (t) — byu (/). (7.607) Поскольку то, подставляя Уравнения %і(/) — — и (Q, уравнение (7.608) в систему (7.604), получим Лі (0 — bixi (0 "h (0> 1 . ■^2 (0 “ (0> J (7.609) можно записать в векторном виде хі /* Х2 (0 (7.608) (7.609) Обозначим \ (О' _х2 (/) через Q матрицу -Ь, 1 -ь0 о (7.610) Q = '-Л 1’ _—ь0 о. • (7.611) Нетрудно показать, что собственными значениями матрицы Q яв¬ ляются —Рі и —132, т- е- нули передаточной функции H (s) совпадают с собственными значениями матрицы Q. Уравнение (7.610) представляет собой однородное векторное дифферен¬ циальное уравнение при t t*. Его можно решить, выразив хх (/) через «начальные условия» %х (Z*) и х2 (^*) и получить (0 = ѵ=грг[*1 (z*) (-IV-₽1 (і-(,)) + Ч л-2(/*)(е-3-</-/*>)], (7.612) 561
Но так как хг (7) = —и (f) при t 5» t* и | и (7) | < 1 при любых t, ввиду уравнений (7.608) и (7.596) при t t* должно быть I 1*1 П + p2^ U-<‘)) + 4-x2(7*)(e-₽> «-<•> —<-П)]| < 1. (7.613) Итак, для того, чтобы наверняка выполнялось соотношение y(t} — у (t) = 0 для любого t^t*, (7.614) необходимо, чтобы при любом t /* обеспечивались условия (7.608), (7.610) и (7.613). Определение 7.42. Обозначим через G множество всех состояний (^*), х2 (t*)> удовлетворяющих соотношению (7.613) при любом t t*. Множество G будем называть областью цели. Это множество замкнуто и выпукло, начало координат является элементом из этого множества1 . Так как уравнение (7.613) определяет G параметрически, необходимо получить выражение [алгебраическое соотношение между xr (t*) и х2 (/*) ] для границы 2 G, обозначенной dG. Это необходимо для того, чтобы можно было сформулировать оптимальный закон управления по отношению к области G. Опишем методику вывода этого уравнения. Введем функции (t) и q2 (/), положив <71(0 = рг1р;-- (-0іе-₽1 u-z’’ + I (7.615) <72 (0 = рг1рі ’> - е~е' «-<’>) для t*. Заметим, что <7і(Н=1; <7гГ) = 0. (7.616) Используя Çi (7) и </2 (7), можно определить область G как G = {(%!, х2) : (t) + x2q2 (7) | < 1 для любых 7 5» 7*}. (7.617) Предположим, что нули передаточной функции расположены в левой полуплоскости s, т. е. р2>₽!>0. (7.618) Легко показать, что lim (7) = lim ç2 (7) = 0. (7.619) t-> OO t-ÏCO Так как каждая из функций qr (t) и q2 (t) является непрерывной функцией времени, то функция Ç (0 = -Мі (0 + x2q2 (7) (7.620) такова, что функция | q (/) | должна принимать максимальное значение в некоторый конечный момент времени /, t t*, поэтому для любого t ф t справедливо |<7(7)|<| ?(7)|. (7.621) 1 В общем виде мы докажем это положение в § 7.14. 2 См. определение 3.10. 562
Поскольку область G замкнута, состояние (xlf х2), принадлежащее границе dG области G, можно найти из соотношения |?(?)| = 1, или, эквивалентного ему, І*і<7і (0 4-х272(0і = I- (7.622) Найдем множество точек (хх, х2), удовлетворяющих уравнению (7.622). Так как \q (/)( имеет максимум при t = t, то (7-623) Поскольку при t = 7 функция q (t) имеет либо максимум, либо минимум, то ЛК I - Г (/) I _1_ V (0 1 _ П /7 fi9zn dt ІК ’ dt \і^+х*—дГ~ °- (7-624) Можно найти и —из соотношения (7.615), подставить их в (6.624) и получить t — t* = log 02-31 (7.625) X1P1 X2P1 Подставив последнее соотношение в уравнение (7.622) после алгебраи¬ ческих преобразований, получим 1 ( Х1Р2 Х2$2 р2 Р1 Х1₽2 — Х$! ( Рл + х2) + (7.626) Следовательно, если р2 > Рі > О, то состояние (х1( х2), удовлетворя¬ ющее уравнению (7.626), принадлежит к границе области G. Предположим теперь, что один, или оба нуля расположены в правой полуплоскости s (т. е. являются неминимально-фазовыми). Для опреде¬ ленности примем, что ₽!<0. (7.627) Из уравнения (7.615) имеем lim|<7i(0l = lim|ç2(0| = ©о. (7.628) /->00 /-> ОС Следовательно, для функции q (Z) = xlql (/) + x2ç2 (t) справедливо lim | <?(/) | = oo при любых xt 0, x2=^0. (7.629) /-> oo Но мы хотим найти такое множество (хх, х2), что | q (/) | < 1. На осно¬ вании уравнения (7.629) получим: если хх = 0, х2 = 0, (7.630) то \q (/)| = 0 для любого t t*. (7.631) Итак, если хотя бы один из нулей не является минимально-фазовым (Рі <0, Рг <0 или Рі < 0 и р2 <0), то область G состоит из единствен¬ ной точки \ а именно, начала координаты фазовой плоскости. 1 Заметим, что множество, состоящее из одной точки является замкнутым и выпуклым. 563
Наконец, рассмотрим случай 01 = О и 02 >0, (7.632) т. е. когда один нуль расположен в начале координат, а второй — в левой полуплоскости. Подставив значения (7.632) в уравнение (7.615), находим qi (t) = и—**); <72 (О = (7.633) Следовательно, функция q (/) == xrqx (t) + x2q2(f) обладает свой¬ ством : 1іт|<7(0| = 4-І*2І- (7.634) (_>оо Іэ2 Но так как множество G есть множество точек (хъ х2), для которых |ç(/)| < 1» из уравнения (7.634) следует |х2|< 02. (7.635) Если справедливо неравенство (7.635), то условие |?(/)| < 1 дает соотношение ЫСІ. (7.636) Поэтому, если 0! = 0, 02О 0, то областью цели является G = {(хь х2): |хх| < 1; |х2| < 02j. (7.637) На основании вышеизложенного сделаем следующее заключение. Если оба нуля минимально-фазовые, то граница области dG определяется уравнением (7.626). Если любой из нулей неминимально-фазовый, то область G и ее граница dG состоят из единственной точки (0, 0). Наконец, когда один из нулей сокращается с полюсом, а другой является мини¬ мально-фазовым, то область G определяется соотношением (7.637). Поскольку сначала мы должны за минимальное время перевести состояние в область G, то для отыскания экстремальных управлений необ¬ ходимо пользоваться условиями трансверсальности. Однако в общем случае области имеют углы, и поэтому условиями трансверсальности надо пользоваться очень осторожно. Следующие три примера посвящены решению задачи об оптимальном по быстродействию управлении для конкретных значений 0і и 02. Мы будем излагать результаты очень конспективно, предоставив читателю самому разобраться в деталях. Основная цель — показать вид линий переключе¬ ния и областей конечных состояний. Пример 7.8. Рассмотрим систему с передаточной функцией = G (s) = <s+1)2(s+2) . (7.638) и (s) v s2 v ' При этом в уравнении (7.597) мы приняли 0і = 1; 02 = 2; bQ =2; br = 3. (7.639) Фазовыми координатами [уравнение (7.603) 1 являются *i(t) = y(t)—u(ty, ] (7.640) х2 (0 = у (t) — и (/) — За (t). ) Эти координаты удовлетворяют дифференциальным уравнениям Xi (t) = x2(t) +3и (ty, 1 (7.641) x2(/) = 2u(Z) j 564
[см. уравнение (7.604)]. Граница области G получается подстановкой Рх — 1, Р2 = 2 в уравнение (7.626). После алгебраических преобразований имеем (*і — х2)2 4 (2хх — х2 ) Последнее уравнение распадается на два уравнения х2 = Хі + 2 + 2 Ѵ1 — Xi, |хх I 1; х2 =хх — 2 — 2/1 4-Xi, (7.642) (7.643) (7.644) Итак, точка (хь х2) принадлежит границе dG, если она удовлетворяет одному из урав¬ нений (7.643) или (7.644). Область G показана на рис. 7.81. Для отыскания оптимального управления к области G решим уравнение (7.641) при и=Д=±1 и получим уравнения траекторий. При хх (0) = и х2 (0) g2 находим Хі (/) == Hi 4- 4~ “Ь ЗД^Ц хг(Г) = Ъ+2Ы. J (7-645) Исключая время /, получим соот¬ ношение + = Ê1 - 4" Л?2 + “Г + + -ГХ2 1“52. <7-646) Итак, траектории представляют собой параболы с вершинами, располо¬ женными на прямой х2 = —Д. (7.647) На рис. 7.81 показаны кривые у+ и у_. Кривая есть множество точек, которые можно перевести в точку В Ç G управлением и = 4"1, а кривая у_ множество точек, переводимых в точку A Ç G управлением и = —1. Из уравне¬ ний (7.643) и (7.644) нетрудно найти коор¬ динаты точек А и В: л=(—1, 1+2/г); 1 (7 б48) В =(1, —1 — 2 V2). J Рис. 7.81. Область G для объекта с переда- „ , « (s 4~ 1 ) (s + 2) п точной функцией — —!—— . Линии переключения обозначены через у_ и у+. Пунктиром показаны оптимальные по быстро¬ действию траектории Итак, из соотношений (7.646) и (7.648) находим уравнения кривых у+ и у_: (7.649) ( 1 9 3 V— = х2) : Х1 = 4" х2 + ~2~ х2 + *1^—1; (7.650) Кривые у+ и у. и область G делят плоскость ххх2 на две области /?+ и 7?_, как пока¬ зано на рис. 7.81. Если состояние принадлежит к области 7?+, то оптимальным является управление и* — +1, а если к /?_, то оптимально управление и* = —1. В том случае, когда состояние принадлежит к области G, оптимальным является управление и* (/) = —х1 (/). (7.651) Штриховыми кривыми на рис. 7.81 показаны оптимальные траектории к области G. Мы предоставляем читателю доказать, что этот закон управления действительно оптимален по быстродействию. Пример 7.9. Рассмотрим систему с передаточной функцией = G (s) = (s + 1).(5~V (7.652) и (s) s2 ’ что соответствует следующим значениям параметров уравнения (7.597): Рі = і> р2 = —I; = ^і=о. (7.653) 565
Система имеет неминимально-фазовый нуль при s = = 1. Фазовые координаты [см. уравнение (7.603)] определим как хі (0 = y(t) — и (0; 1 *2(0 = У (П — «(О- I (7’654) Дифференциальные уравнения относительно этих координат [см. уравнение (7.604)] имеют вид Х1 (0 = х2 (/); I Ч (t) = J (7.655) Так как один из нулей неминимально-фазовый, об¬ ласть G состоит только из начала координат. Поскольку система (7.655) очень похожа на систему, рассмотренную в § 7.2 (сравните уравнения (7.655) и (7.5)], легко пока¬ зать, что закон управления, изображенный на рис. 7.82, является оптимальным по быстродействию. Уравнениями кривых у+ и у_, показанных на рис. 7.82, являются ( 1 9 ) Y-l- = I(хр х%): хі — 2~ х2' , (7.656) Y— = f(*p ; хх = x2sgo|. (7.657) объекта с передаточной функ- „ и , х (s + 1) (S — 1) циеи /7 (s)= - является начало координат. Линия переключения пред¬ ставляет собой параболу Оптимально управление и* = +1 для состояний из R+ и и* = —1 — для состояний из /?_. При хх — х2 —0 и* — 0. Пример 7.10. Рассмотрим систему с передаточной функцией = G (s) = 21£+_LL (7.658) U (s) ' s2 ’ что соответствует следующим значениям параметров уравнения (7.597): Рі=0; ₽2 = 1; ^о=О; ^ = 1. (7.659) Система имеет нуль в начале координат плоскости s. Фазовые координаты системы равны [см. уравнение (7.603)]: *і (О = y(t)—u(t); *2 (0 = y(t)—û(t) — Они НИЯМ удовлетворяют дифференциальным уравне- Х1 (0 = х2 (0 — и (О; і2(П =0. Так как х2 (0 = 0, х2 (/) — х2 (0) = £2 для любого t. (7.662) (7.660) (7.661) ^еупраіляемьіе. //состояния // 4W -1 7 « у *і и =~1 'Неуправляемые, ^состояния7// Это означает, что мы не в состоянии управлять величиной х2 (t). Область G для этой задачи определяется в виде G = {(х1( х2) : І*і 1. І*2 I 1), (7.663) Рис. 7.83. Областью G для объекта с передаточной функ- u и t \ $ (S “Ь 0 циеи H (s) = — является единичный квадрат т. е. представляет собой квадрат, показанный на рис. 7.83. Из уравнения (7.662) непосред¬ ственно следует, что если | £21 1, то управления, способного перевести систему в область G, не существует. Это означает, что выход системы у (/) и его скорость у (/) невозможно сделать равными нулю и затем удерживать их в этом состоянии. Если I Ê21 < 1, то состояние можно перевести в область G управлением «* (0 = —sign {Хх (<)}; I Хх (ti ) I > 1. (7.664) 566
Если ?2 = 1 и *1 (0 > 1 или ^2 == —1 и Хі (О < —1, то система опять оказывается «неуправляемой». Если |2 = 1 и хх (t) < —1 или g2 = — 1 и (0 > 1, то система «управ¬ ляема», причем оптимально управление и* (0 = — sign {| хг (0 |}. В том случае, когда состояние принадлежит б, управление должно быть равно и* (0 — —xt (t). Область «управляемых» состояний и некоторые оптимальные траектории к области G показаны на рис. 7.83. 7.14. ОБЩИЕ РЕЗУЛЬТАТЫ ОТНОСИТЕЛЬНО ОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЯ ОБЪЕКТАМИ, ИМЕЮЩИМИ В ПЕРЕДАТОЧНЫХ ФУНКЦИЯХ ДИФФЕРЕНЦИРУЮЩИЕ ЗВЕНЬЯ В предыдущих двух параграфах мы рассмотрели задачу об оптималь¬ ном управлении системами второго порядка, передаточные функции кото¬ рых содержат нули и установили, что наиболее важным шагом анализа таких систем является определение области G. После того, как область конечных состояний определена, можно сформулировать закон управления по отношению к этой области и найти управление, которое удерживает состояние в этой области. Нашей задачей является обобщить результаты, полученные в §7.12 и 7.13 на системы с произвольным числом полюсов и нулей в их передаточ¬ ных функциях. Мы обратим внимание на особенности постановки и реше¬ ния задач оптимального управления, связанные с наличием нулей в пере¬ даточных функциях. Рассмотрим систему, выход у (0 и управление и (0 которой связаны линейным дифференциальным уравнением zz-ro порядка коэффициентами Р" + + • • • + a^D + a0]y(t) - = {bnDn -|- Ьп_гОп~} -)-••• + t>iD 4- bq] u(t). Это уравнение можно записать в виде 1=0 /=0 где у(о(/)== z = 0. 1 ..... и; ’ и(П (t)= , i = 0. 1 ,. . п. dt1 ] Известно, что (0 = у (t) и (t) = и (0. Система, описываемая уравнением (7.665), имеет функцию уу = bnsn 4- 4 P Z?1S 4- /?0 sn 4- an_1sn~~ï + ... 4-tfiS 4-a0 с постоянными (7.665) (7.666) (7.667) передаточную (7.668) Предположим, что нули H (s) различны и расположены в точках: s = _рь s = -р2, . .., s = -₽п, (7.669) а полюса H (s) находятся в точках s ——sb s = —$2, .. ., s=—sn. (7.670) Таким образом, передаточную функцию можно записать в виде H (s) = Л(s + pl) (s + Р2) • ■ •. 4+l?n) • (7.671 ) (s 4- si) (s 4- s2) ... (s 4" sn) Корни полинома Г+-4І^Л~1+ ••• +4-^ + ^ (7-672) Un ®П 567
равны À=—pz, 4 = 1, 2, . .., n, (7.673) a корнями полинома 4" an-i^n 1 • • • + являются числа À = —sz, 4=1, 2, .. n. (7.674) (7.675) До того, как ставить задачу об оптимальном по быстродействию управлении системой (7.665), полезно сравнить ее с системой, которая описывается дифференциальным уравнением {Dn + 4- • • • + a.D + а0} у (t) = bou(t) (7.676) и имеет передаточную функцию G (s) = - . (7.677) s + On-iS +---+ais + ao Вектором состояния системы (7.676) является вектор !/(0 y(f) у(п~2' (О Ь(п_1) (о_ Пусть при t = /* у(/*) = 0 и мы хотим найти управление и (/) такое, чтобы у (0 = 0 для любого />/*. Из уравнений (7.679) и (7.680) следует у(п) (/) = 0 для любого /> а также {Dn + an-J^n 1 H- • • • + ûjD 4“ Æol ÿ(0 — 0, t>> t*• Это означает, что управление должно быть равно и (/) = 0 для любого t*. (7.678) (7.679) (7.680) (7.681) (7.682) Обратимся теперь к системе (7.665) и предположим, что при t = /* у(/*) = 0. (7.683) Попробуем опять найти управление и (t) такое, чтобы у(/) = 0 для любого />/*. (7.684) Рассуждая аналогичным образом, установим, что такое управление должно быть решением дифференциального уравнения {bnDn + bn_1Dn~l + ... + + ьо} u(t) = 0; /> Л (7.685) Следовательно, управление и (t) имеет вид «(0= S «,(/*) t=l (7 686) где коэффициенты az (/*) зависят от и (/*), и (/*), . . ., и^п~^ (/*). Эти рассуждения приводят к следующему выводу. 568
Замечание 7.1. Даны системы (7.665) и (7.676). Предположим, что у (t*) = 0. Для системы (7.665) управление имеет вид ы(0= È t>t*, (7.687) i=i а для системы (7.676) управление н(/) = 0, />/* (7.688) обеспечивает у (0 = 0, />/*. (7.689) Известно х, что вектор состояния х (t) для системы (7.665) можно выразить через вектор у (/) [см. (7.678)1, а управление и (t) и его (п — 1)-производную определить следующим образом: = у (t) — hüu (t); x3(t) — y(t) —hou(t) — hlU(ty, x3 (0 = У (0 — hou (0 — hÿi (t) — h2u (t); (7.690) Xn (0 = y(n~" (0 - hou(n~" (t) - M""1 2’ (0 M (0 или более сокращенно в виде 1—1 Xi(t) = 1=1, 2,..., n. (7.691) k-=0 Фазовые координаты xt (t) нениям 2 удовлетворяют дифференциальным урав- (7.692) 1 См. § 4.10. 2 См. уравнение (4.187). 569
Константы Ло, hn_lt hn, фигурирующие в уравнениях (7.690) и (7.692), можно найти из соотношений 1 /г0 = Ьп\ Ьп-т = Ьт 2, • • •» Я К 693) п—1 hn^ bo— S «Л- t=o Пусть в некоторый момент времени t = t* вектор у (Z) равен нулю: у(/*) = 0 (7.694) и мы ищем такое управление, чтобы у (/) = 0 для любого t>t*. (7.695) Подставив соотношения (7.695) в уравнение (7.690), найдем (0 = hou (/)* (0 = bou (/) hxu (/); 696) хп (0 = -hou{n~" (/) - hlU(n--} (Z) hn_xu (Z). . Так как xx (/) = —hou(t) при /;>/*, (7.697) то получим «(/) = при />/*. (7.698) «0 Подставляя это соотношение в уравнение (7.692), можно записать: x(t)—Qx(t) при />/*, (7.699) где Q — матрица размера пХп, состоящая из действительных чисел: _ А. Ло 1 0 . . . 0 ^2 V 0 1 . . . 0 , (7.700) hn-i h0 0 0 . . . 1 hn — "о —а, —а2 . • • —ап-і где Q — известная матрица, так как при помощи уравнения (7.693) можно выразить /г0, hlf . . ., hn через известные постоянные а0, аъ . . . . . ., ап_ѵ и Ьо, blt . . ., Ьп. Уравнение (7.699) представляет собой линей¬ ное векторное дифференциальное уравнение, и поэтому его решение х (t) можно выразить через х (t*) [так как уравнение (7.699) справедливо при />/*]. Это решение имеет вид х(і) = eQ при />/*, (7.701) где —фундаментальная матрица уравнения (7.699). Обозначим через q (/) первый вектор-строку матрицы е^-**), а через q± (/), 1 См. уравнение (4.189). 570
?2 (0, • • -, Яп (і) — его компоненты. Таким образом, (/) — элемент первой строки и Z-го столбца матрицы При t > /* имеем п Х1(0 = {q{t\ x(t*)) = S 9>г(/*) (7.702) 6=1 и из уравнения (7.698) находим 1 п ы(П = -4-Е<7((ОМН. *>t*. (7.703) п0 6=1 Замечание 7.2. Дана система (7.665) или ее эквивалентное представ¬ ление в пространстве состояний (фазовом пространстве) в виде уравнений (7.692); при t - /* y(t*) = Q. (7.704) Если при t > t* прикладывать управление 1 п u(0 = -pS?/(0^n (7.705) Л0 6=1 ТО у(/) = 0 при любом />/*. (7.706) Рассмотрим далее одно очень важное свойство матрицы Q. Лемма 7.1. Матрица Q (7.700) обладает свойством det (AJ — Q) =(Х" + -^Г”1 Н +-^-À +-^-)(—1)п, (7.707) откуда следует [см. уравнения (7.672) и (7.673)], что собственные зна¬ чения Q равны: Z = —р., і = 1, 2, ..., и. (7.708) Элементы доказательства. Тот факт, что собственные значения ма¬ трицы Q являются нулями передаточной функции H (s) [уравнение (7.691)1, можно проверить прямым вычислением det (X/ — Q) при по¬ мощи уравнения (7.693). Существует также другой путь доказательства того; что собственные значения Q равны —рх, —р2, . . —₽„• Предполо¬ жим, что собственные значения равны ——у2, • • •» —Уп- Тогда в урав¬ нении (7.702) Хі (/) можно записать в виде следующей суммы экспонент: п *,(/) = S />/*, (7.709) 6=1 где постоянные ôt (/*) являются функциями от xt (/*) и известных кон¬ стант. По уравнению (7.698) можно написать п u(t) = £ z>z*- (7.710) 6=1 Мы знаем, однако (см. замечание 7.1), что из у (/) = 0 при t > /* следует [см. уравнение (7.687) ] и(/)= />/*. (7.711) б=і Из уравнений (7.710) и (7.711) заключаем, что V/= Pz, /= 1, 2, .. ., п. (7.712) Сформулируем теперь следующую задачу об оптимальном управ¬ лении. Дана система (7.665) и ограничение на управление |и(0| < 1 при любом t. (7.713) 571
Найти управление и (О’ а) переводящее у (0 в 0 за минимальное время /*; б) удерживающее выход в нуле после перевода его в это состояние. Предположим, что мы нашли управление, при котором у (/*) = О, где /* — минимальное время. Из замечания 7.2 известно, что для у (/) = О при любом / > требуется = = *>**■ (7.714) "О і=1 ао Но так как |м (/)| < 1 при любом t, то должно выполняться условие I — •«((*)) I < 1 при любом (7.715) I "о I Определение 7.43. Обозначим через G следующую область состояний х: G = {x:|-Д- х)|< 1, t^t*. (7.716) Эту область будем называть областью цели. Лемма 7.2. Область G, определяемая уравнением (7.716), замкнута, выпукла и содержит своим элементом начало координат х = 0. Элементы доказательства. Сначала докажем, что область G замкнута. Напомним (см. определение 3.7), что область называется замкнутой, если ее каждая предельная точка является элементом этой области. Рассмотрим последовательность хп в G, п — 1, 2, . . ., т. е. *„)|<1, (7.717) I "о I причем хп сходится к х'- хп—*х. (7.718) Предположим, что точка х не является элементом G (т. е. G не зам¬ кнута). Тогда найдется такой момент времени /, Z /*, когда I —-À- (<7(î), х} |> 1 + е; е > 0, (7.719) но loi 1 +1-М' (7’72О) I I I I где последний шаг подтверждается неравенством треугольника (§ 2.13). Используя неравенство Шварца [см. § 2.12, уравнение (2.90)1 и урав¬ нение (7.717), получим соотношение |-J-(^(?), x)|<|--^|k(Ô||U-x„||+ 1, (7.721) где знак || || обозначает эвклидову норму. Так как хп сходится к х, то можно выбрать п таким, чтобы к - II - -, , I . ■ (7 722) и поэтому из соотношения (7.721) получим неравенство *>| + 1- (7.723) 572
(7.724) (7.725) (7.726) Соотношения (7.719) и (7.723) противоречат друг другу. Следова¬ тельно, точка X принадлежит G, и поэтому область G замкнута. Докажем теперь, что область G выпукла. Напомним (см. определение 3.18), что область G выпукла, если для любых х и у из G и г + s = 1, г 0, s О, точка гх + sy принадлежит G. Рассмотрим две точки xt и х2 из G: /zo I t-^t* ио I и два действительных числа г и s: г + s -- 1, r^O, s>0. Мы должны показать, что I — у- \Ч rX\ + sx2) I < 1, при любом t > t*. Последнее соотношение справедливо, поскольку I - 4гrxi+sx^ I=I—ir +(—4r)s (Z)> x^ I <cr| —лг^І + sl —ЛГ3>| <r-hs= 1, t^t*. (7.727) Доказать, что 0 является элементом G, очень просто: I—0) I = 0< 1 при любом t^t*. (7.728) Замечание 7.3. Задачу об оптимальном управлении системой (7.665) можно теперь сформулировать относительно фазовых координат следу¬ ющим образом. Дана система (7.692). Управление и (/) ограничено неравен¬ ством \и (0| С 1. Найти управление и (/), которое переводит любое состояние, не принадлежащее области G, в эту область за минимальное время (что эквивалентно переводу вектора у (/) в 0 за минимальное время), а также удерживает любое состояние из области G в этой области в течение какого угодно времени (что эквивалентно удержанию у (t) в 0). Чтобы полностью решить задачу, необходимо найти область G. Рас¬ смотрим поэтому некоторые свойства этой области. Лемма 7.3. Если хотя бы одно из pz, / = 1, 2, . . ., п является отрицательным числом или имеет отрицательную вещественную часть, то область G состоит из единственной точки, являющейся началом коор¬ динат пространства состояний. Иначе говоря, если р. <0 или для любого из i, ÇI.T2S) то G = {аг : ат = 0}. (7.730) Таким образом, если передаточная функция H (s) содержит хотя бы один неминимально-фазовый нуль, то областью цели является начало координат. Элементы доказательства. Для определенности предположим, что ₽!<0, Р2>0, Рз>0, Р„>0. (7.731) Это означает, что одно из собственных значений матрицы Q поло¬ жительно; следовательно, система (7.699) неустойчива. Так как решение уравнения (7.699) включает член е-Зі (*-**), обнаруживаем lim II q (/)|| = оо, (7.732) / —> оо 573
откуда следует, что если х =£ О, то 1іт|-4-<<7(0, х)|= со. (7.733) /—>оо I П0 I Если, однако, х = 0, то | —-^-(#(0> х) I =- 0 при любом t^t* (7.734) и уравнение (7.730) следует из определения 7.73. Предположим теперь, что все [3f действительны и различны. Это означает, что передаточная функция H (s) содержит только минимально¬ фазовые нули. Если 0< ₽! < ₽2<- • •< (7.735) то собственные значения Q отрицательны и система (7.699) устойчива. Отсюда 1іт||^ (ОН = 0, (7.736)1 t -> 00 поэтому область G содержит более одного элемента. К сожалению, опре¬ деление области G в виде соотношения (7.716) не позволяет написать алге¬ браического выражения для его границы. Но так как область G замкнута и выпукла, можно утверждать следующее. Определение 7.44. Обозначим через dG границу области G. Очевидно, что dG = ^:|-Л (q(t), л)|= 1, (7.737) Чтобы получить дополнительную информацию относительно границы области dG, поступим так же, как и в § 7.13. Функция | — -А-^(^), х) | есть непрерывная ограниченная по величине функция времени при Следовательно2, для фиксированного х из dG функция — X принимает наибольшее абсолютное значение в некоторый I "о I момент времени /, Если /*, то '«((). л<т- 0. (7.738) Максимальное значение функции равно 1, так как х принадлежит dG, и поэтому л)|= 1. (7.739) С помощью уравнений (7.738) и (7.739) можно «исключить» t и полу¬ чить уравнение для компонент х. Итак, рассмотрим следующее замечание. Замечание 7.4. Если выполняется условие (7.735), то точка л: при¬ надлежит dG, если она удовлетворяет уравнениям (7.738) и (7.739). Предостережем читателя, что в общем случае невозможно в явном виде выразить t через х из уравнения (7.738), а затем подставить его в урав¬ нение (7.739). Итак, отыскание области G является исключительно сложным делом, а не имея алгебраического уравнения границы G, конечно, не¬ возможно полностью решить задачу об оптимальном по быстродействию управлении (почему?). 1 См. § 3.26. 2 См. § 3.10. 574
До сих пор мы полагали, что число нулей равно числу полюсов, т. е. (7.740) В оставшейся части параграфа мы определим область G для случая = ••• =^+і = 0, k = 0, 1, . .., n — L (7 741) Это означает, что система описывается дифференциальным урав¬ нением вида [Dn + an_xDn 1 + • • • + arD -|- У (J) = = {bkDk + b^D*-1 +ЬгО + Ьи} и(t). (7.742) Подставляя значения (7.741) в уравнение (7.693), находим й0 — — • • • — hn_k_{ — 0; ^n-k “ n—m—1 hn-m = bm— S m= 1, 2, .. k— 1; l—n—k n—1 hn = b0 — S afit- i=n—k Уравнения (7.690) записываются в виде *i(0 = У (0; х2(0 == z/(0; = y'n~k~ï} (0; х„_4_2(0 = y(n~k+" (t) - hn.ku (0 - hn_k+lu (0; xn (0 = ÿ"1"” (0 - hn_ku(k-l) (t) h^u (t).. (7.743) (7.744) Фазовые координаты удовлетворяют дифференциальным уравнениям МО = х2(0; х2(0 = х3(0; (/) = хп_к (/); Xn-k(0 = xn_k+ï (0 + hn_ku(ty, Xn-k+1 (0 = ^-n-fe+2 (0 4” hn-k+lU (0» n—1 xrt (t) — 2 сухі+і (0 H- hn4 (0 (=0 Полагая в уравнениях (7.744) y(t) = y{t)= ••• = y(n-"(t} = 0, t^t^, находим X!(0 = x2(0= ••• =x„_fe(0 = 0, Z>/*; xn-M (0 = hn_ku (0, (>t*. (7.745) (7.746) (7.747) 575
Таким образом, подставляя в последние k уравнений (7.744) «(0 = Г~Хп-к+Л^ t>t*> “n-k получим %n-k+2 (0 — . ^(0 _ ^n-k+1 hn-k 1 0 . . . 0 " hn-k+2. hn-k 0 1 ... 0 ^n-k+2 ( hn-k Qn-k) ( ^n-k+1) ( ^n-k+2) • • • ( ^n-1) (7.749) при любом /£>/*. Это уравнение является векторным дифференциальным уравнением вида x(t) = Qx(t) при /> t *, где х (t) — /г-мерный вектор, компоненты которого представляют собой последние k компонент вектора х (/), и Q — матрица размера kxk; det (V- Q) = (кк + Л*-1 + ... + A- X + JM (-1Д (7.750) и поэтому k собственных значений Q являются нулями системы (7.742). Так же, как и ранее, находим xn-k+i(t) = при />/*, (7.751) где q (/)—вектор-строка (первая) фундаментальной матрицы . Из уравнений (7.751) и (7.748), а также из неравенства | и (0 | < 1 находим, что соотношение I г—(^(0, 1 (7.752) I я?г-/г I должно выполняться при всех /> Z*. Определение 7.45. Областью G системы (7.745) является множество G = M“-(7.753) I I rLn-k I . X, = x2 = • • • = xn_k = 0; t* Эта область также замкнута и выпукла. То обстоятельство, что размер¬ ность X меньше размерности х, может оказаться полезным, особенно в случае, когда k = 1 или k = 2. Пример 7.11. Если k = 1, (7.754) то уравнение (7.747) сводится к уравнению (/) = х2 (t) = ... = xn_j (t) = 0; t >t* (7.755) и Xn {t) = - hn^u (/). (7.756) 576
Уравнение (7.743) принимает вид — hi — • • • = /zn-2 ~ О» hn-л = bi\ hn — bv — an-ibi, и из уравнения (7.756) получим соотношение «(/) = —-^-Х/2 (0. (7.757) (7.758) В заключение сформулируем основные результаты, полученные в трех последних параграфах. Мы нашли, что управлять объектами с мини¬ мально-фазовыми нулями значительно сложнее, чем объектами, переда¬ точные функции которых не имеют нулей, и установили, что перед тем, как найти линии или гиперповерхности переключения, надо определить в пространстве состояний область G и свести задачу об оптимальном по быстродействию управлении к переводу состояния в G за минимальное время, а затем приложить управление, удерживающее состояние в G. В случае системы высокого порядка и при наличии большого коли¬ чества нулей аналитическое определение границы области конечного состояния является задачей крайне трудоемкой, если вообще разрешимой. Однако, когда имеется единственный минимально-фазовый нуль, то об¬ ласть G, как видно из примера 7.11, оказывается очень простой. Если объект имеет несколько неминимально-фазовых нулей, то и в этом случае область цели G состоит из единственной точки, а именно, начала координат. Встречаются случаи, когда область G оказывается очень сложной, и инженер, столкнувшись с проблемой проектирования оптимальной системы, не в состоянии даже найти границу области цели G, не говоря уж об оптимальном законе управления. В таких случаях хорошая субопти¬ мальная система должна заменить область G более простой или даже просто началом координат. Получившаяся система не будет оптималь¬ ной \ но она будет намного проще оптимальной, не намного уступая ей по времени переходного процесса. Упражнение 7.71. Для каждого из объектов: а) H(s) = S ~r 1 6) Я (s) = S S (s 4- 2) ’ S (S 4-2) ’ г) Я (s) = s 4-3 Д) Я (s) = s— 1 s (s 4- 2) ’ s (s + 2) ’ ж) Я (s) = S 3) Я (s) = s 2 ф (s 4-2) (s 4-4) ’ (s 4-2) (s+4)’ к) Я (s) = s 4- 4 Л) Я (s) = s 4- 5 (s 4-2) (s 4-4) ’ (s 4- 2) (s 4- 4) ’ е) Н (S) ~ (S + 2) (s + 4) ’> И) //(s) = (s+2Hs+4); м) H (s) = „ * ; H(s) = н) 1) напишите уравнения переменных состояний (фазовых координат) через выходные пере¬ менные и управление и его производные; 2) напишите дифференциальные уравнения в фазо¬ вых координатах; 3) найдите области G и нарисуйте их границы 2; 4) обсудите, полностью ли управляема система; 5) найдите оптимальный по быстродействию закон управления. Упражнение 7.72. Для каждого из объектов найдите область G и ее границу: a) H(s) = (s+l)(s+2) s - (s -j— 3) 6) H(s) = (s-t l)(s + 2) - (s + 4) (s + 3) ’ B) H (S) _ (s+l)(s + 2) . , H ( , _ (s+ 1) (s 4-2) B) ~ s(s + 3)(s4-4)> Г} - (s 4-3) (s 4-4) (s 4-5) • 1 Подобного рода системы принято относить к квазиоптимальным (Прим. ред.). 2 Очевидно, предполагается, что | и (/) | 1 (Прим. ред.). 19 Атанс и др. 577
7.15. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ В этой главе мы рассмотрели способы, которые используются при проектировании оптимальных по быстродействию систем с обратной связью для различных объектов, описываемых простыми дифференциаль¬ ными уравнениями. Подход, в своей основе, на протяжении всей главы был один и тот же: мы получали возможно больше информации, применяя принцип минимума, а затем использовали эту информацию совместно с видом траекторий системы в пространстве состояний (фазовом простран¬ стве) для получения и доказательства закона управления, оптимального по быстродействию. После определения закона управления нам становится известным, какое управление следует прикладывать в каждом из состояний, и тем самым мы «спроектировали» оптимальную по быстродействию систему управления. В технической реализации оптимального закона управления использовался элемент релейного типа, при помощи которого получалось кусочно-постоянное оптимальное управление. Мы установили, что в слу¬ чае системы второго порядка с одной управляющей переменной необхо¬ димо подвергнуть нелинейному преобразованию одну из фазовых коорди¬ нат системы. Зависимость выхода от входа для этой нелинейности иден¬ тична линии переключения. Точное уравнение линии переключения опре¬ деляется уравнениями траекторий. В § 7.11 была предложена методика экспериментального определения линии переключения. Мы обнаружили, что линии переключения для колебательных систем сложнее, чем для систем неколебательных. Были предложены субоптимальные устройства, основанные на оптимальных решениях, но существенно упрощающие реа¬ лизацию систем. За исключением задачи, решенной в § 7.9, наше внимание было скон¬ центрировано на нормальных системах с единственной управляющей переменной. Мы показали, что в случае систем второго порядка формули¬ ровка закона оптимального управления (аналитического или эксперимен¬ тального) сводится к задаче отыскания линии переключения, разделяющей фазовую плоскость на две области. Уравнение этой линии переключения определяет вид нелинейности, требующейся для построения оптималь¬ ной по быстродействию системы с обратной связью. Сложность управляющего устройства системы с обратной связью быстро возрастает с порядком системы. Реализация закона управления для системы третьего порядка, рассмотренная в § 7.4, иллюстрирует это обстоятельство. Для систем выше третьего порядка требуется применять итерационные методы, позволяющие решить систему трансцендентных уравнений, которые описывают гиперповерхность переключения. Это об¬ стоятельство сильно осложняет применение теории. Однако читателю должно быть ясно, что системы высокого порядка можно достаточно точно аппроксимировать системами более низкого порядка, и поэтому для суб¬ оптимального управления системами высокого порядка можно использо¬ вать управляющее устройство, аналогичное показанному на рис. 7.66. Даже в случае очень сложной гиперповерхности переключения с прин¬ ципиальной точки зрения работа оптимальной по быстродействию системы не представляет никаких особых трудностей. Очень часто знание оптималь¬ ного решения может помочь проектировщику сконструировать превосход¬ ную субоптимальную систему \ Те же замечания относятся и к проектиро¬ ванию субоптимальных систем для объектов, передаточная функция кото- 1 К числу многочисленных работ, в которых рассматриваются субоптимальные си¬ стемы, относятся [72], [122], [162], [181] и [206]. 578
рых содержит более одного нуля. Материал, представленный в § 7.13 и 7.14, показывает, что для таких задач определение оптимального закона управления является сложной проблемой. Поэтому хорошую субоптималь¬ ную систему часто можно построить, рассматривая более простую область цели. Можно поступить и еще проще, выбрав в качестве области цели начало координат. Во всяком случае инженер может допустить некоторое увеличение времени перехода, используя при этом более простое оборудование. Разумность такого решения зависит, конечно, от целей применения и наличного оборудования.
ГЛАВА 8 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО РАСХОДУ ТОПЛИВА 8.1. ВВЕДЕНИЕ В § 6.11—6.16 мы рассмотрели общую формулировку задачи об опти¬ мальном расходовании топлива. Читателю следует вернуться к знакомому ему уже материалу гл. 6 и в особенности освежить в своей памяти: опре¬ деление нормальных задач, оптимальных по расходу топлива (определе¬ ние 6.11); определение вырожденных задач (определение 6.12); принцип релейного управления («включено—выключено»; теорема 6.11); достаточ¬ ные условия нормальности (теорема 6.13); теоремы единственности (тео¬ ремы 6.14 и 6.15) и материал § 6.21 и 6.22, где рассматриваются вырожден¬ ные задачи. Заметим, что теория систем с минимальным расходованием топлива разработана не так полно, как теория систем, оптимальных по быстро¬ действию. Проектирование таких систем сложнее, чем аналогичных систем, оптимальных по быстродействию. Дополнительные сложности возникают из-за постановки самой задачи. Если мы хотим спроектировать систему, удовлетворяющую разумным тре¬ бованиям в отношении расходования топлива, то мы должны иметь широ¬ кий выбор функционалов Ч Иначе говоря, мы можем включить время перехода в функционал, поскольку система с очень большим временем перехода непрактична с инженерной точки зрения. Конкретный выбор функционала, учитывающего как расходуемое топливо, так и время пере¬ хода, — дело проектировщика. Неопытный инженер может перебрать много критериев, решить оптимальную задачу для каждого из них и лишь после этого сделать выводы о проектировании системы, так как трудно предсказать, насколько «хорошим» окажется решение, до тех пор, пока задача не будет решена. В этой главе мы сформулируем несколько задач управления для одного и того же объекта, но при различных критериях. После этого мы сможем сравнить различные оптимальные системы и, что, возможно, более важно, определить тип оборудования, требующегося для реализации каждой из них. Кроме этого, мы сможем сравнить структуру различных оптимальных систем, чтобы установить, является ли такая структура одной и той же для широкого класса систем. В гл. 7 мы видели, что оптимальное по быстродействию управление разнообразными систе¬ мами второго порядка было одинаковым, так как оно определялось при помощи линии переключения, делящей фазовую плоскость на две области. 1 См. § 6.15. 580
Нас интересует теперь, происходит ли то же самое и в системах, оптималь¬ ных по расходу топлива. С этой целью мы рассмотрим в настоящей главе подобные системы второго порядка с различными критериями. Примеры систем, оптимальных по расходу топлива, которые мы рас¬ смотрим, представляют собой поступательное движение массы при ус¬ ловиях: 1) сила трения и упругие силы отсутствуют; 2) сила трения пропорциональна скорости; 3) сила трения является нелинейной функцией скорости. Будем считать, что управляющая сила создается реактивным двига¬ телем, причем ее величина ограничена и пропорциональна величине расхода топлива. Так как мы для упрощения изложения рассматриваем системы второго порядка (переменные состояния — это положение и скорость массы), то принимаем, что масса топлива, потребляемого на интервале управле¬ ния, пренебрежимо мала по сравнению с массой тела. Ввиду этого пред¬ положения рассматриваем систему с постоянной массой х. В этой главе будут проиллюстрированы следующие основные поло¬ жения: 1. Решение, оптимальное по расходу топлива, для ряда систем не существует, хотя это и может показаться несколько странным (в § 8.3 и 8.5 мы увидим, что это возможно). В таких случаях часто можно найти управление, для которого требования в отношении расходования топлива сколь угодно близки к идеальному минимальному количеству топлива, т. е. 8-оптимальные управления. 2. Оптимальное по расходу топлива управление для некоторых систем неединственно. Другими словами, существует много управлений, требу¬ ющих одинакового количества топлива. Однако в этом случае времена перехода различны (§ 8.2 и 8.4). 3. Формулировка и решение задач с заранее заданным временем перехода. Оптимальное по расходу топлива управление в этом случае является как функцией исходного состояния, так и заданного времени перехода, и поэтому не может быть выражено в функции только одного (текущего) состояния. 4. Формулировка и решение задач, в которых время перехода задано как функция минимального времени, требующегося для перевода из лю¬ бого состояния в начало координат (см. § 8.7). 5. Введение функционала стоимости, который является «взвешенной» суммой потребленного топлива и затраченного времени, с целью обойти неразумные с практической точки зрения аспекты решений с минималь¬ ным количеством топлива в случаях, когда время перехода либо не за¬ дано вообще, либо фиксировано (§ 8.8—8.11). Мы покажем, что опти¬ мальные по быстродействию и по расходу топлива (с незаданным време¬ нем перехода) управления получаются путем соответствующих предель¬ ных переходов. 6. Способ субоптимального управления, приводящий к упрощению оптимального управляющего устройства (§ 8.9). 7. Вырожденные управления могут быть оптимальны по расходу топлива лишь в случае, если уравнения системы нелинейны (§ 8.10 и 8.11). В линейной системе такое положение не имеет места. Так же, как и в гл. 7, некоторые леммы мы будем доказывать очень подробно, а доказательства остальных опустим. Попытаемся вести чита¬ теля от аналитических доказательств и построений к доказательствам 1 См. § 6.11 и 6.12. 581
и рассуждениям, основанным на графических способах. Действуя таким образом, мы покажем, что довольно часто общий вид функций, а не раз¬ вернутые формулы, можно использовать для графического определения оптимального управления. Критерий, связанный с оптимальным расходом топлива, часто возни¬ кает в задачах авиационной и космической техники. Движение ракет, спутников и других космических кораблей осуществляется за счет горения топлива или истечения газа из двигателя. Вес аппарата является одним из основных показателей, и поэтому необходимо включать топливо в функционал такого рода задач. Решения многих задач об оптимальном расходовании топлива были получены без помощи принципа минимума х. Использованные при этом способы в большинстве своем представляют собой смесь полуклассических вариационных методов и физических обосно¬ ваний. Читатель обнаружит, что зачастую использование принципа мини¬ мума упрощает доказательства, но, в общем случае, не уменьшает вычи¬ слительных затруднений. Применение принципа минимума к решению задач об оптимальном расходовании топлива рассмотрено в работах [3], 16], [7], [8], [13], [14], [15], [16], [29], [71], [73], [76], [104], [120], [121], [139], [160], [161], [162] и [167]. 8.2. ЛИНЕЙНЫЕ СИСТЕМЫ ПЕРВОГО ПОРЯДКА. ИНТЕГРАТОР В этом и следующем параграфах мы рассмотрим задачу оптимального по расходованию топлива управления системами первого порядка. Хотя системы первого порядка более или менее тривиальны, их изучение позво¬ ляет обнаружить некоторые важные характеристики, являющиеся общими почти для всех систем, оптимальных по расходованию топлива. Прежде чем строго математически сформулировать задачу, начнем с физического описания системы. Предположим, что нам задана масса т, совершающая поступательное движение без трения. Пусть у (/) — ее ско¬ рость в момент времени /, а и (/) — прикладываемая сила или тяга от реак¬ тивного двигателя. Разумно ожидать, что величина тяги ограничена, и поэтому примем , |а(0І < 1 ПРИ любом /. (8.1) Предположим также, что величина расхода топлива или газа пропор¬ циональна тяге. Расход топлива пропорционален модулю управления MOI; (8.2) из этого предположения следует, что, удваивая расход топлива, мы наме¬ реваемся получить вдвое большую тягу. Такое предположение часто или справедливо, или является хорошим приближением к действительности. В этом случае величина т F (и) = F = J | zz (/) | dt (8.3) о пропорциональна количеству топлива, потребляемому на временном интервале [0, Т]. Будем считать, что масса потребляемого топлива мала по сравнению с массой движущегося тела 1 2. 1 Многие задачи такого рода рассматриваются в работе [151], которая содержит также обширный список литературы. 2 Такое предположение часто справедливо для небольшой коррекции траектории и положения космических аппаратов. Оно, конечно, неприменимо к стартовым ступеням (бустерам), большую часть массы которых составляет топливо. 582
Если все сделанные предположения справедливы, то скорость тела у (t) удовлетворяет дифференциальному уравнению >ш/(/) = «(/). (8.4) Предположим, что при t = 0 скорость равна у (0) и нам задано же¬ лаемое значение скорости yd. Задача состоит в следующем: найти управ¬ ляющую тягу и (/), которая изменит скорость с у (0) на yd, требуя при этом минимального количества топлива F, измеряемого соотношением (8.3). Время перехода Т при этом безразлично. Обозначим через %(/) «ошибку» в скорости: x{t) = y(t) — yd. (8.5) Для простоты примем т=1. (8.6) Из уравнений (8.5) и (8.4) найдем, что х (t) является решением урав¬ нения x(t) = u(t\ (8.7) поскольку yd = const. Ошибку X {t) назовем состоянием (8.7). Название «интегратор» в заголовке параграфа связано с тем, что х (t) = J и (т) dx. Сформулируем теперь для системы (8.7) математическую задачу. Задача 8.1. Дана система (8.7), управление в которой ограничено соотношением (8.1) и заданы состояния: исходное х (0) = ^=40и конеч¬ ное X = 0. Найти управление, переводящее £ в 0 таким образом, чтобы функционал F (8.3) был минимален. Время Т не задано. Задача 8.1 не отвечает достаточным условиям нормальности задачи об оптимальном расходовании топлива (см. теорему 6.13). Дело в том, что хотя система х (t) = и (/) нормальна, матрица системы А (скалярная величина 0) состоит из нулевого собственного значения. Далее мы уви¬ дим, что «ненормальность» задачи 8.1 имеет своим следствием неедин¬ ственность оптимальных управлений. Приступим к доказательству, используя принцип минимума. Гамиль¬ тониан И задачи H=\u(t)\ + u(t)p(t). (8.8) Дополнительная переменная р (/) удовлетворяет уравнению /Л)=0’ (8.9) откуда следует p(t) = л = const. (8.10) Управление, абсолютно минимизирующее 7/, равно u(t) = 0, если |р(0| < 1; (8.11) = — sign » |р(/)|>1; (8.12) 0 С и (t) < 1, » p(f) = — 1 ; (8.13) — !<«(/) <0, » р(0= + 1. (8.14) Уравнения (8.11) и (8.12) однозначно определяют управление и (t) в виде нелинейной функции от р (t). Уравнения же (8.13) и (8.14) опре¬ деляют только полярность, но не величину управления, минимизиру¬ ющего Н. Как мы увидим ниже, это приведет к неединственности опти¬ мальных по расходу топлива управлений для системы (8.7) 583
Отступим от обычного порядка действий и займемся вычислениями, которые определяют нижнюю границу расхода топлива. Сначала проин¬ тегрируем соотношение (8.7) и получим t х(0 £ + f ^(т)Л. (8.15) Так как в незаданный момент времени Т должно быть х (7) = 0, то получим т = — (8.16) 0 откуда, в свою очередь, следует 1 (8.17) Итак, для перевода £ в 0 потребуется не менее чем | g | единиц топлива, поскольку F |£|. Таким образом, если мы найдем управление и* (/), требующее У7* единиц топлива [т. е. F (и*) = F* ] У7* -|g|, (8.18) то такое управление w* (/) можно считать оптимальным по расходу топ¬ лива. Далее увидим, что найти такое управление возможно. Пусть и* (Z) — такое оптимальное управление, тогда (при g 0) должны удовлетворяться два уравнения и JK(O|^ = |||. (8.20) о Определим на интервале [0, T1 множество V+ неотрицательных ограниченных функций ѵ (/) так: Ѵт = (t) : 0 < V (t) < 1 для t Q [0, TJ; v (/) не равна тождественно нулю}. (8.21) Тогда управление £/*(/) =-sign {g) v(t) С V+ (8.22) удовлетворяет уравнениям (8.19) и (8.20). Из соотношений |и*(0|4-и*(0 = (1—sign{|})u(0 и ||| —1 = (1—sign[|))||| . следует Jü(/)d/ = lll. о 1 См. уравнение (3.108). 584
Поэтому существует бесконечное число функций v(t), каждая из кото¬ рых требует отличного от других времени перехода Т, причем т ^v(t)dt = Ц|. О Итак, мы доказали следующий закон управления. Закон управления 8.1 (решение задачи 8.1). Оптимальное по расходу топлива управление как функция состояния х определяется: «•(') = -«(<): «>0;) Х<О; J 1 ’ где V (/) £ V+ [см. уравнение (8.21)1. Это оптимальное управление не¬ единственно. Обратимся теперь к принципу минимума и посмотрим, можно ли полу¬ чить те же самые результаты. Так как система (8.7) инвариантна во времени и время перехода Т не задано, то гамильтониан должен быть тожде¬ ственно равен нулю. Поскольку р (/) = л, из этого условия следует H = I и (0| 4- и (t) л = 0 для любого t £ [0, Т]. (8.24) Если и (Z) = 0, то уравнение (8.24) превращается в тождество при любом л. Если и (Z) 0, то из уравнения (8.24) следует л — — sign \и (/)} ± 1, (8.25) так как | и (t) | = sign {и (/)} и (/), но р (/) = л при любом t Ç [0, 7] [см. уравнение (8.10)]. Поэтому |р (/)| = 1 при любом t £ [0, Т] и, следовательно, минимизация гамиль¬ тониана дает уравнения (8.13) и (8.14), которые, как мы уже отмечали, определяют только полярность, но не величину управления. Если выбрать Л — sign [g}, (8.26) то на основании уравнений (8.25), (8.26), (8.13) и (8.14) можно заклю¬ чить, что управление и* (t) [см. уравнение (8.22) ] переводит £ в 0. Так как это управление u* (t) удовлетворяет необходимым условиям принципа минимума, оно должно быть оптимальным по расходу топлива. Этот результат согласуется с выводами, сделанными нами ранее. Проверим теперь, что минимальное количество топлива как функция состояния является решением уравнения Гамильтона—Якоби Е Иначе говоря, мы должны показать, что функция 7* (х) -- \х\ (8.27) является решением уравнения аг* аг* +|w*(0| +u*(0_^_ = 0. (8.28) Если X ■■= 0, то F* (х) = 0 и и* (t) = 0, поэтому уравнение (8.28) удовлетворяется. Если х =j= 0, то аг* аг* 4- = °; <- = signW; IW* (01 -= v (t'y, и* (t) = — sign V (t); v{t) с v+. (8.29) 1 См. § 5.20. 585
Подставляя соотношения (8.29) в левую часть уравнения (8.28), получим ü (0 — sign {х} sign {х} V (/) = 0. (8.30) Итак, нами доказано, что F* = |х| является минимальным количе¬ ством топлива и управление и* (/) оптимально по расходу топлива. В тех случаях, когда решение задачи оказывается неединственным, математическое описание, как правило, усложняется. Но с практической точки зрения неединственность оптимальных управлений часто полезна, так как среди множества управлений можно выбрать одно, обладающее дополнительными «полезными» свойствами. Проиллюстрируем это на двух примерах. Пример 8.1. Рассмотрим управление и (/), определенное как функция состояния х (t) следующим образом: u* (t) == — sign {х (/)}, если I X (Z) | 1. U*(f)=_Х(/), « |х(/)|<1. (8.31) Предоставляем читателю убедиться, что управление (8.31) оптимально по расходу топлива. На рис. 8.1 показана система с обратной связью, вырабатывающая управление Рис. 8.1. Оптимальная по расходу топ- по формулам (8.31). Полезным свойством этой системы является то, что канал обратной связи линеен. Ограничитель (или элемент с насыще¬ нием) на рис. 8.1 дает ограничение |и (/)|^1. Недостаток устройства — ошибка обращается в нуль лишь при бесконечно большом времени, хотя время, требующееся для того, чтобы сде¬ лать ошибку достаточно малой, конечно. Пример 8.2. Рассмотрим управление «*(0 = —sign {х(/){, если |x(Z) I и* (t) =0, » x(Z) =0. J лива система для управления, опреде- Легко доказать, что управление (8.32) ляемого уравнениями (8.31) оптимально по расходу топлива (в уравнении (8.23) можно выбрать v (t) — +1 для [0, Т]). Желательным свойством такого управления является его оптимальность и по быстродействию Ч Время Г, требующееся для перевода состояния х в 0 управлением (8.32), равно Т — | х| т. е. минимальному времени, и количество потребляемого при этом топлива I X I — наименьшее из возможных. Очень часто надо выделить управления, являющиеся оптимальными по расходу топлива и дающие наименьшее возможное время перехода Т, не отыскивая весь класс управлений, оптимальных по расходу топлива. В оставшейся части параграфа рассмотрим этот способ. Пусть задана система x(/) = u(Z); |и(/)|<1 (8.33) с начальным состоянием х (0) = % =)= 0 и функционалом 1 2 т J= (8.34) о где время перехода Т не задано и £>0. (8.35) Требуется найти управление, переводящее систему (8.33) из £ в 0 и мини¬ мизирующее функционал J. Гамильтониан Н для системы (8.33) и функционала (8.34) равен Я- k -1-M0I + (8.36) 1 См. § 7.10, уравнение (7.442) и, в частности, упражнение 7.58. 2 Сравните с задачей 6.2ж. 586
Тогда = (8.37) и поэтому p(t) = л = const. (8.38) Управление и (О, абсолютно минимизирующее гамильтониан (8.36), выражается уравнениями (8.11)—(8.14). Так как система (8.33) инвари¬ антна во времени и время Т в функционале (8.34) не задано, то гамиль¬ тониан должен быть равен нулю при всех t Ç [О, Т]. Если | л | <1, то (01 <1 Для любого t £ [0, Т1 и по уравнению (8.11) и (t) = 0 для всех t Q [0, Т]. В этом случае Н = /г > 0, (8.39) откуда следует, что управление и (0 = 0 не является оптимальным х. Если I л I = 1, то I р (Z) I = 1 при любом t [0, Т], и по уравнениям (8.13)—(8.14) имеем и (0 = —sign {л} ѵ (0, ѵ (t) £ V+ В этом случае Н= £>0, (8.40) и поэтому управление и (/) = —sign (л) v (t) не может быть оптималь¬ ным. Если |л| > 1, то \р (0| > 1 при любом t £ [0, Т] и, согласно урав¬ нению (8.12), управление и (t) = —sign (л). Тогда H = k+\ — J л I = 0, (8.41) откуда получается соотношение (k > 0) |л| = £+ 1>1. (8.42) Следовательно, управление не меняет знака, и поэтому u(t)=- sign {В} (8.43) является экстремальным управлением, переводящим систему (8.33) из | в 0. Так как экстремальное управление единственно и существует, то уравнение (8.43) должно определять оптимальное управление. Действи¬ тельно, управление (8.43) является оптимальным по быстродействию для системы (8.33). Так как \и (0| = 1 при любом t £ [0, Г], то мини¬ мальное значение «/, обозначенное через «/*, равно т J* = J(é+ i)dt = (é+ Ï)T. (8.44) о Но управление (8.43) оптимально по быстродействию. Поэтому время перехода Т минимально, т. е. T = (8.45) Следовательно, /* = (* + l)|g|. (8.46) Заметим также, что limJ* = П| = F*. (8.47) £->0 Иначе говоря, в пределе, при k —> 0, минимальная стоимость J* превращается в минимальное количество топлива F*. Отсюда следует, что управление (8.43) оптимально также и по расходу топлива. Управле¬ ние (8.43) требует наименьшего времени. В дальнейшем с помощью пре- 1 Оптимальным по отношению к функционалу (8.34). 587
дельного перехода покажем, что в ряде случаев можно найти оптимальное по расходу топлива управление, требующее минимального времени перехода, отыскав ( т } limjmin Ç [k 4-1 u(t) | ] dt\ . (8.48) p (O J J В этом параграфе нами показано, что может существовать много управлений, оптимальных по расходу топлива. В частности, управление, оптимальное по быстродействию, может быть также оптимальным и по расходу топлива. Упражнение 8.1. Рассмотрите систему х (t) = и (t), | и (/) | 1. Минимизируйте т расход топлива F = J | и (t) | dt, считая время Т заданным. Пусть Т больше минимального () времени и конечным является состояние х (Т) — 0. Для каждого Т найдите минимальное количество топлива F* (Т). Начертите график F* (Г) в функции Т, считая исходное состоя¬ ние фиксированным. Исследуйте полученные результаты. 8.3. ЛИНЕЙНЫЕ СИСТЕМЫ ПЕРВОГО ПОРЯДКА. АПЕРИОДИЧЕСКОЕ ЗВЕНО Рассмотрим поступательное движение единичной массы, когда сила трения (или сопротивления среды) направлена противоположно скорости и пропорциональна ей. Обозначим через у (/) — скорость, а через и (/) — движущую силу (силу тяги), которую будем считать ограниченной: I и (/) I < 1 при любом t. (8.49) При этих предположениях скорость у (/) удовлетворяет дифферен¬ циальному уравнению у (0 —сіу(0 + ^(0, я>0, (8.50) где ay(t) — член, соответствующий силе трения. Для удобства обозначим x(t) = ay(tY (8.51) Тогда х (/) удовлетворяет дифференциальному уравнению x(t) = —ax(t) + au(t). (8.52) Очевидно, X (0 можно рассматривать как состояние системы (8.52). Передаточная функция объекта (8.50) равна , и поэтому он назван апериодическим звеном. В этом параграфе решим следующую задачу. Пусть даны система (8.52), управление в которой ограничено соотношением (8.49); исходное состояние X (0) = | и достижимое конечное состояние х (Т) = Ѳ 4= £. Требуется найти управление, переводящее систему (8.52) из £ в Ѳ и минимизирующее при этом функционал т F(u) — F ~ § \u(t)\dt, (8.53) ù где время перехода Т может быть заданным или нет. Изложение основных идей будет достаточно беглым и нестрогим, многие результаты будут даны без доказательств. Математический аппарат достаточно прост, и поэтому читатель без труда сможет проверить любое из утверждений. Мы хотшм показать следующее: 588
1) часто решения, оптимального по расходу топлива, не существует; можно, однако, найти решение, почти оптимальное с практической точки зрения; 2) часто управление, оптимальное по расходу топлива, идентично управлению, оптимальному по быстродействию. Гамильтониан для системы (8.52) и функционала (8.53) равен Н = I и (/) I — ах (/) р (/) 4- au (/) р (t). (8.54) Дополнительная переменная р (t) является решением дифференциаль¬ ного уравнения Р (0 = — --- ар (t), (8.55) и поэтому при л = р (0) р (t) — neat. (8.56) Управление, абсолютно минимизирующее гамильтониан, равно и(0 = 0, если |ар(0|<1; (8.57) «(/) = — sign {ар (t)} если І«р(0І> 1; (8.58) 0 < u(t) < 1, если ap(t) = — 1; (8.59) -1 <«(/)< 0, если ap(t) = + 1. (8.60) Случай |ар(/)| = 1 при любом t £ [/ь /21 (8.61) невозможен. На основании этого из уравнения (8.56) делаем вывод, что в качестве возможных оптимальных управляющих последовательностей следует рассматривать только (0}, {+1}, (-1), {0, Л 1}, {0, -1}. (8.62) Нетрудно показать, что для перевода системы (8.52) из любого исход¬ ного состояния £ в Ѳ в течение конечного времени необходимо выполнение неравенства — 1 <Ѳ< + 1. (8.63) Это условие связано с «недостатком» интегрирования в системе (8.52) и ограничениями величины управления (8.49). Далее всегда будем пред¬ полагать, что условие (8.63) удовлетворяется. Рассмотрим теперь три случая: Случай 1. Пусть £ и Ѳ таковы, что sign ÎÊI = sign {Ѳ}, Ц|>|Ѳ|, £=4 0^=0. (8.64) Управление u(t) = O (8.65) переводит систему (8.52) из £ в Ѳ за время Т, равное <8-66> Последнее соотношение получается в результате подстановки управле¬ ния (8.65) в уравнение (8.52). Очевидно, количество топлива (8.53) равно нулю (что является наименьшей из возможных величин). Заметим, что lim? - оо. (8.67) Ѳ->0 589
Итак, если время перехода Т не задано и Ѳ =f= 0, то оптимальным по расходу топлива является управление и (t) = 0. Время перехода при этом равно Т. Если, однако, Ѳ = 0, то (строго говоря) оптимального по расходу топлива решения не существует, так как для всех конечных t X (/) 0 при и (t) = 0. Тем не менее должно быть ясно, что при и (/) = 0 к нулю можно приблизиться на любую наперед заданную малую величину в течение конечного времени, если Т может быть достаточно большим. Поэтому существует так называемое е-оптимальное управление. Случай 2. Пусть sign {g} = sign {Ѳ}, |5|<|Ѳ|< 1; (8.68) управление u(t) — sign {Ѳ} (8.69) является единственным оптимальным по расходу топлива. Время 7*, требующееся для перевода £ в Ѳ, равно Т* = — 10g-|-~sign . (8.70) а ь Ѳ — sign {Ѳ} ѵ 1 Минимальное количество топлива 7* составляет г* F* = J 1 dt = Т*, (8.71) о причем Т* — минимально возможное время \ которое требуется для перевода системы из £ в Ѳ. В этом случае управление, оптимальное по расходу топлива, идентично управлению, оптимальному по быстродействию. Если решить задачу для Т фиксированного, причем Т > 7*, то потребуется топлива больше, чем 7*. Случай 3. Пусть sign = — sign {Ѳ}. (8.72) Если время 7 не задано, то оптимальная стратегия управления со¬ стоит в следующем: управление и (t) = 0 подается на вход системы до тех пор, пока не будет достигнуто состояние х (t) = 0, а затем на вход системы подается и (Z) = sign {Ѳ} — пока не будет достигнуто состояние Ѳ. Как и в случае 1, можно возразить, что с математической точки зрения решения, оптимального по расходу топлива при незаданном времени 7, не существует. Однако при 7 достаточно большом можно найти 8-опти- мальное решение. Упражнение 8.2. Рассмотрите систему і(0= — x(0 + u(0, I и (01^1, (8.73) где Ѳ — 0,5 является желаемым конечным состоянием. Функционал имеет вид т F = J lu «)|d/. о а) Примите, что исходное состояние = 1 и время перехода Т задано. Начертите график минимального значения F в функции от Т. б) Повторите это же для %= —1. Упражнение 8.3. Рассмотрите систему (8.73) с функционалом т J = f (k 4- I и (t) I) dt, k > 0, (8.74) 1 Cm. § 7.10, упражнение 7.59. 590
(8.75) где Т не задано. Желаемое конечное состояние Ѳ = 0. Покажите, что оптимальное управле¬ ние, переводящее систему (8.73) из исходного состояния £ в конечное состояние Ѳ = 0 и минимизирующее J, выражается в функции от состояния следующим образом: и* = — sign {х(0)> если I х (f) I < k; и* =0, если I х (/) I k. Указание: так как Т не фиксировано, воспользуйтесь равенством гамильто¬ ниана нулю вдоль оптимальной траектории. Покажите, что если исходное состояние IÊK k, то управление (8.75) идентично управлению, оптимальному по быстродействию. Покажите, что минимальная величина J как функции от состояния х, обозначенная через J* (х), определяется соотношениями J* (х) = log I X I* ÏÈÜ) ргпи I y Î Ь' ) kk J J* (X) = log (|x| + 1)*+1 < ели |x| < k. J Покажите, что уравнение Гамильтона—Якоби для этой задачи имеет вид k — X —V2— — 0, если X /г; дх , + 1_^)_|^£)|=0) если|х|<£. ■ 1 дх I дх I 11 Докажите, что 7* (х) действительно является решением уравнения Гамильтона— Якоби. Покажите также, что lim J* (х) = 0. £->0 (8.76) (8.77) ОПТИМАЛЬНОЕ ПО РАСХОДУ ТОПЛИВА УПРАВЛЕНИЕ ОБЪЕКТОМ С ДВОЙНЫМ ИНТЕГРИРОВАНИЕМ 8.4. ПОСТАНОВКА ЗАДАЧИ 1 Рассмотрим движущуюся поступательно единичную массу при отсут¬ ствии трения. Обозначим через у (/) ее положение, а через и (/) —силу тяги. Будем считать, что управление ограничено по величине |u(0|< 1 при любом t. (8.78) Положение системы у (Z) является решением дифференциального уравнения (8.80) Â/CO = ^(0- (8.79) Напомним, что оптимальное по быстродействию управление систе¬ мой (8.79) рассмотрено в § 7.2. Предположим, что нам задано желаемое положение yd = const; наша цель — обеспечить управление системой (8.79) таким образом, чтобы при некотором Т получить у (Т) = yd, Если определить фазовые коорди¬ наты (/) и х2 (t), приняв л (0 = у (?) — уа, ч Ш = Ў (0, то эти (t) удовлетворяют дифференциальным уравнениям ^1 (0 = ^2 (0> j х2(/) = а(0. I Фазовая координата хг (/) представляет собой ошибку по положению, а х2 (0 — скорость массы. Займемся минимизацией функционала т F (и) = F — J I u(t) I dt, U (8.81) (8.82) 1 Этот вопрос рассматривается в работах [3], [7], [15], [71], [73], (121 ], [139] и [161]. 591
который характеризует расход топлива. Время Т есть время перехода. Примем, что масса потребляемого топлива мала по сравнению с массой летательного аппарата, и поэтому уравнения (8.81) являются хорошей аппроксимацией движения летательного аппарата. В § 8.5 рассмотрим минимизацию функционала (8.82) для системы (8.81), когда Т не задано. В § 8.6 рассмотрим минимизацию этого же функционала для системы (8.81) в случае, когда время перехода или фиксировано (Г = Г/), или ограничено заданной величиной T < Tf. В § 8.7 рассмотрим ту же задачу, но потребуем, чтобы время Т было ограничено произведением постоянной на минимальное время, соответ¬ ствующее каждому состоянию. В § 8.8 рассмотрим минимизацию функ¬ ционала т +|ы(0|]^ о с незаданным Т. В этом случае функционал является линейной комбина¬ цией времени перехода и израсходованного топлива. Мы будем часто использовать результаты и формулы, полученные в § 7.2, с целью сократить изложение. Для облегчения ссылок многие выводы будут сформулированы в виде лемм. 8.5. ЗАДАЧА С НЕЗАДАННЫМ ВРЕМЕНЕМ ПЕРЕХОДА В этом параграфе мы рассмотрим задачу оптимального по расходу топлива управления объектом с двойным интегрированием в случае, когда время перехода не задано (т. е. задачу 8.2). Изучение этой системы представляет интерес по следующим причинам: 1) имеются области исходных состояний, для которых решения, опти¬ мального по расходу топлива, не существует; 2) имеются области исходных состояний, для которых существует много оптимальных решений; 3) имеются области исходных состояний, для которых оптимальное по расходу топлива решение является единственным. Методика подобна изложенной в § 8.2. Сначала мы определим задачу, а затем найдем управляющие последовательности, которые могут оказаться оптимальными управлениями. Далее вернемся назад и найдем выражение для минимального расхода топлива в функции от состояния и, наконец, установим закон управления, оптимальный по расходу топлива (если оптимальное управление существует). В этом параграфе решим следующую задачу. Задача 8.2. Дана система Xi (t) = x2 (0; Х2(О = «(О. 1«(0І < 1. (8.83) Найти управление, переводящее систему (8.83) из любого исходного состояния (|х, g2) в начало координат (0, 0) и минимизирующее при этом функционал т F(u) = F-= § \u(t)\dt, (8.84) о где время перехода Т не задано. 592
Гамильтониан Н для данной задачи имеет вид /7 = I u(t) I + х2 (0 Рі (О + и (0^2 (0« (8.85) Управление, абсолютно минимизирующее гамильтониан, равно: и(/) = 0, если |р2(0І<1; (8.86) u(t) = — sign (р2(/)}, если |р2(0|>1; (8-87) 0<н(/)<1, если p2(t) =— 1; (8.88) — 1 < и (/) < 0, если р2 (0 + 1 • (8.89) Дополнительные переменные рг (/) и р2 (0 являются решениями канонических уравнений ^(/)==-0Г7й = 0; <8-90) С7Х1 Р2(0= - Ст) (8.91) 1/Л2 (/у из которых получим p1 (Z) = = const; (8.92) р2(0 - л2 —ЛіО (8.93) где ^і = Рі(0); л2^Р2(0). (8.94) Заметим, что если | р2 (/) I = 1 Для 6 OL то уравнения (8.88) и (8.89) определяют только полярность, но не величину управления и (/), t Ç [Zn /2]. Это условие вырожденности возможно, так как задача 8.2 не является нормальной х. Таким образом, получаем лемму. Лемма 8.1. Если л1 = 0; I л21 — 1, (8.95) то |р2 (t) I = 1 при любом t Q [0, Т]. (8.96) Следовательно, если v (Z) £ Ѵт, где I/+ = (/): 0 < ü (0 < 1 при любом t Ç [0, Т] и v (t) =f= 0 тождественно } (8.97) [см. соотношение (8.21)], то управление и(і) =—sign {л2| ü(/), v(t) £ vt (8.98) может быть управлением, оптимальным по расходу топлива. Доказательство. Подставив уравнения (8.92), (8.93), (8.95) и (8.98) в уравнение (8.85), получим Н = и (/) + х2 (/) -0 — v (t) =0 при любом t Q [0, Т], (8.99) и поэтому управление [по формуле (8.98)] может быть экстремальным. Лемма 8.2. Если лг + 0, (8.100) то оптимальными могут быть девять управляющих последовательностей {0}, {+11, {-1}, {+1; 0}, 1-1; 0}, {0; +1}, {0; —1}, {+ 1; 0; —1}, {—1; 0; +1}. (8.101) 1 См. определение 6.11 и теорему 6.13. 593
Доказательство. Если тц =f= 0, то |р2 (О | = 1 не более, чем при двух изолированных моментах времени. Так как р2 (/) — линейная функция времени (см. рис. 7.1), то из уравнений (8.86) и (8.87) получаются управляющие последовательности (8.101). Мы уже рассчитали траектории на фазовой плоскости для системы (8.83) при и = Д = ±1. Уравнения этих траекторий выражаются соот¬ ношениями (7.14)—(7.19), а вид траекторий показан на рис. 7.2. Если и (/) = 0, то решение уравнения (8.83) выражается соотношениями хі(0 — 5і + 52^’» I *2(0 = 52. і (8.102) Траектории при и (f) = 0 представляют собой прямые, показанные на <2 7 -7 1 Х1 -7 Рис. 8.2. Траектории системы (8.83) при и (t) — 0 рис. 8.2. Заметим теперь, что мы можем найти нижнюю границу расхода топ¬ лива как функцию исходного состоя¬ ния, воспользовавшись особенностями уравнений (8.83) 1}. Лемма 8.3. Обозначим через (gr, g2) исходное состояние, а через Е* (gb S2) — минимальное количество топлива (если таковое существует), требую¬ щееся для перевода (£ь £2) в (0, 0) за некоторое (нефиксированное) время Т. Минимальное количество топлива удов¬ летворяет соотношению (8.103) Следовательно, если существует управление и* (t), переводящее (5і, 52) в (0, 0) и требующее количество топлива |£2|, то и* (t) оптимально и F* (U £2) = |£2|. Доказательство. Для любого и (/) справедливо х2 (t) = и (/), откуда t x2(t) = + J U(r)dx. (8.104) и Так как при t = Т мы должны достичь начала координат, то х2 (Т) = = 0, и, следовательно, Можно записать неравенство т j и (t)dt и Т < § \ u(t)\dt = F. о (8.105) Если F5>|îj2|, то должно выполняться соотношение ^*(5i, tolU (8.106) Здесь уместно сделать несколько замечаний. Во-первых, подчеркнем, что соотношение Е^|^2| дает нижнюю границу |g2| для расхода топлива. Если есть управление, переводящее (£ь £2) в (0, 0), и при этом расхо¬ дуется количество топлива, равное |£2|, то можно быть уверенным в том, 9 Аналогичным образом мы поступали в § 8.2. 594
что это управление является оптимальным (по расходу топлива). Во-вто¬ рых, хотя доказательство леммы и не гарантирует, что наибольшей нижней границей является именно |£2|, мы покажем далее, что это именно так, и будем называть | g2 | (идеальным) минимальным количеством топлива. В-третьих, отметим, что уравнение (8.103) совершенно такое же, как и уравнение (8.18) в § 8.2, где требовалось уменьшить до нуля ошибку по- скорости при минимальном расходовании топлива, причем никаких требований относительно положения при t = Т не предъявлялось. Однако в данном случае мы должны уменьшить до нуля как ошибку по положению, так и величину скорости, если это возможно, израсходовав | g2 | единиц топлива. Можно сразу почувствовать, что при этом возникают некоторые проблемы. Например, если начальным состоянием системы (8.83) является (£і, 0), то мы должны перевести систему из (£г, 0) в (0, 0) с нулевыми затратами топлива. Отсюда следует, что и (0 = 0 при любом t Q [0, Т]. Решив уравнения (8.83) для и (0 = 0 и исходного состояния (£ь 0), мы получим, что (0 = £1 ф 0 при любом t. Следовательно, для началь¬ ного состояния (£ь 0) оптимального по расходу топлива решения не существует. Как мы увидим, имеются и другие исход¬ ные состояния, для которых, строго гово¬ ря, оптимального решения не существует1. Тем не менее можно найти управления, для которых затраты топлива сколь угодно близки к (идеальному) минимальному ко¬ личеству F* = I è21 (см. лемму 8.6). Для отыскания оптимальных по рас¬ Рис. 8.3. Кривые у+, и ось хх делят фазовую плоскость на че¬ тыре области R2, R3 и ходу топлива решений и областей исходных состояний, для которых оптимальных решений не существует, разделим фазо- вую плоскость х^2 на четыре области при помощи кривых и у- (см. определения 7.2 и 7.3) и оси хѵ Напом¬ ним, что кривые и определялись уравнениями (7.19) и (7.20) как ( 1 2 ) Y+ = хг) ■ хі = ~2-xï, х2 < 0| ( 1 2 ' Т- = 1(хі, хг) '• хі = 2~хг; х 2 0 (8.107) (8.108) Определение 8.1. 7?г, Т?2, Кз и — множества (области), показанные на рис. 8.3, определенные как #і = {(хь хг) :х2>0; Хі>Хь где (х'ь х2) £ у_}; (8.109) /?2 = {(хь х2):х2>0; хг<^х[, где (xj, х2) £ ?_}; (8.110) #3 = f(xi. х2> : х2 < 0; х,<Хь где (xj, х2) Q у+}; (8.111) /?4 = {(хь х2):х2<0; хг>Хь где (х'ь х2) £ у+). (8.112) Заметим, что ÜUV R-, R2U R+, (8.113) где и R- соответствуют определению 7.5 (см. также рис. 7.3). 1 Напомним, что в § 8.3 имел место аналогичный случай. 595
Лемма 8.4. Если (£х, £2) ( у+,то управление u(t) — + 1 оптимально по расходу топлива, причем это управление есть единственное оптимальное управление. Доказательство. Допустим, что л4 4= 0 и поэтому выполняется лемма 8.2. Тогда из всех управляющих последовательностей (8.101) лишь последовательность ( + 1} переводит (g4, |2) С V+ в начало координат. Если выполняется лемма 8.1, то управление и (/) должно определяться уравнением (8.98). Пусть хі (/) и х2 (/) — решения уравнений (8.83) с исходным состоянием (Êi, h) (: Ï+ и с управлением (8.98). Очевидно, %і (/) и х2 (0 определяются соотношениями t •МО = U + J [— sign {л2} ü(t)] ch; (8.114) о f т МО = 11 + Ы + j dx j [—sign (л2[ n(o)]da. (8.115) О о Пусть х4 (/) и х2 (t) — решения уравнений (8.83) при и (t) = +1, т. е. t л-2 (t) - g2 + J 1 dx; (8.116) О t т M'Wi + ^ + p-cJ Icfo- (8.117) Ü U Из уравнений (8.115) и (8.117) получим t T Xi (t) — Xi(t) J dx J [1 + sign {л2} и (о)] do 0. (8.118) о и Это означает, что траектория, производимая управлением (8.98), всегда расположена слева от кривой и поэтому она не попадает в начало координат. Таким образом, методом исключения приходим к выводу, что если (gj, ê2) С Ѵ+> т0 только управляющая последовательность ( + 1} (т. е. управление и (/) = +1) переводит (gx, g2) в (0, 0). Из уравнения (8.116) находим, что управление и (Z) = +1 требует |g2| единиц топлива для перевода (gx, |2) в (0, 0) и, следовательно, по лемме 8.3 оно должно быть оптимально. Лемма 8.5. Если (gx, g2) £ /?4, то существует множество оптималь¬ ных по расходу топлива управлений к началу координат. В частности, управляющая последовательность {0, +1}: а) оптимальна по топливу; б) имеет время перехода Т (£х, £2) T(Zi, g2) = - (-1- Ê2 + -|г) ; (8.119) в) требует наименьшего времени перехода среди всех оптимальных по расходу топлива управлений. Доказательство. Можно найти множество функций v(t) £ Ѵт (8.97), для которых управление и (t) = v (t) переводит (gx, g2) Ç T?4 в (0, 0), поскольку можно найти много неотрицательных функций ѵ (/), удовлетво¬ ряющих соотношениям Т T X — J dr Jü(o)do == — £х-~ g2T, (8.120) 0 Ü о 596
где Т не задано. Время Т, вообще говоря, различно для различных v (t). Так как из (£ь g2) £ Т?4 следует, что £2 <0, то нетрудно видеть, что т J и(а)Лт = IÊ2I. О и поэтому каждая функция v (t), удовлетворяющая уравнениям (8.120), оптимальна по расходу топлива (согласно лемме 8.3). Рассмотрим теперь управляющие последовательности (8.101). С по¬ мощью рис. 7.2 и 8.2 приходим к выводу, что только последовательности !0, +1} и ( — 1, 0, +1} могут перевести (£ь £2) показаны траектория АВО, полученная при помощи последовательности {0, +1), и траек¬ тория ACDO для последовательности {—1, 0, +1). Рассмотрим сначала траекторию АВО. Так как и = 0 на участке АВ, то на этом интервале топливо не расходуется. Так как ордината точки В на кривой равна ё2, количество топлива, потребляемого на траектории ВО, равно |£2|, и по лемме 8.3 управляющая последовательность {0, +1} оптимальна по расходу топлива. Эта управ¬ ляющая последовательность дает неотрица¬ тельное управление, удовлетворяющее урав¬ нениям (8.120) и принадлежащее к Vt- Управляющая последовательности {—1, 0, + 11 и траектория ACDO не могут быть опти¬ мальны. Такой вывод следует из рассмотре¬ ния рис. 8.4 или из вычисления требующе- Ç Т?4 в (0, 0). На рис. 8.4 думается как результат управ¬ ляющей последовательности {0; 1}, а траектория ACDO — последовательности {—1; 0; +1} гося количества топлива. Можно также показать, что управляющая последовательность не является оптимальной по расходу топлива, используя необходимое условие, согласно которому гамильтониан равен нулю вдоль оптимальной траектории. Для этого пред¬ положим, что (gx, £2) и управляющая последовательность {—1, 0, + 1} оптимальна по расходу топлива. В этом случае, поскольку и (0) = = —1, мы имели бы [см. уравнения (8.87), (8.92) и (8.93) ] р2(0)= л2>1; р1(0) = л1. (8.121) Подставив последние два соотношения в уравнение (8.85), найдем, что при t = 0 гамильтониан равен //|^=о = I — 1 I 4- ^2Лі — л2. (8.122) Гамильтониан должен быть тождественно равен нулю, так как в этой задаче время перехода не задано, а система (8.83) инвариантна во времени. Но из соотношения 1 — л2 <0 следует, что ^2лх > 0 [так как (gx, £2) С £ Т?4, то Н2 <0]. Поэтому должно быть лх<0; л2> 1. (8.123) Но если jij<0 и л2>1, то (Z) = л2 — лх/ >> л2 > 1 при любом t > 0. (8.124) Если р2(0>1 при ^>0, т0 такое р2(/) может дать лишь управля¬ ющую последовательность {— 1} и не может давать последовательности {—1, 0, 4-1}. Итак, мы пришли к противоречию, на основании которого делаем вывод о том, что последовательность {—1, 0, +1} не может быть оптимальной. 597
В качестве упражнения предлагаем вывести уравнение (8.119) и пока¬ зать, что время перехода (8.119) наименьшее. У Казани e:T = Jd/ = и т о = Ç . dt = f . Нами показано, что любое управление и (f) = J ахл J Хо О 1 6, 2 = V (О С Ѵт> удовлетворяющее уравнениям (8.120), является оптималь¬ ным по расходу топлива и, следовательно, управление, соответствующее последовательности (0, +1), также является оптимальным по расходу Рис. 8.5. Определение множества (гео¬ метрического места точек) Ге топлива. Лемма 8.6. Если (£х, 52) £ 7?х, то решения задачи об оптимальном по рас¬ ходу топлива управлении не сущест¬ вует. Однако для любого наперед заданного е >> 0 существует управля¬ ющая последовательность, а именно {—1,0, 4-1}, которая переводит(£ь g2) (- Q 7?! в (0, 0), расходуя F единиц топ¬ лива: F = Æ* 4- е |£2 Н е. Очевидно, что (8.125) lim F - F* - I g21 e->0 (8.126) Таким образом, решение может быть сколь угодно близким к оптималь¬ ному, хотя оптимального решения и не существует. Такое решение будем называть Е-оптимальным. Доказательство. Рассмотрим диаграмму на фазовой плоскости, пока¬ занную на рис. 8.5. На этом рисунке множество Г8 из /?4 определено как прямая, параллельная оси и расположенная от нее на расстоянии е/2: ге = |(Х1, Х2) :х2 = 1", (8.127) Рассмотрим теперь состояние (£х, £2) из /?х. В зависимости от поло¬ жения точки (gx, £2) ее можно перевести в начало координат либо при помощи управляющей последовательности {—1, 0, 4-1}, либо последова¬ тельности {—1, 4~1}« Если (£х, £2) переводится в начало координат после¬ довательностью (—1, 0, 4-1}, то затраты топлива составляют |£2| + на участке от (gx, £2) Д° линии Г€, равны нулю при движении вдоль нее до точки пересечения с кривой в точке (-у, ) и равны -у при движении вдоль кривой у+ к началу координат. Таким образом, общее количество израсходованного топлива F равно |^2| + е. Если исходное состояние (gx, £2) таково, что траектория, получающаяся при и = —1, ( 82 8 \ -у, 1 и (0, 0), то потребуется топлива меньше, чем |£2| + 8- Для доказательства отсутствия оптимального по расходу топлива решения при е = 0 заметим, что состояние (gx, £2) G переводится в (а, 0) (см. рис. 8.5) управлением и = —1 при помощи минимально воз¬ можного количества топлива, а именно |g2|. Любое другое управление, 598
требующее того же количества топлива, переведет (gb g2) в некоторое состояние (Р, 0), причем р >> а, и поэтому оптимального по расходу топ¬ лива решения не существует. Мы сделали определенные выводы относительно состояний из ?+ U #4 U Яр Аналогичные рассуждения можно провести и для состоя¬ ний из у_ (J R2 U /?3. Полученные результаты можно сформулировать в виде следующего закона управления: Закон управления 8.2 (решение задачи 8.2). Оптимальное по расходу топлива управление (или управления) как функция от состояния (хь х2) для задачи 8.2 определяется соотношениями и* = ц* (%!, х2) = 4-1 для всех (хь х2) £ у+; и* = ц* (хх, х2) = —1 для всех (хь х2) ( у_; и* = и* (хх, х2) — 0 Для всех (xr, х2) Ç R2 (J Если (хг, х2) (Ri U #з, т° оптимальных по расходу топлива управ¬ лений не существует. Оптимальные по расходу топлива управления требуют наименьшего времени перехода. Заметим, что закон управления 8.2 представляет собой лишь иную формулировку лемм 8.4 и 8.5. Мы видели, что в зависимости от исходного состояния оптимальное решение существует или не существует. Кроме того, существуют области, для которых оптимальное по расходу топлива управление неединственно. В следующем параграфе мы рассмотрим задачу об оптимальном по расходу топлива управлении в случае, когда время перехода или задано, или ограничено сверху. Упражнение 8.4. Покажите, что если (£x, £2) Ç /?4, то время перехода, которое необходимо при оптимальной управляющей последовательности {0, 4"1}, равно T’ = --^-g2 (8.128) а если (Êlt ?2) G ^2» то время перехода, соответствующее оптимальной последовательности {0, —1}, равно (8Л29) Упражнение 8.5. Рассмотрите состояние (1, —1) g /?4. Найдите три различных опти¬ мальных по расходу топлива управления к началу координат и начертите траектории, соответствующие каждому из них. Упражнение 8.6. Покажите, что минимальное количество топлива F* (хх, х2) — — I х2 I, требующееся для перевода (хх, х2) £ ?+ U Ï- U #2 U в (0, 0)» есть решение уравнения Гамильтона—Якоби. Упражнение 8.7. Упрощенная задача о мягкой посадке. Рассмотрите летательный аппарат постоянной массы AÎ, находящийся на высоте х1 (0 над поверхностью планеты (лишенной атмосферы) и движущийся с вертикальной скоростью х2 (t). Пусть g — (по¬ стоянное) ускорение планеты, a f (0 — тяга двигателя, —FM^. f (f) Fм и F = т — J \f (01 dt— количество потребляемого топлива. Полагая, что FM > Mg, найдите о оптимальную по расходу топлива тягу (Т не задано) в функции от высоты и вертикальной скорости, обращающую в нуль высоту и скорость. Уравнения системы имеют вид %1(0=Х2(0: I (8.130) Существуют ли начальные значения высоты и скорости, которые приводят к аварии? Сколько существует оптимальных по расходу топлива решений? 599
Упражнение 8.8. Рассмотрите систему (8.83) и функционал (8.84) с незаданным Т. Найдите оптимальное решение (если таковое существует) для областей цели Si = {(хь х2):хі=х2, I Xi I < 1}; S2 = {(Xj, х2):х1=—х2> IXilsgl); s3 = ((Хр Х2) : *1 +х2<1}; S4 = {(хь х2) : Хі = 4-1, х2 = 0 или хА — — 1, х2 — 0}. Упражнение 8.9. Рассмотрите систему (8.83) и функционал (8.84) с незаданным Т. Пусть (1, 1) является желаемым конечным состоянием. Найдите оптимальный по расходу топлива закон управления и выразите минимальное количество топлива в функции от со¬ стояния. Обсудите существование и единственность решения. 8.6. ВРЕМЯ ПЕРЕХОДА ФИКСИРОВАНО ИЛИ ОГРАНИЧЕНО СВЕРХУ Результаты, полученные в предыдущем параграфе, часто оказывались неудовлетворительными с практической точки зрения из-за большого времени перехода при оптимальном по расходу топлива управлении для состояний, расположенных вблизи от оси х19 и из-за «почти бесконечного» времени перехода в случае 8-оптимальных управлений для состояний, принадлежащих к областям Ri и R3. Поэтому рассмотрим задачу об опти¬ мальном по расходу топлива управлении при следующих предположениях: 1. Время перехода фиксировано. 2. Время перехода ограничено сверху. Порядок, которого будем придерживаться в настоящем параграфе, состоит в следующем. После формулировки задачи приводится лемма 8.7, которая устанавливает, что задача с фиксированным временем перехода имеет решение только в том случае, когда заданное время перехода не меньше соответствующего минимального времени. Строгого доказательства существования оптимального управления в данном параграфе не при¬ водится. Решение действительно существует, однако доказательство связано с математическими понятиями (такими, как измеряемые функции), которые мы ранее не рассматривали (см., например, работу [43], которая дает представление об этом). Поэтому примем, что оптимальное решение существует. После ряда выкладок выразим оптимальное по расходу топ¬ лива управление в функции от исходного состояния и заданного времени перехода. Теперь сформулируем задачу. Задача 8.3. Дана система Хі (/) = Хо (t); 1 (8.131) Н)1<И Найти управление, переводящее систему (8.131) из любого исходного состояния (|ь £2) в (0, 0) и минимизирующее количество топлива Tf F-^fu(t)\dt, (8.132) Ô где время перехода Tf а) фиксировано (задано наперед); б) ограничено сверху временем Tf. Tf^zTf. (8.133) 600
На протяжении всего параграфа будем пользоваться терминологией и результатами § 8.5 и 7.2. В частности, будем рассматривать множества /?х, R2, R3 и Т?4 [см. определение 8.1, уравнения (8.109)—(8.112) и рис. 8.3]. Так как в этой задаче задаются три числа £х, g2 и Tf (или Tf), может оказаться, что при некоторой комбинации этих чисел задача не имеет решения. Чтобы избежать осложнений, докажем следующую лемму. Лемма 8.7. Задача 8.3 имеет решение лишь в том случае, если задан¬ ное время Tf (или Tf) не меньше минимального времени /*, соответству¬ ющего заданному состоянию (£х, g2). Для того чтобы задача 8.3 имела решение, должны выполняться соотношения Tf (или Tf )> & -Ь]/"4^ + 2^ для (Іь Ь) Ç U R4-, (8.134) Г/(или Tf) + V - 4Ê, + 2Ц для (gb |2) £ /?2 U Яз; (8.135) 7}(или S&I В2| для (І!, В2) £ Ѵ+ U Т- (8.136) Далее будем полагать, что эти соотношения выполняются. Предположим, что нам задано исходное состояние (gx, g2) из /?х и требуется, чтобы время перехода было в точности равно заданному Tf. Мы видели (см. лемму 8.6), что для перевода (£х, £2) С в (0, 0) требуется топлива более, чем |£2| единиц. Докажем теперь следующую лемму. Лемма 8.8. Заданы (£х, g2) (- Rt и Tf. Оптимальной по расходу топлива является управляющая последовательность {—1, 0, +Ц. Доказательство. Для доказательства можно воспользоваться прин¬ ципом минимума, и поэтому будут справедливы уравнения (8.85)—(8.101). Предположим, что уравнения (8.95) справедливы и оптимально управле¬ ние (8.98). Но это управление не может перевести (£х, £2) в (0, 0) и, следо¬ вательно, справедлива лемма 8.2. Если рассмотреть девять управляющих последовательностей (8.101), то можно установить (воспользовавшись рис. 7.2 и 8.2), что только управляющая последовательность {—1, 0, +1} позволяет перевести (£х, £2) в (0, 0), и следовательно, она должна быть оптимальной по расходу топлива. Причина заключена в том, что эта после¬ довательность — единственная экстремальная управляющая последова¬ тельность, а существование оптимального управления мы предполагаем. Раньше было показано, что управляющая последовательность (—1, 0, +1} оптимальна по расходу топлива для (£1} ?2) £ /?х при заданном Tf. Это означает, что оптимальное по расходу топлива управление равно u(t)~ — 1 для 0<^<7х; и (/) = 0 для tx < t < t2, и (t) = + 1 для t2 < t c Tf (8.137) Очевидно, если мы сможем выразить моменты переключения tr и t2 через заданные величины £х, £2 и 7}, то найдем оптимальное по расходу топлива управление. Пусть S = (gx, g2) — исходное состояние. Опреде¬ лим точки Z = (zlt z2) и W = (wlf w2) следующим образом. Обозначим через [хх (/), х2(/)] фазовые координаты, получающиеся в результате управления (8.137) и соответствующие начальному состоянию (£х, ?2) Пусть 3 = (Bi, g2) = (xx(0), х2(0)); 2 = (zn z2) = (хх (Zx), r2 (/x)); 138) W -^(w^ w2) = (%i (Q, x2 O; 0 = (0, 0)^(x1(T/), x2(Tf)). 601
Непосредственно видно, что управление (8.137) переводит (£х, £2) в (0, 0), если Z = (Zi, z2)£ /?4; ) W = (аух, ш2)6 V+- / (8.139) Такая траектория показана на рис. 8.6. Если она оптимальна по рас¬ ходу топлива, то она должна удовлетворять всем необходимым условиям принципа минимума. Решение уравнений (8.131) при и (/) = А = ±1 и и (Z) = 0 известно [см. уравнения (7.14)— (7.18) и (8.102)]. Таким образом, поль¬ зуясь обозначениями (8.138), имеем управля- результат приложения ющей последовательности г2 — ^2 (8.140) I ■+ г2 (Z2 — Z0; j 0 — w2 н- (Tf— t2)\ 0 - w1 + w2(Tf-^/2)+-L(Tz—r2)2 (8 141) (8.142) Эти шесть независимых уравнений содержат шесть неизвестных t2, г2, и w2 при трех известных величинах gi, g2 и 7\. Чтобы определить управление (8.137), нужно найти tr и t2. Из уравнений (8.142) и (8.141) получим w, = ^-w22 = -±-z2; (8.143) ^2 — + Tf = z2 4- Tf. (8.144) Из уравнений (8.140), в свою очередь, найдем соотношения G “ ^2 г2’ (8.145) zx = Bi + 4-êü-4-4 <8'146) а из уравнений (8.144) и (8.145) t2 — ty = 2z2 4- Tf — l„. (8 147) Подставляя соотношения (8.147), (8.143) и (8.146) в уравнение (8.141), получим г2+(4-М22+^і + 4-^ = °> (8.148) откуда следует г2 = - ± [(Tf - |2)2- 4^ - 2^]~. (8.149) Нужно уточнить два вопроса: во-первых, z2 должно быть действи¬ тельным числом и, во-вторых, надо выбрать правильный знак в выраже¬ нии (8.149). Действительность г2 непосредственно следует из леммы 8.7, потому что из уравнения (8.134) следует (Т/ — g2)2 — 4g х — 2g? 0. 602
Иначе говоря, если мы ошибочно потребуем, чтобы время Tf было меньше минимального, то ?2 не будет действительным числом. Чтобы выбрать правильный знак в выражении (8.149), поступим следующим образом. Времена /х, t2 и Tf должны удовлетворять неравенствам 0</г</2< Tf, (6.150) откуда следует, что t2 — tx > 0, и поэтому [по уравнению (8.147)] Z2>- (8.151) На основании уравнений (8.151) и (8.149) приходим к выводу, что в выражении (8.149) надо выбрать знак +, и, следовательно, 1 ( -1 Ч = - 4 \Tf - Ъ - [(Л - У2 - 4?! - 2Ц] 2 ). (8.152) Подставив это соотношение в уравнения (8.145) и (8.144), найдем h = 4 {Tf + - [( Л - М2 - 4І! - 2Ц] ^} ; (8.153) 'г = 4{Г/ + ^ + [(^-і2)2-4^-2^}; (8.154) это — искомые уравнения для моментов переключения. Итак, мы доказали следующую лемму. Лемма 8.9. Если заданы (gx, g2) Ç 7?х и Tf, то управление (8.137) является единственным оптимальным по расходу топлива управлением, причем моменты переключения /х и t2 определяются уравнениями (8.153) и (8.154). Нетрудно подсчитать количество топлива F (gx, £2, Tf), требующееся для перевода (gx, g2) 4 /?х в (0, 0) при заданном времени перехода Tf. Мы предлагаем читателю проверить, что |2, Tf) = 7/-[(Tf-g2)2-4|1-2g22]^ - (8.155) Воспользуемся уравнением (8.155) для доказательства следующей леммы. Лемма 8.10. Если (gx, £2) 4 и требуется найти оптимальное по расходу топлива управление, переводящее (£х, £2) в (0, 0) при условии, что время перехода Tf ограничено сверху Tf < Tf, то оптимальное по расходу топлива управление потребует времени Tf = Tf. Доказательство. Легко показать, что ТГ> <0; (8.156) dTf 4 это означает, что количество расходуемого топлива возрастает с умень¬ шением Tf. Оптимальное по расходу топлива управление «найдет» наи¬ большее возможное время Tf, Tf = Tf. Мы решили задачу 8.3 для исходных состояний из 7?х. Аналогичные рассуждения можно провести и для исходных состояний из /?3. Обратимся теперь к исходным состояниям из /?4. Пусть (£р £2) 4 /?4. Напомним (см. лемму 8.5), что если (gx, g2) 4 /?4, то управляющая последовательность (0, +1} переведет (£х, |2) в (0, 0) 603
при затратах топлива У7* = |ё2| единиц и при времени перехода [см. уравнение (8.128)1 (8-157) 2 Ъ2 Время перехода Т является наименьшим из возможных при затрате топлива F* = |g2| единиц. Если (|п £2) Q /?4 и время перехода Tf <Т, то потребуется более F* = ||2| единиц топлива. При Tf^>T управле¬ ние, переводящее состояние в начало координат с минимальной затратой топлива F* = I £2| единиц, неединственно (см. лемму 8.5). Эти рассужде¬ ния можно сформулировать в виде следующей леммы. Лемма 8.11. Пусть (£ь £2) Q /?4. Если Tf задано, причем = (8.158) то оптимальное по расходу топлива управление определяется соотноше¬ ниями (8.137), (8.153) и (8.154). Если Tf ограничено величиной Tf, причем Tf<Tf<<T, (8.159) то оптимальное по расходу топлива управление требует времени Tf = Tf. (8.160) Минимальное количество топлива в каждом из случаев определяется соотношением (8.155). Доказательство аналогично доказательствам лемм 8.9 и 8.10 и поэтому не приводится. Лемма 8.12. Если (£v £2) £ /?4 и Tf > Т, то существует множество оптимальных по расходу топлива управлений, требующих F* = |g2| еди¬ ниц топлива. Доказательство этой леммы следует из леммы 8.5. В заключение сформулируем результаты лемм 8.7—8.13 в виде сле¬ дующего закона управления. Заметим, что эти леммы дают решение задачи для начальных состояний (£і, £2) из U результаты для исходных состояний из /?2 и Яз можно получить из соображений симметрии. Закон управления 8.3 (решение задачи 8.3). 1) Пусть (gn g2) — любое исходное состояние и Tf — фиксированное время перехода. Если оптимальное управление и* (/) существует, то оно определяется следующими уравнениями: Для всех (£і, £2) С и любого Tf или для всех (gn g2) Q /?4 и Tf < = для 1 w* (Z) = 0 для tx < t < t2 1 единственно, u* (/) = +1 для t2 < t < Tf j где { T, + 5, - [( T, - - «, - 2Ц ; , (8.161a) =4- p+s.+ifi - w - 2£>1 j ■ 604
Для всех (gx h) € #з и любого Tf или для всех (£x, g2) £ R2 и «*(0 = 4-1 zz* (0 = 0 «*(/) = — 1 для 0 < t 0 1 для единственно, для /2 < t < Tf I где ', = 4 + F + У’+«. - ■ Для всех (11, и 6 Ri и любого Tf>— 4-^2 — или для всех (Êl, U G Rz и любого оптимальное по расходу топлива управление неединственно. (8.1616) (8.161В) Для всех (£р 52) С V+ U V- — оптимальное по расходу топлива управле¬ ние единственно и равно ^*(0 = — sign (£2) для 0</<|£2|; 1 и*(0 = 0 для |g2| < / < ту I (8.161г) 2) Tf ограничено сверху величиной Tf. Выводы аналогичны пункту 1, с той лишь разницей, что в уравнениях (8.161а) — (8.161г) следует заме¬ нить Tf на Tf. Упражнение 8.10. Докажите закон управления 8.3. Упражнение 8.11. Рассмотрите исходное состояние (2, —1) Ç Т?4. Начертите опти¬ мальные по расходу топлива траектории к началу координат для Tf — 2,2; 2,3; 2,4 и 2,5. Мы знаем теперь способы отыскания оптимальной траектории в слу¬ чае, когда время перехода Tf задано. Предположим еще раз, что условия леммы 8.9 или 8.11 удовлетворяются, и поэтому оптимальной по расходу топлива является управляющая последовательность {—1,0, +1). Моменты переключения определяются уравнениями (8.153) и (8.154). Мы показали, что в момент переключения t2 состояние W = w2) принадлежит кривой Напомним [см. уравнения (8.138)], что в момент переключе¬ ния состояние равно Z = (zn г2). Значение г2 определяется уравне¬ нием (8.152), а z1 — уравнением (8.146). Очевидно, что состояние (zx, z2) является функцией от (£х, g2) и Tf. Возникает вопрос: не принадлежит ли состояние (zn г2) некоторой кривой (переключения)? На этот вопрос можно ответить следующим образом: так как (гх, г2) зависит от трех пара¬ метров и Tf, то если зафиксировать любые два из них и варьировать третий, то из уравнений (8.152) и (8.146) получим геометрическое место состояний (гп г2), представляющее собой кривую на фазовой плоскости. Проиллюстрируем это на следующем примере. 605
Пример 8.3. Предположим, что исходным является состояние (£х, 0), |х >0, т. е. точка на положительной полуоси хг. Минимальное время t* (с15 0), соответствующее этому состоянию [см. уравнение (8.134)], определяется соотношением t* = 2 Kl?. Предположим, нам задано значение Tf. Существует такое состояние (|х, 0), что îi = -y-» (8.162) т. е. заданное время Tf является минимальным временем, необходимым для перевода (|х, 0) в (0, 0). Рассмотрим множество состояний (£х, 0), т. е. Рис. 8.7. Иллюстрация линии переключения Г (Tf). При по¬ строениях было принято Tf — 3 Известно [см. соотношения (8.163) и найдем оптимальное по расходу топлива управле¬ ние к началу координат, требующее одного и того же времени Tf для каждого из состояний (£х, 0). Подста¬ вим g2 = 0 в уравнение (8.152) и найдем, что 1 г, = L Т, + Ц- (Г( - 4?і) 1 2 • <8-164)‘ Подставив £2 — 0 в уравнение (8.146), найдем г1 = И г2- (8.165) Исключив £х из уравнений (8.164) и (8.165), после алгебраических преобразований получим zx = —\,bzl — z2Tf. (8.166) (8.139)], что (zx, z2) Ç т. е. 2г2 < 0; (8.167) Итак, уравнения (8.166) и (8.167) определяют кривую на фазовой плоскости, которую мы будем называть линией «переключения»: Г(Т,) = {(гі. г2):г1 = — '>5г1 — г2ті'< г2< 0; г, >-і-гф (8.168) На рис. 8.7 показана такая кривая для Tf = 3, где также изображены некоторые оптимальные по расходу топлива траектории, начинающиеся из оси хг. Все траектории требуют одинакового времени перехода Tf. Управление и (t) — —1 прикладывается до тех пор, пока траектория не достигнет кривой Г (Tf). В момент (/х) управление переключается на и (t) = 0 и остается таким до тех пор, пока траектория не пересечет кривой у+; в мо¬ мент (t2) управление переключается на и (t) — +1 и остается- неизменным до попадания траектории в начало координат. Оптимальная по расходу топлива траектория, начина¬ ющаяся из точки (£х, 0), оптимальна также и по быстродействию (почему?). Упражнение 8.12. Рассчитайте и постройте график потребляемого топлива в зависи¬ мости от £х для примера 8.3. Примите Tf — 3. Упражнение 8.13. Пусть начальным является состояние (0, £2), £2 > 0. Найдите геометрическое место точек (zx, z2) и начертите кривую Г (Tf) для Tf — 3. Упражнение 8.14. Повторите упражнение 8.13 для исходного состояния (£х, £2), = U &2>0. Мы завершаем настоящий параграф проверкой уравнения Гамиль¬ тона—Якоби 2 для данной задачи. Такая проверка полезна потому, что до сих пор мы занимались оптимальным управлением инвариантными во времени системами при неограниченном времени перехода. Система, рас¬ сматриваемая в данном параграфе, также инвариантна во времени, но время перехода теперь фиксировано. 1 Уравнения (8.162) и (8.163) гарантируют, что z2 является действительным числом. 2 См. § 5.20. 606
Предположим сначала, что нам задано исходное состояние (^, g2) из 7?! и время перехода Tf фиксировано. Оптимальным является управ¬ ление ц*(/) =—1 для 0 </</]/, ' и* (/) = 0 для /х < t < /2; w* (/) = 4-1 для /2 < t < Tf, (8.169) где tr и t2 определяются уравнениями (8.153) и (8.154) соответственно. Пусть (xj, х2) —состояние на оптимальной траектории от (£х, £2) до (0, 0). Обозначим через t соответствующее время 0</</п (8.170) а через F (хх, х2, t) — количество топлива, требующегося для перехода из (Л4, х2) в (0, 0). Очевидно, F (хь х2, t) должно быть решением уравне¬ ния Гамильтона—Якоби ÔF (%і, х2, t) , | dF (хь х2, 0 ! dF (хь х2, О ді + 1“ І + Ѵз +U дТ2 = Если t < tlf то согласно уравнению (8.169) и* - —1. Так как (х1? х2)—состояние на оптимальной траектории, ющейся из (èi, Ê2), и то %1 = Хі (/) = + %2t Y t2-, %2 =■ X2(/) = £2— t. Количество топлива F (x1( x2, t) определяется соотношением (8.171) (8.172) начина- (8.173) (2 Tf F (xlt v2, t) = J |— 1 |dx + J |0|dT + J I 1 \dx = t,— t + Tf— t2. (8.174) t il t2 Нам известна зависимость tr и /2 от gx, g2 и Tf. Но из уравнений (8.173) мы также имеем ^2 — Х2 + 11 = Xt — (х2 + t) t + Д-12. (8.175) Подставив уравнения (8.175) в (8.153) и (8.154), выразим tx и t2 в функции от %х, х2, t и Tf и, подставив полученные выражения в соот¬ ношение (8.174), найдем £(Х1,х2; /)= Tf — t-(T! + ? + 2/х2 — 2TfX2 — 2Tff — 4xj — x2)".(8.176) Для упрощения выражений примем У= + t2+ 2tx2 — 2Tix2 — 2Tft-4хх —ХІ (8.177) Найдем теперь частные производные (*1» -^2» 0 1 4" Tf (Q 1 72^ ді ~ 1 ]7т ’ dF (xt, x2> t) = __2_ ф zg J ygx dxi. ŸY У V dF (xlt x2, Z) __ x2 — t Tf zg J gQ\ dx2 yy ‘ ' 6'07
Подстановка выражений (8.172), (8.178), (8.179) и (8.180) в уравнение Гамильтона—Якоби обращает его в тождество. Упражнение 8.15. Заданы (£х, £2) Е и Tf- Пусть (хх, х2) — состояние на оптималь¬ ной по расходу топлива траектории в момент времени t, tr < t < /2. Найдите F (хх, х2, t) и покажите, что оно является решением уравнения Гамильтона—Якоби. Упражнение 8.16. Повторите предыдущее упражнение для /2 < t < Tf. Сделаем в заключение некоторые замечания относительно закона управления 8.3. Мы хотим подчеркнуть, что оптимальное по расходу топлива управление является функцией исходного состояния (gx, ç2) и времени перехода Tf. Методом, аналогичным использовавшемуся при выводе формулы (8.176), можно выразить управление как функцию состоя¬ ния и оставшегося времени Tf — t. Иными словами, практическая реали¬ зация закона управления 8.3 должна содержать «часы», «показывающие» оставшееся время Tf — t. В этом смысле система с обратной связью ока¬ зывается зависящей от времени, хотя управляемая система и функционал стоимости инвариантны во времени. Во многих случаях это может быть крупным недостатком. Поэтому продолжим изучение объекта с двойным интегрированием в надежде найти инвариантную во времени систему с об¬ ратной связью. 8.7. ВРЕМЯ ПЕРЕХОДА ОГРАНИЧЕНО ПРОИЗВЕДЕНИЕМ МИНИМАЛЬНОГО ВРЕМЕНИ НА ПОСТОЯННЫЙ КОЭФФИЦИЕНТ Чтобы мотивировать задачу, рассматриваемую в настоящем параграфе, еще раз обсудим с практической точки зрения недостатки результатов, полученных в § 8.5 и 8.6. Решение задачи 8.2 в § 8.5 неудовлетворительно по двум причинам. С математической точки зрения решений для исходных состояний из 7?! или /?3 не существует. С практической точки зрения более неприятными оказываются большие времена перехода из исходных состояний, располо¬ женных вблизи от оси х1. Приходится смириться с тем, что уменьшение времени перехода требует увеличения расхода топлива. Поэтому в § 8.6 мы сформулировали задачу 8.3, потребовав, чтобы время перехода было либо фиксировано, либо ограничено сверху. В этом случае управление оказалось функцией исходного состояния (|ь g2) и времени перехода Tf, т. е. функцией трех величин £х, £2 и 7}. Если зафиксировать две из них, то получится некото¬ рого рода кривая переключения, как в примере 8.3 и в упражнениях 8.13 и 8.14. Возникает вопрос: какой путь задания времени перехода Tf является наиболее естественным в случае, когда задано исходное состояние (£х, £2)? Предположим, в частности, что нам задано исходное состояние (gx, £2) и время перехода Tf. Пусть теперь нам задано другое исходное состоя¬ ние (g;, £'), близкое к (gp g2). Каким образом выбрать T'f для состояния (£', ^2)’ чтобы оптимальные по топливу траектории были в некотором смысле «близки» друг к другу? Все эти вопросы возникают из физических, а не из математических соображений. Их можно подытожить в виде во¬ проса: каким образом указать естественное время перехода Tf каж¬ дого из состояний? Существует фундаментальная величина времени, связанная с каж¬ дым из состояний на фазовой плоскости. Это — минимальное время пере¬ хода /*, требующееся для перевода состояния в начало координат. Мини¬ мальное время учитывает: 1) ограниченность и (t); 2) положение состояния относительно начала координат. 608
Желательно, чтобы время перехода Tf учитывало минимальное время /*. Посмотрим, как это можно сделать. Предположим, что задано исходное состояние (gb |2) и мы нашли минимальное время (£ь £2). Можно потребовать, чтобы время перехода удовлетворяло соотно¬ шению Л = ₽/*(ЁіЛ2) (8.181) или Tf<Tf= ₽/*(^Л2), (8.182) где |3 — некоторая положительная постоянная, Р>1. (8.183) Для каждого состояния (|ь |2) время Tf, определяемое соотношением (8.181), является фиксированным числом. Если задать р и использовать это значение для каждого начального состояния (|х, g2), то уравнение (8.181) будет естественным способом задания времени перехода. На конкретном примере разберем, что получается, если задавать время перехода при помощи уравнения (8.181). Пример 8.4. Рассмотрим систему (8.131), полагая, что исходным является состоя¬ ние (£х, 0) Ç /?х, £х В> 0, т. е. точка положительной полуоси хх. Это предположение ана¬ логично сделанному в примере 8.3. Минимальное время t* (|х, 0) равно (8.184) Потребуем, чтобы время перехода было равно Tf = ₽/» =2РКІГ; 0> 1- (8.185) Читатель заметил, что в примере 8.3 мы требовали одинакового времени перехода для всех (£х, 0), тогда как в данном примере время перехода является функцией исходного состояния. Если подставить 77 = 2(3 и^2= 0в уравнение (8.152), то после алгебраи¬ ческих преобразований получим соотношение = (/Р3 - 1 - ₽)• (8.186) Читателю следует сравнить это уравнение с (8.164). Так как £2 — 0, zx выражается соотношением (8.165) г1=£1 g-4 (8.187) Исключим^ из уравнений (8.186) и (8.187) и получим г1=ЛЗг2, (8.188) где — постоянная, определяемая соотноше¬ нием лв= —-L+ 1 (8.189) Р 2 (І<Р2-1-Р)2 Так как (3 g> 1, получим (8.190) Поскольку (zx, z2) g ^4, можно опреде¬ лить линию переключения Гр как йр = 1,5 г₽ =|(гь гг):гі г2 < 0; ?! >-1-г|}, (8.191) где hR определяется уравнением (8.189). ( /2 \ На рис. 8.8 показана кривая Гр для /ір — 1,51 р — 3 —-— = 1,06 к где изображены также некоторые из оптимальных по расходу топлива траекторий, начинающихся из оси хх. 20 Атанс и др. 609
Управление и =—1 прикладывается до тех пор, пока траектория не достигнет кривой Гр. В этот момент управление переключается с и = —1 на и — 0. Следующее переключение управления с и — 0 на w = +1 происходит на кривой у+. Из сравнения рис. 8.8 и 8.7 видно отличие в работе системы. Упражнение 8.17. Вычислите количество топлива, необходимое для перевода (Ç,. 0) в (0, 0) по методике, рассмотренной в примере 8.4. Начертите график зависимости количе¬ ства топлива от при р = 1,5. При = 1 начертите график зависимости количества топлива от р. Повторите это для = 2. Упражнение 8.18. Пусть исходным является состояние (0, g2). Задайте время перехода при помощи соотношения (8.181) и найдите геометрическое место точек (zn z2). Начер¬ тите линию переключения для Р = 1,2. Сравните ее с результатами упражнения 8.13. Упражнение 8.19. Повторите упражнение (8.18) для исходных состояний (|ь Ё2) • — £2; ?2 0- Сравните с упражнением 8.14. Фиксация времени Tf при помощи соотношения Tf = (3/* (|х, |2) превращает оптимальное по расходу топлива управление в функцию только Xj (Z) и х2 (/). Если задать соотношение, связывающее с £2 (как в примере 8.4 или упражнениях 8.18 и 8.19), то получится некоторая линия переключения. Заметим, однако, что эта линия переключения является функцией «связи» между и |2. С практической точки зрения желательно иметь систему, измеряющую текущие значения фазовых координат и вырабатывающую оптимальное управление на основе только этой информации. Иначе говоря, система должна работать, «не запоминая» никакой «зависимости» между исход¬ ными значениями фазовых координат. Этим свойством обладали все рас¬ смотренные нами системы, оптимальные по быстродействию. Решение задачи 8.4, сформулированной ниже, также будет обладать этим свойством. Задача 8.4. Дана система À (0 = ^(0; х2(0 = |^(/)| < 1 и функционал т F(ù) = F = J|u(/)| ü Пусть (gx, £2) — произвольное исходное состояние. Если задать время перехода Tf, то можно найти оптимальные по расходу топлива управление и траекторию к началу координат. Обозначим через (xj (/), х2 (/)) состояние на этой оптимальной траектории в момент времени t, t £ [0, Tf]. Пусть /* (хь х2)—минимальное время, соответствующее состоянию (хх (/), х2 (/)). Мы хотим найти оптимальное по расходу топлива управление, при котором Tf — /<p/*Ui,x2), р>1 (8.194) для любых (Ёь £2) и t Ç- [0, Tf]. Разберем физический смысл неравенства (8.194). Это соотношение гарантирует, что с помощью оптимального управления каждое состоя¬ ние (хь х2) на оптимальной по расходу топлива траектории может быть переведено в начало координат за некоторое время Tf — t, ограниченное сверху произведением минимального времени /* (хх, х2), соответствующего этому состоянию, на постоянный коэффициент. По сути дела, уравне¬ ние (8.194) является ограничением, зависящим от времени. Смысл этого утверждения станет яснее по мере решения задачи 8.4. Предположим, что (хх, х2) —состояние из /?4 [см. уравнение (8.112) и рис. 8.3]. Известно, что минимальное время /* (хх, х2), соответствующее этому состоянию, равно t (хі, х2) = х2 + V 4хі + 2x2 . (8.195) (8.192) (8.193) 610
Известно также (см. лемму 8.5), что состояние (хх, х2) Ç Т?4 может быть переведено в (0, 0) оптимальной по расходу топлива управляющей последовательностью {0, 4-1}, требующей | х21 единиц топлива и времени перехода . T(xifx2) = (8.196) С другой стороны, если (хх, х2) Ç R2, то минимальное время, соот¬ ветствующее (хх, х2) 6 ^2 определяется соотношением / (хі, х2) — —Х2 4~ 4~ 2x2 • (8.197) Известно (см. лемму 8.12), что состояние (хх, х2) £ /?2 может быть пере¬ ведено в (0, 0) оптимальной по расходу топлива управляющей последова¬ тельностью (0, —1), которая требует |х2| единицу топлива и времени, равного Т(х1,х2)=-^-х2-^~. (8.198) Определение 8.2. Обозначим через Q (Г) множество состояний (Хі, х2) £ U #2, переводимых в начало координат управляющей последовательностью (0, 4-1}, если (хх, х2) £ Т?4, и управляющей после¬ довательностью {0, —1}, если (хх, х2) £ 7?2, и требующих одинакового времени перехода Т. Из уравнений (8.196) и (8.198) найдем Q(T) = |(х1( х2) :х4 = — х2Т + -^-х2|х2|; (xr, х2) £ (J Я2}- (8.199) Обозначим Q+(T) = Q(T) П R<, Q~ (T) = Q (T) R2. (8.200) На рис. 8.9 показаны некоторые кривые Q (Т). Полезное свойство кривых Q (Т) устанавливает следующая лемма. Лемма 8.14. Пусть 7\ <.Т2, (хр х2) £ Q (7\); (хр х2) £ Справедливо соотношение kîlXxxl. (8.201) Доказательство леммы проводится путем прямых вычислений при помощи соотношения (8.199). Грубо говоря, кривые Q (Т) «растягиваются» с ростом Т, Пусть /* — некоторое положительное число. Известно, что можно найти множество состояний, для которых является минимальным вре¬ менем перехода в начало координат. Это множество состояний мы обозна¬ чили через S (/*) [см. определение 7.6]. Уравнение минимальной изо¬ хроны S (/*) имеет вид [см. уравнение (7.27) ] S (Г) = {(х1( х2) : Хі = ^-х2 + -J- (t* — х2)2, если (хь х2) £ Т?4 U R\, или Xi = 4fxl b(f + х2)2, если (Хі, х2) Q R2 U Яз}. (8.202) На рис. 8.10 показана минимальная изохрона S (/*). На этом же рисунке изображена кривая Q (р/*) с р > 1. Полагая Т = р/* в уравне¬ нии (8.197), получим Q (₽Н = |(Х1, х2) : Хі = —х2р/* + Д- х21 х21; (х4, х2) £ Rt (J /?2|. (8.203) 611
Как показано на рис. 8.10, множества Q (р/*) и S (/*) пересекаются в двух точках, обозначенных через Z = (zp z2) и Z' = (zp z'), симметрич¬ ных относительно начала координат. Точка Z = (z19 z2) принадлежит к /?4, т. е. (г,, z2) = S (/*) П Q+ (РП = 3 (/*) П Q (₽/*) П (8.204) а точка Z’ — (zj, z') £ Т?2, т. е. (гь г2) =-- S (/*) П Q" (₽/*) = S 0*) П Q (рП П (8-205) Рис. 8.9. Некоторые из кривых Q (Т), определяемых уравнением (8.199). Приведенные кривые соот¬ ветствуют Т=1, Т=1,25и Т = 1,50 Рис. 8.10. Точки Z и Z' при¬ надлежат пересечению S (t*) и Q (₽/*) Из уравнений (8.203) и (8.202) находим, что точка (z1? z2) определяется уравнением гі=-г2р/* 1-^ = _^_22 + _^(/*_z2)2. (8.206) Таким образом, точку (zlf z2) можно найти из двух уравнений: г2 = /*[(1-2р) + 2/р(р-1) ]; (8.207) zi= — г2р/*-4*г2- (8.208) Ввиду симметричности (z1; z2) и (zj; г') имеем г2 = -(* [(1 -2р) + 2Ур(р- 1) ]; (8.209) zi = -г^* +4г22- (8-21°) Итак, при заданных 0 и t* точки Z = (zb z2) и Z = (zj, z2) полностью определены. Исключая время /* из уравнений (8.207) и (8.208) и из уравнений (8.209) и (8.210), получим (гь г2) Ç /?4; (8.211) zî = —m₽z22, (zi Z2) £ R2> (8.212) 612
где В 1 m8 = -== 5-. Р 2Р — 2 Кр (P — 1) — 1 2 (8.213) Объединим уравнения (8.211) и (8.212) в одно и определим кривую ур как Те = {(*ь *2) • хі = — тах21 *2ІЬ (8.214) где т6 соответствует выражению (8.213), а символы z заменены на х. На рис. 8.11 показан вид кривых ур для различных значений |3 >* 1. Докажем две леммы, с помощью которых сформулируем затем закон управ¬ ления. Лемма 8.15. Пусть (хх, х2) 6 Ур и Z* (хх, х2) — минимальное время, соответ¬ ствующее (хх, х2). Если (хх, х2) £ Т?4, то оптимальна по расходу топлива управля¬ ющая последовательность {0, +1}, если (хх, *2) Е Я2, то оптимальна управля¬ ющая последовательность {0, —1}. В каж¬ дом из этих случаев время перехода Т = ftt*(xx, х2) (8.215) ДЛЯ любых (Хх, Х2) £ Ур. Доказательство. Эта лемма непосред¬ ственно следует из построения кривой ур. Так как у0 является геометрическим мес¬ том точек (zx, z2) и (гь г2) в зависимости от Г итак как точки (zb z2) и (zb z2) одно¬ временно принадлежат изохроне S (Z*) и множеству Q (|3/*), то лемма вытекает из определения кривых Q (Т) (см. опреде¬ ление' 8.2). Рис. 8.11. Некоторые из кривых у^, определяемых уравнением (8.214). Показанные кривые соответствуют Р= 1,2; 0= 2,0 и р= 10 Лемма 8.16. Дано |3Х < р2; пусть (хь х2) С а (*ь х'д € Ѵр • Тогда ]хг| <|хЦ. Лемма доказывается прямыми вычислениями при помощи уравнений (8.214) и (8.213). Из нее следует, что с ростом [3 кривые у« стремятся к оси хх (сравните с рис. 8.11). Кривые ур и уН делят фазовую плоскость на четыре области Gx, G2, G3 и G4, как показано на рис. 8.12. Более строго: Gx = !(хх, х2) : хх ^~Х2ІХ2І и ххі>— mp%21 х21) ; (8.216) G2 = ((xx, x2) : xx < 5-x2|x2| и х^ —т«х2|х2|); (8.217) G3 = {(Xi, x2) : Xj < Ь x21 x21 и Xj < —/пэх21 x2; (8.218) 04 = {(Xl x2):Xj> g~x2|x2| и X, < — m₽x21x21|. (8.219) Отметим, что область Gx включает кривую у_, а область G3 — кри¬ вую у+. 1) Напомним, что у — у+ U V- 1см- определение 7.4 и уравнение (7.21)]. 613
Закон управления 8.4 (решение задачи 8.4). Оптимальное управление как функция состояния (хь х2) определяется уравнениями и* = и* (%!, х2) = — 1 для (Хх, х2) С ^і» = и* (хх, х2) = + 1 Для (хх, х2) £ G3; и* = и* (хх, х2) = 0 для (хх, х2) £ G2 U G4. (8.220) Оптимальное управление единственно. Доказательство. Пусть X = (хх, х2) — состояние из области G4 и tx — минимальное время, соответствующее X, Мы должны показать, что время перехода Тх, соответствующее оптимальной по расходу топлива управляющей последовательности {0, +1}, удовлетворяет неравенству кости на области Gx, G2, G3 и G4 кри¬ выми у и ур. Траектория Y ABO является оптимальной торию Y ABO, показанную на Тх <0'1 (8.221) Допустим, что Тх > 0'1 (8.222) Тогда должно существовать 0', 0' > 0, для которого Тх - 0''х (8.223) и, следовательно, кривая у0/, причем (хх, х2) £ ур<; в свою очередь, у^, £ G4. Но это противоречит лемме 8.16. Поэтому, если (хх, х2) £ G4, то справедливо урав¬ нение (8.221). Пусть теперь Y = (у19 у2) —состоя¬ ние из Glt показанное на рис. 8.12, и ty—минимальное время, соответству¬ ющее У. Управление (8.220) дает траек- рис. 8.12. Надо доказать, что Ту < 0'у (8.224) Обозначим через tA момент времени, в который траектория пересекает кривую у3 (в точке Д). Так как отрезок траектории Y А идентичен опти¬ мальной по быстродействию траектории к началу координат, минималь¬ ное время tA, соответствующее точке Д, будет равно /* /* / lA lY — (8.225) Время, требующееся на переход из точки А в начало координат вдоль траектории АВО, по определению, равно 0/1 и, следовательно, время Ту, требующееся для перехода из точки Y в начало координат вдоль траектории YABO, равно Ту = 'л + 0 ('у — 'л) = 0'у + (1 — 0) 'л- (8.226) Так как 0 > 1, то член (1 — 0) tA отрицателен, и поэтому Ту < 0/1 (8.227) Если начальное состояние принадлежит к G2 U G3, доказательство закона управления аналогично приведенному выше. Рассмотрим практическую реализацию закона управления 8.4. Си¬ стема управления должна измерять состояние (хх, х2), определять, при¬ надлежит ли оно к областям Glt G3 или G2 U G4, и вырабатывать оптималь¬ 614
ное управление в соответствии с уравнениями (8.220). Система, показанная на рис. 8.13, решает эту задачу. Фазовая координата х2 подается на не¬ линейность N, характеристика которой ХгІХгІ1*- Сигнал х2| х21 делится и суммируется с хх, в результате чего получается сигнал а (/). Сигнал х2| *2І умножается также на постоянный коэффициент тй и складывается с сигна¬ лом хг, давая в результате сигнал b (/). Нетрудно видеть, что а(/)>0 означает (хъ х2) £ Gr J G4; а (/) < 0 означает (хх, х2) £ G2 (J G3; a(t} = 0 означает (хь х2) £ у+ U Ï-’, Рис. 8.13. Реализация закона управления 8.4 И Ь(0>0 означает (хь х2) £ Gx (J G2; t(/)<0 означает (хх, х2) £ G3 (J G4; b(t) = 0 означает (хь х2) £ у6. Сигналы а (/) и b (Z) подаются на поляризованные реле и R2; суммирование выходных сигналов реле дает сигнал /(0 = — sign {а(0} —sign {і>(0}. Следовательно, если (хх, х2) Ç G,, то /(/) = — 2; если (хь х2) С Gs, то f(t) --= + 2; если (х1( х2) Ç G2 U G4, то f(t) = 0. (8.228) (8.229) Характеристики блока RD соответствуют характеристикам идеаль¬ ного реле с зоной нечувствительности, т. е. и (t) = + 1, если / (/) 1 ; и(/) = 0, если |/(0|<1; «(/) = — 1, если /(0< — 1. (8.230) Из уравнений (8.230) и (8.229) видно, что система, показанная на рис. 8.13, дает управление в соответствии с уравнениями (8.220) и пред- 1) Заметим, что это та же нелинейность, что и на рис. 7.5, «вырабатывающая» оптималь¬ ное по быстродействию управление для той же самой системы. 615
ставляет собой обещанное инвариантное во времени управляющее устройство. При решении этой задачи нам «повезло», так как уравнение кривой оказалось подобным уравнению кривой у (обе они являются параболами). Это обстоятельство позволяет использовать один и тот же нелинейный элемент N (см. рис. 8.13) для получения обеих кривых у и у^. Это не всегда справедливо для остальных систем второго порядка. Иначе говоря, урав¬ нения кривых у и у6 в общем случае отличны друг от друга. Упражнение 8.20. Покажите, что для заданного состояния (хь х2) вре^мя перехода Т при управлении (8.220) равно 2xj + X2 1 + 2^’ если (хь х2) Ç Gi, Т = lii *1 Z x2 если (хь х2) g G2 (J G4, (8.231) — 2*1 + 4 1 + 2mp ’ если (xi, x2) Ç G3 и что при этом требуется F единиц топлива: F = 2xi -p *+2 ï+W 1*2 I. если если (*ь ^г)€^ь (Хі,х2) £ G2 (J G4 (8.232) — Х2 2 — 2xl -Ь X2 -, Г» , если 1 + 2mp (xi, *2) € G3. При x2 = 0 постройте графики зависимости количества топлива F и времени Т от | xL | для |3 = 1,0; 1,1; 1,2; 1,5; 2,0; 5,0 и 10,0. При (3 = 1,2 и х2 ~ 0 постройте график зависи- Т мости отношения в функции от | хх [, где /* — минимальное время. 8.8. МИНИМИЗАЦИЯ ЛИНЕЙНОЙ КОМБИНАЦИИ ВРЕМЕНИ И РАСХОДА ТОПЛИВА В предыдущем параграфе мы спроектировали инвариантную во вре¬ мени систему с обратной связью, дающую оптимальное по расходу топлива решение и гарантирующую, что время перехода всегда ограничено произ¬ ведением минимального времени на некоторую константу. При выводе закона управления 8.4 было использовано аналитическое выражение ми¬ нимальной изохроны S (Z*). В гл. 7 мы отмечали, что отыскание уравне¬ ния минимальной изохроны является задачей исключительно сложной, если вообще разрешимой. В этом и заключается основной недостаток подхода, использованного для решения задачи 8.4. Цель настоящего параграфа — сформулировать и решить задачу оптимизации, используя функционал стоимости, представляющий собой взвешенную линейную комбинацию времени перехода и расходуемого топлива. Мы увидим, что использование такого функционала стоимости опять приводит к инвариантной во времени системе с обратной связью, что весьма желательно с практической точки зрения. В двух последующих параграфах используется этот же функционал стоимости, так как счи¬ тается, что он является хорошим критерием для практических задач. В этом параграфе будем действовать следующим образом. Сначала применим принцип минимума для отыскания управляющих последова¬ тельностей, которые могут оказаться оптимальными. Далее мы неодно¬ кратно будем пользоваться необходимым условием, состоящим в равенстве нулю гамильтониана задачи вдоль оптимальной траектории. Покажем 616
единственность экстремальных управлений. Наконец, получим уравнения линий переключения и выразим оптимальное управление в функции от состояния. Оптимальная система с обратной связью окажется той же са¬ мой, что и система, показанная на рис. 8.13. Подчеркнем, что это лишь совпадение, а не общее свойство всех оптимальных систем. В этом параграфе решим следующую задачу. Задача 8.5. Дана система Х1 (0 = х2(0; х2 (0 = «(/); |«(0|<1- (8.233) Найти управление, переводящее систему (8.233) из любого исходного состояния (£ь g2) в (0, 0) и минимизирующее при этом функционал т J(u) = J = J[£ + |«(0lldz> (8.234) О где &>0; (8.235) время перехода Т не задано. Напомним, что т J=kT+ ^\и (01 dt - kT + F. (8.236) и Таким образом, J есть взвешенная сумма времени перехода и израс¬ ходованного при этом топлива. Гамильтониан Н этой задачи равен /-/ = k +1U (С 1 4- Х2 (0 Р1 (0 + U (0 р2 (0. (8.237) Дополнительные переменные рг (/) и р2 (/) являются решениями дифференциальных уравнений "■«“-Л. “0; (8.238) (8.239) Полагая nj == pL (0), л2 = р2 (0), (8.240) найдем pi (t) =. лj = const; 1 Ръ (0 = Л|/. j Управление, минимизирующее гамильтониан, равно (8.241) и (/) = 0, если 1 р2 (01 < 1 ; (8.242) u(t) = — sign (р2(0), если |р2(/)|> Г, (8.243) 0 < и (t) < + 1, если р2 (0 = — 1 ; (8.244) — 1 < и (t) < 0, если р2 (0 = + 1 • (8.245) Нам следует выяснить не окажется ли |р2(0| = 1 Для любого t на некотором интервале, скажем [Zb Z2]. Результатом этого в § 8.5 явилась неединственность управлений. Покажем, что в задаче 8.5 такое положение не встречается. Лемма 8.17. |р2(0| не может быть равно 1 ни на каком интервале [G, /2]. Следовательно, вырожденное управление не может быть опти¬ мально, и поэтому задача нормальна. 617
Доказательство. Допустим, что р2 (/) = —1 при любом t Ç [/х, /2]. Тогда согласно уравнению (8.244) управление и (t) должно быть некоторой неотрицательной функцией времени. В любой момент времени t £ [/х, /2] гамильтониан равен Н = k + I и (О I + х2 (0 лх — и (0 = k + х2 (Z) лх. (8.246) Но если р2 (/) = —1 при любом t £ [/х, t2], то лх — 0 и л2 = — 1. (8.247) Подставив лх = 0 в уравнение (8.246), получим: // = /г>0 (так как й>0). (8.248) Система (8.233) инвариантна во времени, и Т не задано. Поэтому гамильтониан Н должен быть тождественно равен нулю вдоль оптимальной траектории, что, очевидно, противоречит уравнению (8.248). Рассуждения для р2 (Z) = +1 при любом t £ [tlf t2] полностью аналогичны. Так как вырожденные управления не могут быть оптимальными, то в качестве возможных оптимальных управлений следует рассматривать лишь девять управляющих последовательностей 1 {0}; {+1}; {-1}; (о, +1}; {0, -1}, {+1, 0); {-1, 0}; {+ 1, 0, — 1}; {—1, 0, + 1}. (8.249) Лемма 8.18. Если желаемым конечным состоянием является начало координат (0, 0), то оптимальными могут быть только шесть управля¬ ющих поел едов ате л ь ноете й {+1}; {-1}; {0, +1}; {0, -1}; {+ 1, 0, —1}; {—1, 0, + 1}. (8.250) Доказательство. Надо показать, что управляющие последовательно¬ сти {0}; 1 + 1; 0} и {—1; 0} не могут быть оптимальными по отношению к началу координат. Общей характеристикой этих последовательностей является то, что в конечный момент времени Т и(Т) = 0. (8.251) Так как х2 (Т) = 0, гамильтониан при t — Т и [и (Т) = 0] равен Н\^т^ + \и(Т)\ + х2(Т)ъ + u(T)p2(J) = k>0. (8.252) Это противоречит условию Н = 0 при любом t £ [0, Т]. Лемма доказана. Заметим, что управляющие последовательности { + 1} и {0; +1} являются подпоследовательностями управляющей последовательности (—1; 0; +1}, а управляющие последовательности {—1); (0; —1} —под¬ последовательностями из { + 1; 0; —1}. По принципу оптимальности2, если вся последовательность оптимальна, то и любая подпоследователь¬ ность из нее должна быть оптимальна. 1 См. § 5.16. 2 В этом параграфе термин «оптимальный» относится к функционалу т J = J [/г + |и(0 |] dt. о 618
На рис. 8.14 показана функция довательность (—1; 0; 4-1}, т. е. р2 (0, дающая управляющую после- u(t)= — 1; и (t) = 0; и (0 — 4* 1 ; G < < г2І t2 < t < T. , (8.253) Очевидно, что так как р2 (0 = Л2 — Лг0 ДОЛЖНО бЫТЬ л2 > 1, Л! > 0 (8.254) и, кроме того, в моменты переключения Рг (Q = 1 = л2 — лЛ; (8.255) Р2 (z2) = — 1 = л2 — л/2 (8.256) Начиная с некоторого исходного состояния (£ь g2), приложим Н — минимальное управление (8.253). Пусть 1 (zb z2) — некоторое состоя¬ ние при / = t19 а (доь ш2) — состоя¬ ние при t = /2. Известно, что (ayb до2) С V+ и удовлетворяются урав¬ нения (8.140)—(8.142). Надо найти геометрическое место состояний (гх, z2). Так как (w19 w2) £ у+, имеем Wi = -^-wl (8.257) tx и /2 имеем Рис. 8.14. Функция р2 (0 — л2— дающая управление и (/) по уравнению (8.253) Уравнение (8.141) можно записать в виде ^2 = г2І + (8.258) Из уравнений (8.257) и (8.258) получим соотношение -2_ ^2 = + Z2 (^2 — G)- (8.259) Гамильтониан должен быть равен нулю при любом t £ [0, Т]. При t == tx имеем ^(Q^Zf, x2(M = z2; р2 (^) = 1; u(/x)<0. (8.260) Подставив уравнения (8.260) в соотношение (8.237), получим откуда И 1/=^ — 0 — k ~Г z2tcx, (8.261) Л1 = (8.262) Вычтем уравнение (8.256) из (8.255) и найдем 2 = лг(^2 —/х). (8.263) Подставляя уравнения (8.262) и (8.263) в соотношение (8.259), получим 4 - Zr - z, (8.264) или, эквивалентно, 2 21 — gk^2, (8.265) 1 См. уравнения (8.138). 619
где gk 2k (2.266) Уравнения (8.265) и (8.266) описывают геометрическое место состоя¬ ний (zlt z2), в которых управление, даваемое управляющей последова¬ тельностью {—1; 0; +1}, переключается с и — —1 на и = 0. Действуя аналогичным образом, найдем геометрическое место состояний (zu z2), в которых управление, даваемое управляющей последовательностью { + 1; 0; —1}, переключается с и = +1 на и = 0: , *2 m . (2.267) Итак, мы использовали все необходимые условия для доказательства того, что на экстремальной траектории состояние в момент переключе¬ ния Zj хі (^і) — 2і ; Х2 (Q = 22 должно удовлетворять уравнению (8.265), т. е. соотношению Z\ = g^, а состояние в момент переключения t (^2) — *2 (^2) ~ ^2 должно удовлетворять уравнениям (8.257) и (8.258), т. е. соотношениям и z-2 = w2. Так как gk = 4 ■ [см. уравнение (8.266)1, и Ні кривыми у и геометрическое место состояний {(zly ?2)} полностью определяется коэф¬ фициентом k, а геометрическое место состояний {(шх, ^2)j абсолютно не зависит от k. Сформулируем следующее определение. Определение 8.3. Обозначим через Г* кривую, определенную соот¬ ношением Г* = {(хІЎ х2):х, = —g*x2|x2|; = (8.268) На рис. 8.15 показаны некоторые кривые для различных значе¬ ний k. Кривые у и делят фазовую плоскость на четыре области Н19 620
Н 2, Н3п как показано на рис. 8.16. Точно эти области определяются следующим образом: х2) :%! ^-х2|х2| и Х1> —£*х2|х2|}; (8.269) #2 = {(х1( х2):х,< і- х21 х21 и Xi ss — g*x21 х21} ; (8.270) ^з = {(Хі, х2):хх< §-х2|х2| и х2< —f4X2|x2|j; (8.271) #4 = {(Хі, х2):хх> 5-х2|х2| и xt < — g*x2|x2|). (8.272) Закон управления 8.5 (решение задачи 8.5). Оптимальное управле¬ ние ц* как функция от состояния (хъ х2) определяется уравнениями и* = и*(х, х2) = — 1 для всех (х15 х2) Q Нг\ и* = и* (х15 х2) — + 1 Для всех (х1? х2) £ Я3; и* = и* (х1У х2) = 0 для всех (хх, х2) Q //2 U #4, (8.273) и, следовательно, управление и* единственно. Упражнение 8.21. Докажите закон управления 8.5. Указание: при доказа¬ тельстве существования считайте, что оптимальное управление для задачи 8.3 существует. При доказательстве единственности выберите состояния из Hlt Н2, Н3 и Я4. Испытайте каждую из шести управляющих последовательностей (8.250) и потребуйте, чтобы гамильто¬ ниан был равен нулю вдоль оптимальной траектории. Практическая реализация закона управления 8.5 полностью анало¬ гична блок-схеме, показанной на рис. 8.13, и отличается от нее лишь тем, что коэффициент усиления тв на рис. 8.13 надо заменить коэффициентом £ I 4 р усиления gk — 2k ' • Идентичность реализаций объясняется одинаковым видом уравнений кривых ГЛ (8.268) и у6 (8.214)1}. Нетрудно показать, что 1іт^ = -Ь, Ііт^ — оо. /г->оо z fe-»0 (8.274) Это означает, грубо говоря, что lim І\—> кривая у; &->оо (8.275) lim Г* —»ось X,. (8.276) &->0 Этого и следовало ожидать, так как функционал имеет вид т J = §[k + \u(t)\]dt. (8.277) о Нетрудно видеть, что если k —* сю, то функционал «взвешивает» только время, и поэтому при k —> оо закон управления 8.5 переходит в закон управления, оптимального по быстродействию (закон управления 7.1). Иначе говоря, = 7?_ U у_; 1ітЯ3 = #+ U Т+; (8.278) lim Н2 U Hi — 0 (пустое множество). £-> 00 1) Это лишь простое совпадение. Читатель не должен считать, что такое положение имеет место для всех систем второго порядка. 621
Если k —* 0, то функционал (8.277) превращается в функционал топлива F (8.84), и задача 8.5 оказывается почти эквивалентной задаче 8.2. В этом случае lim k->Q lim H3 = /?3; *->о (8.279) lim Н2 (J Ні = /?2 (J Ri, &->0 где области 7?х, Т?2, 7?3 и Т?4 соответствуют определению 8.1 [уравнения (8.109)—(8.112) и рис. 8.3]. В этом случае (А —> 0) закон управления 8.5 почти аналогичен закону управления 8.2. При k —* 0 автоматически полу¬ чается управление, оптимальное по расходу топлива (если оно существует), требующее наименьшего времени перехода1. Иначе говоря, при k —» 0 закон управления 8.5 не выявляет того обстоятельства, что оптимальное по топливу управление может быть неединственно. Упражнение 8.22. Выразите минимальную стоимость J* в функции от (хх, х2). Покажите, что она является решением уравнения Гамильтона—Якоби. Примите k — 1 и начертите область состояний, «стоимость» перевода которых в начало координат одина¬ кова Çj* = -^-, 1, 2у Являются ли эти множества границами выпуклых областей? Упражнение 8.23. Выразите время перехода Т и количество топлива F в функции от состояния. Постройте график отношения количества топлива к времени перехода для исходных состояний, расположенных на оси х1 при k — 1. Упражнение 8.24. Найдите связь между k в задаче 8.5 и р в задаче 8.4 таким обра¬ зом, чтобы законы управления 8.4 и 8.5 были идентичны. Упражнение 8.25. Рассмотрите систему (8.233) и функционал (8.234) с незаданным Т. Считайте, что конечное состояние (Ѳх, Ѳ2) не обязательно является началом координат. Полагая, что оптимум существует, найдите оптимальное управление в функции от состоя¬ ния. Обсудите единственность оптимального и экстремального управлений. Найдите линии переключения для Ѳх = 1, Ѳ2 = 1 при k = 2. Постройте кривые равной стоимости. Яв¬ ляется ли поверхность минимальной стоимости непрерывной функцией состояния? Упражнение 8.26. Рассмотрите систему (8.233) и функционал (8.234) с незаданным Т и k = 2. Областью цели является окружность S = {(ХЬ х2):%2 +хі = 1). Найдите оптимальное управление как функцию от состояния для состояний внутри окружности S и вне ее. Упражнение 8.27. Повторите упражнение 8.26 для случая, когда область цели составлена из двух изолированных точек, т. е. S = {(хь х2) : хх = —1; х2 = 0 или хх — Г, х2 = 0}. Обсудите единственность оптимального и экстремального управлений. * * * 8.9. МИНИМИЗАЦИЯ ЛИНЕЙНОЙ КОМБИНАЦИИ ВРЕМЕНИ И РАСХОДА ТОПЛИВА ДЛЯ ОБЪЕКТА, ПРЕДСТАВЛЯЮЩЕГО СОБОЙ ИНТЕГРАТОР И АПЕРИОДИЧЕСКОЕ ЗВЕНО 2 В предыдущих четырех параграфах мы рассмотрели управление поло¬ жением и скоростью массы, движущейся без трения. В этом параграфе рассмотрим управление движением массы, подверженной действию сил сопротивления. Примем, что сила сопротивления (или трения) пропор¬ циональна скорости движения тела. При этом будем пользоваться тем же критерием, что и в § 8.8, т. е. т J = О 1 То же самое получилось и в § 8.2. 2 Этот вопрос рассматривается в работе [121 ]. 6 22
Методы решения данной задачи аналогичны методам § 8.8. Решение этой задачи преследует две цели: во-первых, показать, что закон управле¬ ния для нашей задачи аналогичен закону управления 8.5 в том смысле, что и здесь будут двё линии переключения, делящие фазовую плоскость на четыре области. Во-вторых, в следующем параграфе мы рассмотрим оптимальное управление телом, которое подвержено действию сил сопро¬ тивления, изменяющихся по нелинейному закону. Эти два случая суще¬ ственно отличаются друг от друга, хотя критерий остается тем же самым. Предположим, что дано тело единичной массы. Обозначим через у (t) его положение, а через и (/) — управляющую силу. Будем считать, что тело движется в вязкой среде и поэтому сила трения пропорциональна ” I имеет вид (8.280) скорости его движения. Дифференциальное уравнение движения Ў(0 4- ay (ft = u(t), где a — положительная постоянная (коэффициент трения). Управляющая сила ограничена: |и(0|<1. Передаточная функция объекта (8.280) имеет вид УІД. -G (s)- 1 и (s) v ’ s (s + a) ’ и поэтому такой объект можно рассматривать как «интегратор дическим звеном». Определим фазовые координаты при помощи уравнений хг (0 = у (0 — у/, х2 (0 = ў (ft, где yd — заданное положение. Задача 8.6. Дана система (0 “ (О’, 1 *2(0 = —я*2 (0 + ^(0, 1^(01 <1- i Найти управление, переводящее систему (8.284) из любого исходного состояния (£ь g2) в (0, 0) и минимизирующее при этом функционал т J (и) = J = J [k -г I Ц (0 |] и где k > 0, а время перехода Т не задано. Оптимальное по быстродействию управление системой (8.280) рассма¬ тривалось в упражнении 7.32 Гамильтониан данной задачи имеет вид H = k + I и (Z) I + х2 (t)P1 (/) - а%2 (0р2 (0 + и (t)p2 (Z). (8.286) Дополнительные переменные Р1 (/) и р2 (/) являются решениями уравнений (8.281) (8.282) с аперио- (8.283) (8.284) (8.285) Примем, что Рі(0 = р2(0 = ^- = 0- дхг (/) =Рі(0); л2 = р2(0), (8.287) (8.288) (8.289) О Фазовые координаты хх (/) и х2 (О, определенные уравнениями (8.284), отличны от фазовых координат (7.272). 623
и, решив уравнения (8.287) и (8.288), получим Рі (О = Лі = const; (8.290) р2(0= (л2-^)еа<(8.291) Управление, абсолютно минимизирующее гамильтониан, равно £/(0 = 0, если |р2(0|< 1; (8.292) u\t) = — sign {р2(0}, если |р2(0|> 1; (8.293) 0 < // (0 < 1, если р2 (0 = —1 ; (8.294) — 1<//(0<О, если р2(0=+1. (8.295) Лемма 8.19. Условие |р2(0| = 1 при любом t Ç [0, 0] дает управ¬ ление, которое не может быть оптимальным по расходу топлива; следо¬ вательно, вырожденных управлений для данной задачи не существует, и поэтому задача нормальна. Упражнение 8.28. Докажите лемму 8.19. Указание: следуя методике доказа¬ тельства леммы 8.17, покажите, что из | р2 (0 | = 1 при любом t £ [£х, /2] следует Н = = k > 0. Так как вырожденных управлений не может быть и функция р2 (0 есть сумма постоянной и возрастающей (по величине) экспоненты, то из уравнения (8.291) следует, что при t Q [0, Т] р2 (і) = const, если л2 = р2 (0 монотонно возрастает, если л2 р2 (0 монотонно убывает, если л 2 -■ лх " а Из уравнений (8.296), (8.292) и (8.293) следует вывод, что оптималь¬ ными могут оказаться девять управляющих последовательностей {0}; { + !}; {-И; {0, -1}; {0, +1}; { + 1, 0}; {-1, 0}; (8.297) ( + 1, 0, -1); {-1, 0, +1}. Лемма 8.20. Если желаемым конечным состоянием является начало координат (0, 0), то оптимальными могут быть только шесть управля¬ ющих последовательностей { + 1}; {-1}; {0, +1}; {0, -1}; ( + h 0, -1}; {-1, 0, +1}. (8.298) Упражнение 8.29. Докажите лемму 8.20. Указание: это доказательство анало¬ гично доказательству леммы 8.18. Теперь необходимо решить систему (8.284) для управлений u(0=+l; W(0 = —1; и(0 = О. (8.299) Пусть g, = (0); = х2 (0). (8.300) Решив уравнения (8.284), получим х2(0 = ^"°'; , „(0 = 0; (8.301) (8.302) 624
Исключив время из уравнений (8.301) и (8.302), получим уравнения траекторий на фазовой плоскости. Определение 8.4. Обозначим через Т° (|1; £г, хъ х2) траекторию, начинающуюся из (£х, £2), произведенную управлением и (/) = 0 и про¬ ходящую через точку (хх, х2). Уравнение траектории Т° (|1( g2, xlt х2) получено путем исключения времени t из уравнений (8.301). Итак, для Т° (êi> ?2> xz) имеем уравнение Х1=Ё1+4(^-*2)- (8-303) Определение 8.5. Обозначим через Т+ (glt g2, xt, х2) траекторию, начинающуюся из (^, g2), произведенную управлением и (0 = +1 и проходящую через точку (хх, х2). Из уравнений (8.302) при А = 4-1 для траектории Т+ (£х, g2, х1( х2) получим -ь 4- log (Л * С* (8.304) и (t) = 1 системы (8.284) при = +1 и а = Рис. 8.17. ^-траектории си¬ стемы (8.284) при и (t) — 0 и а — 1 Определение 8.6. Обозначим через Т~ (£1( £2, хь х2) траекторию, начинающуюся из (£1( £2), произведенную управлением и = —1 и прохо¬ дящую через точку (хь х2). Из уравнений (8.302) при А = —1 для траек¬ тории Т~ (gj, £2, Xj, х2) получим + (8.305) Различные траектории 7°, Т+ и 7~ показаны на рис. 8.17—8.19 для зна¬ чения а = 1. Приступим теперь к построению линий переключения и к формули¬ ровке закона оптимального управления. Нам известно (из леммы 8.20), что управляющая последовательность {—1; 0; +1} может быть оптималь¬ ной. Для этой последовательности управление равно и(0 = — 1 «(0 = +1 при tr < t < /2; при t2 < t < T.. (8.306) при 0 < / <■ /х; На рис. 8.20 показано исходное состояние S = (gx, g2), которое пере¬ водится в начало координат О = (0, 0) управлением (8.306). Обозначим Х1&) =■■ Zi, х2(О = г2, Z = (z1; z2); (Q = ®1> х2 (^2) = w2, W — (w1, w2). (8.307) 625
Так как и (t) = —1 при t £ (0, ^), то траекторией, соединяющей 5 = (Si, S2) и Z = (zx, z2), является 7“ (gb g2, х2). При t £ (/x, t2) и (t) = 0, и поэтому точки Z = (гъ z2) и W — (wlf w2) соединяет траекто¬ рия 7° (zlf z2, w19 w2). Наконец, при t £ [/2, 7] управление и (t) = 1, и точки W = (wlf w2) и О = (0, 0) соединяет траектория 7+ w2, 0, 0). Рассмотрев множество всех состояний, для которых оптимальна управляющая последовательность {—1; 0; +1}, можно получить гео¬ метрические места точек ш2) и (гѵ г2). системы (8.284) при и (/) — —1 и а = 1 Рис. 8.20. Траектория, получающаяся в ре¬ зультате приложения управляющей последо¬ вательности {—1,0,+1} и переводящая исход¬ ное состояние S = (gx, £2) в начало координат Найдем геометрическое место точек (шх, ш2). Так как (шх, ш2) $ £ Т+ (wlf w2i 0, 0), подстановка значений = ^і; S2 = хі = 0; *2 = о (8.308) в уравнение (8.304) дает = +2 — ^2" log ( 1 — aw2). (8.309) Из физического требования — перевести (^ь w2) в (0, 0) за положи¬ тельное время следует, что в уравнении (8.309) ^2<0. (8.310) Если определить кривую у+ соотношением Ѵ+ = |(-*і» х2):Х1 = і-х2 —log(l — ах2); x2<oj, (8.311) то (шх, w2) £ 7+. Далее надо найти геометрическое место состояний (z19 z2). Состоя¬ ния (доь w2) и (z19 z2) соединяет траектория 7° (zlf z2, wlf w2). Подставив значения S1 = Zi, S2 = z2', *1 = *2 = ^2 (8.312) в уравнение (8.303), найдем = Zi + (z2 — w2). (3.313) Подставляя уравнение (8.309) в соотношение (8.313), получим z1 = — —log(! — аьу2). (8.314) 626
Если выразить w2 через z2, то уравнение (8.314) даст уравнение гео¬ метрического места точек (zlf z2). Чтобы получить это соотношение, вос¬ пользуемся тем, что гамильтониан вдоль оптимальной траектории равен нулю. При t = tr имеем = x2(Q = z2; p2(Q-+I; m(Q<0. (8.315) Так как при t = управление (8.306) переключается с и (I) = —1 на и (t) = 0, то р2 (/J = +1 согласно уравнениям (8.292) и Подставим теперь уравнения (8.315) в (8.286). При t = получим H\t=tt = 0 = k + г2лх — az2. При t — t2 имеем хг(Л2) = Wj.; х2(/2) = да2; p2(/2) = — 1; «(Q^O. Подставив уравнения (8.317) в (8.286), найдем Н |/=;2 = 0 = & + üy2nx + aw2. Исключая лх из уравнений (8.316) и (8.318), определим kz, k — 2az2 (8.316) (8.317) (8.318) (8.319) Заменяя в выражении (8.314) w2 соотношением (8.319), получим 2.“—<8-321» Состояние (zx, z2) переводится в (г^х, w2) в течение положительного времени, и поэтому в уравнении (8.320) z2 < 0. (8.321) Таким образом, если определить кривую Г+ соотношением = 1»е(1 ^<о]. (8.322) то (zb z2) будет элементом из IŸ, т. е. (?i, z2) С rt (8.323) Те же рассуждения можно повторить для исходных состояний (£', для которых оптимальна управляющая последовательность { + 1; 0; —1}. Если оптимальным является управление «(0= +1 при 0 < Ct<tû ' и (t) = 0 ПрИ ti 5 С (8.324) u(0 = -l при t2 < <т, то, вводя обозначения хі (л) = zj; х2 (/1) = z2; Xi (/2) = W, х2 (t2) = w2, (8.325) можно найти, что уравнением геометрическое место состояний (^', определяется w'i = l—w2 + log (1 •+ aw'2), (8.326) где ^2^0, (8.327) 627
а геометрическое место состояний (?', z') определяется уравнением > 1 / akzc. \ = + + (8'328) где г2 0. (8.329) Определим кривую у_ соотношением V-= |(Хі, х2) : х2 = х2 4* “г log (1 Ч-ох2); x2>oj, (8.330) а кривую Г- соотношением ГГ-Ы, х^х^-^-ч- -^logfl х2^0}. (8.331) I I* Ct у гѵ J у I V+ U ï_ и г+ и іу делят фа¬ зовую плоскость на области Hlt Н2, Н3 и Нл (а — 1) Тогда (да;, да;) £ ѵ_; (8.332) (гі, £ ГГ. (8.333) Определим линию переключения у как ï = ï+Uï- (8.334) Из уравнений (8.311) и (8.330) получим V = {(*і, *2) : хх = fi (х2)}, (8.335) где функция fi (х2) определяется соотноше¬ нием fi(x2) = — sign {х2} 4г log(1 4 а|х2|). (8.336) Определим линию переключения Г\ со¬ отношением n=rtur?. (8.337) Из уравнений (8.322) и (8.331) найдем Г* = ((Хі, х2) : Хі = f2 (х2)), (8.338) где А (х2) = ~ ^ + sign (х2} A log ( 1 + I ) • (8-339) Кривые у и Г\ делят фазовую плоскость на четыре области Н2, Н3 и Я4, показанные на рис. 8.21. Более точно эти области определяются следующим образом: //1 = {(Xj, х2):%1 = г/і(х2) йх^ >/2(^2)!; (8.340) tf2 = {(Xj, x2):xj< C/i(x2) и Xj = /2(*2)} ’ (8.341) /73= {(Xi, x2):Xi < i/i(x2) и xx< /2 (*2)); (8.342) 774= {(Xi, x2):xx> > fi (x2) И Xi « /2 (X2)} » (8.343) где fi (х2) и /2 (*2) определяются соотношениями (8.336) и (8.339) соответ¬ ственно. Область Ні включает кривую у_, область Н2 — кривую ГТ область Н3 — кривую у+, область Я4 — кривую Г*". 628
Закон управления 8.6 (решение задачи 8.6). Оптимальное управле¬ ние и* как функция от состояния (хх, х2) определяется следующим образом: и* = ц* (хх, х2) = —I Для всех (хх, х2) Ç /7Х; ц* = w*(xx, х2) = +1 для всех (хх, х2) Ç //3; ц* w*(%i, Х2) = 0 для всех Ul> *2) € Н2 и #4- (8.344) Рис. 8.22. Иллюстрация траекторий, используемых для доказательства закона управления 8.6 Следовательно, и* единственно. Доказательство. Прежде всего убедимся, что оптимальное управле¬ ние существует. Далее, пользуясь хорошо нам знакомым методом исклю¬ чения, докажем, что управление (8.344) действительно оптимально. Предположим, что исходным является со¬ стояние (%х, х2) : у_ (заметим, что у_ а: HJ. С помощью рис. 8.17—8.19 «испробуем» каждую из управляющих последовательностей (8.298) и найдем, что только управляющая последова¬ тельность {—1} может перевести (хх, х2) Ç- Ç у_ в (0, 0) вдоль траектории у_. Таким обра¬ зом, действуя методом исключения, устанавли¬ ваем: если (хх, х2) Q у_, то оптимально управ¬ ление и (/) = —1. Предположим теперь, что1 (xi, х2) Ç Hi —у_. Снова с помощью рис. 8.17—8.19 «испытаем» каждую из управляющих последовательно¬ стей (8.298) и найдем, что только управляю¬ щая последовательность {—1; 0; +1) может перевести состояние (хх, х2) Ç Н1 —у_ в начало координат. Управление должно переключиться с и (/) == —1 на и (/) = 0 при пересечении траекторией кривой (траектория пересекает участок кривой Г+). При пересечении кривой у (ее участка у+) управление должно переклю¬ читься с и (/) = 0 на и (Z) = +1. Причина того, что переключения происходят на кривых и у, ясны из построения этих кривых. Предположим, исходным является состояние (хх, х2) Ç //4. С помощью рис. 8.17—8.19 приходим к выводу, что состояние (хь х2) £ Я4 может быть перевёдено в (0, 0) либо управляющей последовательностью {0, +1), либо последовательностью {—1; 0; +1}. Если (хх, х2) £ //4, то последователь¬ ность {—1; 0; +1} не оптимальна, и поэтому (по методу исключения) должна быть оптимальна последовательность {0; +1}. Допустим, управ¬ ляющая последовательность {—1; 0; +1} оптимальна. Тогда управление должно переключаться с и (Z) = —1 на и (/) = 0 на кривой Г+. Но это, как мы покажем ниже, невозможно. Рассмотрим исходное состояние А = = (£х, £2) Ç показанное на рис. 8.22. Траектория АВО получается при помощи управляющей последовательности {0; +1}. Очевидно, траек¬ тория Л В не пересекает кривой (по построению). Если можно показать, что траектория Т~, получающаяся при управлении и (Z) = —1 и исходя¬ щая из А = (£х, £2), не пересекает кривой Г+, то можно сделать вывод о неоптимальности управляющей последовательности {—1; 0; +1}. Уравнение траектории АВ [по формуле (8.303)] имеет вид = + (8.345) 1 Выражение Н± — у. означает область Н± за исключением кривой у_ (см. § 2.3). 629
Траектория Г”, исходящая из (£ь £2) и соответствующая управлению и (0 = —1, определяется соотношением [см. уравнение (8.305)1 X 1-х L. log ' (8.346) 1 1 а а 2 а* & ах2 4- 1 ' Так как траектория «движется» в «положительном» времени, то можно показать, что °^2 + 1 J ах2 -f- 1 откуда следует ,0§ Эіт < °- (8-347> и ил2 -f- 1 Из уравнений (8.346) и (8.347) получим + (8-348) Из уравнений (8.348) и (8.345) следует, что траектория Т“, производимая управлением и (/) = —1, располагается слева от траектории АВ. Так как прямая АВ не пересекает кривой Г+, то и траектория Т~ не пересекает кривой Г+, и поэтому управляющая последовательность {—1; 0; +1} не оптимальна. Аналогичным образом можно доказать закон управле¬ ния 8.6 и для исходных состояний из 77 2 U #з- Рассмотрим поведение оптимальной системы при k —> 0 и k —* сю. Кривая у не зависит от fe, так как функция (х2) (8.336) не зависит от k. Однако кривая зависит от k, потому что k входит в выражение (8.339) функции /2 (х2). Итак, имеем 1іт/2(х2) = — 4-+ sign {х2} log(l -+ a |x21) = A (x2); (8.349) lim/2(x2) = — 4-- (8.350) k-*o a Уравнение (8.349) означает, что при k —» оо кривая Гй переходит в кривую у. Следовательно, 1ітІ\ = у; (8.351) /г-> со lim//2 U Нц = ф (пустое множество), (8.352) &-> оо поэтому при k —> сю закон управления 8.6 превращается в закон оптималь¬ ного по быстродействию управления системой (8.284) (сравните с упраж¬ нением 7.32). При k —> 0 кривая превращается в прямую = (8.353) т Так как при малых k функционал J = J Ik + | и (f) | ] dt оценивает («взве- 0 шивает») в основном затраты топлива, то при k —* 0 получаем систему, оптимальную по расходу топлива, причем никаких ограничений на время перехода не накладывается. На рис. 8.23 показано деление фазовой пло¬ скости на области Н ъ Н Н3 и при k = 0 и некоторые из оптимальных по расходу топлива траекторий. Если исходное состояние принадлежит области Hlt то управление и = —1 прикладывается до тех пор, пока тра- 630
ектория не достигнет кривой I\ (k = 0), которая сама по себе является траекторией к началу координат (см. рис. 8.17). Время перехода в начало координат вдоль нее бесконечно велико, но время, требующееся на то, чтобы достигнуть сколь угодно малой окрестности начала координат, конечно х. На рис. 8.24 показана практическая реа¬ лизация закона управления 8.6. Сигнал х2 при¬ кладывается к нелинейностям Л\ и N 2. Нелиней¬ ность N ! соответствует кривой у, и на ее выходе получается сигнал (х2) в соответствии с соотно¬ шением (8.336). Нелинейность N 2 имеет характе¬ ристику, соответствующую кривой f2 (х2), ее вы¬ ходной сигнал f2 (х2) выражается уравнением (8.339). Из уравнений (8.340) и (8.343) заключаем: Рис. 8.23. Поведение ли¬ ний переключения при k -> 0 и а = 1 (случай оп¬ тимального по топливу управления без ограни¬ чений времени перехода). Траектории АВО и CDO являются оптимальными по топливу траекториями к началу координат а>0 означает (хь х2) Q Н± U Я4; а<0 означает (хх, х2) £ Н2 (J Я3; ô>0 означает (хх, х2) Ç /Л U Н2, b<ZO означает (хх, х2) £ Н3 U #4- (8.354) Сигналы а и b подаются на реле /?х и Т?2, на выходах которых получаются сигналы sign (а) и sign {b} соответственно. Таким образом, — sign {а} — sign [b] = + 2 означает (xj, х2) £ Н3\ — sign {а} — sign [b] = — 2 означает (хх, х2) Q Нг\ — sign {а} — sign {6} = 0 означает (хх, х2) £ Н2 U Т/4. j (8.355) Нелинейный элемент RD «вырабатывает» оптимальное управление в соответствии с законом управления 8.6. Рис. 8.24. Реализация закона управления 8.6 Заметим, что при k —» сю наклон характеристики N 2 стремится к нулю, а нелинейность Afx остается без изменений. Система, показанная на 1 Строго говоря, это означает, что оптимального по расходу топлива управления не существует. Однако существует 8-оптимальное управление. 631
рис. 8.24, превращается в систему, оптимальную по быстродействию. При k —> 0 нелинейность N2 превращается в линейный «усилитель» (с ко¬ эффициентом усиления и система, показанная на рис. 8.24, превра¬ щается в систему, оптимальную по расходу топлива, без ограничений на Рис. 8.25. Аппроксимация линии переключения кривой Г& время перехода. Сравнивая рис. 8.24 с рис. 8.13 (кото¬ рый изображает реализацию законов управ¬ ления 8.4 и 8.5 для объекта с двойным интегрированием), заметим что для системы рис. 8.24 требуются две нелинейности, а для системы рис. 8.13 одна \ Можно спроектировать субоптимальную систему, используя только одну нелиней¬ ность Nx (см. рис. 8.24). Кривую (см. рис. 8.21) можно аппроксимировать кривой Г\, имеющей то же уравнение, что и кривая у. Кривая у определяется выражением V = {(*ь х2) • = К (*2)}> (8.356) где /і (х2) — Функция (8.336). Определим новую кривую Г* как !(М, л^іх^ХЛ^); Х> 1). (8.357) Коэффициент X можно выбрать таким образом, чтобы кривая была «близка» 1 2 к кривой Г^. На рис. 8.25 показаны кривые у и при а — 1 и k — 1, а также кривая ГЛ при X = 2. Если использовать в качестве линий переключения кривые у и Г\, то система, показанная на рис. 8.26, Рис. 8.26. Реализация субоптимального закона управ¬ ления, полученного заменой кривой на кривую Г& будет близка к оптимальной. Ее отличие от системы рис. 8.24 состоит в том, что в ней используется только одна нелинейность для получения кри¬ вых у и ffe. 1 Причина в том, что уравнения кривых у^ на рис. 8.12 и на рис. 8.16 похожи по своему виду на уравнение кривой у. 2 Термин «близка» употреблен в практическом смысле, без претензий на математи¬ ческую строгость. 632
Выбор коэффициента X осуществляется, естественно, на основании дополнительной информации. Если, например, с очень большой вероят¬ ностью исходное состояние (gx, g2) удовлетворяет соотношению - Г<?2СГ, (8.358) то надо аппроксимировать кривую только на участке —Г < х2 < Г. Аппроксимация кривой с помощью тем лучше, чем больше вели¬ чина k. Если кривая располагается между кривыми у и І\, то субопти¬ мальная система требует меньше времени и больше топлива, чем оптималь¬ ная (почему?). Если же кривая ГЛ целиком располагается в области Н, и Яз, то субоптимальная система требует меньше топлива, но больше времени, чем оптимальная (почему?). Эти замечания относительно проектирования субоптимальной системы иллюстрируют, по нашему мнению, полезность получения оптимального устройства и на его основе — проектирования субоптимального, которое может оказаться более привлекательным с практической точки зрения. Упражнение 8.30. Рассмотрите аппроксимирующую кривую Г^, показанную на рис. 8.25 (а — 1, k = 1, X — 2), и исходное состояние (2, |2), —3 3. Постройте в функции от £2 следующие графики отношений: а) времени перехода для субоптимальной системы и времени перехода для оптималь¬ ной системы; б) потребляемых количеств топлива; т в) стоимостей J [1 + | и (/) | ] dt. о Упражнение 8.31. Рассмотрите систему Х1(/) = Х2(/); ) (8.359) i2(0 =-x2(t) +«(0;|«(0І < 1 J т и функционал F — j | и (/) | dt. Считайте T незаданным. Найдите оптимальный по расходу о топлива закон управления. Обсудите существование и единственность. Сравните с резуль¬ татами, полученными при k -> 0 (см. рис. 8.23). Упражнение 8.32. Повторите упражнение 8.31, считая Т ограниченным сверху вели¬ чиной Tf. Найдите оптимальное по расходу топлива управление как функцию от исходного состояния (£х, £2) и заданного времени перехода Tf. Упражнение 8.33. Предложите другие аппроксимации кривой и обсудите получив¬ шиеся субоптимальные системы. 8.10. МИНИМИЗАЦИЯ ЛИНЕЙНОЙ КОМБИНАЦИИ ВРЕМЕНИ И РАСХОДА ТОПЛИВА ДЛЯ НЕЛИНЕЙНОЙ СИСТЕМЫ ВТОРОГО ПОРЯДКА1 В § 8.9 была изучена задача о движении материальной точки при наличии «линейного» трения. В этом параграфе рассмотрим задачу об управлении движущейся материальной точкой в случае сил трения, ме¬ няющихся по нелинейному закону, пользуясь тем же функционалом, что и в § 8.8 и 8.9. Мы покажем, что многократное применение и логическая интерпрета¬ ция необходимых условий, даваемых принципом минимума, позволяют выразить оптимальное управление в функции от состояния с помощью одних только графических методов. Надеемся, что способы, применяемые при решении данной задачи, хорошо иллюстрируют как пошаговую про¬ 1 См. работу [14]. 633
цедуру использования необходимых условий, так и возможность руко¬ водствоваться лишь «видом» функций вместо их уравнений. Предположим, единичная масса движется в таких условиях, что сила сопротивления пропорциональна квадрату скорости. Обозначим через у (/) положение, а через и (I) — управляющую тягу в момент времени t. Будем считать, что |и(/)|<1, (8.360) а также, что сила сопротивления пропорциональна квадрату скорости у (t) и направлена противоположно ей. В этом случае движение единичной массы подчиняется дифференциальному уравнению y{t) = -ay^\y(t)\ + u(t)9 (8.361) где коэффициент трения а>0. (8.362) Включение сомножителя |г/(/)| в силу сопротивления ау (t) | у (t) | гарантирует, что последняя всегда направлена противоположно скорости. Обозначив через yd желаемое положение, введем, как и выше, фазовые координаты = — yd-, x2(t) = y(t). (8.363) Задача 8.7. Дана система хх(0 = х2(0; 1 (8.364) *2(0 = — ^х2(/)|х2(/)| + «(0; |«(0| < 1- I Найти управление, переводящее систему (8.364) из любого исходного состояния (£ь g2) в (0, 0) и минимизирующее при этом функционал т = f [Æ + I и (/) I ] dt, (8.365) Ô где £>0 (8.366) и время перехода Т не задано. В § 7.11 мы рассматривали оптимальное по быстродействию управле¬ ние нелинейной системой второго порядка и получили закон управления системой (8.364), показанный на рис. 7.68 (при а = 1). В § 7.11 отмеча¬ лось, что оптимальное по быстродействию управление нелинейными систе¬ мами второго порядка в основном не отличается от оптимального по быстро¬ действию управления линейными системами второго порядка. Изучение оптимального управления нелинейной системой (8.364) по отношению к стоимости (8.365) должно показать, существуют ли отличия между линейными и нелинейными системами в случае, когда расход топлива входит в функционал. Как будет показано, различие действительно суще¬ ствует, и мы обнаружим это, доказав, что вырожденные управления могут быть оптимальными. Для получения необходимых условий оптимального управления вос¬ пользуемся принципом минимума. Гамильтониан Н для системы (8.364) со стоимостью (8.365) имеет вид н = k 4- I и (t) 1 + х2 (0 Р1 (0 — ах2 (t) I х2 (0 I р2 (0 4- + и(і)р2(і). (8.367) 634
Дополнительные переменные рх (t) и р2 (О удовлетворяют дифферен¬ циальным уравнениям А (0 = - Zv - °; <8-368) Рі (0 = дх а} Рі(0 + 2fl|x2(/)|p2(/). (8.369) Примем, что лі = Pi (0); л2 =■ Pi (0)- (3.370) и получим уравнения Px (/) = nj = const; (8.371) Рі (О = — Л1 + 2а I х2 (/) I р2 (/). (8.372) Управление, абсолютно минимизирующее гамильтониан и удовлетво¬ ряющее ограничению \и (/)| < 1, равно и(/) = 0, если |р2(/)|< 1; (8.373) u(t) = — sign {р2(/)}> если |р2(/)|>1; (8.374) 0 < и (/) « — 1 <и(0 < С + 1, если р2(/) =— 1; (8.375) СО, если р2(/) = + 1. (8.376) Покажем, что если в функционале (8.365) k < 1, то для данной задачи существуют вырожденные экстремальные управления. Для этого 1 пред¬ положим, что Их, /2] cz [О, Т] и р2(/) = -|-1 ПРИ любом t £ [/х, t2]. (8.377) Отсюда следует: р2(/) = 0 при любом t Q [/х, /2]. (8.378) Подставляя выражения (8.377) и (8.378) в уравнение (8.372), получим = 2а|х2(/)| при любом t £ [/ь /2]. (8.379) Так как лх и а — константы, это означает, что х2(/) = const при любом t £ [/х, t2]. (8.380) НОЙ Может возникнуть подозрение, не является ли х2 (t) кусочно-постоян- функцией, например х2(0 = >Иі<^<^; (8.381) такой, что уравнение (8.379) удовлетворяется. Это невозможно, так как х2 (0 — фазовая координата и, следовательно, непрерывная функция времени 2. Таким образом, х2 (0 = const. Из уравнения (8.379) также следует лх>0. (8.382) Но так как х2 (t) = const при любом t Q Их, /2], то х2 (/) = 0 при любом t £ [/х, /2], (8.383) поэтому из уравнения (8.364) получим и (/) = ах2 (t) I х2 (/) I при любом t £ [/х, /2]. (8.384) 1 Советуем читателю вернуться к материалу § 6.21 и 6.22. 2 См. § 4.5, аксиома 4.3. 635
Так как х2 (/) = const, из уравнения (8.384) следует и (t) — const при любом t £ [Zx, /2] (8.385) Мы начали с уравнения (8.377) и с предположения, что р2 (/) = +1 при любом t £ /2], а затем, следуя от уравнения (8.378) к (8.385), пришли к выводу, что управление и (Z) должно быть постоянным при лю¬ бом t £ t2]. Если это постоянное управление оптимально, то оно должно удовлетворять необходимым условиям принципа минимума. Одно из требований состоит в том, что оптимальное управление должно минимизировать гамильтониан. Это условие выражается уравнением (8.376). Итак, на основании уравнений (8.376) и (8.385) — 1 < u(t) = const < 0 при любом t £ [/х, /2]. (8.386) Другое необходимое условие состоит в том, что гамильтониан (8.367) должен быть тождественно равен нулю при любом t £ [О, Т ] 1} и, следо¬ вательно, при любом t £ [i\, t2]. Подставляя уравнения (8.377), (8.379) и (8.384) в уравнение (8.367), получим, что при любом t £ ltlf 121 должно выполняться равенство // = 0 = £ + |д/(/)|+ 2ах2 (/) | х2 (01 - — ах2 (t) I х2 (/) I 4 и (t). (8.387) Так как и (/) отрицательно, то, очевидно, I и (/) | + и (/) = 0 при любом t QД/1,/2], (8.388) поэтому из уравнения (8.387) получим — ах2 (t) I х2 (/) I = k при любом t Q [^, /2]. (8.389) Из уравнения (8.384) находим, что u(t) = —k при любом t £ [/х, /2]. (8.390) Итак, постоянное управление и (t) = —k удовлетворяет условиям * 2, вытекающим из принципа минимума, и поэтому может быть оптимально, если \и (/)| < 1; очевидно, что для этого должно быть k<l. (8.391) Из уравнения (8.390) получим также т / Г *2(/) —У-t- (8.392) Аналогичные рассуждения можно повторить и для р2 (/) = —1 при любом t Ç- Ux, t2] и прийти к выводу, что управление и (Z) = k при любом t Ç [Zx, /2] может быть оптимальным. Таким образом, мы доказали следующую лемму. Лемма 8.21. Если k < 1 (8.393) и I р2 (t) I = 1 при любом / Ç [/х, /2], (8.394) то вырожденное управление ц(/) =—&sign{p2(Z)} при любом t £ [4, t2] (8.395) может быть оптимальным. В этом случае Лі = 2 V-sign [р2 (/)} (8.396) 1) Так как система (8.364) и подынтегральная функция k + | и (f) | инвариантны во времени, а время перехода не задано. 2 Мы еще не убедились в том, что это управление удовлетворяет граничным условиям. 636
и *2(0 = -/4 signal- (8.397) В дальнейшем будем полагать, что k < 1. Так как оптимальными могут быть управления и (/) = +1,н(/) = —1, и (і) = 0, и (/) = k и и (/) = —kt полезно рассмотреть траектории си- Рис. 8.27. Траектории системы (8.364) при и (/) = +1 и а = 1 Рис. 8.28. Траектории системы (8.364) при и (t) = —1 и а = 1 стемы (8.364) на фазовой плоскости, соответствующие этим управлениям. На рис. 8.27—8.30 показаны траектории системы. Все траектории строи¬ лись графически 1 для а = 1. Рис. 8.29. Траектории системы (8.364) при и (t) =0 и а — 1 К=1,00 1 0,56 0,25 0,06 1 f 0 К =0,06 0,25 0,56 1^00 - 1 Рис. 8.30. Траектории системы (8.364) при и (t)~ ±k и а = 1. Траектории, соответствующие u—k, расположены в верхней полуплос¬ кости (х2 >* 0), а при и = — k — в нижней полуплоскости (х2 <5 0) Интересно сравнить траектории на фазовой плоскости этой системы с нелинейным трением с траекториями системы, рассмотренной в § 8.9. 1 Из уравнения (8.364) следует, что = г^“ТТ— » и поэтому наклон wX2 Û!X2 J Х2 I J ■ И траекторий известен. 637
Из сравнения рис. 8.27 с рис. 8.18 видно, что траектории этих двух систем похожи друг на друга и лишь незначительно отличаются по виду. Однако сравнение рис. 8.29 с рис. 8.17 обнаруживает существенные различия характеристик двух систем. Так как //-минимальное управление и (/) является нелинейной функ¬ цией дополнительной переменной р2 (0» желательно получить как можно больше информации относительно р2 (О- Для этого докажем следующую лемму. Лемма 8.22. Функция р2 (/) непрерывна при всех t £ [О, Т] и может обращаться в нуль не более одного раза. Доказательство. Функция р2 (/) является решением дифференциаль¬ ного уравнения (8.372), и поэтому р2 (t) является непрерывной функцией времени. Доказательство того, что р2 (t) обращается в нуль не более одного раза, приводится в § 7.11 и поэтому опущено. Лемма 8.23. Оптимальная управляющая последовательность к началу координат должна иметь вид {. . .; +1} или {. . .; —1}. Иначе говоря, оптимальное управление при t = Т должно быть равно и (Т) = +1 или и (Г) = —1 (если оно существует). Доказательство. Управляющая последовательность {. . .; 0} не может быть оптимальна, так как подстановка и (Т) = хх (Т) = х2 (Т) = 0 в уравнение (8.367) дает H = k > 0. Управляющая последовательность {. . .; +k] не может быть оптимальна, так как подстановка р2 (Т) = —1, и (T) = k, хг (Т) = х2 (Г) = 0 в уравнение (8.367) дает Н = k >> 0. Управляющая последовательность {. . .; —k} не может быть оптимальна, так как подстановка р2 (Т) = +1, и (Т) = —fe, хх (T) = х2 (T) = 0 в уравнение (8.367) дает И = k > 0. Лемма доказана методом исключения. Существует другой путь доказательства леммы 8.23, основанный на виде траекторий, а также на том, что при k > 0 время перехода должно быть конечно. Из рис. 8.29 и 8.30 видно, что траектории, соответствующие управлению и = 0 и и = ±k, не попадают в начало координат. В начало координат попадают лишь две траектории, соответствующие и = +1 и и = —1 (см. рис. 8.27 и 8.28). Упражнение 8.34. Покажите, что если и (Т) = +1, то р2 (Т) = —1 — k, и если и (Т) = —1, то р2 (Т) = 1 + k. Опишем путь дальнейших рассуждений. Как и в § 8.9, мы сформу¬ лируем определения различных траекторий, получающихся при различ¬ ных постоянных управлениях. После этого приведем ряд лемм, выделяю¬ щих управляющие последовательности, которые могут быть оптимальными. Доказательство некоторых из лемм «конструктивно» в том смысле, что мы определим различные линии переключения через входящие в них величины. С помощью ряда лемм докажем, что экстремальные управления един¬ ственны. После этого мы окажемся в состоянии доказать закон управ¬ ления 8.7. Определение 8.7. Обозначим через Т+ (£х, |2, xlt х2) траекторию, исходящую из (gx, |2), производимую управлением и (Z) = +1 и прохо¬ дящую через состояние (точку) (хх, х2). В силу того, что время положи¬ тельно, имеем (см. рис. 8.27) |^-/4-і>іх2-УТІ- <8-398) Все траектории Т+ асимптотически стремятся (при t —» оо) к прямой х2 = + • Обозначим через Т~ (£х, g2, *і» *2) траекторию, исходящую 638
из (Si, S2), производимую управлением и (t) = —1 и проходящую через состояние (хх, х2). Из-за положительности времени имеем (см. рис. 8.28) Р/4ІД- +/Д <8'з99> Все траектории Т~ асимптотически стремятся (при t —* ею) к прямой х2 - — . Обозначим через Т° (Si, S2, *і, *2) траекторию, исходящую из (gj, S2), производимую управлением и (0 = 0 и проходящую через состояние (хх, х2). Из-за положительности времени (см. рис. 8.29) имеем IS2|>|%2|. (8.400) Обозначим через Tt (Si, S2, *2) траекторию, исходящую из (Sx, S2) и производимую вырожденным управлением и (Z) = + &, 0 < k < 1 (см. рис. 8.30). На основании леммы 8.21 и положительности времени имеем Ь = (8.401) Обозначим через Т~ (Si, S2, *і, *2) траекторию, исходящую из (Sx, S2) и производимую вырожденным управлением и (t) = —k (см. рис. 8.30). На основании леммы 8.21 и положительности времени имеем ^2 = х2 = -(8.402) Определение 8.8. Обозначим через у+ (у_) множество состояний (хх, х2), которые могут быть переведены в (0, 0) управлением и (t) = +1 (и (t) = —1) за положительное время: у+ = {(*і, *2)‘ (*і, хг) С Т+ Ui, х2’ 0» 0), хх >0, х2 < 0}; (8.403) у_ = {(хх, х2) : (хх, х2) £ Т~ (хх, х2, 0, 0), хх<$0, х2>0). (8.404) Пусть У = У+ U У- (8.405) Кривые у+ и у_ показаны на рис. 8.31. Как показано на рис. 8.31, — множество состояний справа от кривой у, а SL — множество со¬ стояний слева от кривой у; S# = {(хх, х2) : хх >хі, если (хь х2) Ç у}; (8.406) St = {(хх, х2) :хх<хь если (хх, х2) £ УІ- (8.407) Рассмотрим теперь управляющие последовательности вида {. . +1}. Лемма 8.24. Управляющие последовательности вида {. . .; —1; +1}, (. . .; —k; +1} и (. . .; 4-fe; +1} не могут быть оптимальны, и поэтому должна быть оптимальна управляющая последовательность 0; +1}. Доказательство. Допустим, что оптимальна либо {. . .; —1; + 1}, либо {. . .; —k; +1}, и пусть управление переключается с и = —1 или с и = — k на и = +1 при t = /х. Тогда р2 (/х) = -1 и р2 (Zx—) = +1 [см. уравнения (8.374) и (8.376)]. Следовательно, при t = tv имеет место разрыв р2 (0, что противоречит лемме 8.22. Управляющая последователь¬ ность {. . .; k; +1} не может быть оптимальна, так как траектории Tf (Si, S2, *і, х2), производимые управлением и (/) = +k, расположены в верх¬ ней половине фазовой плоскости, а кривая у+ — в нижней (см. рис. 8.30 и 8.31). Лемма 8.25. Если лх — 2 ka, (8.408) 639
то управляющая последовательность {0; —k} 0; +1} может быть опти¬ мальной, а {. . —1; 0; —k\ 0; +1} — нет. Доказательство выполним графически. На рис. 8.32 показан вид функции р2 (0, которой соответствует управляющая последовательность {0; —fe; 0; +1}. Пунктирное продолжение р2 (0 требуется для получения последовательности {...§—!• 0; — kl 0; +1}- Пусть Рис. 8.31. Кривые у+ и Y* (а= 1) и области SrkSl (8.409) Х1 (/5) = Шх; х2 (/б) == ш2; Х1 (fi) Х2 (^4) “ S2Î Х1 (?з) == ^1» Х2 (^з) = ^2> Х1 (*о) ~ *1» Х2 (?о) = Г2' Рис. 8.32. Вид функции р2 (/), которой соот¬ ветствует управляющая последовательность { . . ., —1, 0, —&;0;-Н}. Участок р2 (t), пока¬ занный сплошной линией, дает управляющую последовательность {0, —/г, 0, 4-1} Очевидно, что (wlt wJ Ç у+, (8.410) и поэтому w2 <JO. (8.411) Но р2 (4) = —1, и так как тц = 2 то условие Н = 0 дает Н = 0 = k 2 Ykaw2— awl- (8.412) Решив уравнение (8.412) относительно ш2, получим w2 = ±У2). (8.413) Так как w2 <30, то = -(1/2-1). (8.414) Тем самым точка (wly полностью определена, поскольку она пред¬ ставляет собой пересечение кривой у+ и прямой х2 = — j/*-^-(]/2 — 1). Так как при t = состояние равно (sb $2) и и (0 = 0 при любом t Ç [Z4, 7б], то существует траектория 7° (sx, s2, wlf ш2), соединяющая ($і, s2) с (wlt ш2). Из уравнения (8.400) и условия w2 <50 получим соот¬ ношение (8.415) При t = /4 и р2 (4) =. + 1 условие Н = 0 дает уравнение /7 = 0 = k + 2 kcis2 4“ (8.416) 640
Решая уравнение (8.416) относительно s2, находим = (8.417) Точка (s15 s2) полностью определена, поскольку она является пересе¬ чением траектории TQ(slf s2, w2) и прямой х2 — — ]/ В течение временного интервала t3 С t < Z4 управление вырождено, т. е. и —k, и поэтому траектория проходит вдоль прямой х2 = — |/ Рис. 8.33. Вид функции р2 (/), которому соответ¬ ствует управляющая последовательность { . . —1, О,—1, —k, 0, +1}. Участок р2 (/), показанный сплошной линией, дает управляющую последова¬ тельность (0; —1; —k; 0; +1} до точки (st, s2). Итак, точки (zn z2) и (sb s2) соединены траекторией ТТ (2Х, z2, sr, s2), и поэтому [из уравнения (8.402)] получим Ч = s2 = - )' V < 0; ?!>*!> 0- (8-418) Допустим, что оптимальна управляющая последовательность {. . .; —1; 0; —k\ 0; +1}. Тогда (см. рис. 8.32) найдется такой момент времени /0 < ^з> что Р-2 (^о) = 1» Р2 (Q <0, и состояние системы будет (ѵь ѵ2). Состояние (иь ѵ2) должно переводиться в z2) по траектории 7° (ѵх, ѵ2> 2і> ^2). Из уравнений (8.418) и (8.400) следует, что ѵ2<г2 -= - (8.419) При t =■- -ij = 2 Y ka, p2 (/0) = 4 1, x2 Go) = <0 имеем P2 Go) — 2 Vka — 2av2. (8.420) Так как p2 (tQ) <0 (см. рис. 8.32), из уравнения (8.420) получим ѵ2>-'|/4- (8.421) Соотношения (8.419) и (8.421) противоречат друг другу. Следова¬ тельно, последовательность {. . .; —1; 0; —k; 0; +1} не может быть оптимальна. Оптимальной может быть последовательность {0; —k; 0; +1}. Лемма 8.26. Если л1 = 2]/^ (8.422) то последовательность [0; —1; —k; 0; +1) может быть оптимальной, а последовательность |. . .; —1; 0; —1; —k; 0; 4-1} —нет. Доказательство выполним графически. На рис. 8.33 показан вид функции р2 (t), дающей управляющую последовательность [0; —1; —k; 21 Лтанс и др. 641
0; +1}. Пунктирный отрезок р2 (0 дает управляющую последователь¬ ность (. . .; —1; 0; —1; —/г; 0; +1}. Воспользуемся обозначениями (8.409) и, кроме этого, примем •^і (^2) “ ^2 (^2) = ^2- (8.423) Очевидно, что все условия и уравнения для состояний (wly w2), (sb s2) и (zb z2), полученные при доказательстве леммы 8.25, остаются в силе. Так как и (/) = —1 при t £ [t2, /3Е то состояние (<?х, q2) при t = t2 должно переводиться в (гх, г2) управлением и ■== —1, и поэтому (zx, г2) и (?і, 9г) соединены траекторией Т~ q2; zx; z2). Поскольку [см. урав¬ нение (8.418) ] z2 = — ]/ — >—1/—, то должно быть [см. уравне¬ ние (8.399)] а а_ ^>-/4- (8-424) Но р2 = +1 и Pz > 0 при t = t2. Так как р2 (t) = —2 Уka-'r + а| ç2|p2 (<2), получим ш>/4- <8-425) Из неравенств (8.424) и (8.425) следует <72>/4>°. (8.426) При t = t2 условие Н = 0 дает уравнение 0 = k 4- 2 Yka q2 — aql, откуда, в свою очередь, в силу неравенства (8.426) следует q2- /4(і +/2). (8.427) Таким образом, состояние (q19 q2) определено, поскольку оно является пересечением траектории Т~ (qlt q2i zlt z2) с прямой х2 = j/"( 1 4- 1^2). Допустим, что оптимальна последовательность {. . .; —1; 0; —1; —k; 0; +1}. Тогда найдется такой момент времени t0 < /2, что при t = хх Go) = G, *2 Go) = G, Р2 Go) = L Р2 Go) <0- Так как U (0 = о при t £ По, /2], то состояние (гх, г2) должно быть соединено с (çx, q2) траекторией TQ (rx, r2, qlt q2). Из этого, а также из уравнений (8.400) и (8.427) следует, что r2>q2= /4^ + ^2)>/4>°- <8-428) Но р2 (/о) = — 2 Уka + 2a|r2|p2 (t0); так как р2 (t0) <0 и р2 (t0) = 1, получим г2і</4- (8-429> Уравнения (8.428) и (8.429) противоречат друг другу. Следовательно, управляющая последовательность (. . .; —1; 0; —1; —k; 0; +1} не может быть оптимальной, и поэтому в качестве возможной оптимальной последо¬ вательности необходимо рассматривать только последовательность {0; —1; — k; 0; +1}. 642
Лемма 8.27. Если Jij = 2]/Т’я, то управляющая последователь¬ ность {. . .; —k; 0; —1; —k; 0; +1} не может быть оптимальной. Упражнение 8.35. Докажите лемму 8.27. Лемма 8.28. Если = 2 У ka, то управляющие последователь¬ ности (. . .; 4-1; 0; —k; 0; 4-1} и (. . .; +k; 0; —k\ 0; 4-1} не могут быть оптимальны. Упражнение 8.36. Докажите лемму 8.28. Указание: используйте лемму 8.22. Теперь обсудим результаты лемм 8.25--8.28. Мы показали, что если 2У ka (лишь в этом случае вырожденное управление и (/) = —k может быть частью опти¬ мальной управляющей по¬ следовательности), то опти¬ мальными могут быть только управляющие последователь¬ ности {0;—k\ 0; 4-1) и {0; — 1; —k\ 0; 4-1}. По прин¬ ципу оптимальности можно сделать вывод, что любая подпоеледовател ьность из этих двух управляющих последовательностей также может быть оптимальна. Перечислим некоторые из определений и построе¬ ний, использовавшихся ра¬ нее при доказательствах гра¬ фическими методами (рис. 8.34): 1) во-первых, выбираем л j = 2 ]/ka\ 2) по уравнению (8.414) находим w2 = — I/ — X И/2-І); Рис. 8.34. Точки (ojp w2), (slt s2) и (qlf q2) и кривые и 3) точка (wi, w2) принадлежит кривой y+; 4) по соотношению (8.417) имеем s2 = — 1/ 5) точка (sb s2) является пересечением траектории Т° (sx, $2, ^i» и прямой х2 = — . 6) из соотношения (8.427) имеем q2 = "|/^-(1 + У%)’ 7) точка (7і, q2) является пересечением траектории T" (ft, q2, zlf z2) и прямой х2 = |/ -^- (1 4- У2). Назовем геометрическое место точек (zi, z^) кривой у*: yt = |(хі, х2) : х2 = — у , xi > si (8.430) Рассмотрим геометрическое место точек (çx, q2) в зависимости от изме¬ нения (zi, г2) вдоль кривой yt- В частности, (7ь ft) ~ lim (ft, ft). (2і, г2) -* (s 1, s2) (8.431) 643
Точка (qx, q2) показана на рис. 8.34. Легко видеть, что (qx, q2) является пересечением Т~ (qx, q2, s,, s2) с прямой х2 = ^2)- При изменении (гь г2) на множестве yt точка (^, qi) описывает кри¬ вую, которую будем называть кривой у^\ vt = {(%ъ х2):х2= (1 -I-F2); Х1>?1]. (8.432) Докажем теперь ряд лемм в предположении, что 4= 2 }/ka. Если jij =4 2 У ka, то вырожденное управление и (t) = —k не может быть частью оптимальной управляющей последовательности (см. лемму 8.21). Лемма 8.29. Если Лі > 2 У ka. (8.433) то управляющая последовательность {0; —1; 0; +1) может быть опти¬ мальной, а последовательность {. . .; —1; 0; —1; 0; 4-1} —нет. Рис. 8.35. Вид функции р2 (/), которому соответствует управляющая последова¬ тельность {. . ., —1; 0; —1; 0; +1 }х. Участок р2 (/), показанный сплошной линией, дает последовательность {0; —1; 0; +1} Доказательство выполним гра¬ фически. На рис. 8.35 показан вид функции р2 (/), дающей управля¬ ющую последовательность {0; —1; 0; + 1}. Отрезок р2 (/), показанный штриховой линией, дает управля¬ ющую последовательность {. . —1; 0; —1; 0; +1}. Пусть ті = (Q; т2 = х2 (Q; ' "і - Ш п2 = х2(/4); ~ (^>)» ^2 “ х2 Sl “ X1 о)і §2 “ Х2 (Q ' При t = /0 управление переключается с м = 0на« = +1, причем и (/) = +1 при любом t £ l/ô; Т]. Отсюда следует, что (mn т2Уу+ (8.435) и поэтому т2<0. (8.436) При t = /5, р2 (t5) = —1; условие Я - 0 дает уравнение Н = 0 — 1 4 — аті (8.437) Воспользовавшись неравенством (8.436) для определения знака, по¬ лучим т-2 (лі — ] Лі *- 4а&) . (8.438)1 Заметим, что справедливы предельные соотношения [см. уравнение (8.414)1 _ lim m2 = — 1 / -L (J/2— 1) = w.2; (8.439) lim m2 0. (8.440) Неравенство (8.433) гарантирует, что m2 — действительное число. 644
При t = /4 управление переключается с и (/) = —1 на и (/) = 0. Так как и (/) = 0 при любом t [/4, /5], получим соотношение n2<m2<0. (8.441) При t = /4 р2 (/4) = +1, р2 (/4) << 0 и поэтому из уравнения р2 (^) —яі + 2а\п2\р2 (^4) получаем соотношение н2>-^. (8.442) Условие Н - 0 при I = /4 дает Н = k + /готті = 0. (8.443) Таким образом, мы найдем [пользуясь соотношением (8.442)] п2 (Л1 — лі — 4а&). (8.444) При этом выполняются предельные соотношения [см. уравнение (8.417)] 1іт_ п2 = — = s2; (8.445) Лі~>2 ka lim п2 = 0; (8.446) Л,—>оо lim (/гр п2) = ($i,s2)- (8.447) л, >J ka При t = t2 p2 (t2) =- 1 и p2 (/2) >0; поэтому уравнение p2 (t2) = = —лх + 2a I h21 p2 (/2) дает неравенство (8.448) Так как и (/) = —1 при t Ç [/2, /4] и \ лі л /Л k . I f 1 •ч(G) - «2> — 2^ > — I ~>— I — * то получается [(см. уравнение (8.399)1 (8.449) Из двух неравенств (8.448) и (8.449) делаем вывод, что lÆL^O. (8.450) Условие Н 0 при t — t2 дает H^Q=k h^ — ahl (8.451) Решим уравнение (8.451), пользуясь неравенством (8.450) для выбора знака, и найдем /г? =- (лі + ] -- 4ak). (8.452) Заметим, что lim h,-- 1/— (1 н /2) = ^2; (8.453) а 1 lim h2 = +oo; (8.454) oo lim_(/i1, h2) = (q1, q2). (8.455) Лі->2 ka 645
Для доказательства того, что управляющая последовательность {. . .; —1; 0; —1; 0; +1} не может быть оптимальной, можно повторить процедуру доказательства леммы 8.26, и поэтому мы предоставляем эту часть доказательства проделать читателю в порядке упражнения. Лемма 8.30. Если п1>>2Ука, то управляющая последователь¬ ность типа +1; 0; —1; 0; +1} не может быть оптимальной. Упражнение 8.37. Докажите лемму 8.30. *2 Рис. 8.36. Кривые и Геометрическое место точек (h1yh2) Кривая T'(hltJi2,nun2) q2,S1tSz) еометрическое место точек (пъП2} / Кривая у* /, ($!, $2> Геометрическое место ~точек (тьт2) Указание: пользуйтесь леммой 8.28. Лемма 8.31. Если л ! >2/^, то управляющая последователь¬ ность типа {. . .; +1; 0; +1} не может быть оптимальной. Упражнение 8.38. Докажите лемму 8.31. Еще раз посмотрим, что сле¬ дует из лемм 8.29—8.31 и их гра¬ фических доказательств. Для ил¬ люстрации воспользуемся рис. 8.36. _ 1. Выбираем лх '^>2]/rka. 2. Согласно выражению (8.438) имеем т2 = (лі — + ^ak}. 3. Точка (mx; m2) принадле¬ жит кривой у+, являясь точкой пересечения кривой у+ с прямой: = (яі-Кяі т 4яА). ïq 4. Согласно выражению (8.444) имеем "2 = — 2? (Л1 — КЯ1 — 4о*)- 5. Чертим траекторию T0 (nlf п2, mlt проходящую через (т19 т2), и находим точку ее пересечения с прямой: Х2 = — («! — ]/лі — 4а&). Точка пересечения дает точку (п19 п2). 6. Согласно выражению (8.452) имеем /і2 — (лі + "|/~л? -j- 4ak^. 7. Точка (йх, h2) есть точка пересечения прямой Х2 — *2^* (Л1 4aé) с траекторией T (hlt h2, п2), проходящей через точку (п19 п2). Итак, для каждого из значений лх > 2 У ka можно графически найти точки (mx, т2), (лгх, п2) и (йх, Л2). Если лг изменяется на множестве 2 У ka < лх < оо, (8.456) 646
то получаются геометрические места точек (тъ т2), (пъ п2) и (/ц, Zz2). Мы знаем, что х2):(хі, х2)£ѵ+; — j/^ < х2 < oj. (8.457) Определение 8.9. Обозначим через yt геометрическое место точек (Z2i, /2о), а через yt — геометрическое место точек (Лі, Л2), получающееся при изменении л х на множестве значений 2 У ka < лх <5 оо. Эти множества yt и yt показаны на рис. 8.36. Серию лемм завершим следующей леммой. Лемма 8.32. Если < 2 У ka, то управляющая последовательность [0; +1} может быть оптимальна, а последовательности вида {. . .; —1; 0; +1} и {. . .; +1; 0; +1} не оптимальны. Упражнение 8.39. Докажите лемму 8.32. Указание: доказывайте от противного. Мы определили выше некоторые кри¬ вые, показанные на рис. 8.34 и 8.36, и назвали их кривыми у+, у_, у+, у+, и у+. Все эти кривые принадлежат к т. е. расположены справа от кривой у+ J у_. Так как система симметрична, то можно доказать аналогичную последовательность лемм относительно управляющих после¬ довательностей вида (. . .; —1}. Чтобы не тратить усилий попусту, определим кривые у~, у~, у~ и у- как кривые, сим¬ метричные относительно начала коор¬ динат кривым у+, и соответ¬ Н3, Нь и Н6 ственно. Напомним, что каждая из этих кривых зависит от постоянной k, 0 <Z k < 1- На рис. 8.37 показаны все эти кривые для значений а = 1 и k = 0,25. Все они были построены описанными выше графическими ме¬ тодами. Как видно из рис. 8.37, эти кривые делят фазовую плоскость на шесть областей, обозначенных Hlf Н2, Я3, Т/4, Нъ и //6. Мы ограничимся определением этих областей с помощью рис. 8.37, добавив, что Н2 включает кривую Я3 включает кривые у~, у~ и Н- включает кривую Я6 включает кривые и Горизонтальные отрезки и у~ не включаются ни в одну из областей У-Н6. Решением поставленной задачи является следующий закон управ¬ ления. 647
Закон управления 8.7 (решение задачи 8.7). Если 0< k < 1, то единственное оптимальное управление w* как функция состояния (хь х2) определяется следующим образом: и* = 0 для всех (хь х2) £(J Н2 U U и* = —1 для всех (ад, а2) Я6; и* — 4~ 1 для всех (ад, ад) Я3; (8.458) и* -= —k для всех (A4, ад) и* ~ 4-Л для всех (хр ад) - Доказательство. Пусть (£х, £2) — некоторое исходное состояние. Напомним, что построение различных кривых основывалось на том, что оптимальными управляющими последовательностями к началу координат являются |0; 4-1), если (gp Д) G ТД (0; — 1), если (Вр Ê2) G V7J { — k, 0; 4-1), если (|р L) G у+; {4-А; 0; —1), если (Д ê2) G ТГ; {—1; 0; +1), если (|р S2) G Y/t; { + 1; 0; —1), если (£p (—1; —k', 0; -+-1), если (|р [4-1; +k; 0; —1), если (£р g2) G Отсюда непосредственно следует: Если (|г, Ѣ2)£Н6, то u(t) = — 1; Если (£х, g2)<//3, то u(t) = 4-1; Если (gp g2) £ у+, то и (/) = — k\ Если (£р |2)СТГ’ то u(t) = +k. (8.459) (8.460) На основании лемм (8.26) и (8.27) делаем вывод, что к кривой у+ J ïj" надо двигаться по траектории TQ. Отсюда, если (Ёд, %2)^Hlt то и(/) = 0. (8.461) Из леммы 8.25 следует, что к кривой надо двигаться по траекто¬ рии Т°, и поэтому в Нь существует подмножество исходных состояний, которые переводятся на кривую у+ управлением и = 0. Из леммы 8.32 следует, что существуют состояния, которые могут переводиться в точки кривой у+ управлением и (/) = 0. Итак, если (£р 12)ѵН5, то — (8.462) Аналогичные рассуждения приводят к заключению: если (g1? £2)6^2> то w(/) = 0. (8.463) Таким образом, закон управления доказан. Устремим теперь k —> 0 и рассмотрим поведение различных кривых 648
в этом предельном случае. Такой переход даст нам решение, оптималь¬ ное по расходу топлива. Из уравнений (8.414) и (8.427) находим lim (w , w2) = (0, 0); k->0 s2) = (0, 0); . (8.464' lim(<7i, q2) = (0, 0). Из уравнений (8.438), (8.444) и (8.452) получим lim (mp m2) = (0, 0); Æ—>0 lim (nb n2) = (0, 0); . (8,465) lim^j й2) = (oo; co). £->0 Итак, lim = lim y~ =0 (8.466) — пустое множество, limy+uy- есть ось xj (8.467) /?-»о limy+Uï- есть ось (8.468) Л—>0 lim y+U V7 = V+U Y_. (8.469) Упражнение 8.40. Решите задачу об оптимальном по расходу топлива управлении т системой (8.364) (т. е. используйте функционал Æ = J | и (t) | dt; Т не задано). Обсудите и существование и единственность и сравните с результатом, полученным выше при k -> 0. т Упражнение 8.41. Рассмотрите систему (8.364) и функционал F ~ j |u(/)|d/. о Считайте Т заданным. Опишите порядок отыскания оптимального управления. Суще¬ ствуют ли в этом случае вырожденные решения? Упражнение 8.42 Ч Решите задачу, рассмотренную в настоящем параграфе при k > 1. Указание: вырожденных управлений быть не может; наиболее общими оптимальными управляющими последовательностями являются {0; +1; 0; —1} и {0; —1; 0; +1}. Поло¬ жите k -> оо и проверьте, стремится ли ваше решение к решению, оптимальному по быстро¬ действию (§ 7.11). Упражнение 8.43. Спроектируйте практическую реализацию закона управления 8.7 и предложите субоптимальные устройства. Повторите упражнение для закона управления, полученного в упражнении 8.42. 8.11. ЗАМЕЧАНИЯ И ОБОБЩЕНИЯ В § 7.11 были рассмотрены способы оптимального по быстродействию управления для одного класса нелинейных систем второго порядка. Мы пришли к выводу, что оптимальное по быстродействию управление нелинейными системами то же, что и для линейных систем, за исключением «вида» уравнений или линий переключения. 1 Решение приводится в работе [14]. 649
Если сравнить оптимальное управление * 1 нелинейной системой, рассмотренное в § 8.10, с оптимальным управлением линейной системой (§ 8.8 и 8.9), то нетрудно обнаружить различие между ними, проявля¬ ющееся в наличии вырожденных оптимальных управлений для нелинейной системы. Возникает естественный вопрос: является ли существование оптималь¬ ного вырожденного управления свойством только нелинейной системы (8.364) или общим свойством класса нелинейных систем? Чтобы ответить на этот вопрос, рассмотрим нелинейную систему вто¬ рого порядка %1 (/) = X (Z); ] (8.470) 2 х2(0 = — f[x2(O] + u(0. |«(OI<1J и функционал т J = J[é + |и(/)|Ж (8.471) о где Т не задано. Будем считать, что функция f [х2 (/) ] обладает свойствами: /(0) = 0; (8.472) sign {/ [х2 (/)]} = sign (х2 (0). (8.473) £І*г(0] = >0- (8.474) Если |М0|<|М< то |/[хН0]|<|/[хН0]|. (8.475) Систему (8.470) можно использовать для описания движения матери¬ альной точки, считая, что (/) обозначает ошибку по положению, х2 (/) — скорость, a f [х2 (01 — силУ сопротивления, являющуюся нелинейной функцией от скорости х2 (t). Предположения (8.472)—(8.475) означают, по сути дела, что сила сопротивления направлена противоположно ско¬ рости и большим скоростям соответствуют большие силы сопротивления. Гамильтониан для системы (8.470) и стоимости (8.471) имеет вид H = k + I и (01 + х2 (0 Рі (0 - f [х2 (/)] р2 (0 + и (/) р2 (/), (8.476 ) и поэтому <8-477> Р, ('> “ - “ ~М0 + « К <01 Р, (')■ (8.478) Если Лх = Рх (0), л2 = р2 (0), то Pi (t) = Лх = const; (8.479) р2 (/) = — Лх +• g [х2 (/)] р2 (/). (8.480) Управление, минимизирующее гамильтониан Н, определяется урав¬ нениями (8.373)—(8.376). Вырожденные управления возникают в том слу¬ чае, если существует конечный интервал времени /21, на котором |р2(/)| = 1 при любом (8.481) т 1 По отношению к функционалу J [& 4- I и (0 |] dt, 0 < k 1. 2 Это те же самые уравнения, что и (7.465). 653
Предположим, что условие (8.481) выполняется. Тогда р2(0 =0 ПРИ любом /2], (8.482) и из уравнения (8.480) получим = g[x2(/)]sign {р2(/)} при любом Г2], (8.483) откуда следует, что х2(0 = const при любом t Q [/і, /2] (8.484) и х2(/) = 0 при любом /2]. (8.485) Из уравнений (8.485) и (8.470) получим и (/) = f [х2 (Z)] == const при любом t2], (8.486) Необходимое условие Н = 0 при любом t £ [/г, /2] и уравнения (8.481)—(8.486) дают H = Ç) = k^ sign (р2(0} (x2(Z)g[x2(01 — f[x2(O]} (8.487) ИЛИ х2 (0g k2 (0] — f [*2 (01 = — sign {p2(t)}-k. (8.488) Уравнение (8.488) можно «решить» и выразить х2 (0 = const, t £ С ІО» Oh через k. Пусть таким «решением» является х2 (0 = h I — sign {р2 (0} при любом t Q (0, 01- (8.489) Из уравнения (8.489) получим u(t) = f{h I — sign {p2 (0} &]} при любом t £ [Zi, /2]. (8.490) Очевидно, что управление (8.490) может быть оптимальным в течение временного интервала [/ь /2] при условии, что удовлетворяются также и ограничения амплитуды \и (/)| < 1, иначе говоря, если I/ {h [- sign {р2 (0І *]} I < 1, (8.491) то вырожденное управление (8.490) может оказаться оптимальным. Пример 8.5. Предположим, что в уравнении (8.470) Лх2(/)] = -1-хЗ(0. (8.492) g[x2(0] (8.493) Уравнение (8.491) принимает вид *2 (О = — sing{p2(O) k, (8.494) а его решением является _і_ Г 3 1 3 х2 (0 = 2"siSn W k\ * (8.495) Из уравнения (8.489) получим и (О = /[х2(/)] =Д-^(/). (8.496) Подставив (8.495) в (8.496), найдем u(t)= ^-sign (р2 (/)} k. (8.497, 651
Так как sign (р2 (/)} = ±1, то оптимальными могут быть вырожденные управления и (Г) = k (8.498) и +4" * (8.499) при условии, что 0<fe^2. (8,500) Эти рассуждения приводят к заключению, что в случае нелинейных систем вырожденные оптимальные управления могут возникать довольно часто, в отличие от линейных систем, где они вообще не встречаются. Упражнение 8.44. Используя методику § 8.10, найти оптимальный закон управле¬ ния к началу координат для системы іі(0=*2(0; x2(t) + “«), l“(0|s£l (8'501) с функционалом Т J — j [k 4- I и (t) |] dt, Т не задано. (8.502) о Рассмотрите оба случая: вырожденный (0 < k 2) и невырожденный (k 2). Упражнение 8.45. Рассмотрите систему Xi(t) =--x2(t), I (8.503) х2 (0 = — хг (t) — х2 (t) IX., (t) I + и (0, I и (t) I 1 J T и функционал J = J {k + | и (/) | ] dt, T не задано. Определите, для каких значений k о вырожденные управления могут быть оптимальными. Найдите оптимальное управление к началу координат для вырожденного случая. Упражнение 8.46. Рассмотрите линейную систему іі (t) = — xt (0 — w(0; 1 (8.504) х2 (0 -- — 2х2 (/) — 2и (/), I и (0 I 1 J т и функционал J — j [/г 4“ | и (/) 11 dt, Т не задано. о Найдите оптимальное управление к началу координат. Указание: оптимальное по быстродействию управление системой (8.504) рассматривалось в § 7.3. Вырожденных управлений в этой задаче не существует. Наиболее общими оптимальными управляющими последовательностями являются {0; 4~1; 0; —1} и (0; —1; 0; +1}. См. также работу [121 ]. Т Упражнение 8.47. Рассмотрите систему (8.504) и функционал F — J | u(t)\ dt, Т за- о дано. Найдите оптимальное управление к началу координат. Указание: воспользуй¬ тесь методикой § 8.6. Упражнение 8.48. Рассмотрите гармонический осциллятор: Хі (/) = х2 (/); 1 х2(0 = -Хі(04-“(0> |u(0|^1 / (8 505) т и функционал F j | и (/) | dt, T не задано. Считайте, что исходным является состояние о g — (Èi, £2) и конечным — начало координат (0, 0). Покажите, что наибольшая нижняя 652
T граница F* количества топлива F — J | и (t) | dt равна F* Указами е: о фундаментальная матрица системы (8.505) ортогональна и поэтому (8.506) Покажите, что, строго говоря, оптимального по расходу топлива управления для данной задачи не существует. Покажите также, что для любого 8 > 0 существует ô >> 0 и управление вида и (t) — — sign [х2}, если I х} I Ô: и (t) — 0 в остальных случаях, переводящее состояние в окрестность начала координат при расходовании F* + е единиц топлива. Указание: оптимальное по быстродействию управление гармоническим осциллятором рассматривалось в § 7.7. Упражнение 8.49. Рассмотрите гармонический осциллятор (8.505) с функционалом т F -= J |u (t)\dt, Т фиксировано. Пользуясь методами § 8.6, найдите оптимальное по рас- о ходу топлива управление, переводящее любое исходное состояние (£ъ £2) в (0, 0), где Упражнение 8.50. Рассмотрите гармонический осциллятор (8.505) с функционалом Г [/г + I и (/) I ] dt. Начало координат является желаемым конечным состоянием. и Найдите оптимальное управление и линии переключения для исходных состояний (£ъ £2), Упражнение 8.51. Рассмотрите систему (8.470) с функционалом (8.471). Пусть сила сопротивления удовлетворяет условиям (8.472)—(8.475) и задан график функции f [х2 (01 в зависимости от х2 (0, но мы не знаем аналитического выражения / |х2 (01- Опишите методику, которая позволит вам найти вырожденные управления, пользуясь только графи¬ ческими методами.
ГЛАВА 9 ПРОЕКТИРОВАНИЕ ОПТИМАЛЬНЫХ ЛИНЕЙНЫХ СИСТЕМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ 9.1. ВВЕДЕНИЕ Проектирование систем, оптимальных по быстродействию и минимуму расхода топлива, встречает значительные трудности, связанные с уста¬ новлением оптимального закона управления и с реализацией оптималь¬ ных систем с обратной связью. Даже если управляемая система линейна, почти невозможно получить общие аналитические результаты как в слу¬ чае оптимального быстродействия, так и в случае оптимизации по расходу топлива. Видимо, читатель уже начал сомневаться в том, что вообще существуют системы и критерии, для которых могут быть получены изящные и общие результаты. В этой главе мы получим аналитические результаты для определен¬ ного класса систем с определенным классом критериев, а также рассмотрим линейную систему с переменными параметрами, состояние которой х (/), управление и (/) и выход у (t) связаны системой уравнений Наиболее общей формой функционала будет J(«) = 4- (lz (Л - У (T)],F[Z (Г) - у (Г)]) + т + 4/ {<1^(0 — у (Ob Q(t)lz(t)-y(t)]) + о + (»(/), R(t)u (0)1 dt, где z (/) — желаемый выход. Предположим, что ограничения на величины компонент управляю¬ щего вектора и (/) отсутствуют. Сделаем также некоторые предположения относительно матриц F, Q (/) и R (/). При этом мы сможем получить аналитическое выражение для оптимального управления и обнаружить, что оптимальная система с обратной связью линейна. Рассмотрим теперь структуру настоящей главы с тем, чтобы читатель смог получить общее представление о ее содержании. В § 9.2 приведена постановка оптимальной задачи и обоснован выбор квадратичного функционала J (а), при этом особое внимание обращено 654
на его физический смысл. Физические соображения приведут нас к неко¬ торым математическим предположениям относительно матриц F, Q (/) и R (t). Таким образом, с самого начала читатель будет убежден, что имеет дело с задачей оптимизации, имеющей большой смысл с практиче¬ ской точки зрения. В § 9.3 мы приступим к математическому описанию так называемой задачи о регуляторе состояния (т. е. задачи об удержании состояния вблизи нуля). При этом будем действовать обычным способом, используя принцип минимума 1 для получения необходимых условий оптимального управления. Мы обнаружим, что канонические уравнения, связывающие состояние х (/) с дополнительной переменной р (/), линейны. Линейность канонических уравнений позволит сделать вывод, что х (/) и р (0 связаны уравнением вида р (t) = К (t) х (t), где К (0 — действи¬ тельная симметричная матрица. Соображения, связанные с нахождением матрицы К (/), приведут нас к закону управления 9.1. Затем покажем, что наши предположения позволят доказать глобальную достаточность локальных необходимых условий. Таким образом, мы сможем доказать существование и единственность оптимального управления. В § 9.4 обсудим некоторые следствия закона управления 9.1 и спо¬ соб вычисления матрицы К (/) при помощи цифровой вычислительной машины. В § 9.5 установим закон управления 9.2, согласно которому при условии инвариантности системы во времени, в случае постоянных матриц Q (/) и R (/) и Т = оо, оптимальная система с обратной связью должна быть линейна и инвариантна во времени. В § 9.6 проанализируем очень простой оптимальный регулятор первого порядка и приведем несколько переходных процессов, чтобы читатель смог получить представление о работе и свойствах оптимальных регуляторов. В § 9.7 приступим к задаче о так называемом регуляторе выхода. В этой задаче речь пойдет об удержании вблизи нуля выхода у (/), а не состояния X (t). Мы получим закон управления 9.3 и покажем, что задачу о регуляторе выхода можно решить точно также как и задачу о регуляторе состояния § 9.3; определим закон управления 9.4, аналогичный закону управления 9.2, как частный случай закона управления 9.3 для случая инвариантной во времени системы при Т = оо. В § 9.8 рассмотрим инвариантные во времени системы с одним входом и одним выходом и обсудим структуру оптимальной системы с обратной связью, анализируя полюса передаточной функции замкнутой системы. В § 9.9 решим задачу об удержании выхода у (/) близким к желаемому выходу z эта задача называется задачей слежения. Основные резуль¬ таты этого параграфа подытожены в законе управления 9.5. Мы обсудим эти результаты с практической точки зрения и обнаружим, что структура обратной связи оптимальной следящей системы идентична структуре оптимального регулятора выхода. Особенностью, отличающей следящую систему от регулятора выхода, является канал прямой связи, который дает сигнал, зависящий от желаемого выхода z (t). В § 9.10 рассмотрим приближенные результаты, справедливые для постоянных систем с постоянными желаемыми выходами и неограниченно возрастающим конечным временем Т. Аппроксимация показывает, что оптимальная система ведет себя почти как линейная, инвариантная во времени система с обратной связью. Недостаток точных результатов для предельного случая Т = оо вызван неразработанностью теории, гарантирующей существование оптимального решения при Т —> оо. По сути дела, мы используем результаты § 5.7 и 5.8, в частности, следствие 5.2. 655
В § 9.11 приведем некоторые достаточные условия, накладываемые на желаемый выход z (t], которые позволяют свести задачу слежения к задаче о регуляторе. В § 9.12 рассмотрим переходные процессы оптимальной следящей системы первого порядка, которая аналогична системе, приведенной в §9.6. Рисунки иллюстрируют переходные процессы, соответствующие ступен¬ чатым входным сигналам, задержанным ступенькам и синусоидальным сигналам. Глава завершается § 9.13, который содержит обзор дополнительных результатов, описанных в литературе. На протяжении всей главы (и осо¬ бенно в § 9.3, 9.5, 9.7 и 9.9) мы основывались на различных работах Калмана [107], [НО], [1121 и [113]. При этом были опущены многие детали доказательств, которые можно найти в этих работах Г На протяжении всей главы мы пытались проиллюстрировать теорию простыми примерами и обсудить, насколько возможно, практическое значение математических результатов. 9.2. ПОСТАНОВКА ЗАДАЧИ Задана линейная динамическая система с переменными параметрами: X (/) — состояние, и (t) — управляющий вход и у (/) — выход системы. Уравнениями системы являются Л(/)х(0 + В(0^(0; 1 (9 Л) Пусть (/), х2 (t), . . ., хп (t) — компоненты вектора состояния X (/); (/), и2 (/), . . ., иг (/) — компоненты управляющего вектора и (t) и уА (/), у2 (/), . . ., yni (É) — компоненты выходного вектора у (/). Таким образом, А (/) — матрица размера п Хп, В (/) — матрица размера пХг и С (/)— матрица размера тХп. Предположим, далее, что 0 < т С г С п (9.2) и и (0 не ограничено. (9.3) Определим теперь назначение системы с физической точки зрения. Пусть z (/) —вектор, имеющий т компонент (/), ?2 (/), . . (/) 1 2. Требуется управлять системой (9.1) так, чтобы выходной вектор у (/) был «близок» к вектору z (/). Условимся называть вектор z (/) желаемым выходом. Далее определим вектор ошибки е (/), приняв е(0 ^z(t)-y(t). (9.4) Попросту говоря, надо найти такое управление и (/), чтобы ошибка е (t) была «малой». Будем считать, что управление и (/) не ограничено по величине; следовательно, возможны случаи, когда и (/) очень велико. Для того чтобы избежать таких предельных ситуаций (требующих очень больших усиле¬ ний в контуре управления), можно включить требование, учитывающее тот факт, что «большие сигналы дорого стоят». Иначе говоря, мы хотели бы, с одной стороны, сохранять ошибку достаточно малой, а с другой — не использовать «чрезмерно больших» управлений. Перевод этих физических требований в форму того или иного мате¬ матического функционала зависит, конечно, от инженера. В этой главе 1 См. дополнительно [11], [163], [193], [183] и [182 ], а также литературу, на которую есть ссылки в § 6.17, 6.18, 6.20 и 6.21. 2 Некоторые или все могут быть равны нулю. Размерность выхода равна т. 656
рассмотрим частный класс функционалов, имеющих квадратичный ха¬ рактер, что вполне соответствует физическим требованиям. Такой выбор функционала может и не быть наилучшим в конкретной ситуации. Тогда инженер должен выработать свой собственный критерий и самостоятельно решить задачу. Чтобы помочь понять смысл функционалов, которые мы будем рассматривать, уточним сначала физический смысл математи¬ ческих понятий. Строго говоря, рассмотрим функционал т J(u) - -±-(e(T),Fe(T)) ++ ;«(/)> конечное время Т задано; F — постоянная положительно полуопределенная матрица размера m X m; . (g g) Q (t) — положительно полуопределенная матрица размера mXm; /? (/) — положительно определенная матрица размера r X г. Предположения (9.6) будут оставаться неизменными на протяжении всей главы. Понятия положительно определенной и полуопределенной матриц мы также будем использовать на протяжении всей главы. Напомним (см. § 2.15), что действительная симметричная матрица М положительно опре¬ деленна, если (а, Ma) >0 для любого а о и действительная сим¬ метричная матрица N положительно полуопределенна, если (&, Nb) 0 для любого b ф 0. Отметим, что нулевая матрица, очевидно, положи¬ тельно полуопределенна. Рассмотрим теперь каждый член функционала J (а) и установим, насколько правильно он отображает математически физические требова¬ ния к системе. Начнем это рассмотрение с члена Le = ~ {е (/), Q (f) е (/)), где Q (I) положительно полуопределенна. Очевидно, что этот член неотри¬ цателен при любых е (t) и равен нулю при е (/) — 0. Если ошибка мала при любом t £ [/0, Г], то и интеграл от Le будет мал. Так как Le = " mm (/), Q (t) е (0/ = ySE Яц (0 «i (f)e, (t), где (/) — эле- менты Q (/), a et (/) и e, (/) — компоненты e (/), то очевидно, что стои¬ мость Le оценивает большие ошибки намного «дороже», чем малые. Поэтому система «штрафуется» за большие ошибки намного больше, чем за малые Ч Перейдем далее к члену Lu =■■ (/), R (/) и (/)), где R (/) поло¬ жительно определенна. Этот член оценивает стоимость управления и «на¬ казывает» систему за большие управления гораздо сильнее, чем за малые. Так как R (/) положительно определенна, стоимость управления поло¬ жительна при любых и (/) 0. Этот член часто называют мощностью т управления, a i Lu dt часто называют энергией управления. Причина m 1 Если Le заменить на \Яі (0 (0|, то система будет «штрафоваться» одинаково 4 = 1 T m за большие и малые ошибки. Использовать функционал вида j qi (t) et (t) не следует, t0 4 = 1 так как компенсация больших положительных ошибок большими отрицательными может дать нулевую стоимость (значение функционала), несмотря на большие ошибки. 657
таких названий в следующем. Предположим, что и (/) — скаляр, про¬ порциональный напряжению или току; тогда величина и2 (/) пропорцио- т нальна мощности, а J и2 (Z) dt пропорционален энергии, израсходованной ^0 на интервале [/0, Т]. Требование положительной определенности, а не полуопределенности /? (/), как мы увидим, является условием существо¬ вания управления конечной величины. Заметим, что это условие исполь¬ зовалось также в § 6.18. Наконец, обратимся к члену -і- (е (T), Fe (Т)). Этот член часто назы¬ вают стоимостью конечного состояния. Его цель — гарантировать «малость» ошибки в конечный момент времени Т, Иначе говоря, этот член должен рассматриваться тогда, когда величина е (t) в конечный момент времени особенно важна. Если это не так, то можно принять F = 0 и, опираясь на остальную часть функционала, считать, что ошибка в конечный момент времени «не слишком велика». Может возникнуть вопрос: почему матрицы Q (/) и R (t) зависят от времени, а не приняты постоянными? Если развить теорию для завися¬ щих от времени матриц Q (/) и R (t), то функционал J (и) можно будет использовать для более реалистических задач. Например, предположим, что при t = /0 состояние х (/) задано, и, следовательно выход у (/0) = = С(/0)л:(/0) известен. Вектор z (/0) может оказаться таким, что началь¬ ная ошибка е (/о) будет очень большой. Система, конечно, «не виновата» в том, что е (/о) велика. Поэтому мы можем выбрать матрицу Q (/) таким образом, чтобы «наказывать» систему за большие начальные ошибки меньше, чем за большие ошибки в дальнейшем. Для этого можно выбрать Q (/) такой, чтобы при h<t^t2<T (9.7) для произвольного постоянного вектора b скалярные произведения (ô, Q (/J &) и (b, Q (/2) Ь) удовлетворяли неравенству (&, Q(Q &>«(&, Q(Qb). (9.8) Мы надеемся, что это обсуждение физических свойств функционала J (и) поможет читателю понять его смысл. Инженер-проектировщик дол¬ жен решить вопрос о практическом использовании функционала. Тем не менее оказывается, что этот функционал имеет два очень ценных свойства. Во-первых, он удобен математически, и, во-вторых, его минимизация при¬ водит к тому, что оптимальные системы оказываются линейными. В настоящей главе мы будем рассматривать следующую задачу. Даны линейная система (9.1) и функционал (9.5), удовлетворяющий предположениям (9.2), (9.4) и (9.6). Найти оптимальное управление, т. е. управление, под воздействием которого система (9.1) движется таким образом, чтобы минимизировался функционал (9.5). Прежде чем пытаться решить эту задачу, получим некоторые очевид¬ ные, но полезные результаты. Прежде всего, если Q (/) = F = 0, то опти- т мальное управление и (t) = 0. В этом случае стоимость равна f (и (/), *0 R (/) и (/)) dt, и поскольку время Т мы не задали, стоимость минимизи¬ руется в том и только в том случае, если и (/) = 0. Чтобы исключить этот тривиальный случай, примем на будущее, что Q (/) nF одновременно не являются нулевыми матрицами, хотя одна из них и может быть нулевой. 658
е ['о. t Пусть теперь Ф (/, /0) — фундаментальная матрица линейной си¬ стемы (9.1) и X (/о) — исходное состояние. Состояние х (t) при Т] равно x(t) = 0>(t, tQ) X (t0) + J Ф 1 (T, t0) в (t) и (t) dx , и, следовательно, ошибка e (/) определяется уравнением e (0 = z (t) - C («) Ф {t, t0) X (Q + J Ф-1 (t, tu) B (t) « (t) dx (9.9) (9.10) в силу уравнений (9.1) и (9.4). Лемма 9.1. Если начальное состояние х (/0) и желаемый выход z (/) связаны соотношением г(О = С(/)Ф(^)х(/о), tQ [tQ, T], (9.11) то оптимально управление и (/) = 0 и минимальная стоимость </* равна нулю. Доказательство: подставляя и (т) = 0 и уравнение (9.11) в выра¬ жение (9.10), получим е (/) = 0. Лемма 9.2. Если и (t) Ф то стоимость J положительна. Доказательство. Оно следует из предположения о положительной по¬ луопределенности матриц F и Q (/) и о положительной определенности матрицы R (/). Лемма 9.3. Если для любого и (t) функционал не определен, т. е. J (и) = оо, то оптимального решения не существует. Доказательство. Это очевидно, потому что если, например, два управ¬ ления дают бесконечную стоимость, то нельзя определить, которое из них лучше. В заключение советуем читателю еще раз просмотреть материал § 6.17—6.20. Основное отличие этих параграфов от настоящей главы состоит в том, что в гл. 6 мы задавали конечное состояние в виде точки или области цели. В этой же главе конечное состояние полностью неоп¬ ределенно. Покажем, что это изменение задачи об оптимальном упра¬ влении имеет большое практическое значение. 9.3. ЗАДАЧА О РЕГУЛЯТОРЕ СОСТОЯНИЯ 1 В этом параграфе рассматривается так называемая задача о регуляторе состояния. Решение задачи приводит к оптимальной системе с обратной связью, удерживающей компоненты вектора состояния х (/) вблизи нуля без слишком больших затрат энергии управления. Параграф построен следующим образом. Сначала используются не¬ обходимые условия, вытекающие из принципа минимума, с помощью которых отыскиваются экстремальные управления. Мы покажем, что: 1) //-минимальное управление оказывается линейной функцией до¬ полнительной переменной; 2) канонические уравнения сводятся к системе 2п однородных линей¬ ных дифференциальных уравнений; 3) из условия трансверсальности дополнительного вектора р (/) в конечный момент времени Т получается, что р (Т) является линейной функцией незаданного конечного состояния х (Т). Руководствуясь вычислительными соображениями, мы покажем, что экстремальное управление есть линейная функция от состояния. 1 Этот параграф почти целиком опирается на результаты работы [107]. 42 659
Изменяющаяся со временем матрица, которая связывает экстремаль¬ ное управление с состоянием, может быть найдена путем решения ма¬ тричного дифференциального уравнения (уравнения Рикатти в матричном виде). После этого мы покажем, что экстремальное управление является по крайней мере локально оптимальным и что оно единственно. Суще¬ ствование оптимального управления будет установлено на основе того, что решение уравнения Гамильтона—Якоби везде определено. Рассмотрим линейную систему с переменными параметрами х(0 = Л (0 а: (0 + В (t)tt(t) (9.12) и функционал Jl--=-^{x(T), Fx(T)) + T + + (u(t),R(t)tt(t))]dt. (9.13) 0 Если принять С (/) = I и z (/) = 0, то у (/) = х (/) = — е (/), и функционал J (и) (9.5) сводится к функционалу (9.13). Физический смысл этого состоит в том, что мы хотим удержать состояние вблизи нуля без слишком большой затраты энергии на управление. Будем счи¬ тать, что предположения (9.6) удовлетворяются. Покажем, что оптимальное управление есть линейная функция со¬ стояния, т. е. имеет вид a(0-G(0x(0; te Ѵ0,Т], (9.14) где G (/) — матрица—функция размера г X п. Предположим, что для любого начального состояния оптимальное управление существует. Для получения необходимых условий оптималь¬ ного управления и отыскания экстремальных управлений можно восполь¬ зоваться принципом минимума. Гамильтониан Н для системы (9.12) и стоимости JY (9.13) равен н = 4 'х (О- Q (О X (t)) + -L {и (I), R (Z) и (/)> + + + (9.15) Дополнительный вектор р (/) является решением векторного диффе¬ ренциального уравнения которое сводится к уравнению Р(0 - —Q(t)x(t) — A'(t)p (/). (9.17) Вдоль оптимальной траектории должно быть 1 откуда следует -^^/?(()«(()+ В'(0М0 = 0. (9.19) Из последнего уравнения получим = —R~l (t) В' (t)р (t) (9.20) 1 См. § 5.7 и 5.18. 650
Предположение относительно положительной определенности /? (/) при любомПо, Т] гарантирует 1 существование (/) при t~ [/0, Г]. Оптимальное управление должно минимизировать гамильтониан. Необходимое условие = 0 Дает только экстремум И по и (/). Чтобы экстремум Н был минимумом по отношению к и (/), матрица д2Н du2(t) размера г X г должна быть положительно определенна. Но из уравнения (9.19) мы имеем д2Н ди- (О /?(0- (9.21) Следовательно, поскольку R (/) предполагается положительно определен¬ ной, управление и (/), соответствующее уравнению (9.20), действительно минимизирует гамильтониан и поэтому является //-минимальным. Следующий шаг состоит в том, чтобы найти упрощенные канонические уравнения. Для этого подставим уравнение (9.20) в (9.12) и получим X (0 - А (/) X (/) - В (0 R1 2 (0 В (t)р (/). (9.22) Уравнения (9.22) и (9.17) являются упрощенными каноническими урав¬ нениями. Определим матрицу 5 (/), приняв 5(/)-В (Z)/?’1 (0В'(О, (9.23) где 5 (/) — симметричная матрица размера п X п (почему?). С помощью матрицы 5 (/) уравнения (9.22) и (9.17) можно записать в виде ~х(/_) 1 = Г A_(t) \_~SJQ' І-адТ-лчо- х(0 (9.24) Последнее уравнение представляет собой систему 2/г линейных одно¬ родных дифференциальных уравнений с зависящими от времени коэффи¬ циентами. Можно найти единственное решение этой системы (см. § 3.20) при условии, что мы знаем 2п начальных условий; п начальных условий определяются исходным состоянием системы х (/0) при /0. Остальные п граничных условий определяются условиями трансверсальности 2, в силу которых (поскольку X (Т) не задано) в конечный момент времени Т до¬ полнительная переменная р (Т) должна удовлетворять соотношению рСП - дГт (9.25) Таким образом, р(Т) Fx(T). (9.26) Пусть й (/, /0) — фундаментальная матрица системы (9.24) размера 2/г X 2/г. Если обозначить через р (/0) (неизвестное) начальное значение дополнительной переменной, то решение уравнения (9.24) будет иметь вид х(0 P(Ô (9.27) Следовательно, при t = Т должно быть 1 det М > 0 является необходимым условием положительной определенности М, а поэтому М невырождена (см. теорему 2.4). 2 См. табл. 5.2. 661
Разделим далее 2м X 2м матрицу Й (7, /) на четыре м X м матрицы следующим образом: ( ’ ' [й21(7, /)!Й22(7, /)]’ ( } Уравнение (9.28) теперь можно записать в виде х(Т)^йп(Т, /ию + й12(7, (9.30) р(7) = й21(7, /)х(/) + Й22(Т, t)p(t) = Fx(T). . (9.31) Из уравнений (9.30) и (9.31) после алгебраических преобразований получим р(0 = [й22(Л 0-/ад ОГЧ^іИЛ 0-Й21(Л 0U(0 (9.32) при условии, что обратная матрица существует. Уравнение (9.32) говорит о том, что дополнительная переменная р (/) и состояние х (/) связаны соотношен ием вида p(t) = K(t).x(t) (9.33) при любом [/0, Т1]- Матрица К (/) есть матрица размера м X м с переменными коэффи¬ циентами, которая зависит от конечного времени Т и от матрицы F, но не зависит от исходного состояния. Действительно, К(С = [й22(Т, /)-^й12(Т, 0]’Ч/?й11(7, с-й21(^ 0]. (9.34) Здесь могут оказаться полезными несколько замечаний. Мы не пока¬ зали, что матрица [й22 (7, /) —7Й12 (7, /)] имеет обратную. Рассмот¬ рим ситуацию при t = Т. Известно, что Й(7, 7)-/; (9.35) и поэтому справедливы соотношения Йп(7, 7)-Й22(7, 7) — /; (9.36) й12(7, 7)-й21(7, Л = 0. (9.37) Таким образом, матрица [й22 (7, 7)—7й12 (7, 7) ] = I невыро¬ ждена. Далее, К(7) = [Й22(7, 7)-ГЙ12(7, 7)Г1[7Й11(7, 7)-Й21(7, 7)], (9.38) и поэтому из соотношений (9.36) и (9.37) Æ(7)-F. (9.39) Следовательно, уравнение (9.33) справедливо при t = Т. Можно показать х, что обратная матрица существует при любом /, /0 < < Т и поэтому выражение (9.33) справедливо. Обсудим теперь вычисление матрицы К (t). Если матрицы A (t), S (/) и Q (/) зависят от времени, то в общем случае невозможно получить аналитическое выражение для фундаментальной матрицы й (7, /) раз¬ мера 2п X 2п. Тогда К (0 необходимо определить с помощью цифровой вычислительной машины. Если, однако, матрицы А (/), 5 (/) и Q (t) инвариантны во времени, то матрицу Й (7, /) можно найти аналитически, с помощью, например, преобразования Лапласа. Но даже и в этом слу¬ чае вычисление обратной матрицы в уравнении (9.32) является очень трудоемкой задачей, особенно для систем высокого порядка. 1 См. работу [107]. 662
До сих пор создавалось впечатление, что вычислительные трудности почти непреодолимы. Возникает естественный вопрос: мы показали, что р (Z) = К (О х (/); можно ли установить дополнительные свойства матрицы К (/)» которые дадут нам иные пути ее вычисления, желательно не связанные с вычислением обратной матрицы размера п X п? Ответ на этот вопрос — положительный, и в оставшейся части параграфа мы попытаемся это показать. Возьмем соотношение р (/) = К (t) х (t), t- [/0, Г], продифферен¬ цируем его по времени, подставим полученные соотношения в канониче¬ ские уравнения и установим, что матрица К (/) должна удовлетворять некоторому матричному дифференциальному уравнению. Предположим, что решения канонических уравнений (9.24) х (/) и р (/) связаны уравнением p(t)==K(t)x(t\ tQ[t^ Т]. (9.40) Дифференцируя его по времени, получим p(t) = j((t)x(t) + K(t)x(t). (9.41) Но из уравнения (9.24) следует X (/) - А (/) X (0 — 5 (0 р (0; (9.42) Р (0 = - Q (0 X (0 - Д' (t)p (/). (9.43) Подставляя соотношение (9.40) в уравнение (9.42), получим выражение x(t) = [А (0-S(0K(01*(/). (9.44) Из уравнений (9.44) и (9.41) получим P (Z) = [К (0 + к (0 А (0 - К (0 5 (t}K(01X (/). (9.45) Подставив уравнение (9.40) в (9.43), найдем Р (0 - Ï-Q (0 - А ' X (0. (9.46) Из уравнений (9.45) и (9.46) определим [К (0 + К (0 А (0 - К (0 5 (0 К (0 + А ' (0 К (0 + Q (01 X (0 - 0 (9.47) при любом t из [/0, Т]. Так как уравнение (9.47) должно выполняться при любом исходном состоянии, матрица К (0 от исходного состояния не за¬ висит, а X (/) есть решение однородного уравнения (9.44), то урав¬ нение (9.47) должно быть справедливо при любом значении х (/). Это означает, что матрица К (0 должна удовлетворять матричному диффе¬ ренциальному уравнению К(0 + К(0 А (0 + А ' (0 К (0 - К (0 5 (/) К(0 + Q (О = о, (9.48) но 5 (/) = В (/) R"1 (/) В' (/), и поэтому уравнение (9.48) можно записать в виде Æ(0 -/<(/) А (0 - Д' (0 Æ(0 + К(t) В (0 /Г1^)В' (t)K^ - (?(/). (9.49) Таким образом, доказана следующая лемма. Лемма 9.4. Если х (/) и р (t) — решения канонических уравне¬ ний (9.24) и р (t) = К (/) X (/) при любых [Zo, Т1 и х (/), то ма¬ трица К (t) должна удовлетворять уравнению (9.49). Обратимся теперь к граничным условиям при t = Т. Условия транс¬ версальности [см. уравнение (9.26)1 требуют, чтобы p(T)^Fx(T\ (9.50) 663
но при / = Т имеем также р(Т) = К(7’)ж(Т). (9.51) и поэтому (9.52) при любом1 X (Г) и, следовательно, K(T)-F, (9 53) т. e. мы получили соотношение (9.39). Уравнение (9.49) представляет собой матричное дифференциальное уравнение типа Риккати. Для краткости будем называть его уравнением Риккати. Уравнение (9.53) дает граничные условия уравнения Риккати, и поэтому согласно теореме существования и единственности 2 решение уравнения Риккати К (/) существует и единственно. На первый взгляд может показаться, что так как К (/) есть матрица размера п X п, то уравнение (9.49) представляет собой систему п2 диффе¬ ренциальных уравнений первого порядка. Покажем теперь, что К (/) есть симметричная матрица. Лемма 9.5. Если К (/) — решение уравнения Риккати (9.49) и К (/) = = F, то К (0 симметрична при любом [Zo, Т], т. е. Æ(/)-Æ'(0- (9-54) Доказательство. Протранспонирусм обе части уравнения (9.49) и най¬ дем, что [4-к ' - ~к' А (/) -А ' к' + + К' (О В (0 Я1 (/) В' (О К' (/) -Q(0, (9.55) поскольку Q (/) и й (/) /?-1 (/) В' (/) симметричны. Но для любой ма¬ трицы справедливо уравнение [■Иг m (9.56) Опираясь на уравнение (9.56), сравним (9.55) с (9.49) и обнаружим, что К (/) и К' (0 являются решениями одного и того же дифференциаль¬ ного уравнения. При t = Т имеем граничное условие К СП = F. Так как матрица F симметрична, то F = F', но КС (t) == F' = F, и поэтому КСП = К СП = F (9.57) Итак, К (/) и К' (/) — решения одного и того же дифференциального уравнения при одинаковых граничных условиях. Из единственности решений дифференциальных уравнений следует, что К (t) = К' (/). Так как матрица К (0 симметрична, уравнение Риккати (9.49) представляет собой систему обыкновенных нелинейных диф¬ ференциальных уравнений первого порядка с переменными (зависящими от времени) параметрами. Управление (9.20) экстремально. Покажем, что оно является един¬ ственным оптимальным управлением. Мы установим это в следующем законе управления. 1 Напомним, что х (Т) не задано. 2 См. теорему 3.14. См. также работу [107], где приводится доказательство того, что /С (/) определена при любом t <С Т. 664
Закон управления 9.1 (решение задачи о регуляторе состояния). Даны линейная система х (/) - А (О х (0 + В (/) и (t) (9.58) и функционал Л -=-±-{х(Т),Гх(Т)) +4-j[(x(0,Q(0x(0) + to + (п(/),/?(0я(0)И; (9.59) и (/) не ограничено, Т — задано, F и Q (t) — положительно полуопре- деленные и /? (/) — положительно определенная матрицы. Оптимальное управление существует, единственно и определяется уравнением и (0 - — Я1 (О В (/) К (/) X (/), (9.60) где симметричная матрица К (/) размера п X п является единственным решением уравнения Риккати К (0 - - К (0 А (/) - А ' (0Æ (0 -Г + К(0В (0 R1 (0 В (t)K(t) - Q (0, (9.61) удовлетворяющим граничному условию К(Т) -=F. (9.62) Состояние оптимальной системы есть тогда решение линейного диффе¬ ренциального уравнения X (0 - [4 (/) - В (0 R1 (0 В (0 К (0] X (0, (9.63) -ѵ(0)-1 Покажем сначала, что экстремальное управление и (t), определяемое уравнением (9.60), является по крайней мере локальным минимумом стоимости JНапомним1, что если матрица д2Н ! &Н дх2 (t) • dx(t)du(t) (У.04) д2Н I д2Н ди (t) дх (/) j ди2 (t) дН п положительно определенна, то управление, при котором -j- = 0, должно быть оптимально, хотя бы локально. Из уравнения (9.15) находим д2Н дх2 (О дН ди (t) д2Н ди2 (t ) д2Н дх (0 ди (/) - Q(0; = Æ (0 «(0 т В' (0р(0; (9.65) = /?(/); д2н о ди (0 дх (О 1 См. § 5.8. 665
Подставляя соотношения (9.65) в (9.64), получим матрицу Так как R (t) положительно определенна, если Q (/) также положи¬ тельно определенна, то матрица (9.66) положительно определенна. Если Q (/) только положительно полуопределенна, то и матрица (9.66) также положительно полуопределенна. Так как высшие производные Н равны нулю, то для данной задачи предположение о положительной полуопре¬ деленности1) R (/) является достаточно сильным, чтобы гарантировать, что управление и (t) = — /?-1 (/) В' (/) К (0 х (/) минимизирует стоимость по крайней мере локально. Итак, мы доказали следующую лемму. Лемма 9.6. Управление u(t) = —R"1 (t) В' (t) К (f)x(t} соответствует минимуму (по крайней мере локальному) стоимости J Следующий шаг состоит в доказательстве единственности экстре¬ мального управления a (Z)--/?'1 (О В' (t)K(t)x(t). Доказательство опирается на то, что решение уравнения Риккати К (О, удовлетворяющее граничному условию К (T) = F, единственно. Мы докажем следующую лемму. Лемма 9.7. Если оптимальное управление существует, то оно един¬ ственно и определяется уравнением (9.60). Доказательство. Установлено, что экстремальное управление и (0 = -R1 (0 В' (0 К (0 X (/) (9.67) соответствует минимуму (по крайней мере локальному) стоимости J Так как матрица К (/) единственна, то оптимальное (локально) управле¬ ние является однозначной функцией состояния. Допустим, что суще¬ ствуют два оптимальных управления (/) и и2 (0 и две оптимальные траектории х± (/) и лг2 (/); причем хг (/0) =х2 (^о)« Тогда [см. уравнение [9.63)1 хг (/) и аг2 (/) должны быть двумя различными решениями диффе¬ ренциального уравнения х (t) = [А (0 - В (0 R1 (/) В' (/) К (01* (/), (9.68) исходящими из одной точки хх (t0) = х2 (/0). Но так как матрица /С (/) единственна, то и матрица Л (/) — В (/) 7?-1 (/) В' (/) К (/) также един¬ ственна. Поскольку уравнение (9.68) линейно и однородно, его решение, начинающееся из любой исходной точки, единственно. Следовательно, Хі (0 = х2 (/) и »! (/) = и2 (/) при любом 1/0, Т]. Тем самым лемма доказана. Докажем далее теорему, которую можно использовать при доказа¬ тельстве существования оптимального управления и для вычисления минимальной стоимости J* [аг (/), t] как функции состояния х (/) и вре¬ мени t. Теорема 9.1. Даны линейная система (9.58) и функционал (9.59). Обозначим через J* минимальную величину Ji. Она равна = K(t)x(t)), (9.69) где К (/) — симметричная матрица размера п X /г, являющаяся решением уравнения Риккати (9.61) и удовлетворяющая граничному условию 1 См. следствие 5.2. 666
K (T) = F. Если оптимальное управление и (/) 0 для всех состояний, то К (0 есть положительно определенная матрица при любом /, t0 < t <j T и K (T) = F положительно полуопределенна. Так как минимальная * 1 стоимость Ji = -?-(х (t), K{t)x(t)) определенна при всех х (/) и /, оптимальное управление существует и минимальная стоимость действи¬ тельно равна J*. Доказательство. Мы покажем, что является решением диффе¬ ренциального уравнения в частных производных Гамильтона—Якоби и что оно удовлетворяет граничным условиям. Существование оптимального управления будет при этом следовать из теоремы 5.12. Прежде всего заметим, что при t = Т уравнение (9.69) запишется в виде /Г [х(Л, Т] = -±-(х(Т), Fx(T)), (9.70) т. е. представляет собой стоимость конечного состояния. Уравнение Гамильтона—Якоби1 для системы (9.58) и функционала Jг имеет вид /] + тіпЦ-<х(0. Q(0x(0) + al u (O l 2 1 / <V,* [x(Z), Z] \ + 4-(«(о. 2+ / , ôJ* Z] \) + <в /) = о- <9-п> Стоящее в скобках выражение минимизируется управлением 5Л* [х (Z), Z] « (t) = -R1 (0 В' (t) - 1 ' J-, (9.72) Подставляя соотношение (9.72) в уравнение (9.71), находим dJ* 1 1 / , ± dJ? ал* \ / dJ* \ / dJ* dJ* \ + <Е<7Г/-<ВХг/ = °' <9'73’ Но если J* = K (/) x(t)), то dJ? i = K(t)x(t)} (9.74) и dJy -l- = K(t-)x(t). (9.75) Подставляя соотношения (9.74) и (9.75) в выражение (9.73), получим уравнение 4-(x(0, \-^-{x(t), Q(0x(0) + M(/)x(0, K(t)x(t))- - ~ (B (t) R-1 (t) B' (t)K(t)x(t), K(t)x(t)) =0. (9.76) 1 Cm. § 5.20. 667
Но так как матрица К (0 симметрична, можно написать (А (t)x(t), K(t)x(t)) = = (A(t)x(t), Æ(OxO+ (A(t)x(l), K(t)x(t)) = - -1- (X (/), А' (/) К (О X (/)) + 4 <•* * (0A (z>x <9-77> Подставив это соотношение в (9.67) и собрав все члены в одно скаляр¬ ное произведение, получим 4^(0- [К(0-!-К(0Л(/)4 л'(.')О)- - К (t)в (0 /г-1 (0 В' (/) К (0 + Q (/)] X (/)) = 0. (9.78) Если К (0 удовлетворяет уравнению Риккати (9.61), то матрица в скобках будет, очевидно, нулевой матрицей, и поэтому уравнение (9.78) удовлетворяется. Справедливо и обратное утверждение. Доказывая положительную определенность матрицы К (/), посту¬ пим следующим образом. Допустим, что при t = tr <Z Т матрица К (/) не является положительно определенной. Тогда существует х (/') такое, что (х (/'), К x (/')) < 0- При этом, очевидно, нарушается лемма 9.2, и поэтому К (/) должна быть положительно определенна при любом /, /0 С t < Т. * 1 Минимальная стоимость J\ _ — (х(/), К (/) х (0) есть скалярная функция от точек (п + 1)-мерного пространства, образованного /г-мерным пространством состояний и временем t. Поверхность, определяемая стои¬ мостью J*, является гладкой и везде имеет градиент (почему?). * 1 Заметим также, что функция [х (/), t] = -^{х (/), К (/) х (/)) является решением уравнения Гамильтона—Якоби при любых x (t) Ç Rn и /Q/о» 74- Можно обратиться к результатам § 5.20, чтобы доказать существование оптимального управления. Мы полностью доказали закон управления 9.1 и показали, что опти¬ мум существует и что единственное экстремальное управление (9.60) соответствует минимуму функционала Jх (и). Оптимальное управление и (t) определяется уравнением (9.60). В следующем параграфе рассмотрим различные аспекты закона управления 9.1. 9.4. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ И ПРИМЕРЫ В § 9.3 мы установили закон оптимального управления для задачи о регуляторе состояния. В этом параграфе обсудим с физической точки зрения следствия, вытекающие из закона управления 9.1. Структура оптимальной системы с обратной связью. На рис. 9.1 показана структура оптимальной системы с обратной связью. Так как оптимальное управление равно и (/) = —Z?1 (t)Br (/) К (/) х (/), то над состоянием х (/) производится линейное преобразование К (/), а за¬ тем с помощью преобразования — /?-1 (/) В' (t) получается само управле¬ ние. Система с обратной связью является, таким образом, линейной систе¬ мой с зависящими от времени параметрами. Так как /? (/) и В (/) — из¬ вестные матрицы, то поведение системы определяется матрицей К (/). Матрицу К (/) часто называют «матрицей усиления». 668
Переходный процесс х (/) оптимальной системы является решением дифференциального уравнения x(t) = G(t)x(t). (9.79) где матрица G (/) [см. уравнение (9.63)] размера п X п определяется как G (t) А (0 — В (О Я1 (t)B'(t) К (0. (9 80) На рис. 9.2 показана модель оптимальной системы х (t) = G (t) х (t). Рис. 9.1. структура оптимальной системы регулирования состояния. «Утолщенные» каналы обозначают, что по ним передаются векторные сигналы Вычисление матрицы усилений К (t). Положительно определенная матрица К (/), По, T1 есть решение матричного уравнения Риккати: К (0 - —К (0 А (/) - А’ (/) К (0 + 4 К (0 В (/) Æ1 (0 В (0 к (0 - Q (0 (9 81) И Рис. 9.2. Модель оптимального регулирования состояния (9.79) с граничным условием K(T) = F. (9.82) Матричное уравнение Риккати нелинейно, и поэтому найти его решение в замкнутой форме, как правило, невозможно. Следовательно, вычи¬ слять К (/) надо при помощи цифровой вычислительной машины. Такие вычисле¬ ния могут быть основаны, например, на аппроксимации К (/)• Напомним, что 4- К(0 = lim , (9.83) и поэтому уравнение (9.81) можно ре¬ шить приближенно, используя формулу К (t + А) К (0 + А ! -К (0 А (/) - —Л' (/) К (0 В (/) R1 (/) В' (/) К (t)~ — <?(0Ь (9.84) Уравнение Риккати решают в «обратном времени», используя малые А <4 0 и полагая К (T) F. Такие вычисления с помощью современ¬ ной цифровой вычислительной машины можно проделать очень быстро. Естественно, что чем меньше величина А, тем лучше аппроксимация. Важно понять, что матрица усилений К (/) не зависит от состояния, и поэтому, указав J1Э матрицу К (/) можно вычислить до начала работы системы. Проиллюстрируем эти теоретические положения простым при¬ мером. Пример 9.1. Рассмотрим систему второго порядка (объект с двойным интегрированием) xt (/) = х2 (/); j x2(t)=u(t) J (9.85) 669
с функционалом Л = 4- [4 (3) + 2%1 (3)] + 3 +4“ f [ 2хі(/)+4х2 (п + 2X1 {t} %2 (°+4" “2 (z)]dt- о Для системы (9.85) имеем ГО П Г°1 л“Чо о]: Для функционала (9.86) имеем ГІ 01 Г2 И 1 F-L J; Q(t)= , I; — \ /о=0; 7 = 3. [0 2J LI 4J Пусть К (0 — матрица размера 2X2: K(t} =РП (<) *12 1*12 ( П *22 ) J (9.86) (9.87) (9.88) (9.89) Тогда оптимальное управление (скаляр) определяется уравнением u(t) = — Я-1 (t)B' (t)Kd)X(t) = = -2 [0 1 ] Рп р *12 (Ч P’ J4 = -2 [*12 (О ъ (0 + *22 W Х.2 (01. (9.90) 1*12 (Ô *22 (OJ ІЛ (0J Уравнение Риккати имеет вид ’fe„(/) fe12(/)l Rn (/) /г12(()1Г0 П_ГО 01 р„ (О fel2(Ol /212 (Z) *22 (0_ 1*12 ^22 (П] LO 0J [1 0] [* 12 () *22 ^)J Ru (о *!2(тгоі 2!0 „р.ло *12(01 р о L*12(o *22(oJLd Lw) *22 (oJ Li d Граничным условием при t — 3 является Г*и(3) fei2(3)l = ri 01 L*u(3) ^22 (3)1 Lo 2_| ' После перемножения матриц, входящих в уравнение (9.91), получим три дифферен¬ циальных уравнения и соответствующие им граничные условия: feu(0 = 2^2 (О — 2, *п(3) = 1; fe12(Z) =—fcn(0 + 2/г12(О 622(О —О fc12(3) = 0; (9.93) k2, (t) = -2ki2 (t) + 2fe^ (O-4. *22 (3) = 2. Если решить уравнения (9.93) для /г12 (/) и k22 (t), то мы сможем получить оптималь¬ ное управление и (/) при помощи уравнения (9.90). Рассмотрим теперь, необходима ли управляемость?1 • В § 9.3 мы не требовали управляемости системы. Так как уравнением состояния системы является X (0 - А (/) X (0 + В (0 и (0, (9.94) использование функционала J т означает, что мы хотим удержать состоя¬ ние системы X (t) вблизи нуля. Управляемость означает, что можем найти управление, способное перевести состояние в нуль (а следовательно, и управление, удерживающее х (t) вблизи нуля). Является ли управляе¬ мость системы (9.49) необходимым условием того, что оптимальное решение выражается законом управления 9.1? Это условие не является необходи¬ 1 См. § 4.15 и 4.16. 670
мым, потому что вклад неуправляемых компонент в функционал всегда конечен, если конечен интервал управления [/0, Т]. В следующем пара¬ графе мы потребуем управляемости системы, чтобы обеспечить конечность стоимости при Т —> сю, а пока покажем, что можно найти оптимальное управление для двух неуправляемых систем. Пример 9.2. Рассмотрим «наиболее неуправляемую» систему х (0 = А (Z) х (0 + В (0 и (0, (9.95) где В (/) = 0 при любом t (9.96) с функционалом J. Очевидно, что величина (х (/), Q (t) х (t)) не зависит от ti(f). Следует ожидать, что оптимальное управление а (/) должно быть равно нулю, так как {и (t), R (t) и (t)} не будет ничего добавлять к стоимости. Эго действительно так, потому что оптимальное управление равно и (t) = —R'1 (/) В' (/) К (t) х (/)• Так как В' (/) = О, то и и (t) = 0. Пример 9.3. Рассмотрим неуправляемую систему второго порядка xi (0 ~—ax2(t) +u(ty, (9.97) х2 (/) = Ьх2 (/) и функционал т Jl = 4- J [4 (О + hx\ (t) + и2 (Z)] dt. (9.98) о Мы предоставляем читателю проверить, что оптимально управление и (0 = — kn (0 хг (Z) — k12 (t) х2 (/) (9.99) и что уравнение Риккати дает три дифференциальных уравнения вида *ц(0 =*и(0~ 1, *п(Т)==0; fe12(0 =-а*ц(0-**12(0 +*ц(0 *і2(0. *12(0=0; (9.100) fe22 (t) = —2afe12 (/) — 26й22 (0 — *12 (0 — *. *22 (О = 0. Рассмотрим теперь систему (9.97). Так как управление и (t) не влияет на перемен¬ ную х2 (0> то оно не оказывает влияния в функционале на член hx^ (t). Следует поэтому ожидать, что оптимальное управление не будет зависеть от h. Это действительно так, потому что управление [см. уравнение (9.99)] зависит только от (t) и /г12 (Z); уравнения отно¬ сительно kn (/) и &12 (/) (9.100) не зависят от /г22(/), a h фигурирует только в уравнении от¬ носительно k22 (t). Однако, хотя координатой х2 (t) и нельзя управлять, управление должно зависеть от х2 (0. Дело в том, что при a =j= 0 величина х2 (t) влияет на xY (t). Иначе говоря, если а =1= 0, то и /г12 (/) =!= 0. Если же а = 0, то управление не должно зависеть от х2 (/) и поэтому kl2 (t) обращается в нуль. Это так, потому что при а — 0 kn(t) — (t) — 1 не зависит от /?12(0 (9.101) и kl2(t) = kl2(t) [kn (t) — b], (9.102) что после интегрирования дает t £12 (0 = £12 (°) ехР J [£ц (т) — b] dx. (9.103) о т Но так как &12 (Г) = 0 и exp J [&п (т) — b} dx =/= 0, то, следовательно, &12 (0) = 0 о и поэтому £12 (0 = 0 ПРИ любом t g [Zo, Г]. (9.104) Из этих двух примеров видно, что оптимальное управление для не¬ управляемых систем существует и имеет физический смысл. 671
Упражнение 9.1. Рассмотрите систему (9.97) с функционалом 71 4" [Х1+ gxi *2 (7) 4’ тх2 (7)] + Т Ч—г- J £*1 х? ^*2 Н—2~ U J 105) о Покажите, что оптимальное управление будет функцией только от (t) в том случае, когда а = g = ri -= 0. (9.106) Согласуйте математический результат с вашей физической интуицией. Подчеркнем, что оптимальная система с обратной связью линейна, но имеет переменные параметры, если интервал управления [/0, Т] ко¬ нечен. Это справедливо и в том случае, когда система и функционал инвариантны во времени, т. е. если А (/), В (t), Q (/) и R (/) — постоян¬ ные матрицы. Свойство линейности очень полезно, но практическая реали¬ зация функций, зависящих от времени, должна осуществляться с помощью цифровой вычислительной машины. Инженера не удивит необходимость изменять во времени параметры управляющего устройства в системе с переменными параметрами. Однако для системы с постоянными параметрами он предпочел бы иметь управля¬ ющее устройство, инвариантное во времени. В гл. 7 и 8 мы видели, что такие устройства можно построить, если время перехода Т наперед не задано. К сожалению, мы не можем не задавать Т для функционала J j (а), так как нам не задано конечно состояние (почему?). В следующем параграфе покажем, что если принять Т оо, то можно получить инва¬ риантное во времени управляющее устройство для инвариантных во вре¬ мени системы и функционала. 9.5. ЗАДАЧА О РЕГУЛЯТОРЕ СОСТОЯНИЯ ДЛЯ ИНВАРИАНТНОЙ ВО ВРЕМЕНИ СИСТЕМЫ ПРИ Т = оо Предположим, что А (/), В (/), R (/) и Q (t) — постоянные матрицы, и поэтому как линейная система, так и функционал инвариантны во времени. Примем, что F (/) = 0. Очевидно, что матрица К (/) опять-таки будет решением уравнения Риккати, которое теперь удовлетворяет гра¬ ничному условию К (Т) = 0. Возникает вопрос: при каких обстоятельствах матрица К (/) будет постоянной? Ясно, что если матрица усилений К (/) постоянна, то опти¬ мальная система будет линейной и инвариантной во времени. С практи¬ ческой точки зрения такую оптимальную систему построить очень просто. Следующий закон управления устанавливает условия, при которых матрица К (0 постоянна. Закон управления 9.2. Даны управляемая линейная инвариантная во времени система х(/) = Лх(0 ; Bu(t) (9.107) и функционал оо = Qx(t)) .1- (»(/), Ru(t))]dt, (9.108) о где и (/) не ограничено, a Q и R — положительно определенные матрицы. Оптимальное управление существует, единственно и определяется уравнением u(t) = — R'B'Kxtf), (9.109) 672
где К — постоянная положительно определенная матрица размера п X п, являющаяся решением нелинейного матричного алгебраического уравнения —КА — АК KBR'BK — Q = 0. (9.110) При этом оптимальная траектория является решением линейной инва¬ риантной во времени однородной системы x(t) = Gx(t), x(Q) задано, (9.111) где О определяется как G - А — BR^B'K. (9.112) Минимальная стоимость 7* равна Л*[х(/)] = ^-(х(0, (9.113) Обсудим некоторые отличия закона управления 9.2 от закона 9.1. Прежде всего мы требуем, чтобы система (9.107) была полностью управляемой. Это означает, что матрица [В\АВ\ . . .\Ап~'В\ (9.114) должна содержать п линейно независимых векторов-столбцов Ч Требо¬ вание управляемости гарантирует конечность минимальной стоимости. Если бы система была неуправляема и неустойчива, то функционал был бы бесконечен при любых управлениях из-за бесконечности интервала управления. В этом случае отличить оптимальное управление от всех остальных невозможно. Другим отличием закона управления 9.2 является F = 0. Таким образом, мы не рассматриваем никакой конечной стоимости типа lim Fx(T)). Конечная стоимость при Т = оо не имеет практи- Г->ео 1 2 ческого смысла, поскольку на практике представляет интерес переход системы из одного состояния в другое в течение конечного времени. Мы полагаем Т -> оо по следующим причинам. Во-первых, нам желательно гарантировать, что состояние после начального переходного интервала остается в дальнейшем близким к нулю. Во-вторых, мы хотим избежать (довольно произвольного) задания большого конечного времени Т. В-третьих, мы не смогли бы гарантировать, что при t > Т состояние оста¬ нется близким к нулю. Рассмотрим теперь матрицу /С. Калман показал 2, что из предполо¬ жений об управляемости и из F = 0 следует существование lim К (0» оо его единственность, а также равенство 1ітК(0 = К, (9.115) Г-»оо где К—положительно определенная матрица, являющаяся решением алгебраического уравнения (9.110). Полезна следующая интерпретация матрицы К- Рассмотрим урав¬ нение Риккати K(t) = —K(t) А — A'K(t) 4- K(t) BR^B'Ktt) — Q (9.116) с граничным условием К (Т) = 0. Представьте себе момент времени Т 1 См. § 4.16. 2 См. [НО] или [107]. 22 Атанс и др. 673
«начальным» и К (Т) — «начальным условием». Тогда матрицу К можно представлять себе «квазипостоянным» (асимптотическим) решением урав¬ нения Риккати при уменьшении времени. При Т сю «переход», вызван¬ ный «начальным условием» К (Т) = 0, затухает, и квазипостоянный интер¬ вал, в течение которого К (0 = /С, неограниченно возрастает. Как по¬ казано на рис. 9.3, К (0 —> К для любого конечного времени t. Так как оптимальное управление равно и (/) = — /?"1В'ЛГ-ѵ(Л, то оптимальная траектория есть решение однородного уравнения Квазистационарный йнтер дал Уменьшение бремени 'Переходный шн тербий Рис. 9.3. Грубая интерпретация постоянной матри¬ цы К. При Т -> оо «переходный период» распола¬ гается в бесконечности, и квазипостоянный интер¬ вал растягивается на все конечные времена x(t} = Gx(t\ (9.117) где G = А — BR~rB K (9 118) Лемма 9.8. Собственные значения матрицы G = А — —BR~1B'К должны иметь от¬ рицательные действительные части, и поэтому оптималь¬ ная система (9.117) устой¬ чива С Доказательство. Предпо¬ ложим, что одно или более собственных значений G имеют неотрицательные вещественные части. В этом случае некоторые из фазовых координат не будут стремиться к нулю, и, следовательно, стоимость J* будет бесконечна. Таким образом, матрица К должна быть такой, чтобы собственные значения G имели отрицательные вещественные части, хотя одно или более собственных значений матрицы А могут иметь неотрицательные вещественные части. Иначе говоря, если даже управляемая система не¬ устойчива, то оптимальная система должна быть абсолютно устойчива. Проиллюстрируем эти понятия на простом примере. Пример 9.4. Рассмотрим управляемую систему (0 = х<> (0; х2 (0 = u(t). (9.119) Известно 2, что эти уравнения являются представлением в пространстве состояний системы, вход и выход которой связаны передаточной функцией 4Йг-0«-т' <9J201 т. е. эта система представляет собой так называемый объект с двойным интегрированием. Рассмотрим функционал 00 Â = (0 + 26л1 (Z)x2(Z) + (0 + Ч2 (/)] dt, (9.121) о где принято, что а —62>0. (9.122) Для этой задачи имеем Уравнение (9.122) гарантирует положительную определенность Q. 1 См. § 3.26. 2 См., например, § 7.2. 674
Из уравнений (9.123) и (9.109) находим, что оптимальное управление u(t) =— Ь12хг(і)— k22x2(t). (9.124) Из уравнений (9.123) и (9.110) находим ^11 ^12 0 1 — 0 0 kl2 4- > to 0 (0 1] /гп Z?12 _^12 k22_ _0 о_ _1 0 _&12 ^22 _ _1_ _^12 &22_ Г1 bl _ ГО 01 [ь а] [о о] (9.125) Выполнив указанные перемножения матриц, получим три алгебраических уравнения ki2= 1; (9.126) ^11 ~Ь ^12^22 Ь — (9.127) 2/г12 ^22 « = 0. (9.128) Решения этих уравнений ^12 = ± 1‘, (9.129) ✓X Xs, ^11 — ^12^22 (9.130) k22 = ± а 4- 2£12 . (9.131) Чтобы устранить неопределенность знака, мы должны воспользоваться положитель¬ ной определенностью К, из которой следует Z?n > 0; (9.132) ^11^22 ^12 > (9.133) Из последних неравенств вытекает, что ^22 > В. (9.134) Из уравнений (9.134) и (9.131) получим k22 а 4~ 2^12» (9.135) Величина ^12 = +1 (9.136) обеспечивает положительную определенность матрицы К. Чтобы показать это, допустим, что ^12 — 1 • Тогда из уравнений (9.137) и (9.135) находим k22 = }[ а — 2. Поскольку k22 — действительное число, то должно быть а ^>2. Из уравнений (9.130), (9.132), (9.137) и (9.138) получим kir = —k22 — b — — Ÿa — 2 — b > 0, и поэтому выполняется соотношение b< — /0^2 <0. Уравнения (9.133), (9.129), (9.139) и (9.138) дают неравенство — (а — 2) — bVâ^2> 1 или эквивалентное ему Ь2 > а. (9.137) (9.138) (9.139) (9.140) (9.141) (9.142) (9.143) 675 откуда
Но неравенства (9.143) и (9.122) противоречат друг другу. Следовательно, величина k12 = —1 не может сделать матрицу К положительно определенной, и поэтому решением должно быть ^12 — + U &22 = V+ 2, kn =■ ]/”ci + 2 — b. (9.144) Итак, оптимальное управление [см. уравнение (9.124)] должно быть равно и (і) = — Xi(t) — + 2 х2 (/). (9.145) Таким образом, для данной задачи и (t) не зависит от Ô. Рис. 9.5. Система с обратной связью, полученная путем преобразования блок- схемы, показанной на рис. 9.4 Рис. 9.4. Оптимальный регулятор состояния для системы, рассматриваемой в примере 9.4 Блок-схема оптимальной системы показана на рис. 9.4. На этой схеме х^ (0 — выход - 1 ‘Т' / dxt (/) , объекта, обозначенного через Так как х2(0 ——’ дифференцирование обозна¬ чено блоком s, через который пропускается сигнал хх (0, в соответствии с обозначением производной в «преобразовании Лапласа. На рис. 9.5 показана преобразованная блок-схема, где показано, что оптимальная система содержит в цепи обратной связи компенсирующую цепочку с передаточной функцией 1+s а + 2. Передаточ¬ ная функция замкнутой системы равна 1 Рис. 9.6. Корневой годограф опти¬ мальной системы с обратной связью при изменении а при изменении а от 0 до оо. При 1 +s /а + 2 + s2 = d . (9.146) s2 + s а + 2 4- 1 Таким образом, полюса оптимальной системы с обратной связью располагаются в точках s=- ^Q2+2 ± -|-//Т=3. (9.147) На рис. 9.6 показан корневой годограф по¬ люсов оптимальной системы с обратной связью л /2 . а — 0 полюса располагаются при s = — ± ± / ——, что соответствует случаю [см. уравнение (9.121)], когда сигнал х2 (0 (т. е. про¬ изводная от выхода) не «взвешивается» в функционале. С ростом а полюса оптимальной си¬ стемы стремятся к действительной оси плоскости s, что выражается в уменьшении колеба¬ тельности переходного процесса и его растягивании. При а +> 2 оба полюса — действитель¬ ные отрицательные числа. Итак, чем «сильнее взвешивается» производная выхода, тем меньше колебательность системы. 676
Теперь следует сделать еще несколько замечаний о решении алгебраических уравне¬ ний (9.126)—(9.128). Заметим, что хотя ku и не фигурирует в выражении для оптимального управления, мы, тем не менее, должны его вычислить, чтобы найти такие решения алгебраи¬ ческих уравнений, при которых матрица К положительно определенна. Читателю не следует недооценивать трудностей выделения соответствующего решения этих квадратных уравне¬ ний. Часто легче решить дифференциальное уравнение Риккати и найти его «квазипостоян¬ ное» решение, чем выделить положительно определенное решение алгебраического урав¬ нения (9.110). 9.6. АНАЛИЗ СИСТЕМЫ ПЕРВОГО ПОРЯДКА Предыдущие четыре параграфа содержали теорию задачи о регуля¬ торе состояния. Мы иллюстрировали смысл этой теории на простых при¬ мерах. В этом параграфе рассмотрим систему первого порядка и проиллю¬ стрируем реакцию оптимальной системы несколькими временными графи¬ ками. Хотя система очень проста, результаты иллюстрируют свойства оптимальных систем, и нам кажется, что читатель сумеет глубже понять их поведение. Рассмотрим систему i(/) = ax(0 + u(t) (9.148) и функционал т А = 4-^(0 + -^\[qx2(t) + ru2(t)]dt. (9.149) О Предположим, что /^0; ?>0; г>0. (9.150) На основании закона управления 9.1 оптимально управление u(t) = — (9.151) где скаляр k (/) есть решение уравнения Риккати k(t) = -2aA(/) + -J-ÂJ2(0 — q (9.152) с граничным условием *(Г) = /. (9.153) Из уравнения (9.152) находим f -j =Г dx. (9.154) J — k2 (0 — 2ak (/) — q J MO t Это выражение можно проинтегрировать и получить -L — а— 0 Р + а + (P — a) е2₽ (‘-Г) --а +Р k (/) - Г - , (9.155) -4- — а— 0 1 _ _L eW(t-T> — а 4- р где р='|/4’+°2- (9.156) Таким образом, в данном случае мы можем решить уравнение Риккати аналитически. 22 Аіанс и др 577
Оптимальная траектория является решением дифференциального уравнения первого порядка с переменным коэффициентом х(і) = k (/)J X (/), x(0) задано. (9.157) Таким образом, t x(t) — x (O)exp j £(t)J du (9.158) о на состояние Рис. 9.7. Оптимальный регулятор состояния системы х (t) — ах (/) + и (/). «Коэффициент усиления» k (t) получается путем моделирования уравнения (9.152). Начальное значение k (0) вычислено заранее На рис. 9.7 показана структура оптимальной системы. Мы нашли k (t), моделируя уравнение Риккати; начальное состояние k (0) полу¬ чается из уравнения (9.155) при t = 0. Для получения оптимального управления сигнал k (t) умножается х(/). На рис. 9.8, а пока¬ зано состояние оптималь¬ ной системы при а = —1, f = о, Т = 1, X (0) - 1 и q = 1, где в качестве пара¬ метра используется г. За¬ метим, что если г мало (стоимость управления не важна), то состояние х (t) переводится в ноль быстро; если г велико (управление «стоит» очень дорого), то состояние убывает мед¬ ленно. На рис. 9.8, б пока¬ зано оптимальное управ¬ ление и (/) с г в качестве параметра. Заметим, что с уменьшением г управление на начальной части интервала управления становится довольно большим; при г—>0 оптимальное управление приб¬ лижается к импульсу при t = 0. На рис. 9.8, в показаны решения уравнения Риккати k (/) с г в ка¬ честве параметра. Заметим, что с уменьшением г, k (/) почти постоянно на начальном участке интервала управления; для малых значений г вре¬ менная зависимость k (t) проявляется лишь в самом конце интервала управ¬ ления. С ростом г, k (t) становится действительно зависящим от времени коэффициентом усиления. На рис. 9.9 показано решение уравнения Риккати для различных значений конечного времени Т и двух граничных условий k (Т) = 0 и k (Т) = 1 (т. е. f = 0 и f = 1). Значения остальных констант выбраны а = —1, q = г = 1. На рис. 9.9 показано, что функция k (t) стремится к одному и тому же «квазипостоянному значению в обратном времени» с ростом Т независимо от конечных условий. Это обстоятельство можно проверить аналитически, используя уравнение (9.156), которое дает (так как р положительно) соотношение lim k(t) = r(p + а) = ar -h г 1/"— + a2. (9.159) T->oo г г Результаты, изображенные на рис. 9.8 и 9.9, получены при а = —1, т. е. для устойчивой системы х (t) = ах (t) + и (t). Предположим, что 678
Рис. 9.9. Решение k (/) урав¬ нения Риккати для различ¬ ных значений конечного вре¬ мени Т Рис. 9.8. а) Переходный процесс оптимального регулятора при а = —1 (устойчивый случай); б) оптимальное управление; в) решение уравнения Риккати k(t) 679
а = +1 (система неустойчива). На рис. 9.10, а показано состояние X (1) с г в качестве параметра при значениях а = 1, х (0) = 1, f = 0 и q — 1. Реакция системы интересна тем, что она иллюстрирует некоторые особенности поведения оптимальных систем. Прежде всего заметим, что для больших значений г регулятор состояния плохо регулирует фазо¬ вую координату. Дело в том, что для системы «дешевле» иметь большую ошибку на конечном интервале времени, чем использовать большие управления. С уменьшением г фазовая координата начинает убывать от исходного значения х (0), достигает минимума, а затем увеличивается в течение остальной части интервала управления. Такое поведение вызвано тем, что k (Т) = 0, откуда следует, что опти- х(і) мальное управление стремится к нулю с 7,(?| ^ЛЯІ~ 0) t —» Т. На рис. 9.10, б показано поведение 1 функции k (t) с изменением г. Еще раз отме- I х(.0)=1, q=1,r=1,T=1 тим> чт0 МО почти постоянно при малых І\ ’ ’ ’ значениях г в начале интервала управления --I \ Рассмотрим далее влияние граничного ’ I \ условия k ІТ\ = f на конечное состояние \ \ ; X (Т) как для устойчивой (а = —1), так и \ X- Для неустойчивой (а = +1) систем. На рис. 9.11 показан график отношения ? , х (Г) (для f > 0) 0 10 20 Г х (Т) (р.ля f = 0) ѴУ-іои; Рис. 9.11. Влияние величины f в зависимости от f для обоих случаев призна¬ на конечное состояние х (Т) чениях X (0) = q = г = Т = 1. Из рис. 9.8, а оптимального регулятора при 0 чт0 при / = 0 И а = — 1, х (1) = 0,2184; а = — 1 (устойчивый случаи) и n in ' ’<• ч=+1 (неустойчивый случай) из рис. 9.10, а видно, что при/= 0 и а =+1, X (1) = 1,2244. Как следует из рис. 9.11, включение конечной стоимости ~^fx2 (Т) приводит к тому, что регу¬ лятор для неустойчивой системы оказывается лучше регулятора устой¬ чивой системы, особенно при малых значениях /. В каждом из случаев lim X (Т) =0, но X (Т) 0 ни для какого конечного /. оо Обратимся теперь к случаю Т = оо. Из закона управления 9.2 на¬ ходим, что оптимально управление „(/) = _ J_éx(0, (9.161) где k — положительный корень алгебраического уравнения -J-£2 — 2ak — q = 0, (9.162) поэтому k определяется уравнением k = аг + г У+ а2 . (9.163) Сравнивая уравнения (9.163) и (9.159), замечаем £=1іт&(/)для любых /^0. (9.164) Т -> оо Если а = —1 и q = г = 1, то £ = —1 + ]/2 0,414, что действи¬ тельно является «квазипостоянным» значением k (/) (см. рис. 9.9). Если 680
а = 4-1, g — 1 и г ~ 0,05, то «квазипостоянным» значением k (t) (см. рис. 9.106) является £^ 0,278. Упражнение 9.2. Рассмотрим систему х (t) = Ах (/) 4- Ви (/) и функционал т ^^-^(х(Т), Fx(T)) +-1- Qx(tï) (9.165) 0 Считайте, что F положительно определенна и удовлетворяет алгебраическому урав¬ нению -FA — A'F + FBR^B'F—Q ~0. (9.166) * 1 Покажите, что минимальная стоимость равна = — (х (0, (0) для любого t и Т как конечного, так и бесконечного. Покажите, что оптимальное управленце является линейной инвариантной функцией состояния. Можете ли вы объяснить, что следует из уравнения (9.166)? Упражнение 9.3. Рассмотрите систему с передаточной функцией -Ц4 = G (S) = а , 1 . . (9.167) и (s) sa 4- ats 4- а0 Пусть X] (() = у (і) и х2 (() = у (()• Рассмотрите функционал оо 7, =Л-J [х|(0 4-?х|(0 4-',«2(0] <7>0; г>0. (9.168) о Найдите оптимальное управление и постройте блок-схему (подобно рис. 9.5) опти¬ мально?! системы. Для каждого из следующих случаев а0 = 0; = 1 ; (9.169а) ао=О; = — 1; (9.1696) а0 — 2; аг = 3; (9.169в) а0 = —1; аг — 0; (9.169г) а0=1; аі = 0 (9.169д) а) начертите корневые годографы оптимальной системы с обратной связью при г — 1 и г = 0,1 в зависимости от q\ б) начертите корневые годографы оптимальной системы с обратной связью для q ~ 1 и q — 0,1 в зависимости от г; в) сделайте выводы о характере системы (колебательная, апериодическая и т. д.). Следующие упражнения предназначены для читателей, которые могут пользоваться цифровой вычислительной машиной и умеют программировать. Упражнение 9.4. Рассмотрите систему первого порядка х(/)“’(2е"~*— 1) х (0 4" 4~ и (t) и функционал 2 •у-J Iх2 (0 + и2 (01 dt. Считайте х (0) = 0. о Начертите оптимальные кривые для х (/) и и (t). Повторите это же упражнение для системы X (/) — (sin 10/) х (t) и (/); х (0) = 0. Упражнение 9.5. Рассмотрите систему іх(/)=х2(/); і2(/)=а(/); (9.170) с начальными условиями Хі(0) = 1; х2(0) =0 (9.171) и функционал т A=4f [4(0 4-0,1 4 (() 4-0,1 u\t)]dt. (9Л72) о Начертите графики xr (t) и х2 (/) в зависимости от t на интервале 0 Т для Т = 1; Т — 2\ Т = 5; Т = 10 и Т ~ оо. Определите зависящие от времени собственные 681
(9.173) (9.174) значения (/) и Х2 (0 оптимальной системы и постройте их временные графики (если не¬ обходимо, для вещественной и мнимой частей) на интервале 0^ t 1 при Т — 1 и сравните их с собственными значениями оптимальной системы при Т == оо. Упражнение 9.6. Рассмотрите систему третьего порядка Х1 (/) = х2 (/); х2(0=*з(0; х3 (t) = — ах3 (0 4- и (0 , при Хі (0) = 1; х2 (0) = х3 (0) = 0. Функционал оо Л = [^(0 +0,1x2 (0 + 0>ім2(0] dt о Найдите оптимальное управление. Нарисуйте переходной процесс хх (/) оптимальной системы при а — 0,1; а = 1; а — 10 и а = 100. Сравните полученное хх (/) с х± (/) из при¬ мера 9.5 при Т = оо. Ваши выводы? 9.7. ЗАДАЧА О РЕГУЛЯТОРЕ ВЫХОДА До сих пор мы имели дело с задачей уменьшения составляющих век¬ тора состояния х (t). В этом параграфе мы рассмотрим задачу о том, как сделать малыми составляющие выходного вектора у (t), а в следую¬ щем— кратко исследуем задачу о регуляторе выхода для систем с од¬ ним входом и одним выходом. В этом параграфе покажем, что если управляемая динамическая си¬ стема наблюдаема, то задачу о регуляторе выхода можно свести к задаче о регуляторе состояния. По сути дела, понятие наблюдаемости позволит нам установить единственность оптимального управления. Рассмотрим линейную систему с переменными параметрами у (t) = С (t) х (t), J где состояние х (t) — /г-мерный вектор-столбец; управление и (t) — г-мерный вектор-столбец; выход у (/) — m-мерный вектор-столбец; 0<m<r<n. (9.176) Рассмотрим функционал т К = ^{у{Т), Fy(T)) + 4 + R{t)u(t))]dt. (9.177) Предположим, что система (9.175) полностью наблюдаема1; управление и (t) не ограничено; /? (/) положительно определенна; (9.178) Q (t) положительно полуопределенна; F положительно полуопределенна; Т задано. Мы хотим найти оптимальное управление, т. е. управление, минимизи¬ рующее стоимость J 2. Использование функционала J 2 обнаруживает наше желание сделать, а затем удержать близким к нулю выход у (/), не расходуя слишком много энергии на управление. Из наличия конечной стоимости {у (Т), 1 См. § 4.15, определения 4.14 и § 4.17. 682
F y (T)) следует, что при F =£ О мы хотим также гарантировать малую величину выхода в конце интервала управления. Решим эту задачу, называемую задачей о регуляторе выхода, сведя ее к задаче, которая аналогична задаче о регуляторе состояния, а затем воспользуемся результатами § 9.3, чтобы установить закон оптималь¬ ного управления. Подставим у (t) - С і х (0 в уравнение (9.177) и получим соот¬ ношение А=4<* C'(T)FC(T)x(T)) + T + 4- JI <x (z)- c (f) Q c & x > + to + <и(0,/?(0я(0Ж (9.179) Сравнивая стоимость J2 (9.179) c (9.13), найдем, что они идентичны, с той лишь разницей, что матрицы F и Q (/) выражения (9.13) заменены матрицами С' (T) FC (Т) и С' (t) Q (/) С (t) соответственно в уравнении (9.179). Если мы сможем показать, что матрицы С' (T) FC (Т) и С' (О Q (/) С (t) положительно полуопределенны, когда F и Q (/) поло¬ жительно полуопределенны, то соответствие между Jx и J 2 будет полным. Лемма 9.9. Если F и Q (/) положительно полуопределенны и если система (9.175) полностью наблюдаема, то матрицы С' (T) FC (Т) и С' (О Q (t) С (t) положительно полуопределенны. Доказательство. Прежде всего, поскольку F и Q(t) симметричны, матрицы С' (T) FC (Т) и С' (T) Q (t) С (0 также симметричны. Если система (9.175) наблюдаема, то С' (0 не может быть равна нулю ни при каком t С Ио, Т]. Если Q (t) положительно полуопределенна, то (У (0» Q (0 У (0 9 для любого у (0; следовательно, если у (t) = = С (0 x (0, то (С (t) x (t), Q (t) C (0 x (t)) 0 для всех C (t) x (t). Но наблюдаемость предполагает, что каждый выход у (0 получается при единственном состоянии х (0, и поэтому (x (t), С' (t) Q (t) С (0 х (0)^0 при любом x (t), а следовательно, матрица С' (0 Q (t) С (0 положительно полуопределенна. Аналогично доказывается положительная полуопре¬ деленность С' (T) FC (Т). Воспользуемся теперь результатами § 9.3, чтобы установить следу¬ ющий закон управления. Закон управления 9.3 (решение задачи о регуляторе выхода). Даны линейная наблюдаемая система x (t) = A (t)x(t) + В y(t) = C(t)x(t) и функционал т а=4 Fy о+44^ (/)> V у ю + to + (u(t),R(t)u(t))]dt. (9.181) Считаем, что управление и (0 не ограничено, F и Q (t) положительно полуопределенные, JR (t) положительно определенна, Т фиксировано (задано). Оптимальное управление существует, единственно и равно u(t)= -R-\t)B'(t)K(t)x(t\ (9.182) 683 (9.180)
где положительно определенная симметричная матрица К размера п X п есть решение уравнения Риккати + К (О В (t) (О В' (/) К (0 - С (О Q (О С (0 (9.183) с граничным условием К(Т) = C'(T)FC(T). (9.184) Оптимальное состояние является решением дифференциального урав¬ нения х (0 - [А (/) - В (Q R1 (О В' (/) K(t)\X (0, (9.185) где X (/0) задано. Минимальная стоимость J2* равна J*[x(0,n (9186) для любых X (t) и t. Прокомментируем некоторые выводы из закона управления 9.3. Структура оптимального регулятора выхода показана на рис. 9.12. Заметим, что оптимальное управление является функцией состояния, а не выхода у (t). Это обстоятельство может разочаровать читателя, Рис. 9.12. Структура оптимального регулятора выхода. Матрица усилений К (/) является решением уравнения Рик¬ кати (9.183) поскольку он мог ожидать, что оптимальное управление является функ¬ цией от выхода, а не от состояния. Так как размерность вектора состоя¬ ния в общем случае выше размерности выхода, это означает, что оптималь¬ ная система получается сложной. Однако наблюдаемость системы гаранти¬ рует, что мы можем вычислить состояние, зная выход. Если бы система не была наблюдаемой, то вычислить состояние по выходу было бы нельзя, и поэтому оптимально управлять системой было бы невозможно. Поразмыслив, читатель убедится в том, что оптимальное управле¬ ние «обязано» быть функцией состояния, которое в каждый момент вре¬ мени содержит всю информацию, необходимую для предсказания будущих значений как самого состояния, так и выхода. Последнее становится очевидным благодаря тому, что оптимальное управление должно исполь¬ зовать всю информацию наиболее «эффективным» образом. Заметим также, что минимальная стоимость J2* является функцией состояния [см. урав¬ нение (9.186)], а не выхода. Один только выход не может определять минимальную стоимость (хотя стоимость J2 и была выражена через у (/)), потому что выход, в общем случае, не содержит всей информации, опре¬ деляющей будущее процесса. Обратимся теперь к матрице /С (0, являющейся решением уравнения Риккати (9.183). Сравнивая (9.183) с (9.61), легко заметить, что в обоих уравнениях члены, включающие К (/), одинаковы. Различаются эти выра¬ жения тем, что матрица Q (t) в уравнении (9.61) заменена матрицей С' (t) Q (/) С (/) в уравнении (9.183). Естественно, что решения К (t) 684
для задач о регуляторе состояния и о регуляторе выхода будут различны. Тем не менее, поскольку К (О является для обеих задач решением урав¬ нения Риккати, все замечания § 9.4 относительно вычисления К (t) остаются в силе. Наконец, заметим, что, как и в § 9.3, управляемости линейной системы (9.180) не требуется, если Т конечно1. Сделаем теперь частные выводы для случая линейных инвариантных во времени систем и функционалов при Т = оо. Воспроизводя результаты § 9.5, получим следующий закон управления. Закон управления 9.4. Дана управляемая и наблюдаемая линейная инвариантная во времени система лг(О = Ax(t) + Ви (0; (9.187) y(t)= Cx(t) и функционал Л = (9.188) о Пусть и (0 не ограничено, а матрицы Q и /? положительно опреде¬ ленны. Оптимальное управление существует, единственно и равно и(і) — (9.189) причем постоянная матрица К размера п X п симметрична, положительно определенна и является решением нелинейного инвариантного во времени алгебраического матричного уравнения — КА — А К + KBR^B'K — C QC = 0. (9.190) В этом случае состояние оптимальной системы является решением линейного инвариантного во времени однородного уравнения [при задан¬ ном X (0) ] х(0 - [Л — BR 'B KSxtt) = Gx(t). (9.191) Минимальная стоимость </2* равна Л* - (9.192) Собственные значения матрицы G - [Л - BR^B K] (9.193) имеют отрицательные вещественные части. Напомним, что система (9.187) управляема в том и только в том слу¬ чае, когда матрица \В\АВ\А2В\. . . \Ап~'В] (9.194) содержит п линейно-независимых векторов-столбцов. Система (9.187) наблюдаема тогда и только тогда, когда матрица [С'\А'С'\(А')2С'\ . . . j (Л'Г-'С') (9.195) содержит п линейно-независимых векторов-столбцов. 1 См. замечания относительно управляемости в § 9.4. 685
Пример 9.5. Рассмотрим систему іі (0 = х2 (О; х2 (О = и (О; у(і)=хг(і). , (9.196) Эта система уже рассматривалась у (s) 1 _ . • Рассмотрим функционал в примере 9.4. Ее передаточная функция равна Л = 4 + (01 dt. О (9.197) Используя закон управления 9.4, найдем, что оптимальное управление имеет вид и (0 = ІЛ 12*1 (0 + ^22х2 (О] • (9.198) Матричное алгебраическое уравнение (9.190) дает в этом случае три уравнения 1 h 2 1 . -y 12 = h (9.199) — £ц + “ k12k22 =0; (9.200) —12 + — k 22 = 0. (9.201) Так как К положительно определенна, должны иметь место неравенства kn > 0; fe22 > 0; ^11Ze22—k[2 > 0. (9.202) Таким образом, правильными решениями уравнений (9.199)—(9.201) являются £12 =''2’ fe22=r4/2; (9-203) k11==r4^2. Подставляя значения (9.203) в уравнение (9.198), найдем, что оптимально управление _J_ _1 « (0 = — г 2*1 (0 — г 4 Г2Х2 (0 = = -r~* y(t)-r~T]f2y(t). (9204) Блок-схема оптимальной системы (в обозначениях преобразования Лапласа) показана на рис. 9.13. Оптимальное управление получается пропусканием сигнала у (t) через цепь обратной связи с передаточной функцией 1_ __1_ F (s) = г 2 + г 4 /2s. (9.205) Передаточная функция G* (s) оптимальной системы с обратной связью равна _1_ q2 1 G* (s) = уу-7т = ï~yr ТУ • (9-206) r 2+r 4 K2s s2+K2r 4s + r 2 1-1 ? 686
Полюса оптимальной передаточной функции системы с обратной связью G* (s) равны (9.207)1 На рис. 9.14 показан корневой годограф замкнутой системы в зависимости от г. Годо¬ граф представляет собой прямую, угол которой с осью /со составляет 45°. Примечательным свойством этой системы является то, что коэффициент затухания 2 оптимальной системы I = 0,707 (9.208) при любом значении г. Изменение г увеличивает или уменьшает коэффициент усиления системы; при г ма¬ лом коэффициент усиления большой и наоборот. Упражнение 9.7. Рассмотрите линейную систему хЮ =А Юх(/) + B(t)u(i); Рис. 9.14. Корневой годограф замкнутой системы рис. 9.13 при изменениях г. Отмечены положения полюсов для г= = 0,0155 и г = 1 Рис. 9.13. Оптимальный регулятор выхода с обратной связью для объекта с двойным интегрированием и функционал стоимости J2 (9.181). Найдите оптимальное управление и минимальное значение J2. Строго сформулируйте все сделанные вами предположения. Упражнение 9.8. Рассмотрите систему х (/) = Ах (/) + Ви (0; У (0 = Сх (0 и функ¬ ционал т = Fy(T))+^-J [(у (Z), «У (0> + о + {«(/), Ru(t)}]dt, где Т фиксировано и Т < оо. Можете ли вы найти условия, при которых К (t) — const для всего t g [0, 71]? Указание: см. упражнение 9.2. 9.8. ЗАДАЧА О РЕГУЛЯТОРЕ ВЫХОДА ДЛЯ СИСТЕМЫ С ОДНИМ ВХОДОМ И ОДНИМ ВЫХОДОМ В этом параграфе мы применим результаты предыдущего параграфа к системам с одним входом и (t) и одним выходом у (t). Основными целями будут: 1) показать структуру оптимальной системы с обратной связью; 2) привести уравнения, которые надо решать. Мы будем рассматривать системы, передаточные функции которых содержат только полюса, и отметим особенности, характерные для систем с нулями и полюсами. 1 j = 2 Коэффициент затухания — понятие, хорошо знакомое специалистам по управлению. Если пара комплексных полюсов (или собственных значений) равна s = —ап ± jan и ап^ 0, 0, то коэффициент затухания % определяется как g = sin arctg ал 687
Рассмотрим систему, которая описывается линейным инвариантным во времени дифференциальным уравнением м-го порядка: [D + Qn-iP + • • • 4" &1D -j- clq }у (0 = и (/). Передаточная функция этой системы равна У : Q ( s\ — ! . и № sn + an_lsn 1 + • * • 4- ais 4" ао Определим состояние 1 х (t) системы (9.209), приняв Xi(t) = ^y(t), 1, 2, ..., п. Тогда уравнениями состояния системы (9.209) будут МО (9.209) (9.210) (9.211) L x„(0 Уравнение выхода имеет вид 'хЛО" Х2 (О (9.213) y{t) = 11 о . . . 0] _ хп (О _ Уравнение (9.212) можно записать в векторном виде: х (t) = Ах (() -j- bu (/), а уравнение (9.213) можно представить в виде y(t) = Cx(t), где С — матрица размера 1 X п (вектор-строка). Пусть (9.214) (9.215) Л = 4" f + r“2 dt о — рассматриваемый функционал стоимости. Используем управления 9.4. Если мы обозначим через klf элементы матрицы оптимальное управление будет равно ^(0 ~ 4“ ^2п^2 (0 4“ * * ’ 4- &пп%п (ty] = (9.216) теперь закон К, то (9.217) /=1 1 г Структура оптимальной системы с обратной связью показана на рис. 9.15, где использованы обозначения преобразования Лапласа. Вы¬ ход у (/) подается на корректирующее устройство в цепи обратной связи с передаточной функцией F (s) — knnsn~~1 4~ • • • 4~ k,2ns + (9.218) 1 См. § 4.9. 688
на выходе которого получается оптимальное управление. Передаточная функция G* (s) замкнутой оптимальной системы равна G* (s) = G(s) 1 + _LG(s)F(s) = -, ! —г -, —Г- • (9.219) Сп±. л I I П— 1 і I I п I I I I I I s 4- I ап^ -J—— I s + • • • + I Qi 1—— I « -г I Оо Н—— I Полюсами (или собственными значениями) замкнутой оптимальной системы являются п решений алгебраического уравнения s" 4- ( 4 + ... -b ( О1 + s + (а0 + = 0. (9.220) Значения kin, . . knn надо найти из уравнения — КА — А К + -^КЬЬК—С'С = 0, (9.221) где А — матрица, входящая в уравнение (9.212), 0 0 и С = [1 0 . . . 0]. Расположение полюсов замкнутой системы будет, естественно, зави¬ сеть от величины весового коэффициента г, входящего в функционал Рис. 9.15. Оптимальный регулятор (с обратной связью) выхода объекта. Передаточная функция объекта содержит только полюса (9.216). Калман показал, что асимптотическое поведение полюсов G* (s) можно описывать следующим образом. При г —> 0 полюса оптимальной замкнутой системы стремятся к устойчивой конфигурации Баттерворта х. Как и ранее, можно нарисовать годограф полюсов замкнутой системы в зависимости от г. Заметим, что величина коэффициента обратной связи является (нелинейной) функцией параметра г. Чем меньше величина г, тем больше коэффициент и наоборот. С практической точки зрения проектировать корректирующее устрой¬ ство F (s) [см. рис. 9.15 и уравнение (9.218)1 следует приблизительно. Причина состоит в том, что передаточная функция F (s) содержит только 1 Фильтры Баттерворта описаны в работе [209]. 689
нули. Субоптимальную систему можно получить, заменив F (s) цепочкой с передаточной функцией р (s\ — F ( ' Q (s) ’ где корни Q (s) расположены возможно дальше влево от корней F (s). Эта теория применима и к системе, передаточная функция которой содержит т нулей и п полюсов, т < п. Предлагаем читателю самостоя¬ тельно проверить данное положение. Проиллюстрируем теорию при помощи простого примера. Пример 9.6. Рассмотрим систему выход у (0 которой связан со входом нением и (О урав- y(t) = il(t) +0U (t). (9.222) Рис. 9.16. Оптимальный регулятор выхода (с обратной связью) s —I— В для объекта с передаточной функцией —~- s Система имеет передаточную функцию — a (S)= s+ P u (s) () s2 • Определим переменные состояния (фазовые координаты), положив хі(0=!/(0; I х2(/) = г/(0 — u(t). J (9.223) (2.224) Уравнения системы *1 (0 — х2 (0 +«(0; ' х2 (О = Р« (0 ; У (0 = (0 Мы хотим найти управление, которое минимизирует стоимость J2 (9.216). На нии закона управления 9.4 найдем и (0 = т" + Р^іг) хі (0 + (^12 + Р&22) х2 (0]• (9.225) основа- (9.226) Из уравнения (9.190) получим следующие алгебраические уравнения ^11 + 2Р& Ц&12 + р2&12 — г =0; Р^11^22 Н" Р^12 + р2 ^12 ^22 “h 11^12 — г ^11 ~ ^12 + 2Р/г12£22 + P2 М2—2г&12=0. (9.227) На рис. 9.16 показана блок-схема оптимальной системы (в обозначениях преобразова¬ ния Лапласа). Так как х2 (0 = у (t) — и (0, переменную состояния (фазовую координату) 1 Оптимальное по быстродействию управление таким объектом рассматривалось в § 7.12. 690
х2 (О получим, вычитая управление и (t) из у (/)• Блок-схему на рис. 9.16 можно упростить при помощи обычных преобразований. Из уравнения (9.227) находим »n+₽W-r (9И8) (&12 + Р/г2г)2 = 2rfc12. , Так как > 0; 622 > 0; /гп^22— ^12 > 0» получим 4- Й12 = /г; (9.229) *„ + pfe22 = V2г*,г • (9.230) Из уравнений (9.229), (9.230) и (9.227) видно, что £12 есть решение алгебраического уравнения четвертого порядка, пытаться решать которое мы здесь не будем. Интересный случай возникает при Р = 0, і. е. когда система неуправляема. Чтобы проиллюстрировать отсутствие смысла при попытке использовать закон управления 9.4, подставим, не раздумывая, р = 0 в уравнение (9.227) и получим ft?, = г; (9.231) ^11^12 — (9.232) = 2г*12- (9.233) Так как fctl > 0 и г > 0, из уравнения (9.231) следует, что *н — Ис > 0. Уравнение (9.232) приводит к выводу (9.234) *12 = Г, а уравнение (9.233) — к соотношению (9.235) k12 = 0 или 612 = 2г. (9.236) Очевидно, что соотношения (9.235) и (9.236) противоречат друг другу. Такой невероят¬ ный ответ возникает потому, что мы попытались применить закон управления 9.4 к неуправ¬ ляемой системе. Упражнение 9.9. Для каждой из следующих систем, где у (t) — выход и и (t) — управление, функционал стоимости задан как л=J[у2 (°+г“2 (/)] dt ■ (9-237) о Для каждой из систем найдите оптимальное управление, полюса оптимальной системы и нарисуйте годограф полюсов в зависимости от г: а) у (О +И0 = «(0; б) = В) ÿ (t) + Зу (і) + 2у (/) = и (t); г) У (t) — у (t) = и (t); д) у (t) + у (t) = и (0; е) y(f)=u(t); ж) у (0 + у (0 = « (0- Есть ли что-либо общее в годографах полюсов систем второго порядка [с а) по г)]? Упражнение 9.10. Рассмотрите систему, выход у (і) и вход и (t) которой связаны диф- ференциальным уравнением ў(0+Ў(0=а«(0 + «(0 (9.238) с функционалом (9.237). Найдите и нарисуйте годограф полюсов оптимальной замкнутой системы в зависимости от г и а. Что происходит при а = 1? 691
9.9. ЗАДАЧА СЛЕЖЕНИЯ 1 В предыдущих параграфах мы рассмотрели задачи о регуляторах состояния и выхода. В этом параграфе обратим внимание на задачу сле¬ жения. Напомним, что физические положения этой задачи подробно обсуж¬ дались в § 9.2, где приведена ее формулировка. Повторим ее еще раз в данном параграфе. Здесь будем поступать точно так же, как и в § 9.3. Для определения экстремальных управлений воспользуемся принципом минимума. Покажем, что: 1) //-минимальное управление есть линейная функция от дополни¬ тельной переменной; 2) упрощенные канонические уравнения линейны, но неоднородны (так как желаемый выход войдет в вынуждающий член); 3) дополнительная переменная р (t) связана с состоянием х (t) вы¬ ражением вида р(/) = — 4) матрица /((/) есть решение уравнения Риккати, a g (t) — решение линейного дифференциального уравнения, в которое входит желаемый выход. Доказательства существования и единственности мы предоставим читателю и сосредоточим свое внимание на обсуждении свойств оптималь¬ ной следящей системы. Предположим, что нам задана линейная наблюдаемая система с со¬ стоянием х (0, выходом у (/) и управлением и (/), описываемая урав¬ нениями *(/) = Л(0*(0 + £(0«(0; У (0 = Пусть вектор г (t) — желаемый выход и предположим, что размер¬ ность z (0 равна размерности выхода у (t). Наша цель — управлять системой таким образом, чтобы «держать» выход у (t) «близким» к z (t) без «слишком больших» затрат управляющей энергии. Определим сперва вектор ошибки е (/), положив e(t)^z(t)-y(t). (9.240) Функционал J3, который будем минимизировать, имеет вид А = 4 + т + 4Й<*(0, + R (t) и (t))] dt. (9.241) Как обычно, предполагается, что Т задано; /? (t) положительно определенна, a Q (/) и F положительно полуопределенны. Ошибку можно выразить как функцию от z (/) и х (t): e{t) = z(t)—C{t)x(t). (9.242) Подставив (9.242) в функционал (9.241), выразим J3 в функции от лг(/), и (t) и z (/). Мы можем теперь использовать принцип минимума и полу¬ чить необходимые условия. Наш подход очень похож на методику, изло¬ женную в § 9.3, и поэтому многие доказательства опущены или реко¬ мендуются читателю как упражнения. 1 Эта задача рассматривается в работе [112]. (9.239) 692
Гамильтониан для задачи слежения записывается в виде # = 4 (О - с (Ох (01’ <?(')[* (о - с (0 х (01) + + 4<“(0’ /?(0и(0) + (Л(П^(0. p(t)) (9.243) Условие = 0 дает уравнение _^_ = O = /î(O«(O + ^'(0P(0, (9-244) откуда получим и (t) =■- - 7?1 (/) В' (t)p(t). (9.245) Так как /? (/) положительно определенна, управление (9.245) мини¬ мизирует Н и поэтому является //-минимальным. Условие р(0 = дает р (t) = - С (t)Q(t) C(t)x(t) - А' (t)p(t) + C (0.246) Из уравнений (9.245) и (9.239) получим соотношение x(t) - А (/) х (0 — В (t) R1 (/) В' (/)р (0- (9.247) Для упрощения выкладок обозначим 5 (0 - В (/) /Г1 (0 В' (t); (9.248) V(/) = С' (t)Q(t) C(t)- (9.249) (9.250) Комбинируя уравнения (9.246) и (9.247), получим упрощенные кано¬ нические уравнения X (t) — _ A (t) 1 1 1 x(t) + 0 -P(t)_ — A'(t) _ _P(t)_ (9.251) Это — система 2п линейных дифференциальных уравнений с перемен¬ ными коэффициентами. Вектор W (/) г (t) выступает как «вынуждающая функция». При t = t0 начальное состояние дает п граничных условий *('о) = (9.252) При t = Т условие трансверсальности дает еще/г граничных условий - С (T) FC (T) X ( Т) — С' (T) Fz (Т). (9.253) Пусть Ф (/, t0) — фундаментальная матрица системы (9.251) размера 2п X 2п. Можно записать ~х(ту = Ф(Т, ty ~x(ty T + t) t 0 dx (9.254) .P(T)_ -P (0 _ _ W (t) z (t) _ Если подставить выражение (9.253) для р (Т) в уравнение (9.254) и действовать далее, как и в § 9.3, то окажется, что х (/) и р (t) связаны линейным уравнением (2.255) 693 p(t) = K(t)x(t)-g(t).
Так же, как и в § 9.3, установим свойства п X п матрицы К (О и n-мерного вектора-столбца g (/), поскольку дополнительные свойства К (0 и g (t) могут быть полезны с вычислительной точки зрения. Продиф¬ ференцируем уравнение (9.255): Р (О = К (О х (t) + К (t) X(t)-'g (t). (9.256) Из уравнений (9.247), (9.248) и (9.255) получим X (0 = [А (0 - 5 (О К (0] X (/) + 5 (t) g (/), (9.257) и поэтому уравнение (9.256) принимает вид Р(/) = [К(/) + к(t)А it)-К(05(0К(0]x(t) + + K(05(0ff(0-ff(0. (9-258) Из уравнений (9.246), (9.249), (9.250) и (9.255), находим Р (0 - [- V (t) - А’ (t) К (0] X (0 + А ' (0 g (t) + w (0 z (/). (9.259) Поскольку оптимальное решение существует, уравнения (9.258) и (9.259) должны выполняться для любых х (t), z (t) и t. Следовательно, 1) матрица К (/) размера п X п должна удовлетворять матричному дифференциальному уравнению /С(0 = - К(0 Л (0 - Л' (0К(0 + K(t)S(t)K(t) - V(t)- (9.260) 2) n-мерный вектор-столбец g (t) должен удовлетворять векторному дифференциальному уравнению g (0 = [К (0 5 (С - л ' (01 g (t) - W (t) Z (/). (9.261 ) Граничные условия получаются следующим образом. Из уравне¬ ния (9.255) p(T) = Æ(T)x(T)-g(T), (9.262) а из уравнения (9.253) р (?) = С (T) FC (Т)х (Г) С' (T) Fz (/). (9.263) Поскольку два последних уравнения должны быть справедливы при любых X (Г) и z (Т), получим К(Т) = С (T)FC(T) (2.264) и g(T) = C'(T)Fz(T). (9.265) Таким образом, граничные условия дифференциальных уравнений (9.260) и (9.261) полностью определены в (заданный) конечный момент времени 7; поэтому их можно решить и получить К (0 и g (t) для любого te [/о, Т]. Если подставить уравнение (9.255) в (9.245), то можно выразить экстремальное управление как функцию от К (0 и g (0- Экстремальная траектория будет тогда решением уравнения (9.257), начинающимся из заданного начального состояния х (t0) = g. Теперь мы уверены в том, что оптимальное управление существует и что экстремальное управление единственно. Итак, можно сформулиро¬ вать следующий закон управления. Закон управления 9.5 (решение задачи слежения). Дана линейная наблюдаемая система х(/) = 4(/)х(0 + Я(0«(0; 1 694
Заданы желаемый выход z (/), ошибка е (/) = z (/) — у (/) и функ¬ ционал Л=-4-(в(П Fe(T)) + т + 4 J Qe(t)) + (u(t), R(t)u(t)]]dt, (9.267) где и (0 не ограничено, Т задано, R (/) — положительно определенна, a F и Q (t) — положительно полуопределенные матрицы. Оптимальное управление существует, единственно и равно и (0 = R1 (t) В' (0 [g- (0 - К (О х (/)]. (9.268) Действительная, симметричная, положительно определенная ма¬ трица К (/) размера п X п есть решение матричного дифференциального уравнения типа Риккати: К(0 = -К(0Л(0-Л'(0А’(0 + + К (О В (t) R1 (О В' (t) К (I) - С (О Q (t) С (0 (9.269) с граничным условием R(Т) = С'(T) FC(Т). (9.270) Вектор g (t) (из п компонент) есть решение линейного векторного дифферен¬ циального уравнения g (0 = - [A (t) - в (/) R1 (/) В' (0 К (0]' g (0 - С' (0 Q (/) z (0 (9.271) с граничным условием g(T) = C'(T)Fz(T). (9.272) Оптимальная траектория есть решение линейного дифференциального уравнения X (0 - [А (0 - В (0 R1 (0 В' (0 К (/)] X (0 + в (0 /г-1 (0 В' (I) g (0, (9.273) начинающееся из (известного) исходного состояния х(/0) = 1- Минималь¬ ное значение У3* стоимости J3 равно 7з* = 4 x(t)} + <p (0, (9.274) где ф (0 = —^l(z (0. Q (() Z (0) - {g (0. в (0 /?-’ (0 В’ (/) g(t))]; Ф(Т) = (г(Т), K(T)z(T)) и определена для любых х (t) и t £ [/0, Т]. Упражнение 9.11. Покажите, что предположения относительно R (t), Q (t) и F гаран¬ тируют, что экстремальное управление (9.268) дает (по крайней мере) локальный мини¬ мум J3. У к а з а н и е: см. уравнения (9.64)—(9.66). Упражнение 9.12. Получите уравнение (9.274) из уравнения Гамильтона—Якоби. Указание: см. теорему 9.1. Упражнение 9.13. Покажите, что оптимальное управление существует и что управ¬ ление и (0 (9.268) оптимально и единственно. Обсудим теперь некоторые выводы из закона управления 9.5. Во- первых, рассмотрим «матрицу усилений» R (t). Отметим, что уравнение Риккати (9.269) и граничные условия (9.270) не зависят от желаемого выхода z (/). Это означает, что «матрица усилений» К (t) полностью опре¬ деляется заданием системы, стоимости и конечного времени Т. Сравнение уравнений (9.269) и (9.270) с (9.183) и (9.184) (см. закон управления 9.3, 695
решение задачи о регуляторе выхода) обнаруживает их идентичность. Поэтому структура обратной связи оптимальной следящей системы та же самая, что и системы оптимального регулятора выхода. Этот факт стано¬ вится еще более очевидным при сравнении уравнений (9.273) и (9.185). В обоих уравнениях матрица системы [4 (/) — В (/) 7?”1 (/) В' (/) К (01 одна и та же. Таким образом, собственные значения замкнутой оптималь¬ ной следящей системы тождественны собственным значениям замкнутой оптимальной системы для регулятора выхода и не зависят от желаемого выхода z (/). Рискуя повториться, подчеркнем, что «матрица усилений» К (0 является функцией только матриц 4(/), В(0, С(0, F, (?(/), /?(0 и конечного времени Т. Основное отличие оптимальной следящей системы от оптимального регулятора выхода заключается в векторе g (t) [сравните уравнение (9.268) с (9.182)]. Вектор g (t) можно представлять себе вынуждающей функцией системы [см. уравнение (9.273) ] л (о = [4 (о - в (о /г1 (о в' (о к (оі л (t) + + B(t)R-1(t)Bf(t)g(t). (9.275) Таким образом, g (t) «стремится уравновесить» регулирующие «осо¬ бенности» системы. Рассмотрим теперь более детально дифференциальное уравнение относительно g (t): g(t) = - [А (0 - В (0 R1 (0 В' (0 К (0]' g (0 - — C'(0Q(0*(0- (9.276) Граничное условие при t = Т есть g (Т) = С' (T) Fz (Т). Прежде всего отметим, что система (9.276) является сопряженной по отношению к системе (9.275). Таким образом, если Ф (/, /0) — фундаментальная ма¬ трица системы (9.275), а Т (/, /0)— фундаментальная матрица системы (9 276), то WoWU) = /. (9.277) Другим следствием сопряженности является то, что собственные зна¬ чения матрицы —[4 (0—В (/) 7?"1 (/) В' (/) К (/)]' равны собственным значениям матрицы [4 (/) — В (/) У?’1 (0 В' (t) К (/)К с0 знаком ми¬ нус. Таким образом, динамическое поведение системы (9.275) также не зависит от желаемого выхода z (/). По этой причине желаемый выход z (/) можно представлять себе в виде возмущающей функции, производящей сигнал g (/) (9.276). Пусть Чг (/, /0) — фундаментальная матрица системы (9.276). Непо¬ средственно получим С'(T) Fz (t) = g (Т)— = Т(Т, t) т g (0 — J ^-1 (b 0 С’ (т) Q (т) z (т) гіт I (9.278) или для любого t Ç_ По, Т] т g (0 - T1 (T, t) g(T) + J Y-1 (т, t) c (t) Q (T) z (T) àx. (9.279) t Из последнего соотношения следует: для того чтобы вычислить g (Z), t Т*], мы должны знать z (т) для всего промежутка т £ It, Т]. 696
Иначе говоря, чтобы вычислить настоящее (текущее) значение g (/), мы должны знать будущие значения желаемого выхода z (t). Так как опти¬ мальное управление выражается уравнением я (0 = — fl-1 (О В (О Ю) х (0 - g (/)], (9.280) то это означает, что текущее значение оптимального управления зависит от будущих значений желаемого выхода. Здесь разочаровавшийся инженер может отказаться от идей опти¬ мального управления, поскольку оно требует знания будущего и в общем случае 1 нереализуемо. Тем не менее легко видеть, что оптимальное управ¬ ление 2 должно быть функцией будущих значений z (t). Дело в том, что оптимальное управление использует всю доступную информацию. Оче¬ видно, формулировка нашей задачи управления не включала требования реализуемости. Зададимся теперь вопросом: существует ли простой путь учета реа¬ лизуемости в математической формулировке оптимальной задачи? Положи¬ тельного ответа на поставленный вопрос дать нельзя. Для подтверждения этого обозначим через t настоящее, через [/0, 0—прошлое и через (t, Т] — будущее время. Настоящее управление и (t) может влиять только на будущую реакцию системы и, очевидно, не может изменить прошлого. Прошлое поведение системы подытожено в ее настоящем состоянии х (t). Так как настоящее состояние х (t) определяет часть будущего переходного процесса, настоящее управление и (t) должно быть функцией настоящего состояния X (t). Но действие этого управления и (t) должно минимизи¬ ровать будущие ошибки. Эти будущие ошибки зависят от последующих значений z (т), т Q (t, Т]. Таким образом, мы приходим к выводу, что настоящее оптимальное управление и (t) должно зависеть от z (т) для всех т Ç (/, Т]. Иначе говоря, если мы точно не знаем будущего, нельзя ждать, что в настоящем мы будем действовать строго оптимально. После уточнения этого обстоятельства можно двигаться дальше в двух направлениях. Можно или использовать предсказанное значение будущего желаемого выхода, или сформулировать задачу вероятностным образом (т. е. минимизировать функцию ожидаемой ошибки). Если исполь¬ зовать «наилучшие» детерминированные предположения, то оптимальная система будет настолько «хорошей», насколько «хороши» эти предполо¬ жения. Если, напротив, сформулировать стохастически детерминированную задачу, то получится система оптимальная «в среднем». Это не гаранти¬ рует, что в каждом отдельном эксперименте реакция системы будет удо¬ влетворительной. Смирившись с тем, что мы должны знать желаемый выход априори обсудим вычислительные аспекты определения К (0 и g (/). Так как матрица К (0 не зависит от z (t), ее можно вычислить заранее для любого t е Т]. Знание К (0 и z (0 позволит нам рассчитать g (t) назад во времени для любого t £ [/0, Т]. Мы можем или хранить 1 Есть, конечно, много случаев, когда будущие значения z (/) известны. Например, управление антенной для получения телеметрической информации со спутника Земли, который находился до этого на орбите достаточно долго для того, чтобы его орбита была измерена с высокой степенью точности. Известно, что спутник, появившись из-за горизонта в 4 ч. 13 м. утра, скроется в 4 ч. 27 м. Очевидно, что z (t) в этом случае известно и опти¬ мальная система для следящего радиолокатора реализуема. Антенна должна начать дви¬ гаться раньше 4 ч. 13 м. и двигаться в соответствии с траекторией спутника в момент его выхода из-за горизонта. 2 Дальнейшие утверждения применимы ко всем следящим системам, а не ограни¬ чиваются лишь системами, рассматриваемыми в данном параграфе. 697
g (0 на магнитной ленте, или вычислить начальное значение g(tQ) по формуле т g (zo) = 'ïr-1 (Т, to) С' (T) Fz (T) + J* 'F-1 (T, t0) c (?) Q (?) z (?) d?. (9.281) to Затем это вычисленное значение g (tQ) можно использовать в качестве начального условия системы (9.271) и получить решение g (0 «в пря¬ мом» времени. На рис. 9.17 показана динамическая система, производя- N g(t0) Рис. 9.17. Моделирование системы, вырабатывающей g (/). Предполагается, что g (/0) и К (/) вычислены заранее щая g* (0, если g(tQ) было вычислено заранее. На рис. 9.18 показана полная структурная схема оптимальной системы. Векторные каналы обрат¬ ной связи, охватывающие интеграторы, подчеркивают свойство сопряжен¬ ности двух динамических систем. нений (9.274) и (9.276). Матрица G (t) =А (t) — В (/) R"1 (Z) К (0. Считается, что g (/0) и К (t) рассчитаны заранее Поскольку преобразование (9.281) линейно, легко доказать следую¬ щую теорему. Теорема 9.2. Пусть ffp {to) = 'Г-1 {т, to) с ( T) Fz& (T) + T 4- J'F-1 (?, t0) c (?) Q (?) z& (?) d?, (9.282) to P= 1,2,...JV Если г(?) = S (?), ? C T], (9.283) p=i где Yp — любые постоянные числа, то начальное значение вектора g (/0), соответствующее сигналу Z[t0, rj, равно g{t0)= І y^{to). (9.284) 3=1 Доказательство. Теорема доказывается подстановкой соотношения (9.283) в уравнение (9.281) и использованием уравнения (9.282). 698
Из теоремы следует: предположим, нам известно, что желаемые выходные сигналы z (/) всегда являются линейными комбинациями известных сигналов z$ (t). В этом случае можно заранее рассчитать на¬ чальные значения векторов g$ (t) и получить g (/0) с помощью уравне¬ ния (9.283) при условии отсутствия проблемы устойчивости. В следующем параграфе обсудим некоторые приблизительные соотно¬ шения для инвариантных во времени систем при неограниченном возраста¬ нии конечного времени Т. Выполнив следующие упражнения, можно получить некоторые до¬ полнительные теоретические результаты. Упражнение 9.14. Рассмотрите линейную наблюдаемую систему X (0 = A (Z) X (/) + В (t) и (/) + ш (/); f9 285) где со (0 — известный возмущающий вектор. Пусть z (/) — желаемый выход, е (/) = z (0 — у (t). Рассмотрите функционал J3 [уравнение (9.267)]. Покажите, что оптимально управление и (t) = /Г1 (0 В' (0 [h (0 — К (О X (/)], (9.286) где К (0 — решение уравнения Риккати (9.269) с граничным условием (9.270), а век¬ тор h (t) — решение линейного дифференциального уравнения h (0 = - [A (t) - В (t) /Г1 (/) В (t) К (01 ' h (0 - — С' (0 Q (t) Z(t)+K (0 (û (0 (9.287) с граничным условием h (t) = С' (T) Q (T) z (T). (9.288) Из уравнения Гамильтона—Якоби найдите минимальную стоимость. Предположите теперь, что z (t) = 0 при любом t £ [f0, 7]. Можно ли получить h (t), не зная возмуще¬ ния со (0 на всем интервале т g [0 Г]? Упражнение 9.15. Рассмотрите линейную наблюдаемую систему X (0 = А (/) X (t) + В (0 и (0 + со (0; I (9 289) У (0 = С (/) X (0 + D (0 и (0 ч- v (Q, J где to (0 и V (t) — известные возмущающие векторы. Пусть z (t) — желаемый выход; е (0 = z (0 — у (0 и функционал J3 (9.267). Най¬ дите оптимальное управление и уравнение минимальной стоимости. 9.10. ПРИБЛИЖЕННЫЕ СООТНОШЕНИЯ ДЛЯ СИСТЕМ, ИНВАРИАНТНЫХ ВО ВРЕМЕНИ В этом параграфе мы рассмотрим задачу слежения для линейных инвариантных во времени систем, для случая, когда желаемый выход — постоянный вектор, а время неограниченно возрастает. Все результаты будут приближенными и справедливыми лишь для очень больших значе¬ ний конечного времени Т. К сожалению, на данный момент времени нет теории, рассматривающей предельный случай Т = оо. Рассмотрим наблюдаемую и управляемую линейную инвариантную во времени систему і(0-4х(0 + в«(0; 1 ,qwm = I (9290) Пусть z — постоянный вектор, представляющий собой желаемый выход, и поэтому ошибка равна е (t) = z — у (0 = z — Сх (/). (9.291). 699
Рассмотрим функционал т h = 4-J + <» (0. Ru(t))\dt, (9.292) полагая, что постоянные матрицы Q и /? положительно определенны. Очевидно, что если Т задано и конечно, то для решения этой задачи можно воспользоваться законом управления 9.5. Известно \ что при Т —> оо «матрица усилений» К (/) уравнения Риккати (9.269) стремится к постоянной положительно определенной матрице К. Напомним, что эта матрица К является положительно опре¬ деленным решением матричного алгебраического уравнения — КА — А 'К + KBR-lB'k— C'QC = 0. (9 .293) Пусть время Т велико, но конечно. Пусть Тг и Т2 — два других очень больших значения времени, причем 0 < 7\ < Т2 < Т <3 оо. (9.294) Представим матрицу К в виде решения уравнения (9.269), получаемого при решении уравнения Риккати в «обратном» времени. Так как Т2 < Т, аппроксимируем матрицу К (/) матрицей К для всех t £ [0, Т21: К(Ъ~к\ ' С [0, Т2]. (9.295) Используя эту аппроксимацию и закон управления 9.5, из уравне¬ ния (9.273) найдем X (/) ~ (Л — BR-'B'k) X (/) + BR ^B'g (t), t С [0, Г2], (9.296) а из уравнения (9.271) получим g (/) ~ (Л — BR^B K}' X (/) — C'Qz, t 6 [0, ЛЬ (9.297) Обозначим через О, 5 и IV матрицы G = А — BR^BK, S = BR1B,\ W = CQ. (9.298) Тогда уравнения (9.296) и (9.297) можно записать: X (0 ~ Gx (/) + Sg (/); t е [0, Т2]; (9.299) g(/)^-G'gr(/)-lVz; /ЕЮ, Т2]. (9.300) Известно (см. закон управления 9.4), что собственные значения G имеют отрицательные вещественные части. Поэтому собственные значе¬ ния — G' имеют положительные вещественные части. Следовательно, система (9.300) неустойчива. Тем не менее, поскольку F = 0 (J3 не содер¬ жит стоимости конечного состояния) то и g (Т) = 0, и вектор т g(T2) = J Y-1 (т, Т2) C’Qz(9.301) Tz конечен. 1 По закону управления 9.4 в § 9.7. 700
Для приближенной системы (9.300) фундаментальная матрица равна е-в' и поэтому имеем Т'2 g (t) — J е°'(т—° Wz dï, g (T2) e~~G'{Tz~t} t C [0, T2], или, эквивалентно, T’2 * g(t)^ea"r‘e-°’tg(T2) + J eG' «-"Wzdx, (9.302) (9.303) Т2 J е°' ^~^Wzdx = і t (- [0, П]. Так как желаемый выход z — постоянный вектор, находим т2 \ J eG'T dr I е~°ч Wz = t / = _ (G'yWz -h (G'Y^G'T>e-G,tWz. (9.304) При выводе уравнения (9.304) мы воспользовались следующими поло¬ жениями: 1. Обратная матрица (О')”1 существует, потому что все собственные значения О' имеют отрицательные вещественные части. 2 Рис. 9.19. Структура близкой к оптимальной инвариантной во времени системы для случая, когда желаемым выходом является постоянный вектор z. Матрица G — А —BR~lBfK 2. Свойством коммутативности матриц (О')-1 и е°' (докажите, что эти матрицы обладают свойством коммутативности). Подставим теперь уравнение (9.304) в (9.303), тогда получим g(t) ~ - (О')-1 Wz + е°'т* [(О')-1е“°'' Wz + e-G,tg(T2)\ (9.305) при любом t Ç 10; Т2]. Выберем Тг таким, чтобы 0 « 7\ « Т2 (9.306) и t С [0, Л]. (9.307) Так как собственные значения О' имеют отрицательные действитель¬ ные части, то ^'7^0 (9.308) и g(0^-(O')-1^-i, te [0, TJ. (9.309) Из уравнения (9.309) следует, что g (/) g, т. е. при малых t век¬ тор g (t) приблизительно постоянен. Эти аппроксимации тем лучше, чем 701
больше значения Т, Т2 и 7\. Строгой теории для предельного случая Т — со в настоящее время нет. Однако указанным аппроксимациям можно вполне доверять, если конечное время достаточно велико. На рис. 9.19 показана структура полученной следящей системы при принятых допу¬ щениях. 9.11. ЗАДАЧИ СЛЕЖЕНИЯ, СВОДИМЫЕ К ЗАДАЧАМ О РЕГУЛЯТОРЕ ВЫХОДА В § 9.10 указано, что предельный случай Т = ос в литературе строго еще не рассмотрен. Напомним, однако, что предельный случай хорошо исследован как для задачи об оптимальном регуляторе состояния, так и для задачи об оптимальном регуляторе выхода. Возникает вопрос: существуют ли задачи слежения, эквивалентные задачам о регуляторе выхода? Ответ на этот вопрос можно дать положительный. В данном параграфе сформулируем необходимые условия относительно желаемого выхода, выполнение которых позволит нам преобразовать задачу слежения в задачу о регуляторе выхода. Изложим основные идеи применительно к системе с одним входом и одним выходом. Обозначим через L (D) дифференциальный оператор: L (D) = [Dn -р + • • • + aiD + #o}; D = (9.310) Пусть у (/) — скалярный выход, а и (t) — скалярный вход системы, описываемой соотношением L (D)y(t) = u(t). (9.311) Пусть г (/) — желаемый выход и е(/) = г(0 -y(t) (9.312) — ошибка. Задача об оптимальном слежении состоит в отыскании управ¬ ления, минимизирующего стоимость J3, заданную как J3 = [qe2(t) + ru2(i)] di, ?>0,r>0. (9.313) Теорию § 9.9 нельзя использовать для решения этой задачи. Попы¬ таемся найти условия для г (/), которые достаточны, чтобы гарантировать возможность решения задачи. Это можно сделать, преобразовав задачу слежения в задачу о регуляторе выхода. Чтобы получить дополнительные условия для z (/), применим опе¬ ратор L (D) к обеим частям уравнения (9.312), тогда получим L (D) e(t) — L (D) [z (/) - у (/)] = L (D) z (/) - L (£>) у (/). Пусть функция z (/) дифференцируема (по крайней мере) п раз и удовлетворяет уравнению L(D)z(t)={D- + an_1D^+ ... + a,D + aQ} z(t) = 0. (9.314) Из уравнений (9.311) и (9.314) получим L(D)e(t) =— u(t) для любого /. (9.315) Последнее уравнение можно рассматривать как связь между входом и выходом линейной инвариантной во времени системы с «входом» и (t) и «выходом» е (/). Так как система (9.315) управляема и наблюдаема (почему?), то можно, воспользовавшись законом управления 9.4, найти 702
управление, минимизирующее стоимость J3 (9.313). Итак, если опре¬ делить фазовые координаты (/), положив (/) = D^e (/), i = 1, 2, . . ., nt то систему (9.315) можно привести к виду, соответствующему закону управления 9.4. Таким образом, оптимальное управление будет линейной комбинацией ошибки и ее (п — 1) производной по времени. Приведем два примера, иллюстрирующих эти идеи. В каждом случае задача слежения сводима к задаче о регуляторе выхода, потому что z (t) удовлетворяет уравнению (9.314). Пример 9.7. Предположим, что система (9.311) имеет вид у (t) + Зу (t) + 2у (0 — u(t). (9.316) Тогда сигнал z (/) определяется уравнением Z (t) = сце-* + а2е“2' (9.317) (где «і и а2 — произвольные постоянные), причем L (D) z (0 = г (/) + 3z (t) + 2z (Z) = 0 (9.318) для любого t. Пример 9.8. Пусть система (9.311) имеет вид dn (9.319) тогда сигнал г (t) определяется уравнением z (0 = а0 + oj/ + а2/2 + • • • + ап.!/”’1), (9.320) где аь а2, . . ., «п.1 — произвольные постоянные, причем dn L(D)z(t)=-^z{t) =0 (9.321) для любого t. Следующие упражнения иллюстрируют различные аспекты оптималь¬ ных задач слежения. Упражнение 9.16. Объясните результаты этого параграфа при помощи понятий, основанных на передаточной функции системы. Каков физический смысл уравнения (9.314)? Упражнение 9.17. Пусть L (D) и М (£>) —линейные инвариантные во времени диф¬ ференциальные операторы (т < п): L (D) = [Dn + an^D^ Н + axD + а0}; (9.322) М (D) = {bmD™ + H 1- + М- (9-323) Рассмотрите линейную управляемую и наблюдаемую систему L (D) у (Z) = М (£>) и (/). (9.324) Пусть z (t) — желаемый выход и е (t) = г (t) — у (0. Определите нетривиальные достаточные условия для z (t), при которых минимизация стоимости (9.313) может быть выполнена при помощи теории систем регулирования выхода. Упражнение 9.18. Данное упражнение требует использования ЦВМ. Рассмотрите си¬ стему *і(0 = *2(0; (0) = 0; і2(/) ==-х1(0 + и(0; х2 (0) = 0; и z (f) = z = const; t £ [0, T]; e (/) — z — y (t). Необходимо минимизировать стоимость т h = -j- fe2 (T) + -b J [e2 (t) + ru2 (/)] dt. (9.325) (9.326) Пользуясь законом управления 9.5, определите оптимальное управление. Обозначим через kn (/), /?12 (/) и k22 (t) элементы матрицы усилений К (/) размера 2X2, а через (/) и §2 (0 — компоненты вектора g (t). 703
Задано: а) f — 0; г = 0,1 ; z — 1. Начертите графики е (/), /?п (/), /?12 (0, /?2з (0, Si (0» Si (О в зависимости от t для Т — 1; 2; 5; 10 и 20; б) f — 0; z = 1; Т — 2. Повторите пункт а) для г — 10; 1; 0,1; 0,02 и 0,001; в) г — 0,1; z — 1; Т — 2. Повторите пункт а) для f — 0; 1; 5; 10; 50 и 100; г) можете ли вы найти такое z (/), для которого задача слежения сводится к задаче о регуляторе? Является ли таковым z (t} — z? Упражнение 9.19. Повторите упражнение (9.18), заменив систему (9.325) системой *і(0 ==х2(/); х'г (0) == 0; х2 (/) = х. (/) 4- и (/); х2 (0) = 0; é/(0 (0- (9.327) 9.12. АНАЛИЗ СЛЕДЯЩЕЙ СИСТЕМЫ ПЕРВОГО ПОРЯДКА В § 9.6 мы привели некоторые переходные процессы для регулятора, описываемого дифференциальным уравнением первого порядка. В этом параграфе приведем вычисленные переходные процессы для следящей системы (первого порядка), иллюстрирующие некоторые из свойств опти¬ мальных следящих систем. Рассмотрим ту же систему, что и в § 9.6: Л- (/) = ах (0 + и I z/(Z) = x(O. J Желаемый выход равен z(t), ошибка равна е (t) = г (t) — у (і) — = Z (0 — X (t). Стоимость выражается функционалом j3=4 (л+4 J +ru2 dt’ <9-329> 0 где f 0; q > 0; r > 0. (9.330) Используя закон управления 9.5, находим, что оптимальное управле¬ ние равно 4^ = -^{g^-k(t>)x{t)}. (9.331) Скаляр k (/) является решением уравнения Риккати первого порядка: k(t) = — 2ak(t) — q (9.332) с граничным условием k(T) = f. (9.333) Скаляр g (/) является решением линейного уравнения первого порядка: = (9.334) с граничным условием g(T) = fz(T). (9.335) На рис. 9.20, а показана реакция оптимальной системы на скачок на входе. При расчете г было выбрано в качестве параметра; а = —1 (устой¬ чивый случай), X (0) = 0; f ~ 0; q = 1; Т = 1 и г (/) — +1 для всех t из [0, 1]. Мы видим, что система лучше отслеживает скачок при умень¬ шении г. Отметим также, что в конце интервала управления ошибка начи¬ нает увеличиваться. Такое поведение вызвано тем, что f = 0. Так как / = 0, g (Т) = & (Т) =■= 0, и поэтому и (Т) = 0. Поскольку с ростом t упра¬ вление убывает, а система устойчива, состояние начинает стремиться к 0. 704
На рис. 9.20, б показано поведение g (Z); t Ç [0, 1]. Отметим, что с уменьшением г, g (/) остается почти постоянной в начале интервала управления, а затем убывает до нуля (так как / = 0). Мы не приводим графиков k (Z), потому что k (t) не зависит от z (t) и его поведение было приведено на рис. 9.10, б. На рис. 9.20, в показано, как ведет себя оптимальное управление. Заметим, что и (t) убывает до нуля. Этим определяется увеличение ошибки при /, близком к Т (см. рис. 9.20, а). На рис. 9.21, а, б и в показаны переходные процессы оптимальной системы при а = 0 («чистый» интегратор); х (0) = 0; f = 0; Т = 1; g = 1; z (t) ~ 1; t Q 10, Т]. Заметим, что увеличения ошибки при t —* Т Рис. 9.20. а) Реакция оптимальной системы при а = —1 (устойчивый случай) и z (/) = 1; б) функция g (t) при а = —1 и z (t) = 1; в) оптимальное управление при а — —1 и г (0 = 1 не наблюдается, хотя оптимальное управление и убывает до нуля. Это происходит благодаря интегрирующим свойствам системы. На рис. 9.22, а, б и в показаны переходные процессы оптимальной системы при а = +1 (неустойчивый случай); х (0) = 0; / = 0; q = 1; Т = 1 и г (t) = +1; t Ç [0, Т]. Так как система неустойчива, то выход превосходит желаемый выход при /, близких к Т (почему?). Отметим также, что при г = 0,01 оптимальное управление и (t) меняет знак для того, чтобы противодействовать неустойчивости системы. Благодаря этому ошибка остается малой. Рис. 9.23, а иллюстрирует противоречивую природу оптимальной системы. Мы вычислили переходные процессы для а = 0; f = 0; <7=1 и Т = 5. Желаемый выход равен (0 0 </<2,5; ] Z(z) U 2,5 </<5,0. } (9.336) Исходное состояние х (0) = 1. При г = 0,01 на временном интервале [0; 1,5] система работает как обычный стабилизатор. Однако система «знает», что при t — 2,5 «придет» ступенька, и поэтому начиная примерно с / = 2, выход возрастает. Таким образом, с момента прихода импульса (/ > 2,5) ошибка оказывается малой. При г = 1 происходит то же самое. На рис. 9.23, б показано поведение g (t) для z (/), определяемого уравне¬ нием (9.336). На рис. 9.24 показана реакция оптимальной системы для случая, когда желаемый выход г (/) — синусоидальный сигнал. Реакция рассчиты¬ валась для значений а = 0; f = 0; q = 1; х (0) = 1 и Т = 5, где z (/) было принято равным z(t) = 2 sin (4/); t [0; 5]. (9.337) 705
Рис. 9.21. а) Реакция оптимальной системы при а — 0 (для интегратора) и г (/) = 1; б) функция g (/) при а = 0 и г (/) — 1; в) оптимальное управление при а = 0 и г (I) — 1 Рис. 9.22. а) Реакция оптимальной системы при а = +1 (неустойчивый случай) иг(/) = 1; б) функция g (t) при а — +1 и г (/) = 1 ; в) оптимальное управление при а = +1 и г (/) = 1 Рис. 9.23. а) Реакция оптимальной системы при а = 0 и z (/), пред¬ ставляющем собой задержанный единичный скачок б) функция g (t) при а = 0 и z (/), представляющем собой задержанный единичный скачок 706
Для малых значений г после начального переходного участка выход си¬ нусоидален и заметный фазовый сдвиг отсутствует. С ростом г система ведет себя как стабилизатор «среднего» уровня, теряя способность отсле¬ живать входной сигнал. а = 0,х(0) = 1, q=1, Т = 5 Рис. 9.24. Реакция оптимальной системы при а = 0 и z (t) = 2 sin (4/) На рис. 9.25 показаны ошибка е (t), оптимальное управление и (/) и функция g (t) для а = —1; х (0) = 0; / = 0; q = 1; г = 0,1; Т = 10 и ?(/) = ?= 1,0; / £ [0; 10]. (9.338) Используем результаты, приведенные на рис. 9.25, для проверки соот¬ ношений, полученных в § 9.10. Заметим, что на квазипостоянном участке и (/)^ 0,91; е (0^0,09; g(0^0,31. (9.339) Так как Т = 10 велико, находим, что k (t) = fe, где k — положительное реше¬ ние алгебраического уравнения (при г = = 0,1; а — —1; q = 1), т. е. ю£2 + 2£ — 1 - 0, (9.340) откуда k = 0,23. (9.341) Матрицы G, S и W [уравнение (9.298)] представляют собой скалярные величины, Рис. 9.25. Иллюстрация квазипо¬ стоянных величин при а — — 1 и г (/) = +1, t Ç [0, 10] равные 6 = —1—10* = —3,3; 5 - 10; (9.342) ѴѴ=1. Из уравнения (9.309) следует, что g (t) —(G')~1Wz> для данной задачи и g(0~ — (—3,3)-! X 1 X 1 = 0,315. поэтому (9.343) Это приближенное значение g (t) согласуется с данными рис. 9.25 и уравнением (9.339). 707
Если принять, что Т неограниченно возрастает, то и «квазипостоян¬ ный» интервал, показанный на рис. 9.25, будет неограниченно возрастать. Так как и и (/), и е (t) на этом интервале постоянны и не равны нулю, то легко видеть, что lim J3* = сю, и поэтому, строго говоря, оптимального 00 решения не существует. Закончим этот параграф замечанием о «взвешивании» ошибки в за¬ висимости от управления. В общем случае для того, чтобы получить хорошую следящую систему, ошибку следует оценивать раз в 50—100 «дороже», чем управление. Такой метод проб играет важную роль в прак¬ тике и, без сомнения, будет развит дальше по мере накапливания опыта в отношении поведения оптимальных систем. 9.13. НЕКОТОРЫЕ ЗАМЕЧАНИЯ Поскольку оптимальная система с обратной связью линейна, то теория и выводы предыдущих параграфов этой главы математически изящны и практически весьма полезны. В этом параграфе прокомментируем неко¬ торые дополнительные результаты, которые можно найти в литературе. Рассмотрим системы регулирования с одним входом и одним выходом, которые мы изучали в § 9.8. Проектирование корректирующих устройств (последовательных или параллельных) было основной задачей обычной теории регулирования. Проектирование исполнительных устройств осно¬ вывалось на переходном процессе и частотных характеристиках замкнутой системы. Возникает естественный вопрос, можно ли перевести свойства оптимальной инвариантной во времени системы с обратной связью на «язык» частотных характеристик. Работа [114] содержит строгое изложение частотных свойств линей¬ ной системы, оптимальной по отношению к некоторой квадратичной функции стоимости. В ней рассматривается так называемая «обратная» задача»1 и, в частности, показано, что традиционный критерий «качества» (а именно, максимальное перерегулирование, высокий коэффициент уси¬ ления и плоская частотная характеристика) соответствует свойствам оптимального регулятора выхода. Прежде чем приобрел популярность подход к системам с точки зрения пространства состояний, оптимальные системы проектировались при помощи преобразований Лапласа и Фурье. Преобразование из временной области в частотную можно произвести при помощи теоремы Парсеваля. Эта точка зрения изложена в гл. 2 работы [172] и в гл. 2 работы [42]. К сожалению, в настоящее время нет работ, содержащих строгое изложе¬ ние этого вопроса и имеющих ценность как с методологической, так и с вычислительной точек зрения. В работе [163] рассматривается проектирование оптимальных линей¬ ных систем методами динамического программирования. В ней содержатся примеры применения теории к нетривиальным практическим задачам. Сконцентрируем теперь внимание на ослаблении некоторых из пред¬ положений, которые мы сделали на протяжении настоящей главы. Рас¬ смотрим, например, линейную инвариантную во времени систему л:(/) - Ллг(') 4- Bu(t) (9.344) и функционал т А = -И + («('), Ru(t))]dt. (9.345) о 1 Обратная задача состоите следующем: заданы система и закон управления; требуется установить, какой функционал минимизируется. 708
Одним из предположений было то, что матрица /? является положительно определенной. Допустим, что в уравнении (9.345) мы приняли 7? = 0 (9.346) и требуем, чтобы матрица Q была положительно определенной. Если /? = 0, мы не «штрафуем» систему за расходование управляющей энер¬ гии. Оптимальное управление в этом случае будет пытаться перевести состояние системы в нуль как можно быстрее. Поскольку никаких огра¬ ничений на величину и (0 мы не накладываем, оптимальное управление оказывается импульсным. Импульсный характер управления «порожден» тем, что математическая постановка задачи не учитывает реальных огра¬ ничений управления. Чтобы показать это, запишем гамильтониан Н для системы (9.344) и стоимости (9.345) при R = 0: H = ÿ(x(Z), Qx(t)) + (Ax(t),p(t)) + (Ba(t),p(t)). (9.347) Так как гамильтониан И линеен относительно и (t) и и (t) не огра¬ ничено, легко видеть, что минимум Н достигается при и (t) —* ±сю (если р (Z) 4= 0). Очевидно, что для получения разумного практического реше¬ ния мы должны наложить ограничения на компоненты управляющего вектора. Если сформулировать задачу с ограничениями величины управления, то решения уже не будут простыми и линейными (даже при R ч= 0). В таких задачах оптимальное управление оказывается или строго непре¬ рывным (с интервалами, в течение которых некоторые из управляющих переменных постоянны), или кусочно-постоянным. Очень часто оптимальное управление оказывается вырожденным. В работе [211] рассматривается система лг(/) = Ллг(О -г bu (/), (9.348) где (скалярное) управление ограничено по величине \и (/)| <т и мини- т мизируется функционал вида у j Qx (/)) dt. В работе приводятся условия для A, Q и &, при выполнении которых оптимальное управление вырождено. В остальных случаях оптимальное управление релейно. В заключение мы хотим подчеркнуть, что любое нарушение предполо¬ жений, сделанных в этой главе [в особенности неограниченности и (/)], приводит в общем случае к более сложному решению и к системе с нели¬ нейной обратной связью. 23 2025
ГЛАВА 10 ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ ПРИ ОГРАНИЧЕНИИ УПРАВЛЕНИЯ ГИПЕРСФЕРОЙ 10.1. ВВЕДЕНИЕ В гл. 9 мы рассматривали оптимальное управление линейными си¬ стемами по квадратичным функционалам и вывели аналитические выра¬ жения для оптимального управления в предположении, что управление не ограничено по величине. В этой главе получим аналитические выраже¬ ния оптимального управления для одного класса нелинейных систем и разнообразных критериев в предположении, что управление ограничено по величине. На протяжении всей главы будем предполагать, что вектор управле¬ ния и (/) ограничен гиперсферой. Иначе говоря, будем считать, что ком¬ поненты (Z), и2 (f), . . ., иг (/) вектора управления и (/) ограничены соотношением II# (ОН = (0 + • • • + иг (0 < tn для любого t. Цель настоящей главы состоит в том, чтобы: 1. Проиллюстрировать минимизацию гамильтониана при ограниче¬ ниях управления вида || и (t) || < т, 2. Показать, что оптимальные управления можно найти при помощи стандартных методов функционального анализа (таких как неравенство Шварца), не прибегая к принципу минимума. 3. Продемонстрировать на конкретных примерах ценность теории оптимального управления на стадии предварительного проектирования. Рассмотрим теперь краткое содержание главы. В §10.2 кратко обсудим физические и математические следствия ограничения [| и (t) || </п. В § 10.3 сформулируем задачу об оптимальном управлении и покажем, что при ограничении || и (t) || < т получается оптимальное управле¬ ние а* (/), компоненты и* (t), и* (Z), . . ., и? (/) которого оказываются непрерывными, а не кусочно-непрерывными функциями времени. В § 10.4 для одного класса нелинейных систем выведем очень про¬ стое выражение для оптимального управления. В § 10.5 обсудим пред¬ положения и методику, использованные в § 10.4. В § 10.6 рассмотрим оптимальное управление классом систем, назы¬ ваемых системами с инвариантной нормой, по отношению к различным критериям. Для каждого из критериев оптимальное управление опреде¬ ляется при помощи неравенства Шварца. 716
В § 10.7 результаты § 7.7, 7.9 и 10.6 используем для того, чтобы показать ценность теории оптимального управления на стадии предвари¬ тельного проектирования системы. Рассмотрим оптимальное по быстро¬ действию управление скоростью вращающегося тела. Основные ограниче¬ ния (скорость расхода топлива и свобода выбора места расположения реактивных двигателей) образуют три области ограничений, наклады¬ ваемых на управляющий вектор. Мы вычислим переходные процессы в си¬ стеме для каждой из областей ограничений и сделаем интересные выводы, которые могут оказаться полезными проектировщику систем управления. Завершает главу § 10.8, который содержит некоторые замечания и рекомендации по дальнейшему изучению литературы в области оптималь¬ ного управления. Хотим предостеречь читателя, что класс систем, рассматриваемых в настоящей главе, является весьма специальным, и поэтому примени¬ мость полученных результатов ограничена. Однако способы, которые мы опишем, интересны, так как они показывают, что инженер, проектиру¬ ющий системы управления, должен учитывать возможность существования «прямых методов» решения данной задачи, которые можно использовать вместо или в сочетании с необходимыми условиями принципа минимума. 10.2. ОБСУЖДЕНИЕ ОГРАНИЧЕНИЯ || и (t) || < т Во всех рассмотренных нами задачах об оптимальном управлении по быстродействию и по минимуму расхода топлива мы считали компо¬ ненты (/), и2 (/), . . ., ur (t) управляющего вектора и (t) ограниченными по величине: I < tn, j = 1, 2, . . . г. (Ю-1) Из этих ограничений величины управляющего вектора вытекает: 1) управляющий вектор должен принадлежать гиперкубу в г-мерном пространстве. 2) каждая компонента управляющего вектора независима от всех остальных. Например, тот факт, что в некоторый момент времени (/) = = +т не оказывает никакого влияния на величины остальных компо¬ нент и2 (/), . . ., ur (t), которые могут иметь любое значение, совмести¬ мое с уравнением (10.1). Предположим теперь, что компоненты управляющего вектора и (I) ограничены по величине соотношением V + = Il U (О II < т. (10.2) Норма К и (t) II есть эвклидова длина вектора и (t). Из этого ограни¬ чения следует: 1) управляющий вектор должен принадлежать гиперсфере (радиуса т) в г-мерном пространстве; 2) компоненты управляющего вектора оказываются зависимыми. Например, если в некоторый момент времени t' имеет (t') = m, то ^2 (О “з (f) =• • • = ur (f ) = 0. Ограничение || и (t) || возникает довольно часто в том случае, когда управляющий вектор и (t) представляет собой силу тяги реактив¬ ного двигателя, поворачиваемого в пространстве. Очень часто такое огра¬ ничение может быть искусственным и использоваться вместо ограниче¬ ния |и;(0| < т. В этом случае гиперкуб аппроксимируют вписанной в него гиперсферой. Очевидно, что если ||а(01| < то и все компо¬ ненты Uj (t) вектора и (/) автоматически удовлетворяют ограничению I Uj (Z) I < т. 711
В этой главе мы увидим, что замена ограничений по гиперкубу огра¬ ничениями по гиперсфере приводит к решениям, которые являются «глад¬ кими». Например, законы управления, оптимального по быстродействию и по минимуму расхода топлива, не определяются в этом случае с помощью линий переключения. 10.3. ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ ОПТИМАЛЬНОМ ПО БЫСТРОДЕЙСТВИЮ В этом параграфе сформулируем задачу об оптимальном быстродей¬ ствии при ограничении || и (/) || < т таким образом, чтобы читатель смог получить представление о структуре управляющего устройства для такого рода ограничений. Рассмотрим следующую задачу: Дана система *(0 = g[x(0, + (10.3) в которой управление ограничено соотношением II и (/)II < tn для любого t. (10.4) Задан начальный момент времени /0 и исходное состояние х (/0)- Найти управление, переводящее систему (10.3) в начало координат X = 0 за минимально возможное время. Начнем с использования принципа минимума. Гамильтониан данной задачи выражается уравнением //-І + ШО. t], р(П)-Ь(В(0«(0, Р(0Г (10.5) Дополнительный вектор р (t) является решением системы дифферен¬ циальных уравнений = ~та = - L p‘{t) dXi(t) ’ (10-6> /=1 где i = 1, 2, . . ., n. Пусть p* (/) — решение уравнения (10.6), соответ¬ ствующее оптимальной траектории х* (/) и оптимальному управлению и* (0, И и* (011 < По принципу минимума необходимо, чтобы H\x*(t\ p*(t),u*(t), /] </7 [дг* (/), р*(0, »(0, П, (10.7) откуда 1 + {g [аг* (0, И, Р* (0) + {В (0 а* (0, Р* (0) < <i + <ff[**(0, 0, p*0 + (fi(0»(0,p*(0). (10.8) Из последнего неравенства получим соотношение (»*(0, B'(t)p*(t)) <(#(/), В'(ОР*(О). (10.9) Уравнение (10.9) означает, что независимо от p* (t) оптимальное по быстродействию управление должно минимизировать скалярное про¬ изведение <»*(/), В'(0р*(0> (10.10) Оптимальное по быстродействию управление должно быть равно й*(0 = -^||д?(2)рУ/))|| » если ||5'(0р*(0Н 0. (10.11) Если, однако, 115'(0 р* (011 = 0, (10.12) 712
то В' (/) р* (/) = 0, и уравнение (10.9) справедливо при всех и (/)• Это — известный вырожденный случай, и поэтому, если выполняется условие (10.12), то никакой информации относительно а* (/) из уравнения (10.9) получить нельзя. На рис. 10.1 показана геометрическая интерпретация уравнения (10.11) . Пусть при t = /і n-мерный вектор р* (ZJ =# 0 и В' (/) =у= 0. Матрица В' (/J =/= 0 соответствует линейному преобразованию п-мерного пространства дополнительного вектора в г-мерное пространство перемен¬ ных управления. Таким образом, вектор р* (/J преобразуется в вектор В' (/і) р* (/J. Для минимизации скалярного произведения {и (ZJ, В' (^і) р* (ZJ) вектор а* (/J должен быть направлен противоположно вектору В' (/J р* (tj) и ||д* (^і)||= т. Такое же положение имеет место в любой момент вре¬ мени t. Итак, из уравнения (10.11) следует, что опти¬ мальное по быстродей¬ ствию управление должно быть направлено противо¬ положно вектору В'(/)р*(0 и иметь максимально воз¬ можную величину, т. е. II а* (/)|| - т. Если подставить уравнение (10.11) в (10.3) (опустив для удобства зна¬ чок *), то получим xOT-gixm. іі-гівд . (ю.із> быть возможно больше по величине, откуда Уравнения (10.13) и (10.6) являются каноническими уравнениями для данной задачи. Для конкретной системы мы можем решить канонические уравнения и найти оптимальное управление при условии, что оно суще¬ ствует и единственно. Очень важной особенностью оптимального управления тВ' (*)Р* ’ \\В' (Op*(/)|| является непрерывность по времени его компонент и* (/), и* (t), . . ., . . ., ur* (t). Это непосредственно следует из непрерывности р* (t) (по¬ чему?) и В' (t). Данное свойство прямо противоположно кусочной по¬ стоянности компонент оптимального по быстродействию управляющего вектора в случае ограничения его гиперкубом х. Если к* (/) — непре¬ рывная векторная функция, то и х* (/) также непрерывна. Это означает, что оптимальная по быстродействию траектория не имеет «углов», и поэтому не следует ожидать в фазовом пространстве никаких линий «переклю¬ чения». Оптимальное по быстродействию управление оказывается нели¬ нейной, но «гладкой» функцией от состояния системы. Далее на конкретном примере проиллюстрируем все эти понятия, а также вычислительные трудности, которые могут возникнуть. Пример 10.1. Рассмотрим оптимальное по быстродействию управление системой X] <0 — 1 о" X] (t) -F ’1 1’ «1 (0 _Х2 (О, 0 —2_ _х2 _0 L >2 (0. (10.14) 1 См. теорему 6.2. 23 Атанс и др. 713
с ограничением V(t) + «| (О sgi. (10.15) Предположим, что (|х, §2) — начальное и (0, 0) — конечное состояния. Гамильтониан для этой задачи равен Н = 1 - X. (0 Р1 (П - 2х2 (0 р2 (t) + [ux (Z) + и2 (OJ Рі (0 + и2 (/) р2 (0. (10.16) Управление, минимизирующее гамильтониан, выражается уравнением и (0 = '1 0‘ _1 1 Рх (01 _Рг (ОJ 1 1 0‘ _1 1 Рх (Oil .Рг (О-!! (10.17) Выполнив указанные операции, найдем и Р1(/) ui (О — — ■ "1 * V Pl (t) + [р, (О + Р2(()]2 и (Z) = — Рі(О+Рг(О Р\ (О 4~ (О —н х?2 (^)]2 (10.18) Дополнительные переменные являются решениями дифференциальных уравнений ₽1(Z) = -^ÏÏÏ=₽1 ₽2(/) = -лі77) = 2₽2 (10.19) Обозначим через и л2 (неизвестные) начальные значения дополнительных перемен¬ ных, соответствующие исходному состоянию (gx, £2). Решения уравнений (10.19) тогда за- пишутся: Pj «) = ліе'; 1 (10.20) р2 (Z) = л2е ‘ ■ J Подставим уравнения (10.20) и (10.18) в систему (10.14). Поскольку уравнения ли¬ нейны, то, проинтегрировав их, получим, что хг (t) и х2 (t) определяются уравнениями (t g, - Г ег 2jIlgX + J ]/ 2Л|в2т 4- л^е4т 2л1л/3т о (10.21) (10.22) где и ?2 — начальные значения переменных состояния (фазовых координат) при t — 0. Пусть /* — минимальное время, требующееся для перевода исходного состояния (£х, |2) в (0, 0). Подставим %i(/*) = х2(Г) = 0; (10.23) в уравнения (10.21) и (10.22) и, таким образом, установим связь между 5і, ^2» яі> я2 и ^*- Можно получить дополнительное соотношение для лх, л2 и /*, воспользовавшись тем, что Н — 0 для всех t £ (0, /* ], в том числе Н — 0 и при t — t*. Итак, подставляя соотноше¬ ния (10.23), (10.20) и (10.18) в уравнение (10.16), получим = 1. (10.24) Если бы можно было вычислить интегралы, входящие в уравнения (10.21) и (10.22) то тогда для экстремального управления можно было бы получить аналитическое выражение. В ряде случаев это возможно, но в общем случае их надо вычислять при помощи вычисли¬ тельной машины. В следующем параграфе рассмотрим класс систем, для которых легко получить аналитическое выражение управления, оптимального по быстродействию. 714
Этот пример показывает, что отыскание экстремальных управлений сводится к вычи¬ слению некоторых интегралов. Аналитические трудности возникают из-за того, что инте¬ гралы получаются очень громоздкими. Таким образом, аналитически решить задачу с двумя" заданными граничными точками, как правило, невозможно. 10.4. АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЯ ДЛЯ ОДНОГО КЛАССА НЕЛИНЕЙНЫХ СИСТЕМ1 В § 10.3 мы сформулировали задачу об оптимальном быстродействии с целью проиллюстрировать применение принципа минимума в случае, когда управление ограничено по величине соотношением \\и (0|| <т для любого t. В этом параграфе получим аналитическое выражение опти¬ мального по быстродействию управления для одного класса нелинейных систем. Этот класс нелинейных систем весьма ограничен, однако выраже¬ ние для оптимального управления оказывается исключительно простой функцией состояния и получается непосредственно, без помощи принципа минимума. Полученные результаты важны с теоретической точки зрения. Оказы¬ вается, что существует (по крайней мере) одна практическая система, попадающая в эту категорию. Позднее мы ее детально исследуем. Сначала рассмотрим следующую задачу: Задача 10.1. Дана система х(П = /[х(0, t] + u(ty x(t0) = l (10.25) Предположим: а) система управляема; б) управляющий вектор и (0 и вектор состояния х (0 имеют одина¬ ковую размерность п; в) управление и (0 ограничено по величине соотношением || « (0II = /«ï(0 + ••• + 4(0 < т (10.26) при любом t /0. г) вектор-функция f [х (0, t] обладает свойством </[х(0, t], x(t\) = h[\\x(t)\\, /] (10.27) для любых X (t) и t Zo. Функция h [ ||х (0||, N — некоторая скаляр¬ ная функция от нормы IIаг (ОН [т. е. от эвклидовой длины вектора состоя¬ ния X (/) и от времени Л. Найти управление и* (0, переводящее систему (10.25) из любого заданного исходного состояния х (/0) == I в начало координат 0 простран¬ ства состояний (фазового пространства) за наикратчайшее возможное время. Прежде чем рассматривать физическую трактовку задачи, сделаем некоторые тривиальные, но очень важные выводы. Лемма 10.1. Пусть и (0— управление, уменьшающее норму ||х(0|| решения х (0 системы (10.25) от ||х(/0)||И!ІІІ ДО ||АГ(/*)|| = 0 за минимально возможное время Z*. Тогда и (t) = и* (t), т. е. управле¬ ние и (0 оптимально по быстродействию. Доказательство. Это очевидно, потому что х (/*) = 0 только в том случае, когда ||аг (Л) || = 0. На протяжении всей этой главы будем иметь дело с производной па времени от длины вектора. Поэтому полезно доказать следующую лемму. 1 Этот параграф основан на результатах работы |11]. 715
Лемма 10.2. Пусть w (t) — вектор с компонентами (/), w2 (t) —■ . ., . . ., wn (t), тогда A il w (t) il - <« «),«>«)) /■ (t} w(Q \. 10 28) 11^0)11 — ||W(Z)|| \W(O> || w (/) || / uu.zoj Доказательство. Уравнение (10.28) получено прямым вычислением: ( w (0 w (0) II w (Oil (10.29) Пусть теперь х (t) — решение уравнения (10.25). Из уравнений (10.28) и (10.25) находим, что скорость изменения ||л:(0|| можно найти из соот¬ ношения d и„шн (х(0, х(0> </[х (/),/], х(0) , (а(0,х(0> /щ -diIIх(t)Il = IlX(0II = IÎT(Ô|j + IlX(oil • ( 1 °-30) По предположению г) задачи 10.1 и, в частности, путем подстановки соотношения (10.27) в уравнение (10.30), получим 4іх«)і= ллі!'''+<Лт- 1^г>- ио-эн Уравнение (10.31) представляет собой дифференциальное уравнение первого порядка, определяющее поведение нормы х (/), ||х (/)|| как функ¬ ции от управления и (t). Введем обозначения в уравнение (10.31): у(‘) = II* (ОН; (10.32) л - Л(И*«и, л. aiz/Ю, Ч- |1Х(П)| , (10.33) (10.34) тогда получим y(t) =^a[y(t), q + v(t), (10.35) где Наша цель — решить задачу 10.1. Заметим, однако, что перевод любого исходного состояния в нуль за минимальное время эквивалентен уменьшению длины исходного состояния до нуля за минимальное время и наоборот. Из леммы 10.1 следует, что управление, уменьшающее до нуля длину исходного вектора состояния за минимальное время, является также и решением задачи 10.1. Уравнение (10.35) является дифференциальным уравнением первого порядка. Следовательно, если мы найдем v (t), пере¬ водящее систему (10.35) из любого исходного состояния у (tQ) >0 в нуль за минимальное время, и сможем связать это v (t) с вектором и (t) при помощи уравнения (10.34), то такая процедура даст нам оптимальное управление а* (/). Это — путь, которому мы будем следовать. Чтобы сформулировать задачу об оптимальном быстродействии для системы y(t) = a[y(t), + y(tQ):>0, (10.36) 716
мы должны наложить ограничения на величину v (t). Они получаются следующим образом. Так как ѵ (/) = ц то из неравенства Шварца 1 следует I I = |<“(()' ттет>1 <11 “(<) 1 Hw|<т’ (10.37) JC (Z) потому что \\и (t) Il < т и вектор единичной длины. Таким образом, скаляр ѵ (/) ограничен по величине соотношением (10.38) Но задачу об оптимальном по быстродействию управлении системой первого порядка мы уже решили в § 7.10. Используя результаты § 7.10 и соотношение у (t) = || х (t) || 0, получим, что функция ü* (0 = — (10.39) переводит любое исходное у (/0) > 0 в нуль за минимальное время (если это возможно). Следовательно, оптимальный по быстродействию управ¬ ляющий вектор и* (/) должен удовлетворять соотношению ттегТ/ " т = -т- (10.40) где х* (0 — состояние оптимальной системы в момент времени /. Сразу получим, что оптимальное управление а* (/) определяется уравнением ‘•I'1—"тег <10-41> и состояние х* (t) есть решение дифференциального уравнения = (10.42) начинающееся из известного исходного состояния х (/0) = 1 (при условии, что решение существует). Очевидно, что оптимальное управление я* (t) (10.41) единственно. Это вытекает из единственности решения уравнения (10.42) и того обстоя¬ тельства, что существует одно и только одно а* (/), удовлетворяющее уравнению (10.40). Представим эти результаты в виде следующего закона управления. Закон управления 10.1 (решение задачи 10.1). Оптимальное по быстро¬ действию управление, являющееся решением задачи 10.1, равно = '10-43> при любом t t0. Управление а* (/) единственно (при условии, что оно существует). Из уравнения (10.43) следует, что оптимальное управление должно быть максимально возможным (|| и* (/) || = т) и направлено противо¬ положно состоянию X* (/). В следующем параграфе рассмотрим физический смысл предположе¬ ний задачи 10.1 и закона управления 10.1. 1 Напомним, что неравенство Шварца устанавливает | (я, W ) | || ѵ || || w || (см. § 2.12). 717
10.5. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ В § 10.4 мы сформулировали задачу об оптимальном быстродействии (задача 10.1) и нашли ее решение (закон управления 10.1). В этом пара¬ графе обсудим способ, которым был получен закон управления 10.1, и важность предположений, принятых при формулировке задачи 10.1. Читатель, вероятно, заметил, что наш метод решения отличается от стандартных шагов, вытекающих из принципа минимума и описанных в § 10.3. Основная идея § 10.4 состояла в том, чтобы рассматривать дифференциальное уравнение относительно эвклидовой нормы ||х (/)|| Ісм. уравнения (10.30) и (10.31)] и найти управление, обращающее ||лг(/)|| в нуль за минимальное время. Предположения, сделанные при формулировке задачи 10.1, состояли в следующем: 1. Однородная часть уравнения (10.31) не зависит Il х \Ч II от компонент xt (t) состояния х (/), а является функцией только ||х (ОН- 2. «Управление» v(t) у ограничено по величине не¬ равенством I V (0| <т. Таким образом, ограничения «управления» не зависят от состояния и времени. Если внимательно рассмотреть уравнение (10.31), то можно обна¬ ружить, что оптимальное по быстродействию управление и (t) = =—т обладает следующим свойством: скорость изменения 1)X(ОН нормы ||лг(О И при таком управлении «наименьшая»1 из всех возможных для каждого момента времени t и каждого состояния х (t). Проверить это очень легко. Пусть и (t) — допустимый управляющий вектор, отличный от оптимального: ||и(0ІІ<т, «(/) т4 —туттиг- (10.44) II л / II С помощью неравенства Шварца из уравнений (10.44), (10.31) и (10.40) получим <“<'>■ ifw/>~ra- <1045> Эти результаты можно трактовать следующим образом: «Локально¬ оптимальное» управление, т. е. управление, локально вызывающее наиско¬ рейшее убывание нормы ||х (0||, оказывается оптимальным глобально и наоборот. Конечно, последнее заключение справедливо только для задачи 10.1 и не является общим свойством всех систем, оптимальных по быстродействию. Проиллюстрируем это на примере системы, которая удовлетворяет некоторым, но не всем предположениям задачи 10.1. Пример 10.2. Рассмотрим управляющую систему (гармонический осциллятор) Х1 (t) = х2 (О; *2 (О - — Ч (t) (10.46) Будем считать, что скалярное управление и (0 ограничено по величине I и (О |^1. (10.47) 1 «Наименьшая» в смысле наибольшая по модулю отрицательная величина. 718
Применим методику § 10.4 и найдем -^-Ц х (<) || для системы (10.46): а „ *г(0*і (()—*i(0*2(0 , х2(0“(0 (П~ ||х(011 + І|х(()|| - = ... (10.48) V *1 (() + *2 (() Уравнение (10.27) для системы (10.46) удовлетворяется, потому что h [|| х (/), ПИ = 0 для любых х (/) и t. Таким образом, предположения а и г задачи 10.1 удовлетворяются, а предположения бив — нет. Попытаемся теперь найти «локально-оптимальное» управление. Другими словами, мы хотим найти управление и' (/), которое делает -^-||х(0|| наиболее отрицательной в каждый из моментов времени. Из уравнения (10.28) с учетом уравнения (10.47) находим, что это «локально-оптимальное» управление выражается в виде и' (t) = — sign *2 (О (О + %2 (И = — sign {х2 (И). (10.49) Это управление не идентично глобально-оптимальному управлению и* (t). Напомним, что мы нашли последнее в § 7.7 [см. уравнение (7.283) при œ = —1 ]. Глобально-оптималь¬ ное управление и* (/) ~ —1, когда состояние находится выше линии переключения у и и = +1 для всех состояний ниже линии пере¬ ключения у (см. рис. 7.41). Так как линия переключения у (см. рис. 7.41) не совпадает с осью х1У то «локально-оптимальное» управ¬ ление іл' (/) не идентично глобально¬ оптимальному управлению и* (t), которое является единственным. Заштрихованная на рис. 10.2 об¬ ласть представляет собой множество состояний, для которых «локально¬ оптимальное» управление и' (t) = — — sign {х2 (/)} отличается от гло¬ Рис. 10.2. Траектория 7\ оптимальна по быстродей¬ ствию. Траектория Т2 получается при помощи управления и' (/) — —sign {х2 (/)} бально-оптимального по быстро¬ действию управления и* (/). На рис. 10.2 показаны истинно опти¬ мальная по быстродействию траек¬ тория 7\ и траектория Т2, произ- веденная управлением и' (t). Траектории идентичны до точки Q. После нее неоптимальная траектория Т2 проходит ближе к началу координат, чем траектория 7\, пока траектории не достигнут оси х^ Однако к тому моменту, когда начальное состояние по траектории Т2 попадает в точку Р, то же начальное состояние уже достигнет начала координат по траекто¬ рии 7\. В идеальном случае траектория Т2 закончится в точке р, но в любой практической системе из-за неидеальности реле состояние р постепенно достигнет начала координат вдоль зигзагообразной траектории, показанной на рис. 10.2. Грубо говоря, управление и' (Z) «близоруко», потому что оно не учитывает будущих результатов текущего управления (и поэтому оптимально только локально). Для состояний, достаточно удаленных от начала координат, траектории, соответствующие и* (t) и и' (/), почти идентичны. Прево¬ сходство и* (0 обнаруживается лишь вблизи от начала координат. Нахождение оптимального по быстродействию управления путем сведения системы n-го порядка к системе первого порядка не представляло никаких трудностей. Но найти оптимальное управление при помощи принципа минимума исключительно сложно. Чтобы убедиться в этом, следуя методике § 10.3 [уравнение (10.11)], найдем, что оптимальное по быстродействию управление должно быть равно a* (t) = —т Р* (0 Il Р* (ОІГ (10.50) 719
где р* (/) — дополнительный вектор, соответствующий оптимальным по быстродействию управлению а* (О и траектории х* (0- Канонические уравнения для задачи 10.1 имеют вид хГ (0 = Л [х* (М— а (10.51) P* z| dxf (t) /=1 для i = 1, 2, . . n. Поскольку оптимальное по быстродействию управле¬ ние равно = —(10-52) то на основании уравнений (10.50) и (10.52) решения канонических уравне¬ ний должны удовлетворять соотношению р* (/) = X* (/) ||р*(ОІІ Il х* (О II * (10.53) Сложно даже проверить, что уравнение (10.53) справедливо, не говоря уже о том, что исключительно трудно, если не невозможно, вывести ч уравнение (10.53), решая уравнения (10.51). Упражнение 10.1. Пользуясь предположениями, принятыми в задаче 10.1, убеди¬ тесь, что решения р* (t) и х* (і), связанные соотношением (10.53), удовлетворяют уравне¬ ниям (10.51). Прямой метод § 10.4 позволяет сделать еще одно упрощение. Если попытаться решить задачу 10.1 при помощи принципа минимума, то можно найти экстремальное управление. Как отмечалось в гл. 6, нужно еще до¬ казать существование оптимального управления, и лишь убедившись, что экстремальное управление единственно, можно сделать вывод о том, что найденное экстремальное управление оптимально по быстродействию. Так как мы имеем дело с нелинейной системой с переменными параметрами, проверить единственность исключительно трудно. Подчеркнем, что все эти вопросы в изложенном решении задачи 10.1 мы опустили. Наконец, обсудим практическую реализацию оптимального управле¬ ния а* (t). Так как і-я компонента и* (/) равна * 4 (0 «Г ’ (10.54) II Л И ) II то надо измерять компоненты вектора состояния х* (Z) и делить каждую компоненту на |/х*2 (0 + • • • + х*2 (t). В работе [199] описана схема, которую можно использовать для приблизительного вычисления квадрат¬ ного корня из суммы квадратов произвольного числа переменных. Таким образом, получение оптимального по быстродействию управления не требует слишком сложной с практической точки зрения системы. В следующем параграфе рассмотрим управление так называемыми «системами с инвариантной нормой». Системы с инвариантной нормой обра¬ зуют класс нелинейных (или линейных) систем вида х (t) = f [л: (/), /] + + и (/), где / Ілг (/), t] обладает свойством: (/ [лт (/), Л, х (t)) = 0 для любых X (t) и t. Таким образом, системы с инвариантной нормой представляют собой особый класс систем того же типа, что и системы, рассмотренные в задаче 10.1. 720
Упражнение 10.2. Исследуйте оптимальное по быстродействию управление к началу координат Для системы x(t)=f[x(t), t] + B[x(Z), И и (t) И ni. (10.55) Считайте, что система (10.55) удовлетворяет всем предположениям задачи 10.1. Кроме того, примите, что матрица В (t) размера пХп ортогональна для любых х (t) и t. Покажите, что оптимальное по быстродействию управление к началу координат равно г* (7) «*(0=-™В'|х*(а і] • (10.56) Указание: см. § 2.14. Упражнение 10.3. Рассмотрите задачу 10.1 и покажите, что при заданном исходном состоянии X (t0) = I оптимальным по быстродействию управлением к области S = |х : || X || = г| будет +/птЯ^Г’ если г>ш- Упражнение 10.4. Рассмотрите линейную систему X (П = {kl + 5] X (0 -t- и (Z), II и (/) И т, (10.57) (10.58) (10.59) где k— произвольная постоянная; / — единичная матрица и »5 — косо-симметричная матрица: 5 = —5'; (10.60) а) покажите, что эта система удовлетворяет всем предположениям задачи 10.1; б) если X (0) = g — исходное состояние, то его можно перевести в начало координат лишь при условии |||||<-^-, если k > 0. (10.61) При k 0 любое состояние можно перевести в начало координат; в) при k < —минимальное время /*, требующееся для перевода | в 0, равно Z* = т (10.62) г) найдите оптимальное управление a* (Z) = —т -д—* , решив канонические уравнения. Указание: фундаментальная матрица системы (10.59) равна е^+^І1 — — ekt<& (/), где Ф (Г) —ортогональная матрица; д) покажите, что время /* (10.62) является решением управления Гамильтона- Якоби при любом X. 10.6. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ СИСТЕМАМИ С ИНВАРИАНТНОЙ НОРМОЙ 1 В этом параграфе мы рассмотрим управление классом систем, которые называются системами с инвариантной нормой. К данному классу систем относятся такие системы, у которых при отсутствии управления эвкли¬ дова длина вектора состояния постоянна. Дадим сначала некоторые точные определения, а затем перейдем к формулировке и решению опти¬ мальных задач для систем с инвариантной нормой по отношению к некото¬ рым критериям. Оптимальное управление найдем не по принципу мини¬ мума, а с помощью неравенства Шварца. Определение 10.1. Динамическая система x{t) = g 1-ѵ(0; П + »(0 (10.63) 1 Материал этого параграфа основан на работах [10] и [12]. 721
называется системой с инвариантной нормой, если решение х (t) однород¬ ной системы g {x(ty, t] (10.64) обладает свойством = 0 (10.65) для всех х (t) и t. Эквивалентным является следующий способ определения инвариантности нормы системы (10.63): известно [см. уравнение (10.28)1, что <loœ> и поэтому, по уравнениям (10.65) и (10.64) норма системы х (t) = = g lx (/); t] + и (t) инвариантна, если {gïx(ty Z], x(t)) = Q (10.67) для всех X (t) и t. Пример 10.3. Однородная система % (t) = t4 sin {xj (Z) x2 (0} *2 xi (0; 1 (10.68) X2 (t) — — t4 sin {Xj (t) X2 (0} X2 (t) X4 (t) j является системой с инвариантной нормой, потому что справедливо уравнение (t) х{ (t) 4- х2 (/) х2 (t) = sin {xj (О х2 (/)} х2 (t) Xj (/) — — t4 sin {Xj (/) X) (t)} x2 (/) X4 (0 = 0. (10.69) Пусть дана линейная однородная система х(0= S(t)x(ty (10.70) каким условиям должна удовлетворять матрица системы 5 (/) для того, чтобы система (10.70) была системой с инвариантной нормой? Таким условием является косо-симметричность матрицы S (/): = (10.71) Чтобы показать это, образуем скалярное произведение (10.67), кото¬ рое для системы (10.70) запишется в виде (x(t), S(t)x(t)) = 0. (10.72) Так как (х (t), S (/) х (t)) = (S' (t) х (t), х (/)) для любой 5 (t), то получим, что S (t) должна быть такой, чтобы для любых x(t) и t выполнялось равенство <[5(0 + У (/)] x(ty х(/)) = 0. (10.73) Следовательно, уравнение (10.71) справедливо. Чтобы различать линейные и нелинейные системы с инвариантной нормой, дадим следующее определение Определение 10.2. Будем называть линейную систему с инвариантной нормой X (0 = 5 (0 X (0; 5 (0 = —S' (0 (10.74) самосопряженной. Сопряженной к системе (10.74), очевидно, является система z (t) = — S' (t) z (f) = S (t) z (0, и, следовательно, система (10.74) является сопряженной к самой себе. 722
Пример 10.4. Линейная система ~Xl (t)~ 0 sin t (/) - X., (0 = — sin t 0 -e* X2 (0 (/)_ _-/3 e‘ 0 (0 _ (10.75) является самосопряженной системой с инвариантной нормой. После этих предварительных определений мы готовы сформулировать некоторые оптимальные задачи. Чтобы избежать повторений относительно предположений и т. д., сформулируем все оптимальные задачи в виде одного утверждения. Задача 10.2. Дана управляемая система с инвариантной нормой x(/) = g[x(0; + х(0)-|. (10.76) Предположим, что размерности и (t) и х (/) одинаковы и что || и (/) || < < т при любом t. Найти управление, переводящее систему (10.76) из исходного состоя¬ ния g в 0 и минимизирующее следующие функционалы. Задача 10.2а. Время переходного процесса т Jj dt = T, Т не задано. (10.77) о Задача 10.26. Расход топлива т JB JII и (О||бй. Т не задано. (10.78) о Задача 10.2в. Линейную комбинацию затраченного времени и израс¬ ходованного топлива ' т JB = J {k + Il »(011) не задано, £>0. (10.79) 0 Задача 10.2г. Энергию управления т Jr ~^\\u(t)\\2 dt, T задано. (10.80) о Задача 10.2д. Линейную комбинацию затраченного времени и израс¬ ходованной энергии т Ja = J М +’4'і|я(0іі2|^, Т не задано, > 0. (10.81) о ' ’ Найдем оптимальное управление для каждой из сформулированных выше задач. Мы получим оптимальные управления при помощи нера¬ венства Шварца. Доказательства сравнительно просты, потому что можно рассматривать дифференциальное уравнение первого порядка относительно нормы х (t). Так как система (10.76) является системой с инвариантной нормой, то ||лг(/)|| будет решением дифференциального уравнения пер¬ вого порядка: = = (10,82) 723
Так как ||a(O||<m, получим, что v (t) ограничено неравенством |t40l = |\«(0, (10.83) Эти два уравнения будут неоднократно использоваться при отыскании оптимального управления для каждой из задач. Сначала для каждого из функционалов найдем наибольшую нижнюю границу, а затем покажем, что можно найти одно или более управлений, достигающих наибольшей нижней границы. Такие управления оптимальны. После этого уточним вопросы единственности. Математический аппарат различных доказательств несложен, так как рассматриваются два соотношения первого порядка (10.82) и (10.83). Мы считаем, что читателю следует усвоить способы отыскания наиболь¬ шей нижней границы с помощью обычных неравенств.и выкладки, касаю- щиеся еди нственности. Начнем с задачи 10.2а. Так как система (10.76) является системой с инвариантной нормой, относящейся к системам особого класса, рас¬ сматриваемым в задаче 10.1, то можно сформулировать следующий закон управления. Закон управления 10.2а (решение задачи 10.2а). Единственное опти¬ мальное по быстродействию управление и* (Z), т. е. управление, миними¬ зирующее функционал JА (10.77), равно хА (О и* (0 - —m , (10.84) А и* где х* (/) — решение уравнения (10.76) при и (t) = и* (/). Минимальная величина Уд стоимости J А, т. е. минимальное время требующееся для перевода | в 0, выражается уравнением Ja = ** - Ж (10.85) Доказательство. Уравнение (10.84) следует из закона управления 10.1. Уравнение (10.85) получено подстановкой уравнения (10.84) в (10.82), т. е. 4 !<•(') I—(10.86) Интегрируя соотношение (10.86), получим ІИ (Ob-IISI-^- (10.87) Но при t = t* должно быть |дг* (/)|| = о, и поэтому минимальное у* II1II время равно /* = Перейдем к решению задачи 10.26. Как увидим, управление, опти¬ мальное по расходу топлива, неединственно. Закон управления 10.26 (решение задачи 10.26). Пусть 2? — мно¬ жество неотрицательных скалярных функций р (/), определенное как ® = (Р (/) : 0 < P (t) < т для любого /, причем Т для каждой р (/) существует такое, что J р (t) dt = |||||). (10.88) о Тогда управление ^(0 = -Р(0тЖ|Г> Р(ОС® (10-89) II ХБ II 724
оптимально по расходу топлива. Иначе говоря, управление и* (t) мини¬ мизирует функционал JB (10.78). Так как [3 (t) неединственно, то и управ¬ ления, оптимальные по расходу топлива, неединственны. Минимальное количество топлива «/б, требующееся для перевода | в 0, равно (10.90) Если, кроме того, р (/) = т для любого /, (10.91) то 1см. уравнение (10.84)] можно получить X* (t) »1 (0 = — т^4—ІГ = »Д (0. (10.92) Б |х* 0)|| откуда следует, что управление, оптимальное по быстродействию, яв¬ ляется также оптимальным и по расходу топлива. Доказательство. Рассмотрим уравнение (10.82), которое устанавли¬ вает, что у к ІІ-Ч')! "<“<')• IÎWT/- (10.93) Проинтегрировав это уравнение, получим t И(ПІІ = Ш+ K«W. (10.94) J \ II л V Ч II / 0 Пусть Т — время, такое, что ||х (Т)\\ = 0. Тогда IJI-—г» (10.95) о Из последнего уравнения найдем нишМ5ІІ-І- 1 <“(').^»1 < о о т т о о (10.96) Итак, мы показали, что ^^ІІІІІ- (10.97) Это означает, что начальная норма ||§|| является наибольшей нижней границей стоимости JБ. Очевидно, управление, дающее эту наибольшую нижнюю границу |||||, оптимально. Покажем далее, что любое управление и* (t), определяемое урав¬ нениями (10.88) и (10.89), оптимально. Так как К(0|| = ₽(0. Z (10.98) то, подставив и* (/) в уравнение (10.95), получим гв р(/)Л = J||«*(Op, (10.99) о о 725
где Тр — время, требующееся для перевода | в 0 для данного р (/), т. е. •Гб(7» = 0 (10.100) Уравнение (10.99) показывает, что управление Ue (0 соответствует наибольшей нижней границе [см. уравнение (10.97)], равной |||||, и поэтому управление Ue (0 оптимально по расходу топлива. Минималь¬ ная стоимость (топливо) равна Je = * (10.101) Прямой подстановкой легко доказать, что управление Ua (t), опти¬ мальное по быстродействию, является также оптимальным и по расходу топлива. Так как оптимальное по быстродействию управление един- ственно, а минимальное время t* равно t* = (см. закон управле¬ ния 10.2а), приходим к выводу, что время перехода, связанное с каждым Р (/) из ®, удовлетворяет неравенству Тр>/* для ₽(/)^/п. (10.102) Наконец, убедимся в том, что уравнение (10.89) выражает все управ¬ ления, оптимальные по расходу топлива. Заметим, что из уравнения (10.89) следует: 1) оптимальное управление направлено противоположно вектору состояния; 2) управление может иметь произвольную амплитуду р (/), не пре¬ восходящую т. Пусть R (Z) — ортогональная матрица1; рассмотрим класс управле¬ ний, определяемых соотношением «(0 = -₽(0/?(0ЛД+ (10.103) IIX (t) Il Р(О С/?'(/)/?(/) = I Другими словами, рассмотрим управления и (/), полученные из управлений и*ь (t) ортогональным преобразованием. Так как р (t) и R (/), вообще говоря, произвольны, легко видеть, что множество управле¬ ний u(f) идентично множеству управлений, переводящих состояние g в 0 и удовлетворяющих неравенству || и (t) || < /и. Управления и (/) и (0 имеют одинаковую величину, т. е. ІІя(ОЫІ«д(')ІІ= m (10.104) так как |l/?(0x(0ll = ll-v(0lh и поэтому и (t) отличается от Ue (0 лишь тем, что оно направлено не противоположно вектору состояния. Пусть Тр — время перехода, при котором Хе (Тр) = 0, а Т$ — время перехода, при котором х (Тр) = 0. Покажем, что J ||«(/)||<#> J||«b(/)||d/ (10105) о о и, следовательно, и (/) не является оптимальным по расходу топлива. 1 См § 2.14. 726
Для этого [см. уравнение (10.104)1 надо лишь доказать неравенство ТЬ>Т^ (10.106) Если подставить управление и* (0 в уравнение (10.93), то получим соотношение ^-кб(0ІІ = -₽(0; к: (0)11 -IlU (10.107) Если в то же уравнение подставить управление и (/), то получим d .. (t)x(t), x(o\ .. -J-k(0 =-₽(0-^—|k(0)!l = 11111- (10.108) dt l|x(0ll На основании неравенства Шварца и по предположению /? (О =/= /, получим </?(/)х(/), х(О/<|х(оГ (10.109) и, следовательно, -^-к(П||>Р(О; к(0)|| = |||||. (10.110) Из уравнений (10.107) и (10.110) с помощью доказательств, анало¬ гичных § 7.10, заключаем: Т8>Т6. (10.111) Скорость изменения ||лг(О|| превышает скорость изменения ||Хь (0 || в любой момент времени t. Таким образом, соотношение (10.105) дока¬ зано, и поэтому управления, оптимальные по расходу топлива, должны принадлежать к классу, определяемому управлением ив (0- Читатель, видимо, заметил, что доказательство закона управле¬ ния 10.26 очень похоже на доказательство, использовавшееся при отыска¬ нии оптимальных по расходу топлива управлений для интегратора в § 8.2. Перейдем теперь к задаче 10.2в, связанной с минимизацией стоимости 7 Jв = J \k + II и (t) Il] dt. Стоимость J в можно интерпретировать как линейную комбинацию потраченного времени и израсходованного топлива. Мы покажем, что управление ив (t), минимизирующее стоимость J в, является оптимальным по быстродействию1 управлением а* (/). Закон управления 10.2в (решение задачи 10.2в). Пусть ив (0 — управ¬ ление, минимизирующее стоимость JB (10.79). Обозначим через Jb ми¬ нимальную величину J в. Тогда единственное оптимальное управление и'в (0 равно «в(0 = -тД^|,, (10.112) II хв >0|| а минимальная стоимость Jb равна «^=11111(1 +4)- <10Л13) Уравнение (10.112) означает, что оптимальное управление ив (0 идентично оптимальному по быстродействию управлению и a (t) [сравните уравнение (10.113) с (10.84)1. 1 К такому же выводу мы пришли и в § 8.2. 727
Доказательство. Из уравнения (10.96) имеем f||»(O||dr>|||||. (10.114) о Так как /* = 1111! — минимальное время и k > 0, имеем также kT^kt* = -^ÿ^. (10.115) Из уравнений (10.114) и (10.115) находим J [ + il « Ю ІИ Л = т + J il « (0 il л о о ^^ + 11111 = 11111(1+4)- (10116) Уравнение (10.116) означает, что величина ІІ1Іі(1+4) является наибольшей нижней границей стоимости Jв. Сначала прямой подстановкой покажем, что управление ив (0 (10.112) дает эту наибольшую нижнюю границу. Так как \\ив (0II — т> получим .... іі^іі Т tn Л - J [k + US (f)|| dt = ,f |* + m|<K = ||S|(l +i). (10.1.7) Далее мы должны показать, что оптимальное управление ив (0 единственно. Для этого рассмотрим управление и (/) (10.193), т. е. управле¬ ние, которое мы использовали при доказательстве закона управления 10.26. Очевидно, что время перехода Тв, соответствующее и (/), превосхо- дит Кроме этого, мы показали, что J || и (0 || dt || g ||. о Следовательно, ^[^+11«(01п^>111||(1 + 4)=^- (іо-і18) о и поэтому, поскольку класс управлений и (f) идентичен классу управле¬ ний, обладающих свойством \\и (t) || < т, единственность и% (t) доказана. Найдем далее решение задачи 10.2г. Оптимальное управление, мини¬ мизирующее стоимость J г, будем называть оптимальным по энергии. Сформулируем следующий закон управления. Закон управления 10.2г (решение задачи 10.2г). Пусть и* (/) — управ¬ ление, оптимальное по энергии, т. е. управление, минимизирующее т функционал Jг = J К и (t) ||2 dt, с Т заданным. Обозначим через минимальное значение Jr. Тогда единственное оптимальное по энергии управление и* (t) определяется уравнением (10.119) т IIх* м 728
при условии, что заданное время перехода Т /* = последнее неравенство является необходимым условием существования решения. Для этой задачи минимальное значение J* определяется соотно¬ шением 7* _ Ulf. Jr 2Т ’ (10.120) Доказательство. Из доказательства закона управления 10.26 известно, что т ПИК JII«(Oildt. (10.121) о Напомним \ что для любых двух кусочно-непрерывных функций a (t) и b (t) справедливо соотношение Если принять, что « (0 = II « (0 II. = то из уравнения (10.122) получим II « (ОНdt (10.122) (10.123) (10.124) Из уравнений (10.124) и (10.121) непосредственно видно, что 4 = 4-jll«(0IK^^-. <10125> Прямой подстановкой несложно доказать, что управление и* (t) (10.119) обладает свойством к JII иг (0 II2 dt = -L j Ilf- dt = . (10.126) о 0 Это означает, что управление и* (0 соответствует наибольшей ниж- ней границе Jr— -7^7-, и поэтому управление tir (t) оптимально по энергии. Теперь надо доказать, что управление иг (0 единственно. Для дока¬ зательства единственности заметим сначала, что неравенство (10.124) оказывается строгим равенством в том и только в том случае, когда IIи (t) II = const при любом t £ [0, т]. Следовательно, если || а (/) || ¥= Ф const для і £ 10, Т], то имеет место строгое неравенство откуда, в свою очередь, следует 4-Jll»(0ll2^>^, (10.127) и 1 См. § 3.15, уравнение (3.148). 729
и поэтому и (f) не может быть оптимальным. Случай, когда || и (0 || = = const, мы предлагаем рассмотреть самостоятельно. Итак, единствен¬ ность доказана. Так как оптимальное по энергии управление является функцией * [I ? 112 исходного состояния § и времени Т и минимальная энергия Jг = - убывает с ростом Т, то мы отыскиваем оптимальное управление, минимизи¬ рующее линейную комбинацию потраченного времени и израсходованной энергии (задача 10.2д). Управление, минимизирующее стоимость Jn (10.81), определяется следующим законом управления. Закон управления 10.2д (решение задачи 10.2д). Пусть ад (0 —управ¬ ление, минимизирующее стоимость: т ja = + о L J Обозначим через /д минимальную величину J д. Тогда при задан¬ ном k управление ид (0 единственно и определяется уравнениями #д(0 =—m \\ ) и , если ; (10.128) = еслий<^. (10.129) II хд II Минимальная стоимость Уд равна Уд = Цг (k + -4-m2) > если&>-^-; (10.130) Уд = 1^11111, если k<^- . (10.131) Время перехода, требующееся для перевода | в 0, равно 'Г IIS II А т2 T = = если m 2 ’ лр II IU t m2 Т = -уЛІ-, если k < -X- . (10.132) (10.133) Упражнение 10.5. Докажите закон управления 10.2д. Указание: сначала дока¬ жите, что управление должно быть постоянным по величине, пользуясь уравнениями (10.121) и (10.124), а также тем обстоятельством, что соотношение (10.124) является равен¬ ством в том и только в том случае, когда || и (0 |) = const. Докажите, что оптимальное х(0 « 7 ? \ п д/д (а) А управление должно иметь вид: —а„—и найдите Jnia). Примите —= =0 Il х (0II да и покажите, что а = У 2k или а — m в зависимости от величины k (см. также § 6.24). Надеемся, что читатель нашел интересными эти доказательства «типа неравенств». Нашей целью было продемонстрировать, что в частных слу¬ чаях оптимальные законы управления можно найти, не прибегая к прин¬ ципу минимума. Доказательства, использующие инструменты функ¬ ционального анализа (такие как неравенство Шварца), часто имеют то преимущество, что они не затемняют физических положений задач, как это часто случается при введении дополнительных переменных. Закончим этот параграф примером физической системы, которая является системой с инвариантной нормой. 730
Пример 10.5 х. Рассмотрим асимметричное тело в пространстве. Это тело может быть спутником или любым другим космическим кораблем. Введем три оси /, 2 и 3, проходящие через центр масс тела. Предположим, что эти оси фиксированы относительно тела. Пусть /х, /2 и /3 — три момента инерции тела относительно осей /, 2 и 3 соответственно. Как показано на рис. 10.3, уг (0, У2 (0 и Уз (0 — три угловые скорости относительно осей /, 2 и 3. Под¬ черкнем, что эта система координат связана с телом и все измерения производятся по отно¬ шению к этой системе координат, фиксированной относительно тела. При отсутствии внешних моментов уравнения движения 2 имеют вид 1 1У1 (0 — U2 1з) У2 (0 Уз (0> І2Ў2 W = (і з-li) уз (0 Уі (0; 1 зУз (0 = (Л — 12) Уі (0 У2 (0* > (10.134) Дифференциальные уравнения движения нелинейны. Члены (// — //) уі (t) yj (/) отображают гироскопический эффект связи. Если бы тело было абсолютно симметрично, т. е. Л = /о = Л, то нелинейные члены были бы равны нулю и уравнения движения не были бы связаны. Покажем далее, что система (10.134) является системой с инвариантной нормой со¬ гласно определению 10.1. На первый взгляд может показаться, что это не так, потому что находя скорость изменения величины вектора скорости у (0, мы получим II (0II — у\ (і) + У2 (0 + УІ (0 ~ Рис. 10.3. Асимметричное тело с тремя осями /, 2 и 3, проходящими через центр масс I Л І2 \ Уі (0 У2 (1) lJ3 (0 / Q /1Л іое\ + ІЗ ) II (О II (10Л35) Это означает, что величина вектора скоро¬ сти со временем изменяется. Таким образом, у (/) представляет собой вектор состояния си¬ стемы (10.134), но не является величиной инвариантной. С физической точки зрения известно, что тело в пространстве, показанное на рис. 10.3, сохраняет неизменным свой угловой момент. Поэтому обозначим через х (t) вектор углового момента, определяемый преобразованием: *1 (01 гл 0 0 1 Уі (0 х(0 = Хг(0 — 0 І2 0 Уз(0 (10.136) .Х3 (0. 0 0 Із] Li/з (0. Через компоненты этого вектора уравнение (10.134) запишется в виде Xid) = 'Ті'3 xAt)xsW, 12*3 (0 = /з ~ Л х3 (0*1(0; . '3'1 Хз = ^1 2/,//2 X1 У) х* Вычисляя теперь || х (0 ||, найдем ri ri г— 1ГІ|Х(/)ІІ = ~drVx\ W+x2 (О + xgсо =0, (10.137) (10.138) и поэтому система (10.137) является системой с инвариантной нормой согласно определе¬ нию 10.1. 1 Мы рассматривали такую систему в примере 7.4 и в § 7.9. 2 Систему уравнений (10.134) обычно называют уравнениями движения Эйлера. См. [85J, гл. 5. 731
Уравнения (10.137) описывают движение тела в отсутствии прикладываемых к нему моментов. Вектор и (t) можно получить с помощью реактивного двигателя, маховиков, устройств, использующих неравномерность силы притяжения, и т. д. В любом случае при наличии и (/) уравнения движения примут вид Хі (0 = І2, , ,3 Ъ (t) х3 (О + иг (t); (Л = /з ~ 71 х3 (0 Хі (О + u2 (/); I 3' 1 Ха = Х1 х~ + “3 Если ограничения управляющего момента и (t) имеют вид II « (0 II = ]/"«? (Л + «2 (0 + “з (0 «S т’ (10.139) (10.140) (10.142) то вся теория, рассмотренная в настоящем параграфе, может быть использована для отыска¬ ния оптимального управляющего момента. Можно дать физическую интерпретацию найденных законов управления. Например, на основании закона управления 10.2а, оптимальный по быстродействию момент должен быть равен V* (/\ “*w=-'nTFW (10J41) Это означает, что для уменьшения вектора углового момента х (t) до нуля за наимень¬ шее возможное время вектор момента и (t) надо направить противоположно вектору углового момента х (/), причем и (0 должен быть как можно больше. В следующем параграфе мы исследуем оптимальное по быстродействию управление космическим телом с одной осью симметрии (1г = 12 =j= /3) и сравним три различных способа оптимального управления. Упражнение 10.6. Рассмотрите линейную самосопряженную систему (см. определе¬ ние 10.2) x(t) =S (/) X (/) 4- и (t), X (t0) = I, S(t)=-S'(t), II и (t) И ^т. Докажите законы управления 10.2а—10.2д, пользуясь исключительно принципом минимума. Указание: во всех доказательствах пользуйтесь ортогональностью фунда¬ ментальной матрицы Ф (t\ t0) системы (10.142) при любом t. Многие доказательства можно найти в работе [12]. Упражнение 10.7. Считайте, что на вращающееся тело из примера 10.5 действуют моменты трения. Пусть х (t) — вектор углового момента и и (0, || и (t) || т — вектор управляющего момента. Покажите, что если уравнения движения тела имеют вид Xi(t) = — а(0 Х1 (/) +-4=4іх2(0х3(/) H-U] (t); 1 3 Х2(/) = —а(/)х2(() 4- /з/^7|/1 +u2(ty, . (10.143) x3(0 = — а (Z)x3(() + --L Z,2. (t) x2 (/) 4- u3 (t), где коэффициент трения а (t) > 0, то оптимальное по быстродействию управление можно найти при помощи методов, описанных в § 10.4. Каков физический смысл того, что коэффи¬ циент трения a (t) одинаков для всех трех уравнений? Упражнение 10.8. Рассмотрите линейную инвариантную во времени самосопряжен- ную систему x(t) = Sx(t) 4- и (/), x(0)=g; S = — S', ||«(f)lls=S'n (10.144) с функционалом т j (a) = -L. J[|| X(t) |p 4- r II и (t) U2] dt, r : >0, (14.145) и где Т задано, а X (Т) — нет. Найдите оптимальное управление. Что происходит при Т -> оо? 732
10.7. ОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЕ СКОРОСТЬЮ ВРАЩЕНИЯ ТЕЛА С ОДНОЙ ОСЬЮ СИММЕТРИИ 1 В этом параграфе применим теорию, развитую в § 7.7, 7.9 и 10.6, к задаче об управлении скоростью вращения космического тела с одной осью симметрии. Мы хотим показать, что применение теории оптимального управления крайне полезно на предварительной стадии проектирования, и детально продемонстрировать, какое влияние на работу системы оказы¬ вает изменение ограничений, накладываемых на управление. В § 7.7 и 7.9 были получены уравнения движения космического тела с одной осью симметрии. Для полноты приведем эти уравнения еще раз. Пусть тело, рассмотренное в примере 10.5, имеет одну ось симметрии. Предположим, что осью симметрии является ось 3. Это означает, что мо¬ менты инерции относительно осей 1 и 2 одинаковы: / = Л = /2¥=/з. (10.146) Если подставить соотношение (10.146) в уравнения (10.134), то ока¬ жется, что угловые скорости yY (t), у2 (/) и у3 (t) удовлетворяют дифферен¬ циальным уравнениям ІУі (0-=(І-ІзШ0 у2 (Z); /Ў2(0 = (/з-/)Уз(0у1(О; зУз (0 = (10.147) (10.148) Предположим, что каким-либо способом мы получили вектор момента и(/), и уравнения движения приняли вид IУі (0 — (1 /3) Уз (0 У2 (0 (Of ІУ2 (0 — (/3 О Уз (0 Уі (0 ^2 (0> IзУз (0 — из (0- Управляющие моменты можно получить с помощью какой-либо системы. Для этого можно воспользоваться реактивными двигателями, маховиками и т. д. Предположим, что мы выбрали реактивные двигатели. Следующая проблема — размещение этих двигателей. Из уравнений (10.148) видно, что скорость у3 (t) (т. е. угловая скорость тела отно¬ сительно его оси симметрии) является функцией только компоненты и3 (t), потому что Уз(0 = й(0) -і- 77 Ju3(T)dT- и Очевидно, скорость у3 (/) не зависит от уг (/) и у2 (/). Однако yl (t) и у2 (/) зависят от у3 (t). Часто желательно 2 управлять скоростью у3 (t) независимо от остальных скоростей. Поэтому двигатель J3, развивающий тягу /з (/), разместим на теле так, чтобы вектор момента и3 (t), полу¬ чаемый за счет f3 (/), имел вид (10.149) 0 О «з(0 «з (0 = (10.150) 1 Материал данного параграфа основан на работах [5] и [9]. 2 Например, в случае обитаемой космической станции можно создать искусственную гравитацию, установив у3 (t) постоянной и поддерживая у± (t) и у2 (/) равными нулю. Если космическое тело является возвращаемым космическим кораблем, то вращение вокруг оси симметрии желательно с точки зрения аэродинамической устойчивости. 24 2025 733
Иначе говоря, двигатель J3 должен давать момент только относительно оси симметрии, а следовательно, тяга /3 (/) — располагаться в плоскости, перпендикулярной к оси симметрии (ось 3). Рассмотрим далее задачу получения моментов (t) и и2 (О- Предло¬ жим три различные схемы получения этих моментов. Сравнивая их, сделаем некоторые выводы. В следующих определениях компоненты вектора измеряются отно¬ сительно осей 1, 2 и 3 тела. Оси 1, 2 и 3 образуют правую систему коорди- Рис. 10.4. а) Размещение реактив¬ ных двигателей по схеме А. Двига¬ тель JA укреплен неподвижно. Он может развивать тягу в обоих на¬ правлениях и давать момент только относительно оси 2. б) Размещение двигателей по схеме В. Двигатели и укреплены неподвижно. Двигатель дает момент только относительно оси 2, двигатель — относительно оси 1. в) Размещение двигателей по схеме С. Двигатель Jc может вращаться в плоскости, параллельной плоскости 1—2. Угол Ѳ (/) определяет направление вектора тяги fc (/) нат, и поэтому на нее распространяются все правила определения направ¬ лений, соответствующие правой тройке единичных векторов. Схема А. Один фиксированный двигатель. Единственный реактивный двигатель JA укреплен на теле так, как показано на рис. 10.4, а. Вектор тяги имеет компоненты (10.151) и дает вектор момента uA (t) с компонентами uA(t) = (10.152) Таким образом, тяга fA (/) дает момент uA (t) = afA (t) относи¬ тельно оси 2, Будем считать, что величина тяги ограничена: І|/Л(0ІІ = |/Л0І (10.153) 734
Схема В. Два фиксированных двигателя. Два реактивных двига¬ теля JB' и 1Вг закреплены на теле так, как показано на рис. 10.4, б. Соответствующие векторы тяги /в‘ (/) и fB‘ (t) имеют компоненты ив' (t) = uf'(Z) 0 0 _ fB' (t) = 0 fB‘ (t) = /f2 (t) 0 0 и дают векторы моментов tlB' (/) и иВг (t) с компонентами 0 (10.154) a/f- (Z) 0 Таким образом, тяга fB' (/) дает момент ив’ (/) = a/f2 (t) относи¬ тельно оси 2, а тяга fB> (t) — момент uf2 (t) = afB* (t) относительно оси 1. Будем считать, что величины тяги каждого из двигателей ограничены соотношениями ||/в,(0ІІ== ИГ'(0І II/5* = (10.156) Схема С. Один верньерный (поворотный) двигатель. Один двига¬ тель Jc укреплен на теле таким образом, что может вращаться в плоскости, перпендикулярной к оси 3 (рис. 10.4, в). Вектор тяги fc (£), развиваемой двигателем J, имеет компоненты (10.157) Вектор момента ис (0 имеет компоненты яс(0 - a/f (0 (10.158) Таким образом, верньерный двигатель может давать моменты относи¬ тельно осей 1 и 2 одновременно. Будем считать, что вектор тяги ограничен по величине соотношением І1/с (0 II = <FC. (10.159) Обсудим теперь задачу управления с физической точки зрения. Пред¬ положим, что до момента времени t = 0 мы включали двигатель «73 для того, чтобы придать скорости у3 желаемую величину, скажем у3 Ф 0, и поэтому при t = 0 имеем Уз(0) = Уз- (10.160) Из-за гироскопической связи, в общем случае, начальные значения двух других угловых скоростей у± (0) и у2 (0) не будут равны нулю. При отсут¬ ствии внешних моментов при t >> 0 тело будет вращаться вокруг центра масс. Надо найти управляющий момент, который уменьшит до нуля скорости Уі (0 и Уъ (0- Иными словами, трехмерное вращательное движение тела 735
надо сделать «чисто» вращательным, причем скорость вращения должна быть равна заданной у3. Чтобы иметь разумную оптимальную задачу, нужно еще установить критерий. Выберем в качестве критерия минималь¬ ное время. Таким образом, физически задача состоит в следующем: умень¬ шить до нуля начальные скорости у± (0) и у2 (0) за минимальное время, сохраняя скорость у3 (Z) равной заданному значению z/3, т. е. Уз (0 Уз (0) Уз const при />0. (10.161) Если подставить у3 (/) = у3 = const в уравнения (10.148), то можно найти дифференциальные уравнения для скоростей уг (/) и у2 (/). Более удобно, однако, рассматривать угловые моменты. Поэтому введем угловые моменты (Z) и х2 (/) с помощью уравнений *Л*)==ІУ1(іу x2(t) = Iy2(t), (10.162) Из уравнений (10.162), (10.161) и (10.148) получим, что угловые моменты удовлетворяют уравнениям %i (t) — сох2 (Z) 4- (/); 1 (10.163) (0 — (0 + ^2 (0» I где со — постоянная, равная со ~ - у-/з у3 рад/сек. (10.164) Двумерный вектор углового момента х (t) = трехмерного вектора углового момента .*2 (0_ есть проекция (/) *2 (0 _1з Уз _ на плоскость 1—2. Двумерный вектор момента и (t) = проекция трехмерного вектора момента есть иі (0 “2 (0 0 на плоскость 1—2. Как было отмечено ранее, мы хотим найти такой управ¬ ляющий вектор и (t), который переводит х (t) в 0 за минимальное время. Из определений трех схем управления видно, что для отыскания опти¬ мального по быстродействию управления к началу координат нужно ре¬ шить следующие системы уравнений с ограничениями (все индексы, во из¬ бежание путаницы, опущены): Схема А. Один фиксированный двигатель (Z) = <ÙX2 (t). X., (0 = — (ОХ1 (0 + (t\ |u2(0l < FAa. (10.165) 736
Схема В. Два фиксированных двигателя x1(0 = œxs(0 +иЛО. I Ui (t) I < FBa\ x2(t) =—ахЛ) + u2(t), I u2(0l<.FBa. (10.166) (10.167) Схема С. Один верньерный двигатель (0 = cdx2 (0 + (0; x2 (t) =■- —(/) 4- w2 (/), Г(Z) 4- ui (/) < Fca. Мы нашли законы оптимального управления: для системы (10.165) — в § 7.7; для системы (10.166) — в § 7.9; для системы (10.167) (которая является самосопряженной системой с инвариантной нормой) — в § 10.6. Наша цель — сравнить эти три оптимальных по быстродействию решения. Из сравнения систем (10.165), (10.166) и (10.167) видно, что все три управляемые системы одинаковы, а различны лишь ограничения, накла¬ дываемые на управляющий вектор и (t). Для того чтобы сравнение было четким, найдем некоторые соотношения, устанавливающие связь между Fa, Fb и Fc. Эти величины — наибольшие значения тяги, развиваемой реактивными двигателями. Установим эти соотношения в зависимости от величины расхода топлива. В гл. 8 мы полагали, что расход топлива ср пропорционален величине тяги данного двигателя. Если считать, что [3 — некоторый положительный коэффициент пропорциональности, то для каждой из трех схем полу¬ чим соотношения [см. уравнения (10.153), (10.156) и (10.159) ] ФЛ = РІІ/Л(*)ІІ = РІ/Л(ОІ <Р^Л; (10.168) фВ = р[||/в-(0|| + ||/вЧОІІ] =P[|/f‘(/)l + |^(O|] <2₽^в; (10.169) Фс = РІІ/С(0|| = P (< -- [tf (O]2 < №C- (10.170) Поскольку в случае оптимального по быстродействию управления двигатели должны развивать максимальную тягу в течение всего времени t, величина расхода топлива достигает своей верхней границы, и поэтому фЛ = рГл; фВ = 2р£в; <рс = 0FC. (10.171) Самый лучший способ сравнить эти три схемы состоит в том, чтобы потребовать одинакового расхода топлива в каждом из трех случаев: фл = фв = фс, (10.172) что, в свою очередь, дает искомое соотношение F = Fa = 2Fb = Fc. (10.173) Пользуясь уравнением (10.173), можно определить область ограниче¬ ний управляющего вектора и (t) для каждой из схем управления следу¬ ющим образом: 737
Схема А u(t) Q Йд. Йд — {#(/) : их (/) О, ІМОІ < Схема В u(t)tnB, йв = {«(О:|«!(О| ’(10Л74) Схема С и (О Ç йс, Qc = (в (/) : jZи{ (/) ■]- іД (t) < а/7}. Области Йд, Йв и йс показаны на рис. 10.5. Так как области Йд и Йв являются подмножествами из области Йс, следует ожидать, что опти¬ мальное управление по схеме оудет «лучше», чем оптимальные управле¬ ния по схемам А и В. Под словом «лучше» понимается, что при заданном исходном состоянии X (0) минимальное время, ко¬ торое потребуется на перевод х (0) в 0, по схеме с верньерным двигателем ока¬ жется меньше, чем по схемам с одним и с двумя фиксированными двигателями. По¬ скольку область йд не содержится цели¬ ком в области йв, то нельзя утверждать, что схема с двумя двигателями всегда «лучше» схемы с одним двигателем. Можно, однако, ожидать, что схема В будет лучше схемы А для большинства исходных состояний, поскольку область йв «содержит» большую часть обла¬ сти йд. Рис. 10.5. Три области ограничений Йд, Йв и Йс Проверим эти рассуждения, нарисовав минимальные изохроны для каждой из схем. Для различных графиков примем aF = 2. (10.175) Сначала сформулируем законы оптимального управления для каждой из схем (полагая aF = 2). Схема А Оптимальный по быстродействию управляющий вектор и (0 1см. уравнение (10.165)] равен Ui (/) - 0; (—2, если (шх,, сох,) Ç R . п / \ < п (10.176) 2 ( + 2, если ((0%!, сох2) £ R+i где R_ — множество точек выше, а R+ — ниже линии переключения у, как показано на рис. 10.6, а. Схема В 2) Оптимальный по быстродействию управляющий вектор (момент) Ісм. уравнение (10.166)] равен “,(0 = {+L 1) См. рис. 7.41. 2) См. рис. 7.60. если (®хъ ®х2) £ /?_+и если (œxj, ®х2) € R+- U ^?++; если (®х1( <ох2) £ /?+_ (J [ если (®хх, ®х2) £ (J /?++. (10.177) 738
Области /?_+, Схема С п /?+_, /?++ и /?_ показаны на рис. 10.6, б. Оптимальный по быстродействию вектор и (t) [см. уравнение 10.167)) равен „ /А 9 х(<) 2 шх (f) и(І>~ 2 ~ ||œx(/)|| (10.178) или, эквивалентно, 2*і (О ]/"х{ (Z) + х^ (/) ^2 (0 — 2хг (t) X) (/) -t-%2 (О (10.179) Обозначим через Ѳ (/) угол между осью двигателя Jc (см. рис. 10.4, с) и осью 2. В этом случае из уравнений (10.157), (10.158) и (10.179) получим Ѳ(0 = arctg^T = агс^7Г7П' (10.180) Л1 {I) {L ) Минимальное время t*, требующееся для перевода (юхр <ох2) в (0, 0) управлением (10.178), равно te = -^7 Ѵ(<»Х1)2 + (сох2)2 = 1А«*1)2 + (®х2)2. (10.181) Из уравнения (10.181) следует, что минимальные изохроны пред¬ ставляют собой окружности радиуса 2/* на плоскости тх1 — сох2. Вычертим теперь для каждой из схем минимальные изохроны и, срав¬ нивая их, определим, какая из схем «лучше». Обозначим через 5д (/*), SB (/*) и Sc (f*) множества состояний, которые могут быть переведены в начало координат за время, меньшее или равное £*, с помощью схем Д, В и С. Пусть 5д (/*), SB (t*) и Sc (/*) — границы множеств 5д (/*), SB(t*) и 5С (/*) соответственно. Кривые 5д (/*), SB (t*) и Sc (t*) являются минимальными изохронами. На рис. 10.7 показаны минимальные изохроны SB и > на рис. 10.8 — изохроны и Очевидно, что и (10.182) (10.183) Если вычертить все минимальные изохроны, то можно установить, что $л(/*)с$с(/*) и SB(/*)czSc(/*) (10.184) U См. уравнение (10.84). 739
для любого /* > 0. Последнее неравенство означает, что для любого исходного состояния юх2) минимальные времена Z*, /* и /*, которые требуются схемам Л, В и С для перевода (сох^ сох2) в (0, 0), удовлетворяют неравенствам (10.185) 1 * 1 *•* J * J * te < м; te < tB В этом смысле схема С «лучше» обеих схем А и В. ? не СТОЛЬ Рис. 10.8. Минимальные изохроны Зл (^*), 18 видно, Ss , „ Sc {t.t) при z*= л_ принад- 2(0 областям координат при помощи схемы А быстрее, чем Сравнение схем А и I очевидно. Из рис. 10.7 и Ь что исходные состояния, лежащие заштрихованным более строго, множества можно перевести в начало схемы В. В общем случае, если (coxj, сох2) £ (/*) — SB (/*), то схема А «лучше» схемы В; если (сох15 сох2) £ SB (t*) — SA (t*), то схема В «лучше» схемы Л. Однако площадь (или мера) (/*) в общем случае меньше площади (или меры) SB (/*). Поэтому «в среднем» схема В «лучше» схемы Л. 740
На рис. 10.9 показаны три оптимальные по быстродействию траекто¬ рии, начинающиеся из одного и того же исходного состояния и оканчива¬ ющиеся в начале координат, полученные при помощи схем А, В и С. Минимальные времена для них равны (10.186) Очевидно, для данного исходного состояния схема С намного превос¬ ходит схемы А и В. Мы доказали, что схема с верньерным двигателем лучше схем с фикси¬ рованными двигателями в отношении времени переходного процесса. Существуют, однако, и другие сообра¬ жения, которые следует принять во внимание, столкнувшись с задачей проектирования системы управления скоростью вращения данного космиче¬ ского тела. Например, надо знать тех¬ нические проблемы, связанные с реа¬ лизацией каждой из схем, количество топлива, потребляемое каждой схемой, и т. д. В оставшейся части параграфа рассмотрим относительные достоинства -+ и недостатки каждой из схем управ- * Рис. 10.9. Три оптимальные по быстро¬ действию траектории (Л, В и С) к началу координат, соответствующие схемам А, В и С ления. Такое знание позволит проек¬ тировщику принять решение на тельно свойств каждой из схем управ¬ ления. 1. Практическая реализация. Так как целью является уменьшение до нуля скоростей ух (/) и у2 (/), то мы должны быть в состоянии измерять эти скорости. Измерения скоростей необходимы для всех трех схем. Схемы А и В требуют вычисления величин <х>хх (/) = І^Уі (0 и (ох2 (0 = (t), потому что линии переключения определяются как кривые на плоскости cojq — сох2 (см. рис. 10.6, а и б). Таким образом, мы должны вычислить постоянную со = у3. Это означает, что мы должны также измерять и угловую скорость у3. При использовании таких измерений блок-схема оптимальной системы управления аналогична показанной на рис. 7.42. Сигнал a (t) на рис. 7.42 представляет собой управление, включающее двигатель JA (см. рис. 10.4, а). Блок-схема оптимальной системы управления по схеме В аналогична показанной на рис. 7.61. Сигнал т (/) есть управление, включающее двигатель JB\ а сигнал п (/) — управление, включающее двигатель JB* (см. рис. 7.61 и 10.4, в). Схема управления с верньерным двигателем (схема С) существенно отличается от первых двух. Прежде всего двигатель Jc (см. рИС. 10.4, с) должен в течение всего времени управления развивать максимальную тягу. Таким образом, от системы управления требуется правильно напра- 741
вить двигатель Jc. Это означает [см. уравнение (10.180)1, что двигатель Jc должен поворачиваться так, чтобы угол Ѳ (/) был равен e(/)=arctg^g-. В этом случае сразу видно, что не требуется вычислять сигналы ыхА (/) и cùx2 (t), а также измерять скорость у3. Таким образом, оптимальная си¬ стема управления по схеме С должна: 1) измерять скорости у± (/) и у2 (Z); 2) вычислять угол Ѳ = arctg 3) использовать следящую систему для поворота Jc. Теперь можно сравнить три схемы с точки зрения требующейся си¬ стемы управления. Схемы А и В требуют измерения у3 и использования генераторов нелинейных функций для получения линий переключения. Схема С требует очень простого вычислительного устройства для нахо¬ ждения Ѳ (0 и высококачественной следящей системы для управления направлением двигателя Jc. Трудно сказать, какая из схем более надежна и технологична. Эти расчеты зависят от конкретной системы. 2. Потребление топлива. Мы сравниваем три схемы управления. В основу сравнения положим равенство расхода топлива ср всеми тремя т схемами. Так как потребляемое топливо пропорционально J ср dt и о поскольку схема С требует меньшего времени для перевода в нуль любого исходного состояния, то можно сделать вывод, что схема с верньерным дви¬ гателем потребляет меньше топлива, чем схемы с фиксированными двига¬ телями. Кроме того, из закона управления 10.26 известно, что оптимальное по быстродействию управление по схеме С является также оптимальным и по расходу топлива. Следовательно, по потреблению топлива схема С «лучше» схем А и В. 3. Случай, когда скорость z/3 (/) переменна. При формулировке физи¬ ческой задачи мы полагали угловую скорость у3 (t) в начальный момент времени t = 0 равной заданной величине у3. Это означает, что вначале мы установили желаемую величину скорости у3 (t), и лишь после этого сде¬ лали равными нулю две остальные угловые скорости. Математическим следствием такого предположения явилась линейность и инвариантность во времени дифференциальных уравнений (10.163) относительно угловых моментов (/) и х2 (0- Предположим, что мы изменили задачу следующим образом. В начальный момент t = 0 измеряем три угловые скорости у± (0), у2 (0) и у3 (0), причем начальное значение у3 (0) не равно желаемому: </з(0) Уз (10.187) и г/і (0) 0; </2 (0)^=0. (10.188) Угловой скоростью у3 (0 можно управлять независимо с помощью двигателя J3. Так как у3 (t) определяется уравнением (10.149), можно найти со (Z), приняв œ(Z) = ÙZÏ2i/3(Z). (10.189) 742
Тогда дифференциальные уравнения относительно угловых моментов (t) и х2 (/) примут вид X1(0 = Co(/)x2(/) + zïl(/); (/) — w (О-ч (0 4“ ^2 (О- (10.190) Так как эти уравнения зависят от времени, результаты § 7.7 и 7.9 для определения линий переключения использовать нельзя. Для отыскания оптимальных по быстродействию моментов по схемам А или В мы должны найти некоторый класс меняющихся со временем линий переключения, которые будут зависеть от со (/). При использовании схемы С оптимальное управление не зависит от со (7), и поэтому уравнение (10.180) (определя¬ ющее угол Ѳ (0 в зависимости от угловых скоростей) остается в силе и тогда, когда со (Z) является функцией времени. Причина этого в том, что система с переменными параметрами (10.190) является системой с инва¬ риантной нормой, а следовательно, к ней применимы законы управления 10.2а и 10.26. Система с верньерным двигателем может использоваться для перевода в ноль iji (0) и у2 (0) за минимальное время и при минимальном расходо¬ вании топлива одновременно с управлением скоростью z/3 (/). Чтобы ре¬ шить ту же задачу по схемам А или В, мы должны построить генераторы нелинейных функций, зависящих от времени, и требовать, как и раньше, больше времени и топлива. Выполнение зависящих от времени генера¬ торов нелинейных функций — куда более сложная проблема, чем раз¬ работка исполнительного устройства, устанавливающего двигатель Jc по требуемому направлению Ѳ (/) = arctg у . Итак, мы нашли, что из трех схем оптимального управления схема С требует наименьшего времени и наименьшего количества топлива для пере¬ вода в нуль любых начальных скоростей у± (0) и у2 (0). Более того, опти¬ мальная по быстродействию система управления по схеме С не зависит от скорости вращения у3 (/) (которая не обязательно должна быть постоян¬ ной), тогда как схемы А и В зависят от у3 (t). Мы против того, чтобы рекомендовать ту или иную схему проектиров¬ щику. Наша цель — скорее показать, как можно использовать теорию оптимального управления на стадии предварительного проектирования для осмысленного выбора конкретной схемы управления. Решение хорошо сформулированной оптимальной задачи — удел математики, но при выборе области ограничений очень многое зависит от инженера. Поэтому инженер всегда должен пытаться установить свойства системы оптимального управ¬ ления для различных возможных областей ограничений управления. Упражнение 10.9. Рассмотрите систему х1(0=х2(/) + «1(0; 1 (10191) х2 (/) = -Х1 (t) + u2 (t). J Считайте, что управляющий вектор u (t) принадлежит к трем различным областям ограничений Qx, Q2 и Q3, определенным как Й! = {«(/): (0 + «'І (0 < 1; (10.192) й, = {в(0:|И1(01<1; І«2 (01 < 1); (10.193) й3 = (и (/) : uj (t) + U“ (Z) < Кф (10.194) 743
Предположите, что при t = 0 исходным состоянием системы является (£х, 0). Пусть для перевода О) в (0, 0) при /* t * L1 ^2 Начертите графики — и — в зави- z2 £*, /2* и —минимальные времена, требующиеся и (0 € «(0 6 ^2 и и (t) Ç Q3 соответственно. СИМОСТИ ОТ I ёі |. Примите, что израсходованное топливо измеряется следующим образом: (10.195) Начертите графики -г- и 12 гз в зависимости от |?і]. 10.8. РЕКОМЕНДАЦИИ ПО ДАЛЬНЕЙШЕМУ ЧТЕНИЮ ЛИТЕРАТУРЫ В этой главе мы показали, что неравенство Шварца можно использо¬ вать для решения оптимальных задач определенного класса. Использо¬ вание функционального анализа (а не теории принципа минимума) при исследовании задач оптимального управления нашло свое отражение в ли¬ тературе [125], [126], [135], [136], [137] и [194]. Использование верньерных ракетных двигателей для движения ракет и других космических аппаратов приводит к ограничениям вида || и (t) || < т, налагаемым на управляющую переменную и (t). В работе [151] рассматриваются такие задачи и содержатся дополнительные ссылки. В работе [1601 также рассматриваются ограничения типа || и (t) || < т и схемы наведения на среднем участке траектории, оптимальные по рас¬ ходу топлива, а также итерационная процедура вычисления оптимальной траектории. Способы «локальной оптимизации» (т. е. способы выбора управления таким образом, чтобы скорость изменения ||х (/)|| была возможно «более отрицательна») очень привлекательны с практической точки зрения. На примере 10.2 мы продемонстрировали недостаток такого способа, состоящий в том, что состояние переводится не в нуль. Тем не менее эта идея «локальной оптимизации», вероятно, может быть использована при разработке субоптимальных систем управления. Дополнительные резуль¬ таты заинтересованный читатель может найти в работе [108].
ЛИТЕРАТУРА r\ а 1 DA hd n a s s i a d e s M. and Smith O. J. M. Theory and Design of High Order Bang Bang Control Systems. «IRE Trans. Autom. Control», Vol. AC—6 1961 pp. 125—134. ’ 2. A t h an as si ad es M. Bang-Bang Control for Tracking Systems. «IRE Trans. Autom. Control», Vol. AC—7, 1962, pp. 77—78. m Tæ a n/hsJ аЛ e s On Linear Control Systems Which Minimize the l ime Integral of the Absolute Value of the Control Function (Minimum-fuel Control Sys¬ tems), «MIT Lincoln Lab. Rept.» 22G—4, Lexington, Mass., May, 1962. m 4- Athanass i a d e s M. and F a 1 b P. L. Time Optimal Control for Plants with Numerator Dynamics. «IRE Trans. Autom. Control», Vol. AC-7, 1962, pp. 46—47. 5. A th a n a s s i a d e s M. and F a 1 b P. L. Time Optimal Velocity Control of a Spining Space Body, «MIT Lincoln Lab. Rept.», 22G-8, Lexington, Mass, 1962, July. ... t; A с аіП a SjSJ a d M. Optimal Control for Linear Time Invariant Plants with Time- Fuel-, and Energy Constraints. «IEEE Trans. Appl. Ind. », Vol. 81, 1963, p. 321-325 7. A th a ns M Minimum Fuel Feedback Control Systems: Second Order Case. «IEEE Trans. Appl. Ind.», Vol. 82, 1963, pp. 8—17. ™ n8‘ tA t h ax П s Time- and Fuel-optimal Attitude Control «MIT Lincoln Lab. Rept.» 22G-9, Lexington, Mass, 1963, May. f <?*. Albans M. F a 1 b P. L. and R. T. L а с о s s. Time Optimal Velocity Control of a Spinning Space Body. «IEEE Trans. Appl. Ind.» Vol. 83, 1963, pp. 206—214. + . 9’ xC * b ? nfs М-» F a I b P- L. and L а с о s s R. T. Time-, Fuel-, qand Energy- Vol mAC-8 ^963 °ppN?96—N°rm'^ПѴаГ^аП^ Systems- <<IEEE Trans’ Autom’ ^trol», Çvcfal1* Atrpc M‘ Aand F aJ bx P’ L* T’^e-op t ima 1 Control for a Class of Nonlinear Systems. «IEEE Trans. Autom. Control», Vol. AC-8, 1963, p. 379. дяі^ЧА i h a П F a 1 b Ap- L- and L а с о s s r’. T. On’Optimal Control of Self Adjoint Systems. «IEEE Trans. Appl. Ind.» Vol. 83, 1964, pp. 161—166. ircc3TAt hAa niS TML Minimum Fuel Control of Second Order Systems with Real Poles. «IEEE Trans. Appl. Ind.» Vol. 83, 1964, pp. 148—153. с t b a n s M. and Canon M. D. Fuel-optimal Singular Control of a Nonlinear Second Order System, preprints 1964, Joint Autom. Control Conf., pp. 245—255, June 1964 15. A J h a n sM Fuel-optimal Control of a Double Integral Plant with Response Time Constraints. «IEEE Trans. Appl. Ind.», Vol. 83, 1964 pp 240—246 H . B V a пГ I? h П a 9 A; V1 and Ne us t a d t L. W. (eds.). Computing Methods in Optimization Problems, «Academic Press Inc»., New York, 1964. 17. B a ss R. W. Optimal Feedback Control System Design by the Adjoint System Aeronca Tech. Report 60—22A, Baltimore, Md., 1960, June. У Berlin ^196je C e П a C E* F’ and Bel l am an R. «Inequalities.» Springer-Verlag OHG d ki19* B 6 1 lmAa Пі 9 1 \СЛ S b e rg L and Gr о s s O. On the Bang-Bang Control Problem. Quart. Appl. Math., Vol. 14, 1956, pp. 11—18. m t m a n R‘ <<DYnamic Programming». Princeton University Press, Princeton, M ііп95іоЛТСЯ русский перевод. Б е л м а н Р. Динамическое программирование М., ИЛ, 1960, 400 стр.). .. ё1' ,в ’ m а п п- introduction to Matrix Analysis». McGraw-Hill Book Company New York, I960. Г> tr-22: BeI,maV , «Mathematical Optimization Techniques». University of Califirma Press, Berkeley, Calif., 1963. ? • 23; BMeLk ? v j V V D/ Variational Methods in Problems of Control and Program¬ ming. «J. Math. Anal. Appl.», Vol. 3, 1961, pp. 145—169. ë 745
24. В і г к h о f f G. and Mac Lane S. «A Survey of Modem Algebra», rev. ed., The Macmillan Company, New York, 1958. 25. B i r к h о f f G. and Rota G. C. «Ordinary Differential Equations». Ginn and Company, Boston, 1962. 26. В 1 i s s G. «Calculis of Variations». Mathematical Association of America. The Open Court Publishing Company Lasalle Ill. 1925. (Имеется русский перевод. Блисс Г. А. Лекции по вариационному исчислению. М., ИЛ, 1950). 27. В о g п е г L. An Investigation of the Switching Criteria for Higher Order Con¬ tactor Servomechanisms. «Cook Res. Lab. Rept.» PR-16-9, 1953. 28. В о g n e r I. and K a z d a L. F. An Investigation of the Switching Criteria for Higher Order Contactor Servomechanisms. «Cook Res. Lab. Rept». PR-16-9, 1953. 29. В о y a d j i e f f G. et all. Some Applications of the Maximum Principle to Second Order Systems, Subject to Input Saturation, Minimizing Error, and Effort, «J. Basis Eng.», Vol. 86, 1964, pp. 11—22. (Имеется русский перевод. Бояджиев, Иглстон, Так, Су та бу тр а, проф. Такасахи. О применении принципа максимума к системам второго порядка с насыщением входного сигнала с целью минимизации ошибки или управления. Теоретические основы инженерных расчетов, Русский перевод, № 1, 1964, стр. 16—31). 30. В г е a k w е 1 1 J. V. The Optimization of Trajectories, J. SIAM, Vol. 7, 1959, pp. 210—247. 31. В г e a к w e 1 1 J. V., S p e v e r J. L. and Bryson A. E. Optimization and Control of Nonlinear Systems Using the Second Variation. «J. SIAM Control», ser. A, Vol. 1, 1963, pp. 193—223. 32. В г e a к w e 1 1 J. V. and Ho Y. C. On the Conjugate Point Condition for the Control Problem. «Harvard Univ. Cruft Lab. Tech. Rept.» 441, Cambridge, Mass, March, 1964. 33. B r i d g 1 a n d T. F. On the Existence of Optimal Feedback Controls. J. SIAM Control, ser. A, Vol. 1, 1963, pp. 261—274. 34. В г о c к e t t R. W. The Invertibility of Dynamical Systems with Application to Control. Ph. D. dissertation, Case Institute of Technology, Cleveland May, 1963. 35. Brockett R. W. and Mesarovic M. The Reproducibility of Multivariable Systems, preprints 1964, Joint Autom. Control Conf. June, 1964, pp. 481—486. 36. В г о с к e t t R. W., Poles, Zeroes and Feedback: State Space Interpretation, IEEE Trans. Autom. Control, Vol. AC-10, 1965, pp. 129—135. 37. B r y s о n A. E. and Denham W. F. A Steepest-ascent Method for Solving Optimum Programming Problems. «J. Appl. Mech.» ser. E, Vol. 29, 1962, pp. 247—257. (Брайсон, Денхэм. Решение задачи оптимального программирования методом быстрейшего подъема. «Прикладная механика», русский перевод, № 4, 1962, стр. 32). 38. В u s h a w D. W. Differential Equations with a Discontinuous Forcing Term. Stevens Inst. Technol. Experimental Towing Tank Rept. 469, Hoboken, N. J., 1953, January. 39. B u s h a w D. W. Optimal Discontinuous Forcing Terms, in S. Lefschetz (ed.), Contributions to the Theory of Nonlinear Oscillations, Vol. 4, pp. 29—52, Princeton Uni¬ versity, Press, Princeton, N. J., 1958. 40. Caratheodory C. Variationsrechnung und Partielle Differentialglei- chungen erster Ordnung. B. G. Teubner Verlagsgesellschaft, mb, Leipzig, 1935. 41. C h a n d a k e t P., L e о n d e s С. T. and D e 1 a n d E. C. Optimum Non linear Bang-Bang Control Systems with Complex Roots. «Trans. AIEE», pt. II, Vol. 80, 1961, pp. 82—102. 42. C h a n g S. S. L. Synthesis of Optimum Control Systems. McGraw-Hill Book Com¬ pany, New York, 1961. (Имеется русский перевод. Чанг Ш. С. Л. Синтез оптимальных систем автоматического управления. «Машиностроение», М., 1964). 43. С h a n g S. S. L. An Extension of Ascoli’s Theorem and Its Applications to the Theory of Optimal Control, New York Univ. Dept. Elec. Eng. Tech. Rept. 400—51, 1962, New York. 44. C h a n g S. S. L. Sufficient Condition for Optimal Control of Linear Systems with Nonlinear Cost Functions, preprints, 1964. Joint Autom. Control Conf. ,1964, June, pp. 295-296. 45. C h z h a n S y - I n. On Sufficient Conditions for an Optfhium. Appl. Math. Mech., Vol. 25, 1961, pp. 1420—1423. (Чжан С ы - и н. К теории оптимального регу¬ лирования. «Прикладная математика и механика», т. 25, 1961, вып. 3, стр. 413—419). 46. С о d d i n g t о n E. A. and Levinson N. Theory of Ordinary Differential Equations, McGraw-Hill Book Company, New York, 1955. 47. Den h a m W. F. Steepest-ascent Solution of Optimal Programming Problems, Harvard Summer Program. 1963, «Optimization of Dynamic Systems», Rayteon Co. Space and Inform. Systems Div. Rept., Bedford, Mass., 1963. 48. D e s о e r C. A. The Bang-Bang Servo Problem Treated by Variational Techni¬ ques, Inform, and Control, Vol. 2, 1959, pp. 333—348. 49. D e s о e r C. A. Pontryagin’s Maximum Principle and the Principle of Optima¬ lity. «J. Franklin Inst.», Vol. 271, 1961, pp. 361—367. (Имеется русский перевод. Де¬ зо э p К. А. Принцип максимума Понтрягина и принцип оптимальности. «Механика», № 5, 1962, стр. 15—21). 746
50. D e m’ у а п о V V. F. and Khomenyuk V. V. The Solution of a Linear Problem in Optimal Control. «Automation and Remote Control», Vol. 24, 1964, pp. 1068—1070. (Демьянов В. Ф.. Хоменюк В. В. Решение одной линейной задачи оптималь¬ ных управлений. «Автоматика и телемеханика», т. 24, 1963, стр. 1174—1177). 51. Dieudonne J. «Foundations of Modern Analysis» Academic Press, Inc., New York, 1960. 52. D о 1 1 H. G. and Stout T. M. Design and Analogue Computer Analysis of an Optimum Third-order Non-linear Servomechanism. «Trans. ASME», Vol. 79, 1957, pp. 513-525. 53. D r e y f u s S. E. Dynamic Programming and the Calculus of Variations. «J. Math. Anal. Appl.», Vol. 1, 1960, pp. 228—239. 54. D r e y f u s S. E. Variational Problems with Inequality Constraints. «J. Math. Anal. Appl.», Vol. 4, 1962. pp. 297—308. 55. D r e y f u s S. E. and E I . i о t J. R. An Optimal Linear Feedback Guidance Scheme, J. Math. Anal. Appl., Vol. 8, 1964, pp. 364—386. 56. D u b о V i t s k i i A. Y. and Milyutin A. A. Certain Optimality Problems for Linear Systems. «Automation and Remote Control», Vol. 24, 1964, pp. 1471 —1481. (Дубовицкий А. Я., Милютин А. А. Некоторые оптимальные задачи для линейных систем. «Автоматика и телемеханика», т. 24, 1963, № 12, стр. 1616—1625). 57. Eaton J. Н. An Iterative Solution to Time Optimal Control, J. Math. Anal. Appl., Vol. 5, 1962, pp. 329—344. 58. E d e 1 b a u m T. Theory of Maxima and Minima, in G. Leitman (ed.). Optimi¬ zation Techniques. Academic Press. Inc., New York, 1962. (Эдельбаум T. Теория мак¬ симумов и минимумов. «Методы оптимизации с приложением к механике космического полета» под ред. Дж. Лейтмана. Пер. с англ, под ред. В. А. Троицкого, Изд. «Наука», М., 1965, гл. 1, стр. 19—53). 59. E g g 1 e s t о n H. G. «Convexity». Cambridge University Press, London, 1958. 60. Fa dden E. J. and Gilbert E. G. Computational Aspects of the Time-opti¬ mal Control Problem, In Balakrishnan A. V. and Neustadt L. W. (eds.), «Computing Methods in Optimization Problems». Academic Press Inc., New York, 1964. 61. F a 1 b P. L. and A t h a n s M. A Direct Proof of the Criterion for Complete Con¬ trollability of Time-invariant Linear Systems. «IEEE Trans. Autom. Control», Vol. AC-9, 1964, pp. 189—190. 62. F i 1 i p p о V A. F. On Certain Questions in the Theory of Optimal Control. J. SIAM Control, ser. A, Vol. 1, 1962, pp. 76—84. 63. Flügge-Lotz and Frederickson A. A. Contactor Control of Higher- order Systems Whose Transfer Functions Contain Zeros, Stanford Univ. Div. Eng. Meeh. Tech. Rept., 119, Stanford, Calif., 1959. 64. F 1 ü g g e - L о t z I. and Ichikawa T. Investigation of Third-order Con¬ tactor Control Systems with Two Complex Poles without Zeros, NASA Tech. Note, D248, 1960. 65. F 1 ü g g e - L о t z L. Synthesis of Third-Order Contactor Systems. Proc. First IFAC Congr., 1961, pp. 390—397. (Ф л югге-Лотц И. Синтез релейных систем регу¬ лирования третьего порядка. Труды I Международного конгресса Международной феде¬ рации по автоматическому управлению. T. II. Изд-во АН СССР. М., 1961, стр. 290—304). 66. F 1 ü g g e - L о t z I. and Vin M i h. On the Optimum Response of Third- order Contactor Control Systems. Stanford Univ. Eng. Meeh. Rept. 125, Stanford, Calif., 1960. 67. F 1 ü g g e - L о t z I. and H a 1 k i n H. Pontryagin’s Maximum Principle and Optimal Control. Stanford Univ. Div. Eng. Meeh. Tech. Rept., 130, Stanford, Calif., 1961. 68. F 1 ü g g e - L о t z I. and Ishikawa T. Investigation of Third-order Contac¬ tor Control Systems with Zeros in Their Transfer Functions. NASA Tech. Note, D719, 1961. 69. F 1 ü g g e - L о t z I. and M i h Yin. The Optimum Response of Second-order Velocity-controlled Systems with Contactor Control. J. Basic Eng., Vol. 83, 1961, pp. 59—64. (Флюгге-Лотц H., Ми Ин. Оптимальный переходный процесс систем второго порядка с релейным управлением по скорости. «Техническая механика» Русский пере¬ вод, 1961, № 1, стр. 75—81). 70. F 1 ü g g e - L о t z L. and Titus H. A. The Optimum Response of Full Third- order Systems with Contactor Control. J. Basic. Eng., 1962, pp. 554.—558. (Флюгге- Лотц, Титус, Оптимальные переходные процессы полных систем третьего порядка с релейным управлением. «Техническая механика». Русский перевод, 1962, № 4, стр. 172—176). 71. Flügge-Lotz I. and Marbach H. The Optimal Control of Some Atti¬ tude Control Systems for Different Performance Criteria. J. Basic Eng., Vol. 85, 1963, pp. 165—176. (Флюгге-Лотц И. и Марбах. Оптимальное управление в неко¬ торых системах угловой ориентации при различных критериях качества. «Техническая механика».Русский перевод, т. 89, 1963, № 2, стр. 38—54). 72. F 1 ü g g e - L о t z I. and M a 1 t z M. D. Attitude Stabilization Using a Con¬ tactor Control System with a Linear Switching Criterion (to be published in Automatica). 73. F о y W. H. Fuel Minimization in Flight Vehicle Attitude Control. IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 84—88. 747
74. F г i e d 1 а п d В. Minimum Response-time Controller for Amplitude and Energy Constraints. IRE Trans. Autom. Control. Vol. AC-7, 1962, pp. 73—74. 75. F r i e d 1 a n d B. The Structure of Optimum Control Systems. J. Basic Eng. Vol. 84, 1962, pp. 1—12. (Ф p и д л e и д. Структура оптимальных систем регулирования. «Техническая механика». Серия Д. Русский перевод, 1962, № 1, стр. 3—17). 76. F г i e d 1 a n d В. The Design of Optimum Controllers for Linear Processes with Energy Limitations. J., Basic Eng., Vol. 85, 1963, pp. 181 —196. (Ф p и д л e н д. Опти¬ мальные регуляторы для линейных процессов при наличии ограничений по расходу энер¬ гии. «Техническая механика». Русский перевод, том 85, 1963, № 2, стр. 60—80). 77. F г i e d 1 a n d В. Optimum Control of an Aerodynamically Unstable Booster. General Precision Aerospace Res. Rept., 63-RC-8, Little Falls, N. J., November, 1963. 78. F r i e d m a n A. Optimal Control for Hereditary Processes. Arch. Rational Mcch. Anal. Vol. 15, 1964, pp. 396—416. 79. G a m b i 1 1 R. A. Generalized Curves and the Existence of Optimal Controls. J. SIAM Control ser. A, Vol. 1, 1963, pp. 246—260. 80. G e 1 f a n d I. M. and Fomin S. V. «Calculus of Variations». Prentice-Hall, Inc., Englewood Cliffs, N. J., 1963. (Гельфанд M. M., Фомин С. В. «Вариацион¬ ное исчисление». M., Физматгиз, 1961, 228 стр.). 81. Gibson J. Е. «Nonlinear Automatic Control». McGraw-Hill Book Company. New York, 1963. 82. G i 1 b e г t E. G. Controllability in Multivariable Control Systems. J. SIAM Control, ser. A, Vol. 1, 1963, pp. 128—151. 83. G i 1 b e г t E. G. The Application of Hybrid Computers to the Iterative Solution of Optimal Control Problems, in В a 1 a k r i s h n a n A. V. and Neustadt J.W. (eds.), «Computing Methods in Optimization Problems», Academic Press Inc., New York, 1964. 84. G i 1 1 e J. C. et al.: «Feedback Control Systems». McGraw-Hill Book Company. New York, 1959. 85. G о 1 d s t e i n H. «Classical Mechanics». Addison-Wesley Publishing Company, Inc. Reading, Mass, 1959. 86. G о t t 1 e b G. «Energy Optimum systems with Constraints on the Control and the Response Time», M. S. Thesis Massachusetts Institute of Technology, Cambridge, Mass, May, 1964. 87. H a 1 k i n H. Liapunov’s Theorem on the Range of a Vector Measure and Pon¬ tryagin’s Maximum Principle. Arch. Rational Meeh. Anal., Vol. 10, 1962, pp. 296—304. 88. H a 1 k i n H. The Principle of Optimal Evolution, in J. P. LaSalle and S. Lef- schetz (eds.) «Nonlinear Mechanis», Academic Press Inc. New York, 1963. 89. H a 1 k i n H. On the Necessary Condition for Optimal Control of Nonlinear Sys¬ tems. J. Anal. Math., Vol. 12, 1963, pp. 1—82. 90. H a 1 m о s P. R. «Finite Dimensional Vector Spaces». 2d ed. D. Van Nostrand Company, Inc., Princeton, N. J., 1958. 91. Hancock H. «The Theory of Maxima and Minima». Ginn and Company, Boston, 1907; also Dover Publications Inc., New York, 1960. 92. H а r V e у C. A. Determining the Switching Criterion for Time Optimal Control. J. Math. Anal. Appl. Vol. 5, 1963, pp. 245—257. 93. H а г V e у C. A. and Lee E. B. On the Uniqueness of Time-Optimal Control for Linear Processes. J. Math. Anal. Appl., Vol. 5, 1962, pp. 258—268. 94. H e r m e s H. and Haynes G. On the Nonlinear Control Problem with the Control Appearing Linearly. «J. SIAM Control ser. А», Vol. 1, 1963, pp. 185—205. 95. Ho Y. C. A Successive Approximation Technique for Optimal Control Systems Subject to Input Saturation J. Basic Eng., Vol. 84, 1962, pp. 33—40. (X о Ю - Ш и. Метод последовательных приближений для оптимальных систем регулирования с ограничением по управляющему сигналу. «Техническая механика». Серия Д. Русский перевод. 1962, № 1, стр. 44—53). 96. Н о p k i n А. М. А Phase Plane Approach to the Design of Saturating Servome¬ chanisms. Trans. AIEE, Vol. 70, 1950, pp. 631—639. 97. H о w a r d D. R. and Rekasius Z. V. Determination of Reachable Zone Boundaries. Aerospace Corp. Rept. ATN-64 (4540-70)-l, Los Angeles, Calif., June 1964. 98. H u t c h i n s о n С. E. Minimum Time Control of a Linear Combination of State Variables. Stanford Univ. Electron. Lab. Systems Theory Lab. Tech. Rept., 6311-1, Stan¬ ford, Calif., August, 1963. 99. J e n - W e i C. A. Problem in the Synthesis of Optimal Systems Using Maximum Principle. Automation and Remote Control, Vol. 22, 1962, pp. 1170—1176. ^Чжан Жэнь- в e й. Одна задача синтеза оптимальных систем по принципу максимума. «Автоматика и телемеханика», т. 22, 1961, № 10, стр. 1302—1308). 100. J e n - W е і С. Synthesis of Relay Systems from the Minimum Integral Quadratic Deviation. Automation and Remote Control, Vol. 22, 1962, pp. 1463—1469. (Чжан Ж e н ь- в е й. Синтез релейных систем по минимуму интегральных квадратичных отклонений. «Автоматика и телемеханика», т. 22, 1961, № 12, стр. 1601—1607). 748
101. J о h п s о п С. D. and Gibson J. E. Singular Solutions in Problems of Opti¬ mal Control. IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 4—14. 102. Johnson C. D. and W о n h a m W. M. On a Problem of Letov in Optimal Control, preprints 1964, Joint Autom. Control, Conf., June 1964, pp. 317—325. 103. Johnson C. D. and Gibson J. E. Optimal Control of a Linear Regulator with Quadratic Index of Performance and Fixed Terminal Time. IEEE Trans. Autom. Control, Vol. AC-9, 1964, pp. 355—360. 104. Johnson C. D. Singular Solutions in Problems of Optimal Control in С. T. Leondes (ed.), «Advances in Control Systems: Theory and Applications», Vol. 11, Aca¬ demic Press Inc., New York, 1965. 105. Kalman R. E. Analysis and Disign Principles of Second and Higher Order Saturating Servomechanisms. «Trans. AIEE», pt. II, Vol. 74, 1955, pp. 294—310. 106. Kalman R. E. On the General Theory of Control Systems. «Proc. First IFAC Congr.», pp. 481—493. (К а л m a h P. E., Об общей теории систем управления. Труды I Международного Конгресса Международной федерации по автоматическому управле¬ нию. Изд-во АН СССР. М., 1961, стр. 521—546). 107. Kalman R. Е. Contributions to the Theory of Optima. Control. Bol. Soc. Mat. Mex., Vol. 5, 1960, pp. 102—119. 108. Kalman R. E. and Bertram J. E. Control Systems Analysis and Design via the Second Method of Lyapunov. S. Basic Eng., Vol. 82, 1960, pp. 371—393. 109. Kalman R. E. et. all. Controllability of Linear Dynamical Systems in «Con¬ tributions to Differential Equations», Vol. 1, John Wiley & Sons. Inc., New York, 1962. 110. Kalman R. E. et. al. Fundamental Study of Adaptive Control Systems. Wright- Patterson Air Force Base Tech. Rept. ASD-TR-61-27, Vol. 1, April, 1962. 111. Kalman R. E. Canonical Structure of Linear Dynamical Systems, Proc. Natl. Acad. Sci. U. S., Vol. 48, 1962, pp. 596—600. 112. Kalman R. E. The Theory of Optimal Control and the Calculus of Variations, in R. Bellman (ed.), «Mathematical Optimization Techniques», University of California Press. Berkeley, Calif., 1963. 113. Kalman R. E. Mathematical Description of Linear Dynamical Systems. J. SIAM Control, ser. A, Vol. 1, 1963, pp. 152—192. 114. Kalman R. E. When Is a Linear Control Optimal? J. Basic Eng., Vol. 86, 1964, pp. 51—60. (К а л m a h P. E. Когда линейная система управления является опти¬ мальной. Т. 4. «Теоретические основы инженерных расчетов». Русский перевод № 1, 1964, стр. 69—84). 115. Kelley H. J. Guidance Theory and Extremal Fields, IRE Trans. Autom. Con¬ trol., Vol. AC-7, 1962, pp. 75—81. 116. Kelley H. J. Method of Gradients in G. Leitman (ed.) «Optimization Techni¬ ques». Academic Press Inc., New York, 1962. (Имеется русский перевод. Келли Г. Дж. Метод градиентов «Методы оптимизации с приложением к механике космического полета». Под ред. Дж. Лейтмана. Пер. с англ, под ред. Троицкого В. А. Изд. «Наука», М., № 1965, гл. 6, стр. 244—308). 117. К і г і 1 1 о V a L. S. The Problem of Optimizing the Final State of a Controlled System. «Automation and Remote Control», Vol. 23, 1963, pp. 1485—1494. (Кирил¬ лова Л. С. Задача об оптимизации конечного состояния регулируемой системы. «Автоматика и телемеханика». Т. 23, 1962, № 12, стр. 1584—1594). 118. Kirillova L. S. An Existence Theorem in Terminal Control Problems. «Auto¬ mation and Remote Control», Vol. 24, 1964, pp. 1071—1074. (Кириллова Л. С. Тео¬ рема существования для задачи терминального управления. «Автоматика и телемеха¬ ника», т. 24, 1963, стр. 1178—1182). 119. К і р i n i a k W. «Dynamic Optimization and Control». John Wiley & Sons, Inc., New York, 1961. 120. K i s h i F. H. The Existence of Optimal Controls for a Class of Optimization Problems. IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 173—175. 121. Kleinman D. L. «Fuel-optimal Control of Second and Third Order Systems with Different Time Constraints». M. S. thesis, Massachusetts Institute of Technology, Camb¬ ridge, Mass., June, 1963. 122. Knudsen H. K. «Maximum Effort Control for an Oscillatory Element», M. S. thesis University of California, Berkeley, Calif., February, 1960. 123. Knudsen H. K. An Iterative Procedure for Computing Time-Optimal Controls, IEEE Trans. Autom. Control., Vol. AC-9, 1964, pp. 23—30. 124. Kolmogorov A. and Fomin S. «Elements of the Theory of Functions and Functional Analysis», Vol. 1, «Metric and Normed Spaces», Graylock Press, Rochester, N. Y., 1957. (Колмогоров A. H. иФомин С. В. Элементы теории функций и функ¬ ционалов. М., Изд-во Московского университета, 1960). 125. К г а n с G. M. and S а г а с h i k P. E. An Application of Functional Analysis to the Optimum Control Problem. J. Basic Eng., Vol. 85, 1963, pp. 143—150. (Крэнк Дж., Сарачик П. Применение функционального анализа и задача оптимального управле¬ ния. «Техническая механика». Русский перевод, 1963, № 2, стр. 10—19). 749
126. Krasovskii N. N. On the Theory of Optimum Regulation. Automation and Remote Control, Vol. 18, 1958, pp. 1005—1116. (Красовский H. H. К теории опти¬ мального регулирования. «Автоматика и телемеханика». Т. 18, 1957, № 11, стр. 960—970). 127. Krasovskii N. N. On the Theory of Optimum Control. Appl. Math. Meeh., Vol. 23, 1959, pp. 899—919. (Красовский H. H. К теории оптимального регули¬ рования. «Прикладная математика и механика», т. 23, 1959, вып. 4, стр. 625—639). 128. Krasovskii N. N. and Letov А. М. The Theory of Analytical Design of Controllers. «Automation and Remote Control», Vol. 23, 1962, pp. 649—656. (Красов¬ ский H. H., Летов A. M. К теории аналитического конструирования регуляторов. «Автоматика и телемеханика», т. 23, 1962, № 6, стр. 713—720). 129. К г е i n d 1 е г Е. «Contributions to the Theory of Time-optimal Control». J. Franklin Inst., Vol. 275, 1963, pp. 314—344. 130. К г e ’ n d 1 er E. and S a г a c h i k P. E. On the Concept of Controllability and Observability of Linear Systems. IEEE Trans. Autom. Control, Vol. AC-9,1964, p. 129—136. 131. Kro to V V. F. Methods for Solving Variational Problems on the Basis of the Sufficient Conditions for an Absolute Minimum I. Automation and Remote Control, Vol. 23, 1963, pp. 1473—1484. (Кротов В. Ф. Методы решения вариационных задач на основе достаточных условий абсолютного минимума. Часть I. «Автоматика и телемеханика», т. 23, 1962, № 12, стр. 1571 — 1583). 132. Krotov V. Е. Methods for Solving Variational Problems Sliding Regimes. «Automation and Remote Control», Vol. 24, 1963, pp. 539—553. (Кротов В. Ф. Методы решения вариационных задач. II. Скользящие режимы. «Автоматика и телемеханика», т. 24, 1963, № 5, стр. 581—598). 133. К u b a R. E. and К a z d a L. F. A Phase Space Method for the Synthesis of Nonlinear Servomechanisms. Trans. AIEE, pt. II, 1956, pp. 282—290. 134. K u b a R. E. and K a z d a L. F. The Design and Performance of a Model Second Order Nonlinear Servomechanism. IRE Trans. Autom. Control, Vol. AC-1, 1958, pp. 43—48. 135. Ku 1 i ko wsk i R. On Optjmum Control with Constraints, Bull Polish, Acad. Sci. Ser. Tech. Sci. Vol. 7, 1959, pp. 385—394. 136. Kulikowski R. Synthesis of a Class of Optimum Control Systems. Bull. Polish Acad. Sci., Ser. Tech. Sci., Vol. 7, 1959, pp. 663—671. 137. Kulikowski R. Optimizing Processes and Synthesis of Optimizing Auto¬ matic Control Systems with Nonlinear Invariable Elements, Proc. First. IFACCongr., pp. 473— 477. (Куликовский P. К оптимальным процессам и синтезу оптимальных систем с линейными и нелинейными неизменяемыми элементами. Труды I Международного кон¬ гресса Международной Федерации по автоматическому управлению. T. II, Изд-во АН СССР. М., 1961, стр. 491—505). 138. К u r t s V е і 1 Y. The Analytical Design of Control Systems. Automation and Remote Control, Vol. 22, 1961, pp. 593—599. (Курцвейль Я. К оптимальному кон¬ струированию регуляторов. «Автоматика и телемеханика», т. 22, 1961, № 6). 139. Ladd Н. О. Minimum Fuel Control of a Second Order Linear Process with a Con¬ straint on Time to Run. Raytheon Missile and Space Div., Rept. BR-2113, Bedford, Mass, November 1962. 140. LaSalle J. P. Time Optimal Control Systems. Proc. Natic Acad. Sci. U. S., Vol. 45, 1959, pp. 573—577. 141. L a S a 1 1 e J. P. The Time-optimal Control Problem in «Contributions to Diffe¬ rential Equations», Vol. V, pp. 120—124, 1960. 142. LaSalle J. P. The Time-optimal Control Problem, in «Contributions to Diffe¬ rential Equations», Vol. V, pp. 1—24. Princeton University Press, Princeton, N. J., 1960. 143. LaSalle J. P. The Bang-Bang Principle. Proc. First IFAC Congr., pp. 493— 497. (Лассаль Дж. П. Принцип оптимального релейного управления. Труды I Между¬ народного конгресса Международной федерации по автоматическому управлению. T. II, Изд-во АН СССР, М., 1961, стр. 548—557). 144. Lee Е. В. Mathematical Aspects of the Synthesis of Linear Minimum Response Time Controllers. IRE Trans. Control. Vol. AC-5, 1960, pp. 283—289. 145. Lee E. B. and Markus L. Optimal Control for Nonlinear Processes. Arch. Rational Meeh. Anal., Vol. 8, 1961, pp. 36—58. 146. Lee E. B. and Markus L. Synthesis of Optimal Control for Nonlinear Pro¬ cesses with One Degree of Freedom. Inst. Math. Acad. Sci. Ukrainian SSR, Kiev, 1961. (Л и И. Б., Маркус Л. Синтез оптимального регулирования для нелинейных про¬ цессов с одной степенью свободы. Труды Международного симпозиума по нелинейным колебаниям. Приложение методов нелинейных колебаний к задачам физики и механики. Киев, изд-во АН УССР, 1963) 147. Lee Е. В. On the Time-optimal Regulation of Plants with Numerator Dyna¬ mics. IRE Trans. Autom. Control, Vol. AC-6, 1961, pp. 351—352. 148. Lee E. B. A Sufficient Condition in the Theory of Optimal Control. J. SIAM Control, Ser. A, Vol. 1, 1963, pp. 241—245. 149. Lee E. B. Geometric Properties and Optimal Controllers for Linear Systems. IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 379—381. 750
150. Lee E. B. On the Domain of Controllability for Linear Systems. IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 172—173. 151. L e i t m a n n G. (ed.) «Optimization Techniques with Applications to Aerospace Systems». Academic Press Inc., New York, 1962. (Имеется русский перевод. Л e й м а н Дж. (ред.) Методы оптимизации с приложениями к механике космического полета. Пер. с англ, под ред. В. А. Троицкого. Изд. «Наука», М., 1965). 152. Le May J. L. Recoverable and Reachable Zones to Control Systems with Linear Plants and Bounded Controller Outputs, preprints 1964. Joint Autom. Control Conf., June 1964, pp. 305—312. 153. Letov A. M. Analytical Controller Design I. «Automation and Remote Control». Vol. 21, 1960, № 4, pp. 303—306 (Летов A. M. Аналитическое конструирование регуля¬ торов I. «Автоматика и телемеханика» Т. 21, 1960, № 5). 154. Letov А. М. Analytical Controller Design IL «Automation and Remote Cont¬ rol», Vol. 21, 1960, No. 5, pp. 389—393. (Летов A. M. Аналитическое конструирование регуляторов. II. «Автоматика и телемеханика». Т. 21, 1960, № 5). 155. Letov А. М. The Analytical Design of Control Systems «Automation and Remote Control». Vol. 22, 1961, pp. 363—372. (Летов A. M. Аналитическое конструирование регуляторов. Метод динамического программирования. IV. «Автоматика и телемеханика». Т. 22, 1961, № 4. 156. Litovehenko LA. Isoperimetric Problem in Analytic Design. «Automa¬ tion and Remote Control», Vol. 22, 1962, pp. 1417—1423. (Литовченко И. А. К изо¬ периметрической задаче аналитического конструирования. «Автоматика и телемеханика». Т. 22, 1961, № 12. 157. McDonald D. С. Nonlinear Techniques for Improving Servo Performance. Proc. Natl. Electron. Conf. Vol. 6, 1950, pp. 400—421. 158. McShane E. J. On Multipliers for Lagrange Problems. Am. J. Math., Vol. 61, 1939, pp. 809—819. 159. M e d i t c h J. S. Synthesis of a Class of Linear Feedback Minimum Energy Con¬ trols. IEEE Trans. Autom. Control. Vol. AC-8, 1963, pp. 376—378. 160. M e d i t c h J. S. and Neustadt L. W. An Application of Optimum Con¬ trol to Midcourse Quidance. Proc. Second IFAC Congr., Paper 427, Basle, 1963. (M e- д и ч Дж. С., H ь ю с т а д Л. У., Применение оптимального управления к наведению на среднем участке траектории. Труды II Международного конгресса Международной федерации по автоматическому управлению. Т. 2, изд-во «Наука», 1965, стр. 91—105). 161. Med itch J. S. On Minimal Fuel Satellite Attitude Controls. IEEE Trans. Appl. Ind., Vol. 83, 1964, pp. 120—128. 162. Me d i t c h J. S. On the Problem of Optimal Thrust Programming for a Lunar Soft Landing, preprints 1964, Joint Autom. Control Conf., June 1964, pp. 233—238. 163. Merriam C. W. «Optimization Theory and the Design of Feedback Control Systems». McGraw-Hill Book Company, New York, 1964. 164. Miele A. The Calculus of Variations in Applied Aerodynamics and Flight Mecha¬ nics in G. Leitman (ed.), «Optimization Techniques», Academic Press Inc., New York, 1962. (M и e л e А. Методы вариационного исчисления в прикладной аэродинамике и меха¬ нике полета. «Методы оптимизации с приложениями к механике космического полета». Под ред. Дж. Лейтмана, изд. «Наука», М., 1965, пер. с англ, под ред. В. А. Троицкого, гл. 4, стр. 130—208). 165. Neiswander R. S. and M а с N e а 1 R. Н. Optimization of Non-linear Control Systems by Means of Non-linear Feedbacks. Trans. AIEE. Pt. II, Vol. 72, 1953 pp. 262—272. 166. Neustadt L. W. Synthesizing Time-ootimal Control Systems. J. Math. Anal. Appl., Vol. 1, 1960, pp. 484—493. 167. Neustadt L. W. Time-optimal Control Systems with Position and Integral Limits. J. Math. Anal. Appl., Vol. 3, 1961, pp. 406—427. 168. Neustadt L. W. Minimum Effort Control Systems. J. SIAM Control, Ser. A, Vol. I, 1962, pp. 16— 31. 169. Neustadt L. W. The Existence of Optimum Controls in the Absence of Con¬ vexity Conditions. J. Math. Anal. Appl., Vol. 7, 1963, pp. 110—117. 170. Neustadt L. W., Paiewonsky B. On Synthesizing Optimal Controls. Proc. Second IFAC Congr., paper 421, Basle,4963. (Ньюстад Л. У., ПайевонскиБ. Синтез оптимальных систем управления. Труды II Международного конгресса Международ¬ ной федерации по автоматическому управлению. Т. 2. М., Изд-во «Наука», 1965,стр. 73—90). 171. Neustadt L. W. Optimization, a Moment Problem, and Nonlinear Programm¬ ing, Aerospace Corp. Rept. TDR-169-(3540-10)-TN-l, El Segundo, Calif., July, 1963. 172. Newton G. C., Goul d L. A. and Kaiser J. F. «Analytical Design of Linear Feedback Controls». John Wiley & Sons, Inc., New York, 1957. (Имеется русский перевод. Ньютон Дж. К., Гулд Л. А., Кайзер Дж. Ф. «Теория линейных следящих систем». Физматгиз, М., 1961, 407 стр.). 173. Oldenburger R. Optimum Non-linear Control. Trans. ASME, Vol. 79, 1957, pp. 527—546. 751
174. 01 denberger R. and Thompson G. Introduction to Time Optimal Control of Stationary Linear Systems. Automatica, Vol. 1, 1963, pp. 177—205 (Contains 58 references, mostly on time-optimal control). 175. Paiewonsky B. Time-optimal Control of Linear Systems with Bounded Control in «International Symposium on Nonlinear Differential Equations and Nonlinear Mechanics». Academic Press Inc., New York, 1963. 176. Paraev Y. I. On Singular Control in Optimal Processes That Are Linear with Respect to the Control Inputs, Automation and Remote Control, Vol. 23, 1962, pp. 1127— 1134. (П a p a e в Ю. И. Об особом управлении в оптимальных процессах, линейных- относительно управляющих воздействий. «Автоматика и телемеханика», т. 23, 1963, № 9, стр. 1202—1239). 177. Pars L. А. «Ап Introduction to the Calculus of Variations», John Wiley & Sons, Inc. New York, 1962. 178. P i tt e 1 B. G. Some Problems of Optimum Control. I. Automation and Remote Control, Vol. 24, 1964, pp. 1078—1091. (П и т т e л ь Б. Г. О некоторых задачах оптималь¬ ного управления». «Автоматика и телемеханика», т. 24, 1963, № 9, стр. 1187—1201, № 1, стр. 1441 —1453). 179. Pontryagin L. S., Boltyanskiî V. G., Gamkrelidze R. V. and Mishchenko E. F. «The Mathematical Theory of Optimal Processes». Interscience Publishers. Inc., New York, 1962. (Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе P. В., Мищенко E. Ф. «Математическая теория оптимальных процессов». М., Физматгиз, 1961, 391 стр.). 180. Pontryagin L. S. «Ordinary Differential Equations». Addison-Wesley Publishing Company, Inc., Reading, Mass., 1962. (Понтрягин Л. С. «Обыкновенные дифференциальные уравнения». 2-е изд. «Наука», М., 1965). 181. Preston J. I. Non-linear Control of Saturating Third-order Servomechanism, MIT Servo Lab. Tech. Mem. 6897-TM-14, Cambridge, Mass, 1954. 182. Pryakhin N. S. The Problem of Analytical Regulator Design. Automation and Remote Control, Vol. 24, 1964, pp. 1075—1077. (Пряхин H. С. Задача об анали¬ тическом проектировании регуляторов. Автоматика и телемеханика, т. 24, 1964, стр. 1075— 1077). 183. Rekasius Z. V. A General Performance Index for Analytical Design of Con¬ trol Systems. IRE Trans. Autom. Control, Vol. AC-6, 1961, pp. 217—222. 184. Rekasius Z. V. and Hsia T. C. On an Inverse Problem in Optimal Control, preprints 1964 Joint Autom. Control Conf., June, 1964, pp. 313—316. 185. Repin Yu. M. and T r e t’ у a k о v V. I. The Electronic Analog Devices. Automation and Remote Control, Vol. 24, 1963, pp. 674—679. (Репин В. Г. и T p e т ь я - ков В. И. Решение задачи об аналитическом конструировании регуляторов на электронных моделирующих устройствах. «Автоматика и телемеханика», т. 24, 1963, № 6, стр. 738—743). 186. Rohrer R. A. and S о b г а 1 M. Optimal Singular Solution for Linear, Multi¬ input Systems. Univ. Illinois Coordinated Science Lab. Rept. R-199, Urbana, Ill, April, 1964. 187. Rose N. J. Optimum Switching Criteria for Discontinous Controls, IRE Natl V Conv. Record, 1956, pp. 61—66. 188. Rozonoer L. I. L. S. Pontryagin’s. Maximum Principle in the Theory of Optimum Systems I, II, III. Automation and Remote Control, Vol. 20, I, 1960, pp. 1288— 1302; II. pp. 1405—1421; III, pp. 1517—1532. (P о з о н о э р Л. И. Принцип максимума Понтрягина в теории оптимальных систем. «Автоматика и телемеханика», т. 20, 1959, № 10, стр. 1320—1334; № 11, стр. 1141—1458; № 12, стр. 1561 — 1578). 189. R о X i n Е. Reachable Zones in Autonomous Differential Systems. Bol. Soc. Mat. Mex., Vol. 5, 1960, pp. 125—135. 190. R о X i n E. The Existence of Optimal Controls. Mich. Math. J., Vol. 9, 1962, pp. 109—119. 191. Roxin E. A. Geometric Interpretation of Pontryagin’s Maximum Principle, in J. P. LaSalle and S. Lefschetz (eds.). «Nonlinear Differential Equations and Nonlinear Mechanics». Academic Press. Inc., New York, 1963. 192. R u d i n W. «Principles of Mathematical Analysis». 2ded., McGraw-Hill Book Com¬ pany, New York, 1964. 193. S a 1 u k v a d z e M. E. On the Analytical Design of an Optimal Controller. Automation and Remote Control, Vol. 24, 1963, pp. 409—417. (Салуквадзе M. E. К вопросу аналитического конструирования оптимального регулятора. «Автоматика и телемеханика», т. 24, 1963, № 4, стр. 437—446). 194. Sarachik P. E. and К r а n с G. М. On Optimal Control of Systems with Multinorm Constraints. Proc. Second. IFAC Congr. Paper 423, Basle, 1963. (Capa- чин П. Э., Крэнц Дж. M. Оптимальное управление в системах со многими ограни¬ чениями. Труды II Международного конгресса Международной федерации по автомати¬ ческому управлению, т. 2, М., Изд-во «Наука», 1965, стр. 168—184). 195. Schmidt S. F. The Analysis and Design of Continuous and Sampled Data Feedback Control Systems with a Saturation Type Non-Linearity, NASA Tech., Note D-20 1959. 752
196. Simmons G. F. «Introduction to Topology and Modern Analysis». McGraw- Hill Book Company, New York, 1963. 197. Smith F. B. Time-optimal Control of Higher-order Systems, IRE Trans. Autom. Control, Vol. AC-6, 1961, pp. 16—21. 198. Smith O. J. M. Feedback Control Systems. McGraw-Hill Book Company, New York, 1958. (Имеется русский перевод. Смит О. Дж. М. Автоматическое регулирова¬ ние. М., Физматгиз, 1962, 847 стр.). 199. Stern T. Е. and Lerner R. M. A Circuit for the Square Root of the Sum of the Squares. Proc. IEEE, Vol. 51, 1963, pp. 593—596. 200. Stout T. M. Effects of Friction in an Optimum Relay Servomechanism. Trans. AIEE, pt. II, Vol. 72, 1953, pp. 329—336. 201. S u n - J i a n anb Hang King-ching. Analysis and Synthesis of Time optimal Control Systems, submitted to the Second IFAC Congress, Basle, September, 1963. (Сун Цзянь, Хань Кин-чин. Анализ и синтез оптимальных по быстродей¬ ствию систем управления. Труды II Международного конгресса Международной федера¬ ции по автоматическому управлению, т. 2, М., Изд-во «Наука», 1965, стр. 185—195). 202. Tou J. T. «Optimum Design of Digital Control Systems». Academic Press. Inc., New York, 1962. 203. T r u X a 1 J. G. «Automatic Feedback Control System Synthesis». McGraw-Hill Book Company, New York, 1955. (Имеется русский перевод. Траксел Джон. М., Машгиз, 1959). 204. Т г о i t s k i i V. A. The Mayer Bolza Problem of the Calculus of Variations and the Theory of Optimum Systems. J. Appl. Math. Meeh., Vol. 25, 1961, pp. 994—1010. (Троицкий В. А. Задача Майера-Больца и теория оптимальных систем «Прикладная математика и механика», т. 25, 1961, вып. 4). 205. V u 1 i k h В. Z. «Introduction to Functional Analysis», Addison-Wesley Publi¬ shing Company, Inc., Reading, Mass, 1963. 206. Wang P. К. C. Analytical Design of Electrohydraulic Servomechanisms with Near Time-optimal Response, IEEE Trans. Autom. Control, Vol. AC-8, 1963, pp. 15—27. 207. Wa rga J. Relaxed Variational Problems, J. Math. Anal. Appl., Vol. 4, 1962, pp. 111 — 128. 208. Warga J. Necessary Conditions for Minimum in Relaxed Variational Prob¬ lems, J. Math. Anal. Appl., Vol. 4, 1962, pp. 129—145. 209. Weinberg L. «Network Analysis and Synthesis», McGraw-Hill Book Com¬ pany, New York, 1962. 210. Weiss I. and Kalman R. E. Contributions to Linear System Theory, RIAS Tech. Rept. 64-9, Baltimore, Md., April, 1964. 211. W о n h a m W. M. and Johnson C. D. Optimal Bang-Bang Control with Quadratic Index of Performance. J. Bashc Eng., Vol. 86, 1964, pp. 107—115. 212. Z a d e n L. A. and D e s о e r C. A. «Linear System Theory. The State Space Approach». McGraw-Hill Book Company, New York, 1963. Литература, добавленная при переводе книги 213. Александров В. В. О применении аналоговых вычислительных машин для итерационного процесса определения управления в одной оптимальной системе. «Вест¬ ник Московского университета. Серия «Математика и механика», 1964, № 4. 214. Альбрехт Э. Г. Об оптимальной стабилизации нелинейных систем. «При¬ кладная математика и механика», т. 25, 1961, вып. 5. 215. Альбрехт Э. Г., Красовский H. Н. О наблюдении нелинейной управ¬ ляемой системы в окрестности заданного движения. «Автоматика и телемеханика», т. 25, 1964, № 7, стр. 1047—1057. 216. А н о р о в В. П. Принцип максимума для процессов с ограничениями общего вида. I. «Автоматика и телемеханика», 1967, № 3, стр. 5—15. 217. А н о р о в В. П. Принцип максимума для процессов с ограничениями общего вида. II. «Автоматика и телемеханика», 1967, М 4, стр. 5—17. 218. Балакирев В. С. Принцип максимума в теории оптимальных систем вто¬ рого порядка. «Автоматика и телемеханика», т. 23, 1962, № 8, стр. 1014—1022. 219. Бойчук Л. М. Некоторые вопросы анализа оптимальных систем автомати¬ ческой стабилизации. «Автоматика», Киев, 1963, № 3. 220. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории оптимальных процессов. «Докл. АН СССР», т. ПО, 1956, № 1, стр. 7—10. 221. Болтянский В. Г. Принцип максимума в теории оптимальных процес¬ сов. «Докл. АН СССР», т. 119, 1958, № 6, стр. 1070—1073. 222. Болтянский В. Г. Оптимальные процессы с параметрами. Докл. АН Узб. ССР, 1959, № 10, стр. 9—13. 223. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. Теория оптимальных процессов. I. Принцип максимума. Изв. АН СССР, серия «Матема¬ тика», т. 24, 1960, № 1, стр. 3—42. 753
224. Болтянский В. Г. Применение теории оптимальных процессов к задачам приближенных функций. «Труды математического ин-та им. В. А. Стеклова», т. 60, стр. 82— 95. 225. Болтянский В. Г. Моделирование линейных оптимальных быстродей¬ ствий при помощи релейных схем. «Докл. АН СССР», т. 139, 1961, № 2, стр. 19—22. 226. Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф., Понтрягин Л. С. Принцип максимума в теории оптимальных процессов. «Труды I Международного конгресса Международной федерации по автоматическому управлению». T. II. Изд-во АН СССР, М., 1961, стр. 457—467. 227. Болтянский В. Г. Достаточные условия оптимальности и обоснование метода динамического программирования. «Изв. АН СССР. Серия математика», т. 28, 1964, № 3, стр. 481—514. 228. Болтянский В. Г. Математические методы оптимального управления. Изд-во «Наука», М., 1966, 307 стр. 229. Бор-Раменский, Сун Цзянь. Оптимальный следящий привод с двумя параметрами управления. «Автоматика и телемеханика», т. 22, 1961, № 2, стр. 157—170. 230. Бутковский А. Г., Лернер А. Я. Об оптимальном управлении системами с распределенными параметрами. «Автоматика и телемеханика», т. 21, 1960, № 6, стр. 682—691. 231. Бутковский А. Г. Оптимальные процессы в системах с распределенными параметрами. «Автоматика и телемеханика», т. 22, 1961, стр. 17—26. 232. Бутковский А. Г., Лернер А. Я. Принцип максимума для опти¬ мальных систем с распределенными параметрами. «Автоматика и телемеханика», т. 22, 1961, № 10, стр. 1288—1301. 233. Бутковский А. Г., Лернер А. Я. Некоторые приближенные методы решения задач оптимального управления системами с распределенными параметрами. «Автоматика и телемеханика», т. 22, 1961, № 12. 234. Бутковский А. Г. Расширенный принцип максимума для задач опти¬ мального управления. «Автоматика и телемеханика», т. 24, 1963, № 3, стр. 312—327. 235. Бутковский А. Г. Теория оптимального управления системами с рас¬ пределенными параметрами. Изд-во «Наука». М., 1965, 474 стр. 236. Вайсбород Э. М. Об одном приближенном методе синтеза оптимального управления. «Автоматика и телемеханика», т. 24, 1963, № 12, стр. 1626—1632. 237. Васильев А. Я. О необходимых и достаточных условиях оптимальности регулируемых систем. «Автоматика и телемеханика», т. 25, 1964, № 10, стр. 1404—1413. 238. В о з н ю к Л. Л., Иваненко В. И., Кара генец Д. В., Свер- д а н М. Л. Синтез оптимального по быстродействию управления для объектов второго порядка. Изв. АН СССР. «Техническая кибернетика», 1963, № 3. 239. Габасов Р. К вопросу о единственности оптимального управления в дискрет¬ ных системах. «Изв. АН СССР». «Энергетика и автоматика», 1962, № 5, стр. 99—106. 240. Габасов Р. К оптимальным процессам в связанных системах дискретного типа. «Автоматика и телемеханика», т. 22, 1962, № 7, стр. 872—880. 241. Габасов Р., Кириллова Ф. М. Об одном способе решения некоторых задач оптимального регулирования. «Автоматика и телемеханика», т. 25, 1964, № 3, стр. 312—320. 242. Габасов Р., Кириллова Ф. М. О решении некоторых задач теории оптимальных процессов. «Автоматика и телемеханика», т. 25, 1964, № 7, стр. 1058—1066. 243. Габасов Р., Кириллова Ф. М. Об оптимальном управлении связан¬ ными системами дискретного типа. «Автоматика и телемеханика», т. 24, 1963, № 7, стр. 900—905. 244. Гамкрелидзе Р. В. К теории оптимальных процессов в линейных систе¬ мах. «Докл. АН СССР», т. 116, 1957, № 1, стр. 9—11. 245. Гамкрелидзе Р. В. К общей теории оптимальных процессов. Докл. АН СССР, т. 123, 1958, № 2, стр. 223—226. 246. Гамкрелидзе Р. В. Теория оптимальных по быстродействию процессов в линейных системах. «Изв. АН СССР, серия математика», т. 22, 1958, № 4, стр. 449—474. 247. Гамкрелидзе Р. В. Оптимальные по быстродействию процессы при ограниченных фазовых координатах. «Докл. АН СССР», т. 125, 1959, № 3, стр. 475—478. 248. Гамкрелидзе Р. В. Оптимальные процессы управления при ограни¬ ченных фазовых координатах. «Изв. АН СССР, сер. матем.», т. 24, 1960, № 3, стр. 315—356. 249. Гамкрелидзе Р. В. О скользящих оптимальных режимах. «Докл. АН СССР», т. 143, 1962, № 6, стр. 1243—1245. 250. Гантмахер Ф. Р. Теория матриц. 2-е издание. Изд-во «Наука», М., 1966, 575 стр. 251. Фаддеева В. Н. Вычислительные методы линейной алгебры. Гостехиздат, 1950. 252. Горбань А. В. О проблеме синтеза управляемых систем. «Автоматика и телемеханика» т. 24, 1963, № 10, стр. 1297—1302. 754
253. Гродзовс к и й Г. Л., Иванов Ю. Н., Токарев В. В. Механика космического полета с малой тягой. Изд-во «Наука», М., 1966, 679 стр. 254. Гулько Ф. Б., Коган Б. Я. Метод оптимального управления с прогно¬ зированием. «Труды II Международного конгресса Международной федерации по автома¬ тическому управлению», т. II, Изд-во «Наука», М., 1965, стр. 406—414. 255. Демьянов В.Ф. К построению оптимальной программы в линейной системе. «Автоматика и телемеханика», т. 25, 1964, № 1, стр. 3—11. 256. Демьянов В.Ф. Минимизация выпуклых гладких функционалов в линей¬ ных системах при выпуклых гладких ограничениях на фазовые координаты. «Автоматика и телемеханика», т. 25, 1964, № 11, стр. 1528—1537. 257. Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при нали¬ чии ограничений. «Доклад АН СССР», т. 149, 1963, № 4, стр. 759. 258. Егоров А. И. Об одной вариационной задаче в теории уравнений эллипти¬ ческого типа. «Сибирский математический журнал», т. 5, 1964, № 3. 259. Егоров А. И. Об оптимальном управлении процессами в некоторых систе¬ мах с распределенными параметрами. «Автоматика и телемеханика», т. 25, 1964, № 5, стр. 613—623. 260. Егоров В. А. О решении одной вырожденной вариационной задачи и опти¬ мальном подъеме космической ракеты. «Прикладная математика и механика», т. 22, вып. I, 1958. 261. Егоров Ю. В. Некоторые задачи теории оптимального управления. «Жур¬ нал вычислительная математика и математическая физика», т. 3, 1963, вып. 5, стр. 887—904. 262. Иванов Ю. Н. Оптимальное изменение мощности при движении тела пере¬ менной массы в гравитационном поле. «Прикладная математика и механика», т. 26, № 4, 1962. 263. Иванов Ю. Н., Токарев В. В., Шалаев Ю. В. Оптимальные траектории и оптимальные параметры космических аппаратов с двигателями ограничен¬ ной мощности. «Космические исследования», т. 2, № 3, 1964, стр. 414—432. 264. Ильин В. А. Оптимальный переход космического аппарата, тормозящегося в атмосфере планеты, на орбиту искусственного спутника Земли. «Инж. журнал», т. 3, № 2, 1963. 265. Исаев В. К. Принцип максимума Л. С. Понтрягина и оптимальное програм¬ мирование тяги ракет. «Автоматика и телемеханика», т. 22, № 8, 1961, т. 23, № 1, 1962, стр. 986—1001. 266. Исаев В. К., Курьянов А. И., Сонин В. В. Применение прин¬ ципа максимума в ракетодинамике, т. XIV Международный конгресс по астронавтике (труды), Изд-во 1964. 267. Исаев В. К., Сонин В. В. Об одной нелинейной задаче оптимального управления. «Автоматика и телемеханика», т. 23, № 9, 1962, стр. 1117—1129. 268. Калинин В. Н. Обобщенные критерии оптимальности в задачах опти¬ мального управления. «Автоматика и телемеханика», т. 26, 1965, № 2, стр. 365—369. 269. К а н а р е е в Л. Е. К теории оптимальных процессов. «Изв. АН СССР. Энер¬ гетика и автоматика», 1951, № 4, стр. 120—129. 270. Кириллова Ф. М. Некоторые вопросы теории оптимального регулирова¬ ния «Изв. высш, учебн. завед. Математика», 1962, № 3, стр. 48—58. 271. Кириллова Л. С. Теорема существования для задачи термиального управ¬ ления. «Автоматика и телемеханика», т. 24, 1963, № 9, стр. 1178—1182. 272. Красовский H. Н. О выборе параметров оптимальных устойчивых систем. «Труды I Международного конгресса Международной федерации по автоматическому управ¬ лению», т. II, Изд-во АН СССР, М., 1961, стр. 482—489. 273. Красовский H. Н. О стабилизации неустойчивых движений дополни¬ тельными силами при неполной обратной связи. «Прикл. матем. и механика», т. 25, 1963, вып. 4. 274. Красовский H. Н. К теории управляемости и наблюдаемости линейных динамических систем. «Прикладная математика и механика», т. 28, 1964, вып. I, стр. 3—14. 275. Красовский H. Н. Проблемы управляемости, наблюдаемости и стабилизи¬ руемое™ динамических систем. «Труды II Всесоюзного съезда по теоретической и при¬ кладной механике», вып. I, Изд-во «Наука», М., 1965. 276. Красовский H. Н. Оптимальные процессы в системах с запаздыванием. «Труды II Международного конгресса Международной федерации по автоматическому управлению», т. II, Изд-во «Наука», М., 1965, стр. 201—210. 277. Кротов В. Ф. Расчет оптимальной траектории для перехода ракеты на заданную круговую траекторию около Земли. С6-. «Механика МВТУ», Оборонгиз, М., 1955. 278. Кротов В. Ф. Приближенный синтез оптимального управления. «Автома¬ тика и телемеханика», т. 25, 1964, № 11, стр. 1521—1527. 279. Крылов Н. А. и Черноусько Ф. Л. О методе последовательных приближений для решения задач оптимального управления. «Журнал вычислительной математики и математической физики», т. 2, 1962, № 6, стр. 1132—1139. 755
280. К у з м а к Г. Е. Линеаризованная теория оптимальных перелетов. «Косми¬ ческие исследования», т. 3, № 1, 1965, стр. 3—26. 281. К у з м а к Г. Е., Исаев В. К., Давидсон Б. X. Оптимальные режимы движения точки переменной массы в однородном центральном поле. «Докл. АН СССР», т. 149, № 1, 1963, стр. 58—61. 282. Кузмак Г. Е., Лавренко Н. И., Исаев В. К., Сонин В. В. Линеаризованная теория оптимальных многоимпульсных перелетов. Некоторые особен¬ ности задачи об оптимальном программировании тяги ракет. «XV Международный конгресс по астронавтике. (Труды)». Изд-во, «Наука» 1965, стр. 311—346. 283. Куликовский Р. Оптимальные и адаптивные процессы в системах авто¬ матического регулирования. Пер. с польского под ред. А. Г. Бутковского, Изд-во «Наука», М., 1967, 379 стр. 284. Лебедев В. Н. Вариационные задачи о взлете космического аппарата с кру¬ говой орбиты. «Журнал вычислительная математика и математическая физика», т. 3, № 6, 1963, стр. 1126—1130. 285. Лернер А. Я. О предельном быстродействии систем автоматического управ¬ ления. «Автоматика и телемеханика», т. 15, 1954, № 6, стр. 461—477. 286. Летов А. М. Устойчивость нелинейных регулируемых систем. Издание 2-е. «Физматгиз», М., 1962, 483 стр. 287. Летов А. М. Теория оптимального управления. «Труды II Международ¬ ного конгресса Международной федерации по автоматическому управлению», т. II, Изд-во «Наука», М., 1965, стр. 7—38. 288. Лурье А. И. Минимальный квадратичный критерий качества регулируемой системы. «Изв. АН СССР. Техническая кибернетика», 1963, № 4. 289. Милыптейн Г. Н. Применение последовательных приближений для реше¬ ния одной оптимальной задачи. «Автоматика и телемеханика», т. 25, 1964, № 3. стр. 321—329. 290. Мороз А. И. Синтез оптимального по быстродействию управления для линей¬ ного дискретного объекта третьего порядка. «Автоматика и телемеханика», т. 26, 1965, № 2, стр. 193—207; № 3, стр. 410—420. 291. Новосельцев В. Н. Оптимальный процесс в релейно-импульсной системе второго порядка. «Автоматика и телемеханика», т. 21, 1960, № 5, стр. 569—574. 292. Новосельцев В. Н. Об оптимальном управлении при наличии запазды¬ вания. «Автоматика и телемеханика», т. 25, 1964, № 11, стр. 1545—1548. 293. Новосельцев В. Н. Оптимальные по быстродействию системы управ¬ ления при наличии случайных помех. «Труды II Международного Конгресса Международ¬ ной федерации по автоматическому управлению», т. II, Изд-во «Наука», М., 1965, стр. 368— 377. 294. О X о ц и м с к и й Д. Е., Энеев T. М. Некоторые вариационные задачи, связанные с запуском искусственного спутника Земли. «Успехи физических наук», т. 63, вып. I, а, 1957. 295. Павлов А. А. О повышении быстродействия некоторых релейных систем третьего порядка. Изв. АН СССР ОТН. «Энергетика и автоматика», 1962, № 2, стр. 59—71. 296. Павлов А. А. Динамика быстродействующих релейных сервомеханизмов с запаздыванием. «Изв. АН СССР. ОТН. Техническая кибернетика», 1963, № 1. 297. Павлов А. А. Синтез релейных систем, оптимальных по быстродействию. Метод фазового пространства. Изд-во «Наука», М., 1966, 390 стр. 298. Петров В. А., Скворцов Г. В. Об одной задаче аналитического кон¬ струирования регуляторов. «Автоматика и телемеханика», т. 25. 1964, № 10, стр. 1399—1403. 299. Питтель Б. Г. О некоторых задачах оптимального управления. «Автоматика и телемеханика», т. 24, 1963, № 9, стр. 1187—1201; № 11, стр. 1441—1453. 300. Платонов А. К., Дашков А. А., Кубасов В. И. Оптимальное управление полетом космического аппарата. «Труды I симпозиума. Автоматическое управ¬ ление в широком использовании космического пространства», 1965. 301. Понтрягин Л. С. Оптимальные процессы регулирования. «Успехи матем. наук», т. 14, 1959, вып. I, стр. 3—20. 302. Пропой А. И. Об одной задаче оптимального дискретного управления. «Докл. АН СССР», т. 158, 1964, № 6, стр. 1232—1235. 303. Пшеничный Б. Н. Численный метод решения некоторых задач оптималь¬ ного управления. «Журнал вычислительная математика и математическая физика», т. 4, 1964, № 2, стр. 292—305. 304. Роз о но э р Л. И. О вариационных методах исследования качества систем автоматического управления. «Труды I Международного конгресса Международной феде¬ рации по автоматическому управлению», т. II, Изд-во АН СССР, М., 1961, стр. 506—514. 305. Р о з е н м а н Е. А. О предельном быстродействии следящих систем с огра¬ ниченным по мощности, моменту и скорости исполнительным элементом. «Автоматика и телемеханика», т. 19, 1958, № 7, стр. 633—653. 756
306. Саввин А. Б. К теории оптимальных по быстродействию процессов в систе¬ мах второго порядка. «Изв. АН СССР. ОТН. Энергетика и автоматика». 1960, № 6, стр. 162—164. 307. Саввин А. Б. О совместной работе двух оптимальных по быстродействию автоматических устройств. «Автоматика и телемеханика», т. 25, 1964, № 1, стр. 12—15. 308. Салуквадзе М. Е. К задаче синтеза оптимального регулятора в линей¬ ных системах с запаздыванием, подверженных постоянно действующим возмущениям. «Автоматика и телемеханика», т. 23, 1962, № 12, стр. 1595—1601. 309. Салуквадзе М. Е. К вопросу инвариантности оптимальных регулято¬ ров. «Автоматика и телемеханика», т. 25, 1964, № 5, стр. 650—652. 310. Соколов В. Б. Исследование некоторых задач сближения и мягкой посадки с помощью обобщенных параметров. «Космические исследования», т. 5, 1967, вып. 1, стр. 45—57. 311. С т р а т о н о в и ч Р. Л. Новейшее развитие методов динамического програм¬ мирования и их применение для синтеза оптимальных систем. «Труды II Международного конгресса Международной федерации по автоматическому управлению», т. II, Изд-во «Наука», М., 1965, стр. 120—130. 312. Стратонович Р. Л. Условные марковские процессы и их применение к теории оптимального управления. Изд-во МГУ, 1966. 313. Тарасов Е. В. Оптимальные режимы полета летательных аппаратов. Обо- ронгиз, М., 1963. 314. Токарев В. В. Оптимальное управление источником мощности при движе¬ нии тела переменной массы в гравитационном поле с активным сбросом мощности. «При¬ кладная математика и механика», т. 27, № 4, 1963. 315. Троицкий В. А. О вариационных задачах оптимизации процессов управ¬ ления. «Прикладная математика и механика», т. 26, вып. 1, 1962. 316. Троицкий В. А. Вариационные задачи оптимизации процессов управле¬ ния в системах с ограниченными координатами. «Прикладная математика и механика», т. 26. 1962, № 3, стр. 431—443. 317. Троицкий В. А. Вариационные задачи процессов управления с функцио¬ налами, зависящими от промежуточных значений координат. —«Докл. АН СССР», т. 149, 1963, № 2. 318. Федоренко P. М. Приближенное решение некоторых задач оптимального управления. «Журнал вычислительная математика и математическая физика», т. 4, 1964, № 6, стр. 1045—1064. 319. Фельдбаум А. А. Оптимальные процессы в системах автоматического регу¬ лирования. «Автоматика и телемеханика», т. 14, 1953, № 6, стр. 712—728. 320. Фельдбаум А. А. О синтезе оптимальных систем с помощью фазового про¬ странства. «Автоматика и телемеханика», т. 16, 1955, № 2, стр. 120—149. 321. Фельдбаум А. А. Основы теории оптимальных автоматических систем. 2-е издание. Изд-во «Наука», М., 1966, 623 стр. 322. X а р а т и ш в и л и Г. Л. Принцип максимума в теории оптимальных про¬ цессов с запаздыванием. «Докл. АН СССР», т. 136, 1961, № 1, стр. 39—42. 323. Цыпкин Я. 3. Оптимальные процессы в импульсных автоматических систе¬ мах. «Изв. АН СССР. ОТН. Энергетика и автоматика», 1960, № 4, стр. 74—93. 324. Ш а т X а н Ф. А. Применение принципа максимума к задачам оптимизации параллельных химических реакций. «Автоматика и телемеханика», т. 25, 1964, № 3, стр. 368—373. 325. Шилов Г. Е. Введение в теорию линейных пространств. Гостехиздат, 1952.
АЛФАВИТНО-ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ А Апериодическое звено, управление оптималь¬ ное по расходу топлива 588 Б Базис 33 — канонический 33 — натуральный 34 — ортонормальный 49 Баттерварта, фильтр Беллман Р. 16, 316 Болтянский, В. Г. 16 Больцано-Вейрштрасса, свойство 68 Бушау, Д 451, 503 Бюси, Р 20 В Вандермонда, матрица 140 Вариация — первая 219 — вторая 220 Вариации — временные 294 — местные 295 Вариации управления для задачи с закре¬ пленным концом 253 Вариационные задачи — фундаментальные леммы 218, 239 Вариационное исчисление 222—263 — применение к задачам с закрепленным концом 252 — применение к задачам оптимизации пер¬ вого порядка 222 — 233 — применение к общей задаче со свободным концом и фиксированным конечным вре¬ менем 233—256 Вектор — линейно зависимый 33 — линейно независимый 33 — норма вектора 50 — столбец 32, 36 — строка 32, 36 — трансверсальный 92 Вектор ошибки 692 Векторное пространство 30—33 — базис 33 — произведение на скаляр 36 — размерность 35—36 — сумма элементов 36 Векторная функция 75 —105 — интегралы от 94—97 — из R в Rn 75 — 76 — из R в Rn 76 — кусочная непрерывность 80 — 82 — непрерывность 77 — 80 — произведение 76 — производная 82—90 — регулярная 80 — 82 — сумма 76 Винер, Н 20 Внутреннее произведение 46—48 — невырожденное 47 — определение 46 — определенное 47 — положительное 47 — функций 103 — 104 Внутренняя точка множества 62 Внутренняя часть множества 64 Возмущение — линеаризованные уравнения относитель¬ но оптимальной траектории 234 — 235 — оптимальной траектории 234 — 235 — оптимального управления 234 — функционала стоимости 237 — 238, 240 — 244 Вращающееся космическое тело 504 — 505, — гироскопическая связь 731 — размещение двигателей 734 — сравнение схем управления 738—743 — сравнение схем управления при пере¬ менной скорости вращения 742 — сравнение по расходу топлива 742 — схемы управления 734 — уравнения Эйлера 731 — управление, оптимальное по быстродей¬ ствию 503, 525 Временные вариации оптимального управле¬ ния 294 Выпуклая комбинация 71 Выпуклое множество 70 — 73 — внутренняя часть 73 — гиперплоскости 73 — 74 — замыкание 72 — определение 71 — регулярное 74 — регулярные точки 74 Выпуклый конус 71 Выпуклая оболочка 72 Вырожденные задачи оптимального управле¬ ния 430—444 Вырожденная задача управления — необходимые условия 432, 439 — для нелинейной системы 633 — об оптимальном быстродействии 341, 356 — об оптимальном расходовании топлива 391, 398 — оптимальные и экстремальные управле¬ ния 433 Выход, задача о регуляторе 682 Расчет 170 Г Гамильтона — Якоби уравнение — замечания относительно решения 324 — 326 — для задачи об оптимальном по быстро¬ действию управлении объектом с двой¬ ным интегрированием 460—461 — для задачи об оптимальном по расходо¬ ванию топлива управления интеграто¬ ром 585 — для задачи об оптимальном по расходо¬ ванию топлива управления объектом с двойным интегрированием 607 — для общей задачи управления 317—319, 321—323 — для задачи о регуляторе состояния 667 — для систем, оптимальных по быстродей¬ ствию 377—380 Гамильтониан (функция Гамильтона) — графическая интерпретация необходи¬ мых условий 257 — 259 — нормальный (определение) 321 — для принципа минимума 263 — определение 236, 263 Гамильтонова система (система канонических уравнений) 264 Гамрекелидзе Р. В. 16 Гармонический осциллятор — вырожденное управление 438 — 439 — демпфированный 520 — локальная и глобальная оптимальность по быстродействию 719 — минимальные изохроны 515, 536 — оптимальное по быстродействию управле¬ ние 503 — 536 — с двумя входами 525—536 — линии переключения для двух вхо¬ дов 533 — линии переключения для одного входа 512 — закон управления 512, 534 — субоптимальная система 517—519 Гейне—Бореля свойство 67
Геометрическая интерпретация задач об опти¬ мальном быстродействии 327—332 Гиперплоскость 68 — 70 — касательная 90 — опорная 69 — определение 68 — разделяющая 69 Гиперповерхносіь 90 — 92 — гладкая 90 — и ^-мерное многообразие 92 — нормаль 90 — определение 90 — переключения 496 — регулярные точки 90 Гиперсфера как область ограничений 711 Гироскопическая связь 731 Гладкое множество 90 Градиент 86 Граф (см. также функция) 29 Граница множества 64 Граничные условия дифференциальных урав¬ нений, свободные и фиксированные 110—111 д Детерминант 41 Диагональная матрица 45 Диагональное преобразование 45 Динамика в числителе 547 Динамическая система 155 — движение 161 — дифференциальная (определение) 160 — интуитивные понятия 145 — 154 — конечномерная 160 — непрерывная (определение) 160 — определение 155 — 159 — эквивалентность 161 Дифференциальные уравнения 107—144 — граничные условия 110 — задача с начальными условиями 110 — линейное 118 — /2-го порядка, определение 108 — развернутая форма 108 — решение 108 — решение системы дифференциальных уравнений 108—110 — система дифференциальных уравнений первого порядка 109 — теорема существования и единственности решения 112 Дифференцируемая функция из R в R 82 из R в Rn 84 из Rm в Rn 88 Доказательство принципа минимума 260 — 319 Дополнительная переменная 236 Достаточные условия — вывод с помощью вариационного исчи¬ сления 246 — для задач об оптимальном управлении 316 — 326 — замечания 316 — минимума функционала 221 — для обычного минимума 207, 209 — теория Гамильтона — Якоби 319 Достижимое состояние 179—186 область достижимых состояний 183 — 186, 332 Е Единственность оптимального управления 444 — 446 — в задаче о минимуме энергии управле¬ ния 416 — в задаче об оптимальном быстродей¬ ствии 357 — в задаче об оптимальном расходовании топлива 399, 583 — 586 592 — в задаче о регуляторе состояния 660 Единственность экстремального управления 444—446 — в задаче о минимуме энергии управления 416 — в задаче об оптимальном быстродей¬ ствии 361 — в задаче об оптимальном расходовании топлива 400 — 402 Ж Жорданова каноническая форма 45 3 Задачи, зависящие от времени с подвижной областью цели 271 Задачи па минимум энергии управления 410 — 430 — для объекта с двойным интегрированием (пример) 417 — 424 — единственность экстремальных управле¬ ний 416 — зависимость от конечной стоимости 419 — 420 — необходимые условия 413 — нормальность 415 — при ограничениях управляющих пере¬ менных 426 — уравнение для оптимального управле¬ ния 415 — 416 — физический смысл 410 — формулировка задачи 412 Задача об оптимальном быстродействии 328 — 383 — вырожденные задачи 341 — Гамильтониан 336 — Н — минимальное управление 345 — геометрическая интерпретация 331—334 — для линейных инвариантных во времени систем 352 — е — оптимальные управления 334 — единственность — оптимальных управлений 357 — экстремальных управлений 361 — задача перехвата 328 — задача о регуляторе 353 — для подвижной области цели S 328 — 334 — канонические уравнения 337 — нормальная задача 341 — область достижимых состояний 332 — области ограничений управления 331 — применение принципа минимума к общей задаче 337 — релейный принцип 382 — существование оптимального управле¬ ния 373 — упрощенные необходимые условия 342 — число переключений управления 359 — экстремальные переменные 351 — экстремальное управление 359 Задача об оптимальном расходовании топлива 383 — 409 — влияние ограничения времени перехода 404 — вырожденная задача 391 — единственность — оптимальных управлений 399 — экстремальных управлений 401 — моменты переключения 391 — необходимые условия 388 — нормальная задача (определение) 390 — общая постановка задачи 385 — ограничения управления 384 — оптимальная система с обратной связью 407 — принцип релейный («Включено—Вы¬ ключено») 392 — расход топлива (в единицу времени) 384 — с подвижной областью цели 385 — функционал стоимости 384 — с незаданным временем перехода 592 — с заданным или ограниченным сверху временем перехода 600 - с ограничением времени перехода, про¬ порциональным минимальному времени 608 — с минимизацией линейной комбинации топлива и времени 616 — для двух интеграторов 616 — оптимальный закон управления 621 — для интегратора с апериодическим зве¬ ном 622 — для нелинейного объекта второго по¬ рядка 633 — уравнение Гамильтона — Якоби 605 — уравнение минимальной стоимости для двух интеграторов 594 Задача слежения 692 — задачи, сводимые к задачам о регуляторе выхода 702 759
— закон оптимального управления 694 — оптимальная система с обратной связью 698 — система, близкая к оптимальной 701 — реакция системы первого порядка 706 — на задержанную ступеньку 706 — на синусоиду 707 — на ступеньку 705 — реализуемость оптимального управления 697 — связь с задачей о регуляторе выхода 696 — упрощенные канонические уравнения 693 — уравнение минимальной стоимости 695 — уравнение Риккати 695 — формулировка задачи 692 Задача управления 178 — обсуждение 178 — определение 180 — оптимальная 181 Заде Л. А 24 Замена переменных в принципе минимума 274 Замкнутая сфера 60 Замкнутые множества, определение 63 — объединение 62 — связь с замыканием 64 Замкнутый (закрытый) интервал 64 Замыкание множества 64 И Изображение (отображение) 29 Интеграл 93 — от векторной функции 95 — от кусочно-непрерывной функции 93 — от матрицы 95 — определенный 93 — свойства 93 Интегратор ; апериодическим звеном, управле¬ ние, оптимальное по расходованию топлива 622 Интервал 64 Интервал наблюдения 152 Интервал открытый 64 К Калман P. Е. 20, 21, 316 Каноническая система 264 Каноническая форм: инвариантной во времени системы уравнений 130 Канонические уравнения 337 Каратеодори 20, 316 — лемма 319 Касательная плоскость 92 Квадратичный критерий преобразования (см. задача о регуляторе выхода, задача о регу¬ ляторе состояния, задача слежения) Квадратичная форма 46 Квазипостоянное решение уравнения Риккати 674 Кэли —Гамильтона теорема 44 Компактность 67 Компактное множество 67 Конечная стоимость 181 — применение принципа минимума к зада¬ чам с конечной стоимостью 273 Конечное время (время перехода) 181 — зависимость от конечного времени в за¬ дачах на минимум энергии управления 420 — ограничения и их влияние в задаче об оптимальном расходовании топлива 404 — определение 181 — фиксированное и свободное 446 Конечное множество 26 Конус 70 — выпуклый 70 Косо-симметричная матрица 51 — и самосопряженная система 141, 722 Коэффициент затухания 678 Красовский Н. Н. 16 Кронекера, символ 40 Кусочно-непрерывная функция 80 — 82 Кусочно-постоянная функция 82 Л Лагранж, множители Лагранжа 216, 223, 231 Лемма Каратеодори 319 Линейная зависимость 33 Линейно-зависимые вектора 33 Линейно-независимые вектора 33 760 Линейная оптимальная система е квадратич¬ ным критерием преобразования (см. задачу о регуляторе выхода, задачу о регуляторе состояния, згдачу слежения) Линейная система — инвариантная во времени 118 — задача об оптимальном быстродействии 353 — задача об оптимальном расходовании топлива 394 — наблюдаемость 192 — управляемость 187 — определение 162 — управление, оптимальное по быстродей¬ ствию (см. управление, оптимальное по быстродействию для линейных систем) — уравнения состояния и выхода 162 Линейное дифференциальное уравнение — инвариантное во времени (определение) 118 — определение 118 — решения 119 — сведение уравнения n-го порядка к си¬ стеме первого порядка 137 — с переменными коэффициентами (опре¬ деление) 118 — с постоянными коэффициентами (инва¬ риантное во времени) 118 — фундаментальная матрица (см.) 123 Линейное преобразование 35 — диагональное 45 — невырожденное 41 — обратное 40 — определение 35 — произведения 36 — сложное 37 — собственные вектора 42 — собственные значения 42 — суммы 36 — тождественное 40 Линейные комбинации 33 Линия переключения 452 Локальная оптимальность 248 м Матрица 35 — Вандермонда — вектор-столбец 36 — вектор-строка 36 — диагональная 45 — интеграл от матрицы 95 — косо-симметричная 51 — коэффициенты матрицы 35 — невырожденная 41 — обратная 40 — отрицательно определенная 55 — отрицательно полуопределенная 55 — ортогональная 52 — подобная 42 — положительно определенная 55 — положительно полуопределенная 55 — произведение матриц 38 — произведение матрицы на действительное число 37 — связь с линейным преобразованием 35 — симметричная 47 — собственные вектора матрицы 44 — собственные значения 44 — сумма матриц 37 — тождественная 40 — транспонированная 38 , — фундаментальная 123 * — характеристический полином 44 — элементы (коэффициенты) 35 Местные вариации оптимального управления 295 Минимальная изохрона 366 — для вращающегося космического тела 740 — для гармонического осциллятора — с одним входом 515 — с двумя входами 536 — для объекта с двойным интегрированием 460 Минимизация времени и энергии управления — для объекта с двойным интегрированием 421-423 — для системы с инвариантной нормой 730 Минимизация времени и топлива — для апериодического звена 588 — для интегратора 586 — 588
— для интегратора с апериодическим зве¬ ном 622 — для нелинейной системы 633 — для объекта с двойным интегрированием 616 — для системы с инвариантной нормой Минимум функционала 218 — 221 — вторая вариация 221 — достаточные условия 222 — необходимые условия 219 — определение 218 — первая вариация 219 Минимум функции 205, 214 — абсолютный 205, 215 — достаточные условия — для векторной функции 222 — для скалярной функции 207 — локальный 205, 215 — необходимые условия 216 — отыскание минимума функции при нали¬ чии ограничений 210 Множество 25 — внутренняя точка 62 — внутренняя часть 64 — выпуклая оболочка множества 72 — выпуклое 71 — граница 64 — достижимых состояний 183 —186, 332 — замкнутое 63 — замыкание множества 64 — компактное 67 — конечное 26 — нулевое 26 — объединение бесконечного числа мно¬ жеств 27 — объединение множеств 26 — ограниченное 67 — операции над множествами 26 — открытое — определение 62 — пересечение 62 — пересечение 26 — полное 65 - предельная точка множества 63 — принадлежность к множеству 25 — произведение множеств 27 — пустое 26 — регулярное, выпуклое 74 — с «углами» 74 — счетное 26 Множители Лагранжа 216, 223, 231 Моменты переключения — для задачи об оптимальном быстродей¬ ствии 340 ~ для задачи об оптимальном расходовании топлива 391 Мощность управления 657 Мягкая посадка (упрощенная задача) 599 н Наблюдаемая система — линейная, инвариантная во времени 192 — примеры 195 — проверка (для линейной системы) 195 — определение 186 Наблюдаемость — линейной инвариантной во времени си¬ стемы 192 — определение 186 — физический смысл 196 — 200 Нелинейная система, оптимальное по быстро¬ действию управление — для класса нелинейных систем 541 — для системы первого порядка 537 — для системы второго порядка 561 Необходимые условия — вывод при помощи вариационного исчи¬ сления 233 — минимума функционала 218 — обычного минимума 205 — 208 — обычного минимума с ограничениями 214 — таблица 278 — 281 Непрерывная функция (и преобразование) 77 Неравенство треугольника 59 Неустойчивая система 142 Нули передаточной функции 165, 171 — минимально-фазовые 548 — неминимально-фазовые 548 Норма — вектора 50 — функции 98, 104 Нормаль к гиперповерхности 91 Нормальная задача управления 321 — гамильтониан 321 — на минимум времени перехода (об опти¬ мальном быстродействии) 340, 357 — на минимум топлива (об оптимальном расходовании топлива) 390 — на минимум энергии управления 415 Нормальная система (определение) 201 О Область ограничений 179—180 Область цели S 180, 182, 443 — типы 262 Обратная задача оптимального управления 708 Обратная матрица 40 Обратное отображение 29 Объединение множеств 26 Объект — апериодическое звено, управление, опти¬ мальное по расходу топлива 588 — интегратор с апериодическим звеном 502 — управление, оптимальное по расходу топлива 622 Объект с двойным интегрированием — выражение для минимального количества топлива 598 — закон управления, оптимального по рас¬ ходу топлива — при незаданном времени перехода 599 — при фиксированном времени перехода 604 — линии переключения при фиксирован¬ ном времени 606 Объект с двойным интегрированием — минимальные изохроны 460 — минимизация времени и топлива 616 — закон управления 621 — линии переключения 620 — формулировка задачи 617 — минимизация времени и энергии упра¬ вления 421 —423 — минимизация энергии управления 669 — оптимальное по расходованию топлива управление при незаданном времени перехода 599 — оптимальное по расходованию топлива управление при фиксированном времени перехода 604 — полюса оптимального регулятора 676 — регулятор состояния 674 — система с обратной связью при ограни¬ ченном времени перехода 615 — с нулями в передаточной функции, управление, оптимальное по быстродей¬ ствию 560 — стабилизатор выхода 686 — стабилизатор состояния 674 — управление, оптимальное по быстродей¬ ствию — закон управления 458 — линии переключения 456 — к началу координат 453 — к области цели 463—466 — система с обратной связью 458 — управление Гамильтона-Якоби 460 Объект с двойным интегрированием — уравнение Гамильтона — Якоби для управления, оптимального по топливу 607 Объект с двумя постоянными времени (два апериодических звена) — закон управления 474 — оптимальная система с обратной связью 474 — управление, оптимальное по быстродей¬ ствию 474 Объект нелинейный первого порядка 537 Объект нелинейный второго порядка 561 Объект с нулями в передаточной функции — управление, оптимальное по быстродей¬ ствию 547, 560, 567 Объект с одним входом и одним выходом, регулятор выхода 687 Объект с передаточной функцией с п действи¬ тельными полюсами 489 761
Ограничения — по гиперсфере 710 Ограничения управления в задачах об опти¬ мальном расходовании топлива 582 Ограничения управляющих переменных в за¬ даче о минимуме энергии 709 Ограниченные функции 98 Операции над множествами 26 Опорная гиперплоскость 69 — выпуклого множества 74 — регулярная 74 Оптимальная траектория, возмущения 234 Оптимальное по быстродействию управление классом нелинейных систем 561 Оптимальное управление — возмущения 234 — временные вариации 294 — единственность (см. Единственность оп¬ тимального управления) — закон оптимального управления для задачи о регуляторе состояния 665 — закон оптимального управления для задачи слежения 694 — местные вариации 295 — обсуждение достаточных условий 316 — существование (см. Существование опти¬ мального управления) Оптимальность — глобальная 256 — локальная 256 Оптимальные и экстремальные управления для вырожденных задач управления 433 Ортогональная матрица 52 Ортогональные векторы 49 Ортонормальный базис 49 Открытая сфера 60 Открытое множество — определение 62 — пересечения 62 Открытый интервал 64 Отображение Отрицательно определенная матрица 55 Отрицательно полуопределенная матрица 55 п Пара вход — выход, — определение 153 Первая вариация 219 Передаточная матрица 165 Передаточная функция 164 — и дифференциальная система 164 — нули 165 — отыскание представления в пространстве состояний 165 —177 — полином в знаменателе 165 — полиномы в знаменателе и в числителе 171 — полюса 164 Пересечение множеств 26 Переходная матрица (см. Фундаментальная матрица) Перпендикулярные векторы (см. Ортогональ¬ ные векторы) Поверхность переключения 484 Подмножество (см. Множество) Подобные матрицы 42 — связь между их фундаментальными ма¬ трицами 129 Подобные преобразования 42 Подпространство 32 — произведение на действительное число 32 — сумма 32 Полином, характеристический 44 Полнота 65 Полнота множества 65 Положительно определенное внутреннее про¬ изведение 48, 55 Положительно определенная матрица 55 — критерий 54 — собственные значения 54 Положительно полуопределенная матрица 55 Полупространство 69 Полюса оптимального регулятора для объекта с двойным интегрированием 687, 16 Понтрягин Л. С. — принцип максимума (см. Принцип ми¬ нимума) Последовательность — предел последовательности 61 — равномерно отходящаяся 65 — сходимость последовательности 61 Предел — справа и слева 81 — последовательности 61 Предельная точка — множества 63 — последовательности 61 — функции 77 Представление в пространстве состояний с по¬ мощью аналоговой модели 167, 170, 174, 176 Преобразование 29, 35, 40 — диагональное 45 — Лапласа 133 — невырожденное 40 — тождественное 40 Принцип минимума 280—312 — вывод на основе вариационного исчисле¬ ния 243 — вырожденные случаи 265 — Гамильтониан 263 — доказательство 280 — временные вариации оптимального управления 294 — движущиеся гиперплоскости 292 — замена переменных 284 — луч для временных вариаций управле¬ ния 295 — конечный конус 299 — конус для местных вариаций управле¬ ния 297 — местные вариации оптимального упра¬ вления 295 — описание доказательства 282—283 — принцип оптимальности 286 — разделяющая гиперплоскость 302 — распространение изменений начальных условий 289 — теоремы, которые надо доказать, 281 — 282 — условия трансверсальности 307 — для задачи с заданным конечным вре¬ менем 273 — для задачи с закрепленным концом и незаданным временем перехода 264 — для той же задачи с переменными пара¬ метрами 266 — для задачи с конечной стоимостью 275 — для задач с незакрепленным концом и незаданным временем 275 — для задачи с переменными параметрами с подвижной конечной точкой 269 — для задачи с переменными параметрами с подвижной областью цели 271 — замечания 313 — каноническая система 264 — предположения 260 — 262 — таблица необходимых условий 278 — 280 Принцип оптимальности 286 Произведение — векторных функций 76 — внутреннее (см. Внутреннее произведе¬ ние) — на действительное число 37 — матриц 38 — множеств 27 Производная 82 — от векторной функции 83 — высшего порядка 83 — по направлению 88 — от произведения 84 — от скалярной функции 82 — от сложной функции 85 — от суммы 84 — от функции из в Rn 83 — от функции из Rm в R (см. также Гра¬ диент) 85 — частная 87 — от эвклидовой нормы 716 Пространство состояний (фазовое простран¬ ство) 157 Пустое множество 26 Р Размерность векторного пространства 33 Разрыв функции 80 Расстояние между функциями 102 762
Расстояние, свойства 58 — связь с нормой 59 — функция 59 — Эвклидово 59 — примеры 59 Расход топлива (в единицу времени) 384 Регулярная точка 74 — гиперповерхности 90 Регулярное выпуклое множество 74 Риккати, уравнение — вычисление решения 669 — для задачи о регуляторе выхода 684 — для задачи о регуляторе состояния 663, 664 — для задачи слежения 694 — для примера первого порядка 677 — квазипостоянное решение 673 С Самосопряженная система 142 Свертка функций 136 Симметричная билинейная форма 46 Симметричная матрица 47 — свойства 47 — собственные значения 54 Система с инвариантной нормой — задача управления 723 — минимизация времени и топлива 723 — минимизация времени и энергии 723 — определение 721 — пример — вращающееся космическое тело — самосопряженная система 722 — связь между управлениями, оптималь¬ ными по расходу топлива и по быстро¬ действию 725 — управление, оптимальное по быстродей¬ ствию 724 — управление, оптимальное по расходу топлива 724 — управление, оптимальное по энергии 728 — уравнение для минимума времени 724 — уравнение для минимума расхода топлива 725 Скалярное произведение 48 — свойства 50 Собственные вектора 42 Собственные значения 42 — отрицательно определенной матрицы 55 — отрицательно полуопределенной ма¬ трицы 55 — подобных матриц 44 — положительно определенной матрицы 55 — положительно полуопределенной матри¬ цы 55 —- связь с полюсами передаточной функ¬ ции 168 — связь с характеристическим полиномом 43 — симметричных матриц 54 Сокращение полюса с нулем 198 Сопряженные переменные 236 Сопряженная система 141 Состояние — достижимое 183 — наблюдаемое 186 — управляемое 186 — динамической системы, аксиомы 155 — 159 — интуитивные понятия 151 — 155 — переходное или полугрупповое свой¬ ство 156 Существование — оптимального управления для задачи о регуляторе состояния 667 — оптимальных управлений 444 — 8 — оптимальных управлений 333 — решения дифференциального уравнения — управления, оптимального по быстро¬ действию 333, 374 — управления, оптимального по топливу 590, 595, 598 Схемы управления вращающимся космическим телом 734 т Таблица необходимых условий 278 — 281 Теорема о конечном приращении 83 Тождественное преобразование 40 Трансверсальность — условие 265, 448 — 449 — доказательство 307 Трансверсальный векгор 92 Транспонированная матрица 38 У Угол между Лекторами 50 Управление с минимальной затратой энергии для системы с инвариантной нормой 728 Управление, оптимальное по быстродействию — для вращающегося космического тела 504 — 505, 512, 525 — 527, 534 — для гармонического осциллятора 512, 534 — демпфированным гармоническим осцил¬ лятором 524 — для двух интеграторов 458 — для класса нелинейных систем 541 — для линейных систем — единственность оптимального управле¬ ния 357 — единственность экстремального упра¬ вления 361 — задача о регуляторе 353 — минимальные изохроны 386 — необходимые условия 354 — оптимальная система с обратной связью 362 — поверхность минимального времени (стоимости) 366 — связь нормальности задачи с нормаль¬ ностью системы 357 — связь оптимального управления и до¬ полнительной переменной с градиентом стоимости 366 — существование оптимального управле¬ ния 374 — уравнение Гамильтониана — Якоби 377 — условия вырожденности 356 — условия нормальности 357 — число переключений 359 — экстремальные управления 359 — для нелинейной системы первого по¬ рядка 539 — для нелинейной системы второго по¬ рядка 544 $ -4- д — для объекта с U7 ——— 547 — для объектов с нулями в передаточной функции 560, 567 — для объекта, представляющего собой два апериодических звена 474 — при ограничении управление гиперсфе¬ рой (см. также система с инвариантной нормой) 724 — для системы jV-го порядка 489 — для системы третьего порядка — закон управления 485—486 — система с обратной связью 487 Управление, оптимальное по расходу топлива — общая постановка задачи 385 — необходимые условия 388 — принцип «Включено — Выключено» 408 — для линейных систем — единственность оптимального управле¬ ния 399 — единственность экстремального упра¬ вления 401 — задача о регуляторе 395 — необходимые условия 395 — достаточные условия нормальности 398 — достаточные условия вырожденности 398 — структура оптимальной системы 408 — формулировки и функционалы 404 — для объектов — апериодическое звено 588 — два интегратора 591, 592, 600, 608, 616 — интегратор 582 — интегратор с апериодическим звеном 622 — нелинейная система второго порядка 633 Управление, оптимальное по энергии, 410 .Управляемость 186 — для линейных, инвариантных во времени систем 187 — физический смысл 196 — 203 763
Управляющая последовательность 452 Уравнение выхода 160 Уравнение движения Эйлера 526 Уравнения состояния 160 — аналоговая модель 167, 170, 174, 176 — для системы с многими переменными 150 — для системы с полюсами 165—171 — для системы с полюсами и нулями в пе¬ редаточной функции 171 —178 — для /?Е-цепочки 145 Уравнения состояния и выхода для линейной системы 162 Условие Липшица 117 Устойчивость систем 142 Ф Фундаментальные леммы вариационного ис¬ числения 218, 239 Фундаментальная матрица 121 — 144 — вычисление с помощью преобразования Лапласа 133 — определение 121 — переходное свойство 125 — сведение к канонической форме 130 — свойства 123 —125 — сопряженной системы 141 — и экспонента от At 127 Функционал — минимум функционала 217 — 222 Функционал, определение 181 Функция 29 — внутреннее произведение 102 — 105 — дифференцируемая 84 — знака, векторная SIGN 342 — знака, скалярная sign 342 — «зона нечувствительности», векторная (DEZ) 392 — «зона нечувствительности», скалярная dez 390 — из R в R 83 — из R в Rn 84 — из *т в Rn 88 — кусочно непрерывная 81 — интеграл от нее 94 — кусочно постоянная 81 — минимум функции 205, 210 — многих переменных (см. Векторные функ¬ ции) — «насыщение» (sat, SAT) 428 — непрерывная 80 — норма 98 — норма 1 102 — норма 2 103 — область изменения 30 — область существования 30 — ограниченная 98 — однозначная 30 — от функции 30 — предельные точки 81 — разрывы 80 — расстояние между функциями 98 —103 — свертка 136 — сложная 82 — экстремальные точки 205 X Характеристический полином 44 ц Центральные оси 731 ч Частная производная 87 Ш Шварца, неравенство 48 — применение для решения оптимальных задач — для функций 104 э Эвклидова норма, — производная от 716 Эвклидово пространство 32, 48 Эйлер, уравнения движения 526 Эквивалентные функции 103 Эквивалентность динамических систем 161 Экспоненциальная матрица 127 — вычисление с помощью преобразования Лапласа 133 — для подобных матриц 129 — представление в виде ряда 128 Экстремум функции 205 Энергия управления 657 Я Якобиан 89 М. Атанс и П. Фалб ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Технический редактор Н. Ф. Демкина Корректор Н. И. Шарунина Переплет художника А. Я. Михайлова Сдано в производство 15/11 1968 г. Подписано к печати 15/Х 1968 г. Тираж 11000 экз. Печ. л. 66,85. Бум. л. 23,88. Уч.-изд. л. 62. Формат 70хЮ81/1в. Цена 4 р. 48 к. Заказ № 2025 Издательство «МАШИНОСТРОЕНИЕ», Москва, Б-66, 1-й Басманный пер., 3 Ленинградская типография № 6 Главполиграфпрома Комитета по печати при Совете Министров СССР Ленинград, ул. Моисеенко, 10