Текст
                    OPTIMAL CONTROL
An Introduction to the Theory
and Its Applications
MICHAEL ATHANS
Assistant Professor
Department of Electrical Engineering
Massachusetts Institute of Technology
PETER L. FALB
Associate Professor
Information and Control Engineering
The University of Michigan
McGRAW-HILL BOOK COMPANY
New Ycrk/St. Louis/San Francisco/Torcnto/Lcndon/Sydney


М. АТАНС и П. ФАЛБ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Перевод с английского канд. техн, наук Г. Н. АЛЕК.САКОВА Под редакцией д-ра техн, наук проф. Ю. И. ТОПЧЕЕВА ИЗДАТЕЛЬСТВО «МАШИНОСТРОЕНИЕ» Москва 1968
УДК 62—50.001 Редактор инж. Л. П. Строганов 3-18-3 105-68 Атанс М. и Фалб П Л. Оптимальное управление. Перевод с английского. Под ред. д-ра техн, наук проф. Ю. И. Т о п ч е е в а. М., «Машиностроение», 1968, стр. 764. Книга американских ученых М. Атанса и П. Фалба пред¬ ставляет собой систематическое изложение теории оптимального управления детерминированных систем. Изложению теории оптимального управления предшествует обширное введение, где приводятся основные сведения из теории множеств, линейной алгебры и теории дифференциальных урав¬ нений линейных систем с постоянными параметрами. Далее рассматривается теория оптимального управления на основе классических вариационных методов и принципа максимума Понтрягина. Ряд глав посвящен изложению методов расчета и проектиро¬ вания систем оптимальных по отношению к различным крите¬ риям оптимальности (максимуму быстродействия, расходу топ¬ лива, комбинированному и квадратичному критериям). Как пра¬ вило, результаты синтеза доведены до рабочего алгоритма или блок-схемы аналогового управляющего устройства. Книга снабжена многочисленными примерами. Работа предназначена для научных работников, инжене¬ ров, преподавателей и аспирантов, занимающихся вопросами автоматического управления, а также может быть использована студентами старших курсов высших учебных заведений, спе¬ циализирующихся в области автоматики. Илл. 265. Табл. 2. Библ. 325 назв.
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Прошло немногим более 10 лет с тех пор, как Л. С. Понтрягин и его ученики В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко заложили строгие математические основы теории оптимального управления, сфор¬ мулировав и доказав принцип максимума \ а к настоящему времени методы оптимального управления нашли весьма широкое практическое применение. Несмотря на физическую ясность этих методов, в практике проекти¬ рования оптимальных систем инженер встречается с целым рядом мате¬ матических трудностей, для преодоления которых ему необходимы глу¬ бокое понимание теории оптимального управления и обширные знания в различных ее технических приложениях. Предлагаемый вниманию читателей перевод книги американских ученых М. Атанса, П. Фалба и представляет собой систематическое изложение теории оптимального управления детерминированных систем, иллюстрированной многочислен¬ ными примерами, необходимыми для понимания теории и получения пер¬ вых практических навыков синтеза оптимальных систем. Авторы книги, желая сделать ее более доступной широкому кругу читателей, в ряде случаев отказываются от строгих аналитических дока¬ зательств, а пользуются геометрическими, носящими часто эвристический характер 1 2. Применение геометрических доказательств не только упро¬ щает изучение теории оптимального управления за счет большей нагляд¬ ности изложения, но формирует у читателя четкие представления, позво¬ ляющие ему быстрее перейти к решению поставленных перед ним прак¬ тических задач. Книга состоит из трех разделов: первого (гл. 2—4), где излагаются математические основы линейной алгебры и динамики линейных систем управления с постоянными параметрами; второго (гл. 5—6), где рассмат¬ ривается теория оптимального управления, основанная на классических вариационных методах, принципах максимума Понтрягина и динамиче¬ ского программирования Веллмана; третьего (гл. 7—10), посвященного методам проектирования систем, оптимальных по быстродействию, расходу топлива и квадратическому критерию. Книга представляет собой обработку прочитанных авторами в Мас- сачузетском технологическом институте лекций по теории оптимального управления и ее практическим приложениям и отличается хорошей логи¬ кой построения, четкостью математических постановок рассматриваемых задач, ясностью изложения, большим числом примеров конкретного проек¬ тирования некоторых классов систем автоматического управления. В тех случаях, когда аналитические методы проектирования оптимальных систем делаются громоздкими, авторы прибегают к расчетам на цифровой вычи¬ слительной машине. Книга представляет интерес и будет полезна как для инженеров, зани¬ мающихся проектированием систем автоматического управления, так и для аспирантов и студентов старших курсов высших учебных заведений, изучающих теорию автоматического управления. Ю. И. ТОЛЧЕЕВ 1 См. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории оптимальных процессов, «Доклады Академии наук СССР», т. ПО, 1956, № 1, стр. 7—10. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В, Мищенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз, 1961. 2 В этих случаях авторы указывают на литературные источники, в которых приводятся строгие математические доказательства. 5
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ 9 ГЛАВА 1 ОСНОВНЫЕ ПОЛОЖЕНИЯ. СОДЕРЖАНИЕ КНИГИ 1.1. Введение (11). 1.2. Задача синтеза системы (11). 1.3. Цель управления (13). 1.4. Исторический обзор (14). 1.5. Назначение книги (17). 1.6. Общие замечания по струк¬ туре книги (18). 1.7. Описание содержания глав книги (20). 1.8. Требования к минимуму знании, необходимых для чтения книги, и предложения относительно ее изучения (23). ГЛАВА 2 ЛИНЕЙНАЯ АЛГЕБРА 2.1. Введение (25). 2.2. Множества (25). 2.3. Операции над множествами (26). 2.4. Функции (29). 2.5*. Векторные пространства 1 (30). 2.6*. Линейные комбинации и базис (33). Линейная алгебра. 2.7*. Линейные преобразования и матрицы (35). 2.8*. Операции над линейными преобразованиями и матрицами (36). 2.9*. Линейные преобразования V в V (40). 2.10*. Собственные векторы и собственные значения (42). Эвклидовы пространства. 2.11*. Внутренние произведения (46). 2.12. Неравенство Шварца (48). 2.13. Определение ортогональности и нормы (49). 2.14. Некоторые свойства скалярного произведения на Rn (50). 2.15. Некоторые свойства симметричных матриц (53). ГЛАВА з МАТЕМАТИЧЕСКИЙ АНАЛИЗ 3.1. Введение (58). Расстояние и связанные с ним понятия. 3.2*. Определение (58). 3.3*. Сферы и пре¬ делы (60). 3-4*. Открытые и замкнутые множества (62). 3.5*. Полнота и сжатие (65). Свойства множеств в Rn. 3.6. Компактность (67). 3-7. Гиперплоскости и конусы (68). 3.8*. Выпуклость (71). Векторные функции. 3-9*. Вводные замечания (75). 3.10*. Непрерывность (77). 3.11. Кусочная непрерывность (80). 3.12*. Производные (82). 3.13. «Гладкие» множества из Rn (90). 3.14*. Интегралы (92). 3.15*. Векторные пространства (97). 3-16*. Функ¬ ционалы (105). Дифференциальные уравнения. 3.17*. Предварительные замечания (107). 3.18. Тео¬ рема существования и единственности (112). 3.19*. Линейные дифференциальные уравне¬ ния. Основные положения (118). 3.20. Фундаментальная матрица (121). Системы с постоянными параметрами. 3 21*. Экспонента от At (127). 3.22. Сведение к канонической форме (130). 3.23*. Вычисление фундаментальной матрицы с помощью преобразования Лапласа (133). 3.24*. Системы n-го порядка (137). * * * 3.25. Сопряженная система (141). 3.26. Устойчивость линейных систем с постоян¬ ными параметрами (142). 1 Значение звездочек разъясняется в гл. 1. 6
ГЛАВА 4 ОСНОВНЫЕ ПОЛОЖЕНИЯ 4.1*. Введение (145). 4.2*. Цепочка RL (145). 4.3. Система со многими перемен¬ ными (150). Динамические системы. 4.4*. Вводные замечания (151). 4.5. Определение (155). 4.6. Ди¬ намические системы, рассматриваемые в данной 1<ниге (159). 4.7. Линейные динамические системы (162). 4.8. Связь между входом и выходом системы. Передаточная функция (164). 4.9*. Отыскание представления в пространстве состояний (или в форме динамической системы) объекта, передаточная функция которого содержит только полюса (165). 4.10*. Отыскание представления в пространстве состояний (или в форме динамической систе¬ мы) объекта, передаточная функция которого содержит полюса и нули (171). Задача управления. 4.11*. Вводные замечания (178). 4.12*. Определения (179). 4.13. Специальные случаи (181). 4.14*. Множество достижимых состояний (183). 4.15*. Управляемость и наблюдаемость. Определения (186). 4.16*. Управляемость линей¬ ных систем с постоянными параметрами (187). 4.17*. Наблюдаемость линейных систем с постоянными параметрами (192). Физическое представление понятия нормальности. 4.18. Регулирование выхода (196). 4.19. Эффект сокращения полюса с нулем (198). 4.20. Практический пример (199). 4.21*. Нормальные линейные системы с постоянными параметрами (201). ГЛАВА 5 УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МИНИМУМА И УРАВНЕНИЕ ЯКОБИ —ГАМИЛЬТОНА 5.1. Введение (204). 5.2. Обычный минимум (205). 5.3. Обычный минимум с ограни¬ чениями. Простая задача (210). 5.4. Обычный минимум с ограничениями. Необходимые условия и множители Лагранжа (214). 5.5. Некоторые замечания (217). 5.6. Пример (222). Вариационный подход к задаче управления. 5.7*. Необходимые условия для задачи с незакрепленными концами (233). 5.8. Достаточные условия для' -задачи с незакрепленным концом (246). 5.9. Задача с закрепленным концом (252). 5.10*. Обсуждение вариационного метода (254). Принцип минимума Понтрягина. 5.11*. Введение (260). 5.12*. Формулировка задачи управления (260). 5.13*. Принцип минимума Понтрягина (263). 5.14*. Замена перемен¬ ных (266). 5.15*. Доказательство принципа минимума. Предварительные замечания (280). 5.16*. Эвристическое доказательство принципа минимума (282). 5.17*. Некоторые замеча¬ ния по принципу минимума (313). Достаточные условия оптимальности. 5.18*. Вводные замечания (316). 5.19*. Урав¬ нение для функционала (317). 5.20*. Достаточное условие оптимальности (319). 5.21. Некоторые замечания относительно достаточных условий (324). ГЛАВА 6 СТРУКТУРА И СВОЙСТВА ОПТИМАЛЬНЫХ СИСТЕМ 6.1. Введение (327). Задачи об оптимальном быстродействии. 6.2*. Формулировка и геометрическая интер¬ претация (328). 6.3*. Применение принципа минимума (334). 6.4*. Замечания (351). 6.5*. Линейные системы с постоянными параметрами (352). 6.6 Структура оптимального регулятора и проблема обратной связи (364). 6.7. Геометрические свойства управления, оптимального по быстродействию (367). 6.8. Существование оптимального управления (374). 6.9. Уравнение Гамильтона—Якоби (377). 6.10. Комментарии и замечания (382). Задачи на оптимум расхода топлива. 6.11. Введение (383). 6.12. Обсуждение задачи и ограничений (384). 6.13*. Формулировка задании получение необходимых условий (385). 6.14*. Линейные системы с постоянными параметрами (394). 6.15. Дополнительные фор¬ мулировки и функционалы (404). 6.16. Комментарии (409). Задачи на минимум энергии. 6.17*. Введение (410). 6.18*. Линейная задача с задан¬ ными конечным состоянием и временем перехода (412). 6.19*. Пример (417). 6.20. Ограни¬ чения управления по величине (426). Вырожденные задачи. 6.21*. Гамильтониан — линейная функция управления (430). 6.22. Гамильтониан — линейная функция управления и его абсолютного значения (442). * * * 6.23. Некоторые замечания относительно существования и единственности оптималь¬ ных и экстремальных управлений (444). 6.24*. Связь между задачами с фиксированными и нефиксированными граничными условиями (446). 6.25. Заключительные замечания (450). 7
ГЛАВА 7 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО БЫСТРОДЕЙСТВИЮ 7.1*. Введение (451). Оптимальные по быстродействию системы 7.2*. Управление объектом, который представляет собой два интегратора (453). 7.3. Управление объектами с двумя постоянными времени (469). 7.4*. Управление объектом, описываемым передаточной функцией третьего порядка с двумя интегрирующими и одним апериодическим звеньями (477). 7.5. Управление объектом, имеющим передаточную функцию с действительными полюсами (489). 7.6. Неко¬ торые замечания (501). 7.7*. Управление гармоническим осциллятором (503). 7.8. Управ¬ ление устойчивым гармоническим осциллятором с демпфированием (520). 7.9. Управление гармоническим осциллятором при помощи двух входных переменных (525). 7.10. Управ¬ ление нелинейными системами первого порядка (537). 7.11*. Управление для одного класса нелинейных систем второго порядка (541). 7.12*. Управление объектом, имеющим в пере¬ даточной функции два интегрирующих звена и один нуль (547). 7.13. Управление объек¬ том, имеющим передаточную функцию с двумя интегрирующими звеньями и двумя нулями (560). 7.14. Общие результаты относительно оптимального по быстродействию управления объектами, имеющими в передаточных функциях дифференцирующие звенья (567). 7.15. Заключительные замечания (578). ГЛАВА 8 ПРОЕКТИРОВАНИЕ СИСТЕМ, ОПТИМАЛЬНЫХ ПО РАСХОДУ ТОПЛИВА 8.1. Введение (580). 8.2. Линейные системы первого порядка. Интегратор (582). 8.3. Линейные системы первого порядка. Апериодическое звено (588). Оптимальное по расходу топлива управление объектом с двойным интегрирова¬ нием. 8.4*. Постановка задачи (591). 8.5*. Задача с незаданным временем перехода (592). 8.6*. Время перехода фиксировано или ограничено сверху (600). 8.7. Время пере¬ хода ограничено произведением минимального времени на постоянный коэффициент (608). 8.8*. Минимизация линейной комбинации времени и расхода топлива (616). * * * 8.9. Минимизация линейной комбинации времени и расхода топлива для объекта, представляющего собой интегратор и апериодическое звено (622). 8.10*. Минимизация линейной комбинации времени и расхода топлива для нелинейной системы второго по¬ рядка (633). 8.11*. Замечания и обобщения (649). ГЛАВА 9 ПРОЕКТИРОВАНИЕ ОПТИМАЛЬНЫХ ЛИНЕЙНЫХ СИСТЕМ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ 9.1*. Введение. (654) 9.2*. Постановка задачи (656). 9.3*. Задача о регуляторе состоя¬ ния (659). 9.4. Обсуждение результатов и примеры (668). 9.5*. Задача о регуляторе состояния для инвариантной во времени системы при Т — оо (672). 9.6. Анализ системы первого порядка (677). 9.7. Задача о регуляторе выхода (682). 9.8*. Задача о регуляторе выхода для системы с одним входом и одним выходом (687). 9.9*. Задача слежения (692). 9.10. Приближенные соотношения для систем, инвариантных во времени (699). 9.11*. За* дачи слежения, сводимые к задачам о регуляторе выхода (702). 9.12. Анализ следящей системы первого порядка (7Û4). 9.13*. Некоторые замечания (708). глава ю ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ ПРИ ОГРАНИЧЕНИИ УПРАВЛЕНИЯ ГИПЕРСФЕРОЙ 10.1. Введение (710). 10.2. Обсуждение, ограничения || u(t) || m (711). 10.3. Поста¬ новка задачи об управлении оптимальном по быстродействию (712). 10.4. Аналитическое определение оптимального по быстродействию управления для одного класса нелинейных систем (715). 10.5. Обсуждение результатов (718). 10.6. Оптимальное управление системами с инвариантной нормой (721). 10.7. Оптимальное по быстродействию управление ско¬ ростью вращения тела с одной осью симметрии (733). 10.8. Рекомендации по дальнейшему чтению литературы (744). * * * Литература , 745 Алфавитно-предметный указатель 758
ПРЕДИСЛОВИЕ Последние достижения науки об управлении вызвали необходимость написать книгу, являющуюся введением в теорию оптимального управле¬ ния, доведенную до практического применения. Цель данной книги — снабдить инженера или аспиранта основными знаниями, необходимыми для глубокого понимания теории оптимального управления автоматиче¬ скими системами. Мы надеемся, что материал, изложенный в книге, позво¬ лит аспирантам, начиная с ранней ступени их деятельности, успешно применять на практике теоретические положения работ по автоматиче¬ скому управлению и критически оценивать достоинства и значение много¬ численных работ, публикуемых в литературе по теории управления. Нам хотелось также указать на большое значение аккуратного и точного мышления и дисциплинированной интуиции для будущего ученого. В связи с этим в книгу было включено большое число примеров и упражнений. Книга подразделяется на три основные части: 1. Математическое введение в описание и анализ динамических систем (гл. 2—4). 2. Основные положения теории оптимального управления, включая принцип максимума Понтрягина (гл. 5 и 6). 3. Приложения теории оптимального управления к расчету систем с обратной связью, оптимальных по отношению к различным критериям (гл. 7—10). В гл. 2 излагаются достаточно конспективно основные положения линейной алгебры и определяются векторные обозначения, используемые на протяжении всей книги. В гл. 3 рассматриваются элементарные топо¬ логические свойства /г-мерного эвклидова пространства, основы теории векторных функций и различные положения векторных дифференциаль¬ ных уравнений. Гл. 4 посвящена изложению основных понятий о представлении дина¬ мической системы в пространстве состояний и определению задачи управ¬ ления. В гл. 5 выводятся и анализируются основные условия оптималь¬ ности, включая принцип максимума Понтрягина. Структура и основные свойства оптимальных систем по отношению к различным конкретным показателям преобразования рассматриваются в гл. 6, которая является переходной от теоретического материала предыдущих глав к проблемам расчета конкретных систем управления, рассматриваемых в последующих главах. Гл. 7 посвящена решению задачи оптимизации по быстродействию для некоторых специальных систем. В гл. 8 даются приложения теории к расчету систем, имеющих минимум расхода топлива. В гл. 9 предла¬ гаются вниманию читателя общие результаты, достижимые для одного важного класса задач оптимизации, а именно: для управления линейными объектами по критерию квадратичной интегральной оценки. В заключи¬ тельной главе (гл. 10) рассматривается класс задач автоматического 9
управления, которые решаются проще прямыми методами, нежели мето¬ дами, основанными на принципе максимума Понтрягина. Мы глубоко признательны многим нашим коллегам и студентам за их неоценимую помощь в подготовке данной книги. В частности, мы хотим поблагодарить профессора Калифорнийского университета в Беркли К- А. Дэзоера, декана Бруклинского политехнического института Джона Траксела, профессора Калифорнийского университета в Беркли Е. Р. Пол¬ лака, доктора X. К. Кнудсена из Линкольновской лаборатории Мас- сачузетского технологического института и доктора С. Дж. Кэхью из научно-исследовательской лаборатории ВВС в Кембридже за вниматель¬ ный просмотр рукописи и за их многочисленные, очень полезные предло¬ жения и комментарии. Мы также выражаем нашу благодарность доктору Г. Галкину из лабо¬ ратории фирмы «Бэлл-Телефон» в Уиппени за его замечания по гл. 4 и 5; профессору В. У. Броккэту из Массачузетского технологического инсти¬ тута за предложения по гл. 6 и профессору P. Е. Калману из Стэнфорд¬ ского университета за очень полезные замечания по гл. 9. Ряд студентов Массачузетского технологического института помогли нам своими замеча¬ ниями и предложениями после очень внимательного изучения рукописи. Мы особенно хотим поблагодарить Д. Грея, Д. Клейнмана, У. Левина, Дж. Планта и X. Уитсенхаузена за их исключительную помощь в напи¬ сании книги. Р. А. Кэрол из Линкольновской лаборатории предоставил нам результаты расчетов на цифровой вычислительной машине, приведен¬ ные в гл. 9, за что мы ему очень признательны. И, наконец, мы хотим поблагодарить мисс Дж. М. Келли, которая выполнила исключительную работу по печатанию большей части рукописи, и миссис С. М. Маккей, которая очень помогла нам при подготовке рукописи. МАЙКЛ АТАНС ПИТЕР Л. ФАЛБ
ГЛАВА 1 ОСНОВНЫЕ ПОЛОЖЕНИЯ. СОДЕРЖАНИЕ КНИГИ 1.1. ВВЕДЕНИЕ В последнее десятилетие значительное внимание уделяется оптималь¬ ному управлению, получившему свое развитие в виде общей теории, осно¬ ванной на сочетании вариационных методов, теории автоматического регулирования и применении быстродействующих вычислительных машин. Поэтому возникла большая необходимость в изложении введения в теорию оптимального управления и ее приложений, которая снабдила бы инже¬ нера и студента теоретическими основами, необходимыми для глубокого понимания последних достижений в теории, практике расчетов и проекти¬ ровании систем автоматического управления. Предлагаемая вниманию читателя книга восполняет в какой-то мере данный пробел. В настоящей главе рассмотрены основные положения, сформулиро¬ вана задача синтеза оптимального управления и приведено содержание книги. В § 1.2 дана постановка задачи синтеза систем оптимального упра¬ вления. Затем в § 1.3 перечислены вопросы, которые необходимо решать при проектировании систем оптимального управления. Далее в § 1.4 изложена краткая история развития теории оптимального, управления и указано на перспективность вопросов, рассматриваемых в книге. В § 1.5 достаточно подробно рассказано о цели данной книги. Исходя из сформулированных задач будут сделаны общие замечания по структуре книги (§ 1.6) и подробно описано содержание ее глав (§ 1.7). Первая глава заканчивается § 1.8, в котором указываются требования к объему предварительных знаний, необходимых для чтения книги, а также даются некоторые предложения по изучению ее материалов, осно¬ ванные на нашем опыте преподавания. 1.2. ЗАДАЧА СИНТЕЗА СИСТЕМЫ Синтез системы начинается с постановки задачи (иногда довольно неопределенной), которая должна выполняться с помощью существующего или вновь разработанного метода. Например, специалисту по проекти¬ рованию систем может быть предложено увеличить выход химической дистилляционной колонны или спроектировать систему связи со спут¬ ником. В качестве требований к задачам инженеру обычно задается: 1. Некоторая совокупность целей, которые достигаются в результате осуществления физического процесса. Например, может быть поручено спроектировать ракету, способную перехватить заданную цель в течение определенного отрезка времени. 2. Некоторая совокупность ограничений как внутренних, присущих самому физическому процессу, так и наложенных искусственно, извне. Н
В реальных системах почти всегда существуют ограничения, связанные со стоимостью, надежностью или размерами объектов или устройств управления. Разработка системы, которая выполняет поставленные перед ней задачи и удовлетворяет наложенным на нее ограничениям, по сути дела, и есть проблема синтеза системы. Существуют два метода решения задачи синтеза: эмпирически — интуитивный (первый метод) и логически —дедуктивный (второй метод). Решая задачу синтеза первым методом, инженер использует свой опыт, умение, интуицию и результаты экспериментов с тем, чтобы создать из реальных агрегатов некоторый прототип требуемой системы. Он имеет дело с реальными агрегатами и не разрабатывает математических моделей, не прибегает к методу моделирования системы. Короче говоря, исходя из имеющихся агрегатов или оборудования, которое может быть разра¬ ботано, инженер просто собирает систему, выполняющую поставленную задачу. Например, если инженеру задан тип проигрывателя, оконечный усилитель и характеристики громкоговорителя, а перед ним ставится задача спроектировать систему звуковоспроизведения, отвечающую задан¬ ным показателям качества, то он может на основе экспериментов и своего опыта прийти к выводу, что заданные требования к качеству звуковос¬ произведения могут быть удовлетворены с помощью предварительного усилителя с вполне определенными характеристиками, который он зака¬ зывает и после его изготовления включает в рассматриваемую систему. Поэтому первый метод часто справедливо относится к «инженерному искусству». К сожалению, для сложных систем с высокой точностью работы пер¬ вый метод часто оказывается неприемлемым. Более того, высокая стои¬ мость оборудования, нужного для проведения экспериментов, и возмож¬ ность привести его в негодное состояние могут являться серьезным пре¬ пятствием к применению этого метода. Например, никто не вздумает пытаться управлять ядерным реактором, просто экспериментируя с самим реактором, и, наконец, первый метод редко приводит к созданию общих принципов синтеза систем, которые могут применяться при решении дру¬ гих задач. Второй метод решения задачи синтеза начинается с замены реальной системы математическими соотношениями. Другими словами, первый шаг синтеза состоит в разработке математической модели, соответствующей фи¬ зическому процессу, целям системы и налагаемым ограничениям. Удовле¬ творительное математическое описание и формулировка проблемы синтеза системы являются исключительно увлекательной и сложной задачей. Желаемые особенности системы, такие как надежность и простота, почти невозможно перевести на математический язык х. Более того, математи¬ ческие модели, которые являются идеализацией и приближением к реаль¬ ным системам, не являются единственными. Сформулировав задачу синтеза в виде некоторых математических зави¬ симостей, инженер, проектирующий систему, ищет далее ее структурную 1 В настоящее время на основе развития методов регуляризации некорректных задач А. Н. Тихонова В. В. Солодовниковым разработан принцип минимальной сложности, позволяющий синтезировать систему управления с наиболее простой структурой. См., напри¬ мер, следующие работы: Солодовников В. В., Ленский В. Л. Синтез систем управления минимальной сложности. «Изв. АН СССР. Техническая кибернетика», 1966, № 2. Солодовников В. В., Ленский В. Л. Принцип минимальной сложности и регу¬ ляризация задач синтеза систем управления (гл. 5); Синтез оптимальных систем и коррек¬ тирующих устройств минимальной сложности (гл. 8). В сборнике «Современные методы проектирования систем автоматического управления. Анализ и синтез». М., «Машинострое¬ ние», 1967 (Прим. ред.). 12
схему, которая представляет собой аналитическое решение стоящей перед ним проблемы синтеза. Моделирование математических соотношений с помощью средств вычислительной техники (цифровых, аналоговых или аналогово-цифровых) часто играет весьма важную роль в поисках нужного решения. Полученное решение даст инженеру некоторые представления о числе требуемых взаимозависимостей, о типе вычислений, которые должны быть проделаны, о необходимых математических описаний подсистем и т. д. После определения соотношений, описывающих систему в целом, инженер часто моделирует их с тем, чтобы глубже «заглянуть внутрь» системы и исследовать поведение модели при идеальных условиях. Из мо¬ делирования можно сделать вывод о том, насколько математические соот¬ ношения соответствуют реальной физической системе, исследовать чув¬ ствительность модели к изменениям параметров и непредсказуемым воз¬ мущениям, сравнить различные варианты структуры системы. После завершения проектирования и проверки путем моделирования и экспериментов с моделью инженер строит прототип системы в виде макета. Процесс макетирования обратен процессу моделирования, по¬ скольку макет — это физическая система, которая должна адекватно изображать полученные математические соотношения. Затем исследуется макет системы с целью установить, отвечает ли система предъявленным требованиям и удовлетворяются ли заданные ограничения. Если система функционирует правильно, работа может считаться завершенной Е Часто по экономическим или другим причинам инженер бывает не удовлетворен системой, которая выполняет поставленную задачу, и он пытается ее улучшить, или оптимизировать. Процесс оптимизации на этапе предварительного проектирования весьма полезен с точки зрения пони¬ мания работы системы и часто используется для сравнения вариантов, в то время как процесс оптимизации на этапе математического макетиро¬ вания связан в основном с выбором лучших показателей. Роль оптими¬ зации в задаче синтеза будет рассмотрена в следующем параграфе. 1.3. ЦЕЛЬ УПРАВЛЕНИЯ Определенный класс задач синтеза систем представляет собой задачу «управления» системой. Например, перед инженером может быть постав¬ лена задача разработать автопилот с определенным видом переходной характеристики, быстродействующую следящую систему или систему управления положением спутника, которая не потребляла бы слишком много топлива. Запись целей управления в математической форме на этапе предварительного проектирования обычно называют задачей управления. Существенными элементами задачи управления являются: 1) математическая модель системы, которой надо управлять; 2) желаемый выходной сигнал системы; 3) совокупность допустимых входов или управляющих сигналов; 1 По терминологии, принятой в СССР, первый этап проектирования системы управ¬ ления, выполненный на основе математических соотношений, именуется предварительным (предэскизным) проектированием. Второй этап проектирования, когда упрощенные мате¬ матические соотношения заменяются более полной математической моделью, реализуемой на электронных вычислительных машинах, называется эскизным проектированием (мате¬ матическим моделированием). На третьем этапе проектирования к электронной модели подключается динамический стенд, имитирующий перемещения объекта управления. Макеты реальной аппаратуры управления устанавливаются на стенде. Этот этап проектиро¬ вания именуется стендовой отработкой системы управления (физическим моделированием). И, наконец, на четвертом этапе проектирования производится отработка системы управле¬ ния в реальных условиях (натурные испытания). (Прим, ред.). 13
4) функционал, или стоимость, измеряющие эффективность данного процесса управления. Рассмотрим теперь, как возникают эти элементы из физической задачи синтеза реальной системы управления. Математическая модель, представляющая физическую систему, состоит из набора соотношений, которые описывают реакцию или «выход» системы относительно различных входных сигналов. Ограничения, основанные на особенности физических процессов в системе, связаны с этим набором соотношений между входами и выходом системы. При переводе задачи проектирования в задачу управления инженер сталкивается с трудностью описания желаемого физического поведения системы в математической форме. Цели системы часто переводятся в тре¬ бования к выходу системы. Например, если проектируется следящая система, желаемым выходом является сам отслеживаемый сигнал (или сигнал, достаточно близкий к нему). Поскольку «управляющие» сигналы в физической системе обычно полу¬ чаются с помощью устройств, которые могут обеспечить лишь ограничен¬ ные по величине силы или энергии, на входные сигналы накладываются некоторые ограничения. Эти ограничения дают набор так называемых допустимых входных (управляющих) сигналов. Часто желаемые цели могут быть достигнуты с помощью различных управляющих сигналов, и поэтому инженер отыскивает способ измерения качества работы системы или стоимости управления, который позволил бы ему выбрать «лучший» вход. Выбор математического выражения функцио¬ нала является весьма субъективным моментом, так как выбор, сделанный одним проектировщиком, не является для другого обязательным. Опыт и интуиция инженера играют важную роль в определении функционала стоимости, подходящего для поставленной перед ним задачи. Более того, функционал (стоимость) будет зависеть от желаемого поведения системы. Например, при стремлении ограничить колебания переменной, описы¬ вающей поведение системы, например х (/), можно принять стоимость преобразования (функционал) пропорциональной [х(/)]6 и пытаться сде¬ лать интеграл этой стоимости на отрезке времени, скажем Ц < / < /2, малым. В большинстве случаев функционал выбирается таким образом, чтобы его величина зависела от входного сигнала и переменных, описы¬ вающих поведение системы. Когда функционал выбран, задача управления формулируется сле¬ дующим образом: требуется определить допустимые входные сигналы, обеспечивающие получение желаемого результата на выходе, одновре¬ менно минимизируя (оптимизируя) выбранный показатель. Теория опти¬ мального управления помогает инженеру в отыскании решения стоящей перед ним задачи. Такое решение (если оно существует) называется опти¬ мальным управлением. Итак, задача управления есть перевод задачи синтеза системы управ¬ ления на язык математики; решение задачи управления относится к опре¬ деленной методике, которой руководствуется инженер при разработке реальной системы управления. 1.4. ИСТОРИЧЕСКИЙ ОБЗОР До второй мировой войны проектирование систем управления пред¬ ставляло собой искусство. В течение войны и после нее было потрачено много усилий на проектирование замкнутых систем, в которых отрица¬ тельная обратная связь использовалась для улучшения переходного про¬ цесса и повышения точности. Первые теоретические методы анализа си- 14
стемы автоматического регулирования опирались на работы Г. Бодэ и Найквиста х. В частности, такие понятия, как частотная характеристика, ширина полосы пропускания, усиление (в децибеллах) и запас фазы исполь¬ зовали для проектирования систем в частотной области, основываясь на способе проб и ошибок. По сути дела, это было началом инженерных методов современной теории управления. Теория автоматического регулирования 1 2 быстро развивалась в период после окончания войны и до начала 50-х годов. В это время широко при¬ менялись временные критерии, такие как время нарастания, время пере¬ ходного процесса, максимум относительного перерегулирования. Метод корневого годографа, предложенный в 1948 г. У. Эвансом 3, явился свя¬ зующим началом между методами анализа и синтеза во временной и ча¬ стотной областях и представляет собой достаточно мощный аналитический инструмент исследования. В течение этого периода инженер, занимаю¬ щийся управлением, имел дело с проектированием линейных следящих систем. Небольшими нелинейностями объекта и усилителя мощности можно было пренебречь, так как отрицательная обратная связь делала харак¬ теристики системы нечувствительными к изменениям параметров и воз¬ мущениям. Технический прогресс промышленного производства и исследования космоса, которые начались в середине столетия, пробудили интерес как к системам с исключительно высокой точностью и требованием мини¬ мальной стоимости, так и к нелинейным системам управления, в частности релейным системам управления, так как реле является простым и непри¬ хотливым усилителем мощности. Для анализа систем управления с релей¬ ными устройствами было предложено два метода: описывающей функции 4 1 В эти же годы в СССР А. В. Михайловым, В. В. Солодовниковым и многими другими учеными закладывались теоретические основы частотных методов ана¬ лиза и синтеза линейных систем автоматического регулирования. Более подробно с исто¬ рией развития теории автоматического регулирования в СССР можно ознакомиться по книге «Техническая кибернетика, книга 1. Теория автоматического регулирования», М., «Маши¬ ностроение», 1967 (Прим. ред.). 2 См. Основы автоматического регулирования. Теория. Под ред. В. В. Солодовни¬ кова. М., Машгиз. 1954 (Прим. ред.). 3 В том же году в СССР была опубликована работа К. Ф. Теодорчика «Траектории корней характеристического уравнения системы третьего порядка при не¬ прерывном изменении свободного члена и максимально достижимая при этом устойчи¬ вость», журнал «Теория физики», том 18, 1948. В практике проектирования автоматических систем в СССР метод корневого годо¬ графа нашел ограниченное применение, хотя он и освещался достаточно широко в оте¬ чественной литературе, см. например: Удерман Э. Г. Метод корневого годографа в теории автоматического управле¬ ния. М., Госэнергоиздат. 1963 (Прим. ред.). 4 Метод гармонической линеаризации или гармонического баланса Крылова—Бого¬ любова (или по терминологии, принятой в США, описывающей функции) основан на исполь¬ зовании асимптотических разложений, представляющих развитие теории возмущений. Дальнейшее развитие этого метода принадлежит Е. П. Попову и Л. С. Гольдфарбу. Крылов Н. М.,Боголюбов Н.Н. Основные проблемы нелинейной механики. Изв. АН УССР, 1933, № 4, стр. 475—498. Крылов Н. М., Боголюбов Н. Н. Вве¬ дение в нелинейную механику. Изд. АН УССР. Киев, 1937, 364 стр. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний. Изд. 3-е. М., Физматгиз. 1963, 410 стр. Попов Е. П. Динамика систем автоматического регулирования. М., Гостехиздат. 1954. Попов Е. П., Пальтов И. П. Приближенные методы исследования нелиней¬ ных автоматических систем. М., Физматгиз. 1960, 792 стр. Гольдфарб Л. С. О некоторых нелинейностях в системах регулирования. «Автоматика и телемеханика», т. 8, 1947, № 5, стр. 349—383. (Прим. ред.). 15
и фазового пространства Г Метод описывающері функции позволяет инже¬ неру исследовать устойчивость замкнутой нелинейной системы с частотной точки зрения, а метод фазового пространства — проектировать нелиней¬ ные системы управления во временной области. Законы управления, обеспечивающие минимальное время переходного процесса (в терминах линий и поверхностей переключения), для различ¬ ных систем второго и третьего порядка были получены в начале 50-х годов. Доказательства оптимальности были эвристическими и, по сути дела, геометрическими. Однако идея определения оптимальности системы по отношению к такому специфическому показателю качества системы как время переходного процесса представляла значительный интерес для ин¬ женера-проектировщика. Точная формулировка этой проблемы привлекла к ней интерес математиков. Проблема оптимального по времени управления интенсивно изуча¬ лась математиками в СССР и США. В 1953—1957 гг. Р. Веллман, Р. В. Гам- крелидзе, Н. Н. Красовский и Ж. Ла-Саль развили основы теории задачи о минимальном времени перехода и представили результаты, связанные с существованием, единственностью и основными свойствами управления, оптимального по быстродействию1 2. Вскоре последовалопризнание того, что задачи управления, по сути дела, являются и задачами вариационного исчисления. Классическое вариационное исчисление не может с легкостью обхо¬ диться с теми «жесткими» ограничениями, которые обычно имеют место в задачах управления. Это затруднение привело Л. С. Понтрягина к пер¬ вому предположению о существовании его знаменитого принципа макси¬ мума и затем к тому, чтобы вместе с В. Г. Болтянским и Р. В. Гамкрелидзе дать его доказательство 3. Принцип максимума был впервые провозглашен на международном конгрессе математиков, который проходил в Эдин¬ бурге в 1958 г. Принцип максимума Понтрягина можно рассматривать как способ подхода к вариационным задачам Гамильтона, а метод динамического программирования Веллмана следует рассматривать как направление, иду¬ щее по пути Гамильтона—Якоби. Использование методов динамического 1 Метод фазового пространства был создан и развит А. А. Андроновым и его учени¬ ками. Андронов А. А., X а й к и н С. Э. Теория колебаний, ч. 1. ОНТИ. М.—Л., 1937 или Андронов А. А., Витт А. А. и Хайкин С. Э. Теория колебаний, 2-е изд, переработ. и доп. Н. А. Железцовым. М., Физматгиз. 1939, 915 стр. (Прим. ред.). 2 Из числа первых работ в области оптимальных по быстродействию систем управ¬ ления, выполненных в СССР, следует назвать: Фельдбаум А. А. Оптимальные процессы в системах автоматического регули¬ рования. «Автоматика и телемеханика», т. 14, 1953, стр. 712—728. Фельдбаум А. А. О синтезе оптимальных систем с помощью фазового про¬ странства. «Автоматика и телемеханика», т. 16, 1955, № 2, стр. 120—149. Болтянский В. Г., Гамкрелидзе Р. В..Понтрягин Л. С. К теории оптимальных процессов «ДАН», т. ПО, 1956, № 1, стр. 7—10. Гамкрелидзе Р. В. К теории оптимальных процессов в линейных системах «ДАН», т. 116, 1957, № 1, стр. 9—11. Красовский Н. Н. К теории оптимального регулирования. «Автоматика и телемеханика», т. 18, 1957, № 11, стр. 960—970. Красовский Н. Н. Об одной задаче оптимального регулирования. «Приклад¬ ная математика и механика», т. 21, 1957, № 5, стр. 670—677. (Прим. ред.). 3 См. Болтянский В. Г., Гамкрелидзе Р. В., Понтрягин Л. С. К теории оптимальных процессов «ДАН», т. ПО, 1956, № 1, стр. 7—10 или Понт¬ рягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мишенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз. 1951, 391 стр. Болтянский В. Г. Математические методы оптимального управления. М., Физ¬ матгиз. 1966, 307 стр. (Прим, ред.) 16
программирования в решении задач управления принесло большую пользу. Одновременно с быстрым развитием теории управления происходил непрерывный прогресс в области вычислительной техники, которая снаб¬ дила инженеров неограниченно расширяющимися вычислительными воз¬ можностями и мощными средствами моделирования. Широкая доступность специализированных и универсальных вычислительных машин значи¬ тельно сократила потребность получения решений в замкнутой форме и требования к тому, чтобы корректирующие устройства осуществлялись с помощью RC цепочек. Современная теория и техника управления могут, следовательно, рассматриваться как результат слияния трех различных направлений: теории автоматического регулирования, вариационного исчисления и вы¬ числительной техники. В наши дни теория управления является прежде всего средством проектирования, позволяющим инженеру-проектировщику правильно вы¬ бирать внутреннюю структуру и находить аналитическим способом реше¬ ния задачи оптимального управления. Из этого совершенно не следует, что процесс проектирования оптимальных систем управления является достаточно простым делом. Поскольку оптимальные системы с обратной связью, как правило, сложны и в принципе нелинейны, то очень трудно анализировать влияние изменения параметров и возмущений на характе¬ ристики системы. В добавок к этому необходимость точного измерения переменных (или фазовых координат) и вычислительные трудности, свя¬ занные с отысканием оптимального управления, могут сделать оптималь¬ ное устройство экономически нецелесообразным. Тем не менее мы глубоко убеждены в том, что современная теория управления будет становиться все более полезной наукой для инженерной практики. Для этого есть несколько оснований. Во-первых, предэскизные проекты и модели, выполненные с помощью цифровых или аналоговых машин, могут служить основой для сравнения вариантов проектируемых систем. Во-вторых, знание оптимального решения данной задачи служит инженеру надежной путеводной нитью при выборе варианта, близкого к оптимальному. В-третьих, прогресс в области вычислительной техники будет способствовать преодолению затруднений, которые возникают при реализации оптимальных законов управления в реальных системах с помощью существующих вычислительных средств. И, наконец, хотя оптимальные устройства далеко не часто могут быть реализованы, тем не менее теория расширяет горизонты инженерной практики и, следова¬ тельно, позволяет инженеру браться за решение таких сложных и труд¬ ных проблем, о которых раньше он не смел и подумать. 1.5. НАЗНАЧЕНИЕ КНИГИ При написании этой книги мы преследовали две основные цели. Во-первых, хотели создать учебник по теории оптимального управления и ее приложениям для аспирантов первого года обучения, специализи¬ рующихся в области автоматического управления; во-вторых, — снабдить инженеров и аспирантов доступным и значительным теорети¬ ческим фундаментом, необходимым для дальнейшего развития теории и практики систем автоматического управления. Мы не пытались и не хотели написать исчерпывающую монографию. В книге уделено довольно много внимания разработке вводного мате¬ риала, который излагается весьма детально. В частности, мы хотели: 1. Развить основы математического аппарата, необходимые для глу¬ бокого понимания теории. 17
2. Дать строгую формулировку задачи управления. 3. Изложить необходимые условия оптимальности, уделив особое внимание принципу максимума Понтрягина и основным достаточным условиям в форме уравнений Гамильтона—Якоби. 4. Проиллюстрировать приложения теории простыми задачами, при¬ бегая к помощи различных общепринятых критериев оптимальности. 5. Рассмотреть структуру, свойства и техническую реализацию неко¬ торых оптимальных систем с обратной связью. В книге мы не стремились излишне «углубить» многие из рассматри¬ ваемых вопросов и опускали целый ряд других важных задач. Поэтому при доказательствах часто использовались эвристические положения. А для изучения более строгих доказательств мы отсылаем читателя к соот¬ ветствующим литературным источникам. Надеемся, что основной материал, изложенный в книге, позволит аспирантам на ранней ступени их научной деятельности применять на практике достижения теории автоматического управления и квалифици¬ рованно оценивать достоинства и значение бесчисленных статей, публи¬ куемых в литературе по автоматическому управлению (которые, к сожа¬ лению, содержат много неосновательных претензий на всеобщность). Хотим также отметить неоценимое значение для будущего ученого более строгого мышления и дисциплинированной интуиции, которые так необ¬ ходимы для его развития. Мы обнаружили, что аспиранты, специализирующиеся в области прак¬ тики автоматического управления, не могут по настоящему изучить теорию управления без убедительных примеров и выполнения определенного числа упражнений. Только с помощью последних они могут оценить полезность и преимущества теории. Примеры нужны и математикам-прикладникам, стремящимся внести свой вклад в теорию, поскольку эти примеры часто помогают им отличать физический смысл от чисто математического. Поэтому в книгу включено большое число примеров и упражнений, которые, мы надеемся, будут полезны аспирантам, инженерам и мате¬ матикам-прикладникам. 1.6. ОБЩИЕ ЗАМЕЧАНИЯ ПО СТРУКТУРЕ КНИГИ Книга может быть разделена на следующие три основные части: 1. Математические основы, относящиеся к описанию и анализу дина¬ мических систем (гл. 2—4). 2. Некоторые положения теории оптимального управления, включая принцип максимума Понтрягина для непрерывных детерминированных систем с конечным числом переменных (гл. 5—6). 3. Приложения теории к расчету систем с обратной связью, опти¬ мальных по отношению к различным критериям (гл. 7—10). На протяжении всей книги мы часто пытались строго формулировать определения, теоремы и задачи; с другой стороны, иногда лишь бегло описывали доказательства, опустили или отнесли к числу упражнений многие доказательства, сославшись на соответствующую литературу. Мы считали такой метод изложения наиболее удобным для аспирантов, специализирующихся в области техники автоматического управления. В книге использованы обозначения теории множеств и векторной алгебры, позволяющие избежать громоздких математических записей, затрудняющих изучение основных положений. Мы знаем, что после на¬ чального переходного периода аспиранты приспосабливаются к такой тер¬ минологии и способу думать «физически» в терминах множеств, векторов и матриц. Основные положения книги, как правило, иллюстрируются 18
примерами. Мы, однако, не пытались скрыть трудности, особенно вычисли¬ тельного характера, связанные с анализом и синтезом систем со многими переменными. Большинство тщательно проработанных примеров включено в книгу с целью снабдить читателя иллюстрациями общей теории. Эти примеры послужат углублению понимания и повышения уровня интуиции. Кроме того, включены многочисленные упражнения. Упражнения распадаются на три категории: 1) обычные упражнения; 2) упражнения, которые используются для иллюстрации «вершин» теории, а также вычислительных трудностей, связанных с определением оптимальных законов управления х; 3) упражнения для обоснования новых положений теории и прило¬ жений. Некоторые из них относятся к категории «почти невозможных». Мы часто ссылаемся на несколько литературных источников по од¬ ному и тому же вопросу. Кроме того, отмечаем литературу, относящуюся к тому или иному конкретному вопросу, так что заинтересованный чита¬ тель может с успехом «обратиться за консультацией» к литературным источникам. С этой целью в книгу включена подробная библиография, которая, однако, не является исчерпывающей. В нее были включены статьи, отчеты и книги, с которыми мы знакомы. Поскольку нашей целью было дать введение в теорию оптимального управления и ее приложения, мы не обсуждаем множество важных вопро¬ сов, которые являются слишком «продвинутыми» или требуют дополни¬ тельной подготовки. В частности, в книге не освещены следующие вопросы: 1. Вычислительные алгоритмы для определения законов оптималь¬ ного управления сложных систем. 2. Задачи с ограничениями фазовых координат. 3. Теория оптимального управления для дискретных (или импульс¬ ных) систем. 4. Задачи, связанные с объектами с распределенными параметрами. 5. Теория оптимального управления для стохастических систем. 6. Проектирование оптимальных фильтров, интерполяторов, сглажи¬ вающих устройств 1 2. Ниже кратко перечислены некоторые из причин, по которым эти важ¬ ные вопросы были опущены. 1. Несмотря на то, что много усилий было посвящено (и посвящается) разработке сходящихся вычислительных алгоритмов, было получено мало общих результатов, которые гарантировали бы сходимость или содер¬ жали бы информацию относительно скорости сходимости алгоритма. 2. Ограничения фазовых координат более сложны для анализа, чем ограничения управляющих сигналов. Необходимые условия для задач с ограничениями фазовых координат имеются в литературе, но, по нашему мнению, не относятся к материалам вводного характера. 3. Теория дискретных стохастических систем 3, а также систем с рас¬ пределенными параметрами 4 в настоящее время еще только развивается. Поскольку изучение систем с распределенными параметрами требует знания дифференциальных уравнений в частных производных, а изучение стохастических систем требует знания теории вероятностей (в том числе 1 Некоторые упражнения гл. 9 требуют использования цифровой вычислительной машины. 2 Читатель, которого интересуют перечисленные выше вопросы, может ознакомиться с ними по литературным источникам, добавленным при переводе книги. (Прим. ред.). 3 См. [312]. 4 См. [235]. 19
стохастических дифференциальных уравнений), эти вопросы, очевидно, не годятся для введения в теорию оптимального управления. 4. Для синтеза оптимальных фильтров линейных систем с гауссовыми шумовыми процессами может быть использована теория Винера—Кал- мана—Бюси. Однако общие результаты, относящиеся к нелинейным системам с негауссовым шумом, в настоящее время недоступны для целей практики. Заинтересованный читатель без больших затруднений сможет изучать теорию Винера—Калмана—Бюси после усвоения разделов дан¬ ной книги, относящихся к детерминированным системам. В следующем параграфе приводится описание содержания каждой из глав книги. 1.7. ОПИСАНИЕ СОДЕРЖАНИЯ ГЛАВ КНИГИ Ниже дается краткое описание содержания каждой из глав. При этом особое внимание уделяется взаимным связям между различными главами. Линейная алгебра (гл. 2). В этой главе дается обзор основ¬ ных положений линейной алгебры и приводятся векторные и матричные обозначения, которые используются далее на протяжении всей книги. После краткого изложения известных положений и теории множеств вво¬ дится понятие векторного пространства, а затем рассматриваются линей¬ ные преобразования. Теория матриц излагается в основном с точки зре¬ ния линейных преобразований, и в значительно меньшей степени исполь¬ зуется распространенный подход к матрицам как к упорядоченным наборам чисел. Мы подчеркиваем, что матрица связана с линейным преобразова¬ нием и заданной координатной системой, а также указываем, что линейные преобразования являются внутренними, а матрицы ими не являются. В остальной части гл. 2 рассматриваются собственные значения и собст¬ венные векторы, подобие матриц, внутреннее и скалярное произведения, эвклидовы векторные пространства и некоторые свойства симметричных матриц. Материал этой главы используется в каждой из последующих глав книги. Математический анализ (гл. 3). В гл. 3 обсуждаются элементарные топологические свойства n-мерного эвклидова пространства, основы теории векторных функций и некоторые положения векторных дифференциальных уравнений. Эта глава начинается с изучения понятия расстояния и связанных с ним представлений об открытых и закрытых множествах, о компактности. Далее рассматриваются функции различных переменных, развиваются определения непрерывности, кусочной непре¬ рывности (или регулярности), производной, градиента и интеграла таких функций. Вводятся важные понятия функционального пространства и рас¬ стояния между элементами функционального пространства. Оставшаяся часть гл. 3 посвящена векторным дифференциальным уравнениям. Здесь доказываются основные теоремы существования и единственности и разви¬ вается метод решения линейных дифференциальных уравнений с помощью фундаментальной матрицы. Материал этой главы будет полезен при чтении последующих глав книги. Основные положения (гл. 4). В этой главе мы вводим понятия, связанные с представлением системы в пространстве состояний, приводим определение задачи управления и начинаем ее изучение. Рас- мотрение понятия «состояние системы» начинается на примере простых электрических цепей. После популярного изложения методов математи¬ ческого описания физических систем мы приводим аксиоматическое опре¬ деление динамической системы. Далее рассматриваются конечно-мерные непрерывные системы. Материал гл. 3 используется для того, чтобы уста- 20
новить соотношения между состоянием системы и начальными условиями дифференциальных уравнений, описывающих систему. В § 4.9 и 4.10 описываются приемы представления системы с постоянными параметрами, имеющей один вход и один выход, в пространстве состояний. Физический смысл фазовых координат иллюстрируется с помощью аналогового моде¬ лирования дифференциальных уравнений. Глава завершается формули¬ ровкой определения задачи управления и обсуждением некоторых след¬ ствий, вытекающих из этого определения. В частности, мы рассматри¬ ваем множество достигаемых состояний и качественные определения поня¬ тий управляемости, наблюдаемости и нормальности и развиваем некоторые из важных приложений этих понятий. Материал этой главы служит крае¬ угольным камнем теории и практики оптимального проектирования, рас¬ сматриваемых в последующих главах книги. Условия оптимальности. Принцип минимума1 иуравнение Гамильтона — Якоби (гл. 5). В этой главе формулируются и изучаются основные условия оптимальности. Мы вклю¬ чили сюда обзор теории отыскания минимума функций, определенных на n-мерном эвклидовом пространстве; упоминание об использовании вычисления вариаций для решения задач управления; постановку и эври¬ стическое доказательство принципа минимума Понтрягина и рассмотрение уравнений Гамильтона—Якоби, основанных на сочетании «принципа опти¬ мальности» Веллмана и леммы Каратеодори по способу, предложенному Калманом. Для развития интуиции у читателя мы начинаем изложение с обычного минимума (с § 5.2 по § 5.4) и приводим обзор применения метода неопределенных множителей Лагранжа для решения задачи мини¬ мизации с ограничениями. Далее излагаем вариационный подход к задачам управления (с § 5.5 по § 5.10), шаг за шагом показывая способ, который можно использовать, чтобы найти некоторые необходимые и достаточные условия оптимальности. С § 5.11 по § 5.17 приведены некоторые необхо¬ димые условия оптимальности, основанные на принципе минимума Пон¬ трягина. Мы тщательно формулируем различные задачи управления и варианты принципа минимума, соответствующие каждой из этих задач. Эвристическое доказательство принципа минимума, опирающееся в основ¬ ном на геометрические представления, приводится в § 5.16. Некоторые следствия принципа минимума приведены в § 5.17. Глава завершается рассмотрением условий Гамильтона—Якоби и связанными с ними доста¬ точными условиями. Здесь также показывается, что принцип минимума является основным методом отыскания оптимального управления систем, рассматриваемых в гл. 7—10. Структура и свойства оптимальных систем (гл. 6). В этой главе исследуются структура и основные свойства систем, оптимальных по отношению к различным специальным критериям ка¬ чества; указываются методы, позволяющие определить, являются ли опти¬ мальные и экстремальные управления единственными, а также рассмат¬ ривается вопрос единственности управлений. Далее авторы концентрируют свое внимание на вопросах, позволяющих перейти от теоретического мате¬ риала предыдущих глав к конкретным задачам проектирования, которые и являются содержанием последующих глав книги. Вначале рассматри¬ вается задача управления, оптимального по быстродействию для линейных и нелинейных систем (с § 6.2 по § 6.10). После обсуждения задачи управ¬ ления, оптимальной по быстродействию, с геометрической точки зрения 1 В этой книге «принцип максимума» назван «принципом м и н и - м у м а». Отличие формулировки состоит в перемене знака и совершенно не сказывается на результатах расчетов. (Прим. ред.). 21
для получения соответствующих необходимых условий используется принцип минимума. Затем приводятся определения единственности и нор¬ мальности, а также принципа релейного управления для нормальных систем с оптимальным быстродействием. Мы рассмотрим ряд теорем, отно¬ сящихся к существованию, единственности и числу переключений для линейной инвариантной по времени системы (§ 6.5). Материал этой части настоящей главы используется в гл. 7. Далее с § 6.11 по § 6.16 излагается задача оптимального управления на минимум расхода топлива. Для полу¬ чения необходимых условий снова используется принцип минимума, а затем следуют доказательства единственности и нормальности задач, оптимальных по расходу топлива. Устанавливается принцип релейного управления для нормальных задач на оптимум расхода топлива и разви¬ ваются теоремы единственности для линейных систем с постоянными пара¬ метрами. Мы рассмотрим также различные формулировки задач, учиты¬ вающие оптимальность как по времени, так и по расходу топлива (§ 6.15). Этот материал используется в гл. 8. С § 6.17 по § 6.20 приведены задачи на минимум энергии. Дано аналитическое решение задачи с фиксирован¬ ными временем и конечным состоянием для линейной системы с постоян¬ ными параметрами и иллюстрируются общие результаты на довольно простом примере. Эти результаты мы применяем и развиваем в гл. 9. Глава завершается краткими замечаниями о проблемах единственности (§ 6.21 и 6.22) и некоторыми соображениями относительно существования и единственности оптимальных и экстремальных управлений. Проектирование систем, оптимальных по быст¬ родействию (гл. 7). Теория, развитая в гл. 5 и 6, применяется в этой главе к решению задачи оптимального быстродействия для ряда конкретных систем. Рассматривается определение оптимального по быстро¬ действию управления как функции от состояния системы; исследуются структуры систем с обратной связью, оптимальных по быстродействию; указываются типы нелинейностей в цепи обратной связи. Здесь же изу¬ чается синтез субоптимальных систем. Мы начинаем с § 7.2 по § 7.6 рас¬ сматривать объекты, передаточные функции которых имеют только веще¬ ственные полюсы. Сложность оптимальных по быстродействию систем с обратной связью иллюстрируется путем сравнения оптимальной по быстродействию системы для объектов второго порядка (§7.2 и 7.3) с аналогичной системой для объекта третьего порядка (§ 7.4). Далее исследуется задача оптимального быстродействия для объектов типа коле¬ бательного звена без затухания (с § 7.7 по § 7.9). Мы показываем (§ 7.10 и 7.11), как результаты, полученные для линейных систем, можно исполь¬ зовать при решении задачи оптимального управления для одного класса нелинейных систем, применяя при этом экспериментальные характери¬ стики и графические построения. В заключение главы рассматриваются объекты, передаточные функции которых содержат как нули, так и полюсы (с § 7.12 по § 7.15). Мы отмечаем влияние на характер и структуру опти¬ мальной по быстродействию системы управления минимально-фазовых и не минимально-фазовых передаточных функций объектов. Проектирование систем оптимальных по рас¬ ходу топлива (гл. 8). Теоретические положения гл. 5 и 6 мы исполь¬ зуем для расчета ряда систем, оптимальных по расходу топлива. Показы¬ ваем при этом, что для консервативных систем управление по минимуму расхода топлива часто оказывается не единственным. В главе рассматри¬ ваются способы, с помощью которых в задачах на минимум расхода топ¬ лива может быть учтено также и время перехода. Приводятся также практические реализации такого рода оптимальных систем. Особо отме¬ чаем, что нелинейные системы часто допускают единственные решения 22
задачи управления, оптимального по расходу топлива (в противополож¬ ность задаче об оптимальном быстродействии). Глава начинается с рас¬ смотрения не единственности оптимальных по топливу управлений (с § 8.2 по § 8.5). С § 8.6 по § 8.10 исследуются различные методы, позволяющие включить время перехода в функционал преобразования. Возможность единственности решения также обсуждается в § 8.10. Глава завершается замечаниями относительно графических методов, которые часто исполь¬ зуются для отыскания оптимального управления как функции исходного состояния в задачах на оптимальное по расходу топлива управление. Проектирование оптимальных линейных си¬ стем по квадратичному критерию (гл. 9). В этой главе излагаются общие результаты для важного класса задач оптимизации, а именно — задач управления линейными объектами с переменными пара¬ метрами и квадратичным критерием оптимальности. На основании неко¬ торых результатов Калмана по задаче инверсии материал этой главы можно рассматривать, по сути дела, как обобщение обычной теории управ¬ ления. При этом сначала исследуется задача о регуляторе состояния (с § 9.2 по § 9.6), а затем задача о регуляторе выхода (§ 9.7 и 9.8) и, нако¬ нец, глава завершается изучением задачи преследования (с §9.9 по §9.13). Поскольку в § 9.5, 9.8 и 9.9 изучаются линейные системы с постоян¬ ными параметрами, нетрудно обнаружить некоторую взаимосвязь между свойствами оптимальных систем и хорошо скорректированных следящих систем, для проектирования которых использована обычная теория авто¬ матического регулирования. Теоретические результаты настоящей главы легко могут быть использованы при управлении процессами (или объек¬ тами со многими входами и выходами или с переменными параметрами), для анализа которых невозможно непосредственно применять теорию автоматического регулирования. Задача оптимального управления для случая, когда управление ограничено гиперсферой (гл. 10). В этой главе изучается широкий класс задач управления, которые легче могут быть решены прямыми методами, нежели способами, основанными на принципе минимума. Основные положения рассматриваются с § 10.2 по § 10.6. С помощью типовых примеров мы иллюстрируем влияние огра¬ ничений на структуру и свойства систем, оптимальных по отношению к различным критериям оптимальности. 1.8. ТРЕБОВАНИЯ К МИНИМУМУ ЗНАНИЙ, НЕОБХОДИМЫХ ДЛЯ ЧТЕНИЯ КНИГИ, И ПРЕДЛОЖЕНИЯ ОТНОСИТЕЛЬНО ЕЕ ИЗУЧЕНИЯ Мы полагаем, что аспирант или инженер, специализирующийся в области автоматического управления и желающий использовать настоя¬ щую книгу в качестве учебника, хорошо владеет следующими дисцип¬ линами: 1. Основами теории автоматического регулирования, включая такие положения как переходной процесс системы, передаточные функции системы, обратная связь и коррекция линейных систем. 2. Обыкновенными дифференциальными уравнениями и математиче¬ ским анализом, включая применение метода преобразования Лапласа для решения линейных дифференциальных уравнений с постоянными коэффи¬ циентами, а также основными сведениями о матрицах вместе с некоторыми практическими навыками выполнения различных преобразований с мат¬ рицами. Мы считаем такую основу достаточной для понимания большей части книги. Для удобства читателя в книгу включены необходимые специаль¬ 23
ные разделы математики: линейная алгебра, векторные дифференциальные уравнения и некоторые другие. Основное содержание книги было изложено в специальном курсе, рассчитанном на один семестр обучения в Массачузетском технологиче¬ ском институте. Параграфы, отмеченные звездочкой в оглавлении, изла¬ гались в аудитории, остальные разделы изучались самостоятельно. Нельзя слепо следовать учебнику при чтении лекций. Поэтому различные препо¬ даватели расширят или сократят некоторые разделы в зависимости от собственных научных интересов или от уровня подготовки слушателей. В этой связи необходимо отметить, что гл. 8—10 не связаны непосредст¬ венно друг с другом и поэтому могут изучаться в любой последователь¬ ности. Для слушателей с более основательной подготовкой (например, после изучения курса, основанного на материалах книги Заде и Дэзоера «Теория линейных систем») гл. 2—4 можно в лекционном курсе опустить, рекомендовав слушателям прочесть их самостоятельно, а материал гл. 5 и 6 излагать более детально.
ГЛАВА 2 ЛИНЕЙНАЯ АЛГЕБРА 2.1. ВВЕДЕНИЕ Настоящая глава, а также гл. 3 посвящена математическим основам теории оптимальных систем управления. В этих главах приводятся основ¬ ные определения и теоремы, необходимые для понимания содержания остальных глав. Математические основы излагаются весьма конспективно, так как предполагается, что читатель знаком с большинством необходи¬ мых математических понятий. Следует также отметить, что приводится только тот материал, который необходим для понимания последующих разделов книги. В данной главе будут рассмотрены множества, функции, векторные пространства, линейная алгебра и эвклидовы пространства. Основной целью изложения является перевод известных физических понятий линей¬ ных систем на язык математики. Поэтому математический аппарат рас¬ сматривается с точки зрения векторного пространства и линейных преоб¬ разований, а не как некоторый набор операций над числами и матрицами. При дальнейшем изложении мы считали, что читатель хорошо знаком с детерминантами и их использованием при решении систем алгебраи¬ ческих линейных уравнений. Подробные изложения теории детерминантов содержатся в литературе ([24] см. гл. 10; или [21], см. дополнение А). Весь материал настоящей главы, целиком или по частям, можно найти в литературе, например, [21], [24], [51], [90], [124], [192], [196] и [212]. 2.2. МНОЖЕСТВА Рассмотрим объекты, которые имеют различные свойства и могут быть сопоставлены друг с другом. Набор объектов, имеющих некоторые общие характеристики и различающихся по своим свойствам, называется мно¬ жеством. Знак 6 используется для обозначения принадлежности к дан¬ ному множеству. Иначе говоря, если А есть множество, то а G А означает, что а является элементом множества А. Два множества одинаковы тогда и только тогда, когда они имеют одинаковые элементы. Если А и В — множества, то говорят, что А содержится в В или является подмножеством В, когда каждый из элементов А является эле¬ ментом В. Такое соотношение обозначается как А^В. (2.1) Пусть А есть множество и ^5 — свойство, которым могут обладать элементы множества Л, тогда \а : ^(а)| представляет собой совокупность элементов множества Л, действительно обладающих свойством Напри¬ 25
мер, если А есть множество всех девушек из Нью-Йорка, и $ — свойство быть блондинкой, то \а : ^З(в)} представляет собой множество всех нью- йорских блондинок. Пример 2.1. Допустим, что R — множество вещественных чисел и ^3—свойство «I I 1» (т. е. абсолютная величина меньше или равна 1). Тогда {г : | г | 1}представляет собой множество вещественных чисел, по абсолютной величине меньших или равных 1. Пусть 0 означает множество, в котором нет элементов. Тогда послед¬ нее называется пустым, или нулевым, множеством. Заметим, что Ф можно определить как \а : $(а)}, где ^3—любое свойство, которым не обла¬ дает ни один из элементов. Например, ^3 есть свойство «а=£а». Заметим также, что Ф с: А для любого множества А. Множество Л, элементы которого можно пронумеровать в последо¬ вательности alf а2, . . являющейся конечной или бесконечной, назы¬ вается счетным множеством. Отметим, что если множество имеет конечное число элементов, то оно является счетным. Но не каждое счетное множество имеет конечное число элементов. Например, множество {1, 2, 3| является конечным и, следовательно, счетным, в то время как множество |1, -4-, — , . . ) счетно, но не является конечным. Множество {г : I г I < 3 п I ’ til < 1} примера 2.1 не является счетным. 2.3. ОПЕРАЦИИ НАД МНОЖЕСТВАМИ Рассмотрим ряд операций над множествами, а именно: суммирование, пересечение, дополнение и произведение. Если А и В —два множества, то сумма Л и В, обозначаемая как Л U В, является множеством всех элементов, принадлежащих множеству Л или множеству В. Заметим, что ЛиВ = |х:хЕЛ или хЕВ}. (2.2)1 Пересечением двух множеств Л и В, обозначаемым Л П В, называется множество элементов, одновременно принадлежащих обоим множествам Л и В. Заметим, что ЛрВ = {х:хЕЛ и xEBj. (2.3) Если Л и В — два множества и Л с В, то множество элементов В, которые не являются элементами Л, называют дополнением Л в В и обо¬ значают В — Л (или просто — Л, если смысл В ясен из контекста). Если обозначить X Е А те элементы х, которые не являются элементами Л, то легко видеть, что В — А = {х:х£В и х$Л}. (2.4) Наконец, произведением двух множеств Л и В, которое обозначается Л X В, называют множество всех упорядоченных пар (a, Ь), где а Е Л и b £ В. Укажем, что ЛхВиВхЛв общем случае не одинаковы. Можно записать Л X В - {(а, 6):аЕЛ 6Е В). (2.5) Иногда вместо (а, Ь) мы будем писать Рассмотрим далее неко¬ торые примеры операций. Символ R на протяжении всей книги будет использоваться для обозначения множеств вещественных чисел, и поэтому под R часто будет пониматься вещественная числовая ось или просто все вещественные числа. 1 <Или» не исключает возможности принадлежности х к обоим множествам А и В. 26
Пример 2.2. А= {r:O^r^l}, где г представляет собой элементы R. Пусть В = <j 2^, тогда имеем A J В — {г : 0^ г<^ 2} и A f] В = |г : -^-<J Г=С 1| • Пример 2.3. А = {г : 0 г 1}, где г — элементы R. Пусть В — {г : 0 г 2}, тогда A с В и В — А = {г : 1 < г 2}. Пример 2.4. А = {г : 0 г 1} и В = {s : 1 s 2}, где rus — элементы R. Тогда Д’ А X В = {(г, s) : 0 г 1, l<^s^2); (рис. 2.1, а); В X А — {(s, г) : 1 s 2, 1}. (рис. 2.1, б). 4 о Упражнение 2.1. Пусть R2 = R X R и А — подмножество R\ определенное как А --= {(х, у) : х2 -h У2^ 1}, и пусть В —под- Рис. 2.1 А X В отличается от В X А множество R2, определенное как В — — {(х, у) : (х — I)2 4~ у2 1}. Что представляют собой A f| В, A J В и R2 — Д? Вычертите фигуры, изображающие эти множества на плоскости. Если Лх, . . .,Ап —множества, то можно дать определения: объеди¬ нения, пересечения и произведения этих множеств. В частности, объеди- п нение A lf . . ., Ап, которое обозначается J Aif определяется как /=і и (\)аД и Лп. 1=1 \/=1 у (2.6) п Пересечение Alf . . ., Ап, обозначаемое П Ah определяется как /=і П ( п—\ \ П А = ПАП Ап, (2.7) І=1 \ І=1 ) п и, наконец, произведение Alf . . ., Ап, обозначаемое П AL или А1 X і=Л X А 2 X • • • X АПІ определяется как п П Л. = {(а1ў а2 ап) : aiÇ.Al для і = 1, ..п}. (2.8) <=і п Элементы П At часто называют упорядоченными n-ками чисел, которые иногда записывают в виде столбцов ai (2.9) Заметим, что п U At = [а :а£ Л1г или а£А2, или ..., или a G Л„}; І=1 П А= (а:а£ А и а G А2 и... и а^Ап}. Упражнение 2.2. Докажите уравнения (2.10). (2.10) 27
Эти понятия можно определить и для бесконечных наборов 4 = 1,2... со множеств. Например, объединение J At определяется как z=i со U At — {а : существует 40, для которого а £ AJ (2.11)1 Z=1 и пересечение оо П А( определяется как ■=-і оо п At — [a: a g Л- для всех і]. Z = 1 (2.12) Определение бесконечного произведения мы опускаем, так как в даль¬ нейшем оно нигде не используется. Пример 2.5. Пусть Аі = {г : —Z^ /}, для і = 0, 1, 2, . . где г представляет ОО оо собой элемент из R. Тогда J Л/ = R и П Л = {0}, т. е. подмножество из R, состоя- Z=1 щее лишь из 0. Пример 2.6. Пусть А[ для і= 1, 2, . . . есть подмножество из R2 (= R X R), определенное как Аі — {(х, у) : і х << і + 1}. Тогда Л, представляет собой полосу (рис. 2.2), параллельную оси у и заключен¬ ную между х~ іих = /+ 1, исключая точки прямой х= і + 1. Для этих множеств имеем Û Аі = {(х, уУЛ^х} и оо П Аі=0 (пустое множество). z=i Связь между различными операциями над множествами устанавливается с помощью сле¬ дующей простой теоремы. Теорема 2.1. а) Даны множества Л, В и С. Справедливы соотношения 1. А — А = 0 и А — 0 — А; 2. Л U А = А и А П А = А; 3. А с: С и В czC тогда и только тогда, когда Л (J В^С\ 4. СсЛ иСс£ тогда и только тогда, когда С с Л р В\ 5. Л U (В П С) = (Л U В) П И U Q; 6. Л П (В U С) = (Л П В) U (Л П С); б) Даны Л£ (4 = 1,2...) — подмножества из Л. Справедливы соот¬ ношения 1. а-( U А К п И-А); \z=i у z=i 2. л-fn Û И-А); \Z=1 / 1=1 в) Даны множества Л, В, С и D . Справедливы соотношения 1. Л X В = 0 только в том случае, если А = 0 или В = 0\ 2. (Л X В) U (С X В) - (Л U С) X В; 3. (Л X В) р (С X D) - (Л р С) X (В П D). Доказательство. Большинство выводов теоремы являются очевидными следствиями определений. Для иллюстрации этого докажем пункт 5. 1 Это означает, что существует по меньшей мере одно /0, для которого а А^. Может быть и большее число таких множеств. 28
Пусть а£А — тогда а не принадлежит Alt поскольку если бы а принадлежало Alf то оно принадлежало бы и J Л,. Другими словами, а^А —ЛР Из аналогичных рассуждений следует, что a g Е А — Л4; для всех і и, следовательно, а Е Q (Л — Л,). С другой сто- і— 1 роны, если а Е П (Л — Л4), то а Е А — At для всех і и, следовательно 1—1 / оо \ а не принадлежит ни одному из Л4. Из этого следует, что а £ А — ( U 4 • \/=і / Упражнение 2.3. Доказать часть теоремы 2.1 для соотношения б), пункт 2. 2.4. ФУНКЦИИ Вообще говоря, функция есть некоторое правило, устанавливающее связь элементов одного множества с элементами другого множества. Более строго функцию можно определить следующим образом. Пусть Л и В — множества и G — такое подмножество Л X В, что существует по крайней мере один элемент (а, Ь) множества G для каждого а из А. Заметим, что для некоторых элементов а из А может и не быть соот¬ ветствующих элементов (а, Ь) в G. G в этом случае называют графом. Если [а, Ь) есть элемент графа G, то b называют значением G, соответ¬ ствующим а, и записывают fe-G(a). (2.13) Соотношение (2.13) между Л и В называют функцией В от Л (преобра¬ зованием Л в В); часто это записывают просто как G (а) или G. Множество элементов а из Л, для которых существуют пары (а, Ь) в G, называется областью существования G (а) или G, а множество элементов b в В, для которых существуют пары (а, Ь) в G, называется областью изменения G (а) (или G). Пример 2.7. Пусть А = В ~ R и G — подмножество из R2, определенное как G = = ((a, b) : b = а2} (см. рис. 2.3). Тогда G есть граф; соотношение b = G (а) = а2 есть Рис. 2.3. Типичный граф G Рис. 2.4 Граф G и множества 6(Лі) и G-1 (BJ. Множество G"1 (Ві) состоит из двух частей функция; область существования G (а) — вся область R, а область изменения G (а) пред¬ ставляет собой множество всех вещественных неотрицательных чисел. Если G — граф и Л1сзЛ, то подмножество 0(Л^ множества В, определенное как О(ЛЛ = {6:(ах6) принадлежит G для некоторых а} из Лг), (2.14) называется отображением А1 через G. Если В, то подмножество G-1 (BJ в Л, определенное как G"1(B1) = [а : (а, bj) принадлежит G для некоторых Ьг из Вх}, (2.15)
называется обратным отображением Вг через G. Заметим, что G (Л) есть область изменения G и что G"1 (В) есть область существования G. Пример 2.8. Пусть G есть граф примера 2.7 и пусть А1= {а : 0 а 1} и — = {Ь Тогда = {b : 0^ 1} и G'1 (Bi) = {a : — 2 a — 1 или l^a^2} (см. рис. 2.4). Упражнение 2.4. Показать, что G~1(B1 (J B2) — G"1 (B)) (J G~l(B2) и что Если для всех b в области изменения G, b = G (а) и b = G (a J озна¬ чает, что а = alt то мы говорим, что функция G однозначна. Другими словами, если b £ G (Л) предполагает, что в А существует единственное а такое, что G (а) = Ь, то G (а) однозначна. С другой стороны, если областью изменения G является все множество В, т. е. если G (Л) = В, тогда мы говорим, что функция G (а) — взаимно однозначная. Функ¬ цию G (а), являющуюся однозначной и взаимооднозначной, иногда назы¬ вают соответствием (или однозначным соответствием), a b = G (а) и соот¬ ветствующее а называют соответствующими элементами. Пример 2.9. Пусть G — подмножество из /?2, определенное как G — {(а, Ь) : b = а}. Функция G (а) является однозначной и взаимооднозначной. Функция примера 2.8 не яв¬ ляется ни однозначной, ни взаимооднозначной. Предположим, что Л, В и С — множества, G—граф, заключенный в Л X В, и Н— граф, заключенный в В X С. Пусть HoG—подмно¬ жество Л X С, определенное как HoG = {(g, с): существует b В такое, что (a, fe)ÇG и (6, с) g И}. (2.16) Тогда HoG— граф в Л X С, который называется композицией Н и G, Функция (HoG) (а), которую часто записывают как H [G (а)], называется сложной функцией (иногда — функцией от функции). Отметим, что об¬ ластью существования ее является G"1 {[Я-1 (с) ]}, а областью измене¬ ния — H {[G (а) ]}. Пример 2.10. Пусть G — граф примера 2.7 и Н — подмножество из 7?2, определенное как Н — {(6, с) : с — sin b}. Тогда HoG = {(а, с) : с = sin а2} и H [G (а)] = sin а2. Предположим, что G есть граф из АхВ и ArczA. Тогда G± = = {(«!, b) : ах ç Лх и (ах, Ь) £ G} также является графом. Функцию Gx (ах) называют ограничением G по Лг Заметим, что Gx (aj = G (aj для A1. Легко видеть, что Gx преобразует подмножество Лх из А в некоторое подмножество из В. Функцию G± часто называют сегментом G, соотнесенным с Alt и записывают Сд1 вместо Gx. Отметим также, что G иногда называют продолжением Gx. Пример 2.11. Пусть G — граф примера 2.8 и 4Х = {а : 0}. Тогда Gr ~ = {(ар Ь) : ах 0 и b — а\ }есть граф, Gx (04) — ограничение G по Аѵ Однозначно ли Gx? 2.5. ВЕКТОРНЫЕ ПРОСТРАНСТВА Векторное пространство есть множество элементов, которые можно складывать друг с другом и умножать на (вещественные) числа. Уточним это положение. Пусть V — некоторое множество и G+ граф, областью су¬ ществования которого является все пространство V X V, а область изме¬ нения заключена в V. Другими словами, функция G+ преобразует V X V в V. Если (vx, ѵ2) £ V X V, то пишут üx + ѵ2 для элементов G+ (üp ü2), т. e. Ui + v2 = G+(üx, ü2). (2.17) Элемент vx + v2 называют суммой vx и v2. Предположим, что G. есть граф, область существования которого все R X V, а область изменения содер- 30
жится в V, Другими словами, функция G. преобразует 7? X V в V. Если (г, ѵ) 6 R X V, то элементы G. (г, ѵ) множества V записывают как г V, т. е. r-v = G.(r, ѵ), (2.18) где г • V называют произведением ѵ на г, а V — векторным пространством (вещественным), если для суммы и произведения справедливы следующие соотношения: Сумма 1) + ѵ2 = ѵ2 + для всех ѵ1 и ѵ2 из V; 2) + (ѵ2 + ^з) = (ѵі + v2> + ѵз Для всех v2 и v3 из V; 3) в V существует единственный элемент 0, такой, что ѵ + 0 = 0 + ѵ для всех V из V; 4) для любого V из V существует единственный элемент —ѵ из V, такой, что V + (—ѵ) = (—ѵ) + ѵ = 0. Произведение 5) Гі-(г2у) = (ri'r2)'v Для всех гг и г2 из R и всех ѵ из V; 6) 1 • V = V для всех V из V; 7) г (üi + ѵ2) — rv± + гѵ2 для всех г из R и любых ѵ1 и ѵ2 из V; 8) (r1 + r2)-v = r1-v + r2-v для всех г± и г2 из R и всех ѵ из V. Если V — векторное пространство, то элементы V будем назы¬ вать «векторами» и в дальнейшем для их обозначения будем использо¬ вать «жирные» строчные буквы латинского алфавита. Произведение на вещественное число будем записывать в виде г-ѵ. Рассмотрим важный пример, иллюстрирующий понятие векторного пространства. Этот пример будет играть основную роль в дальнейшем изложении, и поэтому читателю его следует тщательно изучить. Пусть V есть множество всех п реальных чисел, написанных столбцами: (2.19) Под г, иногда понимают 7-й элемент столбца. Если являются двумя элементами V, то Г2 + s ѵ + w = (2.20) + sn. 31
а если г Е 7?, то г-ѵ = (2.21) Векторное пространство V в этом случае обозначают Rn, а элементы V называют /г-мерными векторами-столбцами. Упражнение 2.5. Проверьте условия с 1 по 8 для Rn. Покажите также, что если v Е Rn.w—‘Р ’ (—1).®и0.ф= 0. Справедливо ли это для любых векторных пространств? Пример 2.12. Пусть V есть множество всех п вещественных чисел, написанных строч¬ ками (гх, г2, . . ., гп). Если ѵ — (гг, г2, ...» гп) и w = (sp $2, . . ., sn) — элементы из V, то V 4- W = (гх + sx, r2 + s2, . . ., rn+ sn), и если г g /?, то r-ü = (rrx, rr2, . . rrn). Векторное пространство V в этом случае будем обозначать Rn, а его элементы V назы¬ вать /г-мерными векторами-строками. Упражнение 2.6. Покажите, что Rn является векторным пространством. Предположим, что V — векторное пространство и W — подмножество из V. Будем считать, что W есть подпространство V, если 1) wlt w2 Е IF, то Wi + w2 Е IF; 2) г Е 7?, w Е IF, то rw Е IF. Другими словами, 1F — подпространство F, если IF само является векторным пространством по отношению к операциям сложения и умно¬ жения. Заметим, что если IFX и 1F2 — подпространства F, то IFi П IF2 также является подпространством V. Если W± и IF2 — подмножества V, то IFi + IF2 cz V определим как IFj. + IF2 = {ti: существуют Wj в IF! и w2 в IF2 такие, что V = wr + w2) (2.22) и будем называть суммой VFT и IF2. В частности, если IFj и IF2 — под¬ множества F, то IFi + IF2 — также подмножество V. Если IF — подмно¬ жество V и г — вещественное число, то подмножество r-W cz F можно определить как г IF = {ci : существует w в IF такое, что ѵ = rw}. Будем называть его произведением IF на г. В частности, если 1F — подмножество F, то rIF — подмножество V. Пример 2.13. Пусть W — подмножество из Rn, определенное как W есть подпространство Rn. Пример 2.14. Если U7 — подмножество из V, состоящее только из 0, то W — под¬ пространство V. Упражнение 2.7. Покажите, что если и W2 — подпространства V, то Wr П ^2 и Wi + W2 также подпространства V. Покажите, что если W — подпространство V, то rW — также подпространство V. На протяжении всей книги мы будем оперировать исключительно вещественным векторным пространством. Однако понятие векторного про¬ странства можно определить значительно шире, заменив множество вещест¬ венных чисел R множеством любых, например комплексных чисел С, 32
имеющим те же основные алгебраические свойства. Множество С комплекс¬ ных элементов, для которого определены и справедливы понятия суммы и произведения, аналогичные 1)—8), стр. 31 называется комплексным век¬ торным пространством. Обсуждение общего понятия векторного простран¬ ства можно найти в работе [24]. В этой книге мы найдем много примеров того, насколько понятия векторного пространства полезны при решении задач управления. Существует много других областей, например теория цепей, теория связи, теория электромагнитного поля, в которых понятие векторного пространства играет исключительно важную роль и позволяет решать различные задачи, с которыми читатель может быть уже знаком. Математическое представление известного физического понятия линейности является основой для определения векторного пространства. 2.6. ЛИНЕЙНЫЕ КОМБИНАЦИИ И БАЗИС Предположим, что V — векторное пространство, а ѵ2, • • vn — элементы V. Считаем, что вектор V из V есть линейная комбинация (или линейно зависит от ^), если существуют вещественные числа rlf г2, • • -, rrt, такие, что ѵ - 1 2 г.дг,-)-••• l rnvn. (2.23)1 Вместо (2.23) иногда записывают È г,.®,. = 4- г2ѵ2 4- • • • +■ rnvn. (2.24) i- 1 Элементы • • -, из линейно зависимы (или vit і = 1, 2, . . ., /г линейно зависимы), если 0 есть линейная комбинация в которой не все rt = 0. Другими словами, еоі : і = 1,2, . . ., п линейно зависимы, если о =- S = rjüj 4- W 4- • • • 4- rnvn (2.25) и существуют rt 0. С другой стороны, если 0 = S rpî (2.26) справедливо только при условии rt = 0, для всех і = 1, 2, . . ., п, то векторы ѵ2, . . ., ѵп} называют линейно независимыми. Заметим, что векторы еъ е2, . . ., еп из определенные как (т. е. і-я составляющая равна 1, а все остальные 0), линейно независимы. Упражнение 2.8. Покажите, что если ѵ =/= 0, то векторы {я} линейно независимы. Указание. Воспользуйтесь условием 6. 1 Сумма п элементов ѵ2, . . ., ѵп в пространстве V может быть определена путем индукции (т. е. + • • • + ѵп) = (г>і H- v2 + F tfrt+i) + vn, что легко сделать, воспользовавшись условиями 1 и 2 на стр. 31. 2 Атанс и др. 33
Множество всех линейных комбинаций векторов ф1у г>2, • . Фп из V есть подпространство V, которое мы будем называть отображением мно¬ жества {гіх, ^2, • • -, ^п}- Легко показать, что отображение [е19 е2, . . еп} есть все пространство Rn. Упражнение 2.9. Покажите, что отображение {®х, ѵ2> • • -, Ѵп} есть подпростран¬ ство V. Набор векторов {сіх, ф2, . . Фп} множества ’ называется (конечным) базисом V, если: 1) векторы фі9 і = 1, 2, . . ., п линейно н. звисимы; 2) каждый элемент V есть линейная комбинация фі (т. е. V есть ото¬ бражение векторов ф2, . . ѵп). Напомним, что elf е2, . . еп [см. (2.27)1 является базисом Rn, кото¬ рый мы будем называть единичным или нормальным базисом Rn. Если {^і, ѵ2, . . ., Фп} есть базис V, то ф G V означает, что ф = S (2.28) і=1 где az — единственные элементы R; az называют координатами ф по отно¬ шению к базису {ях, ф2, . . ., Фп\. Легко видеть, что если ф = G Rn> то числа гх, г2, . . ., гГІ являются координатами вектора ф по отношению к базису (elf е2, . . еп}. Если Ф2, . . ., Фп$ есть некоторый (фиксированный) базис V, а и Ф = S — некоторый элемент V, то можно считать, что координаты г=1 ах, а2, . . ап вектора ф определяют некоторый вектор а в Rn, компо¬ ненты которого по отношению к нормальному базису {е19 е2, . . ., еп} в Rn равны ах, а2, . . ., ап, т. е. _аи_ Если {гіх, ф2і . . ., Фп\ является базисом V, то п называется размер¬ ностью V. Можно показать, что если V имеет базис, то любые два базиса V имеют одинаковое число элементов. Более того, можно показать, что любая линейно независимая система векторов {wx, w2, . . ., wm\ из V может быть дополнена до базиса V (существуют такие элементы х19 . . ., хп_т вѴ, что система векторов {wb . . ., . . ., хп_т} образует базис 7). Следовательно, размерность любого соответствующего 1 подпространства W (W =£ V) n-мерного пространства V меньше, чем п. 1 Слово «соответствующее» означает, что W CZ V, но W =)= V. 34
Пример 2.15. Если UZj и W2 — подпространства n-мерного пространства V, то dim [rjH-dim [Г2] = dim [Г, 4- UZ2] + dim \WA П W]2, где dim [ ] обозначает размерность. Например, в Rn, если IFj есть отображение {^} и W2 — отображение {ег + е2), то dim [IFJ + dim [IF2] = 2 = dim [U/2] + + dim [ П №2], поскольку \V1 + U?2 есть отображение {eD e2} и U7X f| ^2 = {0}. ЛИНЕЙНАЯ АЛГЕБРА 2.7. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ И МАТРИЦЫ Сформулировав определение векторного пространства, математик ста¬ рается отыскать естественный класс преобразований, который «сохраняет» это понятие. Например, если V и W — векторные пространства и если 21 есть преобразование (функция) V в W, то можно поставить вопрос: какими свойствами должно обладать 21, чтобы сохранить структуру V и W? Во-первых, 21 должно сохранять понятие суммы. Иначе говоря, для всех элементов еи1 и ^2 из V должно выполняться: 1 ) 21 + ѵ2) = 21 (îù) + 21 (^2). (2.29) Во-вторых, 21 должно сохранять понятие произведения. Если /? и V £ V, то 2) 21(ггі) = гВД. (2.30) Преобразование 21 множества V в W, область существования кото¬ рого есть все V и которое удовлетворяет приведенным выше условиям, называется линейным преобразованием. Для обозначения линейных пре¬ образований мы в дальнейшем, если не сделана специальная оговорка, будем всегда использовать готические прописные буквы. Предположим, что V есть n-мерное пространство с базисом гг2, . . ., vn\; W — m-мерное пространство с базисом [Wi, w2, . . wm} и 21 — линейное преобразование V в W. Так как каждый элемент W есть линейная комбинация wz и 21 (я,) есть элемент W, то можно написать 21 (ü/)=S для /==1,2,..., п. (2.31) п Далее, если ѵ = S — элемент V, то согласно условиям 1) и 2) /=і имеем 2l(^)=S S (2.32) /=і Набор чисел \аи< і = 1,2, . . ., т; j = 1, 2, . . ., п\ можно записать в виде таблицы, обозначенной А и содержащей m строк и п столбцов: c/ц а12 . . . а1п А а21 а22 . . . а2п . _J^ml • • • ^тп _ Такая таблица называется m X п матрицей. Числа называются элементами (коэффициентами, или составляющими) матрицы А. Иногда для сокращения вместо матрицы вида (2.33) пишут 4 = (ап). Укажем, что і обозначает строку и j — столбец матрицы Л, в кото¬ рых находится элемент аі}-. В дальнейшем для обозначения матриц будут * 35
использоваться жирные заглавные латинские буквы. Мы видим, что матрица А связана с линейным преобразованием 21 и базисами ѵ2, . . ѵп] и w2, . . Если fall ^12 • * ’ ^ІП b2l b22 . . . b2n B = (2.34) _um\ um2 • • • unm есть m X n матрица, то линейное преобразование 23 пространства V в W можно определить как п т 33(®) = s S «A/W,. (2.35) /=11=1 п ДДЯ V = S в /=1 гі2, . . ., ѵп\ и jwb V. В есть матрица 23 по отношению к базисам W2, . . -, Wm\ пространств V и W соответственно. Упражнение 2.10. Покажите, что 33, определенное как (2.35), действительно является линейным преобразованием V в IV7. Пример 2.16. Пусть V /?2, и 21—линейное преобразование V в IF, определенное как ЭД (ej ег + 2е2 + Зе3, ЭД (е2) ~= е3 [см. (2.27)]. Тогда матрицу А преобразования 21 можно записать в виде: А - 1 0" 2 0 3 1 Если задана матрица то 33 (ех) = ег + е3 и ЗВ (е2) — + 2е2. Отметим, что если ЭД — линейное преобразование V в W, такое, что ЭД (я) = 0 для любого ѵ из V, то его матрица А будет состоять только из нулей; и наоборот, если В состоит из элементов, равных 0, то линейное преобразование 93 (2.35) обладает тем свойством, что 93 (v) = 0 для всех ѵ из V. 2.8. ОПЕРАЦИИ НАД ЛИНЕЙНЫМИ ПРЕОБРАЗОВАНИЯМИ И МАТРИЦАМИ Предположим, что ЭД и 93 — линейные преобразования V в W и что А и В — матрицы ЭД и 93 по отношению к базисам {ггх, . . ., ѵп} и jwb w2, • • -, Wm\ соответственно. Найдем матрицы преобразований ЭД + 23 и гЭД, г £ /?, определенные как (ЭД 4-93)(г>) = ЭД(ü) 4-93(я) для всех (2.36) (гЭД)(гі) = г [ЭД(гг)] для всех ѵ^Ѵ. (2.37) Легко видеть, что ЭД 4~ 93 и г ЭД также будут линейными преобразо¬ ваниями V в W; мы будем называть ЭД 4~ 93 суммой ЭД и 93, гЭД — про¬ изведением ЭД на г. 36
Если А =- (aZ;) и В = (&,,), то т (21 + ®)(^) = 21 (ѵ,) + ф(^) = V а w, Z--1 т т + Z bijWi = 2 (az/ + &z/)wz (2.38) г---1 t—1 И т т (г21) (»,) = г 121 (г>;)] = г 2 «,/W,. = 2 (raz/)wz. (2.39) г=1 г —1 Другими словами, матрица преобразования ЭД + ® есть (аи + Ьп) и матрица преобразования гЭД есть (гаі}). Обозначим эти матрицы соот¬ ветственно через А + В и г А. В развернутой форме 62 и + Ьп а12 4- Ь12 ... alrt 4- bln ! 0 __ ^21 ^21 ^22 4~ ^22 • • • ^2П 4“ &2п 4Q) _ 4/îi 4" Ьті 4п2 4“ Ьт2 . . . Clnin 4- fynn _ И ~ гаи га12 . . . га1п ~ rA- га^ га^---га^ . (2.41) _ га,п1 га,п., . . . гатп _ А 4- В называется суммой матриц А и В, а гА — произведением матрицы А на число г. Можно показать, что множество всех линейных преобразований V в W и множество всех т X п матриц являются век¬ торными пространствами по отношению к понятиям суммы и произве¬ дения. Множество всех линейных преобразований V в W будем обозна¬ чать Ÿ (I/, W) и множество всех т X п матриц — 3R (т, п). Упражнение 2.11. Докажите, что £ (V, R) — векторное пространство, и покажите справедливость аксиом 1—8 по отношению к £ (V, R). Пространство С (V, R) обозна¬ чают |/* и называют пространством, сопряженным к V. Упражнение 2.12. Пусть 'V = Rn и пусть ЭД£/?* [см. упражнение 2.11]. Пока- п жите, что если vÇ^R/ly то ЭД, (я) — а/ ЭД, (е/), гДе а/ — координаты ѵ по отношению /=і к е/ (см. § 2. 6). Покажите, что преобразования ЭД/ пространства Rn в R, определяе- (п \ где ѵ 2 ajei Для 1• “ 1’ 2, . . /2, принадлежат к Rn и что /=і ' / / п \ ЭД/ (ej) -- Ô//, где 0/ О, если і ф j и Ô// 1 Указание: eL ô//^/ . Покажите что {ЭДр ЭД2, . . ., ЭДЛ} является базисом R*n. Базис {21р ЭД2, . . ЭДЛ| называют дуальным по отношению к {еІУ е2, . . ., еп}. Чему равна матрица ЭД/ по отношению к базисах! (еІ5 е2, . . ., еп] в Rn и 1 для /?? Можно ли найти однозначное линейное преобразование Rn в Rn (пространство л-мерных векторов-строк)? (Указание: При¬ мите, что fi — n-мерный вектор-строка, имеющий 1 на і-м месте и 0 на всех осталь¬ ных). Если такое преобразование существует, какая матрица с ним связана относительно базисов {ЭДЬ ЭД2, . . ., ЭДЛ) и {/ь /2, . . ., Л}? Предположим теперь, что V, W и X — векторные простран¬ ства с базисами j^, ѵ2, . . ., <гЦ, w2, . . wm} и {хъ x2l . . хр} соответственно. Если ЭД, — линейное преобразование W в X и 93 — — линейное преобразование V в W, то ЭДо93 будет линейным преобразо- 37
ванием V в X. Для примера проверим условие 1. Путь ѵ и ѵ'— эле¬ менты V, тогда (21о93) (ѵ + sf) = il [® (v Ч- ü')] = 21 [® (v) -}- ® (я')] = = 21 [® (ü)] + 21 [® (O - (2Lo53)(ü) -4 (2lo93)(v'). Попытаемся теперь найти матрицу преобразования 21о®, предпо¬ лагая, что А = (aik) и В = (bkj) — матрицы 21 и ®. Имеем (2lo®)(^) - 21 -21 tn S bkiwk k=\ tn m p p / tn \ ~ Xj (^k) Xj bkj Xi alkXi Xj ( Xj ctikbkj I xt. k=\ k=\ z=l 1=1 \Л=1 / (2.42) Другими словами, элементы матрицы С = (cZ/) преобразования 21о93 имеют вид т Сц = S «/А/ (2.43) k=i для і = 1, 2, . . ., р и / — 1, 2, . . ., fi. Матрицу С называют произведением матриц А и В и записывают С = АВ. (2.44) Отметим, что число столбцов матрицы А должно быть равно числу строк матрицы В. В общем случае АВ В А. Пример 2.17. Пусть А = J Упражнение 2.13 А = 01 2 R = P —И 1 о] и [1 21 В = I I . Найдите АВ и ВА. Если А = (aif) есть матрица т X п,то матрица Л' размера п X т, определенная как Л' - «и «12 «21 • • «22 ‘ • «ml «/и 2 (2.45) _«1П «2П «mn называется транспонированной матрицей Л. Строки Л' являются столб¬ цами Л и столбцы Л' — строками Л. Если транспонированную матрицу Л представить как Л' = (а'ц), І = 1, 2, . . ., п. і = 1, 2, . . ., m, (2.46) то ан = аіГ Пример 2.18. Если А = Г° 1 01 |2 3 4]* Если <02, . . , ѵп] — базис V, {wlr w2 wm] — базис W и 11 — линейное преобразование V в W с матрицей А по отношению к этим п базисам, то для ѵ = Xj имеем /=і п т т / п \ т / п \ зад = g az Sat/Wf = .g (^.ga.ja) j w. = .g ^_ga'.a.) w. (2.47) 38
Иначе говоря, А' может рассматриваться как определение перехода от координат а, вектора ѵ к координатам 51 (ѵ). Отметим также, что (Л')' = Л; (Л + ВУ = Л' + В'; (АВ)' = В'А'. (2.48) Рассмотрим транспонирование матрицы с другой точки зрения. Предположим, что Л = (аи) есть матрица т X п и w — элемент Rm, т. е., что - - si s2 w = (2.49) Тогда w можно рассматривать какт X 1 матрицу и произведение Л'w как aus. А’ѵо = S «2/S/ г=1 (2.50) А’ча есть элемент Rn, и преобразование ЭД/ пространства Rm в Rn можно определить, полагая (2.51) для w из Rm. Легко видеть, что 31' — линейное преобразование Rm в Rn. Так как элементы базы elt е2, ■ . ., ет пространства Rm опреде¬ ляются как 0 0 t-я строка, (2.52) нетрудно заметить, что 81W (2.53) Другими словами, Л' есть матрица 21 по отношению к нормальным базисам Rm и Rn. 39
2.9. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ V В V Сосредоточим теперь внимание на линейном преобразовании вектор¬ ного пространства V в V. Предположим, что ѵ2> • • -, Ѵпі —данный базис V. Если 91 — линейное преобразование V в V, то его матрица Л, отнесенная к заданному базису, будет иметь п строк и п столбцов (т. е. А есть п X п матрица). Важным частным случаем линейного преобразо¬ вания V в V является идентичное преобразование определяемое как 5 (г») = f • Матрица / преобразования J имеет вид / = "1 0 ... (Г О 1 ... О (2.54) (2.55) О 0 ... 1 т. е. Г = (ô,z), (2.56) где ôz/ = 0, если i j и ô/7 = 1. ô/z называется символом Кронекера, а / — единичной матрицей. Заметим, что 91 о S = S’ о 9l = 91 для любых линейных преобразований 91 пространства V в V, и, следовательно, ІА - AI - А (2.57) для любой п X п матрицы А. Упражнение 2.14. Докажите формулу (2.57), используя выражение (2.43). Упражнение 2.15. Покажите двумя способами, что если гі Г2 принадлежит к Rn и I — п X п единичная матрица, то Іѵ = ѵ [см. (2.50)]. Указа¬ ние: используйте формулу (2.43) и определение (2.51). Предположим, что 9( — линейное преобразование V в себя и что существует линейное преобразование 93 пространства V в себя, такое, что 9(о93 = 93 о9(-$- (2.58) В этом случае преобразование 91 называют невырожденным, а пре¬ образование 93, обозначаемое 9(-1, — обратным к 9(. Если А и В — матрицы 91 и 93 соответственно, то уравнение (2.58) означает, что В А = АВ = I. (2.59) С другой стороны, если А есть п X п матрица и существует п X п матрица В, которая удовлетворяет выражению (2.59), то говорят, что А — невырожденная матрица и матрица В, обозначаемая Л-1, называется матрицей обратной к А. Отметим, что Л"1 Л - ЛЛ1 - /. (2.60) Следующая теорема (доказательство которой содержится в упраж¬ нении 2.16) дает более глубокое представление о понятии невырожденного линейного преобразования. Теорема 2.2. Если V — /г-мерное пространство и 91 — линейное пре¬ образование V в себя, то
а) 21 невырожденное тогда и только тогда, когда 21 (ѵ) = 0 справед¬ ливо лишь при V = 0; б) 21 невырожденное тогда и только тогда, когда областью сущест¬ вования 21 является все пространство V. Следствие теорем ы : 9( есть невырожденное преобразование тогда и только тогда, когда базис • • -, преобразуется в базис |21(^і), 21 (^2), • • -, îl (^и)Ь Другими словами, невырожденное преобразование соответствует изменению базиса V. Заметим, что единич¬ ная матрица всегда невырожденная. Можно также показать, что п X п матрица А невырожденная тогда и только тогда, когда детерминант Л, обозначаемый как det Л, не равен нулю, т. е. det А 0. Пример 2.19. Пусть 21—линейное преобразование в себя, определенное как 21 (^і) ” + ^2’ 21 (^2) — Тогда матрицу А преобразования 21 относи¬ тельно базы [еъ е2} запишем в виде где А — невырожденная матрица в том и только в том случае, если ad — be 0. Если 21 — невырожденное преобразование, то 21”1 определяется как: 2Г1 (ех) —7-^-7— 4 □—~г~ 2L”1 (^) =■ —-j е2 v ad — be ad — be “ ad — be 1 ad — be и ~ d — с ad — be ad — be ad — be ad — be Например, если 13 2 1 Упражнение 2.16. Докажите теорему 2.2. Пусть 21 — линейное преобразование V в V такое, что: 1) если гн ¥= ^2, то 21 (*>і) =h 21 (^2) и 2) область существования 21 — все пространство V. Покажите, что 21 невырождено. Указание: если ф g У, то ф = 21 (w) для некоторого w. Примите 21”1 (ѵ) = Единственно ли w? Покажите, что если 93 — невырожденное линейное преобразование V в V, то 93 удовлетворяет условиям 1 и 2. Теперь можно доказать теорему 2.2. (Указание: используйте свойства 1 и 2. Например, пока¬ жите, что утверждение: «21 (ѵ) = 0 справедливо лишь для ф — 0» подтверждает, что если {®і, ф2, . . ., фп} есть базис V, то 21 (®і), 21 (я2), • • 21 (ѵп) линейно независимы. Пусть С —линейное преобразование V в V и {г»!, ѵ2. . . . ѵп] и (и>і, w2, . . —базисы пространства V. Можно написать п <£(■»,) = У / = 1,2 п і—1 и п (2.61) І = 1 Иначе говоря, А = (а;/) есть матрица преобразования (£ по отно¬ шению к базису {»1( ѵ2, ..., ѵп\ и В = (6,;) — матрица Q. по отношению к базису («>!, w2, ..wn\. Установим взаимосвязь между А и В. По¬ скольку Wi принадлежат V и (clt ѵ2, ..ѵп]—базис, то п W; = 2 / = 1, 2, ..., п, (2.62а) і—1 41
и поскольку <vk принадлежат V и {wb w2, •. -, wn} —базис, то п Vk = 2 k = 1, 2, .. „ п. /=1 (2.626) Пусть P = (p.J и Q — (qik). Легко видеть, что PQ—QP = I и, сле¬ довательно, Q = Р"1. Далее, (п \ п п п 2 Рі^і = 2 Ро'С (©,) =22 (Puaki)’0k = І = \ / 1 = 1 і=1 k=\ п п п п / п п » п = 222 (Pijakiqrk) W, = 2 ( 2 2 PriflkiPii} = 2 briwr. (2.63) /=1 л=1 г=Л \/г=1 і=1 / г=1 Следовательно, В = Р1АР = QAQ1. (2.64) Матрицы А и В называют подобными, а линейные преобразования, определяемые (2.62а) и (2.626), называют преобразованиями подобия. В общем случае, если А и В — любые две п х п матрицы, для которых имеется невырожденная матрица Р такая, что справедливо уравнение (2.64), то А и В называют подобными матрицами. Отметим, что подобные матрицы соответствуют одному и тому же линейному преобразованию, но по отношению к различным базисам. 2.10. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ Предположим, что 21 — линейное преобразование V в себя и А есть матрица 21 по отношению к базису {г^, гі2, . . ., в V. Вектор ѵ =/= 0 в V называют собственным вектором 21, если существует К С А такое, что 21 (ü) = fay, (2.65) À называют собственным значением ЭД,. Посмотрим, что это значит. Для начала заметим: поскольку v 0, отображение вектора ѵ (см. § 2.6) есть одномерное подпространство Ѵг пространства V. Легко видеть, что 21 (Ѵ\) cz Ѵі (ѵ есть базис VJ. Затем, если —одномерное подпро¬ странство V с Wi в качестве базиса и ЭД, (WJ cz W19 то 21 (wj 6 означает, что 2L(w1) = Xw1, (2.66) так как Wi — собственный вектор ЭД,. Иначе говоря, собственные значе¬ ния 21 соответствуют одномерным подпространствам пространства V, которые преобразование 21 преобразует в самих себя. Пример 2.20. Предположим, что 21 — линейное преобразование /?2 в себя, для кото¬ рого 21 (<?і) = + е2 и 21 (е2) = + е2, тогда 21 (ег + е2) = 2 + е2), так что еѵ + + е2 — собственный вектор ЭД и 2 — собственное значение ЭД; аналогично ЭД — е2) = = 0—0 (ех — е2), где — е2 — собственный вектор и 0 — собственное значение ЭД. Матрица À преобразования ЭД по отношению к {е1У е2} записывается в виде 1 1 1 1 А = Эта матрица подобна матрице В = ГО [О °1 2j * 42
Действительно, 1 1 /2 /2" 1 1_ /2 /2 Что представляет собой данное преобразование подобия? Собственные значения можно рассматривать несколько иначе. Если ѵ— собственный вектор 21 с собственным значением X, то 21 (с>)—'кѵ = = 0; if = S а/Сі/, поскольку {с^, ѵ2, ..ѵп} — базис V, то можно обнару- /=і жить: п / п \ эд. (г»)—х® = 2 «7ЭД (®/) — М 2 ai‘Oj I = /=1 \;=1 / " n " /п = 22 ajaij,°i — 2 = 0* (2.67) /=11=1 /=1 n Заметим, что гі£- = ô£./p£., где ô£/- — символ Кронокера. Поэтому урав¬ нение (2.67) можно записать в виде п п п п ЭД (®) — М) = S 2 ^ац^і — 2 2 = /=1 f=l /=1 Z=1 n / n \ = 22 — bafta ©,• = o. i=l \/=l / (2.67a) Так как — базис V, имеем («n — X)a, + a12a2 H + alnan = 0; ' °2iai + (g22 — X) a2 + • • • + a2nan = 0; . (2 68) + G„2a2 + • • • + <ann — X)a„ = 0. . Система n линейных уравнений с n неизвестными x19 x2, . . xn вида (an — X)xj + a12x2 H 4- alnxn = 0; G21X1 + (G22 M X2 + + а2ПХП — Qi (2 69) amxi + аП2х2 + • • • + (ann — X)x„ = 0 имеет ненулевое решение = аь х2 = а2, . . хп — ап ^так как ѵ = п \ = J] ajVj 7^ 0 I. Отсюда заключаем, что det(4 —Х/) = 0. (2.70) Если det (Л — X/) раскрыть в виде функции от X, то получится поли¬ ном вида det (Л — Х/) = (—1)"Х" +^-1 Н +сп = 0, (2.71) где clf c2f . . сп зависят от а£/. Иначе говоря, X есть корень полинома р (z) степени п: p(z) =■ det (Л — zi) == (— l)nzn -h ctzn-x + • • • + cn. (2.72) 43
Полином р (z) иногда называют характеристическим полиномом мат¬ рицы А. Если, с другой стороны, р £ 7? есть корень полинома р (z), то система уравнений («п — н)*і + «12*2 + • • • + «іЛ - 0; ' «2іхі -Е («22 н)х2 ± * * * 4" а2пхп “0; (2 уд) «Л 1-^1 4" «П2^2 4" ‘ ‘ Т («пн 0 имеет ненулевое решение х2 |32, . . хп = рп и вектор w = п = ü P/®/ есть собственный вектор с собственным значением р. Харак- J---A теристический полином р (z) [уравнение (2.72)1 матрицы А имеет п ком¬ плексных корней, и мы условимся называть любой корень р (z) собствен¬ ным значением матрицы А. Если матрица В подобна матрице Л, В = РАР1 (Р — невырожденная матрица), то det (В — zi) det (PAP1 — PzIP') - det (A — zl). (2.74) Подобные матрицы А и В имеют один и тот же характеристический полином и, следовательно, одинаковые собственные значения. Заметим, что собственные значения линейного преобразования 91 действительно являются собственными значениями матрицы А и каждое вещественное собственное значение А является собственным значением преобразова¬ ния îl. Корни характеристического полинома матрицы Л, имеющие мни¬ мые части (и часто называемые комплексными собственными значениями Л), не являются собственными значениями линейного преобразования ^1. Другим интересным и полезным свойством характеристического поли¬ нома р (z) матрицы Л является то, что сама матрица Л является «корнем» полинома. Справедлива следующая теорема: Теорема 2.3. (Теорема Кэли—Гамильтона): Если Л есть п X п матрица с характеристическим полиномом р (z) (2.12), то Л есть «корень» р (z) в том смысле, что р(А)-^(-\)пАп + сіАп-1 + ••• +спІ. Доказательство этой теоремы можно найти в работах [21] и [24]. Пример 2.21. Пусть ЭД — линейное преобразование R3 в себя с матрицей А по отно¬ шению к базе {ві> е2, е3}: 1—10“ — 1 1 Кз“ 0 КЗ 1 Характеристический полином матрицы А есть р (z) = —z3 + 3z2 + z — 3; собственные значения А — числа 1, —1 и 3. Далее, 3 + е3 — собственный вектор ЭД с собственным значением 1, ех 4~ 2^3— КЗ е3 — собственный вектор ЭД с собственным значением —1 и —ех + 2е2 — КЗ е3 — собственный вектор ЭД с собственным значением 3. Матрица А подобна матрице 1 0 В = 0“ о 3 Упражнение 2.17. Проверьте основные положения примера 2.21. Покажите, что А удовлетворяет уравнению —А3 + ЗД2 + А — 31 — 0. Предположим, что преобразование 21 обладает свойством: îL(üt.) = і = 1, 2, ..., п. (2.75) 44
зису вид оворят, что ЭД — диагональное преобразование по отношению к ба- ü2, . . ., ѵп]. В этом случае матрица А по отношению к имеет ~Хх О ... О - (2.76) О 0 ... где Хь Х2, . . Х,г — собственные значения А (или ЭД,). Если В есть матрица ЭД, по отношению к другому базису [wb w2, . . wn\ того же пространства V, то, как мы уже знаем из выраже¬ ния (2.64), В подобна А (т. е. существует невырожденная матрица Р такая, что В = РАР1) и, следовательно, Хх, Х2, . . ., Хп являются также собственными значениями В (вернитесь к примеру 2.21, имея это в виду). Теперь рассмотрим линейное преобразование ЭД пространства V в себя, имеющее различные собственные значения Хх, Х2, . . ., Х„. Пред¬ положим, что w2, .. ., wn — соответствующие собственные векторы ЭД, [т. е. ЭД (wt.) = XzwJ. Можно показать, что множество {wx, w2, . • -, wn] действительно является базисом V. Следовательно, матрица В преобразо¬ вания ЭД по отношению к базису диагональна, т. е. Л о ... о " о х2 ... о __о о ... хп_ (2.77) Если окажется, что ЭД — линейное преобразование Rn в себя с п различными собственными значениями Хь Х2, . . knt то через А мы будем обычно обозначать п X п матрицу вида (2.78) О 0 ... к и будем называть Л матрицей собственных значений. Наконец, когда А есть п X п матрица, а через Ak (X) мы обозначим k X k матрицу вида “X 1 0 ... ОХ 1 ... А(Х)--= (2.79) ООО... ООО... то можно показать, что если все собственные значения А — вещественные числа, то А подобна матрице вида (2.80) где тг + т2 4 • • -4^4 ‘ п и Хь Х2, . . ., Хр — собственные значения (необязательно различные) матрицы A. J (Л) называется жордановой канонической формой матрицы А. 45
Пример 2.22. Рассмотрим 3X3 матрицу А: г 1 I 0~і можно показать, что или Пример 2.23. Если А есть 2X2 матрица — zi) — 0, то А подобна матрицам вида и X — двойной корень уравнения def (А — 'X 01 n і ИЛИ и ЛІ 'X 1*1 0 х] ЭВКЛИДОВЫ ПРОСТРАНСТВА 2.11. ВНУТРЕННИЕ ПРОИЗВЕДЕНИЯ Предположим, что V — векторное пространство и Р — функция, область существования которой — все пространство V X V и область изменения заключена в R. Говорят, что Р есть внутреннее произведение на V, если удовлетворяются следующие условия: 1) Р(^і + ^2, *>з) = Р(Ѵі, ^з) + Для всех vlf ѵ2 и ѵ3 из У; 2) Р(гѵъ <и2) = гР(ѵ1У ü2) для всех г из R и ѵ2 из V; 3) я2) = Р (ѵ2» ^і) Для всех и ѵ2 из V. Р иногда называют симметричной билинейной формой на V х. Функцию Р (гі, V) часто называют квадратичной формой на У, произ¬ веденной Р. Упражнение 2.18. Покажите, что если Р — внутреннее произведение на V, то: а) Р (Яр ѵ2 + ѵ3) = P (®і, tf2) + ? (^і’ ®з) Для всех и из V и б) Р ^2) = = гР z>2) для всех г g R и pp ф2 Ç V. Указание: следует многократно исполь¬ зовать условие 3. Предположим, что Р есть внутреннее произведение на V и что {^, ^2, • • •> ѵп} — некоторый базис в V. Положим, что Р(^., = aijt i = 1, 2, ..., n; / = 1, 2, ..., n, (2.81) 1 Это более общая терминология, так как термин внутреннее произведение обычно сохраняют для того, что мы в дальнейшем будем называть положительно определенным внутренним произведением [см. уравнение (2.84) ]. 46
и пусть А = (ап) есть п X п матрица. А называют матрицей Р по отно¬ шению к базису (üj, ѵ2і ..ѵп}. Прежде всего отметим, что условие 3 означает, что аа = Р (ѵ{, Vj) =* Р (ям) = ait. (2.82) Матрица А обладает свойством aij = ajt для i = 1, 2, . . п и / = — 1, 2, . . ., п, т. е. А и транспонированная матрица Л' одинаковы: А=А'. (2.82а) В общем случае, если п X п матрица В остается той же самой при транспонировании (т. е. В = В'), то В называют симметричной матрицей. Например, единичная матрица I есть матрица симметричная. Мы пока¬ зали, что если Р — внутреннее произведение на V, то матрица А = где аи- = Р (ѵІУ V;), симметрична. Предположим далее, что В = (fez/) есть симметричная п X п матрица. Можно ли определить внутреннее произ¬ ведение Q на V, для которого Q (üz, ü,) = fy,? Можно, когда Q за¬ дается формулой Q(v, w) = £ £ (2.83) І=1 /=1 п п где с = J а ®, и w = S і=і ‘ /=і Упражнение 2.19. Покажите, что уравнение (2.83) действительно определяет внутрен¬ нее произведение Q на V. Если В — единичная матрица /, найдите, во что превращается формула для Q? Пример 2.24. Матрица Г 1 2 —11 3 1 О 3 В = симметрична и определяет внутреннее произведение Q на /?3, причем Q «1 а2 аз — аіРі + 2ctiр2 — аіРз 2а2р! За2рз — азРі + Зссзр2 + (ХзРз. _Рз_ Отметим, что 0’ 1 , такой, что Q (w, w) —1 ’Ч Иначе говоря, существует ненулевой вектор ф = 0 , такой, что Q (ф, ф) = 0, [1. 0. и другой ненулевой вектор w = Внутреннее произведение Р на V положительно, если Р обладает свойством Р(ѵ, ѵ)^0 (2.84) для всех V из V. Будем называть Р определенным (невырожденным), если утвержде¬ ние «Р (^, г>о) = 0 для всех v Ç V» справедливо лишь для г>0 = 0. Если В— симметричная матрица, причем соответствующее ей внутреннее произве¬ дение на V [см. формулу (2.83)] положительно определенно, то В — поло¬ жительно определенная матрица. Значение последнего понятия рассмат¬ 47
ривается в § 2.12, 2.13 и 2.15. Векторное пространство V вместе с опре¬ деленным внутренним произведением Р на V называется эвклидовым пространством. Например, если рассматривать внутреннее произведение Р на /?п, матрица которого по отношению к нормальному базису (е19 е2, ...» еп} 1 равна единичной матрице /, т. е. то это внутреннее произведение положительно определенно и Rn оказы¬ вается эвклидовым пространством. Выделим это внутреннее произведе¬ ние называя его скалярным произведением, и будем использовать обозначение w) для P (v, w). Если — суть элементы Rni то скалярное произведение ѵ на w w) =-2 (2.86) t=l Это внутреннее произведение будет использоваться в дальнейшем очень часто. Пример 2.25. Если ѵ = J и w = j — элементы R2, то (v, w) = К2 — 3, (я, ф) = 2 и (w, w) = 11. Упражнение 2.20. Покажите, что скалярное произведение на Rn, {v, w) положи¬ тельно определенно. 2.12. НЕРАВЕНСТВО ШВАРЦА Пусть V есть эвклидово пространство с внутренним произведением Р. Докажем неравенство, известное как неравенство Шварца, а именно: \P(v, w)|2 < P(v, v)P(w, w) (2.87) для всех ü, w из V. Для доказательства неравенства (2.87) Р должно быть лишь положительно (определенности Р не требуется). Если X — любое вещественное число, то P (V + Xw, V + Xw) = Р (я, ѵ) — 2ХР (ѵ, w) + №Р (w, w) > 0, (2.88) так как Р положительно. Если P (w, w) 0, то подстановка X =—P (ѵ, w)/P (w, w) в уравнение (2.88) даст желаемый результат, т. е. фор¬ мулу (2.87). Если P (w, w) —0, но P (v, ѵ) + 0, то, рассматривая выра¬ жение P (Хг> + W, Х^+ w), мы снова придем к формуле (2.87). Наконец, 1 См. также формулу (2.27). 48
если P (w, w) = 0 и Р (ѵ, ѵ) = 0, то, полагая в уравнении (2.88) Х= = —P (ѵ, w), получим неравенство — 2 [P (v, w)]2 > 0, (2.89) которое справедливо лишь для P (v, w) = 0, что опять доказывает спра¬ ведливость формулы (2.87). В дальнейшем мы будем использовать нера¬ венство Шварца довольно часто. Заметим, что если Р —скалярное произведение на Rn [см. (2.86)], то неравенство Шварца принимает вид Полагая имеем (2.90) (2.91) 2.13. ОПРЕДЕЛЕНИЕ ОРТОГОНАЛЬНОСТИ И НОРМЫ Пусть V — эвклидово пространство с внутренним произведением Р. Будем говорить, что два вектора ѵ и w ортогональны (или перпендику¬ лярны), если P(ü, w) = 0. (2.92) Например, векторы ех и е2 в /?2 ортогональны по отношению к ска¬ лярному произведению на Т?2: (ех, е2} = 0. Если V /г-мерно, то в нем существует такой базис (Uj, ѵ2, . . .,Фп], что фі ортогонально если i j и P (ф., ^) = 1. Иначе говоря, матрица Р по отношению к базису ф2, • . Фп\ есть единичная матрица /. Такой базис назы¬ вается ортогональным в пространстве V. Например, натуральный базис {е1У е2, . . ., еп] есть ортогональный базис Rn для скалярного произведе¬ ния на Rn, т. е. (еІУ е3) = 8ih 1, 2, ..., п; / = 1, 2, ..., п. (2.93) Пример 2.26. Матрица А = 3 2 симметрична и определяет внутреннее произ¬ ведение Р на /?3: [_0 2 4 — аіРі + аіР2 “Ь а2рі 4“ За2р2 + 2а2Рз 2а302 4- 4а3р3 — == (аі + аг) (Рі "Ь Рг) + а2Рг "I" (а2 + 2«з) (р2 + 2рз). — положительно определенно, и поэтому, если положить = ev w2 = и w3 = = —e2 2*^3’ T0 вектоРы Wi, w2 и w3 образуют ортогональный базис R3 по отно¬ шению к внутреннему произведению Р. Заметим, что Р (а, 0) — (а, 40) и что P Wj) = A W/) = для /, / = 1, 2, 3. Упражнение 2.21. Докажите, что внутреннее произведение Р для примера 2.26 дей¬ ствительно положительно определенно. Указание: используйте ортогональный базис [wl( w2, w3}, предварительно доказав его ортогональность. Упражнение 2.22. Покажите, что ((сцP j + 4а3Р3)|2 < (а2 4а3) (р2 4" 40|). Указание: используйте неравенство (2.87) и внутреннее произведение при¬ мера 2.26. 49
Если V — эвклидово пространство с внутренним произведением Р, то У P (ф, ф) называют нормой элемента ф из V и записывают Mf = ѴР{Ѵ, ѵ). (2.94) В случае скалярного произведения на Рп для нормы ф записывают II = у для всех Ф из Rn. (2.95) Норма обладает следующими важными свойствами: 1) Йіір 0 для всех Ф из V, причем ||ü|| = 0 тогда и только тогда, когда Ф = 0; 2) ||^і + ѵ2\\Р < ІІ^іЦр + для всех ф19 ф2 из V; 3) ІІгг,ІІр== ИМ рДля всех г из Я и для всех ф из V. В следующей главе мы более подробно рассмотрим понятие нормы. В § 3.2 мы покажем, что норма позволяет определить расстояния между элементами V. Более того, мы можем определить «угол» Ѳ (фъ ф2) между векторами Фі и ф2 с помощью формулы = <2'96) Таким образом, существуют понятия длины и угла в пространстве V. Поэтому V называют эвклидовым пространством. 2.14. НЕКОТОРЫЕ СВОЙСТВА СКАЛЯРНОГО ПРОИЗВЕДЕНИЯ НА Rn Предположим, что С = (си) есть п X т матрица. Тогда, если и— элемент из то Си мы можем рассматривать как элемент из 7?п (см. § 2.8). Иначе говоря, если то Си = т 2juj Попытаемся определить (Си, х), где x(zRn- Имеем 50
где С = (Cji) —транспонированная матрица С и сц = сц для і = 1, 2, . . п и / = 1, 2, . . ., т. Итак, {Си, X} = {и, С'х). (2.98) Последнее выражение мы будем использовать в дальнейшем довольно часто. Пример 2.27. Пусть С— 3X2 матрица 1 О О 1 1 2 Если — элементы R2 и R3 соответственно, то а (Си. х) = игхх + и2х2 + urx3 + 2w2x3 = (и, С'х) = (хх + х3) + и2 (х2 + 2*з)- Подставьте какие-нибудь числа вместо Uj и х,, если вы все еще сомневаетесь в справедли¬ вости данного положения. Далее в этом параграфе мы будем рассматривать только простран¬ ство Rn. Все векторы будут считаться элементами Rn и все матрицы — размера п х п. Предположим, что А = (а^) удовлетворяет соотношению А = -4', (2.99) что эквивалентно = —ан для f = l,2, ..п и / = 1, 2, ..., п. (2.100) Говорят, что А — кососимметричная матрица. Каково значение этого свойства по отношению к скалярному произведению? Согласно выраже¬ нию (2.98) имеем {Ах, х) = {х, А'х) (2.101) для любого X. Это означает, что {Ах, х) = {х, — Ах) = — {Ах, х) (2.102) для любого х, если А кососимметрична. Иначе говоря, {Ах, х) = 0 (2.103) для любого х, если А кососимметрична. Справедливо и обратное: если матрица А удовлетворяет уравнению (2.103) для любого х, то А — косо¬ симметрична. Уравнение (2.103) означает, что векторы Ах и х ортого¬ нальны. Таким образом, операция А над вектором х производит век¬ тор Ах, ортогональный к х. 51
0 а b ' 0 11" Пример 2.28. А = — а 0 — с кососимметрична; — 1 0 0 — Ь с 0 — 1 0 0 также кососим¬ метрична. р/ Пример 2.29. Если В — любая п X п матрица, то матрица кососимметрична / 5 ~ D в +В . В— В' (почему?), а матрица— симметрична. Отметим, что В — х 1 ~ . Л £ А Упражнение 2.23. Покажите, что если (Дх, х)=0 для любого х, то А = —Д'. Указание: ( А (еі — ef), ві — ef) = 0. Мы знаем, что {elf е2, • • -, еп] есть ортонормальный базис в Rn. Пред¬ положим, что Ф невырожденная матрица; тогда набор векторов |Феп Фе2, ..., Феп) есть базис Rn (почему?). Посмотрим, каким условиям должна удовлетворять матрица Ф для того, чтобы этот базис был ортонормальным. Имеем (Ф^, Фе7) = (е^ Ф'Фе,). (2.104) Если Ф = (<рг/), то можно написать Ф'Фе,; = <р;.р<рР/, (2 105) Р=1 где Ф' = (ф'7) с ф'.. = фх... Следовательно, (Фе., Фе.) = ô.y. тогда и только тогда, когда Ф'Ф (2.106) Аналогично можно показать, что (Фег, Фе;) = тогда и только тогда, когда ФФ' - I (2.107) В результате получаем, что базис {Феь Фе2, . . ., Ф^Пі снова будет ортонормальным только в том случае, если обратная и транспонирован¬ ная матрицы Ф' одинаковы, т. е. Ф^-Ф', (2.108) или, что то же самое, ф'ф . ф'ф = 7. (2 109) Любая матрица, удовлетворяющая условию (2.109), называется орто¬ гональной матрицей (и преобразование, определяемое Ф, как в § 2.7, называется ортогональным преобразованием). Мы видим, что (Фх, Фх) - (X, х) (2.110) для любого вектора х и ||Фх|| = |]х[| [см. (2.95)] (2.111) для любого X в Rn, если Ф — ортогональная матрица. Ортогональную матрицу (или преобразование) Ф можно представлять себе как преобразование, сохраняющее эвклидову длину ||х|| вектора х, но изменяющее его «направление». [cos Ѳ sin О'] ‘ Ѳ Ѳ (для некоторого угла Ѳ). Тогда fcosO — sin 01 ' Tcos2 0 4- sin2 0 0 ] Г1 0"] Ф — л I; ФФ | , так что Ф есть [sin Ѳ cosOJ [ 0 sin2 0 4-cos2 0] [0 1J ортогональная матрица. 52
Упражнение 2.24. Определите, является ли матрица нальной? cos Ѳ sin Ѳ О — sin Ѳ cos Ѳ О О 0 1 ортого- Является ли ортогональной матрица 1 О О О cos Ф sin Ф ? О — sin Ф cos Ф Что можно сказать о произведении этих матриц? 2.15. НЕКОТОРЫЕ СВОЙСТВА СИММЕТРИЧНЫХ МАТРИЦ В § 2.11 мы уже отмечали, что существует тесная связь между поня¬ тием внутреннего произведения и симметричными матрицами. Исполь¬ зуем эту связь, чтобы отыскать некоторые свойства симметричных матриц, которые нам часто будут нужны в дальнейшем. В этом параграфе мы будем рассматривать лишь пространство Rn. Следовательно, все векторы будут предполагаться элементами из Rn, а все матрицы — размера п X п Пусть еъ е2, . • еп обозначает нор¬ мальный базис в Rn [см. уравнение (2.27)1 и пусть Q = (çz/) —симме¬ тричная п X п матрица, т. е. Q - Q', (2.112) где Q' — транспонированная матрица Q. Мы ‘знаем, что функция Q (ѵ, w), определенная как Q(ü, w) Qw (2.113) для всех V и w из /?п, является внутренним произведением на Rni по¬ скольку Q симметрична. п п Если V = 2^ и W " |3.£;, то имеем Q(f, w) = РА/= ÈÈ Qe/р,. (2.114) \/=1 /==1 / 1=1 /=1 Мы знаем, однако, что п Qer-^qkjek, (2.115) k=\ и, следовательно, А, Qe/ = qkj ’.еІУ ej) = qit, (2.116) Æ=1 поскольку (ez, ek} àik (где ôt/2 = 0, если i -^= k и ôz/ = 1). Отсюда выте¬ кает, что Q(ü, w) — (if, Qw -= S (2.117) и что Q — матрица внутреннего произведения Q по отношению к нормаль¬ ному базису \еъ е2, . . еп\. Рассмотрим теперь очень важную теорему, которая утверждает, что существует ортонормальный базис \f±, f2, . • fn\ в Rn, обладающий свойством Q(Z-//) = W h /=1,2..., п, (2.118) 53
где Х2, . . — п вещественных чисел. Иными словами, матрица внутреннего произведения Q по отношению к базису • • •> fn} есть диагональная матрица с элементами А,п Х2, . . Хп. Строго говоря, мы мо¬ жем доказать следующую теорему: Теорема 2.4. Если Q — симметричная п X п матрица и Q — вну¬ треннее произведение на Rn, определенное уравнением (2.113), то в Rn существует ортонормальный базис f2, . . ., /„}, т. е. {fi, /=1. 2, .... п (2.119) такой, что матрица Q по отношению к ft есть диагональная матрица Л вида " Хі 0 ... О ~ Л= • (2.120) _ 0 0 ... Х„_ Иначе говоря, существует ортогональная матрица Ф [т. е. Ф'Ф = /, см. уравнение (2.109)], обладающая свойством (Ф^, = ХД,; і, / ==1,2, . . ., п (2.121) или, что эквивалентно, Ф'(?Ф = Л. (2.122) Поскольку Ф ортогональна и Ф' — инвертированная матрица Ф, уравнение (2.122) означает, что Q и Л— подобные матрицы (см. § 2.9). Следовательно, вещественные числа Х2, . . ., — собственные зна¬ чения Q х. Можно непосредственно установить два следствия этой теоремы. Следствие 2.1. Если Q — (вещественная) симметричная п X п ма¬ трица, то собственные значения Х2, . . ., матрицы Q вещественны. Следствие 2.2. Если Q (ü, ѵ) = (ѵ, Qv} — квадратичная форма, произведенная внутренним произведением Q (см. § 2.11), то существует ортонормальный базис {f19 f2, . . ., /п}, такой, что Q(v, ѵ) = {V, Qv) = S М? (2.123) І=1 для всех V из Rn, где À, — собственные значения Q и Рг- — координаты ѵ п по отношению к базису /£, т. е. ѵ = 2 IV,- Пример 2.31. Пусть Q — сумметричная 2X2 матрица: р_Га Л. <«і- Qet)=a Qe2) = Ь; р cj’ {е2, Qe1} = b (е2, Qe2) = c. Теорема устанавливает, что существует ортонормальный базис {/х, /2) в Т?2, такой, что (/„ Qfi) = Qf2) = 'f2,Qfô = 0 и (/2, Qf2) = Х2, где и Х2 —соб- ственные значения Q. Так как нетрудно видеть, что det (Q — XI) — X2 — (а + с) X + (ас — Ь2) и, следовательно, соб¬ ственные значения Q равны . (а + с) + К (а — с)2 4- 462 , (а + с) — V (а — с)2 + 4/>2 Лі = 2 и Л2 = 2 * 1 Доказательство этой теоремы можно найти в литературе [21] или [24]. 54
Так как (а — с)2 + 0, собственные значения и Х2 должны быть действитель- „ , Н Ц ными. В частности, если а — о — с= 1, т. е. Q= I I, то собственные значения Q равны 0 и 2, и существует ортогональная матрица Ф, а именно: такая, что Ф'фФ = Векторы /] = Фег = 1 1_ /2 /2 1 1_ /2 /Т 1 /2“ 1 И ?2 = Ф^2 1 /2 1 L J _/2 являются новыми ортонор¬ мальными векторами базиса в /?2. Исходя из следствия 2.2, введем следующую терминологию для симметричной п X п матрицы Q. Будем говорить, что Q: 1. Положительно определенна, если все собственные значения поло¬ жительны, т. е. \ > 0 для всех Z, (2.124) или, что эквивалентно, тогда и только тогда, когда Q(ü, ü) = Лр, Qü)>0 (2.125) для всех V =/= 0 из 2. Положительно полуопределенна, если собственные значения Х2, . . матрицы Q неотрицательны и хотя бы одно из собственных значений \ равно нулю, т. е. \ 0 для всех і (2.126) и = 0 для некоторых £ (1, 2, . . ., п}, (2.127) или эквивалентно, если Q(ü, ѵ) = Qv)^0 (2.128) для всех V из Rn и существует некоторый! вектор гі 0 в Rn, для которого Q(ü, v) = (<ut Qv) = 0. (2.129) 3. Отрицательно определенна тогда и только тогда, когда собствен¬ ные значения Х2, . . матрицы Q отрицательны, т. е. <0 для всех і (2.130) или эквивалентно, если Q(ü, у) = (2.131) для всех V =£ 0 из Rn. 4. Отрицательно полуопределенна тогда и только тогда, когда все собственные значения Х2, . . ., матрицы Q неположительны и по крайней мере одно из них равно нулю, т. е. < 0 для всех і (2.132) и или х = 0 для некоторого £ {1, 2, . . ., п] эквивалентно, если (2.133) для Q(ü, ѵ) = (ü, Qv) < 0 всех V из Rn и (2.134) для Q(ü, v) = (ü, Qv) = 0 некоторого V 0 из Rn. (2.135) 55
Заметим, что если Q положительно или отрицательно определенна, то Q должна быть невырожденной, поскольку Q подобна диагональной матрице, не имеющей нулей среди элементов главной диагонали. Если Q положительно или отрицательно полуопределенна, то Q должна быть вырожденной матрицей, поскольку Q имеет нулевое собственное зна¬ чение. Частные случаи использования этих понятий рассматриваются в гл. 6 и 9. Пример 2.32. Матрица Q = положительно полуопределенна, так как ее соб¬ ственные значения равны 0 и 2. Так как нам часто надо будет определять, является ли данная сим¬ метричная п X п матрица Q =-- (qu) положительно определенной, устано¬ вим два критерия положительной определенности с помощью следующей теоремы: Теорема 2.5. Пусть Q =■- (qif) — симметричная п X п матрица. Тогда а) Q положительно определенна в том и только в том случае, если существует некоторое k > 0, такое, что (ü, Qü> &ИІ2 (2.136) для всех V из Rn, где ||я|| = ф) — эвклидова норма ф [см. урав¬ нение (2.95)]. б) Q положительно определенна в том и только в том случае, если справедливы соотношения det(Qr)>0, г- 1, 2, ..., п, (2.137) где det (Qr) есть детерминант г X г матрицы Qr = (W; 1, 2, ..., г; Р- 1, 2, . . ., г, (2.138) т. е. 7іі Уі2 • • • 9іг Q = <?21 <?22 ••• Ягг (2.139) _<7г1 <?г2 • • • ЯГГ- Докажем пункт а) этой теоремы, а за доказательством пункта б) отошлем читателя к литературе [21 1. Предположим сначала, что соотно¬ шение (2.136) удовлетворяется. Так как k > 0 и || ф|| 0, если ф О (см. § 2.13), то (г>, Qv) ^£||^||2>0 (2.140) для всех ф из Rn. С одной стороны, на основании уравнения (2.125) можно заключить, что Q положительно определенна. С другой стороны, предположим, Q положительно определенна, тогда на основании след¬ ствия 2.2 заключаем, что существует ортонормальный базис flf f 2, ... . . ., fnt такой что (v, = (2.141) для всех ф из Rn, где pz — координаты ѵ по отношению к /t и \->0, і - 1, 2, . . ., п (2.142) (так как Q положительно определенна). Однако, так как fj) =àtl, i, j= 1, 2 n, (2.143) 56
мы имеем II® If2 = (©, ©) = z £ Pi fi, І₽,/,> - S ?’ /-1 / r-=l и если считать k положительным числом (/г > 0), причем k < \ і = 1, 2, . .., и, то из уравнений (2.141) и (2.144) можно заключить, что п п (ѵ, Qv} = ₽Ь=*М2. і=1 і = 1 (2.144) (2.145) (2.146) Таким образом, пункт а) теоремы 2.5 доказан. Пример 2.33. Предположим, что Г<711 <712 1^21 <?22. — симметричная 2X2 матрица. Q положительно определенна только тогда, когда çu > 0 и qnq2.2 — 4:> Если Q - <7и <712 <7із ^21 <722 <723 <7зі <7.32 <7зз — симметричная 3X3 матрица, то Q положительно определенна, если <7ц>0 и quq^ — — q^ 0 и det Q > 0. Этотпример иллюстрирует пункт б) теоремы в тех частных случаях, когда п -- 2 и п = 3.
ГЛАВА 3 МАТЕМАТИЧЕСКИЙ АНАЛИЗ 3.1. ВВЕДЕНИЕ В этой главе продолжим изложение некоторых положений матема¬ тики, необходимых нам в дальнейшем. Основное внимание будет сосредо¬ точено на таких понятиях как расстояние, сходимость векторных функций, дифференциальные уравнения и линейные системы. С целью полноты изложения привлечен математический аппарат высшего анализа. Все эти теоретические положения развиваются лишь в такой степени, чтобы чита¬ телю было доступно изучение последующих глав книги. Заинтересованный читатель может углубить свои знания в этой области с помощью следующих книг: [21], [25], [46], [51], [59], [124], [180], [192], [196], [205] и [212]. РАССТОЯНИЕ И СВЯЗАННЫЕ С НИМ ПОНЯТИЯ 3.2. ОПРЕДЕЛЕНИЕ Мы приступаем к изучению очень важного понятия о расстоянии и некоторых его следствий. Рассмотрим сначала интуитивное понятие расстояния и попытаемся абстрагировать его наиболее существенные элементы. Прежде всего заметим, что когда мы говорим о расстоянии, то всегда представляем его между двумя точками, например: расстояние между Нью-Йорком и Бостоном 208 миль. Во-вторых, отметим, что рас¬ стояние между двумя точками равно нулю, когда эти точки совпадают. Например, расстояние между Бостоном и Бостоном равно нулю миль. В-третьих, мы обычно рассматриваем расстояние между точками незави¬ симо от порядка, в котором эти точки называются, т. е. расстояние между Нью-Йорком и Бостоном то же самое, что между Бостоном и Нью-Йорком. И, наконец, интуитивное понятие расстояния триангулярно в том смысле, что если Л, В и С — три точки, то расстояние между 4 и Сне превышает суммы расстояний между А и В и В и С. Например, расстояние между Нью-Йорком и Бостоном меньше, чем сумма расстояний между Нью- Йорком и Олбани и между Олбани и Бостоном. Эти сведения приводят нас к следующему строгому определению понятия расстояния. Определение 3.1. Если X — некоторое множество, то функция d, принимающая лишь вещественные значения, определенная на всем мно¬ жестве X X X, называется функцией расстояния на X, если удовлетво¬ ряются следующие условия: 1) d (х, у) 0 для всех х, у из X и d (х, у) = 0 тогда и только тогда, когда X = у; 2) d (х, у) = d (у, х) для всех х, у из X; 58
3) d (x, z) < d (x, y) + d (y, z) для всех x, y и z из X, Функцию d (x, y) мы часто будем называть расстоянием между х и у и именовать (3) неравенством треугольника. Множество X вместе с заданной функцией расстояния d на X называется метрическим пространством. Если X — эвклидово пространство с Р в качестве внутреннего про¬ изведения (см. § 2.11 и 2.13), то мы можем определить расстояние, приняв d(х, у) = Ux — у||р = ѴР(х — у, х — у), (3.1) где II (х —у) |[р представляет собой норму х — у (см. § 2.13) и х, у£Х. На основании первого и второго свойств нормы (§ 2.13) и свойства про¬ изведения Р (§ 2.11) замечаем, что уравнение (3.1) действительно опре¬ деляет расстояние на X, В частном случае, когда X есть пространство Rn и Р — скалярное произведение на Rn [уравнение (2.86)], мы имеем Xi Уі x2 Уг X = и y = Уп_ d(x, у) = Il x — у И = Ѵ(х — у, х — у) (3.2) или, что эквивалентно, Такую функцию расстояния будем называть натуральным, или эвкли¬ довым, расстоянием. Пример 3.1. Если X = R есть множество вещественных чисел, то расстояние междух и yt d (х, у) представляет собой абсолютное значение разности х — у, т. е. d (х, у) ~ — I х — у |. Например, d (5, 3) = | 5 — 3 | = 2. Пример 3.2. Если 1 З' 1 2 1 4 х = О 2 О то d(x, z) =||х—z|| = Кб d(x, у) =||х — Я = 2 Кб d (у, z) = ||у — z || = 3. Пример 3.4. Предположим, что X = /?2 и х = , тогда функция Итак, получим Кб <2/б +3; 2 Кб < Кб +3; 3 < Кб +2 Кб. Пример 3.3. Если X — любое множество и мы зададим d (х, у) = 1, если х=ру и d (х, х) = 0 для x и у из X, то d будет функцией расстояния на X. г п Г Уі _ _ LZ/2J d (х, у), заданная как d (x, у) = I хх — £/іі +|х2— */2| есть функция расстояния на /?2. Упражнение 3.1. Покажите, что функция d примера 3.4 действительно есть функция расстояния на Т?2. Обобщите это понятие расстояния на Rn. Указание: в примере 3.4 2 d(x, у) - 2 \*1~ Уі\- £ = 1 59
Упражнение 3.2. Если max {а, b} обозначает наибольшую величину из а, Ь, то функ- LizzJ/ на Докажите эго и обобщите на Rn. Указание: d (й’ 3.3. СФЕРЫ И ПРЕДЕЛЫ Пусть X — множество, d — расстояние на X и х0 — фиксированный элемент X. Часто интерес представляют точки, находящиеся в пределах заданного расстояния от фиксированной точки х0. Если р > 0 — веще¬ ственное число, то множество S (х0, р), определенное как 5(*(ь Р) = І*ЕХ : d(xQ> х)<р}, (3.4) называется открытой сферой радиуса р вокруг х0. Иными словами, S (х0, р) — множество элементов из X, расстояние которых от х0 меньше, чем р. Например, если X = R и мы исполь¬ зуем натуральное расстояние на R, то S (0, 1) = {г : I г I < 1 ). Отметим, что если р <а, то S (х0, р) с: S (х0, <*)• Рис. 3.1 a) S (0, 1) — внутренняя часть круга, S (0, 1) — внутренняя часть круга вместе с окружностью, являющейся границей круга; б) S (О, 1) — внутренняя часть квадрата, S (0, 1) — весь квадрат Пример 3.5. Пусть X — R2 и х0 = [ 0J' Если использовать натуральное расстояние [уравнение (3.3)], то S (0, 1) есть множество |х “ j : < <Z 1 j (см. рис. 3.1, а). Если использовать определение расстояния из упраж¬ нения 3.2, то S (•£(), 1) — - [д/j : max {|хіІ» |х21} <11 (см. рис. 3.1, б). Аналогичным образом, если р > 0 — вещественное число, то множе¬ ство S (х0, р), определенное как S(x0, р) = |х6 X : d(x0, х) <р), (3.5) называют замкнутой сферой радиуса р около х0. Другими словами, S (х0, р) есть множество элементов из X, расстояние которых от х0 не превосхо¬ дит р. Например, если X = R и мы будем использовать натуральное рас¬ стояние на R, то S (0, 1) = {г : | г | < 1}. Причина использования терми¬ нов «открытое и замкнутое пространство» будет ясна из следующего па¬ раграфа. Наконец, заметим, что в частном случае пространства Rn с расстоя¬ нием і| X — у і| имеем S(x0> р) - |х(Е Rn :||х — ЛоІКр} S(x0, р) = (хе /?„ :||х — .toll < р}. (3.6а) (3.66) Определив понятия открытой и замкнутой сферы с центром в неко¬ торой точке, мы готовы к тому, чтобы сформулировать понятие сходи¬ мости. Предположим, что х„, п = 1, 2, ... есть последовательность элементов из X. Что означает утверждение: последовательность прибли¬ жается к х0 (стремится или сходится к х0)? Интуитивно мы рассматри¬ ваем последовательность как стремящуюся к х0, если элементы хп все больше приближаются к х0 по мере увеличения п.
Определение 3.2. Сходимость. Последовательность \хп: п = 1, 2,. . .} называют сходящейся к х0, если для любого действительного е > 0 суще¬ ствует N (е) такое, что если п^> N (е), то хп окажется в S (х0, е), т. е. d (х0, хп) < s для всех п больших, чем N (е). Иначе говоря, если взять любую открытую сферу с центром в xQ, то, начиная с некоторого элемента, все остальные члены последовательности будут находиться внутри этой открытой сферы. Часто пишут хп -> х0 для обозначения следующего положения: «хп сходится кх0». Например, последовательность хп = —, п = 1, 2, . . . в 7? сходится к 0. Легко видеть, что последовательность хп сходится к х0 тогда и только тогда, когда последовательность вещественных чисел d (Xq, хп) сходится к 0. В частном случае пространства Rn с расстоянием IlX—у-l последовательность хп сходится к х0 тогда и только тогда, когда для б > 0 существует N (б) такое, что ||хп—х0|| <е для всех п > N (е). Пример 3.6. Точки хп = [}/^] в ^2 сходятся к началу координат в R2 по отно¬ шению к натуральному расстоянию на R2, а также по отношению к расстояниям из упраж¬ нений 3.1 и 3.2. Пример 3.7. Если X — любое множество и d — расстояние из примера 3.3 (т. е. d (х, у) - 1 при х /- у и d (х, х) — 0 для х, у из X), то последовательность хп — х0, п — 1, 2, . . . сходится к Л'о. Определение 3.3. Предел последовательности. Если последователь¬ ность хП9 п 1,2,... сходится к х0, то х0 называют пределом последова¬ тельности и записывают это так: Рис. 3.2 Две открытые сферы s («О. -|-) и 5 (i/o. -|-) [см. уравнение (3.4)] не встречаются х0 = lim хп. П-+ оо Посмотрим, может ли последовательность хп, п = 1, 2, ... иметь больше одного пре¬ дела? Заметим сначала, что если х0 и yQ — два различных элемента из X, то d (х0, yQ) р > О и, следовательно, S (х0, и S^z/0, не пересекаются, т. е. S (х0, -у) П П S ^z/0> -у) = 0 [см. (рис. 3.2) ]. Для того чтобы X принадлежал одновременно S (хц, и S (^уо, -уу должно быть обеспечено услові х) + d (х, у о), что приводит к противоречию р <р (почему?). Если по¬ ложить Е то нетрудно получить, что для п > N (е) хп не принад¬ лежит к S (z/0, е), и поэтому z/0 не является пределом последователь¬ ности. Наконец, предположим, что хп, п = 1, 2, ... есть последователь¬ ность элементов из и обозначим компоненты хп через хпі, т. е. d (х0, z/o) = P < d (х0, 61
Тогда N-мерный вектор хс компонентами х19 х2, . . xN есть предел последовательности {хД только в том случае, если каждая величина до¬ есть предел последовательности {xrtit}. Иначе говоря, хп -> х тогда и только тогда, когда хп, і хі Для всех (З.бв) Чтобы показать это, запишем N I Хп.< — Xt I С II Хп — X II < S I хп. і — Хі I, (3.6г) так как 3.4. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА Предположим опять, что X — множество и d — расстояние на нем. В этом параграфе мы рассмотрим важные свойства, которыми могут обладать подмножества из множества X. Определение 3.4. Внутренняя точка. Если А — подмножество из X и если xÇ Л, то говорят, что х есть внутренняя точка Л, когда суще¬ ствует р > 0 такое, при котором открытая сфера S (х, р) содержится в Л, т. е. S (х, р) с: Л. Например, если подмножество Л само является открытой сферой (Л = S (х0, р)), тогда любой элемент Л есть внутренняя точка Л. Упражнение 3.3. Покажите, что если А = S (х0, а) и х g X, то х есть внутренняя точка А. Указание: рассматривайте открытую сферу S(x, р) с р = а — d (х0, х). Пример 3.8. Пусть X = R, с натуральным расстоянием d (г, s) = | г — s|, и пусть А — подмножество из X, заданное соотношением А — [г : 0 << 1}. Точка г= — есть вну¬ тренняя точка А, но точка г = 1 таковой не является. Пример 3.9. Пусть X — любое множество и d — функция расстояния из примера 3.3 (т. е. d (х, у) = 1 при X #= у и d (х, х) = 0). Если А — любое подмножество из X, то каж¬ дый элемент А есть внутренняя точка А. Определение 3.5. Открытое множество. Говорят, что Л — открытое подмножество множества X, если каждый элемент Л есть внутренняя точка Л. Иначе говоря, Л открыто, если для каждого х из Л существует р > 0 (которое может зависеть от х), такое, что 3 (х, р) содержится в Л. Заме¬ тим, что открытая сфера является открытым подмножеством (упражне¬ ние 3.3). Если X = R и a, b — элементы /?, причем а < Ь, то множе¬ ство {г : а <^г <^Ь\ открыто и называется открытым интервалом с кон¬ цами а и Ь. Такое множество мы иногда будем обозначать (af Ь) \ т. е. (а, Ь) = {г £ Я : а <^г < 6}. Если А± и Л 2 открыты, то можно показать, что Лх П Л2 также от¬ крыто. Далее, если Л,, / — 1,2,... открыты, нетрудно видеть, что J Л/ і=\ также открыто. Наконец, все пространство X и нулевое множество Ф также открыты. Упражнение 3.4. Покажите, что если Хх и А2 открыты, то Xj П А2 открыто. [Ука¬ зание: Если X g А1 П А2, то существуют рі> 0 и р2> 0, такие, при которых 1 Нельзя путать с парой (а. Ь) в пространстве R X R. Значение символа (а, Ь) всегда будет очевидно из контекста. 62
S (x, px) CZ Ai и S (x, p2) C A2. Что представляет собой S (x, pj f] 5 (x, p2)?]. Если множества Alt A2, . . An открыты, то является ли открытым множеством их пересече¬ ние Лх П А2 fl * ‘ ’ П Является ли множество |^lj : Х; + х2 < 1 и хх > oj откры¬ тым в /?2? Определение 3.6. Предельная точка. Пусть В есть подмножество из X их — элемент X. Будем говорить, что х — предельная точка В, если существует последовательность хп, п = 1, 2 . . . элементов В (хп 6 В для п = 1, 2, . . .), которая сходится к х. Отметим, что х, будучи предельной точкой В, может и не быть эле¬ ментом В. Например, если В — подмножество из 7?, заданное соотноше¬ нием В = \г : 0 < г < 1}, то точка 0 является предельной точкой В, которая не принадлежит В, поскольку последовательность —, п = 1, 2, . . . элементов из В сходится к 0, который не является элементом В. Если у — любая точка из В, то у есть предельная точка В, так как после¬ довательность хп = у у п = 1, 2, ... сходится к у. Определение 3.7. Замкнутое множество. Будем говорить, что В — замкнутое подмножество из X (или, что В замкнуто), если каждая предель¬ ная точка принадлежит В. Докажем теперь следующую теорему. Теорема 3.1. Если А открыто, то X — А (дополнение Л, см. § 2.3) замкнуто, и, наоборот, если В замкнуто, то X — В открыто. Доказательство. Пусть А открыто и х£Л. Существует р > О, такое, что S (х, р) с: Л и, следовательно, S (х, р) не встречается с X — Л, т. е. S (х, р) П (X — Л) = 0. Ясно, что х не может быть предельной точкой X — Л. Это доказывает, что все предельные точки X — А принад¬ лежат X — Л, т. е. что X — А замкнуто. С другой стороны, предположим, что В замкнуто и х С X — В. Рассмотрим открытые сферы S (х, для п = 1, 2, . . . Докажем, что существует N, для которого S Çx, cl X — В, Если это не так, то каждая сфера S (х, пересекается с В и существуетхп в S (х, П 5 для п = 1, 2. . . Последовательность {xj, п = 1, 2, ... сходится к х, так как т > п соответствует S (х, — ) cz S ^х, — ) и так как для р > 0 существует т такое, что р >• —. Поскольку В закрыто и все хп принадлежат В, получаем противоречие: x С В. Итак, открытая сфера S (х, содержится в X — В (для некоторого X), и поэтому х есть внутренняя точка X — В. Следовательно, X — В открыто. Упражнение 3.5. Покажите, что замкнутая сфера S (х0, р) есть замкнутое множество. Указание: Если хл, п — 1, 2, . . принадлежит S (х0, р) и {хп} сходится к х, то d (хп, х) сходится к 0, так как d (х0, x) d (х0, хп) + d (хп, x) P + d (хп, х). Если Вх и В2 замкнуты, можно показать, что Вх J В2 также зам¬ кнуто. Далее, если Bz, 4 = 1,2,..., замкнуты, то П В, также замкнуто. Наконец, все пространство X замкнуто и нулевое пространство 0 также замкнуто. Если X = R и а и b — элементы /?, причем а <* &, то множество {г : а < г < Ь\ замкнуто и называется замкнутым интервалом с кон¬ цами а и Ь. Такое множество мы иногда будем обозначать как [а, Ь], т. е. la, b] = {г g R : а < г < b}. Мы будем также использовать обо- 63
значения [а, b) и (а, Ь] для множеств \г : а < г << Ь] и {г : а <^г < Ь\ соответственно. Резюмируя все это, получим (а, Ь) = {г : a<Z г ' [а, Ь] = {г : а С г С Ь] ; [а, Ь) \г : а < г < Ь\\ (а, Ь] = {г : а<_г < Ь}. Укажем, что множества [я, Ь) и (а, b I не являются ни открытыми, ни замкнутыми и часто называются полузамкнутыми или полуоткрытыми интервалами. Предположим, что С — подмножество из X. Дадим определения трех подмножеств из X, которые называются внутренней частью, замыканием и границей С. Определение 3.8. Внутренняя часть. Если дано множество С, то его внутренней частью, обозначаемой і (С), является множество всех внутрен¬ них точек С, т. е. z(C)— (х : существует р>0, такое при котором S (х, р) cz С}. (3.8) Заметим, что А открыто в том и только в том случае, если оно совпа¬ дает со своей внутренней частью Іиначе говоря, і (Л) Л]. Например, внутренней частью la, b) является открытый интервал (а, Ь). Определение 3.9. Замыкание множества. Замыканием данного мно¬ жества С, обозначаемым с (С) (или С), является множество всех предель¬ ных точек С: с (С) = [х : существует последовательность хп, п = 1, 2, . . ., такая, что хп сходится к х}. (3.9) Можно показать (упражнение 3.6), что с (С) есть замкнутое множество. Далее, множество В замкнуто тогда и только тогда, когда оно совпадает со своим замыканием, т. е. В = с (В). Например, замыкание интервала [а, Ь) есть замкнутый интервал la, bl. Определение 3.10. Граница множества. Границей данного множе¬ ства С, обозначаемой b (С), называется множество предельных точек С, которые не являются внутренними точками С: 0(C)-с(С)—/(C). (3.10) Можно показать, что граница С, b (С) есть замкнутое множество. Действительно, b(C) = с(С) П с(Х-С). (3.11) Иными словами, граница С есть пересечение замыкания С с замыка¬ нием X — С. Например, границей множества [а, Ь) является множество, состоящее из двух точек а и Ь. Пример 3.10. Множество С на задано как С — Цх] : xî "Е х2 < 1 или хі ~ 2, х2 = з| (рис. 3.3). Иначе говоря, С = S (0, 1) (J • Тогда і (С) — S (0. 1); с (С) = S (0, 1) J {[3]} и b (С) — ([^] : Х| + %2 = 1 или хі ~ 2, х2 — з|. Отметим, что среди четырех множеств С, і (С), с (С) и b (С) тождественных множеств нет. 1 Где {(2, 3)} есть множество, состоящее из одной точки L 64
Рис. 3.3. Множество С состоит из внутренней части круга и точки (2, 3). Внутренней частью мно¬ жества і (С) является внутренняя часть круга; границей b (С) — граница круга (окружность) и точ¬ ка (2, 3)\ замыканрем (С) — весь круг и точка (2, 3) Упражнение 3.6. Докажите, что с (С) замкнуто. Указание: Предположим, что x£c{c(Q); тогда существует последовательность^, уп £ с (С), которая сходится к х. Но уп g с (С) означает, что существует хп в С с d (хп, Уп) <Z ♦ Покажите, что последова¬ тельность хп сходится к X. Пример 3.11. Пусть X = R и С — множество всех раци¬ ональных чисел, С = {г £ R; г= где р и q — целые числа^. Тогда і (С) пусто, с (С) есть вся линия R и b (С) также вся линия R. Понятия, которые мы рассмотрели, могут быть несколько обобщены. По сути дела, мы говорили о метрических пространствах и о том, что назы¬ вается топологией. Общее понятие топологии и то¬ пологического пространства основано скорее на понятии открытых множеств, чем на понятии рас¬ стояния Эти более общие идеи можно найти в ра¬ боте [196]. 3.5. ПОЛНОТА И СЖАТИЕ Предположим, что X есть множество с функ¬ цией расстояния d и что х, следовательность, существует N (-у) то d (х0, хп) Из неравенства треугольника п = 1, 2, ... — по- сходящаяся к х0. Для е > О такое, что если (определение 3.1) следует, что если n, т^> N (-у), то d (хп, хт) <е. Это свойство сходящихся последовательностей весьма важно и приводит к следующему. Определение 3.11. Равномерная сходимость. Последовательность уп, п = 1, 2, . . ., элементов из X независимо от того, принадлежит ее предел к X или нет, называется равномерно сходящейся, если для каждого 8>0 существует N (е) такое, что если пит превосходят N (е), т. е. п > N (е), m > N (е), то d (хп, хт) <е. Если каждая последовательность в X рав¬ номерно сходится к элементу из X, то говорят, что множество X является полным. Например, эвклидово пространство Rn с эвклидовой функцией расстояния является полным Ч Пример 3.12. Пусть X — (0, 1 ] и d (х, у) = | х — у | для х, у в (0, 1 ]. Последова¬ тельность Хп = п = 1, 2, . . ., сходится равномерно в X, но ее предел не принадле¬ жит X. Иначе говоря, множество X — (0, 1 ] не является полным. Упражнение 3.7. Докажите, что если X = [1, 2), причем d (х, у)= | х — у | для х, у из [1, 2), то X не является полным. Определение 3.12. Сжатие. Пусть X — полное множество и Т — преобразование (функция) X в себя, т. е. Т — функция, область суще¬ ствования которой — все множество X и область изменения содержится в X. Если существует вещественное число k, 0 < k << 1, такое, что для всех х, у из X справедливо d[T(x), T(y)]<kd(x, у), (3.12) 1 Действительно, Rn полно по отношению к функциям расстояния d (х, у) = || X — /~7і п 2 (Хі — Уі)2 (эвклидово расстояние); d (х, у) = Jj Iх* ~~Уі\ и d ^) = = max {| xz — yi\}. 3 Атанс и др. 65
то преобразование Т называют сжатием на X. Иначе говоря, Т есть сжа¬ тие, если Т уменьшает расстояние между точками. Отметим, что число k в уравнении (3.12) не зависит от х и у. Пример 3.13. Пусть X — закрытый интервал [0, 1 ] с d (х, у) — | х — у | для х. у Х^1 из [0, 1 ] и пусть f — преобразование [0, 1 ] в себя, заданное как f (х) — -у. Тогда | f (х) — — f (у) I = L*+-Е L!.* El I X _ у |э и f есть сжатие на [0, 1 ]. Пример 3.14. Пусть X = Rn и ЭД, — линейное преобразование Rn в себя, заданное как ЭД (я) = Аѵ, где А — (а.^) есть п X п матрица и v £ Rn [см. уравнение (2.51)]. Пред- п п положим также, что 2 = в этом слУчае есть сжатие. і=і /=1 Если wÇ Rn, то Г п. г П \2 d (А я, Aw) = Il Av — Aw|| = ||А (v — w)|| = 1 / аи(ѵі ~ ш/)( • V i=i (/=1 J В силу неравенства Шварца [уравнения (2.87) или (2.91)] d (Av, Aw) у/4"S S a}j И — w II2- Следовательно, d(Av, Aw)^. kd(v, w). Таким образом, ЭД (v) есть сжатие. Например, при и = 2 и А = 2 1 2 1 9 1 имеем ап=-у; ^2=— ; • 2 1 2 2 9 9 3 «22 =-3-; «11 + «12 + «21 + «22 = -4 Следовательно, преобразование ЭД, заданное как ЭД (ех) — 1 1 ~ Из" 2 Кб" 1 1 2 КЗ , ЭД(е2)= 1 /з 1 2/6 , является сжатием. 1 __ 2/б ” 1_ /3 Докажем теперь важную теорему, которая показывает, как сжатие может быть связано с решением уравнений. Теорема 3.2. Если Т есть сжатие на X, то существует единственный элемент х* £ X, такой что T (х*) = X*. (3.13) Более того, если — произвольный элемент X и если х2 = Т (хх), х3 = Т (х2), . . ., хп — T (xrt_j), то последовательность [хп} сходится к х*. Доказательство. Прежде всего докажем, что такой элемент х* дол¬ жен быть единственным. Предположим, что х* и у* — два элемента из X, удовлетворяющие уравнению (3.13), т. е. Т (х*) = х* и Т (у*) = у*. Тогда d [Т (х*), T (ÿ*)] < kd (х*, ÿ*), поскольку Т — сжатие и, следо¬ вательно, d (х*, у*) < kd (х*, у*), что при любом k, 0 < k << 1 справед¬ ливо лишь в случае d (х*, у*) = 0. Следовательно, х* = у*. Докажем теперь, что существует элемент х*, удовлетворяющий уравнению (3.13). Пусть хх — любой элемент из X, х2 = Т (xj, х3 = = Т (х2) и вообще хп = T (хл_і), п --= 1, 2, ... (3.14) 66
Последовательность хп, п = 1, 2, ... сходится равномерно. Если 8 > 0, то существует N (г) такое, что если п N (е), то kn~'d(xi, х2) 11 < 8. (3.15) Предположим, что я, m > N (s) (положим, что т п), тогда d(xn, хт) = d[T (х^), Т (х^)] < kd [ T (xn_2), T (xm_£)] < < kn~Xd [Xx, T (xm_n_x)] < kn^ [d (xb x2) + (xi> хз) + • • • + (*1> xm-n)] < < kn~xd{xu x2) {1 + k + k2 H + km~n~x\ < <én~1d(x1, *2)|утту|<8 (3.16) [по неравенству (3.15)]. Другими словами, последовательность xn, п = = 1, 2, ... сходится равномерно и, следовательно, имеет пределом х* (так как X — полное множество). Мы убедились, что Т (х*) = х*. Рассмотрим последовательность Уп ~ Т (хп) = хп+1, п = 1, 2, . . . Ясно, что уп сходится к X*, и мы пока¬ жем, что уп сходится к Т (х*). Это и обоснует сформулированную нами теорему. Так как х* — предел последовательности {хп}, для 8 >> 0 суще¬ ствует N (8) такое, что если п^> N (е), то хп принадлежит к S (х*, 8), т. е. d (х*, хп) Следовательно, d [T (х*), Т (хп) ] = d [71 (х*), уп] < < kd (х*, хп) <8 и уп принадлежит к S (Т (х*), е) для всех п > N (е). Таким образом, мы показали, что уп сходится к Т (х*). Эту теорему мы используем в дальнейшем для доказательства теоремы существования решения дифференциальных уравнений. СВОЙСТВА МНОЖЕСТВ В Rn 3.6. КОМПАКТНОСТЬ В этом и следующем параграфах мы будем рассматривать исклю¬ чительно эвклидово пространство Rn с натуральным расстоянием d на Rn [см. уравнение (3.2)]. Определение З.ІЗ.Ограниченное множество. Предположим, что С есть подмножество из Rn. Будем говорить, что С ограничено, если» имеется конечное р > 0, при котором С заключено в сфере S (0, р) радиуса р с центром в начале координат. Определение 3.14. Компактность. Пусть С есть подмножество из Rn. Если множество С замкнуто и ограничено, то говорят, что С есть компакт¬ ное подмножество из Rn (или что С компактно). Например, замкнутый интервал [О, T], Т >• 0 есть компактное подмножество множества R = R±. Компактные множества обладают различными свойствами, которые можно использовать для определений компактности и которые часто «по¬ лезны при доказательствах теорем, связанных с компактными множе¬ ствами. Эти свойства могут быть записаны так: 1) С компактно, если С замкнуто и ограничено; 2) С компактно, если для любого заданного набора открытых мно¬ жеств Alt Л 2, . . ., таких, что Ce U Aif существует конечный набор /=і чисел П1, ZÎ2, . . ., Пы, при которых С CZ Апл U U • • • U Это утверждение часто называют свойством Гейне—Бореля; 1 Это утверждение часто формулируют следующим образом: множество является замкнутым, если найдется конечная система открытых множеств, которые целиком покры¬ вают это множество. В нашей литературе это утверждение именуется леммой о конечном покрытии. (Прим. ред.). 67
3) С компактно, если Вг, В2, . . . — любой набор закрытых множеств, (п \ / °° \ П В} J Ф Ф для каждого п, то С П | Г1 Æ/1 (это утвер- /=і / \ /=і / ждение часто называют свойством конечного числа пересечений); 4) С компактно, если для любой заданной последовательности хп, п — 1, 2, . . ., в С 1 Рис. 3.4. Замыкание с (4) и граница b (4) ограниченного откры¬ того множества 4 яв¬ ляются компактными подмножествами из R2 существует подпоследовательность хПі, хП2, . . ., кото¬ рая сходится к элементу из С (это утверждение иногда называют свойством Больциано—Вейершт- расса). Можно показать, что если подмножество С из Rn обладает хотя бы одним из этих свойств, то оно обладает и всеми остальными [51], [196]. Пример 3.15. Если х — элемент из Rn ир>0, то замк¬ нутая сфера S (х, р) компактна, а открытая сфера S (х, р)—нет. Действительно, если 4 есть ограниченное подмножество из Rn, то замыкание 4, с (А) [уравнение (3.9)] компактно и граница b (4) также компактна. Например, если 4 — подмножество из Т?2, определенное как 11, то с (4) = — 1 > — суть компактные подмножества из R2 (рис. 3.4). : 11 и 3.7. ГИПЕРПЛОСКОСТИ И КОНУСЫ Рассмотрим два специальных класса подмножеств эвклидова про¬ странства, чтобы подойти к изучению в следующем параграфе понятия выпуклости. Грубо говоря, гиперплоскость в Rn аналогична линии на плоскости /?2 и может рассматриваться как подпространство размерности (п — 1) пространства Rn. Более строго это можно сформулировать в виде: Определение 3.15. Гиперплоскость в Rn. Пусть L(x) — функция на Rni принимающая только вещественные значения и определяемая в виде (3.17) где а — заданный ненулевой элемент из Rn и b — заданное веществен¬ ное число. Тогда подмножество L из Rn, заданное как {п X : L (х) = 2 аіхі — b — О z=i (3.18) называют гиперплоскостью в Rn. Например, множество L из R3, имеющее вид : 1 •%! + 1 -х2 + 1 -х3— у 2 3J есть гиперплоскость в R3. 68
Примем, что În х: L(x) = ?£ alxi — fe > О (3.19) — b<ZO (3.20) L+ и L~ называют открытыми полупространствами, определенными L. Заметим, что L+ и L~ — суть открытые множества и что Rn = L+ J L U U L~. Иногда мы будем называть множества L+ U L и L J L замкну¬ тыми полупространствами, определенными L. Легко видеть, что L+ J L есть замыкание для В+, что L~ U L — замыкание для L~ и L есть граница как для В+, так и для В" (рис. 3.5). Если А и В — два любых подмножества из /?п, то говорят, что гиперплоскость L раз¬ деляет А и В, если А содержится целиком в одном закрытом полупространстве, опреде¬ ленном В, и В содержится целиком в другом закрытом полупространстве, определенном В, т. е. если A сВ+ J L и Bcz L- U L (3.21а) или Рис. 3.5. Гиперплоскость L и полупространства £+ и L’ A<=L~ (JL и BcL+\}L. (3.216) Если окажется, что А содержится целиком в одном открытом полу¬ пространстве, определенном В, а В — в другом, то говорят, что L строго разделяет А и В. Например, в 7?3 гиперплоскость хг — 1 = 0 разделяет множество S (0, 1) и и строго разделяет множества S (0, 1) и L~ = jx : L (x) Пусть L — гиперплоскость в Rn и А — подмножество из /?п. Оче¬ видно, что L или имеет общие элементы с замыканием А, т. е. L П с (А) =£ 0, или L не имеет общих элементов с замыканием с (Л), т. е. L П с И) = Ф- Если L имеет общие точки с замыканием с (Л), то должно удовлетво¬ ряться одно из трех условий: 1) L содержит Л или Л с В; 2) оба множества L+ f) Л и L~ П А не являются пустыми; 3) L не содержит Л, и Л содержится или в L+ U В, или в В“ U В; т. е. либо В+ f) Л, либо L~ Ç\ А является пустым. Если В удовлетворяет условию 2, говорят, что В пересекает Л; если удовлетворяется условие 3, то говорят, что В есть плоскость, опорная к Л. Пример 3.16. Пусть А —подмножество из /?3, определенное как Гиперплоскость х3 — 1 = 0 не имеет общих точек с замыканием А; гиперплоскость X — 0 содержит Л; гиперплоскость — х2 = 0 пересекает А и гиперплоскость хг + х2 + 69
+ х3 — К2 = 0 является опорной к А ^соприкасается с замыканием А в точке хх = > /2 \ х2 = ~2~ , хз = О I (рис. 3.6). Пример 3.17. Пусть А —подмножество S (0, 1) из /?2, т. е. А = + р Если L — прямая в Т?2 (иначе говоря, L — гиперплоскость в /?2), *1 х2 хгх2=О Рис. 3.6. Множества из при¬ мера 3.16 L=ri : IL^J то возможны три пересекает А и L Опорная пиния А ^2Л2 случая: a) L[\ А — ф\ б) L в) L является касательной L пересекаетА лх ѵѴѴ ѴЛ° о? Рис. 3.7. Три возможных варианта расположения прямой L относи¬ тельно области А к А, т. е. L П с (Л) состоит из одной точки на границе А (рис. 3.7). Прямые, удовлетворя¬ ющие условиям а) или в), являются прямыми, опорными к Д. Этот параграф мы завершим определениями отрезка, луча и конуса. Определение 3.16. Пусть х и у—два элемента из Rn. Отрезком прямой, соединяющим х и у, является подмножество из Rn, определяемое соотношением \zÇ.Rn:z = rx-\-sy, г О, s 5= 0, г + s — 1}, (3.22а) и лучом, соединяющим х с у и Р P P Р Рис. 3.9. Конусы с вершиной Р Рис. 3.8. Отрезок прямой, соединяю¬ щий точки X и у и два луча, опреде¬ ляемых этими точками исходящим из х, является подмножество, задаваемое соотношением {z(z Rn:z = х + г(у — х), г^О). (3.226) Заметим, что отрезок, соединяющий х и у, совпадает с отрезком, соединяющим у с х. Но луч, соединяющий х с у и исходящий изх,отли¬ чается от луча, соединяющего у с х и исходящего из у (рис. 3.8). 70
Определение 3.17. Конусы. Подмножество К из Rn называется кону¬ сом с вершиной х0, если для любой точки х в х^х0, все точки луча, соединяющего х0 с х и исходящего из х0, принадлежат /С. Различные примеры конусов иллюстрируются рис. 3.9. 3.8. ВЫПУКЛОСТЬ Обратимся к очень важному свойству, а именно, к выпуклости. Подмножество из Rn выпукло, если отрезок прямой, соединяющий две любые точки этого множества, принадлежит множеству. Более точное определение приведено ниже. Определение 3.18. Выпуклость. Подмножество А из Rn выпукло, если для любых хи j из Л иг^О, $^0из/?, г + s = 1, точка rx+sy принадлежит А. Например, открытая сфера S (0, р) из Rn выпукла, так как из И XИ <р, ІІУІІ <Р можно заключить, что || rx + sy|| < || гх|| + ||$у|| = = г II X II + s||y II < гр + sp = р, если г О, s 0 и г + s = 1. Пример 3.18. В пространстве 7?3 множество выпукло; множество Рис. 3.10. Множество А не является выпук¬ лым. Выпуклая обо¬ лочка А представляет собой треугольник (плоскость) также выпукло. Любой отрезок прямой или луч выпуклы. Пример 3.19. Множество точек А из заданное в виде Л = 0, х2^ 0, (%і/3 + %2/3)3/2 не является l|_V2 J J выпуклым (рис. 3.10). Множество точек R на Т?2, заданное в виде /< = Л 1 : один из 11*2 J = 0 или х2 = 0І , не является выпуклым, хотя и представляет собой конус с вер- Г0 шиной L0 Пример 3.20. Если а и b — элементы из /?, причем а<^Ь, то интервалы (a, ô], (а, Ь), [а, Ь) и [a, ô] выпуклы. Упражнение 3. 8. Докажите, что закрытая сфера S (0, р) в Rn выпукла. Упражнение 3.9. Докажите, что интервалы [0, 2] и [4, 5] выпуклы, а [0, 2] (J (J [4,5] — нет. Определение 3.19. Выпуклый конус. Конус К в Rn, если он является выпуклым множеством, часто называют выпуклым конусом. Заметим, что не каждый конус является выпуклым (см. пример 3.19). Выпуклые конусы будут рассматриваться в гл. 5 и 6. Определение 3.20. Выпуклая комбинация. Предположим, что хь х2, . . ., xN — N элементов эвклидова пространства Rn. Будем говорить, что X есть выпуклая комбинация элементов хь X2, . . xNi если сущест¬ вуют вещественные числа гх, г2, . . ., rN, такие, что N X = 2 і=1 N Z = 1,2. ..., N и = z=i (3.23) 71
Если А —выпуклое подмножество из Rn и хъ лг2, . . xN— эле¬ менты?!, то любая выпуклая комбинация из xt принадлежит к А. Так как А выпукло, то это утверждение справедливо согласно определению для случая N = 2. С помощью индукции распространим его на N элементов. Полагая, что это утверждение справедливо для N — 1, предположим, у что X 2 есть выпуклая комбинация xt. Можно считать, что 1, /=і в этом случае G + г2 ) +^_! - 1 — rN ф О, следовательно, рѴ-1 лг — (/*1 ^*2 * * * ~Ь ? дл-і) I і —I х і Ѵ 1 21 N 17 Zj Г1 + r2 F F 'W-i 1 V 4=1 + r NXN- (3.24) (3.25) Но выражение в скобках (3.25) представляет собой элемент А согласно допущению, сделанному по индукции; поэтому из-за выпуклости А х принадлежит А. Определение 3.21. Выпуклая оболочка. Пусть В — любое подмно¬ жество из Rn и со(В) обозначает множество всех выпуклых комбинаций элементов из В, т. е. со(В) = {х: существуют элементы хъ х2, . . xNr в В, такие, что х есть выпуклая комбинация xz}; ‘ (3.26) со(В) называется выпуклой оболочкой В. Заметим, что множество В выпукло в том случае, если оно совпадает со своей наименьшей выпуклой оболочкой, т. е. В = со(В). Действительно, выпуклая оболочка есть наименьшее выпуклое множество, содержащее В. Упражнение 3.10. Покажите, что множество со(В) выпукло. Указание: предпо¬ ложите сперва, что V ЛГ ЛГ—1 X = 2 и У 2 SiXi принадлежат со(В) и rx + sy = (г/7 + ssj Хі + 4 = 1 4 = 1 4=1 Затем надо показать, что если N м х^2 ГіХі\ У 2 sfli И Z1 XV • • •’ ZN~ XN’ ZM+1 = 4=1 / = 1 ' ’ ’ ZN+M ’ " Ум ’ T0 N N-\-M Л’ X -■2r^’+ 2 Ог'; y 2O-Z/+ 2 w+л t^i A’ -pi 4=1 /Ѵ-4-1 Пример 3.21. Предположим, что В есть множество из при¬ мера 3.19, а именно: Рис. 3.11. Выпуклая оболочка области В есть сама область В и треугольник В = {(хЛ) : х^О, х2^0, (х2/3 + ^3)3/2< Н- В этом случае выпуклая оболочка определяется как со(В) = {(хі%2) : хі ^0, x2z>0, Хі4-х2<1} (см. рис. 3.10). Пример 3.22. Пусть В — Вг J В2, где Вх — {(хр х,2) : Xj Ь хі =^0} и В2 - {(*1*2) ' хі +Х2=С 1, х2 =С0}, иначе говоря, состоит из трех квадрантов окружности единичного радиуса, как показано на рис. 3.11. Тогда выпуклая оболочка В, со(В) будет иметь вид со(В) — В U {(ххх2) : Хі > 0, х2 > 0, хх4-х2^1}. УѴ может зависеть и от х. 72
Сформулируем и докажем несколько важных теорем относительно выпуклых множеств в Rn. Теорема 3.3. Если А — выпуклое подмножество из Rn, то замыка¬ ние А, с (А) [уравнение (3.9)] также выпукло. Доказательство. Предположим, что х, у, — элементы с (Л), а г, s — элементы из г>0 и s>0 и r + s = 1. Покажем, что rx + sy при¬ надлежит к с (Л), т. е. найдем последовательность элементов {ztl\ из Л, которая сходится к rx+sy. Поскольку х и у принадлежат с (Л), суще¬ ствуют последовательности хп и уп элементов из Л, такие, что хп сходится к X и уп сходится к у. Выберем zn = rxn + syn. Прежде всего zn принад¬ лежит Л, так как Л выпукло. Покажем теперь, что zn сходится к rx + sy. Если 8 > 0, то существует М (е) такое, что если п > М (е), то || хп —х||<< <8 и II Уп — УII Следовательно, для всех п >» 7И (е) имеем II гхп syn — (rx + sy ) || - Il r (Xn — X) + s (yn — y) Il < r\\xn — x|| + sb„ — y||<8- (3.27) Отсюда видно, что последовательность zn сходится к rx + sy. Это и доказывает теорему. Теорема 3.4. Если Л — выпуклое подмножество из 7?п, то і (Л) [внутренняя часть Л, уравнение (3.8)] является либо выпуклым, либо пустым множеством. Действительно, если Л выпукло и і (Л) не «пусто», справедливо следующее утвержде¬ ние. Если даны две точки X и у в Л, при¬ чем у принадлежит /(Л), то любая точка отрезка прямой между X и у (за исключе¬ нием, возможно, лишь самой точки х) есть внутренняя точка Л (см. рис. 3.12). Доказательство. Рис. 3.13. К доказательству теоремы 3.4 Рис. 3.12. Любая точка отрезка, соединяющего X и у, за исключением, возможно, ТОЧКИ X, является внутренней точкой выпуклого мно¬ жества А Так как у есть внут¬ ренняя точка Л, то имеется р >> 0, такое, при котором 3 (у, р) с Л. Пусть z — точка на отрезке прямой, соединяющей лг и у, отличная от X. Тогда Z = ГХ + sy, (3.28) Покажем, что открытая сфера S (z, sp) содержится в Л, следовательно, Z есть внутренняя точка Л (см. рис. 3.13). Если W£S(z, sp), тогда ||w — г II -- U w — (rx H- sy)|| < sp, (3.29) что означает ||-7-(w — rx) — sy J = s !-1-(w — rx) — y||<sp. (3.30) Иначе говоря, | J_ (î€, _ rx) _ y | < (3.31) откуда видно, что -y- (w — rx) принадлежит S (y, p). Так как S (y, p) содержится в A и A выпукло, w = s (w — rx) + rx есть элемент A. Таким образом, S (z, sp) a: A. Теорема доказана. 73
Следующая теорема, доказательство которой мы опустим (см. [59]), будет применяться в гл. 5. Сформулируем теорему. Теорема 3.5. а) Если А и В — открытые выпуклые подмножества из не имеющие общих точек, то существует гиперплоскость L, разде¬ ляющая А и В. б) Если А — выпуклое подмножество из Rn и х — элемент границы Л, то существует по крайней мере одна плоскость, опорная к Л и содержа¬ щая точку X. в) Если А — замкнутое множество из внутренняя часть кото¬ рого і (Л) не является «пустым» множеством, и для каждого элемента х границы Л существует опорная плоскость, то Л выпукло. Пункт а) теоремы иллюстрируется рис. 3.14, а и б. Отметим, что на рис. 3.14, а гиперплоскость L строго разделяет Л и В, но для случая, Рис. 3.14. а) L строго разделяет А и В; б) L разделяет А и В. Прямой, строго разделяющей А и В, не суще¬ ствует. Рис. 3.15. Опорные гипер¬ плоскости Li и L2, прохо¬ дящие через граничные точки выпуклого множе¬ ства А показанного на рис. 3.14, б, не существует гиперплоскости, строго разде¬ ляющей А и В. Пункт б) теоремы иллюстрируется рис. 3.15. Его можно сформулировать иначе следующим образом: «Если х есть точка границы выпуклого множества Л, то существует гиперплоскость L, проходящая через X, такая, что Л содержится целиком либо в L+ (J L, либо в L~ J L. Последнее утверждение мы будем использовать в гл. 5. Пункт в) теоремы дает косвенный способ определения, является ли закрытое множество выпуклым. Наконец, рассмотрим более подробно точки границы выпуклого мно¬ жества и опорные плоскости. Можно сформулировать следующие поло¬ жения: 1. Точка X границы выпуклого множества Л из Rn является регуляр¬ ной точкой, если она является элементом единственной гиперплоскости, опорной к Л. 2. Опорная гиперплоскость L выпуклого множества Л есть регуляр¬ ная опорная гиперплоскость Л, если она имеет с Л единственную общую точку. 3. Выпуклое множество Л называется регулярным выпуклым множе¬ ством, если каждая точка его границы является регулярной точкой и если каждая опорная к Л гиперплоскость является регулярной опорной к Л гиперплоскостью. Сфера S (0, р) есть образец регулярного выпуклого множества. Термин «регулярный» по отношению к множеству, грубо говоря, озна¬ чает, что множество не имеет «углов». Множество Л ! на рис. 3.16 регулярно, множество Л 2 имеет две нерегулярные точки (или «угла»), но каждая гиперплоскость, опорная к Л2, регулярна. Множество Л3 имеет и нерегу- 74
Q Рис. 3.16. Аі — регулярное выпуклое мно¬ жество. Р и Q—нерегулярные точки («углы») выпуклого множества А2- М и N — нерегу¬ лярные точки выпуклого множества А3. L — нерегулярная опорная гиперплоскость множества А3 могут обладать. Мы надеемся, что математики со многими понятиями, лярные точки, и нерегулярную опорную гиперплоскость. Отметим, что выпуклые множества типа {(хх, х2) : *2 = 0, —1 < хг < 1} или типа единичного куба в R3 также являются нерегулярными выпуклыми мно¬ жествами. И, наконец, отметим, что не¬ возможно определить единствен¬ ную нормаль к выпуклому мно¬ жеству в нерегулярной точке (или в «угле») множества. ВЕКТОРНЫЕ ФУНКЦИИ 3.9. ВВОДНЫЕ ЗАМЕЧАНИЯ Переходим к изучению век¬ торных функций, т. е. таких функций, которые принимают раз¬ личные значения, соответствующие точкам векторного пространства, и сформулируем ряд важных свойств, которыми такие функции читатель уже встречался в курсах которые рассматриваются ниже. Поэтому изложение известных вопросов будет весьма кратким. Однако понятия, которые представляют для нас особый интерес, излагаются более строго, чем это свойственно основным курсам математики. Мы рассмотрим понятия непрерывности, производ¬ ной и интеграла от функции, функциональные пространства и функцио¬ налы х. Мы часто будем начинать обсуждение с рассмотрения знакомого слу¬ чая функции, преобразующей 7? в /?, т. е. вещественной функции одной переменной. Далее мы будем переходить к обсуждению функций (преоб¬ разования) R в Rn (векторных функций одной переменной) и, наконец, рассматривать функции от Rm в пространстве Rn [векторные функции нескольких (вещественных) переменных. ] Обычно мы будем вводить такие понятия, как непрерывность функции одной переменной только по отношению к R, а не к интервалу из R [см. уравнение (3.1)]. Если читатель примет интервал за область существования функции (см. § 2.4) в определении, то он легко получит соответствующую форму¬ лировку понятия и будет в состоянии интерпретировать теоремы для этого случая. Напомним, что если х есть элемент из Rn, (3 .32) 1 См. [51 ], [192] и [196]. Эта литература особенно интересна с точки зрения углубле¬ ния приведенных понятий. 75
то х2, . . ., хп называются компонентами х. Если/— функция из/? в /?п, то для t из R имеем Л (О (3.33) где /і, /2, • • •> fn — вещественные функции, которые называются компо- Г t нентами /. вид (3.33), Например, функция /(/) из /? в /?3, /(f) = е z имеет L cos / гДе fi (t) = t, f % (О = е~\ /з (0 = cos Для обозначения векторных функций мы будем использовать жирные прописные буквы латинского алфавита. Аналогично, если g есть функция из Rtn в /?Л и и — элемент из /?ш, то gt (а) &(») g (и) = (3.34) ёп (»)_ где — действительные функции от « £ Rm, называемые компонентами Например, если g есть функция из R2 в R3, au — g- из — элемент /?2, то типичная функция g из /?2 в /?3 может иметь вид z/l 3^2 g(«) = log их + e~U2 sin U\ + где gx (и) = + 3u2, g2 (и) = log иѵ + и g3 («) - sin + и]. Рассматривая уравнения (3.33) и (3.34), видим, что существует тесная связь между векторными функциями и функциями, принимающими только вещественные значения. Эту связь мы часто будем использовать в дальнейшем. Если обозначить через J (7?ш, /?п) совокупность всех функций из /?т в Rtl, т. е. ÎV (Rtn, Rn) = {/ :/ есть функция из Rni в /?„}, (3.35) и определить понятия суммы и произведения (на элемент из 7?) для эле¬ ментов J (7?т, /?п), полагая [/+51 («) = /(») + £(«) — сумма (3.36) [г/] (а) = rf(u) — произведение (3.37) Для /, g из 5 (Rm, Rn), и из Rm и г из /?, то J (7?m, R^ становится вектор¬ ным пространством по отношению к этим понятиям суммы и произведения (см. § 2.5). Эти понятия суммы и произведения мы будем часто исполь¬ зовать ниже. 76
3.10. НЕПРЕРЫВНОСТЬ В § 2.7 мы обнаружили, что если математик дал определение понятия, то он пытается установить, какой вид преобразований это понятие «со¬ храняет». Мы дали определение предельной точки в § 3.3, и теперь мы рас¬ смотрим преобразования, сохраняющие это понятие. Для начала введем понятие предельной точки преобразования. Определение 3.22. Если Xt и Х2 — множества с функциями расстоя¬ ния d1 и d2 соответственно, f — преобразование из Х± в Х2, область существования которого все множество и х0 — элемент из то будем называть элемент у из Х2 предельной точкой f при х0, если для любой последовательности хп, п = 1,2 элементов из Хъ сходящейся к х0 (хп ¥= =£= х0 для любого /г), соответствующая последовательность f (xrt), п = 1, 2, . . ., сходится к у. В этом случае #=1іт/(х). (3.38) х-»х0 Заметим, что преобразование может и не иметь предельной точки при данном х0, но если оно имеет таковую, то она единственна. Отметим также, что у — lim f (х) вовсе не означает, что у = f (х0). х->х0 Определение 3.23. Непрерывность. Пусть Х1 и Х2 — множества с функ¬ циями расстояния dr и d2 соответственно, f — преобразование ХА в Х2, областью существования которого являются все Хъ и х0 — точка в Хг. Говорят, что f непрерывна в точке х0, если f (х0) есть предельная точка f при х0, т. е. / (х0) = 1 ігп / (х). (3.39) х-> х0 Если f непрерывна в любой точке х0, то говорят, что f есть непрерыв¬ ное преобразование (или функция) или просто, что f непрерывна. Непрерывность f означает, что если х0 есть предел последовательно¬ сти X., п = 1, 2, . . ., то f (х0) является пределом последовательности =1,2,... Читатель хорошо знаком с так называемым 8, ô определением непре¬ рывности вещественных функций одной переменной. Покажем, как оно связано с определением (3.23). Понятие предельной точки преобразо¬ вания мы будем связывать со сферами в множествах Хг и Х2. Следующая теорема устанавливает искомую зависимость. Теорема 3.6. Точка у является предельной точкой преобразования f при х0 тогда и только тогда, когда для каждого е>0 существует ô>>0, такое, что /[S(x0, ô)]c=S(t/, е) U (f(x0)} (3.40) или что эквивалентно, если 0 <dx (х, х0) <0 соответствует d2 (/(х), у) <е. (3.41) В частности, если f есть функция из 7? в /?, то у есть предельная точка f при х0 тогда и только тогда, когда для каждого 8 > 0 существует Ô > 0, такое, что 0 < | х — х01 < Ô соответствует |/(х) —у\ (3.42) В более общем случае, если f преобразует Rm в 7?п, то у есть пре¬ дельная точка f при х0, в том случае, когда для любого 8>0 существует Ô > 0, которое может зависеть от 8, такое, что 0<[;х — х0||<0 соответствует ]\f (л) — у'|<8, (3.43) 77
где знак || || обозначает эвклидову норму на Rn. Наконец, из уравне¬ ния (3.40) следует, что f непрерывна при х0, тогда и только тогда, когда для любого 8 > 0 существует ô > 0, такое, что /[S(x0, ô)]cS(/(xo),8). (3.44) Последнее утверждение иллюстрируется рис. 3.17 для случая пре¬ образования R2 в себя. Доказательство. Из определения предельной точки видно, что если f удовлетворяет условию (3.40), то у — предельная точка /при xQ. С другой стороны, если у — предельная точка / при xQ и задано 8 > 0, то мы ут¬ верждаем, что существует ô > 0, такое, что / [S (х0, ô)] с S (у, е) U U {/ (Хо)І- Если это не так, то для п = 1, 2, . . . в Х± найдется хп =/= х0, такое, что d± (хПі xQ) < — и d2 (f (xn), y) 8. Но это означало бы, что Рис. 3.17. е, Ô — свойство непрерывности хп сходится к X в то время, как / (х„) не сходится к у. Это противоречит тому, что у является предельной точкой / при х0- Таким образом, наше утверждение доказано, а вместе с ним доказана и теорема 3.6. Эта теорема имеет прямое следствие: функция / непрерывна тогда и только тогда, когда обратное отображение [см. уравнение (2.15)] каждого открытого подмножества из Х2 есть открытое подмножество в X, т. е. /-1 (Л) открыто в Хъ если А открыто вХ2. В силу теоремы 3.1 можно обнаружить, что / непрерывна тогда и только тогда, когда обратное изображение любого замкнутого подмножества из X есть замкнутое подмножество в т. е. f'1 (В) замкнуто в Xlt если В замкнуто в Х2. Если g есть функция преобразования из Rm в Rnt из уравнения (3.44) легко заключить, что g непрерывна тогда и только тогда, когда каждая из ее компонент glf g2, . . ., gn есть непрерывная функция преобразо¬ вания Rm в R [см. уравнение 3.34)]. Действительно, заметим, что если и и V — элементы Rmi то для і — 1, 2, . . ., п п І£(«) — ^(^)1<И(«)— 2|&(») —£(<0Ь (3.45)1 і=\ откуда следует справедливость сделанного выше утверждения. Далее, легко видеть, что если g и h — непрерывные функции пре¬ образования Rm в Rn, то сумма g и A, g + h [см. уравнение (3.36)] и произведение g на элемент г из R [см. уравнение (3.37) ] также являются непрерывными функциями преобразования из Rm в Rn. Иначе говоря, множество iff :ff — непрерывная функция преобразования Rm в Rn} (3.46) есть векторное пространство, которое является подпространством множе¬ ства всех функций преобразования Rm в Rn, fi (Rmi Rn) [см. уравне¬ ние (3.35)]. О пространствах такого типа будет сказано несколько под¬ 1 См. уравнение (3.6г). 78
робнее в § 3.15. Наконец, отметим, что если g — непрерывная функция преобразования Rm в Rn и h — непрерывная функция преобразования Rn в Rp, то сложная функция hog [см. уравнение (2.16)] есть непрерыв¬ ная функция преобразования Rm в Rp. Пример 3.23. Пусть fn — преобразование R в себя, заданное соотношением fn (х) — хп для п — 0, 1, 2, .... Преобразование fn непрерывно, и, следовательно, любая полино¬ миальная функция непрерывна. Преобразование R в себя, заданное как U (х) — 0, при x^z О и U (х) = 1 при х> О, не является непрерывным при х= 0, но оно непрерывно во всех точках х ф 0. Пример 3.24. Пусть ЭД, — линейное преобразование Rm в Rn с матрицей преобразо¬ вания А = (aij) по отношению к нормальным базисам в Rm и Rn (см. § 2.6). Преобра¬ зование ЭД непрерывно. Для доказательства непрерывности отметим, что если являются элементами из Rfn, то ЭД (я) — ЭД (w) = ЭД (ѵ — w) и (ЭД (ѵ — w), ЭД (ѵ — w)) “ m 2 аИ (ГІ — S!) 7=1 m 2 а27 (Г7 — s/) 7=1 т 2 ani (ri—si) —7=1 m 2 a«7 (r7 ~ sl) —7=1 ~ tn 2 “V (r7 — S7') 7=1 tn 2 a27 (r7 — S/) 7=1 Отсюда используя уравнение (2.32), имеем п ( m \2 <21 (V _ W), sy, (® — w)) = 215 an (ri — Sà ï 7=1 l/=l ) и, следовательно, преобразование ЭД непрерывно. Пример 3.25. Пусть f — функция преобразования R в себя, заданная как f (х) = | х [ (см. рис. 3.18). f непрерывна. Вообще, функция преобразования Rm в R, заданная как f (х) — ||х||, для х из Rm есть непрерывная функция. Г і Пример 3.26. Если х = есть элемент Rm и мы зададим функцию преобразова¬ ния Rm в R как \_Хт J f(x)= max {|Х7І) Z=l, 2, .... m (f (x) равна наибольшей из абсолютных величин компонент х), то f непрерывна, так как / tn \ 1 |xz |< I 2 х/ / = Ï» 2, - - т. ' /=1 / Пример 3.27. Если х — 1 См. уравнение (2.91). — элемент Rm и заданы функции Ф/, і = 1, 2, . . ., tn 79
о| (рис. 3.19), то А является замкну- преобразования Rm в R как Фг- (х) — Xj> то функции ф/ будут непрерывны. В частности, если рассматривать R2 и Фх j j = х1? то Фх непрерывна. Если А есть подмножество Хі 1 1 х2 J Xj тым в R2, но Фх (Л) не является замкнутым в R. Рассмотрите в свете этого примера заме¬ чания, следующие за теоремой 3.6. из R2, заданное как А — Рис. 3.18. Непрерывная функция f (х) I X I Рис. 3.19. Множество А зам¬ кнуто, но его проекция на ось хх не является замкну¬ тым множеством Упражнение 3.11. Покажите, что если g и h — непрерывные функции преобразова¬ ния Rm в Rn, то g + h является также непрерывной функцией преобразования Rm в Rn. У Казани е: если и и ѵ принадлежат Rm, то Il (g + h) («) — (g + h) (v) Il Il g (a) — g (v) i| + И h (u) — h (z>) 4. Предположим теперь, что f — непрерывная функция преобразова¬ ния Rm в Rnn С — компактное подмножество из Rm (см. определение 3.14). Ниже мы покажем (см. теорему 3.7), что f (С) [см. уравнение (2.14)] есть компактное подмножество из Rn. Важным частным следствием этого положения является то, что вещественная непрерывная функция дости¬ гает максимального и минимального значений, если область ее существо¬ вания ограничена компактным множеством. Теорема 3.7. Если f есть непрерывное преобразование Rnl в Rtlu С — компактное подмножество из Rm, то f (С) есть компактное подмножество ИЗ Rn. Доказательство: Для того чтобы доказать компактность f (С), мы воспользуемся свойством 4) из § 3.6 г. Предположим, что уп, п = 1 2, . . . есть последовательность элементов f (С); тогда существуют эле¬ менты хПУ п 1, 2, ... из С такие, что f (хп) = уПУ п == 1, 2, . . . Так как С компактно, то существует подпоследовательность хП1, хП2, • • . последо¬ вательности {хп}у имеющая х своим пределом в С. Однако из непрерыв¬ ности f следует, что уПі = f(xn), Уп2=/(хП2), . . • сходится к f (х), который является элементом f (С). Иначе говоря, уПі, Уп2, ... и есть иско¬ мая сходящаяся подпоследовательность последовательности (уД. 3.11. КУСОЧНАЯ НЕПРЕРЫВНОСТЬ В предыдущем параграфе мы рассмотрели понятие непрерывности в точке. Посмотрим, что происходит в точке, где преобразование не яв¬ ляется непрерывным. В этой точке функция разрывна. Для начала рас¬ смотрим два примера. Пример 3.28. Пусть f — преобразование R в себя, заданное как f (х) = —1, для х<с 0 и f (х)і — 1 для х> 0 (рис. 3.20). Функция f (х) не является непрерывной при х = 0. 1 Свойство (4) устанавливает, что множество К компактно, если для заданной после¬ довательности хл, п— 1, 2, ... элементов из К существует подпоследовательность хп , х , . . . элементов {хл}, которая сходится к элементу из К- 80
Если хп, п = 1,2, ... есть последовательность, сходящаяся к 0 при хп^2 О для каждого п или хп^> 0 для каждого п, то предел последовательности f (хп), п = 1,2, ... существует. Действительно, при хп 0 для всех п имеем lim f (хп) — —1; при хп > 0 для всех п имеем П-> оо Нт f (хп) = 1. П-> 00 Пример 3.29. Пусть g — функция преобразования R в себя, заданная как g (х) — —1, если х — иррациональ¬ ное число, и g (х) — 1, если х — рациональное число. Функция g не является непрерывной ни при каком х, в том числе и при X — 0. Имеются последовательности хп, п = = 1,2,. . сходящиеся к 0, скажем, хп^> 0 для любого п, для которых пределом является lim g (хп) = —1, либо limg(xn) = 1, для которых последовательность g (хп), п- 1, 2, ... не имеет предела. По существу, функция f примера 3.28 гораздо «ближе» к непрерывной при 0, чем функция g примера 3.29. Мы попытаемся разъяс- /М Рис. 3.20. Функция f (х) в точке X — 0 не является не¬ прерывной (имеет разрыв) нить это положение в последующей части настоящего параграфа. Пусть теперь f — преобразование R в множество X с d в качестве расстояния на X. Определение 3.24. Пределы справа и слева. Если t — элемент /?, то будем говорить, что f имеет предел справа при t (или имеет предел сверху при /), если в X существует такой элемент х, что для любой задан¬ ной последовательности tn, п = 1, 2, . . ., которая сходится к t (причем tn > t для любого /г), lim f (tn) = х, т. е. х есть предел последователь- П-> 00 ности Часто это записывают так: X — f(t+) или lim / (Z) = х. t-*t+ (3.47) Аналогично будем говорить, что f имеет предел слева при t (или имеет предел снизу при /), если имеется элемент у в X такой, что для любой заданной последовательности tn, п = 1, 2, . . ., сходящейся к t (причем tn < t для любого п) lim / (Q = у, т. е. у есть предел последователь- П> оо ности \f (/„)}. Можно это записать в виде 1 flOi-o" t Рис. 3.21. Пределы функции f (t) слева и справа в точке t = 0 одинаковы, однако в этой точке имеет место раз¬ рыв функции или lim/(Z) = ÿ. (3.48) t-»t~ Например, функция / в примере 3.28 имеет при 0 пределом справа 1 и пределом слева — 1. Отметим, что если даже х = f (/+) и у = f (Г) су¬ ществуют и равны, функция /, тем не менее, мо¬ жет иметь разрыв при /. Этот случай показан на рис. 3.21, который иллюстрирует пример 3.30. Пример 3.30. Пусть f — преобразование R в себя, определенное как f (/) = 1, если t #= 0 и f (0) = 0. Тогда lim f (t) = 1 = lim f (Z), но f не является непрерывным f->o+ f->0" при 0 (рис. 3.21). Определение 3.25. Кусочная непрерывность. Если f — преобразова¬ ние R в множество X с расстоянием d на X, будем говорить, что f имеет простой разрыв (или скачок) при /, если (1) f претерпевает разрыв при t и (2) f имеет при t пределы как справа, так и слева, т. е. f (/+) и f (Г) оба существуют. Если множество точек разрыва S) (/) = )/: t есть раз¬ рыв /, т. е. f не непрерывна при t] есть счетное множество 1 [т. е. если эле¬ менты © (/) могут быть пронумерованы в некоторой последовательности tn, 1 См. § 2.2. 81
п = 1, 2, . . . (которая может быть конечной)] и состоит только из простых разрывов, то будем называть f кусочно-непрерывной (или регулярной) 1 функцией. Иными словами, f кусочно-непрерывна, если имеется счетное количество точек разрыва и в каждой из этих точек f имеет оба предела (справа и слева). Пример 3.31. Пусть f — функция преобразования R в себя, заданная как f (f) = О, если t < 0, f (/) = 1, если 0^ 1, f (/) = —1, если 1 <J t 2, и f (t) == 0, если /> 2. Функция f (t) кусочно-непрерывна и представляет собой функцию, называемую ступенча¬ той, или кусочно-постоянной. Существует конечная последовательность tlt t2, t3 (/х = 0, t2 = 1 и /3 = 2), такая, что f постоянна на интервалах (/х, /2), (/2, /3), а также на множествах (t : t <2 tr] и {t : t^> /3} / n (рис. 3.22). О ступенчатой функции мы будем подробнее гово- I рить в § 3.15. I Отметим, что любая непрерывная функция 0 / £ і является и кусочно непрерывной и что f есть кусоч- 1 но-непрерывная функция преобразования R в Rn _ 1 в том и только в том случае, когда компоненты /, /2, . . fn (см. уравнение (3.33)] кусочно-непре- Рис. 3.22. Кусочно- рывны. Далее, если мы определим понятия суммы постоянная функция и произведения (на элемент из R) для кусочно¬ непрерывных функций аналогично (3.36) и (3.37), то можно обнаружить, что множество всех кусочно-непрерывных функций преобразования R в Rn образует векторное пространство, которое является подпространством J (/?, Rn). Отметим, наконец, что сложная функция, составленная из кусочно-непрерывных функций, не обяза¬ тельно является кусочно-непрерывной. Однако если f — непрерывная функция, преобразующая Rn в R, и g — кусочно-непрерывная функ¬ ция, преобразующая R в Rn, то fog есть кусочно-непрерывная функция, преобразующая 2 R в R. Пример 3.32. Пусть / — закрытый интервал с концами 0 и 1, т. е. / =[0, 1] [см. вто¬ рое уравнение из 3.7)], и f — функция, преобразующая I в Rn с компонентами fv f2, . . ., . . ., fn. Мы говорим, что f кусочно-непрерывна на / [сравнить с замечаниями в конце § 3.9], если точки /, в которых / терпит разрыв, являются простыми разрывами / и если они счетные. Например, функция, преобразующая / в /?2, заданная как f (t) = [ g J, для t Гп 1 \ x-z.x Г 01 . Г 1 1 \ г—И < Г1 il в Р’ ~ )’ _1 для в "4"» т ) Н' = о] для * в Т ’ КУСОЧНО’ непрерывна. Легко видеть, что множество всех кусочно-непрерывных функций, преобразую¬ щих I в Rn с суммой и произведением, определенными по выражениям (3.36) и (3.37), образует векторное пространство. 3.12. ПРОИЗВОДНЫЕ В этом параграфе мы рассмотрим исключительно важное понятие производной от функции. Производная функции представляет собой «местную» аппроксимацию с помощью линейной функции. Производную можно понимать как меру скорости изменения функции. Попытаемся уточнить это положение. Предположим сначала, что f — функция, преобразующая R в себя, и /0 — некоторый элемент из R. Если / «близко» к /0, то можно попытаться аппроксимировать / (/) функцией fa (t) следующего вида: Ж) + ^-'о) = № (3.49) 1 См. подробнее в работе [51 ]. 2 Имеем Ііш g (/) = V, откуда следует, что t->t+ lim f [^ (f)] = f (îO- t~>t+ Последнее замечание будет нами использовано в § 3.15. 82
где 21 — линейное преобразование 7? в себя. Выражение (3.49) можно записать в виде ^(/) = /(/о) + а(/-/о), (3.50) где а — элемент из R Ч Нетрудно видеть, что fa (/) представляет собой прямую, проходящую через f (to) (рис. 3.23). Нам хотелось бы выбрать а таким образом, чтобы I fa /f\ f /f\ I fa (t) была касательна к f (f) в t0, т. e. чтобы предел , /—, при t-+tQ был равен 0. Иначе говоря, мы хотим выбрать а так, чтобы HmI — а| = 0. (3.51) Если имеется такое а в /?, при котором удовлетворяется уравне¬ ние (3.51), то говорят, что f (t) дифференцируема при t = а а есть про¬ изводная f при tQ. Тогда можно записать а =-g-|/o = Df(/o) = /(/). (3.52) Будем называть функцию f дифференци¬ руемой, если f имеет производную при каждом /0 из R и обозначать через или Df(t), или f (t) (3.53) такое преобразование R в себя, значение которого при t есть производная f в точке t. Эту функцию будем называть производной функции /. Можно показать, что если f имеет Рис. 3.23. Аппроксимирую¬ щая функция fû (t) производную, то f непрерывна. Далее, если f дифференцируема и а, b Ç /?, причем а <^Ь, то существует Ѳ в интервале (а, 6) такое, что f(b) -f(a) = НѲ)(Ь-а) = -g- |Ç (b - a). Последнее соотношение часто называют теоремой о конечном прира¬ щении (теоремой Лагранжа). Если / есть дифференцируемая функция преобразования R в себя, то можно рассматривать функцию f (t) = задаваясь вопросом, имеет ли эта функция производную в данной точке /0 из R- Если f (/) имеет произ¬ водную при /о, то говорят, что f (t) дважды дифференцируема в t0 или что f (/) имеет вторую производную в t0. Последнее можно записать в виде dCfV)) I _ d2f \ dt k ” f dt2\to' Повторяя эти действия, можно получить производные более высоких порядков и написать для них общую формулу d”(f(t)) I _ f(nUt X J_ Гdn~yf(t) dt |f, ' dt dtn-l Определим понятие производной от векторной функции преобразова¬ ния R в Rn. Пусть /0 — элемент из R и 21 —линейное преобразование R В Rn- 1 Отметим, что а есть матрица ЭД, (1 X 1 матрица) (см. § 2.8), тогда выражение (3.50) можно записать в виде fa (t) = f (/0) + («, t — t0), где { ) обозначает скалярное произ¬ ведение на R [см. уравнение (2.86)]. 83
Рассмотрим функции fa (t), заданные как /а(0 = Ж) + или эквивалентную ей (3.54) /а(0 = /(М + «('-6Д (3.55) где а есть вектор из 7?,,1. Как и в выражении (3.51), мы хотели бы вы¬ брать а таким образом, чтобы lin.'l/IO-ZW-aUo. t — to II (3.56) t->îo t*t0 Если в Rn имеется a, для которого уравнение (3.56) удовлетворяется, будем говорить, что f дифференцируема в /0 и что # есть производная f в tQ. Запишем это в виде а==П/(/0)=/(М; (3.57) f дифференцируема в /0 в том и только в том случае, если ее компоненты /1( /2 fn (см. § 3.9) дифференцируемы в /0; fAQ /2(^0) (3.58) Jn(M_ Будем называть f просто дифференцируемой, если f имеет производ¬ ную в каждой точке t0 из R, и записывать или Df(t), или /(/) (3.59) для обозначения функции преобразования /? в R,n, величина которой в точке t равна производной f в t. Эту функцию будем называть произ¬ водной от f и записывать f(t) = (3.60) Jn(0_ Если, далее, f и g дифференцируемы, то можно заметить, что сумма f + g и произведение r f (г Е R) также дифференцируемы, причем У =/(Ш(0 (3.61) (3.62) Из выражений (3.61) и (3.62) вытекает, что множество всех дифферен¬ цируемых функций, преобразующих R в Rn, образует векторное простран¬ ство, которое является подмножеством множества всех функций преоб¬ разования R в Rn, J (/?, R;l). Если g—дифференцируемая функция, 1 Здесь а — вектор-столбец из п элементов ЭД, (1), который является матрицей линей¬ ного преобразования ЭД [см. формулу (2.31)]. 84
преобразующая R в R, и f — дифференцируемая функция, преобразу¬ ющая R в Rn, то сложная функция fog дифференцируема и ^^ = 7[бИ-г(0-4|г1,Д. (3.63) Упражнение 3.12. Покажите, что функция, преобразующая R в Rn, дифференци¬ руема в ta в том и только в том случае, если все компоненты / дифференцируемы и ”/і (<о)" ft (^о) f(ta) = Указание: следует использовать уравнение (З.бв). Пример 3.33. Пусть I — закрытый интервал с концами 0 и 1, I ■= [0, 1] [см. урав¬ нение (3.7)] и f — функция, преобразующая I в Rn с компонентами fu f2, . . ., fn. Будем считать функцию f дифференцируемой на /, если для каждого t0 из I существует а в Rn (которое может зависеть от /0), такое, что І,т Il tç./ II f — г0 II это выражение означает, что любой последовательности tn, п — 1, 2, ... элементов из /, tn =/= іо ни ПРИ каком /г, которая сходится к /0, соответствует последовательность II /(<п) ~/(<о) II II tn-t0 II’ сходящаяся к 0. Легко заметить, что f дифференцируема на / тогда и только тогда, когда каждая компонента fi дифференцируема на I. Например, функция /, преобразующая / г» /дч Г sin л/1 ,, г / Г л cos nt "I в R2, заданная как f (t) = , дифференцируема на / и / == . . I cos л? I I — л; sin Jtr I Итак, мы рассмотрели функции одной (вещественной) переменной. Предположим теперь, что / есть функция, преобразующая R,n в R. В этом случае имеют смысл несколько различных определений производной. Во-первых, мы можем повторить процедуру, использованную для нахо¬ ждения производной функции одной переменной, во-вторых, рассма¬ тривать f как функцию от компонент вектора в Rtn и найти производные f по отношению к этим компонентам (т. е. частные производные); наконец, мы можем рассматривать поведение f вдоль заданного «направления» в Rm и получить производную от f по отношению к этому направлению. Уточним эти различные понятия производной. Если Uq — элемент из Rm и и «близко» к я0, можно попытаться ап¬ проксимировать f (и) с помощью функции fa (и) вида /(«о)-+ 51(а —йо)-Г(й), где 2( — линейное преобразование Rtn в R (т. е. ?( — элемент ства /?*, сопряженного к Rmj [см. упражнения 2.11 и 2.12]. Уравнение (3.64) можно записать в виде fa(«) = f(#o) + (а, и — (3.64) простран- (3.65)1 m-мерный где а — элемент из R,n. Опять-таки мы хотели бы выбрать вектор а таким образом, чтобы («) была касательной к /(«) в точке и0, 1 Здесь знак (,) обозначает скалярное произведение на Rm [см. уравнение (2.86)]. 85
т. e. таким образом, чтобы предел — при я, стремящемся к uQ. \\и — Uo II был равен 0. Иначе говоря, мы хотим получить lim I f W —/ («о) « — «о> I _ n u™ol l|« —«oil |j« —«oil | (3.66) Если существует а из Rm, для которого выполняется соотноше¬ ние (3.66), то говорят, что f дифференцируема в точке uQt и называют а градиентом (или производной /) в точке и0. В этом случае пишут а = v/(«o) = gradf(«0) =-ЦЦ . (3.67) '«О Функцию f называют дифференцируемой, если градиент существует в каждой точке и0 из Rm. Обозначают градиент следующим образом: (?/)(«) или grad /(и) или (3.68) Заметим, что grad f есть векторная функция; будем обозначать ее компоненты в виде (£>Л(«) или (3.69) т. е. ГФіЛ («) I (DJ)(«) ди • -(Dmf) (U)- Например, если /— функция преобразования R2 в /?, заданная как Z(R ]) = u*+sin^’ то df Г 2«! I df п df = И = %U1 TT2- = COS U2. du L cos u2 J dut 1 du2 2 Если / дифференцируема и u± и a2 — точки из Rm, то можно пока¬ зать, что существует точка а* на отрезке, соединяющем иг и и2 (см. опре¬ деление 3.16), такая, что 7(И1) —/(и2) = \-^(»*)> «1 —«2/; (3.70а) это соотношение, часто называемое теоремой о конечных приращениях, мы используем в § 3.18. Будем теперь рассматривать / как функцию компонент векторов в Rm. Если т S и^і \ І = 1 и = 1 еі — элементы натуральной базы в Rm [см. уравнения (2.27)]. 86
то можно написать (т \ S «л =/(«!> «2. •••> ««)• (3-71) і =1 / Пусть uQ — данный элемент из Rm с компонентами и01, и02, • • •> wom- Исследуем поведение /, если изменяется только одна из компонент и0, предположим первая. Рассмотрим функцию glt преобразующую R в себя, заданную как gi(u) = f(u,u02,...,u0m). (3.72) с àf Если g± имеет производную в точке и01, то говорят, что част¬ ная производная в точке uQ. Частную производную будем обозначать (7>і/) («о) или , т. е. 1 «о (^1)(«01) = W)(«o) = -^-1 . (3.73) IWo Отметим, что (DJ)(«0) = lim і{й’ ы°2’ /-(tZo1’ “ог’ u°m) ■. (3.74) W->Woi « — «01 Частные производные f по другим компонентам можно определить совершенно аналогично, т. е. считать, что f имеет частную производную по щ в точке а о, если существует такое, что ]jm |/(«оі> • • •> «o/-i> «> «oZ+i, •• «om) Z («01> • • •> «om) & I _ Q (g 75) В этом случае можно написать a/ = (D/)(«0) = -^7| . (3.76) UUl IWo Если / имеет частную производную по щ в каждой точке а0, то гово¬ рят, что / имеет частную производную по щ, и обозначают функцию пре¬ образования Rm в R, значение которой в точке а0 равно (£\/) (а0), как (Ц/)(«) или (3.77) Но мы уже использовали эти обозначения раньше для компонент градиента f [см. уравнение (3.70)]. Предоставим читателю самому убе¬ диться в обоснованности использования этих обозначений. Рассмотрим теперь понятие производной функции /, преобразующей Rm в /?, вдоль заданного «направления» в Rm. Предположим, что а0 — элемент Rm и е — заданный единичный вектор в Rm, т. е. (е, е) = 1. (3.78) Будем считать единичный вектор е направлением и говорить, что f имеет производную по направлению е в точке а0, если функция ge, преоб¬ разующая R в себя, определенная как ge(t) te), (3.79) 87
имеет производную при t = 0. Производную от ge при 0, ge (0) будем называть производной от f в точке и0 по направлению е (рис. 3.24). Ука¬ жем, что <L.=^(0)- (380) где е2, . • -, ет — нормальный базис в Rm, т. е., что частные произ¬ водные от / являются производными от f по направлениям являющи¬ мися векторами нормального базиса в Rm (см. § 2.6). Действительно, если т е = 2 г-1 то можно показать, что Рис. 3.24. Для получения производ¬ ной функции f в точке д0 по направле¬ нию е пределы берутся вдоль прямой L = (е, grad /(«о))- (3.83) Например, если f — функция пре¬ образования R2 в R, заданная как /(Ы ) = и1 + и2> И еСЛИ то производная f по направлению е в точке 0 равна , так как -0 = (0^(0)" _1=(О2/)(0). 1 Г2 В заключение рассмотрим преобразование f пространства R,n в Rn с компонентами flf . ., fn. Пусть а0 — элемент из Rm. Если и «близко» к и о, функцию f (и) можно аппроксимировать функцией fa (и) вида /а(и) = /(«о) + 5((« —«о), (3.84) где 9( — линейное преобразование Rm в Rn. Мы хотели бы выбрать $( таким образом, чтобы f (и) была касательной к f (и) в точке и0, т. е. таким образом, чтобы (3-85> Если А = — матрица преобразования ?( (см. § 2.7), то мы хотим выбрать аи таким образом, чтобы 1 II fW-fM _ А'(а- ц0) И __ п 2ДТ0Н іі«-«оіі іі«-«оіі II Если в R имеются такие аи-, для которых условие (3.86) удовлетво¬ ряется, говорят, что f дифференцируема в точке uQ и что матрица А есть 88 (3.86)
производная f в точке а0. А часто называют матрицей Якоби функции/ в точке а0. Можно показать, что п X т матрица А имеет вид Wi)(«o) (ад(«0)... (г>„гА)(«о)‘ (^іЛК^о) • • • (^т/г)(^о) (g g7) _.(D1/)(a0)(D/î)(a0).. .(Dtnfn)(u<>L где /і, /2, • fn — компоненты / и Di означают частные производные. Элемент, стоящий в f-м ряду и /*-м столбце матрицы Л, равен о/(«о). (3.88) Матрицу А мы часто будем обозначать . В случае, если / есть преобразование Rn в себя, детерминант матрицы А называют якобиа¬ ном / в точке «ои пишут det А = det L - det < L_. (3.89) Будем говорить, что f дифференцируема, если f имеет производную в любой точке «о из Rm, и писать или [Djfiia)] (3.9Ѳ) для обозначения функции, преобразующей Rm в множество п X т ма¬ триц S01 (п, tri) (см. § 2.8), величина которой в точке и равна матрице Якоби функции f в точке «. Эту функцию будем называть производной f. Если /1(«1, U2, . . -, Щп) /(») = /2 (Wl> И2> • • -, ит) _/п (^1, ^2> * * -, Q (3.91) ~ df л то производная от /, т. е. будет равна df _ ди ~dh диг df2 диг dfi ди., df, ди2 dfi - dum dfï дит dfn dfn dfn ди Y ди., ’ ' dutn (3.92) Например, если f есть преобразование 7?3 в R2, заданное как то д/ _ Г 2«і 1 О ~ [ 0 —1 2и3 ‘ Пример 3.34. Пусть ЭД, — линейное преобразование Rm в Rn с матрицей А ~ (ац) дэд, Мы знаем, что ЭД («) = Au для и из Rm, и можем убедиться, что - = А. 69
В частности, если ЭД, — линейное преобразование R3 в R2 с матрицей А = Г 1 — 1 О "I ~ [ 0 2 3 J ’ Т0 д^І = А = 1 —1 0 ди 0 2 3’ Пример 3.35. Предположим, что f—преобразование /?2 в R3: /(«) = ■ «2 + «2 ’ — и1и2 __ иг sin и2_ тогда 2и± 2и2 — и2 — Uy Sin и2 Uy COS и2 и df ди Заметим, что '0 0' 0 0 0 О и поэтому f не однозначно. 3.13. «ГЛАДКИЕ» МНОЖЕСТВА ИЗ Rn Используем понятия производной и градиента для изучения понятия «гладкости» подмножеств из /?п. Грубо говоря, подмножество из Rn «гладко», если оно в каждой точке имеет касательную плоскость. Уточним это положение. Начнем с ряда определений. Определение 3.26. Пусть f (х)—непрерывная действительная функ¬ ция на Rn. Обозначим через S (/) подмножество из Rni определенное как 5(/) = {л:/(х) = 0). (3.93) S (/) есть множество точек х из Rn, в которых f равна нулю. S (/) называется (непрерывной) гиперповерхностью в Rn, заданной /. Определение 3.27. Пусть S (/) — гиперповерхность в Rn и х0 — элемент S (/) (т. е. /(лг0) = 0). Будем называть х0 регулярной точкой S (/), если градиент f по х при xQ существует и не равен нулевому вектору. Иначе говоря, х0 есть регулярная точка S (/), если ^(*о)¥=О. (3.94) Заметим, что если xQ — регулярная точка S (/), то множество L (лг0) = (лег : \-^-(*о)> X — (3.95) представляет собой вполне определенную гиперплоскость (см. определе¬ ние 3.15), проходящую через точку лг0. Это обстоятельство подводит нас к следующему определению: Определение 3.28. Если х0 — регулярная точка гиперповерхности S (/), то L (х0) называют гиперплоскостью, касательной к S (/) в точке х0. Говорят, что вектор п (х0) есть нормаль к S (/) в точке х0, если « (*о) = с-^ (ХО), с #= 0. (3.96) 90
Иначе говоря, п (х0) — ненулевой вектор, коллинеарный градиенту f в точке лг0. Отметим, что если п(х0) — нормаль к S (/) в регуляр¬ ной точке л:о, то касательная гиперплоскость L(x0) определяется урав¬ нением L(Xo) = {х: (л(лг0), х — х0) = 0}. (3.97) Пусть f — действительная функция, заданная на Rn. Будем назы¬ вать / гладкой, если: 1) / дифференцируема [т. е. существует, см. выражение (3.68)]; 2) градиент есть непрерывная функция, преобразующая Rn в себя. Определение 3.29. Если f — гладкая функция и если каждая точка xQ из S (/) регулярна, то говорят, что 3 (/) есть гладкая гипер¬ поверхность. Заметим, что гладкая гиперповерхность имеет вполне опре¬ деленную касательную гиперплоскость в каждой точке. Пример 3.36. Пусть f (х) = (а, х), где а — некоторый ненулевой вектор из Rn', f есть гладкая функция, множество S (f) — гиперплоскость L, проходящая через начало координат и заданная соотношением (а, х) — 0; касательная гиперплоскость L (х0) в любой точке х0 из S (f) есть само множество S (f) (-L). Пример 3.37. Пусть f— действительная функция на R2, заданная как f Ç — 1, яв¬ ляется гладкой; множество S (f) есть окружность еди¬ ничного радиуса (рис. 3.25) и касательная гиперпло- есть скость L г 1 -1 ѵъ 1 к S (f) в точке Г- 1 -| 1 L JÀ2 J L Г2 J прямая xt + х2 — К2= 0 (как показано на рис. 3.25). Читателю следует рассмотреть этот пример, имея в виду определение 3.22. Мы можем теперь сформулировать опре¬ деление «гладкого» множества в Rn. Пусть /і, f2,..fn-k —п—k различных гладких функций на /?„, где 1 < k —1, а 5 (/і, /2, • • -, fn-k) обозначает пересечение [см. уравнение (2.10)] гипер¬ поверхностей S (/J, S (/2), . . ., S (fn_k), т. е. $(Â, f2, ..fn-k) = 3(A) n S(/2) Л ... ns(/„_è). (3.98) Иными словами, S (fx, f2, ■ ■ fn-k) есть множество точек x из R.n, в которых все ft, i = 1, 2 n. — k равны 0, т. e. S(A, f2 fn-k) = = [x: А(х) = 0 и A(x) = 0 и ... и fn-k{x) = Q\. (3.99) Определение 3.30. Будем говорить, что S (/у, /2, . . ., есть глад¬ кое 6-мерное многообразие в /?„, если для каждой точки хй из S (/ІЎ/2, • • •> • • ; fn-k) n — k векторов (-^-) (Xo), (-|j) (Xo), • • -, (-%^) (*o) ли‘ нейно независимы [см. уравнение (2.26)]. Если S (/і, /2, . . ., fn_k) — гладкое é-мерное многообразие, то каж¬ дая из гиперповерхностей S (Д) гладкая. Следовательно, если xQ—эле¬ мент S (/і, /2, . . /„.J, то касательная гиперплоскость (лг0) к S (Д) 91
в точке xQ определена для і = 1, 2, . . п — k. Пусть М (х0) обозначает пересечение гиперплоскостей L; (xQ): М (х0) = Li (Ло) П Л2 (х0) П ... П Ln_k (х0) = (3.100) = {х:\-^(х°)> х~*о/ = О « —*о/ = О и ... ... и X — х0/ = о). (3.101) Будем называть М (х0) касательной плоскостью к S (/\, f2l . . ., fn_k) в точке х0. Таким образом, гладкое ^-мерное многообразие имеет каса¬ тельную плоскость в каждой точке. Пример 3.38. Пусть (х) = (а1, х) и f2 (х) = (а2, х), где а1 и а2 — линейно неза¬ висимые векторы в Rn. Функции и f2 — гладкие; множество S (/\, f2) есть п — 2-мерное многообразие и касательная плоскость М (х0) к S (flt f2) в любой точке х0 из S (fx, f2) есть само множество S (/\, f2). Пример 3.39. Пусть — действительная функ- Рис. 3.26. Множество S (/\, f2) из примера 3.39. ция на /?з, заданная как х2 _*з_ ~хх — sin х3, *2 = _хз J 7 fi и /г — гладкие; одномерное многообразие *5 (fi, fz) в R3 представляет собой винтовую линию (рис. 3.26), и, например, касательная /ПИ 1 о и f2 — действительная функция; f2 = Х2 — cos х3- к S (fi, Іъ в точке "О' 1 0 есть пересечение плоскостей хх—х3~ 0 и х2— 1 = 0. М Определение 3.31. Пусть S (Д, /2, • • •» fn-k) есть гладкое А-мерное многообразие в Rn и пусть xQ— элемент из S (/ь /2, • • -, fn-k)- Будем считать, что вектор р трансверсалей к S (/\, /2, • • fn-k) в точке х0, если (р, х — Xq) = 0 для всех х из М (х0). (3.102) Заметим, что р трансверсалей к S (/\, /2, . . ., fn_k) в точке х0 в том и только в том случае, когда р есть линейная комбинация (см. § 2.6) п — k векторов (хо), (-^-) (-Vo). • • •. (■^7)(хо)- Это понятие трансверсальности очень важно для изучения материала гл. 5. Вектор р трансверсалей к S (/\, /2, . . ., fn_k) в точке xQ, кроме того, в том случае, если р удовлетворяет k соотношениям (р, X1 — Xq) = О, 7=1,2, ..., k, (3.103) где х'і — элементы из М. (х0) такие, что векторы х]'—xQ линейно неза¬ висимы. 3.14. ИНТЕГРАЛЫ Интеграл от функции f есть функция g, производная от которой равна /. Уточним это понятие. Предположим, что f — действительная функция, определенная на замкнутом интервале [а, Ь] из /?, и пусть g — непрерывная функция, преобразующая [а, Ь] в R. Будем говорить, что g есть первообразная функция для /, если существует счетное подмножество А из [а, Ь] такое, что если / принадлежит [а, Ь] —А [см. уравнения (2.4)], то g имеет произ¬ водную при t, т. е. g (/) = /(/). Заметим, что если g и h — две первообраз- 92 1
ные к /, то разность g — h есть константа на [a, b ] 1. Если f есть кусочно¬ непрерывная функция на la, b] (см. § 3.11), то можно показать, что суще¬ ствует функция g, являющаяся первообразной /. Например, если f — ступенчатая функция (см. пример 3.31 и § 3.15), т. е., если имеется ко¬ нечное число элементов t0, t±, . . ., tn из [a, b], причем а = /0 < h <j <? ’ * <X < b, таких, что f равна постоянным величинам с( на каждом из (открытых) интервалов (/z, /z+1), тогда функция g, определенная как Z-1 g(t) = Ci(t - /,.) + 2 с/(6+1 - tj) (3.104) 7=0 для t из Ц, //+1], есть первообразная к /. Функцию типа g (f) часто называют кусочно-линейной. Это приводит к следующему определению. Определение 3.32. Интегралы. Если f есть действительная кусочно¬ непрерывная (т. е. регулярная) функция, определенная на (закрытом) интервале [а, Ь], и если g — первообразная к /, то разность g (t2) — g (fj для t2, из la, b] называют (определенным) интегралом от до t2 (или просто интегралом /) и записывают g = J/(T)dT. (3.105) G Используем символ sup | f (т) |, где / — интервал, для обозначения т Е 1 максимального значения |/ (т) | на интервале /, если этот максимум суще¬ ствует, и для обозначения наибольшей нижней границы множества чи¬ сел М, т. е. I/ (т) I < М для всех т из I, если этот максимум не существует. Число sup I f (т) I будем называть верхней границей /(т) на /. В § 3.15 мы т € 1 покажем, что если f кусочно-непрерывна, то существуют такие числа М, что I/ (т) I < М для всех т из /. Важные свойства интеграла от функции собраны в следующей теореме, которая приводится без доказательства (см. [51]). Теорема 3.8. Если f и h — кусочно-непрерывные функции, заданные на la, b], и если с — элемент из R, то для tlf /2 и t из Іа, Ь] справедливо: G G G a) J [f + h] (t) dx — J/(T)dr + j* h(x)dx\ (3.106) G G G G G б) t 2 J f(x)dx G §cf(x)dx = G G cJ/(t)c?t; G (3.107) в) < J|/(T)|dT < G ;(/2 — /i)sup|f(T)|; T g [a, b] (3.108) г) если f непрерывна, то непрерывная функция j f (т) dx дифферен- 1, цируема в любой точке / из [а, 6] и Д) е) чг p(T)dT = W); Lg t G 12 р(т)Л + J/(т)Л = J/(т)Л; (3.109) b если J I /(т) I dx = 0, a 1 Это следует из теоремы о конечных приращениях (см. [51 ]). 93
то существует счетное подмножество А из [а, 6], возможно «пустое», такое, что f (т) = 0, если т С [а, Ь] — А. В частности, ь J|/(T)|dT = 0 а означает, что f (т) = 0 для всех т из la, b], в случае, если f непрерывна и f (т) = 0 при всех т из la, b), когда / непрерывна справа, т. е. f (т +) = = f (т) для всех т из [а, Ь); ж) если имеется счетное подмножество А из la, b], такое, что / (т) = = h (т) для всех т из Іа, 6] — Л, то b b J /(т)б/т = J h(x)dT. a a Иначе говоря, две кусочно-непрерывные функции f и h могут разли¬ чаться в счетном числе точек и тем не менее иметь одинаковые интегралы. Например, если f (т) — непрерывная функция на [а, Ь] и h (т) = f (т) для т = (а, Ь), т. е. f (а) h (а) и f (b) h (6) только в двух точках а и Ь, то b b J f(T)dT = J /г(т) dr. Эти свойства интегралов будут неоднократно использоваться в даль¬ нейшем. Предположим теперь, что f — функция, преобразующая [а, Ь] в Rn с компонентами flt f2, . . ., fn. Интеграл от f можно определить через его компоненты. Определение 3.33. Если/—• кусочно-непрерывная функция, то инте¬ грал от/на интервале от tr до /2 (или просто интеграл от /) есть эле¬ мент из Rn, компонентами которого являются интегралы от Д на интер¬ вале от до /2 или G J Л (T) dt il f2 У /(т) dx (3.110) 2 J fn(y)dx G Свойства интегралов, перечисленные в теореме 3.8, имеют естественные аналогии для интегралов от векторных функций. Например, свойство в) [уравнение (3.108)] для интеграла от векторной функции выглядит сле¬ дующим образом: T g [а, Ь] (3.111)1 1 sup H f (т) II есть наибольшая нижняя граница множества чисел М, таких, т g [а, Ь] что II/(т) H М для всех т из [а, 0]. 94
b Свойство e) записывается в виде: если J || f (т) dx\\ = 0, то суще- а ствует счетное подмножество А из [а, 6], такое, что f (т) = 0, если тС Ія, 6] —Л; в частности, из равенства ь JiI/COHt = о а следует, что f (т) = 0 для всех т из [a, b], если f непрерывна, и для всехт из [а, Ь), если f непрерывна справа. Другое важное свойство интеграла от векторной функции связано с линейными преобразованиями. Если ЭД, — линейное преобразование Rn в Rnl, то 21 J/(T)dr = J 21 [/(т)] Л. (3.112) Это соотношение можно записать в виде (3.113) где А = есть т X п матрица преобразования 21. Наконец, предположим, что F есть функция преобразования интер¬ вала la, t>] в множество ЭД (п, т) (см. § 2.8) матриц размера п X т. Дру¬ гими словами, F (f) для t из [а, Ь] есть п X т матрица, элементы которой мы обозначим через /(7 (/) для і — 1, 2, . . ., п и / = 1, 2, . . ., т. Имеем F(/) = Ai (О Д2(0- • • fUt) fUt) fUt). • - fut) (3.114) fm(t) fut)- ■ - fut) A Заметим, что Д/ есть функции преобразования la, b] в /?. Будем гово¬ рить, что матричная функция F (f) кусочно-непрерывна (или непрерывна), если каждая из функций /17 (t) кусочно-непрерывна (или непрерывна). Имея это в виду, дадим следующее определение. Определение 3.34. Если F — кусочно-непрерывная матричная функ¬ ция, то интеграл от F в пределах от до t2 (или просто интеграл от F) есть элемент множества ЭД (п, т), элементы которого есть интегралы от ftj на интервале — t2, т. е. G \ G jF(T)dT =Jf,/(T)dT >G JÙ G (3.115) 95
или G t2 G J/u(T)dT J 7іг(т)гіт... J/lm(r)dT ti G G G J F(x)dx= t. t2 t2 t2 J fn (t) dx J f22 (t) dx • • • J f2m(x) dx il il il (3.116) І2 G І2 \fm(^)dx §fn2(x)dx- • J fnm(x)dx h t, <■ Снова заметим, что свойства интегралов, отмеченные в теореме 3.8, имеют аналогии и для интегралов матричных функций. Существуют и специфические свойства матричных интегралов, которые нам потре¬ буются для дальнейшего изложения. Они сформулированы в следующей теореме. Теорема 3.9. Пусть F (/) — кусочно-непрерывная функция преобра¬ зования интервала [af Ь] в множество п X т матриц; Р— заданная (постоянная) матрица размера р X п; Q — (постоянная) матрица раз¬ мера т X q и V — заданный (постоянный) вектор в Rni. Тогда a) PF(t)Q — кусочно-непрерывная функция преобразования интер¬ вала [a, ô] в множество р X q матриц и J [PF(t) Q] dx = P s J F(x) dx Q; (3.117) б) F (т) V — кусочно-непрерывная функция преобразования интер¬ вала la, b] в Rm: G ( ] j (F(t) ü} dx = К F(t) g Ig J (3.118) Обратимся к примерам, иллюстрирующим понятие интеграла и некоторые из его следствий. Пример 3.40. Пусть f— функция, преобразующая [0, Т] в R, заданная как f (t) = = е1. Имеем G J exdx — еІ2 — eil ti и т J ex dx = eT — 1. о Если g— функция, преобразующая [0, T ] в R, заданная как g (t) = t + 1, то G J g (t) dx = —£-1 + *2 — *1 G и T f T2 J g(T)6/T = —+T. 0 96
Очевидно, что т т т J {ет +(т 4- 1)) гіт =ет — 1 +-Ç- + T = j ех dx j (т + 1) dx. о оо Пример 3.41. Пусть f преобразует [О, Т] в /?3 и задана как f (Z) — Тогда J dx t, ^2 J sin т di G Jl.dT eh — etl — cos t2 + cos ty sin t 1 Пример 3.42. Пусть функция F преобразует [О, Г] в множество матриц размера Тогда т F(t) di = и ет — 1 О — т 2 _ Если Р = [ _ J у и Q [ [ (°]. то PF (/) Q =- -Ç-T о 1 — ет О Если т J PF(x)Qdx = и г j F(t) V di = о - ь. 1 1 1 1 = ет — Т Г ? Ь—1 2 X 2 3.15. ВЕКТОРНЫЕ ПРОСТРАНСТВА Выше уже рассматривался вопрос о множестве функций, имеющих общие свойства для случая множества кусочно-непрерывных функций. Обычно множества функций являлись векторными пространствами. Теперь мы хотели бы ввести для такого рода множества функций понятие расстояния, совместимое с понятиями суммы и произведения. По сути дела, векторное пространство функций с соответствующей функцией расстояния можно назвать функциональным пространством. Уточним это понятие и рассмотрим его на нескольких важных примерах. Определение 3.35. Функциональное пространство1 * * 4. Пусть —под- пространство векторного пространства $ Rn) всех функций преобра¬ 1 См. литературу [196] и [205]. Это определение — частный случай понятия, извест¬ ного как топологическое векторное пространство. Последнее понятие является весьма общим. 4 Атанс и др. 97
зования Rm в Rn или подпространство векторного пространства Ь], Rn) всех функций преобразования интервала [а, Ь] в Rn nd — расстоя¬ ние на 5 (см. определение 3.1). Будем называть J функциональным про¬ странством, если оно обладает свойствами: 1) пусть f и g — заданные элементы а {fk} и — последо¬ вательности из 5, сходящиеся к f и g соответственно [т. е. d (fk, f) -> О и (gk> S) 0]. Последовательность fk + gk сходится к f + g, т. е. d(fk + gk, / + g)^0. (3.119) 2) пусть f —заданный элемент из J и г —элемент из R, а {/J из $ и {rj из R — последовательности, сходящиеся к f и г соответственно. Последовательность rkfk сходится к г/, т. е. d(rkfk, rf)^ 0. (3.120) Обратимся к некоторым важным определениям функциональных про¬ странств. Начнем с рассмотрения множества всех ограниченных функций преобразования интервала la, Ь] в Rn. Определение 3.36. Ограниченная функция. Функцию f преобразо¬ вания [а, Ь] в Rn называют ограниченной, если существует число М из /?, М > 0, такое, что ||/(0 И < М для любого t из [а, Ь]. (3.121) Пусть 93 ([a, b], R ) обозначает следующее множество: 93([я, b], Rn) = [f : f — ограниченная функция из [а, 6] в Rn}. (3.122) Нетрудно заметить, что 93(1«, b], Rn) есть векторное пространство, являющееся подпространством множества b], Rn) всех функций, преобразующих la, Ь] в Rn. Введем понятие расстояния на 93(1«, b], R^, которое превратит последнее в функциональное пространство. Определение 3.37. Норма функции. Пусть /— элемент из 93 (Ія, 6], Rn), т. е. / — ограниченная функция из [а, Ь] в Rn, Нормой /, ||/ ||, по определению является наибольшая нижняя граница множества чисел М такая, что ||/ (ОН < М для любого t из la, b] Ч В частности, если / непрерывна, то 11/11 = sup||/(/)ll = max|l/(/)||, (3.123) /£[a,ô] t£[a,b] поскольку II/ (t) Il действительно достигает максимума на [а, 6] (см. тео¬ рему 3.7). Если/ ng— элементы из 93 ([a, b], Rn),r. е. если обе функции/ и g ограничены, то расстояние между f ng,d (f, g), есть просто норма / — g, иначе говоря, d (f, g) = Il f - g II = su p И f (Z) - g (/) Ц. (3.124)1 2 Покажем, что 93 (k, b], Rn) вместе с понятием расстояния есть функ¬ циональное пространство. Теорема 3.10. Функция d, определяемая уравнением (3.124), действи¬ тельно является расстоянием на 93 (la, b], Rn). Множество 93 (la, b], Rn) есть функциональное пространство по отношению к этому определению расстояния. 1 ||/|[ часто называют наибольшим значением || f (t) || на интервале [а, 6]. 2 sup ||/(0 —g (Oil следует понимать как наибольшую нижнюю границу множества t g [а, Ь] чисел М, таких, что 11/(0 — g (0 II М для любого t из [a, д], т. е. sup || f (t) — g (t) || tÇ- [a, b] есть наибольшее значение || / (0 — g (0 II ♦ 98
Доказательство. Убедимся прежде всего в том, что функция d, опре¬ деляемая уравнением (3.124), обладает свойствами 1) и 3) определения 3.1. Очевидно, что свойством 2) она обладает, так как \\f (/)—g (/)|| = = Il g (f) —f (t) Il для любого t из [a, Ь]. Что касается неравенства тре¬ угольника [свойство 3) определения 3.1], то для f, g и h из 93 ([а, Ь] Rn) справедливо + (3.125) для всех / из [а, Ь]. Это означает sup 11/(0 - h (/)|| < sup Ц|/(/) - g (OU + Il g (t) - < t g [a, b] t Ç. [a, b] <sup||/(O — g(OII + sup||g(/) —й(/)||. (3.126)1 t£(a,b] t£[a,b] Очевидно, что d (/, g)^ 0 и d (f, f) = 0. Далее, если d(/, g) = 0, то для любого заданного /0 из [а, Ь] должно быть ||/ (/0) —g (/0)|| = 0, так что / (/0) = g (Iq). Мы показали, что d есть функция расстояния на 93 ([a, b], Rn). Проверим, удовлетворяется ли условие 1) определения 3.35. Пусть/ ng — элементы из 93 ([а, Ь], 7?п), тогда II/+ g II <11/11 +UII- (3.127) Отсюда следует, что ІІЛ + gk — (/ + ^11 <11/* — Л + lk* — ffll> (3-128) т. e. d (fk + gk, f + g) < d(fk, + /) + d(gk - g). (3.129) Из последнего выражения видно, что условие 1) удовлетворяется. Для уравнения (3.127) имеем II/+ £ІІ = sup II(/ + £)(/) 11 = SUp||/(/) + g(/)||< < sup||/(OI| + supllg-(t)II = ||/|] + ||g||. (3.130)2 Предлагаем читателю самому убедиться в том, что условие 2) опре¬ деления 3.35 удовлетворяется. 93 ([а, b], Rn) является полным (см. § 3.5) по отношению к расстоя¬ нию d, определяемому по уравнению (3.124). Для того чтобы убедиться в этом, заметим, что если f} есть равномерно сходящаяся последователь¬ ность (см. определение 3.11), то любая fj(t) — равномерно сходящаяся после¬ довательность в Rn, которая должна сходиться к элементу из Обозначим этот элемент через f (t). Если задано е > 0, то существует N (-у), при котором II fj — fk II < -|-, если j, £>Л/(-|-). Если / > N (-|-) , то II// -/II <8- Это следует из соотношения ||/;- (/) — /(OU < II// (0 — -/* (011 -4- Wfk (0—f (0 II, которое справедливо для любого t из la, b] (т. е. при t G la, Ь] можно выбрать k (0 > N (-|-) так, чтобы || fk (0 (0 — /(OIK-J. 1 Уравнение (3.126) обосновывается следующим образом. Если A4 и N — числа такие, что II f (t) — g (0 М и ll£ (/) — й (Oil N для любого/ из [а, д], то ||/ (0 — — g (ОН + Il g (0 — h (t) \\ ^ М-\- N для любого t из [а, ô] и, следовательно, ||/(0 — — h (/) И A4 + N для любого / из [а, 0]. Читатель должен иметь это в виду примени¬ тельно к утверждениям, аналогичным уравнению (3.126). 2 Сравнить с уравнением (3.126). 99
Обозначим через (£([а, &], Rn) множество всех непрерывных функций, преобразующих Іа, Ь] в Rn\ G (k, b], Rn) = \f :f есть непрерывное преобразование [a, b] в Rn\. (3.131) По теореме 3.7 множество S (la, b], Rn) содержится в множестве ® (la, b], Rn); более того, оно является его подпространством (см. § 3.10). Иначе говоря, непрерывные функции, определенные на компактном интервале, ограничены. Расстояние d, определенное уравнением (3.124) по отношению к Ê([a, b], Rn), есть расстояние между непрерывными функциями. С помощью теоремы 3.11 мы покажем, что если fk — после¬ довательность непрерывных функций, сходящаяся к /, то/должна быть непрерывна. Это доказывает, что S([a, b], Rn) есть функциональное пространство. Действительно, G ([a, b], Rn)—полное функциональное пространство по отношению к этому расстоянию. Теорема 3.11. Если fk —последовательность непрерывных функций, сходящаяся к /, то / непрерывна. Доказательство. Пусть t0 — некоторая точка из [а, Ь] и {tm} — после¬ довательность из [a, b], которая сходится к /0. Покажем, что /(tm) схо¬ дится к Предположим, задано е > 0; существует К такое, что при k> К имеем sup||/ft(/) — С~. /€ la. Ы 3 При этом справедливо соотношение II/(4.)-/(to)Il < \\'f(tm) -fk(tm)\\ -Н!Л (t,n) - Л (Oil + + ІІ/И0-Ж)ІІ- (3.132) Так как fk непрерывна, то существует М, начиная с которого (т. е. при /п>Л4) IIЛ (Л) - Л (О II <1- (3.133) Из уравнения (3.121) следует, что при т > М ІІ/(Л)-Л0)||<е (3.134) и, следовательно,/(/т) сходится к/(/0). Последнее и доказывает непре¬ рывность/. Упражнение 3.13. На основании теоремы 3.11 необходимо показать, что множество непрерывных функций (£ ([a, ô], Rn) есть векторное пространство. Указание: исполь¬ зуйте теоремы 3.7, 3.11 и 3.10. Теорему 3.11 часто формулируют так: предел равномерно сходящейся последовательности непрерывных функций есть непрерывная функция. Заметим, что теорема остается справедливой и в том случае, когда слова «непрерывная» повсюду заменяются на «кусочно-непрерывную» функцию. Теорема 3.11а. Если fk — последовательность кусочно-непрерывных функций, которая сходится к/ [по отношению к расстоянию d из уравне¬ ния (3.124)1, то и / кусочно-непрерывна. Это опять-таки означает, что множество всех кусочно-непрерывных функций, преобразующих [а, Ь] в Rn, является функциональным пространством, если можно показать, что каждая непрерывная функция преобразования [а, Ь] в Rn ограничена. Покажем, что если функция/кусочно-непрерывна, то существует после¬ довательность stn ступенчатых функций (см. § 3.14) х, для которых || sm —/[| сходится к 0. 1 Напомним, что ступенчатая функция s определяется следующим образом: если /0 G, • • •’ tn — элементы из [а, д], причем а = /0 < tr <? • •< tn — b и s = const = Ci на каждом из открытых интервалов (^, /z+1), то такая функция s называется ступенчатой. 100
Теорема 3.12. Если f— кусочно-непрерывная функция, преобразую¬ щая [а, Ь] в то существует последовательность sm ступенчатых функ¬ ций, такая, что для любого 8 > 0 существует М (е) такое, что при т > > М (8) для любого t из la, b] справедливо неравенство || $т (/)— —/(011 <8. Доказательство. Для доказательства воспользуемся рис. 3.27. Пусть W — некоторое целое число. Предположим, что t Е [а, Ь] и t а или Ь. Существуют элементы і (/) и г (/) в la, b], такие, что если о, т принадлежат к (i (t), t) или к (t, г (/)), то II/ (о) — f (т) II < . Это справедливо, потому что/(/+) и / (t—) существуют \ Аналогично существуют элементы г (а) и t (6) такие, что если, например, о, т принадлежат (а, г (а)), то ||/ (о) — прерывистой линией, —кусочно-непрерывная функция f (/); сплошная кривая — аппроксимирующая ступенчатая функция SN (О f (т) II С . Выберем теперь элементы sn s2, . . ., sp на [a, b] таким обра¬ зом, чтобы каждое t из la, b] находилось хотя бы в одном из интервалов [а, г (a)), (i (SJ, г (sj), . . ., (z (sp), r (sp}), (i (6), b)]. Мы можем это сде¬ лать в силу свойства компактных множеств Гейне—Бореля (см. § 3.6, свойство 2). Рассмотрим множество \а, b, sb s2, . . sp, г (a), i (b), і (sj, r (s^, . . ., i (Sp), r (sp)} и определим точки a = /0 < h < * • • < = b как точки этого множества, расположенные в порядке возрастания. Точка находится в одном из интервалов la, г («)],... и т. д. Точка /.+1 находится в том же интервале, что и /•, или является r (sq) для некото¬ рого q. Следовательно, если о, т принадлежат (/z, то ||/ (о) — — Если определить sN как МО) =/(6); М0=/( ) для Z из то последовательность ступенчатых функций sN для N = 1, 2, ... и есть искомая последовательность. 1 Иначе говоря, 0 означает, что существует интервал, скажем, i (t) такой, что II/(т)для т из (i (t), t). Из неравенства треугольника следует, что II/ (а) -/ (т) II И/ (а) - f (t-) И + HJ (/-) - f (т) |j ==s + A- = ± . 101
Обозначим функциональное пространство всех кусочно-непрерывных функций преобразования la, b] в Rn через ^3 ([я, b], Rn): $ ([a, b], Rn) = {f :f есть кусочно-непрерывная функция, преобразующая [а, b] в Rn], (3.136) Важным следствием теорем 3.11, 3.11а и 3.12 является тот факт, что множество непрерывных функций £ (la, b], Rn) и множество кусочно¬ непрерывных функций ^5 ([а, b], Rn) являются замкнутыми подмноже¬ ствами множества всех ограниченных функций ([a, b], Rn) (см. опреде¬ ление 3.7) и, следовательно, полны (см. § 3.5), поскольку множество 33 ([a, b], Rn) является полным. Таким образом, каждая непрерывная или кусочно-непрерывная функция преобразования [а, Ь] в Rn ограни¬ чена. Этот результат будет использован нами в § 3.18 и 3.19. Другим важным следствием этих теорем и свойств интегралов [урав¬ нение (3.111)1 является то обстоятельство, что если fk есть последова¬ тельность элементов из 33 (Ія, 6], /?„), которая сходится к/в смысле рас- ь стояния по уравнению (3.124), то последовательность ^fk (т) dx схо- а b дится к J/(t) dx. Это, естественно, приводит к известному результату, а относящемуся к почленному интегрированию рядов. Иначе говоря, интеграл есть непрерывная линейная функция на 33 (fa, b], Rn). Рассмотрим множество непрерывных функций Q, ([я, b], Rn) и введем иное понятие расстояния на этом множестве. Определение 3.38. Пусть f—элемент из £ ([a, b], Rn). Норма /, которую будем обозначать как Ц/І^ \ есть просто интеграл эвклидовой нормы для / (/) на интервале la, b]: ь ll/lli = J||/(t)||A. (3.137) a Если f и g — элементы из (£ ([a, b], Rn), то расстояние (/, g) между f и g есть просто норма f — g, т. e. b ddf, g) = ||/~glli = j*ll/(T)-ff(T)||dT. (3.138) a Легко показать, что уравнение (3.138) действительно определяет расстояние на (£ ([a, b], Rn) и что (£ ([a, b], Rn) оказывается функциональ¬ ным пространством по отношению к этому понятию расстояния. Упражнение 3.14. Требуется доказать, что уравнение (3.138) определяет расстояние на (£ [0, 1], R) и что (£ ([0, 1], 7?) есть функциональное пространство по отношению к этому расстоянию. Указание: использовать теорему 3.8; в частности, полезны свой¬ ства в) и е) [уравнение (3.108)]. Уравнение (3.137) имеет смысл и для функции/, кусочно-непрерыв- ь ной на [а, Ь], т. e. J || f (т) || dx существует. Имеются, однако, такие а кусочно-непрерывные функции g, не равные нулю, для которых b J IIS’ (Т)ПТ = Это обстоятельство не позволяет определить расстоя- а 1 Индекс 1 вводится, чтобы отличать это понятие нормы (один) от понятия, сформу¬ лированного в определении 3.37. 102
ние на $ (la, Z? J, Rn) с помощью уравнения (3.138), так как нарушается свойство 1) определения 3.1. Для того чтобы обойти это затруднение, будем называть две кусочно-непрерывные функции f и g «подобными», или эквивалентными (или почти везде совпадающими), если множество А точек t из [а, Ь], в которых /(/) =/=■ g(Z)1 является счетным. Нетрудно заметить, что f и g эквивалентны в том и только в том случае, если b J ll/W —£0011^ = а Обозначим через [/] множество всех h из ^3 (Іа, 6], /?„), «подобных»/: 1/1 — {Л:/ подобна Л). (3.139) Если теперь определить функцию dlt положив ь dA\f\, [gl)= Уі|й(т)-Л(т)|Ит, (3.140) а где h — любой элемент множества [/] и k — любой элемент из [g], то легко видеть, что d± есть расстояние на множестве всех [/]. Хотя, строго говоря, для определения dx следует использовать уравнение (3.140) и рассматривать множество [/], в дальнейшем мы обойдем это обстоя¬ тельство и будем рассматривать в качестве определения расстояния d1 на ^3([а, 6], Rn) уравнение (3.138). Имея это в виду, будем рассма¬ тривать $([а, 6], Rn) как функциональное пространство по отноше¬ нию к dv Отметим, что (Е ([a, b], Rn) и ^3 ([а, ft], Rn) не являются полными (см. § 3.5) по отношению к расстоянию d±. Вернемся к множеству непрерывных функций (Е([а, 6], Rn) и введем еще одно определение расстояния на этом множестве. Определение 3.39. Пусть/и g — элементы из £ ( [а, &], 7?п). Скаляр¬ ное (или внутреннее) произведение/и g, обозначенное через 1/, g], опре¬ деляется уравнением ь I/. £1=4</(т), £(Т)>Л, (3.141) а где (/ (т), g (т)) есть обычное скалярное произведение на Rn [см. уравне¬ ние (2.86)1. Покажем, что это определение имеет смысл и что внутреннее произведение [/, g 1 действительно является положительно определенным внутренним произведением на векторном пространстве G ([a, b], Rn). Теорема 3.13. [/, g] есть положительно определенное внутреннее произведение на (Е ([a, b], Rn). Доказательство (см. § 2.11). Свойства 1,2 и 3 произведения [/, g] не¬ посредственно следуют из соответствующих свойств скалярного произ¬ ведения (/, g). Проверим, обладает ли [/, g], например, свойством 2). Если г £ R и /, g Е (Е ([a, b], Rn), то ь ь Vf, g] = J (г/(т), g(T)) dx = J r 'J(%), g(r)) dr = a a b = g(r))dr =^r[f, g]. (3.142) 1 Cm. § 2.2. 103
Рассмотрим теперь [/, f] [см. уравнение (2.84)] и покажем, что оно неотрицательно: I/. /] = ,f (/(*). /(т)) di. (3.143) Но (/ (т), f (т)/^0 для любого т из Іа, Ь]. По теореме 3.8в имеем I/. /1 = J (/СО. /СО) di = I </(т), /(О) I di > j (/СО. /(О/ di =а0. (3.144) Наконец, пусть/0 — элемент из (Е (к, 6], Rn) такой, что [/, /01 = О для каждого элемента f из (Е ([а, 6], /?п). В частности, [/0, /01 = 0- Но (3.145) и на основании теоремы 3.8е ||/0 (т) ||2 = 0 для любого т из [а, Ь]. Оче¬ видно, что /о 0, и теорема доказана. На основании этой теоремы можно определить понятие нормы ана¬ логично § 2.13 [см. уравнение (2.94)] для элементов из £ (к, 6], Rn). Будем называть ее нормой (два) и обозначать ||/||2: ІІ/ІІ2 = И/, /] = J(/(O./.(O)^ Jll/(^)U2^ (3.146) Неравенство Шварца (2.87) справедливо для внутреннего произведе¬ ния [/» g*]; поэтому (3.147) или эквивалентно 12 1/2 Г b j (/(т). fW)di J (g(T), g(r))<ÏT (3.148) Уравнение (3.148) будет использовано в гл. 10. Такое понятие нормы позволяет определить расстояние d2 в (Е ([a, Ô], Rn) [сравнить с уравнением (3.1)]: Предлагаем читателю убедиться в том, что (Е (k, b], Rn) есть функ¬ циональное пространство по отношению к этому понятию расстояния. Заметим лишь, что (Е (la, b], Rn) не является полным по отношению 104
к расстоянию d2. Заметим также, что это понятие расстояния применимо и к множеству кусочно-непрерывных функций, если согласиться рас¬ сматривать «подобные» функции одинаковыми [сравнить с уравне¬ ниями (3.139) и (3.140)]. Пример 3.43. Пусть f (/) = sin/ для t из [0, л]. Тогда f (/) есть элемент из (£ ([0, л], R) и мы имеем И/И = sup I sin 11 == 1; t (î [0. Л] ||/lk = J I sin t \dt = 2; Отметим, что |lf|| < у ||2 <|| fill- Пример 3.44. Пусть f (t) = 1 для / из [0, 1 ] и g (/) — «пик», заданный как 4—8/ f (/) и g (t) — элементы из С ([tz, ô], R) и ІШі = і; UII-2; ||/_£|| = 1; 11/11!= 1; иііі=Ц-; и/-гііі=-г; /4 1/2 3/0 1 t Рис. 3.28. Функции f, g и h из примера 3.44; h (Z) = 0 при любом t 6 [0, 1 ] Отметим, что |j/ — g||2 < ||/ — glli <||/ — g|| и || f || < || g ||, но || g||i <||/Ці- Выберем, h (t) = 0 для всех / из [0, 1 ] и используем понятие расстояния между элементами функционального пространства для определения, какая из двух функций f или g ближе к h. Если использовать расстояние d, то d(f, /г) = Ц/Ц = 1 и d(g, h)—\\g\\—2. Следовательно, f ближе к h, чем g. С другой стороны, если использовать расстоя¬ ние dp то di (f, h) = mill =-. 1 и dr (g, h) =UII1 =~2~ и по отношению к этому расстоянию g ближе к h, чем f. Аналогично g ближе к Л, чем f относительно d2. Таким образом, мы видим, что «близость» функций зависит от того, какое понятие расстояния используется. 3.16. ФУНКЦИОНАЛЫ Функционал — это вещественная функция векторного пространства (обычно функционального пространства). После предварительного обсу¬ ждения мы определим это понятие более строго и четко. Пусть L — действительная функция на RN. Если у — элемент из Ry с компонентами у±, у2, . . ., yN, то L(S) = ЦУі, Уг W (3.149) £(0- / ? Если f (t) — функция преобразования R в RN с компонентами (/), /2 (0, • • •» /л/ (О» то 1/(0 ] есть функция преобразования R в R (т. е. функция времени) и L [/(/)] =L[fi(t), f2(t) (3.150) 105
Если предположить, что L дифференцируема по у,, то будет функ- иУі цией, преобразующей RN в R, и поэтому [f (/) ] —функция преоб- ѵУі разования из R в /?, которую будем обозначать Итак, вду[/(/)] = і/(0] = /2(0,-.-,/ѵ(0] =(ад[/(оі. (з.і5і> Часто будет представлять интерес отыскание минимума (или ма¬ ксимума) функции типа ь ь Л/) = = Je [/,(/), f2(t) fN(t)]dt, (3.152) a a где L — непрерывная функция преобразования RN в R; f — непрерывно или кусочно-непрерывно преобразует [а, Ь] в Rx и /д, /2, • • », Аѵ — ком~ поненты /. Функция J есть функция преобразования из ([я, 6], Rn) [см. уравнение (3.136)1 в R. Если T Е la, b], то можно задать веще¬ ственную функцию J (T, f), положив т т J(T,f) = $L [f(t)] dt ~ \ L [fdt), M dt. (3.153) a a Функцию J (T, f) будем называть функционалом. Пусть L — диф¬ ференцируема по gt и производная от L по у>, [см. (3.77)] есть непре- оуі рывная функция из Rn в R. 1Аъ\ мэжем определить новый функционал àJ(T, f) , положив dfi (t) T T />(/) /Л01Л. <3.154) a a dJ (T f) —47-777^- будем называть частной производной от J (T, f) по Д (/). Урав- VI і \ч нение (3.154) будет использоваться в дальнейшем довольно часто. Заметим, наконец, что для каждой фиксированной функции f функ¬ ция J (Т, /)от Т имеет производную во всех точках за исключением счет¬ ного множества точек А из [а, 6]. Если Т не принадлежит к Л, то произ- 7 /<Л (T’ f) водная от J (T, f) по Т, —^7 " Равна = L ïfi(T), f2(T), . .. , fN(T)]. (3.155) В частности, если f непрерывна, то = £ [/(Т)] для всех Т из [а, Ь]. (3.156) Пример 3.45. Пусть L (у) — 1 для всех у из Rn; L непрерывна и (у) = 0 для і = — 1, 2, .... N и у из Rn- Если f Ç ([а, 5], Rn), то т J(T,f) = ^ \dt=T — a а 106
dJ (T, f) dT Пример 3.46. Пусть L (y) = 2 Ci I Уі I, (=1 где cA, c2, ...» — положительные константы. В этом случае L непрерывна и N L[f(t)] ^сі\Уі\ і=\ для f из Sp ([а, 6], Ry). Следовательно, т N NT = 2 Ci I fi (/) I dt = 2 ‘I J I A «) I dt a ï=1 i—1 a dJ (T,f) 4 г i f its i = Zj Ci\ fi U ) I- i=l Заметим, что в общем случае неопределенна. dfi (О Пример 3.47. Пусть L (У) = Ц- {У. У) = -у- 2 УІ L непрерывна и для / из $]3 ([а, 6], Rn). Следовательно, J(T, f) = -у- J 2 (O dt; = 4-2 (Г) a i=l x=l И ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 3.17. ПРЕДВАРИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Поведение всех физических систем, которые мы будем рассматривать, описывается системами обыкновенных дифференциальных уравнений. В этом параграфе дадим определение понятия системы обыкновенных диф¬ ференциальных уравнений, объясним, что понимают под решением си¬ стемы, и рассмотрим начальные и граничные условия, а также изучим влияние параметров системы. В последующих параграфах дадим доказа¬ тельство теоремы существования и единственности решения и детально изучим линейные системы. Дифференциальным уравнением называют уравнение, в которое входят производные неизвестной функции. Например, уравнения х(/) = —%(/) (3.157) и —= 1 + dFfx'і} (3.158) 107
являются дифференциальными уравнениями. В уравнении (3.157) неиз¬ вестная функция X есть функция одной действительной переменной. Это уравнение называют обыкновенным дифференциальным уравнением. В уравнении (3.158) неизвестная функция F есть функция нескольких переменных. Такие дифференциальные уравнения называют дифферен¬ циальными уравнениями в частных производных. На протяжении всей книги вместо термина «обыкновенное дифференциальное уравнение» мы будем использовать термин «дифференциальное уравнение». Уточним понятие дифференциального уравнения. Определение 3.40. Пусть F — непрерывная 1 функция преобразова¬ ния открытого подмножества А размерности Rn+2 (см. определение 3.5) в R. В этом случае уравнение F [%(/), л-(/), /] = 0 (3.159) называют дифференциальным уравнением n-го порядка 2. Действительная функция ф (/), определенная на открытом интервале (/х, /.,), называется решением дифференциального уравнения (3.159), если а) ф (/) непрерывна на (/1( /2); б) точка -ф(0 - ф(/) _ф(п)(/)_. принадлежит множеству А для t из (/1( /2); в) F Іф (t), ф (/), . . ., ф<л) (/), t] 0 для t из (^і, /2). (3.160) Если уравнение (3.159) можно записать в виде x{n\t) — G [х(0, x(t), ..., х<'1-1>(0, d - ° (3.161a) или xw(t) = G[x(t), x(t), .... x(n-1)(0. (3.1616) будем говорить, что уравнение разрешено относительно высшей произ¬ водной. Порядок дифференциального уравнения соответствует порядку наи¬ высшей производной, встречающейся в уравнении. Решение уравнения связано с интервалом определения. Например, функция се~1 есть решение уравнения (3.157) на любом интервале (/ь /2)« Пример 3.48. Пусть F —функция из /?3 в /?, заданная как F (уъ у3) = у2 — . Уз Функция F непрерывна на открытых множествах: Уі У'і Уз ' Уз > 0 и Уі У'і Уз 1 Хотя относительно F могут быть рывность вполне достаточна для наших целей. à,xn 2 х(п) (0 обозначает n-ю производную от х (/) по t. сделаны и более «слабые» предположения, непре- 108
Пусть А = Л + (J А , тогда F непрерывна на Л и мы можем рассматривать диффе¬ ренциальное уравнение -J- = 0. Для t>> 0 решением уравнения будет х (f) = log t + с (с — произвольная постоян¬ ная); для t < 0 решением будет х (t) — log (—t) + с. Дадим определение системы дифференциальных уравнений первого порядка х. Определение 3.41. Пусть /2, . . fn — непрерывные функции от произведения открытого множества Ап из Rn и открытого интервала (7\, Т 2) (который может представлять собой все /?, быть задан как мно¬ жество \t : t <^Т2] и т. д.), т. е. из Ап X (7\, Т2) [см. уравнение (2.5)] 1 2 в R. Предположим, что частные производные •’ Хп't} , і, / = 1, 2, п, (3.162) где х2, . . хп — координаты Rn, являются непрерывными функ¬ циями преобразования Ап X (Т19 Т2) в R. Система уравнений х1(0 = 7і[*і(0, х2(/) xn(t), /]; x2(f) = f2 [хх (/), x2(/), x„(0, /]; Xn(t) = x2(t), xn(t), Л (3.163) называется системой из n дифференциальных уравнений первого порядка; х. часто называют зависимыми переменными, a t — независимой перемен¬ ной. Уравнения (3.163) записывают в векторной форме: аг(/) = /[х(/), /], (3.164) где х(/) = *1(0 х2(0 И f[x(t), t] = ~fiïxdt), .. Л •• ., xn(t). „ xn(t), t] (3.165) _fn(*l(O, •• ; Xn(t), /]_ /г-мерную функцию ф (/), определенную на подынтервале (/ь /2) из (ТГ Т2), называют решением системы, если а) ф (/) непрерывна на (/ь /2),‘ 'МО б) ф (0 = -ЫО- есть элемент из Ап для всех t из (fb Z2); 1 Данное определение может быть более общим, но этого не требуется для настоя¬ щей книги. 2 А X (7\, Т2) можно рассматривать как подмножество (открытое) из Rn+i- 109
в) ip (Z) — f [ip (Z), для всех t из (/,, /2), за исключением, возможно, счетного подмножества А элементов из (/1( /2), т. е. Фі(О = fi hMO. ф2(0, •••. MUO. Л; іЫО = f2№(0. ^(0 яиО. Л; (3.166) 'МЛ = /пН’і(О. ф2(Л. •••, Ч>»(0. Л- Системы п дифференциальных уравнений первого порядка будут все время встречаться в основных разделах книги. Они описывают широкий класс физических систем. Решения таких систем соответствуют функциям преобразования R (или интервала из /?) в Rn и могут пониматься как траектории в пространстве Rn. Часто мы будем исключать t из описания этих траекторий, т. е. записывать уравнения траекторий только через переменные xz. Пример 3.49. Пусть (хь х2, t) — х2 и f2 (хх, х2, /) = —xlf и f2 непрерывны на Rn X R (=Rn+i) так же, как и производные от них: = 0; = 1; ■ ^2- = —1 их у ох2 ОХг и = 0. Итак, мы имеем систему двух дифференциальных уравнений первого порядка. хх == х2; х2 = —хх Ч Функция ф(0 с компонентами фі (/) = d cos t + с2 sin t\ ф2 (t) = — d sin t 4- c2 cos t; где cx и c2 — постоянные интегрирования, как нетрудно заметить, является решением системы. Если ф (0 есть 2X2 матрица: cos t sin Я — sin t cos Я’ то X (0 = ф (0 — решение системы. Заметим, что ф (0 есть ортогональная матрица (см. пример 2.30) для любого t. Траекториями системы являются окружности на пло¬ скости Хр х2, уравнения которых можно записать в виде хх + х| = + с2. При изучении дифференциальных уравнений, описывающих поведение физических систем, мы обычно отыскиваем решения, удовлетворяющие дополнительным «граничным условиям». Например, уравнение (3.157) можно рассматривать как уравнение, описывающее процесс радиоактив¬ ного распада, где х (t) — количество вещества, оставшееся после t сек. Если X (0) = с — количество вещества в начале процесса, то отыски¬ вается такое решение уравнения (3.157), для которого ф (0) = с. Иначе говоря, решение должно удовлетворять начальному условию ф (0) = с. Определение 3.42. Пусть х (0 = f (х (0, 0 — система п дифферен¬ циальных уравнений первого порядка [см. определение (3.41)], где f определена на множестве Ап X (Tlt Т2), а (х, /0) —точка из Ап X (Тъ Т2). Эту точку назовем начальной точкой, а числа х10, х20, . . хп0, яв¬ ляющиеся компонентами х0, — начальными значениями. Будем называть соотношения (3.167) xz(/o) = *zo, 4 = 1, 2, ..., п начальными условиями. 1 При записи систем уравнений часто будем опускать время t. 110
О решении системы ф (/) говорят, что оно удовлетворяет начальным условиям или является решением задачи с начальными значениями, если ф(/о) = *о, (3.168) т. е. ^(/o)=:xzo, 4 = 1, 2, ..., п. (3.169) В следующем параграфе мы покажем, что при сделанных нами пред¬ положениях решение задачи с заданными начальными условиями суще¬ ствует. Пример 3.50. Рассмотрим систему , 0 ) — начальные условия, т. е. 1 из примера 3.49: = х2; х2 — —%і- Пусть и 0 — начальные значения, тогда Ф(0 = cos t — sin t sin t cos t cos t —sin t есть решение задачи с заданными начальными значениями. Укажем, что имеется п начальных условий и все эти условия должны удовлетворяться в один и тот же «момент времени» /0. В общем случае для того, чтобы полностью определить решение системы п дифференциаль¬ ных уравнений первого порядка, требуется п условий. Будем называть эти условия граничными. Пусть, например, имеем систему х (/) = f [лг (/), Z] с/, определенной на 7?п+1, и требуется найти решение ф (/) такое, чтобы ■фі (G) = Х1О, 1|>2 (/2) = *20 (U = хп0, где tlf t2, . . tn— точки из R и заданы. В этом случае соотношения xt (fz) = xz0 образуют мно¬ жество граничных условий. Пример 3.51. Вновь рассмотрим систему хх = х2\ х2 — —хг из примеров 3.49 и 3.50. Пусть Хі (0) = 1, х2 (л) = 0 — граничные условия. Тогда гр! (/) = cos t, гр2 (t) = = —sin t — решение системы, удовлетворяющее этим условиям. В дальнейшем будем рассматривать системы, зависящие от пара¬ метров: *(0=/[*(0> я, і] (3.170) или, в записи через компоненты, xn(t), «i, U2, ... ит, л (3.171) где f—непрерывная функция на множестве Ап х Вт х (Тъ Т2) [Ап и Впі — открытые подмножества из Rn и Rm соответственно], а частные производные f по компонентам х и и также непрерывны на множестве Ап х Bm х (Т1У Т2), которое рассмат¬ ривается как подмножество из Rn+^m. Систему вида (3.170) будем назы¬ вать системой п дифференциальных уравнений первого порядка, завися¬ щих от параметров иг, . ., ит. Решение такой системы, зависящее от параметра а, удовлетворяет уравнению Ф(Л ")=/[Ф(0> и, а (3.173) Более подробно такие системы рассмотрим в следующем параграфе, а их значение для управления — в гл. 4. Пример 3.52. Рассмотрим систему: хг (/) = х2 (/), х2 (/) = — xr (t) + и, где и — некоторый параметр. Иначе говоря, [xx, х2, и, /] — х2 и f2 [%і, х2, и, 4] = —хѵ + и. 111
Очевидно, что fr и f2 непрерывны и имеют необходимые непрерывные частные производ¬ ные. Векторная функция ф (/, и), заданная уравнением [cos t sin t —sin t cos t о с2 + I (cos т) и di является решением системы. 3.18. ТЕОРЕМА СУЩЕСТВОВАНИЯ И ЕДИНСТВЕННОСТИ Ниже будет показано, что решение задачи с начальными значениями для системы п дифференциальных уравнений первого порядка существует и единственно. Сначала докажем, что система может быть заменена систе¬ мой интегральных уравнений, а затем покажем, как с помощью теоремы 3.2 можно получить желаемый результат. Доказательство теоремы достаточно сложно. Необходимо, чтобы читатель хорошо понял формулировку теоремы, и не очень существенно, если он не усвоит так же хорошо ее доказательство. Теорема 3.14,х. Пусть Ап — открытое множество из Rn и (Т1У Т2) — открытый интервал (который может быть всем R или множеством ( t : t < < Т 2\ и т. д.). Предположим, что 1-1) /і (•*, и, /), f2 (х, и, f) . . .,fn (х, a, t) — непрерывные функ¬ ции, преобразующие Ап х Rm х (Tlf Т2) в R [см. уравнение (2.5)]; 1.2) частные производные dft (х, a, tydxj — непрерывные функции, преобразующие Ап X Rm X (Т„ Т2) в R; 1.3) xQ — элемент из Ап, tQ — элемент из (Tlt Т2); 1.4) и (т) — кусочно-непрерывная функция, преобразующая (Т±, Т2) в Rm. Существует функция ф (/), преобразующая интервал (/г, /2), содер¬ жащий /0, в пространство Rn, с компонентами фі (0, Фз (О, • • •> Фи (О, такая, что 2.1) ф (/) непрерывна на (/ь /2) и ф (/) £ Ап для t из (/ь /2); 2.2) ф (/0) - х0; (3.174) 2.3) ф (/) есть решение системы х(/)=/[х(/)> а(/), /], т. е. Ф/(0 = Ш(0, *(0> И (3.175) для і = 1, 2, . . ., п и всех точек t из (/ь /2), за исключением, возможно, счетного множества А точек t из (/г, /2). Далее, если ср (/) —другая функция, удовлетворяющая условиям 2.1, 2.2 и 2.3 на интервале (sx, s2), содержащем /0 (по условию 2.3), то ф(0 = Ф(0 (3.176) для всех t из (sn s2) n (/n Z2) [см. уравнение (2.3)]; иначе говоря, реше¬ ние единственно. Доказательство. Допустим, мы нашли решение ф (/), такое, что ф (/о) = Xq. Можно утверждать, что t ■ф(/) =-х0 + м(т), T]dT. (3.177) О 1 См. литературу [46], [51], [180] и [196]. 112
Так какф (т) — f [ф (т), и (т), ті везде, за исключением счетного множества точек А из (/ь /2); f непрерывна, а ф и и кусочно-непрерывны х, то их можно интегрировать для получения соотношения (3.177). С другой сто¬ роны, предположим, что ф (/) удовлетворяет уравнению t x(t) = xQ Ч- ^/[х(т), а(т), T]dx, (3.178) Іо т. е., что ф (/) удовлетворяет уравнению (3.177). Тогда ф (/0) = лг0 и ф (/) = f [ф (/), и (t), t] везде, за исключением счетного множества то¬ чек А из (tlf t2). Попытаемся найти решение интегрального уравнения (3.178). Пусть х0 ç Ап и /0 G (Тъ Т2). Так как Ап — открытое множество, существует сфера S (х0, À) с центром в х0, целиком содержащаяся в Ап (см. определение 3.4), и, следовательно, если Х<<Х, замкнутая сфера S (х0, X) целиком содержится в Ап. Аналогично мы можем найти р, >> О, такое, что замкнутый интервал [/0— р, tQ + р] целиком содержится в (Гі, Т2). Другими словами, если ||* —*о||<А, и |/— /0|<р, (3.179) то X g Ап и t ç. (Tlf Т2). Далее, и (т) — кусочно-непрерывная функция на I/o — И, /0 + pl следовательно, существует замкнутая сфера S (0, ѵ) с центром в начале координат пространства Rm, такая, что и (т) принадлежит к S (0, ѵ) для всех т из [/0 — H, to + р]. Заметим, теперь, что множество S (х0, А) X S(0, v) X По — р, + р] замкнуто и огра¬ ничено, если его рассматривать как подмножество из Rn+l+fn, и, следо¬ вательно, компактно (см. § 3.6). Тогда существуют числа М и N такие, что если .V и t удовлетворяют неравенствам (3.179), то ||/[х, /]|| < М (3.180а) и «(/), /]|<?Ѵ (3.1806) для г, / = 1, 2, . . ., п. Выберем р < р, такое, что для некоторого заданного k, 0 <^k <1, удовлетворяется соотношение p<min{A> _L_|. (3.181) Рассмотрим интервал [/0 — р, /0 + РІ и функциональное пространство С (По — р, + р], Rn) всех непрерывных функций, преобразующих этот интервал в Rn с нормой [см. уравнения (3.124) и (3.131)1. Как было показано в § 3.15, (£ (По — р, /0 + pL Rn) является полным. Если X — подмножество из С ([/0 — P, h + pl, Rn\, определенное, как X = {ф : II ф (т) — х0 II < X для любого т из [/0 — P, h + P1} » (3.182) то нетрудно убедиться, что X есть замкнутое1 2 подмножество из Q, (Ио—р, tQ + pl, Rn) и, следовательно, является полным. Пусть теперь Т — преобразование X в себя, заданное соотношением t Т(дб)(/) = х0 +J/[96(t), «(т), т]Л. (3.183) Іо 1 См. замечания в конце § 3.11. 2 fm-+fu Wfm — Xoll^rZ, отсюда ||/_^Хо1|^||/—/ап+//п — Хо||^||/ап — Хо!| + + 11/ — fm\\ С À --h II/ — frn\\, и наше утверждение доказано. 113
Иначе говоря, если ф (т) — непрерывная функция на [/0 —р, /0 + pL изменяющаяся вблизи х0, то Т (ф)—непрерывная функция на[/0—р, ^o+p L величина которой в каждой точке t задается уравнением (3.183). Теперь убедимся, что Т действительно преобразует X в себя. При этом заметим Г(0б)(О — *о|| = j*/[$(T), «(т)т]Л to —/0|тах||/[дб(т), м(т)т]||< < рМ < по уравнению (3.180а); < М = X по уравнению (3.181). (3.184) (3.185/ (3.186) (3.187) Докажем, что Т есть сжатие на X [см. § 3.5 и уравнение (3.12)]. Покажем, что если ф^ и дб2 — элементы из X, то \\Т (фу} - Т (ф2}\\ с k № - #2||, (3.188) где k — заданное число между 0 и 1 [см. уравнение (3.181)]. Пусть t £ Ио — р, t0 + РІ. тогда Т(ф1)(і)-Т(ф2)(і)\\= J [/[^(т), и(т), х]-/[ф2(х), «(т), т]} dx < t < УіІЛбМт), »(т), х\—Лф2(х), и(х), x]||dx < to < |/ — /0| max II/[фг (т), и (т), т] — f (ф2 (т), и (т), т] || < < prfN ||g0! — g62|| < (3.189) (3.190) (3.191) — 0б2|| (3.192) по уравнению (3.181). Переход от неравенства (3.191) к выражению (3.192) требует доказа¬ тельства. Это можно сделать, воспользовавшись уравнениями (3.70а), неравенством Шварца (2.87) и уравнением (3.1806) (см. упражнение 3.15). Так как Т есть сжатие, то, согласно теореме 3.12, существует единствен¬ ная функция ф (/) из X, такая, что (3.193) т. е. t ■ф(/) = лго+ J/ltCO- и(х),х] dx. (3.194) to В силу уравнения (3.178) и рассуждений, приведших к нему, мы видим, что ф (/) — искомое решение на интервале (/0 — р, h + р)- Предположим теперь, что ф и ф— два решения, определенные на интервалах t2) и (sn s2) соответственно. Рассмотрим множество (G, t2) П (sn s2), которое не может быть пустым, поскольку t0 принад¬ лежит к нему. Отметим, что (/ь П ($і, s2) = (max{/1, sj, min{/2 s2}), (3.195) т. e. (fb t2) П (sb s2) является интервалом (mn m2), где/?ц = max {/b sj и m2 = min (/2, s2). Предположим, что т — точка из (т1У т2), такая, что Ф(т)^^(т). (3.196) 1 Из уравнения (3.111). 114
Положим, для определенности, что /0 <Л Если Е — множе¬ ство точек из Ко, т), в которых if = дб, то Е имеет верхнюю границу, а следовательно, и наименьшую верхнюю границу, которую мы обозначим через о х. Определим, принадлежит ли о к Е? Если о g £, то тогда существовал бы открытый интервал при о, (о — е, а + е), содержащийся в Е, поскольку мы можем применить наше доказательство условий 2.1, 2.2 и 2.3 теоремы 3.14 к задаче с t0 = о и х0 = if (а) = ф (о). Но по¬ следнее приведет к тому, что в £ будет содержаться элемент, больший, чем о. Это невозможно. Следовательно, о не принадлежит к £. Однако в £ существует последовательность элементов которая сходится к о, так как о — наименьшая верхняя граница £. Поскольку ф непрерывна, lim ф Çtm) = ф (о) и if (Z) непрерывна, Ііігмф Çtm) = if (о). Но ф (tm) = = if (/m) для всех m, что означает ф (о) = if (о), т. е. о принадлежит к Е. Это противоречие доказывает, что неравенство (3.196) выполняться не может, и завершает доказательство теоремы. Упражнение 3.15. Докажите справедливость перехода от уравнения (3.191) к уравне¬ нию (3.192). Указание: рассмотрите, скажем, [фг (т), и (т), т] — [ф2 (т), и (т), т]. В силу уравнения (3.70а) существует точка гфх (т) + зф2 (т), r+ s= 1, г, 0 в Ап такая, что |fx (s), и (т), т] — fx [gS2 (т), и (т), т]| = |( \гфх (т) + зф2 (т), и (т), т], фг (т) — ф2 (т) )|. Используйте неравенство Шварца (2.87) и уравнения (3.1806) и (3.45). Проиллюстрируем доказательство теоремы, проделав все эти выклад¬ ки на простом примере. Пример 3.53. Пусть А2— все пространство R2 и (7\, Т2) — открытый интервал (0, 1). Выберем f± (хь х2, и, t) — х2 + и и f2 (хъ х2, и, t) = — хг. Если и (/) = ——-—р-, г (t 1 ) то и f2 удовлетворяют условиям 1.1 и 1.2 теоремы 3.14. Пусть х0 — 0 и t0 = началь¬ ные условия. Мы хотим решить систему уравнений вида xi(t) = x2(t) + <(Д ; *г(0=— Xi(t). Если if (/) — решение системы с if ("g") =0’ тогда имеем ■фі (О = Ф2 (0 + z L 1) ; Фг (0 = — Фі (О- Интегрируя, получим t 1 Фі (П = 0 + j f ф2 (т) + T(TL 1) ] dT: *0 t if2 (t) = 0— Jipx (T)dx. to (3.197) (3.198) (3.199) 1 о удовлетворяет условиям: 1) t для всех t из Е и 2) если о' t для всех t из Е, то о' о. 115
Таким образом, мы хотим решить систему интегральных уравнений: t Х1 (t) = J U (T) + T(TLU] Л; t0 k } 1 Хг (0 = — J xi (t) (3.200) dr. Поскольку Т?2 открыто и сфера S (0, 2) содержится в /?2, то для удобства можно при¬ нять Х= 1. Возьмем ц = -т- и отметим, что если -у-], то и (т) = —~—— 4 I 4 ’ 4 J т(т —1) 16 161 т* -X-, ~ô" • Іаким образом, мы рассматриваем О о J принадлежит сфере 5 компактное множество S(0, 1) X z—, -77- X —7-, -г- === У- На этом множе- I 3 3 J 14 41 стве У II/(X, и (t), ОН ]/| + + 2 (~у ) + 1 < 7 и I u(t), /] |^1. Выбрав /? = , будем пытаться найти р^~- , такое, что . ( 1 1 I 1 Р^гтпп Мы можем принять р = и рассматривать пространство ’ ^2) и замкнутое подпространство X этого пространства, определенное как X = { ф : max <Pj| -€R4; (3.201) где Преобразование Т пространства X в себя представляется соотношениями Замечаем, что Т{ф) (/) = гг ? T (Т — 1) J — J Фі (T) dv 5 т _1_ 8 (3.202) (3.203) p=-|-, М =7, Х= 1. О Проверим, является ли Т сжатием, т. е. убедимся, что иг (Л) (0 - т (вб2) (011^4-і:061 - X , Г 3 5 1 любого / из , — L 8 8 J для 116
Имеем t ІіП^іИО — Т(ф2) (Ollsg [ (t), « (т), т] — /[g62 (т), и (т), r];|dT-ç 1/г p I max (T), «(T), T]— /[fi62(T), U (T) T]||^ <:ÿx4z 1 xll^ - - 0(М, (3.204) где p , n2 - - 4, N = 1. O Читателю следует самостоятельно проверить все вычисления. Главным выводом этих рассуждений является то, что существует единственное решение г|? (/) системы (3.200), определенное на интервале Г—, -~1 с гр —0. Можно показать, что L о о J \ 2 / Прокомментируем теорему 3.14 и ее доказательство. Замечание 1. Мы не делали никаких предположений относительно существования или непрерывности частных производных от f. по компо¬ нентам и- вектора и. Это будет очень существенно для гл. 5. Замечание 2. Пространство Rm можно заменить любым его подпро¬ странством, содержащим замыкание (см. определение 3.9) области изме¬ нения и (т). Теорема останется справедливой, если мы несколько ослабим сделанные предположения, заменив повсюду пространство на замы¬ кание области изменения и (т). Это замечание имеет исключительно боль¬ шое значение при рассмотрении задачи управления и ограничений в гл. 4. Замечание 3. Теорема является частным результатом, так как суще¬ ствование и единственность решения обосновываются только для неко¬ торого интервала [а именно, (/п /2)1 около начального времени t0. Если читатель вновь рассмотрит пример 3.48, он оценит значение этого заме¬ чания. В следующем параграфе мы покажем, что общий результат может быть получен для линейных систем (см. теорему 3.15). Замечание 4. Мы сформулировали и доказали теорему в том виде, в каком она нам потребуется в дальнейшем. Однако условие 1.2 является более строгим, чем это необходимо. Действительно, теорему обычно фор¬ мулируют и доказывают, заменив условие 1.2 так называемым усло¬ вием Липшица: Существует постоянная R > 0, обладающая тем свойством, что |І/(х1) и, и, ОН <Ккі — для всех хх, х2 из Ап, и из Rni и t из (Т\, Т2). Незначительное изменение доказательства дает тот же результат, если заменить этим условием усло¬ вие 1.2 (см., например, [25] или [46]). Замечание 5. При формулировке теоремы мы полагали, что Ап — открытое множество и (Т\, Т2) — открытый интервал. Эти предположе¬ ния были сделаны для того, чтобы исключить точки в пространстве и 117
во времени, в которых решение не может быть определено, т. е. исклю¬ чить из рассмотрения так называемые «особые» точки. Если, например, рассмотреть систему dx _ 1 dt X — 2 * то не существует решения, проходящего через точку х = 2. хотя суще¬ ствуют единственные решения, проходящие через точки, неограниченно близкие к X — 2. Аналогично отсутствует решение уравнения примера (3.48) в точке t = 0, т. е. для уравнения dx __ 1 ~dt " ~Г' Теорему 3.14 мы будем очень часто использовать в дальнейшем. 3.19. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ. ОСНОВНЫЕ ПОЛОЖЕНИЯ Рассмотрим специальный класс систем дифференциальных уравне¬ ний — так называемые линейные системы. Эти системы имеют большое значение, поскольку они очень часто используются для представления динамического поведения физических систем, встречающихся в инженер¬ ной практике. Для систем такого типа можно получить точное аналити¬ ческое решение, что в высшей степени способствует успеху общего подхода к практическим задачам. Определим понятие термина «линейная система». Определение 3.43. Пусть Ап — открытое множество из Rn и (Тъ Т2) — открытый интервал (который может быть всем 7? или множеством {/:/>» > 7\) и т. д.) Пусть ѵ (t) — кусочно-непрерывная функция из (Т\, Т2) в Rn и A (t) — непрерывная функция из (Тъ Т2) в множество 9ÏÏ (п, п) всех п X п матриц (сравнить с окончанием § 3.14). Тогда система урав¬ нений х(/) = Л (/)*(/) 4 v(t) (3.206) или эквивалентная ей система уравнений п х, (0 = 2 (3.207) /=1 где і — 1, 2, . . ., п и А (/) = \аі} (/)] (ai] (t) — элементы матрицы A (t)) и Vx (/), v2 (/), . . ., vn (/) — компоненты v (/), называется линейной системой с вынуждающей функцией ѵ (/). Систему ^(0 = 2 «о (0^/(0 (3.208) /=1 или эквивалентную ей x(t) = Л (/)*(/) (3.209) часто называют однородной (гомогенной, свободной, без входного воз¬ действия) частью линейной системы. Если Л (/) — матрица, состоящая из постоянных элементов, т. е. Л (/) = А = (aif) для любого t из (Tlf Т2), (3.210) то говорят, что такая система является системой с постоянными парамет¬ рами (инвариантная по времени или система с постоянными коэффициен¬ тами). В противном случае система называется системой с переменными параметрами. 118
Пример 3.54. Пусть А (Z) = Л — диагональная матрица с различными тами Хх, 2с2, . . ., кп вдоль диагонали. Тогда система элемен- (3.211) *1 (/) Х2 (t) — Хі 0 0 . , Х2 . , . . 0 “ . . 0 X, (0 х2 (0 хп (0 _ 0 0 . . • _ Хп (t) есть однородная линейная система с постоянными параметрами. Эту систему можно запи¬ сать в векторной форме =Лх(О (3.212) или в виде хі (/) = Х/х/ (/), і = 1, 2, . . п. (3.213) Из этого последнего уравнения легко заключить, что векторная функция ф (/) с ком- понентами ф, (г) = ае 1 есть решение этого уравнения: ф (0) = г, где с — вектор с компонентами сг, с2, . . ., сп. Обратимся к формулировке и доказательству теоремы существования и единственности (теорема 3.14) для линейной системы. Наиболее сущест¬ венным является то, что решение линейной системы оказывается опреде¬ ленным везде, где определена система [т. е. решение ф(/) теоремы 3. 14 определено на всем интервале (Тх, Т2)]. Теорема 3.15. Пусть (7\, Т2) — открытый интервал и Л (/) — непре¬ рывная функция, преобразующая интервал (Т Т2) в множество п X п матриц 9ïï(n, ri). Предположим, что v (t) —кусочно-непрерывная функ¬ ция, преобразующая (7\, Т2) в Rn, и что х0 6 Rn, tQ С (Tx, T2). Сущест¬ вует функция ф (/), преобразующая весь интервал1 (Тх, в Rn с ком¬ понентами фх (/), ф2 (/), . . ., фп(0 со свойствами: 1) ф (/) непрерывна; 2) ф (/о) X о, 3) ф (0 — решение линейной системы x (t) = А (/) х (t) + г>(/), т. е. ф(/) = А (ОФ (0 + *>(/); (3.215) 4) Ф(0 —единственное решение: любая функция, удовлетворяющая условиям 1, 2 и 3, совпадает с ф (/). Доказательство. Если положить/(х, ѵ, f) = А (/) х + ѵ, то очевидно, что / удовлетворяет предположениям теоремы 3.14. Таким образом, можно найти единственное решение уравнения (3.215) на некотором подынтер¬ вале (/х, /2), содержащем /0, из (7\, Мы хотим показать, что (/х, t2) может быть принят равным всему интервалу (Тх, Т2). Условие 4 тогда окажется следствием теоремы 3.14. Примем, что д5°(/)= для t из [sx, s2]; (3.216) Функция ф^ (/) — непрерывная, т. е. ф° (О Е G ( [sx, s2 ], Rn). Определим по¬ следовательность элементов ф (t) множества G([sx, s2], Rn), положив t $'(t) = x0+ J (Л(т)бб'-1 (t) -h ü(T)} dx, / = 1,2, ... (3.217) 10 1 Это главное отличие от результата теоремы 3.14, справедливого лишь на участке интервала (Тх, Т2). 119
Последовательность ф1 сходится равномерно (см. определение 3.11) в этом пространстве по отношению к норме, определенной соотношением (3.124). Положив это утверждение справедливым, обнаруживаем, что в пространстве (Е ((sx, s2], Rn) должен существовать элемент ф, к кото¬ рому сходится последовательность фі [поскольку £ ([s15 s2], Rn) является полным, см. §3. 15). Но тогда ф (/0) = и последовательность t х0 + J {Л (т)# (т) + г»(т)} Л = фі+1 (t) сходится к t х„ + J [Л (т)дб(т) + г>(т)) dr t о (см. упражнение 3.16). Следовательно, для t из [st, s2] t ФУ) =х0+ J (Л(т)дб(т) -I- г»(т)} dr (3.218) <0 и ф есть решение уравнения (3.215) на этом интервале. Таким образом, остается доказать, что ф1 — равномерно сходящаяся последовательность. Для t из [sj, s2] имеем II# (0 — #(0|| = J (Л (т)х0 + ѵ(т)) dr К где М — постоянное число. Далее t ||#(/)-#(/)|Н J (Л (т) {ф' (т)—#(т)]) t0 t ^Nn2 f M |t — Zo| dr < ^0 > —/O|A1, (3.219) (3.220) (3.221) где W — число, такое, что \аи- (/)| < N для t из [sb s2]. По индукции можно показать, что І!#+1 — #ІІ < М l"Wy-si)]' . (3.222) Напомним, что оо M[n2iV(s2 — Sx)]' __ (s2-s,) /! /=0 (3.223) и, следовательно, последовательность ф' сходится равномерно, так как V—1 И#+ѵ _ ф1 С ln<V(.sp.s,)]^ + ;! (3.224) Таким образом, теорема доказана. Упражнение 3.16. Покажите, что последовательность (/) сходится к t х0 + J {А (т) ф (т) + V (т)} dr. 120
Указание: Фі+' (О - t х0 + j" (4 (T)fl6 (т) + <o (т) ) dx ; и j |4 (т)[д6' (т) —g6(T)]) t,. Il sg|Z —Z0|Ata2||fl6' — A где УѴ — то же число, что и в уравнении (3.221). В § 3.17—3.19 мы обозначали решение системы дифференциальных уравнений символом ф (/). В дальнейшем часто не будем делать различия между решением системы и ее переменными. Иначе говоря, будем писать х (t) вместо ф (/) для обозначения решения системы х — f(xt и, t), (3.225) с того, 3.20. ФУНДАМЕНТАЛЬНАЯ МАТРИЦА Используем теорему 3.15 для того, чтобы получить «полное» решение задачи с начальными условиями для линейных систем. Начнем этой системы (3.226) где \ различны. Мы видели, что решение ляется соотношением X (/) при X (0) = с опреде- х(/) = eAtc, (3.227) где eAt обозначает диагонали: диагональную матрицу с элементами ечі вдоль (3.228) 0 0 ... № Предположим, что мы хотим найти решение уравнения (3.226), удов¬ летворяющее начальному условию х(/о)^аго- Нетрудно видеть, что оно выражается соотношением x(/):=eA(^o)xo= (3.229) = eAt-e~A^xQ. (3.230) Иначе говоря, как только определена матрица eAt\ легко найти полное решение задачи с начальными условиями. Таким образом, матрица eAt является поистине фундаментальной для решения задачи с началь¬ ными условиями. Цель настоящего параграфа: 1. Показать, что с каждой линейной системой ассоциируется матрица вполне определенного вида. 2. Изучить свойства этих матриц. Предположим теперь, что (7\, Т2) — открытый интервал, А (/) — непрерывная функция, преобразующая этот интервал в множество п X п 121
матриц 9Л (п, п) и V (/) — кусочно-непрерывная функция, преобразующая (Tlf Т2) в Rn, Рассмотрим линейную систему л;(/) = 2««/(0х;(0 + ч(0. * = 1. 2 п, (3.231) /=1 где А (0 = (аі} (/)). Эту систему можно записать в векторной форме в виде лг(/) = А (t)x(t) + *>(/). (3.232) Предположим, что tQ — элемент из (7\, 7\). Сформулируем следую¬ щую теорему: Теорема 3.16. Пусть — множество всех решений однородной части уравнения (3.232) [см. определение 3.43 и уравнение (3.209)1, т. е. урав¬ нения х (t) = A (t)x(t). Иначе говоря, = {х(0* x(t) — A(t)x(t) для t из (7\, Т2)]. (3.233) Тогда S? есть n-мерное векторное пространство, базис которого (х1(/), х2(/), . . ., xn(t)] можно получить, если принять х1 (t) за единственный вектор, удовлетворяющий условию X1(t0) = eh (3.234) где е2і ..., еп]'— натуральный базис1 в Rn. Доказательство. Очевидно, что функция х (/) = 0 для любого t при¬ надлежит к Эта функция называется тривиальным решением. Далее, если г и s принадлежат к R, а х (t) и у (/) принадлежат к то [rx(0 + sy(/)] = rx(t) 4- sÿ(t) = = rA(t)x(t) + sA(t)y(t) = A(t)[rx(t) + sy(/)], (3.235) так что и rx (/) + sy (t) принадлежит к ©Л Предлагаем читателю самостоятельно проверить аксиомы 1—8 § 2.5 для S?, Покажем теперь, что (/) образуют базис в (см. §2.6). Предпо¬ ложим, что для любого t из (7\, Т2) п 2 с,х‘(/) = 0, (3.236) тогда z=i S CiX^to) = 2 = °> (3.237) /=1 i=\ что возможно только, если все с£ = 0. Иначе говоря, х1 (/) —линейно независимые функции. Если х (t)—любой элемент из то х (to) можно записать как линейную комбинацию eif т. е. x(t0) = 2 (3.238) 4 = 1 1 Напомним, что = 1 ■ 0 0 1 , • . еп=- 0 0 0 _0_ _1 _ 122
Докажем, что п x(t) = 2 для t из (Л> Т'іУ (3.239) Функция принадлежит к»У и совпадает с х (t) при t = /0, т. е. 2 ₽<■*' (^о) = х (/#)• Из той части теоремы 3.15, в которой доказывается единственность реше¬ ния, следует, что п x(t) = 2 Это и обосновывает утверждение (3.239). Определение 3.44. Фундаментальная матрица. Пусть Ф (/, tQ) есть п X п матрица, /-й столбец которой —вектор х1' (t) из причем (/0) = = 6j. Иначе говоря, столбцы Ф (/, /0)—решения однородной системы урав¬ нений (3.232), удовлетворяющие начальным условиям х1' (/0) цу Ф (/, /0) называют фундаментальной или переходной стемы (3.232): = е}-. Матри- матрицей си- Ф(Мо) = Х(о *î(o • • • x"(t) x'2(t) x22(t) ... x2"(/) (3.240) _4(0 Xn(t) • • • Xnn(t)_ где (/) — г-я компонента /-го вектора xj (/). Отметим, что Ф(^0, /о) = ‘1 о 0 ... 0’ 1 ... 0 (3.241) 0 ... 1_ уравнение (2.55)]. _0 где / есть единичная матрица [см. Мы видим, что Ф (/, /0), по сути дела, является функцией, преобра¬ зующей (7\, Т2) в множество всех іг X п матриц. Эта функция Ф (/, /0) дифференцируема (т. е. каждый коэффициент Ф (/, /0) есть дифференцируемая функция по t) и -^-Ф(/,/0) = Ф(/, /0) = Л(/)Ф(/, /«)• Для доказательства этого заметим, что элемент, стоящий в і-й строке и j-м столбце Ф (/, to), есть х- (t). Так как х} (/) есть решение однородной части нашей системы, имеем xi(t) = 2 aik(t)x'k(t), k=l где А (0 = (aik (/)). Но правая часть уравнения (3.243) в точности равна элементу і-й строки и /-го столбца произведения А (t) Ф (/, /0) [см. урав¬ нение (2.33) ], и, следовательно, справедливость уравнения (3.242) дока¬ зана. Это означает, что фундаментальную матрицу Ф (t,tQ) можно рас¬ сматривать как (единственное) решение матричного дифференциального уравнения, понимая под переменной X (t) п X п матрицу: *(/)= Л (/)*(/), (3.242) (3.243) (3.244) 123
которая удовлетворяет начальному условию Х(/о) = /. (3.245) Далее, если х0 — элемент из Rn, то можно обнаружить, что реше¬ ние x(t) однородной части уравнения (3.232), удовлетворяющее началь¬ ному условию x(t0) = х0, записывается в виде х(/) = Ф(/, tQ)xQ. (3.246) Покажем теперь, что матрица Ф (/, /0) — невырожденная для любого t (см. § 2.9). Есть несколько способов сделать это. Например, предположим, что Ф (/, Zo) — вырожденная матрица для некоторого t из (Тх, Т2). Тогда детерминант Ф (/, Zo), det Ф (/, Го), будет равен 0 и столбцы х1 (/) матрицы Ф (/, Zo) окажутся линейно зависимыми, т. е. 2М'(П=о- (3.247) /=1 где не все (37 = 0. Но функция п 2 М'(0 /=1 есть элемент множества всех решений [см. уравнение (3.233)]. Иначе говоря, мы имеем решение, равное нулю при t. Из единственности реше¬ ний следует, что это решение должно быть тривиальным, т. е. Р/Х'(0 = 0 Для любого t из (7\, Т2). (3.248) /=і Это противоречит тому, что х! (/) —линейно независимые функции. Следовательно, Ф(/, /0) — невырожденная для любого t из (Т1, Т2). (3.249) Попытаемся найти матрицу, обратную Ф(/, /0)- Покажем сначала, что Ф(?, /1)Ф(/1, Г0) = Ф(Л Л>) (3.250) для любых /, С и /0 из (Тъ Т2). Это свойство называется переходным свойством матрицы Ф (/, /0). Пусть х0 — элемент из Rn. Известно, что x(t) = Ф (/, t0)x0 (3.251) есть единственное решение однородной части уравнения (3.232) с x(t0) = = xQ. Следовательно, х(/1)-Ф(/1, /о)хо (3.252) и х(?) = Ф(/, /о)-*го. (3.253) Если положить хг = x^t]), то единственное решение xA(f) однород¬ ной части уравнения (3.232) с x1(f) = x1 определяется формулой Х!(/) = Ф(/, і^х^ (3.254) Из единственности следует, что х(7)-xjî), (3.255) откуда получим Ф(Л /о)АТо = Ф(С ^і)Ф(/і, Л))-Ко (3.256) 124
(рис. 3.29). Уравнение (3.256) выполняется для любого х0 из Rn, что и доказывает справедливость уравнения (3.250). Так как Ф(/о, U = Л то уравнение (3.250) означает, что матрица, обратная к Ф (/, t0), есть Ф (/0, t) т. е. Ф~’(/, /0) = Ф(/0, /). (3.257) Имея в виду это свойство, можно написать полное решение задачи с на¬ чальными условиями для системы (3.232). Для решения системы уравнений (3.232) напишем формулу Рис. 3.29. Переходное свойство фундаментальной матрицы х(/) = Ф(/, /o)Uo + t 1 4- J Ф- 1 (т, /0) ѵ (т)Л = (3.258) Іо J {f 'j х0 -I- j Ф(/о, т)©(т)гіт|. (3.259) to J Так как [ 1 х(/0) = Ф(/0, /0) х0 + /ф-Цт, /0) ®(т)Л = (3.260) I to / = lx0 = xQ, (3.261) то начальное условие удовлетворяется. Проверим теперь, обращается ли в тождество выражение (3.232) при подстановке в него x(t). Имеем {і і xQ + J ф-1 (т, /0) ѵ (т) гіт + Іо х0 + |ф-*(т, /0)г»(т)Л = G Xo + j Ф-1 (т, /о)0(т)й(т +Ф(Л /0)Ф-1(Л = (3.262) = А (i)x(t) + v(t) [из уравнения (3.242)]. (3.263)1 Итак, X (t) есть решение уравнения (3.232), которое можно записать в виде суммы двух членов t Ф(/, t0)xQ и Ф(/, /0) Ф-1(т, /0)г!(т)гіт. (3.264) Іо Первый член представляет собой решение однородного уравнения, а второй зависит от вынуждающей функции. Обратимся теперь к примерам. Пример 3.55. Рассмотрим систему вида Гхдоі Г 0 g (01 Г-ч (01 (01 ;2(о]~1-£<о о Jb2(oJ + k(oJ’ (3-265) где g (0 и ѵі (t) кусочно-непрерывны. Попытаемся найти решение этой системы, удовлетво¬ ряющее начальному условию X (0) = л, (3.266) 1 Уравнение справедливо для t из (Тг, Т2) — A, А — счетное множество точек. 125
где л — заданный элемент из /?2. Однородная система записывается в виде ч (О = g(0*2 (*); I х2 (0 =— g (t}xY (/). j (3.267) Если принять, что X1 (/) и х2 (0 равны: t t cos J g (t) dx sin J g (t) dx х1 (О = 0 t ; x2(/) = 0 t — sin J g(T) dx cos J g (t) dx 0 0 (3.268) то легко убедиться, что х1 (/) и х2 (/) являются решениями системы (3.267), причем х1 (0) = ег и X2 (0) = е2. Примем Ф(С 0) = t t COS J g (T) dx sin J g (t) dx о о t t — sin J g (t) dx cos J g (t) dx о 0 тогда искомое решение уравнения (3.265) будет выражаться формулой X (0 = Ф (t, 0) < л (т, ' ) Ф (т) dx (3.269) (3.270) Упражнение 3.17. Рассматривая систему примера 3.55, необходимо показать, что а) Ф (0, 0) = /; Г 0 g(01 ‘’‘■’•"-Lw « г“-№ в) Ф-1 (/, 0) = Ф (0, /); г) эвклидова норма Ф (/, 0) л та же, что и эвклидова норма л (см. § 2.13). Свойство г) устанавливает, что Ф (/, 0) есть ортогональная матрица (см. § 2.14). Пример 3.56. Имеем Векторные функции линейно независимы, но х1 (0) и х2 (0)—линейно зависимые элементы /?2. Следовательно, ф (t) не может быть фундаментальной матрицей линейной системы. Пример 3.57. Рассмотрим однородную систему À (О х2 (/) ГО 1 [о t (3.271) Легко видеть, что фундаментальная матрица системы имеет вид Ф(*> /о) = *о т2 е 2 е2 dx to t2 f0 t2 2 e2 (3.272) 0 126
Решение х (t) системы при х (/0) = л = 1 к*^2. определяется формулой X(t) =Ф(/, /0) л = (3.273) Упражнение 3.18. Проверьте уравнение (3.250) для матрицы Ф (/, t0) (3.272). Предполагая, что /0 = 0, обозначим фундаментальную матрицу си¬ стемы через Ф (/) вместо Ф (/, 0). Это замечание важно, в частности, для последующих параграфов. СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 3.21. ЭКСПОНЕНТА ОТ At Обратимся к частному, но очень важному классу систем, а именно: к системам с постоянными параметрами. Рассмотрим системы вида х(/) = Лх(/) + і!(а (3.274) где А = (аи) — постоянная матрица, называемая матрицей системы (см. определение 3.43). Система из примера 3.54 является системой с постоянными парамет¬ рами с матрицей Л. Для начала введем некоторые определения, полезные для обсуждения такого рода систем. Определение 3.44а. Если дана линейная система с уравнением вида (3.274), то будем называть собственные значения матрицы системы А (см. § 2.10) собственными значениями системы и говорить, что фунда¬ ментальная матрица Ф (/) есть экспонента от At. Вместо Ф (/) будем запи¬ сывать eAt, т. е. <&(t) = eAt (3.275) (сравните с примером 3.54). Для любой матрицы В размера п X п экспонента от Bt, eBt опре¬ делена, поскольку это есть фундаментальная матрица однородной системы вида *(/) = Bx(t\ (3.276) Поясним, почему мы использовали термин «экспонента от Л/», и тем самым установим свойства eAt. Во-первых, из уравнения (3.241) следует, что ф(О) = ело = /. (3.277) Во-вторых, из уравнения (3.242) имеем eAt = АеА, (3.278) В-третьих, уравнение (3.250) принимает вид eA(î'-ti)eAti ^eAÏ^ (3.279) и поэтому еА (r+s) — eAr-eAs. (3.280) Наконец, решение уравнения (3.274), удовлетворяющее начальным условиям х(0) = |, (3.281) 127
определяется формулой t X (t) = eAt^ + eAt J e~~Axv (?) du - (3.282a) о = eAtl + Je-4 <(-T>t>(T)rfr. (3.2826) 0 Покажем теперь, что A и eAt обладают свойством коммутативности и что мы можем рассматривать eAt как сумму бесконечного ряда матриц. Предположим, ѵ — произвольный элемент из /?п. Покажем, что как AeAtvt так и eAt Аѵ являются решениями системы x(t) = Ax(t), (3.283) удовлетворяющими начальному условию х(0) = Аѵ. (3.284) Очевидно, АеАоѵ =- А/ѵ = Av (3.285) и еЛ0Лг> = /Аѵ = Av, (3.286) так как и АеАІѵ, и eAtAv удовлетворяют уравнению (3.284). С помощью уравнения (3.278) находим -±-(AeAtv) = A-^r(eAt)v = A(AeAlv) (3.287) и -^-(еАІАѵ) = -^-(eAt)Av = A(eAIAv). (3.288) Из единственности решения уравнения (3.283) следует, что для лю¬ бого t AeAtv - eAtAv. (3.289) Но поскольку V — просто элемент из 7?п, А и eAt обладают свойст¬ вом коммутативности, т. е. AeAt = eAtA для любого t. (3.290)1 Далее эвристически покажем, что eAt можно рассматривать как бес¬ конечный ряд 2 l + At + Æ-J- + ••• +^7Т+ (3.291) или в более компактной форме записи °° k (3-292> k=0 1 (ÂeAt —eAtA)v= 0 для любого ѵ из Rn, см. также замечание в конце § 2.7. 2 Если определить норму матрицы Д, положив ||Д || = max {| аг/- |; i, j — 1, 2, . . .,. . . п}, то можно показать, что ряд (3.291) сходится при таком нормировании для любого t, и его можно почленно дифференцировать. Опираясь на это, можно строго доказать спра¬ ведливость уравнения (3.292). Заметим, что в общем случае элементы eAt не являются функциями е ч . 128
При t = 0 ряд превращается в /+ ЛО + А2-Х + = /. (3.293) Если почленно продифференцировать ряд (3.292), то получится соот¬ ношение d I V Ak V л* dt I / 2- £•' dt A'- P ! <3.294) (3.295) Это означает, что ряд удовлетворяет дифференциальному уравнению вида X(t) = AX(t), (3.29Ô) где X (/) — переменная матрица размера п X п. оо Еслиіі — произвольный элемент из Rn, тоеА(ѵ и У -p-ü являются k=^ решениями уравнения (3.283), удовлетворяющими начальному условию X (0) = ѵ, и, следовательно, уравнение (3.292) справедливо. Предположим, что В есть п X п матрица, подобная А 1см урав¬ нение (2.64)1, т. е. существует невырожденная матрица Р, удовлетворяю¬ щая условию В ^-Р АР. (3.297) Покажем, что eBi =P~eAtP. (3.298) г Пусть снова ѵ — произвольный элемент из Rn. Рассмотрим функ¬ ции еВІѵ и Р-хеАІРѵ. Покажем, что обе эти функции являются реше¬ ниями системы x(f) = Bx(t), (3.299) удовлетворяющими начальному условию х (0) = ѵ, откуда и будет сле¬ довать справедливость уравнения (3.298). Очевидно, eBtv удовлетворяет уравнению (3.299) и условию х (0) = ѵ. Имеем P~'eAQPv = Р ЧРѵ = Р-'Рѵ = Іѵ = ѵ (3.300) и -^-(P-'eAlP)v = Р-'= (3.301) = P~'AeAtPv = (3.302) = Р-'А (РР ' ) eAtPv = (3.303) = PlAPP-'eAtPv = (3.304) = B(P-'eAlPv). (3.305) Таким образом, P~xeAtPv удовлетворяет уравнению (3.299) и усло¬ вию X (0) = V. Следовательно, если А и В — подобные матрицы, то eAt и eBt также являются подобными матрицами. 5 Атанс и др. 129
Пример 3.58. Пусть А есть 2X2 матрица Г1 Я [о о]’ Легко видеть, что А2 = А, и, сле¬ довательно, еЛ(=/Ц-А +-J- + •..)=/ + (?- 1)А = Заметим, что еАІ значительно отличается от матрицы 1 1 которая получается, если элементы матрицы А заменить экспонентами от них. 3.22. СВЕДЕНИЕ К КАНОНИЧЕСКОЙ ФОРМЕ Рассмотрим задачу с начальными условиями х(/) = Лх(/); х(0) = І (3.306) Решение этой задачи может быть представлено в виде функции x(t) = eAtl (3.307) и связано с собственными значениями системы (или с собственными зна¬ чениями матрицы Л) х. Прежде всего рассмотрим влияние преобразования подобия [см. уравнение (2.62а) и уравнение (2.626)], а затем рассмотрим случай, когда собственными значениями являются различные действи¬ тельные числа. Предположим, что преобразование пространства Rn в себя задано как $-і(г>) = p-'v, (3.308) где P — невырожденная п X п матрица [см. уравнение (2.50)]. Можно определить преобразование SJS-"1 векторного пространства всех /?п-мерных функций на /?, положив Ф“Чх(/)] =Р-1х(/). (3.309) Обычно будем писать у(/) = $-і[х(/)] -P~W). (3.310) Нетрудно видеть, что у(/) =р-іх(/), (3.311) и, следовательно, уравнение (3.306) преобразуется в уравнение у(/)=р-іЛх(/)= (3.312) = P~xAPP~xx(t) = P-'APy (/) (3.313) с начальными условиями у (0) = Р-Чг(0) = Р-'І. (3.314) Если В — матрица, заданная как В = Р-'АР, (3.315) то В подобна Л, и мы имеем y(t) = By(ty, у(0) = Р-1|. (3.316) Решением задачи с начальными условиями для уравнения (3.316), согласно уравнению (3.262а), является y(t) =eBtP-'l. (3.317) 1 См. определение 3.44 и § 2.10. 130
Следовательно, x(Z) = Py(t) = Рев'Р-'1. (3.318) В силу уравнения (2.74) собственные значения систем (3.306) и (3.316) одинаковы. Предположим, что собственные значения А действительны и различны. Обозначим их через Х2, . . а через Л — матрицу собственных значений [см. уравнение (2.78)], т. е. "Л 0 ... 0“ 0 Х2 ... 0 _0 0 (3.319) Из § 2.10 известно, что существует невырожденная матрица Р такая, что Л = РАР~\ (3.320) Из уравнения (3.318) следует, что решение уравнения (3.306) дается соотношением х(0 (3.321) = р 0 ... 0 “ ... 0 (3.322) 0 e^2t Из выражения (3.317) _ 0 0 следует, что урав нение (3.316) записывается как у (/) = = е^2І т]2 (3.323). где т) = P~'ï = пГ 1 (3.324) e^ntn У ’!«_ Таким образом, мы связали решение нашей задачи с собственными значениями матрицы А. В более общем случае, предполагая, что собственные значения А — действительные числа, и обозначив через J = J(4) (3.325) жорданову каноническую форму от А [см. уравнение (2.80)], укажем на существование невырожденной матрицы Р, для которой J == Р~ХАР, (3.326) откуда, воспользовавшись преобразованием подобия (3.309), можно полу¬ чить х(0 в виде х(/) = Р^Р-1|. Можно показать, что если 70 0 ... 0" о Л ... о J — _о о ... Jp_ (3.327) (3.328) 131
где "X, 0 ... О" О Â2 ... о (3.329) 0 0... >.к_ h+m 1 о j-k+in (3 330) где /. j, X о. • . ., . . 1 ^k+m К+р — собственные значения А, то ~e,J- 0 . . . О " О e'J< ... О _ 0 0 . . . eIJp_ (3.331) В последней матрице приняты следующие обозначения: (3.332) и е и о о о о etJm — e,Kk-nn о ... о 1 ... о о . . о . . Л"-2 01 ( • • • (Ѵт - 2)! ООО 1 (3.333) где Jm есть матрица размера vnl X ѵт [46]. Здесь мы снова связали решение рассматриваемой задачи с собствен¬ ными значениями матрицы А. Если ввести в рассмотрение вынуждающую функцию ѵ (/), т. е. рас¬ сматривать задачу x(t) = Лх(/) + х(0) - I, (3.334) то легко видеть, что использование преобразования подобия y(/)-P’1x(/) (3.335) приводит к задаче У (/) = /н АРу (/) + Р'ѵ (/), у (0) - Р-1|. Положив В = Р ^АР, получим решение уравнения (3.336) у (/) = еВІ Р-Ч + J и g—Вт Р а решение х (/) уравнения (3.334) X (/) = PeBt t P*1! + е~Вх Р~1<о (т) dT й (3.336) (3.337) (3.338) 132
В частности, если собственные значения Х2, . . ., —действи¬ тельные различные числа и Л — матрица собственных значений [см. урав¬ нения (2.78) и (3.319)1, то t x(t) = PeAI + P J <'-*> Р~г<о (т) гіт. (3.339) О В дальнейшем мы будем часто пользоваться этой формулой и преоб¬ разованием подобия [см. уравнение (3.335)1. 3.23. ВЫЧИСЛЕНИЕ ФУНДАМЕНТАЛЬНОЙ МАТРИЦЫ С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ЛАПЛАСА Покажем, как с помощью преобразования Лапласа можно получить фундаментальную матрицу линейной системы с постоянными параметрами. При этом предполагаем, что читатель знаком с преобразованием Лапласа и его основными свойствами. Если X (t) — действительная функция «времени», то обозначим через X (s) преобразование Лапласа от х (t) и запишем x(s) - S [%(/)]. (3.340) Если задано х (s), то для отыскания х (t) можно воспользоваться обратным преобразованием Лапласа и записать x(/)-£-1[x(s)]. (3.341) Имеются подробные таблицы, позволяющие найти обратное преобра¬ зование Лапласа. Основное свойство преобразования Лапласа, необхо¬ димое для наших целей, формулируется следующим образом: если задана дифференцируемая функция х (t) с х (0) = t, то преобразование Лапласа от производной X (/) этой функции X (/) дается соотношением £[%(/)] = s£ [%(/)] (3.342) - sx(s) — g. (3.343) Пример 3.59. Если к (t) — eat, то х (s) = С [еа<1 = -у-!— и £ [х (/)] — sx (s) — 1 — s — a s — a Предположим, что х (t) есть я-мерная функция «времени» (т. е. /?) с компонентами х± (t), х2 (/), . . ., хп (/). Преобразование Лапласа отх (/) можно определить как /г-мерный вектор, компоненты которого являются преобразованиями Лапласа от компонент х (t), и написать х($) = £[х(/)], (3.344) считая, что компоненты х; (s) вектора х (s) равны %,•($)=-- £[xz(/)|, Z = 1, 2, . . ., и. (3.345) Если X (/) дифференцируема и х (0) = то £[х(/)1 = s£[x(/)] — I- (3.346) = sx(s) —|. (3.347) Если, наконец, С (t) есть п X т матрица с элементами Сц (/), то пре¬ образование Лапласа С (s) от матрицы С (/) можно определить как п X т матрицу, элементы которой cii (s) являются преобразованиями Лапласа от clf (t). Запишем C(s) = g[C(/)l, (3.348) 133
где Пример 3.60. Найдем преобразования заданных как c17(s) = 2[со(01. Лапласа от (3.349) вектора x (/) и матрицы С (t), (3.350) Имеем sin t x(0 = C(0 = и e ’ k t e cos О)/ (3.351) (3.352) (3.353) Используем теперь эти понятия для отыскания фундаментальной матрицы системы с постоянными параметрами. Прежде всего рассмотрим задачу с начальными условиями для однородной системы x(t) = Ax(t), x(0) = l. Известно, что ее решение записывается в виде х(0 = eAtl. Определим фундаментальную матрицу eAt. Беря преобразование Лапласа от уравнения (3.354), находим sx (s) — I = 4x(s), (3.354) (3.355) (3.356) откуда sx(s) — Ax(s) = I или эквивалентное выражение (sI-A)x(s) = g. (3.357) Если положить, что (3.358) то можно убедиться, что Q(s) = si — Л, (3.359) (3.360) det Q(s) = 0, тогда и только тогда, когда s = некоторому Xz, где Хь Х2, . . ., Хп —собственные значения матрицы Л, поскольку det Q(s) = det (s/ — Л) = 0 (3.361) тождественно с выражением det (Л — s/) = 0 (3.362) [см. уравнение (2.70)]. Следовательно, Q (s)—невырожденная матрица для всех s =# Хр і = 1, 2, . . ., п. Получим x(s) = Q-1(s)l = (s/-4)-1i (3.363) 1 34
Взяв обратное преобразование Лапласа, найдем x(t) = S"1 [x(s)J = g-1 ((s/ — Л Г1] |. (3.364) Поскольку решение системы единственно, заключаем, что eAt = Sr1 [(si — Л)-1]. (3.365) (si — Л)”1. Таким образом, чтобы найти фундаментальную матрицу eAt, мы должны образовать матрицу si — Л, инвертировать ее и затем найти обратное преобразование Лапласа от Пример 3.61. Дана система с матрицей X, (0 ”01’ Xi (/) . X2 (0 . 6 1 _ *2<f) _ А (3.366) (3.367) s — IT — 6 s — 1]’ det Q (s) = s (s — 1) — 6 = (s — 3) (s 4- 2): 1 Q (s) — si — А = (3.368) (3.369) - (s,3|b + 2) (3.370) S — 1 1 6 S s— 1 и (s — 3) (s 4- 2) 6 (s — 3) (s 4- 2) s (3.371) (s —3) ($ + 2) (s — 3) (s —р 2) cAt =£-i[(s/—Д)-і] = Г 2^4- 3e~~2t 5 еея‘-6е-21 5 e3t - e~~2t 5 3e3t 4-2e“2' 5 (3.372) есть фундаментальная матрица системы (3.366). Пример 3.62. Дана система с матрицей X, (0 - X2 (0 _ (3.373) Имеем Г—2 Л= -3 3' — 2 (3.374) [s 4- 2 — 3 3 s + 2 (3.375) det Q (s) = (s + 2)2 + 9; (3.376) — 2 — 3 31 ГхНП — 2J L л2(0 и Q-i (s) = (sl — АГ1 = s + 2 (s + 2)24-9 — 3 (s + 2)2 + 9 3 (s + 2)2+9 s + 2 (s + 2)2 + 9 (3.377) Следовательно, eAt = [(sZ — АГЧ = е 2t cos 3t е 2t sin 3/ —e~2t sin 3t e~2t cos 3/ (3.378) 135
Обратимся теперь к задаче x(t) = Ax(t) -г v(t); х(0) = I, (3.379) где V (/) — вынуждающая функция. Ранее мы показали, что решение этой задачи х (t) определяется фор¬ мулой t x(t) = еАЧ + еА' J е~Ахѵ (т) ih. (3.380) О Дадим интерпретацию этой формулы, используя преобразование Лап¬ ласа. Вычислим X (/), взяв преобразование Лапласа от обеих частей урав¬ нения (3.379). Сделав это, получим sx(s) —£ = Ах (s) + ü(s), (3.381) откуда (si — A)x(s) = | + v(s). (3.382) Полагая, как и ранее, Q (s) = si — А, найдем x(s) = 4- Q~l(s)v(s). (3.383) Обратное преобразование Лапласа дает X(/) - Ÿ-1 [Q"1 (s)J I + S’1 [Q’1 (s) V(s)]. (3.384) Нам известно, что eAt - S-HQ-^s)]. (3.385) Определим, что представляет собой У"1 [Q-1 (s) v (s)]. Если (t) и f2 (t) —две действительных функции t, причем Й[Л(/)]-A(s) и Й[/2(/)]-/2(s), (3.386) то /i(s)72(s)-£[(A*/2)(/)], (3.387) где (/i*/2) (t) есть свертка и /2, которая записывается в виде (/і*72)(О = —т)/2(т)Л. (3.388) Очевидно, что t 2”IA(s)72(s)] =-(Л*/2)(0 = Ул(/-т)/2(т)4/г. (3.389) и Предлагаем читателю убедиться, что 2’1 IQ’1 (s) V (s)) = J еА <'-*> <о (т) di. (3.390) U Таким образом, под несколько необычным выражением t eAt J е~Ах <и (т) di: о в уравнении (3.380) следует понимать не что иное, как свертку фундамен¬ тальной матрицы с вынуждающей функцией v (t). Упражнение 3.19. Имея в виду результаты, полученные в данном параграфе, рассмотрите задачу отыскания фундаментальной матрицы Ф (/, /0) для однородной системы с переменными параметрами х (t) = A (t) х (/) с помощью преобразования Лапласа. 136
Упражнение 3.20. Найдите матрицу eAt для следующих матриц: 3.24. СИСТЕМА л-го ПОРЯДКА Рассмотрим линейное дифференциальное уравнение n-го порядка с по¬ стоянными коэффициентами, которое мы запишем в виде +•••+«! т + ВД(0 = /(О- (3.391) Используя обозначение D = [см. обозначения (3.53)], можно записать {Dn + an_}Dn~} H h axD 4- aQ\y(t) = f(t). (3.392) Докажем, что такая система эквивалентна линейной системе п урав¬ нений первого порядка, собственные значения которой в точности равны корням полинома хп 4- ^п-іхП 1 ~Ь * * * ~Ь &іх + я0, (3.393) и покажем, как найти матрицу преобразования подобия в случае, когда собственными значениями системы являются различные действительные числа. Предположим, что у (/) — решение уравнения (3.391), и определим /г-мерную функцию х (/), положив хДО = </(/); X2(/) = X1(/) = f/(O; х3(/) = х2(/) = 4У (3.394) где (/) — компоненты х (t). Отсюда имеем А(0-л'2(/); Хп (0 = Я0А'і (/) #1*2 (0 * * * — ап~1Хп (0 4“ /(^)* 137
Эту систему можно записать в векторной форме в виде *і(0 0 1 0 0 0 х2(0 0 0 1 ••• 0 0 Хп-1 (0 0 0 0 0 1 xn(t) — а0 — ÛJ — а2■ • • — ап-2 — ап-і (3.396) или, сокращенно, где А = (3.397) "О 1 0 ... О О “ 00 1 ... о о 0 0 0 0 1 _ ^0 ^1 ^2 ^п-2 «п-1_ (3.398) v(t) = . . (3.399) С другой стороны, если а: (/) — решение уравнения (3.396), то сразу видно, что функция у (/) = %і (/) [первая компонента х (/)] есть решение уравнения (3.391). Таким образом, мы получили линейную систему п урав¬ нений первого порядка, эквивалентную одному уравнению n-го порядка. Покажем теперь, что собственные значения матрицы системы А (3.398) являются корнями полинома хп H- an-±xn 1 -F * * * а,]Х Œq. (3.400) Для того чтобы определить собственные значения Л, мы должны найти детерминант матрицы А — X/ и отыскать X, для которых этот детерми¬ нант равен нулю [см. уравнение (2.71)]. Имеем ~—к 1 0 0 0 “ 0 — X 1 0 0 А —7.1 . (3.401) 0 0 0 — X 1 _-а0 — аі ^2 ■ ■ ап-2 ^п-1 _ 138
Раскрывая по минорам первого столбца, получим det (А — X/) = — X det " —X 1 0 . .. 0 0 “ 0 —X 1 .. . . 0 0 > 0 0 . .. —X 1 — а2 — а;! . ^п-1 _ 1 О — /. 1 ... — X .. . 0" ... о (— а0) det _ О О . .. 1_ По метолу индукции, из уравнения (3.402) найдем det (Л — XI) = (— 1)" {Хп + 4 + atî (3.402) (3.403) где À является собственным значением матрицы А в том и только в том случае, когда X есть корень полинома (3. 400), т. е. 7п + а^Х"-1 н h ûiX 4- «о = 0. (3.404) Пример 3.63. Рассмотрим систему -4^-3^ + «/) _ 1. (3.405) Полагая хА (/) = у (/), х2 (0 — У (0, хз (0 ~ У (0» получим систему “il (О- 0 1 о~ “*1 (0‘ і2 (О — 0 0 1 Хг (0 0 (3.406) _і'з (0_ _-4 0 3. (t). Матрица системы А записывается в виде ’ 0 10’ А = 0 0 1 (3.407) — 4 0 3 Собственными значениями матрицы А являются корни уравнения V - ЗХ2 + 4 = 0. (3.408) Собственные значения равны: X = 2, X — 2, X = —1. Упражнение 3.21. Рассмотрите систему d3y(t) d2y(t) dt* dt2 Найдите эквивалентную ей систему. Какова матрица системы и чему равны ее соб¬ ственные значения? Найдите решение у (t) (см. упражнение 3.20). Предположим теперь, что собственные значения матрицы А (3.398) — действительные и различные числа. Обозначим их через Х2, . . ., и будем считать, что Л — матрица собственных значений [см. уравнение (2.78)], т. е. -X! А = о 0 0 ... 0" х2 ... о о ... Хп_ (3.409) 139
Мы знаем, что существует невырожденная матрица Р такая, что Л = Р'АР. Матрица Р есть матрица Вандермонда относительно X,-: " 1 1 ... 1 “ Ài к2 ... Кп X"-1 X"-1 ... X"-1 (3.410) (3.411)1 Для обоснования этого утверждения покажем, что (3.414) (3.415) поскольку X,, будучи собственным значением А, есть корень уравнения (3.404). Следовательно, АРе^'^Ре, (3.416) и поэтому Р^АРе, = Р~'7.1Ре1 = к1Р1Ре1 = (3.417) Совершенно аналогично можно доказать справедливость уравнения (3.412) для / = 2, 3, . . ., п и, таким образом, обосновать уравнение (3.410). * * * * 1 Укажем, что детерминант матрицы Р равен detP=n(^-M=(*2-*i). .. І >І • • • > (^п ^і) (^з ^г) • ♦ • (^п ^тг-і)» так что P — невырожденная, если все X/ различны. 140
3.25. СОПРЯЖЕННАЯ СИСТЕМА Рассмотрим однородную систему с переменными параметрами х(/) = Л (/)*(/). (3.418) В дальнейшем эта система часто будет рассматриваться вместе со свя¬ занной с ней системой Z /) = —4' (t)z(t). (3.419) где 4'(/)—транспонированная матрица 4(0 [см. уравнение (2.45)]. Система, описываемая уравнением (3.419), называется сопряженной системой к системе (3.418). Решение уравнения (3.418), удовлетворяющее начальному условию х (0) = I, выражается формулой х(/) = Ф(/)|, (3.420) где Ф(/) — фундаментальная матрица уравнения (3.418), а решение урав¬ нения (3.419) с начальным условием z (0) = л имеет вид г(/) = Т(/)л, (3.421) где Т(0—фундаментальная матрица уравнения (3.419). Рассмотрим теперь, как связаны между собой Ф(0 и ЧЧО- Эта связь выражается соотношением Т' (/)Ф(/) I для любого t, (3.422) Во-первых, укажем, что Т'(0)Ф(0)-// = /. (3.423) Во-вторых, если выбрать ѵ — произвольный элемент из Rn и при¬ нять, что Л(/) = Т'(/)Ф(/)я, (3.424) то й(/) = {'Г(/)Ф(/)+ ЧГ'(/)Ф(/)}С!. (3.425) Но из определения фундаментальной матрицы следует, что Т(0 = —4'(ЛМГ(/), Ф(0 = 4(/)Ф(/). (3.426) На основании уравнения (2.48) заключаем, что Т'(/) = —Т'(/)4(О (3.427) и й(/) = (-Т' (/)4 (/)Ф(0 + У' (04 (/)Ф(/)} ѵ = (3.428) 0. (3.429) Так как функция h(t) есть решение задачи с начальными условиями й(0 = 0; й(О) = г>, (3.430) которая также имеет решением g(t)=Iv, нетрудно обнаружить, что Чг'(/)Ф(/)г! = Іѵ, (3.431) и, следовательно, уравнение (3.422) справедливо, так как ѵ — произволь¬ ный элемент из Rn. 141
Непосредственным и важным следствием уравнения (3.422) является (*(0, х(/)) = (Т(/)л, Ф(0§)= (3.432) = ( л, Т'(/)Ф(/)§) = (3.433) = (л, 1), [по уравнению (2.98)], (3.434) где символ (,) обозначает скалярное произведение на Rn [см. уравне¬ ние (2.86)1. Предположим, что рассматриваемая система обладает тем свойством, что ее матрица является кососимметричной [см. уравнение (2.99)]. Такую систему будем называть самосопряженной. Система x(t) = A(t)x(t) (3.435) является самосопряженной, если Д(/) + Д'(/) = 0. (3.436) Заметим, что сопряженной системой для самосопряженной системы является сама система. Следовательно, если Ф (/) — фундаментальная матрица самосопряженной системы, то ф'(/)ф(/) = Д (3.437) так как Ф (/) — фундаментальная матрица сопряженной системы. Иначе говоря, Ф (/) есть ортогональная матрица [см. уравнение (2.109)]. Следо¬ вательно, если положить, что х(/) = Ф(/)| есть решение самосопряженной системы для начального условия х (0) = g, то получим (х(0, лг(О) = (Ф(О^ Ф(0£> = І> (3.438) и, следовательно, II* (ОН = 11111- (3.439) Таким образом, если однородная система является самосопряженной, то эвклидова длина решения x(t) является постоянной величиной, не зависящей от времени. Пример 3.64. Рассмотрим систему с постоянными параметрами х (t) = Ах (t). Сопря¬ женная система есть z (t) = —Az(t). Фундаментальная матрица системы есть eAt, фунда¬ ментальная матрица сопряженной системы e~At. Уравнение (3.422) превращается в (e~~A t)' eAt = I, и, следовательно, е~А 1 — (е~~АІ). Если система самосопряженная, т. е. если А + 4' = 0, то eAt — ортогональная матрица и || eAt^ || = || g || для любого g из Rn. показать, что система х (t) = Ax(t) самосопряженная; вычислить фундаментальную матрицу еАі и убедиться путем прямых Упражнение 3.22. « А t вычислении, что е —ортогональная матрица. Упражнение 3.23. Дифференцируя (х (t), X (t)) и используя выражение (2.103), покажите, что если система х (t) — A (t) х (t) самосопряженная, то || х (/) || = const. Про¬ делайте вычисления для частного случая А (і) = 0 Я t or 3.26. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную однородную систему с постоянными парамет¬ рами вида x(t) = Длг(/), (3.440) где А = (а0) — (постоянная) п X п матрица. 142
Система устойчива, если малые отклонения от положения равновесия [т. е. решения х (/) = 0] остаются малыми при сколь угодно большом увеличении времени /, и система неустойчива, если сколь угодно малые отклонения системы от положения равновесия с ростом времени неогра¬ ниченно возрастают. Более строго условия устойчивости могут быть сфор¬ мулированы следующим определением. Определение 3.45. Система (3.440) устойчива, если эвклидова норма ||х(0|| остается ограниченной при t -> сю для любого решения x(t) системы. Систему называют абсолютно устойчивой в том и только в том случае, если Іігп ||лг(/)|| = 0 (3.441) t~> ОО для любого решения системы x(t). Если система не является устойчивой, т. е. если существует решение х(/) такое, что 1іт||х(/)|| = оо, (3.442) ОО то систему называют неустойчивой. Обозначим собственные значения матрицы А через К /Ht» / = 1, 2, ..., и, (3.443) где все А, и р — действительные числа и / = —1. Следующий критерий связывает устойчивость системы (3.440) с собственными значениями (3.443) матрицы А системы. Критерий устойчивости Ч Система (3.440) устойчива, если 1) < 0 для всех і в случае, когда корни действительные числа (3.444) 2) К < 0 для всех k в случае кратных корней вида К + /^ (3.445) Система (3.440) абсолютно устойчива, если \ <0 для любого і. (3.446) Другими словами, система абсолютно устойчива, если все собственные значения имеют отрицательные действительные части. Система устойчива, когда в числе собственных значений нет ни одного с положительной действительной частью и действительные части всех собственных значе¬ ний с кратностью больше единицы отрицательны. Пример 3.65. Рассмотрим систему X] (I) ~ 0 1 X] (0 _*2(*)J L“a0 —^1JLX2(OJ Собственными значениями системы являются корни уравнения X2 —{— X 4- Яд =0. Система абсолютно устойчива только в том случае, если а0 и ах положительны (а0 •> і> 0, ах 0). Если собственные значения имеют кратность больше единицы, т. е. если а~{ — 4а0, то система будет устойчива лишь тогда, когда она абсолютно устойчива. При aQ = — ах = 0 система неустойчива. Сопряженная система для системы (3.440) имеет вид z(t}= — A'z(t), (3.447) 1 См. литературу [21], [25] и [46]. 143
где А' обозначает транспонированную матрицу А. Если Л — собствен¬ ное значение 4, то det(4 —Ѵ) = 0. (3.448) но det (А - V) = — det (— А + Л/) = — det [(— А') 4- М'], (3.449) поскольку детерминанты исходной и транспонированной матриц одина¬ ковы. Следовательно, — À является собственным значением матрицы — 4', если собственным значением матрицы 4 является число Â. Таким образом, с точки зрения критерия устойчивости сопряжения система неустойчива, когда исходная система абсолютно устойчива. В заключение отметим, что понятие устойчивости рассмотрено нами лишь в том объеме, который необходим для дальнейшего изложения материала.
ГЛАВА 4 ОСНОВНЫЕ ПОЛОЖЕНИЯ 4.1. ВВЕДЕНИЕ В гл. 2 и 3 был дан обзор математических понятий, которые необ¬ ходимы нам для дальнейшего изложения. В этой главе мы используем эти понятия для того, чтобы определить и развить основные положения, на которых будет основываться последующее изложение теории систем оптимального управления. В частности, мы сформулируем определения таких ключевых понятий как «динамическая система» и «задача управ¬ ления». В следующих параграфах мы начнем с рассмотрения некоторых про¬ стых примеров, которые послужат мотивировкой формального определения динамической системы. Существенными элементами этого определения явятся понятия входа, выхода и состояния системы. Рассмотрев основные понятия, связанные с динамическими системами, и связав их с более знакомым понятием передаточной функции, мы опре¬ делим задачу управления и рассмотрим некоторые важные специальные случаи. В заключение главы мы определим и рассмотрим некоторые качествен¬ ные свойства систем управления такие, как достижимость, управляемость и наблюдаемость. Эти качественные свойства играют очень важную роль в теории управления. Большинство определений и их приложений являются ключевыми для дальнейшего изложения. Основные понятия входа, выхода и состояния детально обсуждаются в книге Заде и Дезоера [212]. Понятие дина¬ мической системы рассматривается в работах [111], [113] и [210], а общая формулировка задачи управления обсуждается, например, в работах [23], [51], [89] и [106]. 4.2. ЦЕПОЧКА RL Рассмотрим очень простую 7?А-цепочку (рис. 4.1), чтобы проиллюстри¬ ровать основные понятия, которые мы строго определим в дальнейшем. Условимся называть напряжение и (t) «входом» и обозначим ток через і (/). Предположим, что мы наблюдаем и измеряем напряжение у (/) на сопротивлении 7?, и условимся называть это напряжение «выходом». Известно, что ток і (/) и напряжение и (t) связаны дифференциальным уравнением 4г- + w)=«(о, (4.1) 145
и так как у (t) = Ri{f), соотношение (4.1) можно переписать в виде = (4.2) Каждый инженер знает, что если прикладываемое напряжение ко¬ нечно, то ток, протекающий через индуктивность L, не может измениться мгновенно Ч Имея это в виду, сделаем следующий эксперимент. В течение промежутка времени (О, Т ] приложим ко входу непрерывно изменяющееся напряжение u (t) и предположим, что нам известны у (0) и и (0). Чтобы подчеркнуть, что вход известен на всем полузакрытом интервале (0, Г], Рис. 4.1. В этой цепочке выходом у (t) является падение напряжения на сопротивлении R мы обозначим его через w(o, г]. (4.3) Иначе говоря, u^t Ту есть функция, заданная на (0, Т ] с помощью соотно¬ шения и(о, ті(0= «(О Для из (0, Т]. (4.4) Измерим выход у (t) в течение этого нтервала времени и обозначим через ÿ(0, т] функцию, определенную на (0, 74 с по¬ мощью соотношения ^(о, г](0 = УѴ) Для * из (°- Т]- (4-5) Две величины (^(о, г], У(о, и) (4.6) назовем «парой вход—выход» на интервале (0, Т]. Нам хочется предска¬ зать выходное напряжение у^, т]. Итак, мы столкнулись со следующей задачей: задано и(0, т] и дифференциальное уравнение выхода (4.2). Какая дополнительная информация нужна для того, чтобы полностью определить y(Qt Если положить а = R/L, то уравнение (4.2) принимает вид ÿ(f) + ay(t)= au(t\ (4.7) и его решение можно записать как t y(t) = y(fi)e~at + e~at J eaxau (x) dx. (4.8) о Так как u(o, rj известно, то член t e~~at J eox au (t) du U также известен, и, таким образом, единственная величина, которую мы должны знать, чтобы предсказать г/(0, т], есть у (0), т. е. величина выход¬ ного напряжения при t = 0. Отметим, что знания напряжения на входе и (0) при t — 0 не требуется. Основой этого вывода может служить сле¬ дующее рассуждение. Предположим, что и (0 +) =^= и (0), т. е. что при t — 0 + происходит скачок входного напряжения. Так как ток через индуктивность не может измениться мгновенно, то t(O+) = t(O) (4.9) 1 Будем считать, что не бывает импульсов типа ô (Z), и поэтому и (t) не может быть таким импульсом. 146
и, следовательно, J/(0+) = 4/(0) (4.10) не зависит от и (0). Итак, для цепочки (см. рис. 4.1) знания 4/(0, ту и у (0) достаточно, чтобы полностью определить z/(0, ?]. Если дать тривиальное определение: x(t) = y(ty, t£(Q,T], (4.11) то можно обнаружить, что х (0) — минимальный объем информации, требуемый для того, чтобы определить ÿ(0, Г| по заданному u{Qt Т\- Будем называть х (0) состоянием системы при t = 0 и отметим, что х (t) удовлет¬ воряет дифференциальному уравнению %(/) + ах (/) = au (t). (4.12) Заметим, далее, что если ?есть элемент из (0, Т],т. е.О < ? <• Г, то зна¬ ния X (t) [= у (/)] достаточно для того, чтобы найти выход y(f) на интер¬ вале (/, Т], если задан вход и (/) на этом интервале [см. уравнение (3.250) ]. Итак, X (/) будем называть состоянием (переменным) нашей 7?£-цепочки. Рассмотрим теперь ту же цепочку несколько иначе (рис. 4.2). Пред¬ положим, что мы наблюдаем и измеряем напряжение на индуктивности L, а не на сопротивлении R. Назовем это на- пряжение выходом у (/). Ток i (t) по-преж- | I нему удовлетворяет уравнению (4.1), z | однако выход в этом случае описывается I —J Д | уравнением 4/(0 + Ri (0) J y(x)dx = и (t), 0 (4.13) a(t) 1 у н \y(ti 1 1 так как y(t) = L (4.14) Рис. у W 4.2. В этой цепочке выходом является напряжение на индуктивности L Предположим, что мы прикладываем непрерывный входной сигнал (или «вход») и (t), дифференцируемый на временном интервале (0, Т]. В этом случае уравнение (4.13) можно продифференцировать и получить т + 4^(/) = Т’ z€(0, Л (4.15) или, положив а = R/L, записать У(і) + ау (0 = (4.16) Зная у (0), и (0) и 44(о, т], мы хотели бы предсказать выход 4/(0, rj. Здесь необходимо решить следующую задачу. Пусть известны 44<о, г] и дифференциальное уравнение выхода (4.16). Какая дополнительная информация необходима, чтобы полностью определить 4/(0, г]? Рассматривая цепочку на рис. 4.2 с физической точки зрения, мы видим, что если имеет место скачок на входе при t = 0, т. е. если 44(0 + )^= 4/(0), (4.17) то напряжение у (/) на индуктивности L также должно скачкообразно измениться при t = 0 + от у (0) до у (0+), поскольку ток через L и, сле¬ довательно, напряжение на сопротивлении R не изменяются. Другими словами, тот факт, что ток через L не может измениться мгновенно, озна¬ чает, что (4.18) 147 W) = W+)
и, следовательно, ÿ(0) — u(0) = t/(0+) — u(0+) (4.19) ИЛИ Z/(0+) - */(0) -h u (0+) — w (0). (4.20) Решение уравнения (4.16) на интервале (0, Т] записывается в виде / //(/) = e~aty(0-\-) -F e~at J eaxu (t)û’t. (4.21) o+ и, таким образом, чтобы определить тд, мы должны знать у (0+) или, эквивалентно, обе величины у (0) и и (0). Если теперь определить новую переменную х (/), положив *(0 = y(t)—u(t) (4.22) для t из (0, Г], т. е. приняв за х (I) разность между выходом у (/) и вхо¬ дом и (/), то x(t) = y(t)—u(f), /е.(0, Т]. (4.23) Из уравнений (4.16), (4.22) и (4.23) получаем х(/) 4- ax(t) = —au(t) (4.24) для t из (0, 7]. Так как уравнение (4.22) справедливо для любого t из (0, 7], имеем х(0) = //(0)-«(0); (4.25) x(0+) = //(0+)~u(0+) (4.26) и X (0 4- ) - х (0) = у (0+) - у (0) - и (0+ ) + и (0) = (4.27) = 0 по уравнению (4.20) (4.28) Итак, решение уравнения (4.24) можно записать в виде %(/) = e~atx(0) — ae~at j еахи (т) dx. (4.29) о Следовательно, зная х (0) = у (0) — и (0) и г/(0, т\, можно полностью определить х(о, тц и, таким образом, в силу уравнения (4.22) полностью определить y(Qt Ту Назовем х (0) состоянием при t = 0 и заметим, что если t есть элемент из (0, Г), т. е. 0< t <7, то зная х (/) = у (/) — и (f), можно определить выход у (t) на интервале (/, 7] при заданном входе и (t) на том же интервале. Итак, х (t) назовем переменным состоянием системы. Отметим, что уравнения (4.22) и (4.29) описывают поведение цепочки, приведенной на рис. 4.2. Для системы (см. рис. 4.1), в которой выходом у (f) было напряжение на сопротивлении /?, мы получили уравнения: X (/) + ах (/) = au (/) — уравнение состояния, а = R/L; (4.30) у (t) = X (t) — уравнение выхода, (4.31) описывающие поведение цепочки, такие, что знание х (0) и и(о, п позво¬ ляет определить y{Qt Для системы рис. 4.2, где выходом у (/) было напряжение на индук¬ тивности L, мы получили уравнения: X (t) + ах (t) = —au (t) — уравнение состояния, а = R/L; (4.32) у (t) = X (/) + и (/) — уравнение выхода, (4.33) описывающие поведение этой цепочки. 148
Пример 4.1. Примем L — R — 1 ; а = I; Т = 2 сек; у (0) = —0,5 и (0) =—1; и (ty — е~l' 0<Z^2 Для цепочки (см. рис. 4.1) уравнение (4.30) запишется в виде х (О 4- X (/) == е~~1. (4.34) (4.35) На основании уравнения (4.31) и того, что х (0) = у (0), имеем тогда % (0) — —0,5; X (I) — о,5е~' + іе~( , Рис. 4.3. Выход (у f), состоя¬ ние X (/) и вход и (/) для цепочки, показанной на рис. 4.1 Рис. 4.4. Выход у (ty, со¬ стояние X (/) и вход и (/) для цепочки показанной на рис. 4.2 и с помощью уравнения (4.31) найдем у (ty —0,5<? 1 + te 1. (4,38) Состояние X (/), выход у (/) и вход и (t) показаны на рис. 4.3. Для цепочки (см. рис. 4.2) уравнение (4.32) записывается так: +х (0 =—е_'- (4.39) Так как х (0) — у (0) — и (0) |по уравнению (4.33)], имеем х (0) = —0,5 4- 1 = 4-0,5. (4.40) Решением уравнения (4.39) является X (/) — 0,5e-7—te~f. (4.41) Выход, по уравнению (4.33) равный у (t) — = X (t) 4- и (t), запишем в виде у (ty = 0,5е“f — te~l 4- 1,5е~? — te~l. (4.42) Состояние X (t), выход у (ty и вход и (/) пока¬ заны на рис. 4.4. Упражнение 4.1. Рассмотрите RTC-цепочку, показанную на рис. 4.5. Пусть и (t) обозначает входное напряжение, а у^ (ty, уL (t) и ус (t) обозначают напряжения на сопро¬ тивлении R, индуктивности L и конденсаторе С соответственно. Предполагаем, что дифференцируема. Найти соотношения, связывающие вход и (t) с выходами у^ (/), yL (t) и ус (/). В каждом случае с физической точки зрения определите сигналы, которые надо знать при /=0 для того, чтобы полностью определить выходы у# Z/д (о, г] и ус (0 Гр если задано u(0 Упражнение 4.2. Дана система (дифференцирующее звено) с входом и (t) и выхо¬ дом у (t), связанными соотношением У (О — u(ty. 149
Покажите, что если ы(0> дифференцируема, то полностью определен, если известно и (0). Указание: Систему можно представлять в виде единичной индуктив¬ ности; вход и (t) — ток через нее; выход у (t) — напряжение на индуктивности. 4.3. СИСТЕМА СО МНОГИМИ ПЕРЕМЕННЫМИ Обратимся теперь к системе, показанной на рис. 4.6, которая полу¬ чена путем соединения друг с другом нескольких подсистем (обозначен¬ ных на рис. 4.6 символами Sn S2, S3 и S4). Система имеет два входа ux(t) и и2(/) и два наблюдаемых выхода z/JZ) и y2(t). Вход zzj/) при¬ кладывается к подсистемам Sx и S2, выходы которых равны х4(/) и х2(0 соответственно. Вход и2(/) прикладывается к подсистемам S3 и S4. с выходами х3(/) и х4(/) соответственно. Пусть выходные сигналы z/x(/) и z/2(Z), которые мы измеряем, даются соотношениями Рис. 4.6. Система со многими переменными г/і(/) = х4(/) + х3(/); і/2(/) = х2(/) + х4(/), а выходы xt(t) мы наблюдать не можем. Предположим, что каждую из подсистем Sz (f = 1, 2, 3, 4) можно описать простым линейным урав¬ нением первого порядка. Имеем Sp (/) = «,%,(/) 4-ujZ); (4.44) S2: x2(Z) = a2x2(/)-b Uj(/); (4.45) S3: x3(/) = asxs(t) + «2(/); (4.46) S4: x4(/) = a4x4(/) + u2(Z). (4.47) Исходя из этого предположения и соотношений (4.43) можно заклю¬ чить, что выходные сигналы (y^t и y2(t) связаны с входными сигна¬ лами ur(t) и u2(t) следующими двумя соотношениями: ÿi(0 —(«1 + аз)Л(0 + («1«з)Л(0 = = «4(04 ü2(/) —а3ы1(/) —ajü2(0; (4.48) У2 ( О — (а2 а4) у г (t) -г (а2а4) z/2 ( / ) = = «!(/) + u2(t) — — a2u2(t). (4.49) Определим для удобства входной вектор u(t) и выходной вектор y(t), положив й L«2(0j ’ L2(0j ’ Желая предсказать выход (вектор) у(0, г], мы сталкиваемся со следую¬ щей задачей: известны я(0, т] и дифференциальные уравнения выхода (4.48), (4.49). Какая нужна дополнительная информация для того, чтобы полностью определить у(0, ?]? Из рассмотрения дифференциальных уравнений (4.48) и (4.49) сле¬ дует, что для полного определения у(0, достаточно знать следующие начальные условия: */і(0), ^(0), z/2(0), ^2(0), uJO), z/2(0) (4.51) или, что эквивалентно, У(0), ў(0), «(0). 150
С другой стороны, из блок-схемы рис. 4.6 видно, что зная *і(0), х2(0), х3(0), х4(0), (4.52) можно полностью определить х4 (0, г], х2 <о, т], х3 (о, у] и х4 (о, rj при задан¬ ном Ию, г] (см. § 4.2). В силу уравнений (4.44)—(4.47), т. е. исходя из того, что система представляет собой соединение подсистем S1( S2, S3 и S4, заключаем: для определения уі (0, г] и уг (о, г] при заданном «(о, rj тре¬ буется знать вектор x(t), где *(') = -Хі (/)- *2 (О •*з(0 -х4(/)_ (4.53) Вектор х(0) будем называть состоянием системы при t = 0 и вектор х(0 —состоянием системы в момент времени t. Если x(t) может быть измерен, то выход у»<о, г] можно предсказать. Мы предположили, что x(t} измерить нельзя, и поэтому постараемся установить, можно ли рассчи¬ тать х (t) на основании наблюдаемых сигналов и (/) и y(t). Из уравне¬ ний (4.43) следует, что г/і (0) = М (0) + х3 (0); | у2(0) = х2(0) 4-х4(0). J (4,&4) Продифференцировав (4.43), получим Уі (0) = %і (0) + х3 (0) = а1х1 (0) + а3х3 (0) + щ (0) + и2 (0); Уъ (0) = х2 (0) + х3 (0) = а2х2 (0) + я4х4 0) + и± (0) + и2 (0). Итак, если мы знаем у (0), у (0) и и(0), т. е. те же самые величины, что и в (4.51), то можем найти лг(О) из (4.54) и (4.55). Если различны, то х (0) определяется единственным образом; с другой стороны, если, например, а± = а3, то х(0) не является единственным (см. упражне¬ ние 4.3). Во всяком случае, даже на имея возможности непосредственно измерить X (0, его можно рассчитать по входным и выходным сигналам системы. Упражнение 4.3. Предположим, что все подсистемы S2, S3 и S4 идентичны, т. е. в уравнениях с (4.44) по (4.47) имеем аг = а2 — а3— аі. Требуется показать, что зна¬ ния (0) и у2 (0) достаточно, чтобы при заданных входах определить выходы yt (t) и у2 (/). ДИНАМИЧЕСКИЕ СИСТЕМЫ 4.4. ВВОДНЫЕ ЗАМЕЧАНИЯ Познание физического мира основано на эксперименте и абстракции. Инженер изучает физические системы, имея в виду вполне определенные конкретные цели, тогда как теоретик пытается обнаружить общие законы, управляющие поведением физических систем или описывающие их пове¬ дение, в самом общем виде. Попробуем сначала представить поведение инженера-проектировщика. Нам дана физическая система $ («черный ящик»), и мы можем прикла¬ дывать некоторые входные «сигналы» к ^5 так, чтобы наблюдать и изме¬ рять получившиеся в результате выходные «сигналы». Возможной целью изучения системы является определение входа, такого, чтобы выход обладал некоторыми желаемыми характеристиками, а «стоимость» управ- 151
ления была минимальна. Попытаемся достичь этой цели методом «проб и ошибок», испытывая последовательно различные входы. Такая проце¬ дура может дать искомый ответ. В общем же случае это невозможно. Будем рассматривать наши попытки как эксперименты, которые могут привести к описанию поведения $ и определению, какой «выход» будет наблюдаться при приложении любого «входа». Итак, мы столкнулись с задачей описания $ и отыскания подходящей модели поведения Обычно эту задачу пытаются решить путем разработки математических моделей, которые в форме уравнений связывают выход и вход системы. Вид выбранной модели основывается на результатах экспериментов и на предположениях относительно основных законов, управляющих поведе¬ нием всех физических систем. Эти предположения обычно принимаются за аксиомы, которые дают точное определение теоретических понятий, привлекаемых для построения математической модели поведения физи¬ ческой системы ^3. Как только принята некоторая модель, на ее основе делаются определенные выводы, которые проверяются в ходе дальней¬ ших экспериментов над системой В данной книге мы будем иметь дело с физическими системами поведение которых может быть адекватно описано с помощью математи¬ ческих моделей или динамических систем. В § 4.5 дано аксиоматическое определение динамической системы. Здесь же, имея в виду примеры § 4.2 и 4.3, попробуем эвристически рас¬ смотреть некоторые идеи, которые позволят подойти к этой задаче более строго. Для начала проделаем мысленно следующий эксперимент. В неко¬ торый «начальный момент времени» мы прикладываем входной сигнал к физической системе $ вплоть до некоторого будущего момента времени. В течение этого интервала времени, который назовем интервалом наблю¬ дения, будем наблюдать выход системы ^3. Известно, что полученный выход зависит не только от приложенного входного сигнала, но и от вну¬ треннего состояния системы $ в начальный момент времени. Если считать, что есть точное изображение т. е. системы ^3 и идентичны, то можно сформулировать следующую задачу: если к системам $ и 93х, начиная с одного и того же момента, при¬ ложить одинаковые входные сигналы, то будут ли одинаковыми выход¬ ные сигналы систем и $х? Например, если и — идентичные /?ЛС-цепочки, к которым мы прикладываем один и тот же сигнал (напряжение), начиная с момента /0 до некоторого будущего момента времени то задача, которую мы пы¬ таемся решить, может быть поставлена так: будут ли выходные сигналы (напряжения) одинаковы на всем интервале наблюдения (/0, /J? При этом выходное напряжение будет зависеть как от заряда конденсатора и тока, протекающего через индуктивность при t = /0, так и от входного напря¬ жения. Итак, если заряды конденсаторов и токи в индуктивностях систем $ и ^Зі при t = /0 различны, то прикладывая один и тот же входной сигнал (напряжение) к $ и в интервале (/0, t± ], надо ожидать, что будут наблюдаться различные выходные сигналы (напряжения) в системах $ и ^Зр Таким образом, чтобы предсказывать сигнал на выходе, необходимо знать как входной сигнал, так и условия в системе *>|3. Эти условия пред¬ ставляют собой дополнительную информацию, которой мы можем распо¬ лагать для начального момента времени /0, и называются (начальным) состоянием системы ^3 при t = /0. Теперь попробуем выступить в роли теоретика и попытаемся развить формальный способ описания системы Начнем с того, что введем неко¬ торые обозначения. Символом и обозначим типичную входную функцию 152
времени, а у— соответствующую выходную функцию времени. Если t — некоторый момент времени, то и (/) — значение входа и в момент времени /; (4.56) у (t) — значение выхода у в момент времени t. (4.57) Величины и (t) и у (t) могут быть скалярами или элементами из Rtn и Rtl соответственно (т. е. и (/) — набор т действительных чисел и у (/) — набор п действительных чисел) или значительно более общие параметры. Например, если — устройство для распознавания образов, то вход и (/) в момент времени t может представлять собой двумерное изображение, а выход у (/) — решение, является ли и (t) картинкой, изображающей птицу, самолет или робот. Понятия и определения, приведенные в § 4.5, являются весьма общими, но в дальнейшем будем рассматривать лишь те случаи, когда входные величины представляют собой элементы из Rm, а выходные у (/) — элементы из Rn. Начнем наш эксперимент в момент времени /0 и до некоторого будущего момента времени tr приложим к системе входа. Так как мы наблюдаем и измеряем выход у в течение интервала (/0, /х], то будем называть полу¬ закрытый интервал (/0, /Д интервалом наблюдения. Для удобства обо¬ значим величины и и у на этом интервале через а(/0, /ди yUnt Гд, положив #(0 Для t из (/0, (4.58) Уа0, 5>(0 Для t из (/0, /J. (4.59) Две функции (Я(/о, / д, уцп, /д) назовем парой вход—выход на интервале наблюдения. Попросту говоря, систему можно описать как множество всех таких пар, взятых на всех интервалах наблюдения для всех условий (или состояний) Такой подход соответствует проведению всех возмож¬ ных экспериментов над и он нецелесообразен. Мы можем также счи¬ тать, что $3 устанавливает некоторые соотношения между входом, выходом и состоянием. Поскольку в настоящей книге все внимание сконцентрировано на макроскопических объектах, будем считать все системы полностью детер¬ минированными и полагать, что они подчиняются классическим причинно- следственным законам физики. Иначе говоря, будем полагать: 1. Все величины и функции строго детерминировании. Случайные элементы из рассмотрения исключены. 2. Системы без предсказания, т. е. такие системы, когда текущие зна¬ чения входа, выхода и состояния не зависят от их будущих значений. Пусть — абстрактная математическая модель физической системы Для системы мы должны иметь определенный набор входных времен¬ ных функций а, соответствующий набор выходных временных функций у и набор временных функций состояния х. Мы должны иметь два уравне¬ ния: выхода и состояния, связывающие вход, выход и состояние системы Запишем эти уравнения в виде: у(/) = g [х(/0); »((„, м» Go> Ml — уравнение выхода (4.60) И -*г(/) = jf Глг(/о); (^о, /і]] — уравнение состояния. (4.61) Известно, что выход y(t) в момент времени t зависит от состояния лг(/0) в момент времени /0; входа, прикладываемого на интервале наблю¬ дения (/0, /Д, и самого интервала наблюдения (/0, /Д. Мы знаем также, что воздействие на входе а^0> /д не только влияет на выход у(/0, /д> но и из¬ меняет состояние системы. Результат этого изменения х(0 в момент вре- 153
мени t зависит от начального состояния х(/0) в момент времени при¬ кладываемого на интервале наблюдения, и самого интервала наблюдения Go, Gb Если для нашей модели справедливы сделанные выше предположения и если of является адекватным отображением физической системы то уравнения выхода и состояния системы of должны обладать некоторыми естественными и желательными свойствами. Например, обе функции f и g должны быть детерминированными (т. е. ни одна входящая в них величина пе может быть случайной или содержать случайные элементы) и не должны зависеть от будущих значений входа, выхода или состояния. Функции fug должны быть выбраны так, чтобы модель аппроксимировала ре¬ зультаты наших экспериментов над физической системой Иначе говоря, функции/ и g надо выбрать так, чтобы они соответствовали эксперимен¬ тальным данным. В следующем параграфе мы дадим аксиоматическое определение до¬ вольно общего класса моделей систем, а именно: класса динамических систем. Аксиомы предъявляют определенные требования к входным и вы¬ ходным сигналам, к множеству состояний системы и к функциям f и g. В § 4.6 мы наложим дополнительные ограничения, чтобы выделить тот класс систем, который и будет рассматриваться в основной части книги. Однако прежде чем перейти к формальному определению, в заключитель¬ ной части настоящего параграфа мы укажем на некоторые интуитивные аспекты общих аксиом и класса систем, представляющего наибольший интерес. Первая аксиома предполагает, что если известно начальное состояние в момент времени t0 и к системе на интервале (/0, прикладывается известный вход то выход определяется единственным образом. Вторая аксиома утверждает, что существует «достаточно много» состояний системы, так что любая пара вход—выход может быть использована для расчетов. Вторая аксиома, по сути дела, утверждает, что знания началь¬ ного состояния и входа, прикладываемого на интервале наблюдения, достаточно не только для определения выхода на интервале наблюдения, ь’О и состояния системы в пределах интервала наблюдения. Это очень важно, так как состояние в любой момент времени в некотором смысле суммирует всю прошлую информацию, требующуюся для предсказания будущих выходных сигналов и будущих состояний. Третья аксиома является условием «гладкости», которое гарантирует, что малые изменения входа или начального состояния вызовут соответственно малые изменения выхода и будущего состояния системы. Четвертая (и последняя) аксиома содержит условия, которым должна удовлетворять функция, описывающая изменение состояния системы. Системы, которые мы будем изучать в основной части книги, должны удовлетворять не только четырем аксиомам, но и некоторым дополнитель¬ ным условиям. Предположим, в частности, что состояния системы — эле¬ менты некоторого эвклидова пространства Rn, т. е. n-мерные векторы, или соответственно наборы п действительных чисел. Потребуем далее, чтобы входные величины были элементами эвклидова пространства 7?m, т <. п, а выходные величины — элементами Rp. Будем также считать, что все рассматриваемые величины, являющиеся функциями времени, такие, как входы и выходы, определены на некотором открытом интервале (Tlt Т2), а не в дискретные моменты времени (т. е. будем рассматривать непрерыв¬ ные, а не дискретные по времени системы). Наконец, будем считать, что уравнение состояния представляет собой решение дифференциального уравнения, удовлетворяющее условиям теоремы существования и един¬ ственности (теорема 3.14). 154
4.5. ОПРЕДЕЛЕНИЕ1 Определим в этом параграфе понятие динамической системы формаль¬ ным и довольно общим образом. Хотя мы и будем стремиться дать аксиоматическое определение, оно не будет «слишком» общим. В следующем параграфе мы еще больше сузим это определение, с тем чтобы выделить класс систем, который будет рас¬ сматриваться в дальнейшем. Еще раз отметим, что наше представление о динамической системе базируется на понятиях входа, выхода и состояния. Пусть Т — подмножество всех действительных чисел; 2 — множество с расстоянием d на нем (см. § 3.1); Q — множество с расстоянием d и U — множество кусочно-непрерывных функций на Т со значениями в Q. Обозна¬ чим через X (t) — переменную, определенную на Т со значениями в 2, а через g — функцию преобразования из X X Q X Т (см. § 3.2) в эвкли¬ дово пространство Rp. Если /0 и t — элементы из Т, причем tQ < G то будем записывать (/0, t] для обозначения множества всех элементов Т между /0 и /, т. е. (/о, /] = {т:т^7, /0<т</}. (4.62)2 Символ /] будем использовать для обозначения сегмента (отрезка) функции и из U на множестве (/0, t]. Если t — элемент Т, и— элемент U и X (t) —элемент 2, то g [х (/), и (/), t] есть вполне определенный эле¬ мент из Rp) который будем обозначать через у (/), т. е. y(t) = g[x(t), /]. (4.63) Через yUo, будем обозначать сегмент функции (4.63) на (/0, О и писать У(/о, л = [аг(/о); Щіо, d- (4.64) Сформулируем аксиомы: Аксиома 4.1. Для любых x(tQ) из 2; любых / и /0 из Л’ t to, t£T и любого /], uÇU знание х (to) и u(t0> однозначно определяет y{tQt В частности, если и и ѵ — элементы из U такие, что ^(/о. Л = (4.65) то g[x(/0); u(to. d = ff[x(/0), v{to, d- (4.66) Аксиома 4.2. Если t0 < t<< t — элементы из T, x(tQ)—элемент из 2, a S [x (/0), u, t] — множество всех элементов x (/) из 2, удовлетворяю¬ щих уравнению Лг= = «(? п] (4.67) и к* — заданный элемент из U, то пересечение множеств 2 [х (/0), и, ?], где и — элемент из U такой, что и ~ = и* -, не является пустым, т. е. П 2[х(/0), я, Л ¥=$• (4.68) UÇ.U U Z4 = И* Z4 Go, Г] (t0, t] 1 См. литературу [111], [113] и [210], [212]. Особый интерес представляют гл. 1—4 книги [212]. 2 В этом случае интервал (/0, /] скорее является пересечением полузакрытого интер¬ вала (/0, Z] с множеством Т [см. уравнения (2.3) и (3.7)]. 155
В частности, ни одно множество S |х (/0), Л не является пустым. Эта аксиома утверждает, что существует по крайней мере один элемент из I, являющийся общим для любой пары {и, ~ у ~ Можно показать далее, что из аксиом 4.1 и 4.2 вытекает существо¬ вание функции Ф I/, ф х (/о)] такой, что х(/) = Ф[/, ф х(/о)Ь (4.69)1 2 Аксиома 4.3. Функции g, g и Ф непрерывны относительно всех своих аргументов. Зависимость g и Ф от t. означает, что если и и ѵ — эле¬ менты U такие, у которых расстояние г]. г»|г„, d) = SUP I<i(u(i), ü(t)| (4.70)? т Ç Цо. о П 7 мало, то расстояния *(U11 (4-71) И sup (liilx(/0); Tj]-g[x(zo); г>(Го.Т]]||| (4.72) т G По» П т также малы (здесь g\x(tQ)\ u(to, Го]] = g \x(tQ), tf(/0+), /0| и g\x(tQ)\ v<t„, /о)! 5гІ^(/о); гфо + ), M по определению)3 *. Аксиома 4.4. Функция ф удовлетворяет условиям: а. Для любых /, /0£ T, uQ U и х(/0)С U(t0, ф х(/0)| = = х(/0) в том смысле, что предел gSfZ; ф лг(/0)1 равен х(/0), если / приближается к /0 справа. Это можно записать также как ф [/0; #(г0) ?0], х(/о)Ь б. Для любых tQ < t С t из Т, и Ç U и х (/0) < 2 ф [Л х(^)\^ф\і ф& x(/0)]l, (4.73) где t0 << f c t. Это условие называют переходным. в. Для любых т, /0, / ст из [/0, Л П Т и лг(/0) из S, если и, V Ç U и a(r0, z] = v(t9, ф то дб|т, tfUo,T|. X (/0)1 = ф |т, ѵ(І0, и, (4.74) ДЛЯ любого Т ИЗ |/0, /] П Т. Определение 4.1. Динамическая система еР— сложное понятие, состоящее из множеств 7\ 2, Q и U, переменной х(/) и функции g, удов¬ летворяющих условиям аксиом 4.1, 4.2, 4.3 и 4.4. Т называют областью определения системы, 2 — пространством состояний системы, U—пространством входов системы, лг(/)— состоя¬ нием (или переменной состояния) системы; щіо, и называют входом на ин¬ тервале наблюдения системы, а y(to, rj = g[x(tQ); /] 1 — выходом (соответствующим входу >]) системы, причем (я(/о, Z]; y(to, /]) обра¬ зуют пару вход—выход системы; функцию ф{і\ щіо> q, х (/0)1 называют 1 См. работу [212]. 2 Здесь sup означает наибольшую нижнюю границу множества всех чисел М таких, что d (и (т), V (т)) М для любого т из |г0, /] fl Т. Где du есть расстояние на множестве функций и (t0, /], и из U (см. § 3.15). 3 Напомним, что d — расстояние на Q; d — расстояние на 2 и II II — эвклидова норма на Rp. 156
переходной функцией системы, а подмножество {х (т) : х (т) = ф [т; u{t0, т], X (/0) ] для т из [/0, /] П Т} из пространства состояний ѵ _ траекторией |или движением] системы в течение временного интервала [/0, t] П Т из начального состояния лг(/0), произведенной входом д. Наконец, урав¬ нения (4.64) и (4.69) называют соответственно уравнениями выхода и со¬ стояния системы. /Аксиома 4.1, по сути дела, утверждает, что если известно начальное состояние в момент времени tQ и если приложить известный вход в тече¬ ние (/0, /I, t^> /0, то получится выход, определенный единственным об¬ разом. Сущность этой аксиомы состоит в том, что для предсказания вы¬ хода на (/0, t] в случае, когда известно начальное состояние системы при t = tQ, не требуется знания входа, предшествовавшего /0. При этом доста¬ точно знания лишь состояния в момент /0 и t\- Отметим также, что будущие значения входа не влияют на у^0, д, т. е. система не обладает «предвидением». Аксиома 4.2 утверждает, что существует «достаточно» состояний системы, и поэтому можно выбрать для расчета любую пару вход-выход. Эта аксиома предполагает также, что знания начального состояния х(/0) и управления ііщ, t] достаточно не только для того, чтобы определить выход y(f), tQ t С но и состояние системы в момент времени /, лг(/), /0 < Это наиболее важное свойство, так как оно означает, что состояние в любой момент суммирует всю прошлую информацию, требую¬ щуюся для того, чтобы предсказать будущий выходной сигнал и будущее состояние системы. Аксиома 4.3 представляет собой условие гладкости, гарантирующее, что малые изменения входа или состояния системы вызывают соответст¬ венно малые изменения выхода и движения системы. Аксиома 4.4 перечисляет условия, которым должны удовлетворять изменения состояния системы. В частности, такими требованиями являются: 1. Начальные условия должны соответствовать исходной точке дви¬ жения (напомним, что «движение» обозначает траекторию в пространстве состояний системы). 2. Если вход переводит систему из состояния лг0 в х вдоль некоторой траектории и х — некоторое состояние на этой траектории, то этот вход должен перевести систему х в х. 3. Система не обладает «предвидением», т. е. будущие значения входа не влияют на текущее состояние системы. Эти аксиомы являются обоснованной абстракцией свойств физических систем. Следствия аксиом иллюстрируются с помощью рис. 4.7. На рис. 4.7, а показаны два входа Zt] и Z1], причем ukt, G] иЪ, G] J Пусть x(/0) — состояние при /0; у^.чд — единственный выход, полу¬ чающийся при воздействии на систему входа u\to, гд, и у\ц> h, — при и2^, д ]. Выходы показаны на рис. 4.7, б. Согласно нашей терминологии имеем = u\ta. /.] = g [^(Zo). »(/„ /,]]• 157
Аксиома 4.1 и, в частности, уравнения (4.65) и (4.66) гарантируют, что Уа», Я = УЪ», ?]• Пусть 7— произвольная точка из [/0, /J, тогда аксиома 4.2 и урав¬ нение (4.67) утверждают существование состояний х1 (і) и х2 (7) таких, что =і[*Ѵ). «;г J: У a tl] = è[x-(h J. Если [х1 (?)| и [х2 (/)} обозначают множества состояний х1 (t) и х2 (7), то из уравнения (4.68) следует, что кЧО) П И0174 т. е. существует такое состояние е (хчо) п {*2(< при котором У{?, zj —ë‘[x(F), U(Z zj]’, yû. G] = И*(0> «(G G]]' Рассмотрим простую /?£-цепочку, изображенную рис. 4.1. Пусть Т — множество всех действительных чисел, У — действительные числа о) б) Рис. 4.7. Два входа и1 и а2, производящие выходы у1 и у2 с обычным расстоянием, Q = 2 и [/ — множество кусочно-непрерывных функций, преобразующих множество Q в множество 2. Наконец, пусть g — функция, заданная как g (г, s, t) = r, (4.75) где г, s и t — действительные числа. Поскольку g не зависит от s и /, вместо (4.75) для удобства запишем g(r) = r. (4.76) Если и — элемент из U и х0 — элемент из 2, то получаем х(/) = e~atxQ + e~at J cuXu(x)dx, (4.77) и где а = Иначе говоря, t <р(і; «(о, t], х0) = e~atxü + e~at Jеа' u(x)dx. (4.78) и 158
Примем также, что y(t) = g[x(t)] = x(t). (4.79) Таким образом, мы определим динамическую систему с пространством состояний 2 (действительные числа), выходом у (t) и уравнениями состоя¬ ния и выхода: х(/) = ф(/; х(0)) = е~а/х(0) + e~at J eaxu(x)dx о — уравнение состояния; і/(0 = *(0 — уравнение выхода. (4.80) Если нам известны х (0) и u^t q, то мы знаем х (t) и, следовательно, из уравнения (4.80), у (/). По теореме 3.14, х (t) и у (t) определяются пол¬ ностью. Что касается аксиомы 4.2, то элемент ? x(t) = е~^х(О) + е~а~ J eaxu*(y)(h о является пересечением всех множеств 2 (0), tCM- уравне¬ ние (3.259)1. Предоставим читателю проверить самостоятельно аксиомы 4.3 и 4.4. Упражнение 4.4. Проверьте аксиому 4.4 для /?Д-цепочки. Упражнение 4.5. Рассмотрите ÆL-цепочку (см. рис. 4.2) и определите динамическую систему, представляющую эту цепочку. Убедитесь в справедливости аксиом. У к а за ние: Функция g задается как g (г, s, t) = г + s, а функция ф в виде t Ф(/; и(0> z]x0) =e~atx0— ае~а‘\eaTu(t)dr. Ü При этом уравнения выхода и состояния можно записать: у (t) = X (t) + и (t) — уравнение выхода; t X (t) = e~atxQ — ae~at J eaxu (t) du — уравнение состояния, и Теорема 3.8 используется для проверки аксиомы 4.3. 4.6. ДИНАМИЧЕСКИЕ СИСТЕМЫ, РАССМАТРИВАЕМЫЕ В ДАННОЙ КНИГЕ Системы, рассматриваемые в данной книге, являются не только дина¬ мическими системами в смысле определения 4.1, но и удовлетворяют некоторым дополнительным условиям. Мы будем рассматривать только конечно-мерные непрерывные системы. Определение 4.2. Динамическую систему еР называют конечно-мерной: 1) если пространством состояний 2 системы является эвклидово про¬ странство Rn, т. е. 2 = 2) если множество значений входа Q есть эвклидово пространство Rm, т < п, т. е. Q = Rm. В этом случае число п, являющееся размерностью 2, называют порядком (или размерностью) динамической системы. Колеблющаяся струна и полый резонатор (акустический или электро¬ магнитный) являются примерами систем, которые не являются конечно¬ мерными. Будем далее под термином «динамическая система» понимать конечно-мерную динамическую систему. Отметим, что состояниями си- 159
стемы являются /г-мерные векторы х, а входами системы — m-мерные век¬ торы и (/), причем т < п (4.81) Определение 4.3. Говорят, что система оР непрерывна (по времени), если множество Т представляет собой открытый интервал (Tlt Т2\ который может быть равен всему R. Интервал (7\, Т2) часто называют областью существования или интервалом определения системы. Импульсные систе¬ мы являются примером обширного класса систем, не являющихся не¬ прерывными. Определение 4.4. Динамическую систему называют дифферен¬ циальной, если уравнения состояния и выхода системы имеют вид *(/) = $[/; «(!„. Ф х('о)] (4.82) где ф есть решение системы дифференциальных уравнений x(t) = f\x(t\ /], (4.83) где лг(/0) — начальная точка, f удовлетворяет условиям теоремы 3.14, и y(t) = g[x(t), /], (4.84) гДе g — непрерывная функция всех своих аргументов. Мы часто будем ссылаться на уравнения (4.83) и (4.84) как на уравнения системы и на¬ зывать уравнение (4.83) уравнением состояния. Далее, говоря «динамическая система» или просто «система», мы будем подразумевать «конечно-мерную непрерывную дифференциальную си¬ стему». В заключение отметим, что в книге под термином «динамическая система» мы будем понимать сложное понятие, состоящее из открытого интервала (Тъ Т2), который может представлять собой все 7?, множества U кусочно-непрерывных функций преобразования этого интервала в Rni, непрерывной функции/, преобразующей пространство Rn X Rfn х (Ті, Т2) в Rn, и непрерывной функции g, преобразующей пространство Rn X X Rm X (7\, Т2) в Rp, удовлетворяющих условиям: 4.1. Для любых х{} из Rn, tQ и t из (T Т2), t tQ и всех u(t(l, из U существует единственное решение х (т) векторного дифференциального уравнения: х(т) = /[х(т), и(т), т], (4.85) определенное на интервале [/0, /] \ причем x(tQ)^x0. (4.86) Уравнение состояния -*(/) - ф({, d; х0) (4.87) представляет собой это решение. 4.2. ф является непрерывной функцией всех своих аргументов, удовлетворяющей условиям: а) л:й = дб(/0; «(г„. п; л0); (4.88) б) ф(1\ ZJ; х0) = $(/; и(і, п; $(t\ х0)) (4.89) для любого t из [/0, /]; в) Если и = V на (/0, /], то для любого т из [/0, t] «(Го, Т|; хо) = 0б(т; ■»(/„. т]; х0)\ (4.90) 4.3. Если определить выход у(/), положив = ё{ф(т\ х0), «(т), т], (4.91) 1 В действительности это означает, что существует решение на некотором открытом интервале, содержащем [/0, /]. 160
то Уа0. zi однозначно определяется заданием xQ = лг(/0) и ііщ, ф Если /0 < t < t и X (t) = ф (/, ііщ, ф х0), то У(1, п однозначно определяется через X (t) и а <7, ф Мы будем изучать вполне определенный класс динамических линей¬ ных систем. В заключение настоящего параграфа кратко обсудим понятие эквивалентности, которое будет нам полезно в дальнейшем, и рассмотрим некоторые примеры динамических систем. Напомним, что под мы понимаем «модель» некоторой физической системы «Движение» есть внутреннее движение системы и является геометрическим в том смысле, что оно не зависит от способа, которым мы его описываем. Траектории динамической системы («модели») можно рассматривать как кривые в пространстве Rtlt а выход у можно представ¬ лять себе как функцию точек этих кривых. Другими словами, траектории и выход системы являются геометрическими объектами, координаты которых удовлетворяют уравнениям системы. Состояние системы х (/) представляет собой вектор ѵ в Rn с координатами (/), х2 (/), . . ., хп (/) по отношению к натуральному базису еъ е2, .. -, еп пространства Rn (см. § 2.6) \ Если Р — невырожденная матрица размера п X п [см. урав¬ нение (2.59)], то z (t) = Plx (t) можно рассматривать как представление вектора ѵ по отношению к базису Ре1У Ре2 • • Рвп из Rn- Следовательно, если рассматривать динамическую систему о/9', описываемую уравнениями z(t) = P~\f[Pz(t\ /]; (4.92) Я0 = g [Pz(t), u(t), /], (4.93) то траектории и выход системы будут теми же самыми, что и для системы S?. Последнее обстоятельство приводит к следующему определению. Определение 4.5.2 Две динамические системы S? й&' называют экви¬ валентными, если существует невырожденная матрица Р размера п X п из постоянных элементов, такая, что Р’1х(/) = г(/), (4.94) где x(t) — переменная состояния системы о? uz(f) — переменная состоя¬ ния системы <^'. Это понятие эквивалентности будет полезно, в частности, при изуче¬ нии линейных систем (см. § 4.7). Пример 4.2. Пусть (Тѵ Т2)— все R и U — множество всех кусочно-непрерывных функций из R в R, а f — непрерывная функция преобразования R2 X R X Я в R2, задан¬ ная как (4.95) (4.96) 1 Напомним, что — 2 Такое понятие эквивалентности не является наиболее общим, но оно соответствует нашим целям. 6 Атанс и др. 161
и g — непрерывная функция, преобразующая /?2 X R X R в R, заданная как Рассмотрим векторное дифференциальное уравнение: X (т) = /[х(т), и (х), т] = (4.97) (4.98) (4.99) (4.100) Известно (см. пример 3.51), что это уравнение имеет единственное решение: /0)х0 + Ф(/, /о) f Ф(^о, т)[* «7 I U t0 где Ф (/, /0) — матрица: Ф(і, t0) = причем и (т) di, 2 *о т2 2 е 2 di X (/0) — -^о- Запишем выражение (4.101) в виде ( р Г 1 1 1 jc(f)=fl6(f; u(Zo, л; х0)=Ф((. (o)Uo + j Ф(<о. т) I J«(T)drk V Іо ) (4.101) (4.102) (4.103) (4.104) 0 е _ Jo_ е 2 е 2 Из свойств фундаментальной матрицы Ф (/, /0) (см. §3.19) видно, что функция ф (t; U(to х0) удовлетворяет условию 4.2. Далее, так как однозначно опреде¬ ляется величинами х0 и то, очевидно, условие 4.3дакже удовлетворяется. Что ка¬ сается условия 4.1, то оно является следствием теоремы 3.14. Итак, мы определили дина¬ мическую систему второго порядка с помощью уравнений: состояния ГО 11 Г 1 1 x(t) = [о t\ х (0 + [о Jw(Oî (4.105) выхода у(0=[1 0]х(0+0а(0. (4.106) 4.7. ЛИНЕЙНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ Грубо говоря, динамическая система линейна, если линейны уравне¬ ния системы. Можно дать более строгое определение. Определение 4.6. Динамическую систему называют линейной динами¬ ческой системой (или просто линейной системой), если векторное диффе¬ ренциальное уравнение для состояния системы дг (0 есть линейное диф¬ ференциальное уравнение (см. § 3.19) и если выход y(t) есть линейная функция от X (/) и и (/). Уравнения линейной системы имеют вид х(/) = А (/)*(/) + B(t) и (0; (4.107а) y(t) = С(/)х(/) + D(0«(0, (4.1076) где Л (/) — п X п матрица-функция; В (/) — п X т матрица-функция; С (/) — р X п матрица-функция и D (t) — р X т матрица-функция. Все эти матрицы являются функциями времени t. 162
Если приведенные матрицы являются постоянными, то имеем систему с постоянными параметрами, а в противном случае — систему с перемен¬ ными параметрами (сравните с определением 3.43). 7?£-цепочки (см. рис. 4.1 и 4.2) и пример 4.2 представляют собой линейные системы. Для нас особый интерес будут представлять системы, уравнения которых имеют вид л(/) = Л(/)х(о + ^(/)«(О; 1 (4108) y(t) = Cx(t). J В этом случае мы часто будем называть уравнение x(t) = A (t)x(t) + B(t)u(t) (4.109) уравнением системы или просто системой. Если рассматривается линейная система с уравнениями (4.107а) и (4.1076), то уравнения состояния и выхода системы можно записать через фундаментальную матрицу Ф (/, /0) уравнения (4.107а) в виде {t 1 Хо + Уф-1(т, to)B(x)tl(T:)dx ; (4.110) to j у(/)= И((о, (]•- Хо)+ = = С(і)Ф(і, /0) Хо Ф-’(т—/0)^(T)»(T)dT + (4.111) В частности, для линейной системы с постоянными параметрами А (/) = А, В (t) = В, С (/) = С, D (/) = D, имеем {t 1 х0 + J Д»(т)б/тг; (4.112) to J {t ï х0 4- J е~А <*-'») Я«(т) Л 4- Du(t). (4.113) to J Заметим, что свойства переходной функции ф (t; xQ) [см. урав¬ нения с (4.88) по (4.90) ] непосредственно вытекают из свойств фундамен¬ тальной матрицы (см. § 3.20), и наоборот. Отметим также, что понятие эквивалентности (см. определение 4.5) для линейных систем соответствует использованию преобразования подобия (§ 3.22). С другой стороны, если мы применяем преобразование подобия к линейной системе то получаем эквивалентную линейную систему . Наоборот, если линейная система эквивалентна линейной системе^ в смысле определения 4.5, то уравнения^' получены из уравне¬ ний с помощью преобразования подобия. Это означает, что преобразова¬ ние подобия изменяет уравнения системы, но не меняет геометрических свойств движения системы. В частности, если Р — невырожденная п X п матрица [см. уравнение (2.59)] и если Z (t) = P~~^x(t), (4.114) то система с переменной состояния z (/), эквивалентная системе (4.107а) и (4.1076), описывается уравнениями 2(0 =Р“1Л(/)Рг(/) + Р-1В(/)«(/); (4.115) у(0 = С(/)Рг(0 + Л(0«(0- (4.116) Эти положения мы часто будем использовать в дальнейшем. * 163
4.8. СВЯЗЬ МЕЖДУ ВХОДОМ И ВЫХОДОМ СИСТЕМЫ. ПЕРЕДАТОЧНАЯ ФУНКЦИЯ 1 До сих пор мы имели дело преимущественно с основными положе¬ ниями, связанными с абстрактным понятием динамической системы. Посмотрим, как связаны данные положения с передаточной функцией системы, которая, по-видимому, является тем понятием, с которым инже¬ нер, занимающийся управлением, знаком лучше всего, поскольку оно уста¬ навливает связь между входом и выходом линейной системы. Ниже будет показана связь соотношения входа и выхода с ее передаточной функцией, а в следующих двух параграфах — получение описания процесса в виде динамической системы на основе передаточной функции. Одной из наиболее сложных проблем, с которой сталкивается инже¬ нер, является проблема адекватного математического описания данного физического процесса или системы. Если процесс так же прост, как в цепочке § 4.2, то уравнения, описывающие процесс, получаются непосред¬ ственно. Однако в общем случае это невозможно, и хорошее математиче¬ ское описание процесса можно получить только в результате большого количества экспериментов. Обычно экспериментатор прикладывает из¬ вестные входные сигналы и наблюдает получающиеся выходные сигналы. В результате таких экспериментов и априорных теоретических знаний получаются соотношения, связывающие доступные для наблюдения выходные сигналы и допустимые входные сигналы системы. Например, метод частотных характеристик и реакция системы на скачок входного сигнала широко применяются для получения передаточных функций линейных систем с постоянными параметрами. Довольно часто результатом экспериментов над системой с одним входом и одним выходом является линейное дифференциальное уравнение, связывающее ее выход у (t) со входом и (/) в виде {Dn + an_J)n~x••• -I- ахГ> -I а0} y(f) -_=bou(t), (4.117) где символ D обозначает дифференцирование по времени. Если система адекватно описывается дифференциальным уравнением (4.117), то в теории регулирования обычно гцворят, что система имеет передаточ¬ ную функцию G(s) = = 777 7 7— ’ <4-118> и (s) sn 4- Пп-iS 1 + • • • + Û1S 4- а0 где у (s) — преобразование Лапласа от выхода у (t) и и (s) — преобразо¬ вание Лапласа от входа и (t). Так как передаточная функция G (s) (4.118) не имеет конечных нулей, то говорят, что она содержит только полюса. Полюсами G (s) являются корни полинома, стоящего в знаменателе: sn + an_1sn~l 4- F- axs 4- а0. (4.119) Часто уравнение, связывающее выход у (/) со входом и (t) для системы с одним входом и одним выходом, имеет вид {7)п 4- ап-і^п 1 + • • • Ч~ aiD 4~ Яо} у{і) = = {bmDm + bm_1Dtn~x + ... ^blD + bQ\u (0. (4.120) Такая система имеет передаточную функцию fg- = bmSn+ ' ï + éll+ 60 ’ (4.121) w s 4- + •• • 4- 4~ 1 Cm. [34], [36] и [212] (гл. 9). 164
где у (s) — преобразование Лапласа от у (/) и и (s) — преобразование Лапласа от и (t). Передаточная функция H (s) содержит как нули, так и полюса. Нули H (s) являются корнями полинома числителя bmsm — -I- • • • -I- bts + b0, (4.122) a полюсами H (s), как и прежде, корни полинома знаменателя H (s). Предположим, что рассматриваемая система имеет п выходных сигна¬ лов уг (/), г/2 (0, • • -, Уп, (О И т входных сигналов (/), и2 (/), . . . . . ., ит (/). Такую систему часто называют системой со многими перемен¬ ными. Если мы начнем экспериментировать с такой системой (линейной с постоянными параметрами), то получим набор соотношений между вхо¬ дами и выходами вида £4 (D) У1 (t) = (О) и. (/) + $12 (D) и2 (/)+••• + (D) ит (0; e2 (D) y2(t) = $21 (D) и. (О + $22 (D) и2 (/) 4- • • • + {D) иМ (4.123) дифференциальных которого являются ^n(D)yn(t) = ^nl(D)u1(t)^^n2(D)u2(t)-i ... + где (D) и (D), і = 1, 2, . . ., n; j = 1, 2, . . ., m — линейные диф¬ ференциальные операторы с постоянными коэффициентами. Для системы со многими переменными, описываемой набором ‘ ' уравнений (4.123), можно определить передаточную матрицу следующим образом. Пусть у (/) — выходной вектор, компонентами Уі (t), У2 (0» - - •> Уп (О и и (t) — входной вектор с компонентами иг (/), и2 (t), . . ., ит (/). Если преобразование Лапласа от у (t) и #(/) обозна¬ чить через у (s) и и (s) соответственно, то п X т матрица G (s) называется передаточной матрицей системы, если y(s)-G(s)a(s). (4.124) Пример 4.3. Рассмотрим систему со многими переменными из § 4.3. Передаточная матрица этой системы равна 1 1 G (s) = s — аг 1 s — a3 1 (4.125) s — a2 s — a4 J Наконец, в заключение параграфа мы хотели бы указать, что задача получения адекватных соотношений между входом и выходом на основе эксперимента особенно сложна как для нелинейных систем, так и для линейных систем с переменными параметрами. Необходимо подчеркнуть, что в процессе эксперимента получаются соотношения (обычно в виде набора дифференциальных уравнений) между сигналами, прикладывае¬ мыми ко входам и наблюдаемыми на выходах. 4.9. ОТЫСКАНИЕ ПРЕДСТАВЛЕНИЯ В ПРОСТРАНСТВЕ СОСТОЯНИЙ (ИЛИ В ФОРМЕ ДИНАМИЧЕСКОЙ СИСТЕМЫ) ОБЪЕКТА, ПЕРЕДАТОЧНАЯ ФУНКЦИЯ КОТОРОГО СОДЕРЖИТ ТОЛЬКО ПОЛЮСА Инженер, работающий в области управления, хорошо знаком с систе¬ мами, которые имеют один вход и один выход и описываются линейными дифференциальными уравнениями с постоянными коэффициентами я-го порядка вида [Dn + • • • + atD + а01 У{і) = bQu(t), (4.126) 165
где у (t) — (скалярный) выход и и (t) — (скалярный) вход. В предыдущем параграфе мы видели, что такая система имеет передаточную функцию G (s) = -Ц4- • (4-127) V ’ “(s) s" + an.is"-14 F^s + ao Если мы обозначим через sb s2, . . ., sn корни (в общем случае ком¬ плексные) многочлена в знаменателе sn + ^n-isn~x + • • • 4- 4- а0, (4.128) то sz будут полюсами G (s), и мы имеем право написать G (s) = -, п -, г. (4.129) ѵ 7 (s — Si) (s — s2) ... (s — sn) v 7 В этом параграфе мы найдем представление системы (4.126) в про¬ странстве состояний (или в форме динамической системы) и попытаемся показать физический смысл понятия состояния системы. Так как нам надо знать п начальных условий у (0), у (0), . . у(п-ѵ (0) для того, чтобы получить решение дифференциального уравнения (4.126), то можно догадаться, что такое состояние системы. Имея это в виду, по образцу § 3.24 определим п переменных (/), z2 (О, • • -, zn по' ложив zi(0 = y(0; za(0 = i/(0; zn(t) = y^(t). Из (4.130) заключаем, что Zi(0 = z2(/); 22(0 = z3(0; (4.131) a из уравнения (4.126) z„(0 = Dny(t) = —aoy(t) - а1У(і) ап_іУ{п^ (/) - bou (t). (4.132) Следовательно, Zn(0 = ~aoZi(/) —адД/) — Wn(0 (4.133) откуда вытекает, что если мы определили zi по соотношениям (4.130), то zi удовлетворяют системе п линейных дифференциальных уравнений, которые можно записать в матричной форме как "*і(0 ” 0 1 0 .. .. 0 "о“ г2(0 0 0 1 .. .. 0 МО 0 • • = • • + и(і). (4.134) *п-1(0 0 0 0 . .. 1 0 а0 —«1 —а2 .. • • ап-1_ _гп(П _ - ^°_ 166
Векторное дифференциальное уравнение (4.134) имеет вид z(t) = Az(t) + &«(/). (4.135) Уравнение (4.135), за исключением различия в символах, полностью идентично (3.396). Матрица системы А дается соотношением (3.398), а «-мерный вектор b в (4.135) определяется как “О" О (4.136) О Убедимся, что вектор z (t) представляет собой переменную состояния системы (4.126). Чтобы сделать это, мы должны показать, что знание z (t0) Рис. 4.8. Моделирование системы (4. 134) с помощью аналоговой вычислительной машины и u(t0, t] полностью определяет £(fo, и выход у(#0, п. Если z (/0) и u(fo, п известны, то единственное решение уравнения (4.135) с z (t0) в качестве исходной точки и управляющей функцией иц0, t] выражается соотно¬ шением t z(t) = еА J<*-'•>&« (т)гіт, (4.137) /о где —фундаментальная матрица уравнения (4.135). Следова¬ тельно, Z(t0, t] полностью определяется начальной точкой z (/о) и функ¬ цией U(iot fj. Так как у (/) = (/) [в силу (4.130)], то очевидно, что y{t0, (j = Zi(f0,f] также полностью определяется z (/о) и u{tQt Уравне¬ ниями состояния системы являются выражения z(t) = Az(t) + bu(t)-, I У(/) = 21(О. I Мы предлагаем читателю убедиться, что действительно нашли дина¬ мическую систему, которая описывается уравнением (4.126). Рис. 4.8 иллюстрирует моделирование векторного дифференциального уравнения (4.134) с помощью аналоговой вычислительной машины. Для моделирования требуются п интеграторов. Переменные состояния 2і (0, г2 (0, • • -, гп (0 соответствуют выходным сигналам интеграторов. 167
Постоянные коэффициенты а0, аА, . . ап_г являются коэффициентами усиления в цепях каналов обратной связи. В § 3.24 было показано, что собственные значения À2, . . ., матрицы системы (3.396) являются корнями полинома V 4-ап_Х~' -1 } «А f-a0. (4.139) Но два полинома (4.128) и (4.139) идентичны, и, следовательно, имеют одинаковые корни. Таким образом, собственные значения матрицы А (3.396) те же самые, что и полюса передаточной функции О (s) (4.127). Этого следовало ожидать, потому что полюса передаточной функции определяют частотную и переходную характеристики системы и урав¬ нения (4.138) представляют собой просто другой способ описания той же системы. Иначе говоря, собственные значения матрицы системы А опре¬ деляют характеристики системы (4.138), а полюса О (s) — характеристики системы (4.126). Так как это — математические описания одного и того же физического процесса, то полюса и собственные значения должны быть связаны друг с другом. В данном случае они одинаковы. В § 2.10 мы пока¬ зали, что собственные значения являются инвариантным свойством ли¬ нейного преобразования и матрица, связанная с линейным преобразова¬ нием, зависит от базисов векторных пространств. Систему также можно рассматривать как линейное преобразование и, следовательно, обнаружить, что полюса (или собственные значения) представляют собой инвариантные величины. В данном случае матрица и вектор состояния системы зависят от выбранного базиса. Это лишь другая формулировка того положения, что собственные значения эквивалентных систем (см. определение 4.5) одинаковы, тогда как их переменные состояния и ма¬ трицы могут быть различными. Для того чтобы проиллюстрировать неединственность вектора со¬ стояния, произведем следующую замену переменной. Пусть Q — невыро¬ жденная п X п матрица; определим вектор x(f), положив *(/) = (4.140) где z (t)— вектор, определяемый соотношением (4.130). Такая замена эквивалентна замещению системы (4.138) системой, эквивалентной по определению 4.5. Продифференцировав обе части выражения (4.140), получим *(/)== Q"W)- (4.141) Умножив обе части уравнения (4.135) на матрицу Q'1, получим Q-'z (t) = Q-'Az (t) 4- Q-'bu (/). (4.142) Подставляя (4.140) и (4.141) в (4.142), находим, что x(f) удовлетворяет дифференциальному уравнению x(t) = Q~1AQx(t) + Q~1bu(t). (4.143) Пусть S=Q-14Q; (4.144) Уравнение (4.143) запишется в виде x(t) = Sx(f) 4 (4.145) Матрицы S и А подобны 1 и, следовательно, имеют одинаковые соб¬ 1 См. § 2.9. 168
ственные значения (см. § 2.10). Так как собственные значения А те же, что и полюса функции G (s), то и собственные значения S должны совпадать с полюсами G (s). Далее, x(t) можно рассматривать как вектор состояния системы (4.126). Заметим, что для любого tQ знание х (/о) и u{to,t] пол¬ ностью определяет х^б, q, так как ; х(0 = es (t~to)x(Éo)-\- es J e~s (4.146) t0 Но если известен вектор х (т) для любого т из (/0, /], то известен и вектор г (/), так как z (т) = Qx(t), где Q — невырожденная матрица, и, следовательно, (т) = у (т) для любого т из (/0, t], Итак, x(f) — вектор состояния системы (4.126), и уравнения (4.135) и (4.145) являются эквивалентными описаниями этой системы. Упражнение 4.6. Промоделируйте с помощью аналоговой вычислительной машины систему (4.126), используя ее представление в виде (4.145). Можно считать, что sz/- — эле¬ менты S, qij — элементы Q и сі — компоненты с. Требуется показать, что компонентами Х[ (t) и в этом случае являются выходы п интеграторов. Полезную замену переменных можно произвести, когда полюсами передаточной функции G (s) (или, соответственно, собственными значениями матрицы системы) являются различные действительные числа. В § 3.24 мы показали, что в этом случае можно отыскать невырожденную ма¬ трицу Р, которая является матрицей Вандермонда (3.411), такую, что (4.147) где А — диагональная матрица собственных значений (3.409). Если определить вектор состояния x(f), положив х(/) = (4.148) то x(f) будет удовлетворять дифференциальному уравнению x(t) = Xx(f) + P~lbu(t). (4.149) Обозначим элементы Р~1 через гі;, і, j = 1, 2, . . ., п. Так как век- тор b задан в виде (4.136), то уравнение (4.149) можно записать: X,. (t) = Vz(0 + GA“(O» (4.150) где — собственные значения матрицы системы и гіп — элементы по¬ следнего (дг-го) столбца матрицы Р”1. Рис. 4.9 иллюстрирует аналоговую модель системы, описываемой уравнениями (4.149) или (4.150). Компоненты вектора состояния (фазовые координаты) (/) опять представляют собой выходные сигналы п инте¬ граторов. Выход у (t) = (t) равен сумме xt (/), т. е. </(/) = ?,(/) = 2 %,.(/). (4.151) так как первая строка матрицы Вандермонда состоит целиком из единиц [см. матрицу (3.411)1. Числа гіп, і = 1, 2, . . ., п в (4.150) можно вычислить непосредственно, проинвертировав матрицу Р, однако их легче определить иным способом и получить дополнительную информацию о физическом смысле такого преобразования уравнений системы. Так как полюса G (s) расположены при s = можно написать п <41И> Z=1 169
где rz представляет собой вычет G (s) в f-м полюсе Так как \ раз¬ личны, имеем г ! І (^І ^і) (^' ^г) • • • Oti ^і-і) (^І ^і+і) • • • (h ^п) (4.153) Предположим, что вначале система находится в покое (т. е. все на¬ чальные условия — нулевые) и что приложен вход и (/), тогда п У($) = Ьо 2 (4.154) При этих же условиях, из выражения (4.150) находим x.(s) = (4Л55) Так как s ‘ у(/) = 2 х, (0, Ï=1 имеем п п У(з) = £xz(s) = ôo£ (4Л56) І=1 і=1 1 Сравнивая выражение (4.154) с (4.156), получим гіп = г1, (4.157) т. е. элементы последнего столбца Р-1 равны вычетам G (s). Рис. 4.9. Моделирование с помощью аналоговой вычисли¬ тельной машины системы (4.150) Преобразование подобия позволило заменить модель системы, пока¬ занную на рис. 4.8, моделью, которая приведена на рис. 4.9. Коэффи¬ циенты усиления г1п, г2п, . . гпп (рис. 4.9) в точности равны вычетам передаточной функции G (s) в полюсах Х2, . . ., соответственно. Пример 4.4. Рассмотрим систему с одним входом и одним выходом, описываемую уравнением третьего порядка {£>3 + 3D2 + 2D} у (0 = и (0. (4.158) Эта система имеет передаточную функцию У Q ( ! ! (Л 1 50) и (s) “ “ s3 + 3s2 + 2s ~ s (s 4- 1) (s + 2) V ' 170
с полюсами s = 0, s = —1 и s = —2. Если принять, что zi (О = ИО; г2(0=ў(0; гз(О = ÿ(O> . (4.160) то вектор z (/) с компонентами г, (/), г2 (/), г3 (Z) должен удовлетворять векторному диффе¬ ренциальному уравнению вида Zj(Z) г2 (Z) Lz3 (Z). или, более сокращенно, (4.161) z(t) =Az(t) + bu (Z). (4.162) Найдем собственные значения матрицы А. Для этого отыщем нули det (X/ — А), т. е. À —1 0 det (X/ —Л) = det À —1 = V + ЗѴ 4- 2Х. (4.163) Собственные значения А равны 0, —1 и —2. Полюса G (s) и собственные значения А одинаковы. Эти собственные значения — действительные различные числа. Если Р — матрица Вандермонда 1 1 0 —1 0 1 Р = (4.164) то, применяя преобразование подобия к уравнению (4.161), получим следующую систему, эквивалентную исходной: (4.165) (4.166) где X (()=-- Р *2 (Z). Заметим, что G М = 1 = 1 1 □_ 1 s (s + 1) (s + 2) 2s s + 1 Ф 2 (s + 2) * (4.167) Следовательно, вычеты G (s) равны элементам последнего столбца Р"1 [т. е. вычеты — это компоненты вектора, на который умножается и (/) в уравнении (4.166)]. 4.10. ОТЫСКАНИЕ ПРЕДСТАВЛЕНИЯ В ПРОСТРАНСТВЕ СОСТОЯНИЙ (ИЛИ В ФОРМЕ ДИНАМИЧЕСКОЙ СИСТЕМЫ) ОБЪЕКТА, ПЕРЕДАТОЧНАЯ ФУНКЦИЯ КОТОРОГО СОДЕРЖИТ ПОЛЮСА И НУЛИ Рассмотрим объект с одним входом и одним выходом, который описы¬ вается линейным дифференциальным уравнением с постоянными коэф¬ фициентами: {Dn + an_xDn 1 4~ • • • 4’ GjD 4~ y(J) = = \bnDn + bn_1Dn~ï + • • • + b,D + b0} u(t), (4.168) 171
где у (/) — скалярный выход и « (/) — скалярный вход. В § 4.8 [см. урав¬ нение (4.121)] мы видели, что такая система имеет передаточную функцию = -- v ' и (s) — ^пзП 1 • • • ~r~ bts 4~ b0 ,, 169) sn + ^n-isn 1 + • • • + ÆiS + Uq Если обозначить через sx, s2, . . sn комплексные корни полинома знаменателя H (s) и через ох, о2, • • •> — комплексные корни 1 полинома числителя H (s), то sz будут полюсами H (s), а — нулями H (s) и можно написать // (s) - Ьп (s — oj (s — g2) (s — Si) (s — s2) (s —an) (s — sn) (4.170) В этом параграфе мы найдем представление в пространстве состояний (или в форме динамической системы) объекта, который описывается урав¬ нением (4.168). Для того чтобы получить решение дифференциального уравне¬ ния (4.168), необходимо знать 2п начальных условий, а именно: у (0), у (0), . . ., у{п~Х} (0) и и (0), и (0), . . ., а(п~і} (0). Попытаемся определить вектор состояния следующим образом. Пусть г (/) есть /г-мерный вектор с компонентами zx (/), z2 (/), . . . . ., zn (/), заданными соотношениями 2і(0 = і/(0 —Ло«(О; г2(0 — і/(0 — Л#«(0 — AjU(O; 2з(0 = і/(0—М(0—М(0 —М(0; (4.171) 2« (0 = У(п~'} (0 - (0 - Л1«("~2) (0 hn-iU (0, где Ло, hlt . . ., hn_i — постоянные, которые нужно найти. Соотношение (4.171) можно записать в виде 2,(0 = y<Z-1)(0- S t = l- 2, .... п. (4.172)2 k=Q Найдем дифференциальное уравнение, которому удовлетворяют zt- (/). Из соотношений (4.171) заключаем, что y(t)-hQu(t)= (4.173) -г2(/)Н М(0- (4.174) Наш вывод основан на дифференцировании уравнения, определя¬ ющего z1 (/), и на подстановке результата в уравнение, определяющее z2 (t). Совершенно аналогично можно получить г,(^) = //“>(0- (4.175) k=Q = (4.176) 1 Мы приняли, что число нулей равно числу полюсов. Это несущественно, так как можно выбрать Ьп = ^п-1 — ’ • • — Ьт+і — 0, Ьт =/= 0. В этом случае будем иметь т нулей и п полюсов. 2 Напомним, что (Z) = u (t). 172
так как zi+1 (/) = y{i) (/) — S u(k} = k=Q = yz) (0 - hiU(t) - É uw (t)ht_k. (4.177) /2=1 Дифференцирование выражения (4.172) для i = n дает: (4.178) /2=1 Дифференциальное уравнение (4.168) дает соотношение ÿ<n)(0 = — V а.уМ (Z) bnUW (/) 2 bku(k} (t) + bou(t). i=0 &=1 (4.179) Из выражения (4.177) следует, что л—1 п—\ л—1 Г і S «(Ѵг)(0= S ад+1(о+ S а,- S (t)hi_k (=0 z=0 г=() L/e = l л—1 + «(/)£ аД (4.180) і -о и, следовательно, л-1 л—1 гп(0 = — S аЛ+і(0 + bnu{n}(t) + S bkUW(t) + bou(t) — i=O É=1 (4.181) Путем непосредственных вычислений можно получить Л—1 і л—1 л—k— 1 — s а(. É и(к) (t) = — S и(к) (t) S hiai+k. t—0 Л=1 fe=l i=0 (4.182) Подставив это выражение в уравнение (4.181) и сгруппировав члены, получим л—1 МО = - S аЛ+1(0 + (bn - h0)uw (t) + (=0 л—1 I* 'П—k—1 ù f л—1 \ + ^uw(f)\bk-ha_k- S M+4 + «(O po-S аД • (4.183) k=A I £=0 J I f=0 J Выберем h таким образом, чтобы zn (/) не зависела от всех производ¬ ных и (/). Это можно сделать, положив h0 = bn- (4.184) л—k—1 hn-k = bk— S htauk для k=\, 2, n—1. i=0 Подставив выражение (4.184) в уравнение (4.183), получим дифферен¬ циальное уравнение л—1 zn(0 = — S aiZi+i(f) + hnu(f), (4.185) 4=0 где л—1 й„ = &0-2аЛ. (4.186) і ' *0 173
Итак, мы получили дифференциальные уравнения относительно (/), которые можно записать в векторной форме: 4(0 МО 0 0 1 0 0 . . 1 . . 0 0 4(0 + " Лі «(0 4-1(0 0 0 0 1 zn-r(t) hn-, .4(0 а0 —«1 —а2 . . • — ап-1_ /At) (4.187) или, сокращенно, г(/)-Лг(/) + МО> (4.188) где А — матрица (3.398) и h — вектор с компонентами Л2, • • -, определяемыми уравнениями (4.184) и (4.186). Рис. 4.10. Представление в виде аналоговой модели системы (4.187) Заметим, что вычисление постоянных і = 0, 1, . . ., п не предста¬ вляет особого труда, так как уравнения (4.184) имеют вид = Л1 = ^0an-iî Л2 - &п-2 — U-2 — (4.189) и hL находится последовательными подстановками. Нетрудно убедиться, что вектор z (t) представляет собой вектор со¬ стояния системы (4.168), так как знание z (Q и полностью опре¬ деляет решение дифференциального уравнения (4.188) на интервале Ио, t] (т. е. г(/о d). Поскольку выход у (t) равен ÿ(0 = ^i(0 + M(a (4.190) ясно, что y(to п полностью определяется величинами z (/0) и Мы предлагаем читателю получить уравнения состояния и убедиться, что действительно нашли динамическую систему, которая описывается выражением (4.168). Интересно сравнить дифференциальное уравнение (4.187) си¬ стемы (4.168) с дифференциальным уравнением (4.135) системы (4.126). Матрица системы А одинакова в уравнениях (4.187) и (4.135). Эти уравне- 174
ния отличаются лишь векторами b и й, на которые умножается управле¬ ние и (f). Ясно, что собственные значения матрицы системы А являются полюсами как передаточной функции H (s) [см. (4.169)], так и передаточ¬ ной функции G (s) [см. (4.127)]. На рис. 4.10 показана аналоговая модель векторного дифференциаль¬ ного уравнения (4.187). Фазовые координаты являются выходами п инте¬ граторов. Сравнивая рис. 4.8 и 4.10, нетрудно заметить, что последняя схема отличается от первой лишь наличием каналов прямой связи, а каналы обратной связи обеих схем идентичны. Выше мы полагали, что число полюсов и нулей H (s) одинаково. Рассмотрим случай, когда передаточная функция H (s) имеет т нулей и п полюсов, причем m<Zn. Иначе говоря, предположим, что в уравнении (4.168) ьп = Ьп.і = • •• = bm+1 = 0, Ьт=£0 (4.191) и что H (s) имеет вид H (s) = - bm, (s~ - °т) . (4.192) ѵ 7 (s — Si) (s — s2) ... (s — sn) v Способом, совершенно аналогичным тому, который использовался для систем с п нулями и п полюсами, можно показать, что вектор г (/) с ком¬ понентами Zj (/), z2 (/), . . ., zn (f), определенными как г2(/) = ў(0; = У(п-т) ^) = y(n~14t)-hn.mu^(t) W (0> 1 (4.193) где n—k—1 hn-k = bk— S О/+Л> k = °> t j—n—tn . . /И, (4.194) можно рассматривать как вектор состояния системы с передаточной функцией H (s) по выражению (4.192). Доказать это мы предлагаем читателю, отметив, что г (0 удовлетворяет векторному дифференциаль¬ ному уравнению "0 ^п-1 hn (4.195) 175
Выше уже рассматривался эффект преобразования подобия для слу¬ чая действительных различных собственных значений (§ 4.7 и 4.9). По¬ смотрим, к каким выводам приведет нас преобразование подобия в дан¬ ном случае. Пусть собственные значения À2, . . ., матрицы системы А (4.188) действительны и различны. Определим вектор состояния х (/), положив х(/)-P-^(Z), (4.196) где Р — матрица Вандермонда (3.411). Новый вектор состояния удовле¬ творяет дифференциальному уравнению х(0 - Лх(0 + P-'huify (4.197) где Л —диагональная матрица собственных значений (3.409). Еслиx1(f). х2 (/), . . ., хп (/) — компоненты х (/) и Ѵі~ Ѵ2 V = p-^h (4.198) то уравнение (4.197) можно записать в виде xi(t)=kixi(t) + viu(t). (4.199) На рис. 4.11 показана модель системы (4.199) в предположении, что Ьп 0, т. е. когда H (s) имеет п нулей и п полюсов. Из сравнения рис. 4.11 с рис. 4.9 видно, что единственное отличие — канал прямой связи от входа и (/), который показан на рис. 4.11. С другой стороны, если Ьп = 0 (т. е. число нулей по крайней мере на один меньше числа полюсов), то hQ = 0 и рис. 4.11 и 4.9 имеют одинаковую структуру. Если Ьп — 0, то коэффициенты и2, ...» ѵп можно рассчитать непосредственно. Можно определить vt и в терминах вычетов H (s) в полю¬ сах Для этого предположим, что в начальный момент система находится в покое, т. е. У(0) = ÿ(0) = ••• = ÿ(n-1) (0) = u(0) — • • • = u^-1’ (0) = 0, (4.200) 176
и к ней прикладывается входной сигнал и (/). Известно, что преобразова¬ ние Лапласа дает z/(s) = //(S)M(S) = 2 (4-201) 1=1 где pt — вычет H (s) в полюсе \. Так как Хг различны, имеем п ^rn (Xz <h) (X/ а2) . . . (Xz от) . 9П9\ Р‘ (Xz - Xi) (Xz - X2) . . . (Xz - Xz^) (Xz - Xz+1) . . . (Xz - X„) ’ где H (s) имеет m нулей o2, • • tT- e- H (s) определяется урав¬ нением (4.192)]. Из уравнения (4.200) в силу (4.193), определяющего z (/), следует, что z (0) = 0, и поскольку Р"1 — невырожденная матрица, то %і (0) - х2 (0) - - - - - хп (0) - 0. (4.203) Из уравнения (4.199) получим xi(s) = s-=17«(s)- (4-204) Элементами первой строки матрицы Вандермонда Р (3.411), являются единицы. Так как Ьп = 0, то и hQ = 0, и мы получим п п y(s) = zl(s) = 2^.(5)= (4.205) Z=1 Z=1 1 Сравнение выражений (4.205) с (4.201) приводит к заключению, что ѵі = Рр 1• = h 2, ..., п. (4.206) В этом и предыдущем параграфах мы показали, как найти описание системы в пространстве состояний (в фазовом пространстве) по ее пере¬ даточной функции. Мы показали, что собственные значения матрицы системы равны полюсам передаточной функции, а ее нули влияют только на управление в том смысле, что нули передаточной функции определяют «усилительный» вектор Ь. Отметим, что представление системы в пространстве состояний соот¬ ветствует моделированию системы с помощью аналоговой модели, в кото¬ рой фазовые координаты являются выходами интеграторов. Полюса передаточной функции и собственные значения матрицы си¬ стемы одинаковы. Нетрудно убедиться, что критерий устойчивости (§ 3.26) можно преобразовать в известный критерий устойчивости в терминах положения полюсов передаточной функции на комплексной плоскости. Пример 4.5. Рассмотрим систему y\t) -г 3ÿ (t) + 2у (Z) = ü (t) + 7« (0 + 12« (О, для которой имеем п = 3; а0 = 0; «х = 2; а2 — 3; Ь3 = 0; b2 — 1; ЬА = 7; Ьо = 12. Из уравнения (4.194) находим hQ — 0; hr = 1; h2— 4; h3 = —2. Фазовые координаты zx (0> z2 (/) и z3 (/) определяются соотношениями (4.193): (0 = г2(0 = ^(0-«(0; 177
Упражнение 4.7. Найдите дифференциальные уравнения в фазовых координатах zi (t) для следующих систем: 1) 7(0 = ’Й); 2) ÿ\t) = ü(t) + 8Û (0 4 15u (0; 3) ÿ'(t) -y(t)=à (t); 4) ÿ<4> (/) + 2ÿ(3) (t) + z/<2> (t) = u(2) (/) + u(1> (/). Упражнение 4.8. Рассмотрите систему y (t) 4 at (t) y (t) 4 a0 (t) y (t) = b2 (t)u (t) 4 (0 à (/) 4 b0 (t) и (/), где коэффициенты являются непрерывными функциями времени. Требуется найти описа¬ ние системы в пространстве состояний. У Казани е: Необходимо использовать выра¬ жения Zi (0 = у (t) — hQ (t) и (t) и т. д. Упражнение 4.9. Обобщите результат упражнения 4.8 на случай линейной системы с переменными параметрами n-го порядка. ЗАДАЧА УПРАВЛЕНИЯ 4.11. ВВОДНЫЕ ЗАМЕЧАНИЯ Ранее сформулировано общее определение динамической системы и рассмотрены связанные с ним понятия входа, выхода и состояния. Поэтому мы подготовлены к тому, чтобы в достаточно общем виде рассмо¬ треть задачу «управления» динамической системой. При изучении физиче¬ ской системы обычно имеются в виду какие-то определенные цели. В дан¬ ном случае мы хотим, чтобы наша физическая система выполняла опре¬ деленную задачу и делала это возможно «дешевле». Например, нам необ¬ ходимо спроектировать автопилот с некоторыми определенными характе¬ ристиками или систему управления положением спутника, достаточно быстродействующую, но потребляющую не слишком много рабочего тела, или быстродействующую силовую следящую систему. Перевод этих инже¬ нерных задач проектирования на абстрактный язык динамических систем и представляет собой то, что мы будем дальше называть «задачей управле¬ ния». Существенными элементами задачи управления являются: 1) динамическая система, которой надо «управлять»; 2) желаемый выходной сигнал или цель системы; 3) множество разрешенных (или допустимых) «управлений» (т. е. входных сигналов); 4) функционал, измеряющий эффективность «управляющих дей¬ ствий». В качестве желаемой цели системы будем рассматривать заданное состояние или множество таких состояний, которые могут изменяться с течением времени. Иначе говоря, вопрос о получении определенного выходного сигнала мы заменим задачей «попадания» в определенное множество цели в пространстве состояний системы. Например, если мы хотим, чтобы выходной сигнал у (Z) линейной системы, определяемой уравнениями x(t) = A(t)x(t) + все время стремился к нулю, это означает, что мы хотим достичь такого множества состояний х, для которого Сх = О1. «Управляющие» сигналы физической системы обычно получаются с помощью аппаратуры, способной дать ограниченные по величине «силу» или «энергию». Это обстоятельство вызывает необходимость накладывать 1 Если (5 — преобразование Rn в Rp, <5х = Сх, то множество цели есть ядро (0) (см. § 2.4). 178 (4.207)
ограничения на множество всех входов, которые можно использовать для управления системой. Множество управлений (7, удовлетворяющее таким ограничениям, будем называть областью допустимых управлений. Для большинства физических систем желаемая цель может быть до¬ стигнута с помощью различных допустимых входов, дающих различные переходные процессы. Нам хотелось бы рассчитать каждый из них и, если возможно, выбрать наилучший. Это обстоятельство требует некото¬ рого критерия (или функционала). Функционалы, которые мы будем использовать для измерения «стоимости» управления нашей системой, принимают действительные значения и зависят от состояний, соответ¬ ствующих началу и концу «управляющих действий»; траектории движения системы от исходного до конечного состояния; времени, в течение которого прикладывается управление, и используемого закона управления. 4.12. ОПРЕДЕЛЕНИЯ Предположим, что нам дана динамическая система /г-го порядка Літ=/[^т ! (4.208) y(t) = g[x(t), a(t), /] J на интервале определения (T T2) (cm. §4.6). Обозначим переходную функ- цию системы через Ло)- (4.209) Пусть L — непрерывная действительная функция, заданная на Rn X X Rm X (7\, Т2), т. е. непрерывная функция вида L(Xi, х2, • • -, и2> • • -, ит, О, (4.210) и К — действительная функция на Rn X (7\, Т2): К(хі, х2,..., хп, t). (4.211) Будем считать подмножество S из Rn X (Tlt Т2) заданным и назовем его множеством цели (target set). Элементами множества цели являются пары (лг, /), состоящие из состояния х и точки t из интервала определе¬ ния системы. Важным элементом определения динамической системы является множество U кусочно-непрерывных функций (см. определение 4.4). Эле¬ менты и из U будем называть управлениями и покажем, как связаны огра¬ ничения с определением U. Предположим, что для каждого t из (Tlt Т2) задано подмножество Ut из Rm (обычно замкнутое, ограниченное и выпуклое или все /?щ). Обо¬ значим набор всех множеств Ut через Q, т. е. Й = {^:/С(Л, Л))- (4.212)1 Определение 4.7. Ut называют областью ограничений при t и Q — множеством ограничений (или просто ограничениями). Если U — мно¬ жество всех ограниченных кусочно-непрерывных функций и (/) на (Т19 Т2), такое, что и (t)Q Ut для всех t из (Т19 Т2), (4.213) то говорят, что U есть множество, или область управлений, удовлетво¬ ряющая ограничениям Q (или U — область допустимых управлений). Любой элемент и из U называется допустимым управлением. 1 Q имеет другой смысл, нежели в § 4.5. Здесь множество из § 4.5 представляет собой пространство Rm. 179
Пример 4.6. Обозначим через U подмножество из Rm, заданное как 67 = {«і^і + ti2e2 + • • • + и-т^пі : | щ | ^Л4/}, (4.214) где Мі — заданные постоянные и е19 е2, . . ет — натуральный базис в Rm [см. урав¬ нение (2.27)]. Тогда довольно часто встречающееся множество ограничений Q дается соот¬ ношением Q = {Ut — Û: t из (Л, Т2)}. (4.215) Здесь и (t) удовлетворяет ограничениям Q тогда и только тогда, когда для любого t из (?і, Т2) имеем г = 1, 2,. . tn. (4.216) Часто говорят, «« (/) удовлетворяет ограничению |щ (/)| Л4(-, і— 1, 2, . . ., m» вместо «я (6) удовлетворяет ограничению Q». При Мг — М2 — * • -= Мт = 1, ограничива¬ ющим множеством является гиперкуб в Rm. Пример 4.7. Пример ограничений, зависящих от времени, можно получить, приняв ,, ((« : lu/lsgl, і = 1, 2, . . m для t из (Tlt T]} Uf = < (4.217) I : I Ui I 2, 4 = 1, 2,. . tn для t из (T, T2)}, где T — некоторый заданный элемент из Т2). Далее рассмотрим случай, когда M (t) является положительной действительной функцией времени на (Т1, Т2) и Ut = {и : \щ\^М (t), і = 1, 2, . . tn}. (4.218) Пример 4.8. Другим важным примером ограничения является Ut = {« ; II« (4.219) где М — заданное число и || и || обозначает эвклидову норму и (см. § 3.2). В этом случае часто говорят, что и (/) удовлетворяет ограничению: П(0ІІ^А1. (4.220) Последний тип ограничений рассматривается в гл. 10, где ограничивающим мно¬ жеством является гиперсфера радиуса М. в Rtn- Пусть /0 — заданный элемент из (7\, Т2) и xQ— заданный элемент из Rn. Для и из U зависимость х(т) = дб(т; х0) (4.221) является единственным решением системы, удовлетворяющим начальному условию х(/0) = -ѵ0, (4.222) а функция 7, преобразующая Rn X Т2) X U X Rn X (Ть Т2), определенная как t J (хп, t0, и, X, t) = К (х, /) + J L [лс(т), «(т), r]dr, (4.223) <0 является действительным числом. В выражении (4.223) /( и L — функции, введенные ранее [см. уравнения (4.210) и (4.211)]. Определение 4.8. Говорят, что управление и переводит xQ в S [более строго (х0, t0) в S], где S.— множество цели, если множество {$(*; х0), t:t^tQ] (4.224) встречает (т. е. пересекает) множество S. В этом случае говорят, что движение системы встречает, или пересекает, S. Если и переводит xQ в S и tf — первый момент времени после /0, когда движение х (t) = = ф {t; u{tQ, t], *ѵ0) вступает в S, то, обозначив: Xf^x(tf) = $(tf; и((0, x0), (4.225) 180
вместо J (л:,), ta, и, Xf, tf) [см. уравнение (4.223) ] пишут J (х0, tQ, и), т. е. J(x0, t0, a) — J (х$, t0, a, xh tf) = (4.226) = K(xf, tf)+ §L[x(x), «(T), x]dx — (4.227) to = K lift», t ]J x0), 4- (4.228) 4- J^[g6(T; «(?„, ri; x0), u(x), x]dx. J (x0, /0, и) называют значением функционала для управления и по отношению к множеству цели S; tf — конечным временем; Xf — конечным состоянием и К (Xf, tf) — конечной стоимостью. Если и —такой элемент из U, который не переводит х0 в S, принято полагать J(xQ, t0, и) = оо. (4.229) Функционал 1 J (х0, tQ, и), преобразующий Rn х (Т1, Т2) X U в R U {оо}2, называют функционалом преобразования системы. Так как начальные состояние лг0 и время /0 часто фиксированы, то обычно пишут J (и) вместо J (х0, /0, Частные случаи функционалов преобразования, представляющие практический интерес, рассматриваются в гл. 6. Мы можем теперь строго сформулировать задачу управления. Определение 4.9. Задачей оптимального управления системой (4.208) по отношению к множеству S, функционалу преобразования J (лг0, /0> #), множеству допустимых управлений U и начальному состоянию х0 в момент времени /0 является отыскание управления и из (/, минимизирующее функционал J (и). Другими словами, задачей оптимального управления является следующее. Заданы: динамическая система (4.208); начальное состояние х0; начальное время /0; множество S; область допустимых управлений U. Найти: управление и из U, переводящее х0 в S,3 т. е. (дб(^; x°)’ S и минимизирующее функционал J (и) = J (лг0, #)• Любое управление и*, дающее решение задачи оптимального упра¬ вления, называют оптимальным управлением. Отметим, что существование оптимального управления не является необходимым. Действительно, в U может вообще не оказаться управлений и, переводящих х0 в S. Этот случай более подробно разбирается в § 4.14. С другой стороны, может ока¬ заться несколько оптимальных управлений (см. гл. 6, 8 и 10). Так как отыскание максимума действительной функции эквивалентно отысканию минимума той же функции с обратным знаком, то достаточно рассмотреть только минимизацию функционалов. По этой причине в даль¬ нейшем мы будем иметь дело только с отысканием минимума. 4.13. СПЕЦИАЛЬНЫЕ СЛУЧАИ В этом параграфе мы рассмотрим некоторые специальные случаи за¬ дачи управления, а именно: задачу без ограничений, вопрос об огра¬ ничении состояний и различные специальные вопросы, возникающие из 1 J называют функционалом, потому что J зависит от множества функций U\ J есть функция от функций. (Сравните с § 3.16.) 2 Я U {°°} есть множество всех действительных чисел вместе с символом оо, превы¬ шающим любое действительное число. 3 Т. е. переводящее (х0, ^о) в *$• 181
конкретного вида множества цели, т. е. задачи о регуляторе и точке встречи (перехвате). При рассмотрении этих задач будем использовать терминологию и обозначения, приведенные в § 4.12. Несмотря на то, что входы физической системы неизбежно ограничены, часто оказывается интересным рассмотреть задачу оптимального управле¬ ния без ограничений, т. е. случай, когда ограничением Ut в момент вре¬ мени t (см. определение 4.7) является все пространство Rtn для любого t. Иначе говоря, мы часто будем полагать, что любая ограниченная кусочно¬ непрерывная функция из (Т!, Т2) в Rm является допустимым управлением. При этом говорят, что изучается свободная оптимальная задача или оптимальная задача без ограничений. Отметим, что свободная задача может не иметь решения, тогда как аналогичная задача с ограничениями имеет решение и наоборот. При определении задачи оптимального упра¬ вления мы рассмотрели влияние ограничений на величину управлений, предполагая, что вектор состояния системы может принимать любое значение в Rn. Иногда возникает задача управления, где ограничения накладываются и на фазовые координаты системы. Определение 4.10. Пусть X — замкнутое подпространство простран¬ ства состояний Rn и множество цели S содержится в X X (Т\, Т2), тогда оптимальная задача с ограниченным состоянием системы формулируется следующим образом. Дана динамическая система (4.208), начальное состояние х0 из X, начальное время /0, множество цели S и область допустимых управле¬ ний U. Найти управление и из (7, переводящее х0 в S вдоль траектории, целиком заключенной в X, и минимизирующее функционал преобразова¬ ния J (и) = J (х0, ^о, и) по отношению ко всем таким управлениям. Можно заметить, что к общей оптимальной задаче добавлены требо¬ вания: 1) чтобы начальное состояние принадлежало к X и 2) рассматри¬ ваются лишь те управления, которые дают траектории, целиком проходя¬ щие в X. Такие задачи в данной книге рассматриваться не будут, поэтому мы отсылаем заинтересованного читателя к другим литературным источ¬ никам [43], [54], [129]. Рассмотрим некоторые частные случаи множества S и соответству¬ ющие им варианты задачи управления. Напомним, что S представляет собой подмножество из Rn X (Т19 Т2) — элементами S являются пары (х, /), соответствующие состоянию х в момент времени t из Т2). Если множество S имеет вид s - US/ X {/}, (4.230) Л), где St — заданные (непустые) подмножества из Rn, то такую задачу назы¬ вают задачей с нефиксированным временем. Иначе говоря, мы пытаемся достичь множества, движущегося в пространстве состояний, причем достичь его мы имеем право в любой момент времени /, принадлежащий интервалу определения (Т1У Т2). В частном случае S= {(#(/), /):/е(Л, Л)Ь (4.231) где z (0 — заданная на (Tlf Т2) /г-мерная функция времени. Эту задачу называют задачей о точке встречи (или задачей преследо¬ вания). Напротив, если S имеет вид S = X {Т}, (4.232) где Т — заданный элемент из (7\, Т2), 182
то такую задачу называют задачей с фиксированным временем. В данном случае мы пытаемся достичь заданного множества в заданный момент времени Т. Если Т2 = оо, то часто вместо X [Т] рассматривают множество цели S X {/0 + 71}. Определение 4.11. Пусть Т — заданный элемент из (Тъ Т2) и S1 — заданное подмножество из Rn. Задача с фиксированным временем форму¬ лируется так: задана динамическая система (4.208), начальное состоя¬ ние лг0, начальное время /0, причем /0 < Г, множество цели Si X {Т} и множество допустимых управлений U; необходимо найти в U управле¬ ние и, которое переводит систему из лг0 в S, минимизируя функционал преобразования т J (u) = J (х0, t0, u) = К [х(Т), 71] 4 J L [х(т), и(т), x]dx. Предположим теперь, что множество S имеет вид {**} Х(Л, 7\), (4.233) где х* — единственная точка, обычно начало координат в Rn. Такую задачу называют задачей с фиксированной конечной точкой и нефикси¬ рованным временем. В общем случае, если множество всех х из Rn в об¬ ласти цели S состоит из единственной точки, то о задаче управления говорят как о задаче с фиксированным концом. Если точка х* является точкой равновесия системы \ то такую задачу называют задачей о регуля¬ торе. В дальнейшем будут возникать другие варианты задач управления, но после приведенного обсуждения их интерпретация не должна вызывать у читателя затруднений. 4.14. МНОЖЕСТВО ДОСТИЖИМЫХ СОСТОЯНИЙ 2 В теории управления важную роль играют некоторые качественные свойства систем. В частности, очень важны понятия достижимости, управ¬ ляемости и наблюдаемости. В этом параграфе рассматривается понятие достижимости и сопутствующее ему понятие множества достижимых состояний. В следующем параграфе мы дадим определения понятий управ¬ ляемости и наблюдаемости. Термин «достижимость» означает, что мы можем найти такое управле¬ ние, которое переводит систему из заданного состояния xQ в другое состоя¬ ние хг. Сформулируем это понятие более строго. Предположим, что рас¬ сматривается система с переходной функцией $(/; Щі0, п>‘ хо) и областью допустимых управлений (/, удовлетворяющей ограничениям Q (см. опре¬ деление 4.7), т. е. U в том случае, когда и — кусочно-непрерывная функция и (4.234) для любого t из интервала определения системы. Здесь Ut — заданные подмножества из Определение 4.12. Состояние х± называют достижимым, или доступ¬ ным из исходного состояния Хо при tQ по отношению к U, если существует элемент и± из U, такой, что дб(6; м; хо) = хі (4.235) 1 Это означает, что f (х*, 0, /) = 0 для любого t из (7\, Т2), где f— функция, фигу¬ рирующая в уравнении (4.208). 2 См. [87]—[89], [142], [145], [146], [150], [152], [169] и [189]. 183
для конечного /0. Если А (I; х0, /о, U) обозначает подмножество из Rn, которое состоит из всех состояний хъ достижимых из х0 при tQ по отношению к U в момент времени /, Л (/; Xq, tQ, U) = {х±: существует u^U такое, что $(/; tti (t0) d; лг0) = Xi}, (4.236) то A (t; x0; t0; U) называют областью достижимых состояний в момент времени t (из лг0 при t0 по отношению к £7), a J A (t; х0; t0; U) — t > t0 множеством достижимых состояний (из xQ при tQ по отношению к (7). Предположим, что наша система линейна и описывается уравнениями x(t) = A(f)x(f) + y(t) - C(t)x(t) + D(t)u(t). (4.237) (4.238) Пусть Ф (/, /0) — фундаментальная матрица уравнения (4.237) (см. § 3.20). Тогда переходную функцию системы ф можно записать в виде $(/; u{to. /]; х0)^Ф(/, /о) Хо + J Ф(/о, т) Д(т)«(т)гітк (4.239) I J Исследование выражения (4.239) приводит нас к следующей теореме. Теорема 4.1. Если область допустимых управлений U для си¬ стемы (4.237) и (4.238) выпукла (см. § 3.8), то для любых xQ и /0 множество достижимых состояний A (t; xOl U) также выпукло. В частности, если U состоит из всех кусочно-непрерывных функций, удовлетворяющих ограничению «(т)£і7х, (4.240) где все (7Х выпуклы, то и Л (t; лг0, /о, ^0 выпукло. Доказательство. Предположим, что область U выпукла, что xQ — произвольный элемент из Rn и tQ — произвольный момент времени. Мы хотим показать, что если х± и х2 — элементы из Л (/; лг0; tQ; U) и г, s — действительные числа, такие, что г + s = 1, г, s 0, то гхг + + sx2 целиком принадлежит Л (/; лг0; tQ; U). Существуют управления и и2 из (7, такие, что {t х0 н- J Ф(/о, x)B(x)u^(x)dx Іо {t х0 г [Ф(А>, x)B(x)u2(x)dx і. Следовательно, (4.241) (4.242) {/ ) Xq-{- ]*Ф(/о, т)в(т)[га1(т) 4- su2 (т)]я!тк (4.243) to J Так как область U выпуклая, то rux + su2 принадлежит к £7, и мы доказали, что гхг 4- sx2 принадлежит к Л (/; лг0; U). Читатель может самостоятельно проверить справедливость этой теоремы в частных слу¬ чаях. Следствие 4.1. Если U состоит из управлений, удовлетворяющих ограничению Z - 1, 2, . . .,m, (4.244) то множество Л (/; лг0; tQ; U) выпукло. 184
систему Пример 4.9. Если даже все А (t\ xQ; tQ\ U) выпуклы, из этого не следует, что и (J A (t\ х0; /0; U) является выпуклым. Покажем это на простом примере. Рассмотрим t^t0 Х'і (0 = 0 1" Х1 (0 + '«1 (О' (4.245) . ^2 (0. 1 0_ -xï (і). .«2 (0. всего из одной функции, тождественно равной нулю: Предположим, что U состоит иі (0 “ и2 (0 = О для любого t. Пусть /0 ~ 0 и х0 ~ X (0) — . Множество A (t; х0; 0; U) состоит из единствен¬ ной точки I S*n I и, следовательно, выпукло. Однако J А (/; х0; 0; U) есть множество L cos t J И —Ч’ которое, очевидно, выпуклым не является. Следствие 4.2. Если х0 = 0, область U — выпуклая и содержит функцию а (/) для любого t, то множество достижимых состояний выпукло. В частности, если U выпуклая и содержит u (t) = 0, а система является линейной с постоянными параметрами, то множество состояний, дости¬ жимых из xQ = 0 по отношению к U \ является выпуклым. Теорема 4.2. Предположим, что U состоит из всех кусочно-непре¬ рывных функций, удовлетворяющих ограничению (4.246) где все множества Ux содержатся в сфере S (0, М) в Rtn. Тогда для любого /> t0 множество A (t; х[}; tQ; U) ограничено (см. § 3.6). Доказательство. Предположим, что хг принадлежит к А (/; х0; U); тогда существует а из U такое, что = Ф(/, /0) х0+ J Ф(/о, т)Я(т)#(т)гітк (4.247) Так как все элементы матриц Ф и В являются непрерывными функ¬ циями на По, И, то можно заключить, что существуют числа L, N, при которых II Ф(/, (4.248)1 2 ||Ф(/0, г)В(т)о|| < 2ѴМ (4-249) для любого т из По, t] и для любого ѵ из Rn. Из теоремы 3.8 имеем ІІХіІІ < L [||х0|| + (^~/о)maxII«(т)||] < (4.250) тСОо, И <L{||x0|| + (/-/0)W} (4.251) и, следовательно, А х0; /0; U) cz 5(0, L{||xo|| + (/-/o)^A/}). (4.252)3 Таким образом, мы доказали, что множество А (і; х0; /0; U) заключено в сфере 5 из Rn и, следовательно, ограничено. Следствие 4.3. Если U состоит из управлений, удовлетворяющих ограничению |uz(t)| < Mh 1=1,2, .. .,т, (4.253) то А (/; х0; /0,’ ограничено. 1 Рассматриваются лишь управления, принадлежащие к U. 2 Напомним, что || || обозначает эвклидову норму (см. § 3.6). 3 См. уравнение (3.5). 185
Упражнение 4.10. Рассмотрите систему (4.245) для (/) = 0 и |м2(/)|^1 при любом t. Пусть t0 — 0 и начальное состояние хг (0) = х2 (0) — 0. Покажите, что множе¬ ством достижимых состояний А для t = л является А = {(хі> x2):xî + x2^4)- Упражнение 4.11. Рассмотрите систему xr (t) = х2 (/); х2 (t) = и (/); 0-с и (/) 1 для любого t. Пусть /0 = 0; (0) = х2 (0) = 0. Найдите множество достижимых состоя¬ ний при t = 1. В заключение приведем теорему, которая очень часто используется при доказательстве существования оптимального управления. Её доказа¬ тельство можно найти в работе [142]. Теорема 4.3. Предположим, что для системы (4.237) с постоянными A (t) и В (/) область U состоит из измеримых 1 функций, удовлетворяющих ограничению: »(тЖ (4.254) где множества Ux : 1) выпуклы; 2) содержатся в некоторой сфере S (0, М) в Rm и 3) замкнуты в Rm (см. § 3.4). Тогда для любого t > t0 множество Л (/; х0, tQ; U) замкнуто. 4.15. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ. ОПРЕДЕЛЕНИЯ В этом параграфе мы определим понятия управляемости и наблюдае¬ мости. Грубо говоря, термин «управляемость» означает, что в течение конечного отрезка времени t возможно перевести систему из любого состояния в начало координат. Термин же «наблюдаемость» означает, что начальное состояние системы можно определить путем соответствующих измерений ее выхода. Несколько ниже мы дадим строгие определения этих понятий, а в последующих двух параграфах рассмотрим их для слу¬ чая линейной системы с постоянными параметрами, позволяющего полу¬ чить критерии управляемости и наблюдаемости в развернутой форме. В заключение мы рассмотрим некоторые практические примеры этих понятий 2. Предположим, что задана динамическая система x(t)=f[x(ty u(t)\ /]; (4.255) У(О = u(t); /] (4.256) с переходной функцией ф(Т-, Хо) и с областью допустимых управле- ний U, состоящей из всех ограниченных кусочно-непрерывных функций, преобразующих интервал определения в Rm. Никаких специальных огра¬ ничений на и не накладывается. Определение 4.13. Управляемость. Если состояние х± = 0 дости¬ жимо из Xq при /0 (см. определение 4.12), то говорят, что состояние х0 управляемо в момент времени /0. Иначе говоря, х0 управляемо при /0, если существует кусочно-непрерывная функция uQ такая, что fl6(T; Хо)=О (4.257) для некоторого конечного T tQ. Если каждое состояние х0 управляемо при /0, то система управляема при tQ. Наконец, если каждое состояние х0 управляемо в каждый момент времени /0 на интервале определения си¬ стемы, то система полностью управляема (или просто «управляема»). Определение 4.14. Наблюдаемость. Говорят, что состояние х0 на¬ блюдаемо для t = tQ, если для заданного управления и существует время 1 Кусочная непрерывность здесь недостаточна, и поэтому требуется наличие изме¬ ряемое™ (см. [192], где дается определение этого понятия). 2 Более детальный анализ этих понятий читатель найдет в [35], [61], [82], [106], [109], [111], [113], [130], [210] и [212]. 186
/j 2»/ог такое, что знания «((„м и выхода2 у{,0.м = g (х0; а((о>(11) достаточно для определения х0. Если каждое состояние х0 наблюдаемо при /0, то говорят, что система наблюдаема при /0. Наконец, если каждое состояние х0 наблюдаемо в любой момент времени /0 в интервале определе¬ ния системы, то система полностью наблюдаема (или просто «наблю¬ даема»). Ниже мы покажем, что понятия управляемости и наблюдаемости являются внутренними свойствами системы, т. е. они сохраняются при всех эквивалентных преобразованиях системы (см. определение 4.5). Теорема 4.4. Пусть Р — невырожденная п X п матрица и z (t) = = P1 2 X (0- Система /]; (4.258) y(t) = /] (4.259) управляема (или наблюдаема), когда эквивалентная система г(/) = Р"1/[Рг(/), #(/), /]; (4.260) y(t) = g{Pz(t\ u(t), t] = h[z(ty u(tyt] (4.261) управляема (или наблюдаема). Доказательство. Предположим сначала, что система (4.258), (4.259) управляема, /0 — заданное время и z0 — заданный элемент из Rn. Тогда в Rn существует элемент х0 такой, что zQ = Р-1х0, а для некоторого T t0 — элемент а0 из U, для которого ф(Т\ Хо) = О, (4.262) где ф — переходная функция системы (4.258), (4.259). Если z(t) = р~гф(і; u°tt, Хо), (4.263) то непосредственно видно, что z (/0) = и £ (Т) = Р~г0 = 0. Так как справедливо и обратное положение, то часть теоремы, относящаяся к упра¬ вляемости системы, доказана. Для доказательства другой части теоремы, относящейся к наблюдае¬ мости системы, предположим, что система (4.258), (4.259) наблюдаема. Пусть tQ — заданный момент времени, z^ — заданный элемент из Rn, и — любой элемент U и х0 — PzQ. Существует время T t0 такое, что й(<о,П и y(to, г] = g (х0; U(t0, г]) достаточны для определения х0. Так как g[Pz(ty u(f), t] - g[x(t), u(t), /],^то = g (PzQ; #(f0,ri) = = h(z0; U(t0,T]) и» следовательно, знания h(z0; и достаточно для определения z0. Так как справедливо и обратное положение, то эта часть теоремы также доказана. 4.16. УПРАВЛЯЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную систему с постоянными параметрами вида х(0 = Ax(t) + Bu(f); (4.264) y(t) = Cx(t) + Du(t), (4.265) где Л, В, С и D — соответственно матрицы пХ п, nXm, р X п и р X пг и попытаемся обнаружить внутреннее содержание понятия управляемости для этого случая. 1 t-! может зависеть от и. 2 См. § 4.5. 187
Для начала предположим, что — управляемое состояние при /0. Существует Т О (Т = — /0) такое, что для некоторого и имеем 'о-И xQ = — J е~А ^-^Ви (т) dx, (4.266) где eAt — экспонента от At (см. § 3.21). Из выражения (4.266) и уравнения /о-Н т J е~А «-^Ви (т) dx = J е~А°Ви (a) do (4.267) видно, что х0 управляемо при 0. Иначе говоря, при исследовании, яв¬ ляется ли состояние х0 линейной системы с постоянными параметрами управляемым, мы можем принимать 0 за начальный момент времени. Далее, следует говорить об управляемом состоянии вообще, так как мы показали, что начальный момент времени можно выбирать произвольно. Мы показали, что для управляемости х0 при t необходимо и достаточно, чтобы Хо было управляемо при t = 0. Другим важным следствием выражения (4.266) является то обстоя¬ тельство, что множество состояний х0, являющихся управляемыми, есть подпространство из R^. Теорема 4.5 дает описание подпространства управляемых состояний в терминах матрицы системы А и матрицы В. Ясно, что если и — управляемые состояния, то существует траекто¬ рия, соединяющая х0 с хг. В частности, можно двигаться от 0 к любому управляемому состоянию. Упражнение 4.12. Покажите, что область состояний, управляемых при t = 0, является подпространством из Rn. Обозначим через р = 1,2,. . ., п — n-мерный вектор, являющийся р-м столбцом матрицы В: ^13 йр = (4.268) _Az3_, и пусть еар — /г-мерный вектор, определенный как еар = Ла&6; а = 0, 1, . . ., п — 1 ; р = 1, 2, . . ., т, (4.269) где Л° = I и Ла = А А • -А (а раз) для а > 0. Теорема 4.5. Линейная система с постоянными параметрами (4.264), (4.265) полностью управляема тогда и только тогда, когда векторы еа^ отображают все пространство Rn, т. е. только в том случае, когда любой элемент из Rn есть линейная комбинация векторов еа$ (см. § 2.5). Доказательство. Докажем эту теорему, дополнительно предположив, что матрица системы А не имеет комплексных собственных значений (пол¬ ное доказательство можно найти в [61 ]). Прежде всего предположим, что | — управляемое (при t = 0) состоя¬ ние системы. Существуют 0 и управление а* такие, что т — e~As Ви* (s)ds. (4.270)1 2 о 1 Напомним, что подмножество W векторного пространства V является его подпро¬ странством, если: 1) w2 € то Wi + w2 £ № и 2) если г g R и w С W, то rw g W (см. § 2.5). 2 Переменная s обозначает время, а не комплексную переменную. 188
Так как (см. § 3.21) со р = 0 и каждая п X п матрица удовлетворяет своему характеристическому уравнению (см. § 2.10, теорема 2.3), то п—1 e~As = S 4а(з)Ла, а=0 (4.271) где фа (s) — скалярные функции от s. Следовательно, /1—1 т — 1= 2 J 4>a(s)AaSu*(s)ds а=0 0 поскольку п—1 пг Г Т J%(sM(s)ds а=0£ = 1 Lo m U* (s) = S Up(s)e6> 3=1 где — элементы натурального базиса в Rn. Последнее (4.272) (4.273) (4.274) доказывает достаточность. С другой стороны, предположим, что | — элемент пространства Rn. Покажем, что существуют Т > 0 и управление я* такие, что т — e~As Bu* (s)ds. о (4.275) Допустим, что для момента времени Т >> 0 существует действитель¬ ная функция ср (s), удовлетворяющая условиям 1) ф<а> (0) = (Т) = 0 для а = 0, 1, . . ., п — 2, где ф(а) (s) обо¬ значает производную от ф (s) по s порядка а и ф(0) (s) = ф (s); 2) ф (s) > 0 на (0, Т); 3) матрица Q, определенная как Q = J ф ($)е~Л5 ds, (4.276) о — невырожденная. Так как каждый элемент из Rn есть линейная комбинация еа8, то можно записать - Q-’l = S аа^еа6, (4.277) а, 3 где яа3 — действительные числа. Управление и* (s) с компонентами (s), определяемыми соотноше- НИЯМИ /1—1 «P*(S)= S аа₽ф(а)(з), (4.278) a=0 переводит g в начало координат за время T. Далее, Т п—1 m Г Г j e-^Bu^^ds = 2 ^аз J T(a)(s)e~4sds (4.279) о а=0 3=1 Lû J 189
Поэтому достаточно показать, что J Ф(а> (5)е-Л5 ds = QAa. о С помощью выражения (4.275) получим т — QQ-^l = — £ = j e~AsBu* (s) ds. О (4.280) (4.281) Выражение (4.280) легко доказать методом индукции по числу а, используя формулу (4.276) и интегрируя по частям на основе соотноше¬ ния (3.278). Теперь остается показать, что соответствующая функция ф (s) суще¬ ствует. Такой функцией является <p(s)= s2n(T — s)2n, (4.282) и она, очевидно, обладает свойствами 1 и 2. Покажем, что матрица т Q = §<f(s)e~Asds (4.283) о — невырожденная. Пусть J — жорданова каноническая форма А (см. § 2.10). Существует невырожденная матрица Р такая, что Р~гАР = J и ед (т-s) == p-\eJ a-s)p^ > (4.284) гр Д Т Так как матрица е невырожденная, то достаточно доказать, что матрица т PeATQP~x = J ф (s)/(r-s> ds (4.285) о невырожденная. Но eJ (T~S} — треугольная матрица с элементами eKi(T~s} вдоль диагонали, где — собственные значения (необязательно раз¬ личные) матрицы А (см. § 3.22). Следовательно, т п г т det J q(s)eJ ds = П J ^{s)eKiSds о i==i L о (4.286) и поэтому правая часть выражения (4.285) есть невырожденная матрица, так как т J Ф (s)eÀ‘s ds> 0 (4.287) о для любого і (см. теорему 3.8). Итак, теорема доказана. Ее важными следствиями являются: Следствие 4.4. Подпространство управляемых состояний системы (4.264), (4.265) то же самое, что и отображение векторов еа^ (4.269). Иначе говоря, х0 управляемо в том и только в том случае, когда лг0 — линейная комбинация векторов еар. Следствие 4.5. Пусть G — матрица п X пт, определенная соотно¬ шением О = [я ; АВ ; А2В ; . . . ; Д'-’л] (4.288) или эквивалентным соотношением б? [*01, #02» • > ^От { £ц> ^12> • • • > *іт! • • ■ еп_12, , еп_1т], (4.289) 190
где вектора eaft определяется соотношением (4.269). Система полностью управляема тогда, когда ранг G равен п, т. е. ранг G = п, (4.290) или, иначе говоря, в том случае, когда в G имеется п линейно независимых векторов-столбцов. Следствие 4.6. Если В есть п X 1 матрица Ь, т. е. если управления являются скалярными величинами, то система полностью управляема в том и только в том случае, когда п X п матрица . ;An-1&] (4.291) невырождена, или, полагая в том и только в том случае, когда b\ 1 7 e—. >1 /=1 /=1 det G = det Ь2 /=i n ■ /=1 ¥=0, (4.292) bn /=1 /=1 где — элементы матрицы Ak. Следствие 4.7. Если матрица системы А—диагональная матрица с различными элементами, то система полностью управляема, если матрица В не имеет нулевых строк. Последние два следствия дают простые правила для определения, является ли система полностью управляемой. Пример 4.10. Рассмотрим систему _*2_ (4.293) Управляема ли она? В есть вектор-столбец b = и АЪ — вектор j^. Следова¬ тельно, система управляема. Пример 4.11. Рассмотрим систему *1 ’1 Г + ’ 1 ’ _X2 _ _X2 _ _ 0 _ и. (4.294) Управляема ли она? В есть вектор-столбец b = [q] и Ab — вектор Следова¬ тельно, b и Ab не отображают /?2, и система не является управляемой. Пример 4.12. Рассмотрим систему — "о Г xl + 1 Г «1 (4.295) _x2 _ _1 2 _X2 _ 0 2_ _«2 _ 191
Управляема ли она? В — 2X2 матрица Л—2X2 матрица J,] и АВ — 2 X 2 матрица £ Итак, G — [В > ДВ] есть 2X4 матрица: Г—1 1 о 21 G = [ 0 2 -1 5J Ранг G равен 2, следовательно, система управляема. Векторы gj и линейно независимы. Любые два вектора-столбца матрицы G в данном случае линейно независимы. Упражнение 4.13. Покажите, что невозможно найти решения уравнения (4.294), начинающегося в точке и оканчивающегося в точке Упражнение 4.14. Какие из приведенных систем полностью управляемы? Упражнение 4.15. Какиім условиям должны удовлетворять Ьъ Ь2 и Ь3, чтобы обес¬ печивалась полная управляемость системы *1 A, 1 0 *1 *2 — 0 A 1 x2 + Ьг -А'з _ .0 0 _*3_ Упражнение 4.16. Рассмотрите нелинейную систему хх = а^'Л'з + х2 = а2ххх3 + w2; х3 = а3ХіХ2 + и3, где ах + а2 + а3 = 0. Можно ли показать, что эта система управляема? 4.17. НАБЛЮДАЕМОСТЬ ЛИНЕЙНЫХ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ Рассмотрим линейную систему с постоянными параметрами вида x(t) = Ах (/) + Bu(t)\ (4.296) у(0 = Сх(0 + Du (t'y (4.297) где Л, В, С и D — соответственно п X п, п X т, р X п и р X т матрицы. Определим, какой смысл заключен в понятии «наблюдаемость системы». Предположим, что х0 наблюдаемо при /0- Тогда состояние лг0 является наблюдаемым и при t = 0. Для того чтобы показать это, будем считать и заданным элементом из U и примем, что я(/) = я(/—/0), (4.298) где <о есть элемент U. В силу наблюдаемости х0 при t0 можно заключить, “то существует 7^0, такое, что v{tot to+T] и y(tût /û+rj = g (xQ; ѵщ> t^T]) определяют лг0. Из соотношения = х0) = = еА (t~to> I x0 + J e~A (T) dx (4.299) I J 192
для Z из [Zo, t0 + 74 следует, что y(t) = СеА ! х0 + J е-А fT-'»>£ü(r) с/т ! + Dv(t) (4.300) I /о J для t из Uo, t{} + Т]. Если произвести замену переменных s = t— Zo; о т — /0, то уравнение (4.300) с помощью соотношения (4.298) запи¬ шется в виде у (s) = СеАѣ j xQ + J e~A°Bu(o)do ? + Du(s) (4.301) l о J для s из [0, 74. Следовательно, a(0, г] и y(o, т] = g (x0; Д(о, rj) опреде¬ ляют x0. Итак, для линейной системы с постоянными параметрами достаточно рассматривать наблюдаемость при t = 0. Иначе говоря, линейная система с постоянными параметрами наблюдаема в том и только в том случае, когда она наблюдаема при t = 0. Если Хо наблюдаемо при t = 0, то знания У(0, т] = g (лго,* 0) для неко¬ торого T Г> 0 достаточно для определения х0. Справедливо и обратное положение. Если мы знаем свободное движение системы, начиная с х0 (см. 3.19), то этого достаточно для определения х0, и х0 наблюдаемо. Для доказательства этого утверждения заметим, что если а есть элемент из Ut то у(О = Сдб(/; а(0,п; xQ) + Da(t) = (4.302) {г ) a;0+р-ЛтВи(т)гіт +£>«(/)= (4.303) 0 J t = y°(t) + C ^e~AxBu(x)dx + Dn(t). (4.304) Ü Из выражения (4.304) следует, что если у°0, т] определяет Хо, то вели¬ чины U(o, т] и у(0, г] определяют х0- Предположим теперь, что х0 и хг— два наблюдаемых состояния при t = 0, причем Хо¥=^і- Если через у° (0 и у? (/) обозначить выходы системы, начиная с х0 и хг соответственно, производимые управлением и (т) = 0 (т — любое), то мы знаем, что yQQ(t) = CeAtxQ-, (4.305) y?(Z) = Сел*Хі. (4.306) Существует (например, Т), для которого yg(7)^y?(T). (4.307) Если бы уо (0 = yî (0 для любого t > 0, то знание уо на любом интервале (0, t] не позволило бы определить состояние х0, которое в этом случае ненаблюдаемо. Следовательно, если любое состояние наблюдаемо (для t = 0), то преобразование, связывающее каждое из состояний х с соответствующей (свободной) выходной функцией у (t) = CeAtx, будет взаимооднозначным (см. § 2.4). Выше указывалось, что множество управляемых состояний является подпространством из Rn. Справедливо ли это для множества наблюдаемых состояний? Очевидно, что если х0 наблюдаемо, то и гх0, где г Ç R, также наблюдаемо. Предположим, х0 и хх наблюдаемы. Тогда состояние х0 + х1 7 Лтанс и др. 193
также наблюдаемо. Прежде чем доказать справедливость этого утвержде¬ ния, рассмотрим более внимательно, что означает наблюдаемость для линейных систем с постоянными параметрами. В частности справедлива следующая теорема. Теорема 4.6. Обозначим через і = 1, 2, . . ., р /г-мерный вектор- столбец, компонентами которого являются элементы і-й строки матрицы С, например где С = (cit). (4.308) Пусть wki, k = 0, 1, . . ., п — 1, і = 1, 2, . . ., р есть n-мерный век¬ тор, заданный как wki=ÀkCi, (4.309) где А к — транспонированная [см. уравнение (2.45) ] матрица Ак. Пусть X — наблюдаемое состояние и rki — действительное число, определенное как ГЫ = <Wki> ху, (4.310) т. е., если wkij — j-я компонента wki и — j-я компонента х, то п (4.311) /=і Пусть Х\, Х2, . . Хп —п неизвестных. Рассмотрим систему урав¬ нений п Гм = k = 0- 1 И— 1; І = 1, . . . , р. (4.312) /=і Тогда х является единственным решением системы (4.312). С другой стороны, если уравнение (4.312) имеет единственное решение X/ = yh / = 1, 2, . . ., п, то вектор у с компонентами у} является наблюдаемым состоянием системы. Доказательство. Так как состояние х наблюдаемо, то существует Т 0 такое, что у (/) = CeAtx на [0, Т\ однозначно определяет х. Тогда і-я компонента yt (/) вектора у (/) выражается как п-1 = S ^t)(Àkc\, X) = (4.313) /г=0 п-1 = S х) = (4.314) fe=0 п—1 = 2^(0^, (4-315) /г=0 П— 1 оо где eAt = так как eAt = J] (см. § 3.21) и любая п X п матрица является корнем своего характеристического уравнения [по теореме (2.3)]. По определению л: есть решение уравнения (4.312). Если существует другое решение х', то из выражения (4.315) следует, что y(t) = CeAtx' (4.316) 194
на [О, Т] и, следовательно, у(0, г] не позволяет однозначно определить х. Итак, X есть единственное решение уравнения (4.312). Мы предлагаем читателю доказать справедливость обратного утвер¬ ждения теоремы. Следствие 4.8. Если лг0 и наблюдаемы, то х0 + х± также наблю¬ даемо. Упражнение 4.17. Докажите следствие 4.8. Указание: Пусть х0) = X1)=rkll, тогда {Wkt, xQ Д- Xi) = rkio + rki\- Решениями какого уравнения являются компоненты вектора х0 + Х^ Почему они являются единственным решением этого уравнения? Ответ на последний вопрос может быть получен с помощью доказатель¬ ства от противного. Следствие 4.9. Если х наблюдаемо, то CeAtx однозначно определяет X на любом интервале [О, T], Т > 0. Следствие 4.10. Система полностью наблюдаема в том и только в том случае, если каждый вектор х есть линейная комбинация векторов wki (см. § 2.5). Следствие 4.11. Подпространство наблюдаемых состояний есть отоб¬ ражение векторов wki. Иначе говоря, х наблюдаемо тогда, когда лг0 есть линейная комбинация wki. Следствие 4.12. Пусть Н — п X пт матрица, определенная соотно¬ шением Н =[с\АС'\ . . . >(Л')П-1С]. (4.317) Система полностью наблюдаема в том и только в том случае, когда ранг матрицы Н равен п, или, что эквивалентно, если в матрице И имеется п линейно независимых столбцов. В частности, если С есть матрица раз¬ мера 1 X п (вектор-строка г, выходом является скалярная функция), то система полностью наблюдаема в том случае, когда п X п матрица Н=\с\Ас\. . . ;(4')"~V] (4.318) невырожденная (см. следствия 4.5 и 4.6). Следствие 4.13. Если матрица системы А —диагональная с различ¬ ными элементами, то система полностью наблюдаема, когда матрица С не имеет нулевых столбцов (см. следствие 4.7). Два последних следствия дают простые правила проверки наблюдае¬ мости систем. Пример 4.13. Рассмотрим систему RJ Го ЯpJ_L.ro 1. иг] |_б 9J |_-^2 J L 1 J , (4 * = 110][2]=хг Наблюдаема ли она? Так как с' = |gj и А'с' — j^j, то система наблюдаема. Пример 4.14. Наблюдаема ли система (4.320) и (4.321) Имеем с' = |д| и А'с' = Следовательно, система ненаблюдаема. Если рассмотреть единичную массу, движущуюся без трения, обозначив через (/) — положение точки, а через х2 (0 и и (t) — соответственно ее скорость и приложенную силу, то и х2 будут соответствовать уравнению (4.320). Выход у, представляющий собой ско¬ рость точки, может возникнуть в случае наблюдения системы с помощью радара, исполь- * 195
зующего эффект Допплера, который измеряет величину относительной скорости. По ско¬ рости можно определить положение, но лишь с точностью до неизвестной постоянной. Этот случай представляет собой один из примеров ненаблюдаемости системы. Упражнение 4.18. Рассмотрите систему хі (0 — #ііхі (0 + аі2х2 (О ~Ь biu (Oî х2 (/) a2lxr (0 + а22х2 (t) + b2u (/); У(*) = СіХі (/) + с2х2 (t). Требуется получить условия, при которых система ненаблюдаема и неуправляема. Может ли рассматриваемая система быть одновременно ненаблюдаемой и неуправляемой? Проиллюстрировать результат, подобрав нетривиальные числовые значения. Дать схему модели на АВМ. Объяснить с ее помощью неуправляемость, ненаблюдаемость или то и другое одновременно. Упражнение 4.19. Рассмотрите систему Xt — axt 4- Û)X2 г bvw, х2 — — œxj 4- ах2 4~ b2u\ У = xi при œ 4= 0. Покажите, что система управляема, за исключением случая, когда bt = b2~ 0, и что система наблюдаема. ФИЗИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ПОНЯТИЯ НОРМАЛЬНОСТИ 4.18. РЕГУЛИРОВАНИЕ ВЫХОДА До сих пор мы уделяли мало внимания физическому смыслу поня¬ тий управляемости и наблюдаемости. Постараемся исправить такое положение, рассмотрев в этом и двух последующих параграфах некоторые практические стороны приведенных выше понятий. В данном параграфе разберем задачу о регулировании выхода. Рассмотрим линейную динамическую систему с постоянными пара¬ метрами: x(t) = Ax(t)+Bu(ty, (4.322) y(t) = Cx(t) + Du(t). (4.323) В инженерной практике часто представляет интерес перевести выход системы у (/) в 0 и удерживать его в этом состоянии при отсутствии даль¬ нейших возмущений. Регулируя выход, мы желаем найти: 1) управление, переводящее выход системы у (?) в 0; 2) управление, удерживающее выход в этом состоянии после переход¬ ного процесса. Примем tQ — 0 и предположим, что мы нашли управление такое, что у(Т) = 0. (4.324) Будем считать нашу систему наблюдаемой, т. е. мы можем вычислить начальное состояние xQ при t = 0. Так как уравнение (4.322) — линейное с постоянными коэффициентами, то выражения (4.324) и (4.323) дают соотношение {г eAtx0 + eAt J e~AxBu(T)dr [ + Du(T) = 0. (4.325) o J Предположим теперь, что система еще и управляема. Это означает, что мы можем найти такое управление а(0, rj, при котором х (Т) = 0. Если X (t) = 0 и и (t) = 0 для t > Т, (4.326) то у (/) = 0 для любого t^T. (4.327) 196
Следовательно, если система полностью управляема и полностью наблюдаема, то можно регулировать ее выход. Отметим, что управляемость и наблюдаемость дают достаточные условия регулирования выхода, не являясь, конечно, необходимыми. Обнаружить это можно, регулируя выход и определяя такое управление и (0 для t >> Т, когда решение уравнения х (f) = Ах (t) + Ви (0, обозначенное через х (0 для t Т, удовлетворяет уравнению (4.328) Обозначим через Н множество х (Т), для которых можно найти управление и (0. Если система управляема, то можно 1 перевести систему из лг0 в Н. Если система неуправляема, то и в этом случае можно найти управление, переводящее х0 в Н. Пример 4.15. Для иллюстрации рассмотрим простую систему второго порядка *1 (t) х2 (О О 1 хх (О О — 1 J L х2 (Z) У (0 = (О U (0; (4.329) (4.330) Легко видеть, что система наблюдаема, но не управляема. Пусть и ^2 обозначают начальные значения фазовых координат хх (t) и х2 (/). Простое интегрирование уравне¬ ния (4.329) позволяет получить х2 (0 = £ге ‘ ; t (/) = - |2е~' + g, + У и (т) dx. (4.331) Так как система наблюдаема, то |х и £2 можно вычислить, зная выход у (t). Пусть Т — заданное время и требуется найти такое управление, чтобы у (Т) ~ 0. Так как у (/) = хх (/), то нужно получить хх (Т) — 0. Если для любого t Т хт (/) ~ 0, то у (t) — 0 также для любого t^T. Эти рассуждения определяют множество Н в пло¬ скости состояний ххх2. Очевидно, таким множеством является вся ось х2. Пусть и (t) — k является постоянной величиной, тогда при t = Т из уравнения (4.331) получим о =ХХ(7) =|1-а2е-г + ^ + kT. (4.332) Это означает, что постоянное управление и (0 = k = h , 0 < t < T (4.333) переводит выход в нуль при t — Т. Далее задача состоит в том, чтобы удерживать выход в этом состоянии, т. е. удерживать состояние на оси х2. Для Т управление u(t)=- х2 (t} = - . t > Т (4.334) дает [см. (4.329)] хг (/) = 0 для /> Т, и, следовательно, хх (/) — у (t) — 0 для t^> Т. Итак, мы можем регулировать выход, хотя система и не является управляемой. Аналогич¬ ный случай будет рассмотрен в § 4.20, но там мы потребуем, чтобы управление было огра¬ ниченным. Рассмотрим систему (4.329) с выходом z/(/) = х2 (0- (4.335) Система (4.329), (4.335) неуправляема и ненаблюдаема. Нетрудно убедиться, что в этом случае регулировать выход нельзя. Разберем другие примеры, интерпретирующие понятия управляемо¬ сти и наблюдаемости. При этом отметим, что часто ненаблюдаемость или 1 В этом случае управляемость означает, что любое состояние достижимо из любого другого состояния. 197
неуправляемость системы означают, что имеется больше фазовых коор¬ динат, чем это необходимо. Для иллюстрации рассмотрим физическую систему, показанную на рис. 4.12. Постоянные kly k2, k3 и k4 — коэффи¬ циенты усиления; хг (/), х2 (/), х3 (О и (О — выходы четырех интегра¬ торов. Выход у (/) —сумма переменных xz, і = 1, 2, 3, 4. Нетрудно показать, что вектор ГХ1 (/) х(/)- (4.336) Lx4(/)J можно рассматривать как вектор состояния, и описать физическую си¬ стему, приведенную на рис. 4.12, уравнениями x(t) = 0х(/) -1- ^2 ^3 - &4 - (4.337) y(t) = [l 1 1 1] x(t). (4.338) Читателю легко убедиться, что ниями (4.337) и (4.338), неуправляема система, описываемая уравне- и ненаблюдаема. В то же время Рис. 4.12. Аналоговая модель физической системы нетрудно доказать, что вы¬ ход удовлетворяет дифферен¬ циальному уравнению y(t) = ku(t) (4.339) где k = ki k2-\- k^. (4.340) Если k 0, то нетрудно заметить, что система z(/) = te(Z); (4.341) r/(/) = z(Z) (4.342) и управляема, и наблюдаема. Следовательно, выход ее можно регулиро¬ вать и рассматривать z (t) = у (t) как состояние системы. Очевидно, что с точки зрения связи входа с выходом системы (4.337), (4.338) и (4.341), (4.342) эквивалентны. Этот простой пример пока¬ зывает, что выбор состояния системы и особенно размерности фазового пространства с точки зрения связи выхода со входом системы является весьма существенным. Если же размерность фазового пространства больше, чем это необходимо, то система оказывается неуправляемой и ненаблю¬ даемой. В работе [212] содержится строгое изложение этих идей. В работе [35] приведены полезные соотношения для систем, рассматриваемых с точки зрения выхода, с использованием понятия управляемости. 4.19. ЭФФЕКТ СОКРАЩЕНИЯ ПОЛЮСА С НУЛЕМ В этом параграфе мы покажем, что обычные способы сокращения полюса с нулем, применяемые при проектировании следящих систем, приводят, согласно нашему определению, к неуправляемым системам 198
(или неполностью управляемым). Рассмотрим систему с различными соб¬ ственными значениями, фазовые координаты которой удовлетворяют диф¬ ференциальным уравнениям [см. уравнение (4.199)] хг(/) = \хД/) + vzu(0, 4 = 1,2, . . ., п, (4.343) где vt — вычет передаточной функции H (s) [уравнение (4.170)] в і-м полюсе. Если предположить, что в передаточной функции H (s) [см. (4.170)] ох = sx, (4.344) т. е. что в точке s = sx = ох находятся полюс и нуль передаточной функ¬ ции, тогда уравнение для фазовой координаты хх (/) запишется в виде хх(/) = s1x1(/)+ ^(/), (4.345) где = рх, вычет H (s) при sx = Àx. С помощью выражения (4.202) имеем 1-Р1- (M - X2) (Xj - Хз) . . . (Xi - X„) ~U’ (4.34b) так как Àx = sx = ox. Итак, xx (/) = sxxx (/), (4.347) и поэтому, согласно следствию 4.7, система неполностью управляема. 4.20. ПРАКТИЧЕСКИЙ ПРИМЕР С практической точки зрения управление системой означает, что мы заставили выход изменяться желаемым образом. Имея это в виду, рас¬ смотрим проявления неуправляемости на следующем примере. Скалярный выход у (/) связан с ее скалярным входом и (/) линейным дифференциальным уравнением второго порядка ÿ(0 + 2у (/) + y(t) = u(t) + u(t). (4.348) Передаточная функция системы имеет вид = H(s) = 5 + 1 = s + 1 /4 349) U (S) n{S) S2 + 2s + 1 (s + l)2 (4.<54У) В полученной передаточной функции имеются два полюса и один нуль, все при s = —1. Следуя порядку, описанному в § 4.10, определим фазовые координаты zx (/) и z2 (/), полагая = (4-350) г2(/) = г/(/) — «(/). Тогда Попробуем показать, что система неуправляема. Для проверки этого утверждения образуем матрицу G = [b\Ab] = (4.352) 199
Ее детерминант равен нулю. Используем следствие 4.6, и применим к уравнению (4.351) преобразование подобия, преобразующее матрицу А в ее каноническую жорданову форму (см. § 2.10). Пусть и (4.353) (4.354) Тогда J — искомая каноническая форма. Примем, что X = Р'Ч (4.355) •МО == Zj(Z) = y(f); (4.356) х2(0 = г, (Z) + г2(0 = y(t) + y(t) — u(f). Новые фазовые координаты Хі (t) и х2 (/) удовлетворяют Xj(/) — ' — 1 г *1(0 + ■ 1 ■ «(/). Л (0‘. 0 — 1 .*2 (0. 0_ уравнению (4.357) Если принять, что (0) = х2 (0) = g2, то решение уравне¬ ния (4.357) запишется в виде t Xi(t) = Ue~‘ -|- ет«(т)Л; (4.358) О х2(0=^е_<- (4.359) Теперь попробуем для заданных начальных значений и |2 найти управление, переводящее выход# (/) в нуль и заставляющее его оставаться равным нулю в дальнейшем. Итак, мы хотим найти такое управление, чтобы для некоторого Т выполнялось #(/)=0 #(/) = 0 для t Т; для t>T. (4.360) Это требование к выходу эквивалентно требованию к фазовым коор¬ динатам лд (/) и х2 (^) уравнения (4.356): х,(0 = 0 для ✓ >\ /хч , . ™ (4.361) x2(t) =— u(t) для t>T. Из выражения (4.358) заключаем, что любое управление и (t), удов¬ летворяющее соотношению т - JeTU(T)dT = g1 + Ê2T, (4.362) о действительно переводит х± в нуль за время Т, а из выражения (4.359) находим, что управление u(t) = — £2е“* для t>T (4.363) обеспечивает выполнение условия у (t) = 0 для Т. Итак, хотя си¬ стема и неуправляема, выходную величину и ее производную можно сде¬ лать равными нулю. 200
Наложим ограничения на величину управления в виде \и (0| < М для любого t (4.364) (сравните с примером 4.6). Можно ли найти управление, удовлетворяю¬ щее ограничению (4.364) и переводящее выход у (t) и его производную у (t) в нуль? Если £2 и Ттаковы, что существует управление и (/), | и (/) | < М такое, что т = + (4.365) и то (Г) будет равно нулю, но £2 может оказаться таким, что ||2е~'|>Л4 для 7 < / < Г'. (4.366) Следовательно, не существует управления, удовлетворяющего огра¬ ничениям (4.364) и (4.363). Иначе говоря, для таких и g2 выход и его производная не могут быть сделаны равными нулю в течение заданного времени х. Аналогичные задачи будут рассмотрены в § 7.13. 4.21. НОРМАЛЬНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 2 В этом параграфе мы рассмотрим понятие нормальности. Нормальная система — это такая система, которая является управляемой по отноше¬ нию к каждой из компонент ^ (/), и2 (0, • • -, (/) управления и (/). Мы ограничимся обсуждением случая линейной системы с постоянными параметрами, хотя понятие нормальности может быть определено и в более общем виде. Заметим, что понятие нормальности будет широко использо¬ ваться в гл. 6. Рассмотрим линейную систему с постоянными параметрами *(/) = Лх(/) + (4.367) где А и В — матрицы, соответственно размера п X п и п X т. Пусть р = 1, 2, . . ., т обозначает n-мерный вектор, образующий р-й стол¬ бец матрицы В: ^10 ^23 (4.368) Иначе говоря, ‘t ! t ! ! tl В = bi ! ^ ! - • .\bm -1 1 4 1 1 1- 1 Так как и (t) ограничено, то существует время t* (зависящее от и g2), которое величина Т должна превосходить, для того чтобы было возможно решить задачу. Время Т может быть много больше, чем t*. 2 Понятие нормальности было введено в [142] по отношению к системам, оптималь¬ ным по быстродействию. (4.369) 201
Определение 4.15. Нормальность. Говорят, что система (4.367) нор¬ мальна, если каждая из систем x(t) = Ax(t) + b2u(t). (4.370) x(t) = Ax(t) + bmu(t) ‘ полностью управляема (см. определение 4.13), где b$—столбцы ма¬ трицы В из уравнения (4.367) [т. е. Ь$ определяются уравнением (4.368)]. Рассмотрим физический смысл этого определения и его связь с управ¬ ляемостью системы X (t) = Ах (t) + Ви (0. Для того чтобы ответить на эти вопросы, представим систему в виде, изображенном на рис. 4.13. На рис. 4.13 на каждую из компонент и± (0, и2 (0, . . ит (0 вектора и (t) «действуют» соответствующие «векторы усиления» blf b2, • • -, Ьт, в ре¬ зультате чего получаются «векторные сигналы» Ь1и1 (0, Ь2и2 (0, . . ., • • •> bmum (t). Эти векторные сигналы суммируются и образуют сиг¬ нал Ви (0. По сути дела, это просто графическое представление уравне¬ ния вида Bu(t) = t I f I &1 I *2 I • 4 111 «1 (О U2 (/) = (/) + b2u2 (/)+•••+ Ьпіит(і). (4.371) На рис. 4.13 показано также т нормально закрытых ключей 1,2,..., . . ., т. Каждый ключ, размыкаясь, заземляет соответствующую компо¬ ненту вектора и (t) независимо от его остальных компонент. Если, на¬ пример, ключ (3 разомкнут, то и6 (0 = 0 для любого t. Если теперь система х (0 = Ах (t) + Ви (і) полностью управляема и все ключи замкнуты, то можно найти скалярные сигналы их (0, г], ^2(0 тр • • •» ит(о гр переводящие систему из любого начального состоя¬ ния ’ х0 в 0 в течение времени 71, которое может зависеть от х0. Предположим, что мы разомкнули все ключи за исключением первого, тогда получим &2«2 (/) = Ь3и3(і) = ... =bmum(t) = O. (4.372) 202
На движение системы можно воздействовать только с помощью ска¬ лярного управления и± (/). Теперь система описывается уравнением вида x(t) Ax(t) + biu1(t). (4.373) Необходимо определить, существует ли кусочно-непрерывная функ¬ ция их (0 Т] для заданной системы (4.373) и начального состояния х0 при = 0, переводящая систему из х0 в 0. Такое управление существует в силу следствия 4.6 тогда и только тогда, когда система (4.373) управляема, или эквивалентно, если матрица размера п X п G^b^Ab^ . . .'Л^Ч] (4.374) невырожденная. Аналогично, если разомкнуть все ключи за исключе¬ нием |3, то система (4.367) запишется в виде х(/) — Ax(t) + b$Uç,(t). (4.375) Управление up(0 т„ переводящее систему из xQ в 0, можно найти в том и только в том случае, если п X п матрица С7₽ = [&₽,;л^; . . .!лп-’&3] (4.376) невырожденная. Термин «нормальность» означает, что система управляема по каждой из компонент управления и, следовательно, нормальность предполагает, что система полностью управляема. Более того, справедлива следующая теорема: Теорема 4.7. Система х (t) = Ах (Z) + Ви (/) нормальна тогда и только тогда, когда det Gp Ф 0 для всех р = 1, 2, . . ., т, (4.377) где Ор — матрица размера /г X /г, С₽=[&Р:Л&₽!. • - (4.378) и &р — р-й столбец матрицы В. Из примера 4.16 видно, что не каждая управляемая система является нормальной. Пример 4.16. Рассмотрим систему Хі (/) і2 (/) (4.379) где а — некоторая постоянная величина. Прежде всего система (4.379) управляема при Г1 а — 3 — За всех значениях а, потому что матрица G = I $ [1 1 г з“| и . Для исследования нормаль- 1J L — ности системы образуем две матрицы Gj и G2 [см. уравнение (4.378)]: '1 — 3’ 'а — За 2 10 (4.380) _1 — 5J’ где Оі всегда невырожденная, тогда как О2 невырожденная лишь для а 0. Итак, система нормальна лишь при условии a 0. При а — 0 система (4.379) не яв¬ ляется нормальной, но остается управляемой. Нетрудно заметить, что если а = 0 и их (t) — = 0, то система (4.379) превращается в систему À (0 =-3%! (0; Х2 (0 = — 5Х2 (0 + 2«2 (t). В этом случае управлять координатой xr (t) с помощью одного только сигнала управления и2 (t) невозможно. (4.381)
ГЛАВА 5 УСЛОВИЯ ОПТИМАЛЬНОСТИ. ПРИНЦИП МИНИМУМА И УРАВНЕНИЕ ЯКОБИ —ГАМИЛЬТОНА 5.1. ВВЕДЕНИЕ Задача оптимального управления состоит в том, чтобы найти управле¬ ние а*, минимизирующее заданный функционал преобразования J (и) Ч Целью настоящей главы будет развитие некоторых весьма общих условий оптимальности управления к*. Мы будем предполагать, что имеется неко¬ торое решение задачи оптимального управления а*, и попытаемся сделать из этого некоторые выводы. Эти результаты позволят нам найти способ судить о том, может ли данное управление быть решением поставленной задачи. В последующих главах будет показано, что эти общие условия имеют большее значение для решения практических задач управления. Так как задача оптимального управления является задачей миними¬ зации, нам придется иметь дело с отысканием экстремумов. Поэтому часть настоящей главы посвящена изучению задач минимизации. При этом имеется в виду получение необходимых условий минимума. Вначале рас¬ сматривается обычный минимум, т. е. минимум действительных функций, определенных на эвклидовом пространстве Rn; затем исследуются мини¬ мум функционалов и принцип минимума Понтрягина. Результаты минимизации используются для получения классического принципа минимума (методами вариационного исчисления) для задачи управления с незакрепленным концом. Этот классический принцип мини¬ мума послужит основой развития известного принципа минимума Пон¬ трягина 1 2, который и дает необходимые условия оптимальности. В конце главы рассматриваются условия достаточности, основанные на уравнении Якоби—Гамильтона и принципе оптимальности. Перед тем как перейти к детальному изучению проблем минимизации, отметим роль, которую играют необходимые условия при практическом отыскании решений. Использование необходимых условий обычно ограни¬ чивает количество управлений, которые могут представлять решение поставленной задачи. Далее методом исключения можно определить, какое из управлений является наилучшим. Часто встречается случай, когда существует единственный элемент, удовлетворяющий необходимым усло¬ виям. Следовательно, этот элемент и должен быть искомым решением (если он существует). Важность этих замечаний читатель будет все глубже понимать по мере дальнейшего чтения данной книги. 1 См. определение 4.9. 2 См. сноску на стр. 21. 204
К материалу V гл. относятся работы [20], [23], [26], [30], [31], [33], [37], [40], [43], [45], [47], [49], [53], [54], [68], [79], [80], [87], [89], [91], [112], [115], [116], [131], [132], [148], [158], [169], 1171], [177], [179], [188], [190], [191], [204], [207] и [208]. 5.2. ОБЫЧНЫЙ МИНИМУМ Изучение необходимых условий оптимальности мы начнем с рассмо¬ трения теории обычного минимума. Эта теория позволяет решать задачи отыскания точки или точек, в которых некоторая действительная функ¬ ция /, определенная на области эвклидова пространства 7?п, имеет мини¬ мум. Ниже мы дадим точное определение понятий минимума и абсолют¬ ного минимума для такой функции f и опишем некоторые необходимые и достаточные условия для их отыскания. В следующем параграфе будет показано влияние некоторых допол¬ нительных ограничений на эту зада¬ чу. Если f — действительная функ¬ ция, определенная на всем R, то имеем следующие два определения. Определение 5.1. Точку х* из R называют (локальным) минимумом функции /, если существует число е •> 0 такое, что при | х — х* | «< е f(x*)<f(x). (5.1) X Рис. 5.1. Виды минимумов Иначе говоря, х* есть локальный минимум /, если f (х*) не превы¬ шает f (х) для любого X в окрестности х* (т. е. для х, близких к х*). Определение 5.2. Точку х* из R называют абсолютным миниму¬ мом /, если /(х*)</(х) (5.2) для всех X из R. Очевидно, что абсолютный минимум f является также локальным минимумом f и что локальный минимум может не быть абсолютным мини¬ мумом (рис. 5.1). На практике часто представляют интерес действительные функции /, определенные не на всем R, а на интервале из R [см. уравнение (3.7)]. В этом случае понятия минимума и абсолютного минимума полностью аналогичны понятиям, сформулированным в определениях 5.1 и 5.2. Имея в виду эти определения, предположим, что f — действительная функция, определенная и непрерывная на замкнутом интервале [а, Ь]. По теореме 3.7 f может иметь абсолютный минимум на Іа, Ь]. Попробуем его отыскать. Прежде всего, если х — внутренняя точка интервала la, b], т. е. х принадлежит открытому интервалу (а, Ь), и производная /' (х) существует и не равна нулю, то точка х не может быть минимумом /. Таким образом имеем первое необходимое условие: 1. Если X* — внутренняя точка из [a, b], f' (х*) существует их* — минимум /, то Г(х*) = -^-(х*) = °. (5.3) Точка X, в которой /' (х) равна нулю, называется экстремумом функ¬ ции /. Можно заключить, что абсолютным минимумом f могут быть эк¬ стремумы /, конечные точки интервала а и b и точки из (а, Ь), в которых производной / не существует. 205
Предположим, что f' (х) — кусочно-непрерывная функция \ имеющая конечное число разрывов на [а, Ь]. В этом случае имееі^ второе необ¬ ходимое условие: 2. Если внутренняя точка х* из [af Ь] является минимумом /, то /'(х*) = 0 (5.4) или lim и lim/'(x)<0. (5.4а)1 2 Х-+Х*+ х->х*— Если а — минимум /, то 1іш/'(х)>0; (5.5) и если b — минимум /, то limf'(x)<0. (5.6) х-> Ь— Различные примеры этих условий иллюстрируются с помощью рис. 5.2. С целью лучшего освоения этого понятия целесообразно краткое обосно- /W вание необходимого усло¬ вия 2. Пусть X* — внутрен¬ няя точка [a, Ь], являю¬ щаяся минимумом /. При t достаточно малом f(a+)>0 f’M-0 f’iïrW f(b-)<0 f’M>0 Рис. 5.2. К необходимому условию 2 О <|/|<е (5-7) имеем f(x* + O>/(**)- (5.8) Назовем х* + t возмущением х*. Если f (х) существует, то на осно¬ вании определения f можно написать Дх* + /) — /(X*) = -f- 0(/), (5.9) где через 0 (/) обозначен поправочный член, обладающий свойством Нщ2Д1 = 0. (5.10) Таким образом, f (х* + /) приблизительно равна f (х*) + tff (х*). Если предположить, что f' (х*) положительна, то для t <<0 мы получим, что разность f (х* + 0 — f (х*), равняясь приблизительно tf' (х*), ока¬ жется отрицательной. Мы пришли к противоречию, так как х* является минимумом /. Мы предлагаем читателю обосновать утверждение для слу¬ чая, когда /' (х*) не существует. Упражнение 5.1. Необходимо показать, что если х* —внутренняя точка из [a, ô], являющаяся минимумом f, и f' (х*) не существует, то lim f' (х) 0. Указание: х->х*4- Если 0, то Упражнение 5.2. Необходимо показать, что наличие члена 0 (/) в уравнении (5.9) не мешает доказательству, т. е. с его учетом предположение f' (х*) > 0 приводит к про¬ тиворечию. Указание: Если f' (х*)> 0, то существует 0 такое, что f' (х*)> 0. Выбрать ô > 0 1 Это означает, что f' (х+) и f' (х—) существуют для всех х, за исключением, воз¬ можно, самой этой точки. 2 См. определение 3.24. 206
е, а затем рассмотреть знак такое, чтобы для | t | < ô выполнялось Hx* + 0-f(x*) для _ô < t < о Отметим, что обоснованиями необходимого условия 2 являются: 1) небольшие изменения (возмущения) х вызывают соответственно малые изменения величины f (х); 2) для малых изменений х изменение f (х) можно аппроксимировать членом, зависящим от производной от f (х). Из обоснования необходимых условий 1 и 2 можно заключить, что если X* — точка, в которой /' (х*) = 0, и производная от f меняет знак с отрицательного на положительный при переходе через х*, то х* — ми¬ нимум /. Это достаточное условие минимума можно сформулировать следующим образом: 1. Если X* —внутренняя точка из [a, b ], в которой /' = 0, а /" (х*) >0, то X* является локальным минимумом /. В настоящее время известны различные достаточные условия мини¬ мума, однако в данной книге мы будем пользоваться только достаточным условием 1. Перейдем к задаче отыскания минимума функции нескольких пере¬ менных. Функция g есть действительная функция, зависящая от век¬ тора X с компонентами хь х2, . . хп. Вопрос минимизации таких функций сложен, и поэтому мы перечислим только те результаты, которые нам понадобятся в дальнейшем. Для начала сформулируем три определения. Определение 5.3. Точку х* из Rn называют локальным миниму¬ мом g, если существует е >> 0 такое, что при || х — х* || <е 1 g(x*) <g(x). (5.11) Точках* есть минимум g (х), если g- (х*) не превосходит g (х) для всех X, лежащих в окрестности х*. Определение 5.4. Точку х* из Rn называют абсолютным миниму¬ мом g, если g(x*)<,g(x) (5.12) для всех X из Rn. Абсолютный минимум g является локальным минимумом g, однако локальный минимум не обязательно является абсолютным минимумом. Часто представляет интерес отыскание минимума g на некотором под¬ множестве из Rn и изучение функций, определенных на подмножестве из Rn, а не обязательно на всем Rn. В частности, имеем. Определение 5.5. Открытое ограниченное подмножество D из Rn называют областью определения, если для любых двух точек х0 и Хі из D существует кусочно-линейная функция [см. уравнение (3.104) ] X, преобразующая [0, 1 ] в D, такая, что À (0) = х0 и À (1) = Хі (т. е. в D существует ломаная линия, соединяющая х0 и хг), как показано на рис. 5.3. Пусть dD обозначает границу D (см. определение 3.10) и D — подмножество из Rn такое, что DdDcD U dD. (5.13) Точку X* из D называют локальным минимумом g в D, если суще¬ ствует 8 > 0 такое, что для X С S(x*, 8) f) D (5.14) 1 Напомним, что символ || || обозначает эвклидову норму. 207
имеем £(**) <g(x). (5.15) Иначе говоря, х* есть минимум g в D, если g (х*) не превосходит g (х) для всех X из D, близких к х*. Предположим, что D — заданная область, g (х) = g (хь х2, . . хп) непрерывна на замыкании D (=D J dD) области D и что g имеет непре¬ рывные частные производные по каждой из компонент хъ х2, . . ., хп векторах в D. Тогда имеем третье необходимое условие: 3. Если точка х* из D Рис. 5.3. Типичная область является минимумом g, то все частные про¬ изводные g в точке х*равны нулю, т. е. = ■” = ’^Г<Х*)==О (5.16) или эквивалентно, градиент g [см. уравнения (3.67) и (3.68) 1 в точке х* равен нулевому вектору 0. Это необ¬ ходимое условие можно рассматривать следующим образом. Пусть а — единичный вектор с ком¬ понентами сс!» а2, . . ., ап и f (t) —функ¬ ция, определенная как f(f) = g(x*+ ta). (5.17) Если X* — минимум g, то 0 является минимумом f и, следовательно, п Г (9)^ == <Ѵ£(**Х <х)=о. (5.18) 1=1 1 Так как /' (0) является не чем иным, как производной g по напра¬ влению а в точке х* [см. уравнение (3.80)], необходимое условие 3 экви¬ валентно условию, что производная от g по любому направлению а в точке X* обращается в нуль. Продолжим обоснование необходимого условия 2 несколько дальше. Предположим, что g имеет непрерывные частные производные второго порядка. В окрестности нуля можно написать п п г ta)a‘ai- (5Л9) / = 1 / = 1 Из достаточного условия 1 можно заключить, что 0 будет миниму¬ мом функции /, если /' (0) = 0 и п п <5-2о> В результате этих рассуждений получаем следующее второе доста¬ точное условие: 2. Если производная от g по любому из направлений а в точке х* обращается в нуль и неравенство п п <52|> £ —1 /=1 208
выполняется для каждого направления а, то х* является локальным минимумом g. Выражение (5.21) очень похоже на внутреннее произведение (см. § 2.11). Если Q—симметричная матрица размера п X п, элементами которой являются ^-^7 (х*), т. е., если Q задается соотношением дх^ dxjxj**)- (х*\ ’ ’ дхі дхп 7 Q = дх2дхх > >(•*•). ■ дх^ дх.,дх„ ) _ дхп дхг 7 Ô2g / А \ -5 f— (X*) . дхпдх2 ѵ 7 ...^(х*) , дхп ѵ 7 (5.22) то можно определить внутреннее произведение Q на Rn с матрицей Q [см. уравнение (2.83)] и убедиться в том, что достаточное условие 2 экви¬ валентно достаточному условию 3. 3. Если градиент g в точке х* равен 0 и если матрица Q (5.22) поло¬ жительно определенна [см. § 2.15 уравнение (2.84)], то х* есть мини¬ мум g. В частности, если g — функция на /?2, то условия ^(^)=^-(J;«) = 0; (5.23) (5.24) (5.25) гарантируют, что в точке лг* имеет место минимум g. Еще раз отметим, что эти условия были получены путем вычисления влияния малых изменений х на функцию g с помощью «производной» (в данном случае — частных производных) от g. Мы предлагаем чита¬ телю самостоятельно рассмотреть полученные результаты с этой точки зрения. х’2 -4- и* Пример 5.1. Рассмотрим функцию g, заданную на R2 в виде g (х, у) — —2' " * Начало координат (0, 0) есть минимум g, так как dg_ _ dg _ d2g _ &g _ . &g _ дх ' ду ~у' dxdy ’ dy2 ’ dx2 и достаточное условие выполняется при х* — (0, 0). Отметим, что матрица Q по выраже¬ нию (5.22) в данном случае является единичной матрицей. Функция g, рассматриваемая как поверхность в R3, представляет собой параболоид вращения, показанный на рис. 5.4. jj2 Пример 5.2. Рассмотрим функцию g, определенную на R2 в виде g (х, у) — . dg и дх dg * в начале координат обращаются в нуль, но начало координат не яв- Производные ляется ни минимумом, ни максимумом функции g. Матрица Q в этом случае имеет вид Г1 °' [о — 209
и не является ни положительно, ни отрицательно определенной. Функция g, рассматривае¬ мая как поверхность в R3, является гиперболическим параболоидом, как показано на рис. 5.5. Начало координат называют «седловой точкой» g, или «седлом» (рис. 5.5). Рис. 5.4. Параболоид к при¬ меру 5.1 Рис. 5.5. Гиперболический параболоид к примеру 5.2. В начале координат находится особая точка типа «седло» 5.3. ОБЫЧНЫЙ МИНИМУМ С ОГРАНИЧЕНИЯМИ. ПРОСТАЯ ЗАДАЧА В предыдущем параграфе была рассмотрена задача отыскания мини¬ мума функции на подмножестве из эвклидова пространства Rn. Теперь мы рассмотрим задачу отыскания минимума функции, на которую наклады¬ ваются некоторые ограничения. Для того, чтобы подойти к общим резуль¬ татам, которые будут получены в следующем параграфе, рассмотрим неко¬ торые более наглядные случаи, используя функции на /?2. Предположим, что f = f (х, у) и h (х) — действительные функции, соответственно определенные на R2 и R. Пусть уравнение у = /г (х); X £ R (5.26) определяет собой кривую1 в пространстве /?2. Если определить g (х, у), положив g(x, У) = у —h (х), (5.27) то уравнение кривой запишется g(x, у) = у — Ь(х) = 0. (5.28)2 Определим, в каких точках кривой у = h (х) функция f (х, у) мини¬ мальна? Другими словами, мы хотим найти точки (х*, z/*) на кривой [т. е. z/* = h (х*)] такие, что если точка (х, у) есть точка кривой «вблизи» точки (х*, z/*), то /(%*, y*)<f(x, у). (5.29) Так как у* — h (х*) и у = h (х), уравнение (5.29) можно записать в более наглядном виде: /(X*, Л(х*))</(х, Л(х)). (5.30) Точку X*, ÿ* называют минимумом f на кривой у — /і (х) = 0. Исполь¬ зуем принцип возмущений для получения необходимого условия мини¬ мума f на кривой у — h (х) = 0. Пусть точка (х*, у*) является таким огра¬ ниченным минимумом, a f и g — достаточно гладкие (т. е. дифференци¬ руемые) функции. Если точка (х, у) «близка» к (х*, #*), то можно написать x = x*-f-e^; ÿ=ÿ* + eg2) (5.31) 1 Эта кривая есть множество точек {(х, у) : у = h (х)} в плоскости х, у в качестве пространства Я2. 2 См. § 3.13. Заметим, что кривая есть множество S (g). 210
где s — малое положительное число и | = (£„ g2) — некоторый вектор. Следовательно, f(x, у) = f(x*, у*) + е у*), I) + О (I), (5.32) где yf(x*, у*) — градиент f в точке (х*, у*) [см. уравнение (3.67)1 и О (е) — член, зависящий от е и обладающий свойством 1іт-£^=0. (5.33) Е->0 8 Если точка (х, у) не только «близка» к (х*, z/*), но и находится на кривой, то у = h (х). Учитывая уравнения (5.31) и то, что у* = h (х*), имеем: У = h(x) = h(x* е^) = h(x*) + eç2 = y* + e£2. (5.34) Но так как значение x «близко» к х*, то можно написать А(х*4-е^) = А(х*)н-8-^-(x*)g2-|- О(е) (5.35) и, следовательно, S2=-g(x*)|; (5.36) [так как lim ° = 01. Итак, для возмущения (x*, z/*) вдоль кри- \ е-»0 8 / вой у = h (х) уравнение (5.32) можно записать в виде «х. (/) = + «і L t, l, + е -g- (л, + о И- (5.37) Так как (x*, z/*) есть минимум f на кривой, 8 > 0, lim ° ■ = О, 8->0 8 a lx может быть как положительным, так и отрицательным, имеем ■ÿ-\ +-FI -т~\ =°- <5-38) ОХ |(х*. У*) ду |(Х*. г/*) ах |х* ' 7 Это уравнение — необходимое условие того, что точка (x*, z/*) является минимумом f на кривой у — /і (х) = 0. Отметим, что при выводе уравнения (5.38) мы рассматривали возму¬ щения вдоль кривой у — h (х). Иначе говоря, если было выбрано, то £2 определялось соотношением (5.36). Таким образом, в соответствии с неравенством (5.30) наш результат зависит лишь от одной производной. Результатом этого является ограничение свободы выбора возмущения и, следовательно, уменьшение размерности задачи. Упражнение 5.3. Рассматривая функцию одной переменной F (x) = f [х, /г(х)], при помощи метода возмущений необходимо получить уравнение (5.38). Подойдем к уравнению (5.38) несколько иначе. Рассмотрим функцию §(Х, у) = у — h(x). (5.39) Ограничение можно записать в виде g(x, у) = 0. (5.40) Заметим, что частная производная 211
нигде на ограничивающей кривой не обращается в нуль. Имеем df df d(f, g) _ дх дУ д (х, у) dg dg дх ду = det df df дх ду dh . dx df df dh dx ' dy dx ' (5.42)* (5.43) (5.44) Левое выражение представляет собой якобиан от f и g по отношению к X и у Ісм. уравнение (3.89)]. Следовательно, уравнение (5.38) можно представить в виде d(/> g) I =0 д(х, у) |(х*, </*) (5.45) Смысл полученного соотношения состоит прежде всего в том, что система уравнений относительно переменной р — 4-Р — дх |(х», У*у м дх |(ж*. ^*) JLI +р-^-і ду l(x*,ÿ*) ду |(х«. у») (5.46) имеет решение р = р*. Действительно, так как g (х, у) = у — h (х), то ^=^=-<L^> = const (5-47) является одним таким решением. Заметим, что если G(x, y) = f(x, z/) + p*g(x, y) = f(x, y)+ D*ïy—h(x)], (5.48) где p* — решение (5.46), то уравнение (5.46) после замены в нем р* на р можно рассматривать как необходимое условие того, что точка (х*, у*) является минимумом G (х, у). Иначе говоря, если (х*, z/*) является мини¬ мумом G (х, у), то, как мы уже знаем, частные производные функции G по X и по у в точке (х*, у*) должны быть равны нулю [см. условие (5.16)]. Таким образом, получаем -&L ,*)=£у)+p*g {х'ÿ)1 L «•> = -Х| +р*-^| =0; дх |(х*. г/*) дх |(х*, у*) 4п-| = {f(x, у) + p*g(x, у)} I = ду |(х*. Ў*) ду [l ѵ ô v AI +p*-^| dy lu*, y*) dy |(x», y») = 0. Cm. § 3.12. 212
Итак, необходимым условием того, что точка (х*, z/*) является мини¬ мумом функции f при ограничении g (х, у) = у — h (х) = 0, будет суще¬ ствование числа р*, для которого справедливы уравнения: 4-1 +р*>| ^0; (5.49) 2L\ +р*>| =0; ду |(х*. г/*) г ду |(х*. у*) (5.50) g(x*, У*) = У* — h(x*) = 0; (5.51) число р* называется множителем Лагранжа. Несколько обобщим теперь нашу задачу. Предположим, что f (х, у) — действительная функция, определенная на /?2, и g (х, у) —также дей¬ ствительная функция на /?2, не обязательно вида у — h (х). Мы можем попробовать найти необходимые условия минимума f вдоль кривой g (х, у) = 0. Предположим, что f и g достаточно гладкие (т. е. достаточное число раз дифференцируемые) и что норма градиента g не равна нулю: Если (х*, z/*) есть минимум f при ограничении g (х, у) =0, то суще¬ ствует число р*, называемое множителем Лагранжа, такое, что х*, z/* и р* являются решениями системы уравнений дх Г ' дх -= 0; (5.53) JL л-р^- ду Л ' ду - 0; (5.54) g(x, у) = 0, (5.55) т. е. справедливы соотношения дх |(х*. £/*) дх I - 0; |(Х‘. у*) (5.56) JL\ + ду |(x’,ÿ’) г ду 1 == 0; |(х\ (/•) (5.57) g(x*, у*) = = 0. (5.58) Доказательство этого положения аналогично приведенному выше, и в разъяснении нуждается лишь утверждение (5.52). Это утверждение предполагает, что уравнение g (х, у) = 0 разрешимо относительно одной из переменных х или у. Например, если 4-1 ^°- ду І(х‘, у’) то в окрестности х* существует функция h (х): у* = h(x*\, Q = g[x, /г(х)]; dg dh __ дх dx ~ dg ’ ~ду~ (5.59) (5.60a) (5.606) (5.60b) 1 Как станет ясно ниже, мы требуем лишь || yg || > 0 на кривой g (х, у) — 0. 213
т. e. уравнения g (x, y) = 0 и y = h (x) определяют одну и ту же кривую «вблизи» от (х*, у*). Необходимость условий с (5.56) по (5.58) мы пред¬ лагаем доказать читателю. Пример 5.3. Пусть f (х, у) — —ху и g (х, у) = у + хех. Какие точки могут оказаться минимумом f при ограничении g = 0? Можно принять h (х) = —хех и использовать уравнение (5.38). Таким образом, мы должны решить урав¬ нения —У + (—X) (—ех — хех) = 0; У + хех = 0. Очевидно, что только точки являются решениями этих урав¬ нений и лишь они могут оказаться минимумом f при ограничении g — 0. Рассмотрение функции х2е* приводит к заключению, что точка (0, 0) является минимумом f, а точка ( ”2’ —максимумом f при ограничении g = 0. Пример 5.4. Пусть f (х, у) = —ху и g (х, у) — х2 + у2 — 1. Необходимо найти, какие точки могут оказаться минимумом f при ограничении g — 0? Прежде всего отметим, что предположение (5.52) в точке (0, 0) не удовлетворяется. Однако эта точка не при¬ надлежит кривой g (х, у) = 0 и мы можем воспользоваться поэтому необходимыми усло¬ виями (5.56)—(5.58). Полагая, G(x, у, р) = — ху + р (х2 + у2 — 1), получаем, что мы должны решить уравнения -g-=-P+2px = 0; dG , „ — = -x + 2Pÿ=0; g (X, у) = X2 + у2 — 1 = 0. Легко проверить, что решениями этих уравнений являются У “Fs)’ ''“FT j “ х* — j/^’ г/* =. Таким образом, минимумом 1 К2 ’ У* = f при ограничении р-= 0 могут быть точки I—— I, I — » — I—т=- » — I, \К2 Г2/ \ Г2 Г2/ И2 /2/ / 1_ 1 \ \ К2’ Г2/ V елгт / 1 1 \ / 1 1 \ Упражнение 5.4. Покажите, что точки —— и , — деистви- \ К2 К2 ) \ У2 К2 ) тельно являются минимумами в примере 5.4. Указание: рассмотрите функцию — I x I — I x I2. 5.4. ОБЫЧНЫЙ МИНИМУМ С ОГРАНИЧЕНИЯМИ. НЕОБХОДИМЫЕ УСЛОВИЯ И МНОЖИТЕЛИ ЛАГРАНЖА После предварительного рассмотрения экстремальных задач в преды¬ дущих параграфах мы подошли к решению задачи отыскания минимума функции при некоторых ограничениях. Отыскание необходимых условий для этого типа задач весьма тесно связано с понятием множителей Ла¬ гранжа, которые будут часто использоваться в дальнейшем. Начнем со строгой постановки задачи, затем с помощью теоремы 5.1 сформулируем необходимые условия и закончим параграф их обсуждением. Итак, предположим, что D — заданная область из Rn (см. определе¬ ние 5.5), f (х) = f (хх, х2, . . ., хп) — непрерывная действительная функ- 214
ция на замыкании 1 D и (х) = gr (хь х2, . . хп), g2 (х) = g2 (х1( х2, • • -, Sm (x) Sm (xi> x2, • • -, Xn) — непрерывные действительные функции на D. Предположим также, что функции g независимы, т. е. что множество общих нулей функций g, или множество всех х, удовлетво¬ ряющих условию S1W ==g2W = ••• - êM = 0, (5.61) не может быть определено при меньшем числе функций 2 g. Определение 5.6. Точку х* из D называют локальным минимумом / при ограничениях £і(*) = 0, £2(л:) = 0, ..., ^(х) = 0, (5.62) если, во-первых, ^(х*)-0, £2(х*) = 0, •••> ^(х*) = 0 (5.63) и, во-вторых, существует 8 > 0 такое, что если удовлетворяется условие ||х —х*||<е, (5.64) причем xQD, (5.65) и £і(лг) = О, £2(х) = 0, ..., gm(x) = 0, (5.66) то Hx*Xf(x). (5.67) Таким образом, мы хотим изучать задачу отыскания минимума функ¬ ции на D при ограничениях gt (х) = 0, і = 1, 2, . . ., т. Предположим далее, что f (хь х2, . . ., хп) и (х19 х2, . . ., хп), і = 1 , 2, . . ., т имеют непрерывные частные производные по всем в области D. Потребуем также, чтобы систему уравнений gt (х) = 0, і = 1, 2, . . ., tn можно было разрешить относительно т координат Xj через п — т осталь¬ ных координат. Это условие будет выполнено, если предположить, что везде на D выполняется неравенство g2. ■ • •• gm) I2 > 0 (5.68) d(x(1, XZ2. . . Xlm) J '^т где под знаком суммы стоят различные якобианы [см. уравнение (3.89)] функций g по отношению к подмножествам из х2, . . хп}, содержа¬ щим т различных элементов. Отметим, что неравенство (5.68) выполняется в том и только в том случае, когда т векторов (ѵ£і, Ѵ£г, • • •» Ѵ£дп) линейно независимы во всех точках D. Пример 5.5. При п = 4 и т — 2 рассмотрим две функции gt и g2 четырех перемен¬ ных хъ х2, хз и *4- Тогда уравнение (5.68) принимает вид Г d(gi, g2) I2 _і_ Г d(gi> g2) p I Г d(gi, g2) 12 L d(xlf x2) J ' L d(xlt x3) J ~*L d(xi, x4) J I Г d(gi, g2) p г d(gl, g2) -12 г d(gl, g2) p L d(x2, x3) J L d(x2, x4) J L d(*3, x4) J Если X* — (x|, x£, x^f xjf) — точка, удовлетворяющая уравнениям ограничений gi (х*) —0, g2(x*) =0, то один из якобианов должен быть не равен нулю хп в точке X*. Пусть . I =^=о. Это означает, что в окрестности двумерного век- о (хг, х2) |х* 1 См. определение 3.9. 2 См. § 3.13. 215
тора (х*, х^ мы можем разрешить уравнения ограничений относительно хх и х?, выразив их через х3 и х4, т. е. существуют функции hx (х3, х4) и h2 (х3, х4) такие, что а) х\ = hx (xj, X*), х2 = Л2 (xj, X*); б) gi [йі (х3, х4), Л., (х3> х4), х3. х4] = 0; ёг [hx (х3, х4), Л2 (х3> х4), х3, х4] = 0; d(gi, g г) d(gi, g,) __ х2) dh, d(x4, x2) дх3 “ d(gi, gt) ’ dx4 ~ ^(gl. gg) d(xlt хг) d(x4> x2) d(gi. ga) ^(gi. ga) дЛ2 д(Хі, x3) dh2 ___ d(X], x4) ^х3 d(gi. g2) ’ dx4 ^(gi. ga) d(xlt x2) â(x4> x2) Функции hx и h2 представляют собой местные «решения» уравнений g} — 0, g2 = 0 для двух переменных хг и х2 в выражении через х3 и х4. Упражнение 5.5. Пусть g± (хь х2, х3, х4) = хг ф- х2 + х3 ф- х4 и g2 (хь х2, х3, х4) = = Х1 — Х2 ф- х% + Х4. Можно ли разрешить уравнения gA ~ 0 и g2 = 0 относительно х4 и х2, выразив их через х3 и х4 «вблизи» начала координат? Можно ли выразить х3 и х4 через хх и х2? Полу¬ чите решения в тех случаях, когда они существуют. Необходимые условия минимума функции f при ограничениях gt — = 0, і = 1, 2, . . т в точке х* из D определяются теоремой. Теорема 5.1. Если х* — точка области Z), в которой f имеет локаль¬ ный минимум при ограничениях gt == 0, і = 1, 2, . . m, причем все функции f и gt имеют непрерывные частные производные, то существуют числа р*, р*, . . р*2, называемые множителями Лагранжа. В этом слу¬ чае X , р*, р*, . . р*т являются решением системы п ф- т уравнений относительно п ф- т неизвестных xlf x2t ..., хп, р19 р2, ..рт: JL + P1^L + р^ + ... + Рт^ = 0; (5.69) дхі dxt dxt > rm fa. \ / gj (xi>x2 ^n)=0. (5.70) где i = 1, 2, . . ., n и j = 1, 2, . . m. Иначе говоря, справедливы равенства L*+L*+4г L*н L*=0; (5-71) gj (х*, X*, ..X*) = 0 (5.72) для /=1,2, . . ., п и j = 1, 2, . . ., т. Доказательство этой теоремы, которую мы часто будем использовать в дальнейшем, очень похоже на рассуждения, использовавшиеся ранее при выводе соотношений (5.49)—(5.51), поэтому предлагаем выполнить его самостоятельно х. Рассмотрим теперь, каков смысл теоремы 5.1? Существенно, что она позволяет нам заменить задачу отыскания минимума f при огра¬ ничениях gj = 0, / = 1, 2, . . m задачей отыскания минимума функции G(x, рг, р2, ..рт) = = f(x) 4- Р& (X) + р^2 (лг) 4 Ь pmgm (X). (5.73) 1 См. [91]. 216
Для того, чтобы показать это, будем считать р и g (х) /n-мерными век¬ торами с компонентами plt р2, . . рт и gx (х), g., (х), . . ., g,H (х) соответ¬ ственно. Уравнение (5.73) при этом запишется в виде G(x, p) = f(x){р, £(*)). (5.74) Необходимыми условиями минимума функции G в точке х*, р* яв¬ ляются wL- "• <5-75> <576) где і 1, 2, . . ., п, / = 1,2, . . ., т и m-мерный вектор с компо¬ нентами . Но уравнения (5.75) и (5.76) представляют собой лишь векторную форму записи уравнений (5.71) и (5.72), что и доказывает наше утверждение. Если мы хотим отыскать абсолютный минимум f при ограничениях gi= 0, / = 1,2, . . ., т на D, то теорема 5.1 устанавливает, что абсолют¬ ный минимум может иметь место в тех точках из D, в которых выполняются условия (5.71) и (5.72), а также в точках границы D, удовлетворяющих уравнениям ограничений. Такая задача, как отмечалось в § 5.2, является типичной задачей отыскания минимума. п Упражнение 5.6. Найти минимум f (хь хп) — 2 х/ ПРИ огРаничениях /==1 п §(хъ х2, • • хп) -- 2 аіхі — 1 аі > 0 на множестве >0, х2 > 0, . . . хп > 0. /=1 5.5. НЕКОТОРЫЕ ЗАМЕЧАНИЯ Перед началом изучения функциональных минимумов и вариацион¬ ных подходов их определения мы хотели бы дать эвристический обзор результатов и способов, полученных для обычных задач отыскания мини¬ мума. В этом обзоре рассматриваются основные идеи в задачах обычной минимизации (см. § 5.2—5.4) и приводятся обоснования некоторых мето¬ дов, которые будут использованы при обсуждении минимизации функ¬ ционалов. В § 5.2—5.4 мы рассматривали задачу отыскания минимума действи¬ тельной функции /, определенной на области А эвклидова простран¬ ства Rn. Мы обычно предполагали, что f непрерывна и что подмножество А из Rn компактно (см. § 3.6). Эти предположения служат гарантией, что задача имеет решение, т. е. что минимум f на А существует. Затем мы отыскали точки, <в которых может иметь место абсолютный минимум f на Д, а для того, чтобы облегчить этот поиск, получили необходимые условия, основанные на методе возмущений. В нем используется то поло¬ жение, что «производная» является наилучшей линейной аппроксимацией функции (см. § 3.12). Мы установили, что локальный минимум может иметь место только при следующих условиях: 1) в точках границы А; 2) в точках, в которых производная / не существует; 3) в тех внутренних точках Л, где производная f обращается в нуль. 1 См. уравнение (5.16). 217
Точки, в которых производная f обращается в нуль, называют точ¬ ками экстремума функции /, и полученные необходимые условия факти¬ чески являются условиями экстремума. Рассмотрим теперь некоторое обобщение задачи х. Предположим, что V — векторное пространство (см. § 2.5) с функцией расстояния d (см. § 3.2), полученной из нормы || || на V. Иначе говоря, предположим, что существует действительная функция ||г>||, определенная на V и обла¬ дающая свойствами: 1) II я II 0 для всех V из V и ||г>|| = 0 в том и только в том случае, если V = 0; 2) I, V + w II < Il VII + Il w II для всех ѵ и w из V; 3) Цг^Ц = |r||| V II для всех ѵ из V и г из R. Расстояние d на V определено соотношением d(v, w) = ||ü — wII (5.77) для V и w из V. Мы предлагаем читателю проверить, что d действительно определяет расстояние на V и что это понятие расстояния совместимо с понятиями суммы и произведения на V: 1. Если заданы элементы ѵ и w из V и последовательности {üj и {wk] из V, сходящиеся соответственно к ѵ и w, то последовательность [vk + wk] сходится к V + w, т. е. d(vk -I ѵ I w)->0. (5.78) 2. Если заданы элементы ѵ из V и г из R и последовательности {^} из У, сходящиеся к гі, и гк из R, сходящаяся к г, то последовательность сходится к гѵ, т. е. d(rkvk, гѵ)->0. (5.79) Упражнение 5.7. Требуется доказать, что функция d [уравнение (5.77)] определяет расстояние на V, удовлетворяющее условиям (5.78) и (5.79). Функциональные пространства 93, $ и (£, введенные в §3.15, являются векторными пространствами этого типа. Если А есть подмножество из V, обладающее тем свойством, что для любой заданной последовательности ak, k = 1, 2, . . . в А существует подпоследовательность akv akcii . . ., сходящаяся к элементу из А (сравните со свойством 4 в § 3.6), то подмно¬ жество А компактно. Наконец, полагая, что J — некоторый функционал, заданный на множестве А (которое может быть компактным или нет), можно дать следующее определение. Определение 5.7. Вектор а* из А называют локальным миниму¬ мом J, если для любого а из Л, достаточно «близкого» к а*, удовлетворяется неравенство J(a*) < J(a). (5.80) Если А компактно (см. теорему 3.7), то J имеет на А абсолютный ми¬ нимум. Попытаемся найти точки, которые можно рассматривать в качестве потенциальных точек абсолютного минимума. Сосредоточим свое внимание на внутренней точке а* из Л и попытаемся использовать метод возмущений. Для начала нам необходимо ввести поня¬ тие производной для того, чтобы затем аппроксимировать / (а) вблизи а* с помощью функции вида /(«*) + ЭД, (а — а*), (5.81) где ЭД, — линейное (непрерывное) преобразование V в R (см. § 3.12) 1 2. 1 Сравните это с § 3.15. 2 Т. е. ЭД представляет собой элемент пространства V*, сопряженного к V, и, следо¬ вательно, является линейным функционалом на V' (см. упражнение 2.11). 218
Если ^О. (5.82) IIй и II то линейное преобразование il называют производной J в точке а* и запи¬ сывают: 21 = ôJ(a*). (5.83) Выражение SJ (а*) часто называют первой вариацией J в точке а*. Отметим, что 8J (а*) вновь будет функционалом на V и, следовательно, (а*) является линейным преобразованием V в R. Если V — ненулевой вектор из V и 8 — некоторое действительное число, то а* 4-8^ называют возмущением или вариацией а* по направле¬ нию ѵ. Если SJ (а*) существует, то можно написать J (а* +- = J (а*) Е 8J (а*) [ег>] + о (е) = = «/(а*) + 8ÔJ(a*) V + О (е), (5.84) где О (е) обладает свойством Ит°1£} = 0. (5.85) Е-»0 8 Если а* — минимум J и А(8) = J(a* + 8ü), (5.86) то при 8 = 0 имеет место минимум действительной функции F (е), и можно заключить, что é/F(e)| п de |e=ü-U’ т. е. lim I•/(«*+**)-■'«И I = Hm|JL ÔJ(g*)v + -°(£L| = e->0 8 8->01 8 8 I = |SJ(a*)ü| = 0. (5.87)1 Так как v — любой ненулевой вектор из V, то ÔJ(a*) = 0. (5.88) Это условие является точной аналогией необходимых условий, полу¬ ченных для функций одной или нескольких переменных. Его смысл станет более понятен из последующих параграфов. Итак, вновь заключаем, что локальный минимум J может иметь место лишь: 1) в точках границы Л; 2) в точках, где не существует производной J; 3) в тех внутренних точках Л, где производная (первая вариация) J обращается в нуль. Пример 5.6. Пусть <р (х) — непрерывно дифференцируемая действительная функция на R и J — действительная функция, определенная на функциональном пространстве SJ3 ( [0, 1], R) всех кусочно-непрерывных функций 2 из [0, 1 ] в R с помощью соотно¬ шения 1 J («) = j ф Іи (/)] dt. О 1 Напомним, что (а*) —линейное преобразование V в R и поэтому 8J (а*) ѵ— действительное число, поскольку Ф — элемент из V. 2 См. § 3.15. 219
Если и* — элемент из ([О, 1 ], R) и и* + &ѵ — возмущение, или вариация и*, то 1 1 J (il* 4“ eü) J ф [И* (/) + &Ѵ (^)J dt " Ç |ф [u* (/)] 4- 8 I * ü (/) 4“ О (8 Д J/ = il t) \ J 0 1 = J (U*) + 8 J <p- [U* (/)] V (/) dt 4- O (8). U Если при и* имеет место локальный минимум J, то 1 J Ф' [«* (О] ѵ (О dt — О и для всех и из $ ([0, 1 ], /?). Отметим, что линейное преобразование ЭД, из $ (|0. 1 ], /?) в R, определенное соотношением 1 Ц (о) = J <р' [и* (<)]» (О dt и является линейным и непрерывным и представляет собой вариацию 8J (и*). Упражнение 5.8. Пусть ф (х, у) — непрерывно дифференцируемая действительная функция на R2 и J — действительная функция, определенная на функциональном про¬ странстве ( [О, 1], /?2) [см. (3.136)] соотношением 1 J (и) = J <р [«! ((), (О] dt и £ ([0,1], R2), U где Ui и и2 — компоненты и. Покажите, что если д* — минимум J, то 1 У <Ѵ Ф І«* (О]. D <t))dt = О и для всех ѵ из $ ([0, 1], /?2), где \/ф обозначает градиент ф. В § 5.2 мы видели, что вторая производная играет важную роль при определении, какой из экстремумов является минимумом. Обобщим эти положения. Во-первых, будем называть а* экстрему¬ мом </, если ÔJ(«*) = O. (5.89) Во-вторых, будем говорить, что функционал J имеет вторую производ¬ ную в точке а*, если существует внутреннее произведение Р (см. § 2.11) на V такое, что 7(a) — </(«*) = ÔJ(a*)(a — а*) + Р (а —а*, а — а*) 4- + О (II а — а* II2) (5.90) для всех а, «близких» к а*. Квадратичная форма, образованная внутрен¬ ним произведением Р (см. § 2.11), является функционалом на V и назы¬ вается второй производной, или второй вариацией J в точке а*. Будем обозначать ее в виде ô2J (а). Итак, J(a) — J(a*) = ôJ(a*)(a — а*) + б2«/(а*)(а —а*) 4- О (||а — я* II2), (5.91) где бѴ(а*)(а — а*) = Р(а — а*, а —а*). (5.92) Если V — некоторый ненулевой вектор из V и е — малое действитель¬ ное число, то, предполагая, что SJ (а*) и Ô2J (а*) существуют, имеем «/(а* 4- е^) = Да*) + eôJ(a*)ü 4- s2ô2J(a*)ü 4- О (е2), (5.93) 220
где О (е2) обладает свойством 1іт^^- = 0. (5.94) е->0 ь Если а* есть минимум J, то SJ(a*) = 0, (5.95) и уравнение (5.93) превращается в J(a* + eü) - J (а*) + е20Ѵ(а*)гі + О (е2). (5.96) Так как £2 >0 и членом 0 (е2) можно пренебречь, то J(a* +^)~^(а*)>0, (5.97) откуда ôV(a*)ü^0 (5.98) для всех V и, следовательно, внутреннее произведение Р [выраже¬ ние (5.90)] должно быть положительным [см. уравнение (2.84)]. Таким образом, выражение (5.98) представляет собой еще одно необходимое условие того, что а* является минимумом J. Значение этого условия ста¬ нет ясным из § 5.7. Наконец, если квадратичная форма, образованная внутренним произведением Р на пространстве V, положительно опреде¬ ленна, т. е. существует а > 0 такое, что P(v, V) а II V II2 (5.99)1 для всех V из V, то можно показать, что положительной определенно¬ сти SV (а*) вполне достаточно, чтобы экстремум а* функционала J яв¬ лялся локальным минимумом J. Пример 5.7. Пусть ф (х) дважды непрерывно-дифференцируемая действительная функция на R и J — действительная функция, определенная на функциональном про¬ странстве $ ([0, 1], 7?) всех кусочно-непрерывных функций, преобразующих [0, 1] в R: 1 /(«) = J <p[u (t)]dt; «О([0,1 ],/?)• и Если и* g ([0, 1 ], R) и и — и* + ео — вариация и*, то 1 J (и* + eü) — j ф [и* (0 + еѵ (0] dt — 1 о = [ !ф [и* (/)] + е -^2- I v(t) -|- -^-у-1 и2 (/) + о (е2) 1 dt = J I dx h* (о ‘ 2 dx2 и* (о I о 4 7 1 1 = J (и*) + е J <₽' [и* (0J V (/) dt + -J- J <р" [u* (01 V2 (О dt + о (е*). о о 1 Если — локальный минимум J, то J ф' [w* (/)] v (t) dt =0 для всех ѵ из $ ([0, (j 1 1], /?) И j ф" [u* (0] V2 (t) dt ^0 для всех ѵ из $ ([0, 1 ], R). Отметим, что преобразование ЭД,, определенное соотношением 1 ЭД (у) = j ф' [u* (0J v (t) dt, и Сравните с § 2.15. 221
является линейным и непрерывным [оно представляет собой Ô./ (и*)]. Функция Р из ÿ ([0, 1], R) X $ ([0, 1], R) в R, определенная соотношением 1 Р (ѵ, w) — J ф" [u* (/)] V (t) w (t) dt, 0 есть внутреннее произведение на <£ ([0, 1], R) [квадратичная форма, образованная Р и представляющая собой ô2J («*)]. 5.6. ПРИМЕР Рассмотрим одну частную задачу управления. Так как она является первой задачей минимизации функционалов, мы будем решать ее очень подробно и постараемся с ее помощью проиллюстрировать и обосновать методы, которые используются в дальнейшем для получения общих результатов. Начнем с постановки задачи. Рассмотрим динамическую систему первого порядка вида x(t) = — x(t) + u(t) (5.100) с интервалом определения (—оо, +оо). Будем считать, что любая огра¬ ниченная по величине кусочно-непрерывная функция из (—оо, +оо) в R является допустимым управлением, т. е., что наша задача относится к задачам без ограничений (см. § 4.13). Пусть L (х, и) —непрерывная функция, определенная соотношением L (х, и) = 4- *2 + 4 и2, (5.101) и К (х, t) — функция, тождественно равная нулю, т. е. К(х, /) НЕ 0. (5.102) Примем t0 = 0; пусть х (0) = 1 (5.103) является начальным состоянием системы, а множество S — конечным состоянием системы, представляющим собой подмножество из R. Рассмо¬ трим случай, когда S состоит из единственной точки (0, Г), т. е. мы хотим попасть в точку х = 0 через заданное время t = Т. Таким образом, множество S дается соотношением 5={(х(7), Т):х(Т) = 0}. (5.104) Итак, мы рассматриваем задачу с закрепленным концом и с фикси¬ рованным временем (см. § 4.13). Функционал преобразования J (и) опре¬ деляется соотношением т J(«) = j +-§■ “2 (z)] (5.105) о где X (/)—фазовая траектория, удовлетворяющая уравнению (5.100), исходящая из х (0) = 1 и произведенная 1 управлением и (t). 1 X (Л — траектория движения системы, представляющая собой решение диффе¬ ренциального уравнения (5.100), когда и t) имеет вполне определенный вид. 222
Можно сформулировать задачу следующим образом. Найти допустимое управление и (/), переводящее х (0) = 1 в х (Т) = 0 и минимизирующее функционал преобразования J (и). Прежде всего мы видим, что эта задача подобна общей задаче, обсу¬ ждавшейся в предыдущем параграфе. Пространство V представляет собой SJ3 ([0, T], R) — множество всех кусочно-непрерывных функций на [0, Т] (см. § 3.15); подмножество А — совокупность управлений и, переводящих х (0) = 1 в X (Т) = 0. Имеется, однако, дополнительное ограничение, а именно: уравнение системы (5.100). Как увидим далее, для учета этого ограничения используется способ, очень похожий на метод множителей Лагранжа § 5.4. Отметим, что заранее не известно, существует ли реше¬ ние задачи г. Мы просто получим необходимые условия оптимума и затем укажем, что требуется еще доказать его существование. В данной задаче такая необходимость существует. Определим теперь необходимые условия, которым должно удовлетво¬ рять оптимальное управление. Для наглядности мы будем излагать мате¬ риал последовательными частями, нумеруя каждый шаг и сопровождая его эвристическими разъяснениями. Шаг 1. Предположение существования оптимума. Для того чтобы получить необходимые условия, которым должно удовлетворять опти¬ мальное управление, предположим, что оптимальное управление сущест¬ вует 1 2. Итак, считаем, что и* (f) — оптимальное управление и х* (t) — соответствующая ему оптимальная траектория. Иначе говоря, х* (/) и и* (/) удовлетворяют следующим условиям: 1) X* (/) = —х* (/) + w* (/); (5.106) 2) х* (0) = 1, X* (Т) - 0; (5.107) 3) если и (t) — любое допустимое управление, такое, что соответст¬ вующая ему траектория х (/) удовлетворяет условиям 1 и 2, т. е. X (/) = — X (0 + и (/), х(0)=1, х(Т) = 0, (5.108) то т j* = j (и*)=4 J [х*2 +“*2 (/)]dt < о т < J («) = -L j [X2 (t) + и2 (/)] dt. (5.109) ü В дальнейшем все оптимальные величины мы будем отмечать звездоч¬ кой справа сверху. По определению решения дифференциального уравнения (определе¬ ние 3.41) любая кусочно-непрерывная функция, отличающаяся от и* (/) лишь в счетном подмножестве точек на [0, Т], является оптимальным управлением. Для математической строгости мы часто к нашим утвер¬ ждениям должны добавлять фразу «за исключением, возможно, счетного множества точек из [0, Т]»; или мы должны говорить об эквивалент¬ ных классах функций, как в § 3.15. Однако мы, обратив внимание чита¬ теля на это обстоятельство, в дальнейшем будем опускать эти математи¬ ческие тонкости. Шаг 2. Возмущение. Как и при рассмотрении обычного минимума, для получения необходимых условий будем использовать метод возму- 1 В положении такого типа трудно определить, является ли А компактным. Даже в том случае, когда А не является компактным, задача может иметь решение. 2 Оптимальных управлений может быть несколько или не быть ни одного. 223
щений. Давая малые приращения и* (/), найдем условия, которым должно удовлетворять возмущение. Положим, что и (/) = w* (/) + ег] (/), (5.110) где т] (/) — кусочно-непрерывная функция на [0, Т] является возмуще¬ нием, или вариацией и* (/). Часто записывают u(t) = и* (t)+ôu* (/) (5.111) и называют ôu* (/) = ет] (/) (5.112) вариацией и* (/). Если X (/)—траектория, производимая управлением и (/), то в силу аксиомы 4.3 и определения динамической системы (см. § 4.5) можно написать X (t) = х* (/) + еф (/), (5.113) причем ф (/) ограничена на [0, 7]. Другими словами, малая вариация управления дает малую вариацию движения системы. Так как х (t) — решение уравнения (5.100), имеем х(/) = — *(0 + (5.114) = —X* (/) — еф (/) + и* (/) 4- ет) (/); (5.115) из уравнения (5.113) найдем X (/) = X* (/) + 8ф (/). (5.116) Следовательно, ф(О=~Ф(О + п(О (5.117) или, эквивалентно, (Ôx* (/)} = —ÔX* (0 + ôu* (t), (5.118) где ôx* (/) = еір (/) (5.119) есть вариация х* (/), соответствующая вариации ôu* (t) управления и* (t). Потребуем, чтобы возмущенное управление переводило х (0) = 1 в X (Т) = 0, т. е. должно выполняться условие ф(0) = ф(7) = 0. (5.120) В силу (5.117) это означает, что т q(T)=e~T jefri(i)dt = O, (5.121) о и поэтому возмущение ет] (t) не является совершенно произвольным. Например, можно принять, что т] (/) = е~1 cos (-у-), но г] (/) = е~* sin-^ в качестве возмущения рассматривать нельзя. Итак, сообщая управлению w* (/) малые изменения ет] (/), где г] (/) принадлежит к $([0, 7], 7?), т. е. является кусочно-непрерывной функ¬ цией из [0, Т1 в /?, удовлетворяющей соотношению т J e'i](t)dt = 0, (5.122) о 224
устанавливаем, что соответствующие изменений еф (/) траектории х* (і) являются решениями дифференциального уравнения еф(О = —еф(0+ ет](/), (5.123) причем ф(0) = 0. Эти возмущения показаны на рис. 5.6. Шаг 3. Гамильтониан. Перед тем, как вычислять влияние возмущения на величину функционала преобразования J, введем скалярную функ¬ цию Я, называемую гамильтонианом, которая поможет получить искомые необходимые условия. При этом мы введем дополнительную пере¬ менную, которая играет роль, ана¬ логичную множителям Лагранжа в § 5.4. Хотя на данном этапе та¬ кой прием может показаться искус¬ ственным, важность этого понятия будет ясна из дальнейшего изло¬ жения. Итак, будем считать, чтор(/) — некоторая, пока еще неопределенная кусочно-непрерывная функция, кото¬ рую будем называть дополнительной переменной (сопряженной перемен¬ ной, или множителем Лагранжа) х. Так как и х (t), и х* (/) являются решениями уравнения (5.100) в ре¬ зультате воздействия управлений и (/) и и* (/) соответственно, имеем —х (/) — X(t)+ и (/) = 0; (5.124) Рис. 5.6. Возмущения управления и соот¬ ветствующие им возмущения оптимальной траектории —х* (/) — X* (/) + zz* (0 = 0. (5.125) Следовательно, т j р (/) [—х(/) + и (/) —х(/)1 dt = и 7 = J [— р (t) х (О + p(t)u(t) — р (/)х(/)] dt = 0; (5.126) О т J р (t) [—х* (г) 4- U* (О - X* (0] dt = о г - J \-р (/) х* (/) + р (t) и* (t) — p(t) X* (/)] dt = 0, (5.127) о откуда т •/(«) = } + — P(t)x(t) + p(t)u(t) — р(/)х(/)] dt и 0 J(u*) = = J -Ï ±^-р(0^*(0 + р(^)и*(^)-р(0х*(/)] dt. о (5.128) (5.129) 1 Если р (t) определена, то она будет .«отвечать» за ограничения, наложенные урав¬ нением системы (5.100). 8 Атанс и др. 225
Если определить скалярную функцию Н (х, р, и) на R X R X 7?, положив Н (х, р, и) = L (х, и) + р (—х + и) = + р (—х + и\ (5.130) то уравнения (5.128) и (5.129) можно записать в виде т J (и) = J {Н [х (О, Р (0, и (01 —p(t) X (/)} dt\ (5.131) о т J(u*) = j [H [X* (/), р (/), (/)] — p (t) X* (/)} dt. (5.132) о Функцию H часто называют функцией Гамильтона (или просто га¬ мильтонианом). Из уравнений (5.131) и (5.132) непосредственно получим т J (u) — J (и*) = J {H [x(t), р(і), и (t)] — H [х* (t), p(t), «*(/)]} dt + Ü T + Jp (t) [X* (/) — x (/)]<//. (5.133) 0 Шаг 4. Вычисление J (и) — J (и*). Вычислим влияние возмущения на величину J. Сделаем это, используя различные уравнения возмущений шага 7, определение 7/, разложение Н в ряд Тейлора и интегрирование по частям. Прежде всего заметим, что для малого е справедливо H [X (/), р (/), и (/)] = H [X* (/), р (/), ц* (/)] + + [X* (/), р(0. [X (0-х* (01 + + [х* (t), p (t), и* (/)] [U (t)-и* (/)] + о (е) = (5.134) = H [X* (t), p (t), (/)] + [X* (t), p (/), u* (/)] eip (t) + + [X* (t), p (t), u* (/)] er] (/) + O (e), . (5.135) где O (e) — член, обладающий свойством lim °--- = 0, E->ü 6 и x(/) — X* (/) = (/); Ц(/) —w*(/) = 8T](0 (5.1369 по уравнениям (5.110) и (5.113). Далее, так как X* (/)— х(/) = —еф (/), (5.137) из уравнения (5.133) следует, что /(«) —J(«*) = e j{^-[x*(O, р(0, «*(0W(0 + Ô + [X* (0, P (0. u*(/)] n(o]^-e J р(01>(0^ 4- o(e). (5.138) 226
Упражнение 5.9. Запишите уравнение (5.138) через бх* (/), и* (t) и -^-бх* (/) и дока- dt . « дн ГЛ жите, что в этом уравнении будет отсутствовать член, содержащим , Почему в уравне- т нии (5.138) можно писать о (е) вместо J о (е) dt, как это следовало бы из (5.124)? У к а- о з а н и е: установите не является ли о (е) членом вида £2/(/), где f (/) — ограниченная кусочно-непрерывная функция /? Интегрирование по частям последнего слагаемого (5.138) позволяет получить 7 —J р (/) ip (t)dt - и т = р (0) (0) - р (Т) ф (л + Jpm (t)dt = <5-139) о т = J р (/) (/) Л (5.140) по уравнению (5.120). Итак, имеем (т 1Х* (/), р(/), u*(/)] + p(/)U(/)d/ + и ' т \ + J^k*(O. Р(0, U* (01 П(0 + 0(8), (5.141) о / где функция р (t) все еще не определена. Так как и* — оптимальное управление, то должно выполняться нера¬ венство J(u) —7(ц*)^0. (5.142) Поскольку 8 может быть как положительным, так и отрицательным, а членом О (е) можно пренебречь (см., например, упражнение 5.2), то получим, что (т j£k*(O. Р(0. u*(01 + P(0U(0^ + т \ + J к* (0. Р (0, «* Ц)1 Л (0 di j = 0. (5.143) о / Здесь мы впервые воспользовались оптимальностью и*, и поэтому урав¬ нение (5. 143) является предварительной формой искомого необходимого условия. Шаг 5. Дифференциальное уравнение для р (t). Сформулируем усло¬ вия, которым должна удовлетворять функция р (t). Потребуем, чтобы р (/) удовлетворяла определенному дифференциальному уравнению. Для того чтобы полностью определить р (/), останется лишь выбрать начальное условие р (0). 227
Потребуем, чтобы р (/) было решением линейного дифференциального уравнения вида Р(О=-^[х*У), Р(і), «*(0]= (5.144) = — (5.145) Во-первых, мы видим, что однородные части уравнений (5.145) и (5.106) являются сопряженными согласно определению § 3.25. Во-вторых, из уравнений (5.143) и (5.144) следует, что 7' J [X* (/), р (/), и* (/)] Î] (/) dt = О, (5 146) о когда р (/) есть решение уравнения (5. 144). В-третьих, х* (/) есть решение дифференциального уравнения і*(0 = ^[х*(0, Р(0, «*(/)!• (5.147) Таким образом, как х* (/), так и р (f) являются решениями диффе¬ ренциальных уравнений, в которые входит гамильтониан Н. Шаг 6. Основная лемма. Итак, получено соотношение (5.146), которое должно выполняться для каждой кусочно-непрерывной функции т] (/), удовлетворяющей соотношению (5.122). Какие условия оно накладывает на [х* (/), р (/), и* (/) 1? Мы сможем ответить на этот вопрос с помощью следующей леммы. Лемма 5.1. Пусть h (/) — кусочно-непрерывная функция на [0, Г]. Предположим, что т j h(t)a(t)dt = 0 (5.148) о для всех кусочно-непрерывных функций а (/) на [0, Т], удовлетворяю¬ щих условию т Ja(/)dZ = O. (5.149) и В этом случае h (/) — постоянная величина на [0, Т], т. е. ft(/)=c, /00, Т\. (5.150)1 Доказательство. Так как ft (/) кусочно-непрерывна, существует с из R такое, что т J h(t) dt = сТ. (5.151) и Если т J [ft(0 — с] d/ = 0, (5.152) и то функция а (/) = h (t) —с кусочно-непрерывна и удовлетворяет условию (5.149). 1 За исключением, возможно, счетного множества А точек из [0, Г]. 228
Таким образом, т — c]dt = 0 (5.153) о и т J — c\h(t) — c]dt = 0. (5.154) ô Из последних двух уравнений следует: 7' j‘[/i(/) — c]2dt = 0. (5.155) û На основании теоремы 3.8е получим h(t) — с = 0 (5.156) (за исключением счетного подмножества А точек t из [0, TJ), что и дока¬ зывает лемму. Если принять л(/) = е-*а(/), (5.157) гдеа (/) — любая кусочно-непрерывная функция, удовлетворяющая(5.149), то уравнение (5.146) запишется в виде т JIх* (О- Р(0> и* (t)]e-la.(t)dt — 0, (5.158) о откуда на основании леммы получим [%*(/), p(i), u*(/)] = е‘с, (5.159) где с = const. Шаг 7. Необходимое условие. Сформулируем искомое необходимое условие. Покажем, что существует решение р* (/) уравнения (5.145) такое, что функция Н [х*(0, Р* (0> и] по и имеет абсолютный минимум при и = и*. Пусть р (t) — решение уравнения (5.145), причем р (/) =0, тогда р(0 = —е'р-’х*(т)4т. (5.160) о Из выражения (5.159) следует, что существует постоянная с*, для которой -^-[х*(0, р(0, «*(01 = «*(0 + p(t)=e'c*. (5.161) Иначе говоря, t и* (0 — et J e~xx* (n)di: = efc* (5.162) о или, эквивалентно, t и* (0—etc* — et J £~Tx* (т)гіт == 0. (5.163) и 229
Будем считать функцию р* (/) единственным решением уравнения (5.145) с р* (0) = —с*, т. е. t р* (t) — — efc* — J е~~тх* (т) du. (5.164) о Рис. 5.7. (и) имеет абсо¬ лютный минимум при и — В этом случае гамильтониан Н [х* (/), р* (/), и], рассматриваемый как функция и, имеет абсолютный минимум при и = и* (t) для / из [0, Т]. Это утверждение надо понимать следующим образом: предположим, что — некоторый элемент из [0, Г], тогда х* (/J и р* (/г) — вполне опре¬ деленные числа, и мы можем рассматривать действительную функцию Hг (и) действительной переменной и, опреде¬ ленную как НА (и) Н [х* (/J, р*(/|), z/]= (5.165) = ^ÙL+-^ + p*(/I)[-x*(/1)+u]- (5.166) Наше утверждение сводится к тому, что и = и* (/х) есть абсолютный минимум ATj (и). Это утверждение иллюстрируется с помощью рис. 5.7. Для доказательства сделанного утвержде¬ ния прежде всего отметим, что H [х* (t), и] = + ^ + р* (t)l-X* V) + и] (5.167) представляет собой параболу, имеющую локальный минимум, являющийся одновременно и абсолютным минимумом. Если G (и) = Н [х* (/), р* (/), и], то tFI—“,<Z)1= <5Л68> = U* (0 4- p* (0 = (5.169) t = u*(t)— efc* — e* Çe-Tx*(т)б/т == (5.170) о -0 (5.171) на основании уравнений (5.163) и (5.164). Далее, >>°. <5Л72> так что и = и* (/) действительно является минимумом функции G (и) = = Н [х* (/), р* (/), и], и наше утверждение доказано. В заключение рас¬ смотрим следующую теорему, которая представляет собой искомые необ¬ ходимые условия для нашего примера. Теорема 5.2. Пусть и* (/) — допустимое управление, переводящее X (0) = 1 в X (Т) = 0. Необходимым условием оптимальности управления и* (/) является существование функции р* (/) такой, что: а) если X* (/) —траектория, соответствующая и* (/), то х* (/) и р* (/) являются решениями системы уравнений х*(0 = -^к*(0. Р*Ю, «*(01; дн (5.173) Р* (0 = ^-к* (О, Р* (О. «*(/)!• 230
б) функция Н [х* (/), р* (/), и], рассматриваемая как функция и, имеет абсолютный минимум при и = и* (/) для t из [О, Г], т. е. min Н [%*(/), р* (/), и] = H [X* (/), р*(/), ц*(/)]. (5.174) Дадим интерпретацию теоремы 5.2. Заданы оптимальное управление ц* (7) и соответствующая ему оптимальная траекториях* (/)для любого t из [О, Т]. Первая часть теоремы 5.2 гарантирует, что существует функ¬ ция р* (/), являющаяся решением уравнения (5.173), соответствующая X* (t) и и* (/). Таким образом, в каждый заданный момент времени, например, на интервале [О, T ], х* (/х), р* (/J и и* (/х) — это три вполне определенных числа. Вторая часть теоремы 5.2 утверждает, что число Н [х* (/х), р* (/J, ц* (/J] меньше или равно числу Н [х* (/г), р* (/J, г], где г — любое действительное число. Эта теорема, являющаяся для нашей задачи принципом минимума Понтрягина, в дальнейшем будет обобщена. Перед тем как подвести некоторые итоги и показать возможности практического использования необходимых условий, рассмотрим функцию Н [х* (/), р* (/), и* (/)]. В частности, имеем = **(0 + ^-| Р*(0 + ^г| «*(0, (5.175) U.4 ил I Up I UU [ где знак |* обозначает, что производные должны вычисляться при [х* (/), р* (/), ц* (/)]. Из уравнений (5.168), (5.171) и (5.173) следует, что Р* (/), ц* (/)] = 0, (5 л 76) и поэтому Н [х* (/), р* (/), и* (0 ] есть величина постоянная. Иначе говоря, для данной задачи гамильтониан Н вдоль оптимальной траектории — величина постоянная. Итак, мы начали с предположения, что оптимум существует; после этого подали возмущение на управление и рассмотрели результат воз¬ действия возмущения на траекторию. Затем мы ввели гамильтониан Н и дополнительную переменную р, которая в дальнейшем играла роль, аналогичную роли множителя Лагранжа. Далее мы выразили через га¬ мильтониан воздействие возмущения на величину J и потребовали, чтобы наша дополнительная переменная была решением линейного дифферен¬ циального уравнения; доказали лемму о функциях с нулевыми интегра¬ лами и, наконец, получили необходимые условия, устанавливающие воз¬ можность определения такой дополнительной переменной, при которой оптимальное управление минимизирует гамильтониан Н, рассматриваемый как функцию от и. Таким образом, мы свели задачу минимизации функ¬ ционала к обычной задаче отыскания минимума. Очень часто такое све¬ дение имеет большое практическое значение в решении задач управления. Посмотрим, как можно использовать необходимые условия тео¬ ремы 5.2. Прежде всего теорема устанавливает, что оптимум представляет собой решение х* (/), ц* (/), р* (/) уравнений (5.173) и (5.174), т. е. ’ х* (о=[**е). р* (о. «* (оі = - ** (/)+и* (0; (5.177) р*(/) = -^-[х*(0, р*(о, и*(/)1 = Р*(/)-х*(0; (5.178) min H [X* (/), р* (/)■ и] = H [X* (/), р* (0, «* (01 (5.179) и И х*(0)=1, х*(Т) = 0. (5.180) 231
По определению //, уравнение (5.179) можно записать в виде ^_X*2(Z) + _^U*2(Z)+p*(Z)[_x»(Z)+ U*(Z)] <^х*2(/) + 4-«2 + Р*(О1-^*(^) + «] (5.181) для всех и. Неравенство (5.181) эквивалентно соотношению -^ «*’-(/)+ р*(/) и* (/)< -^-и2 +р*(і)и, (5.182) откуда, в свою очередь, следует равенство u*(t) = — p*(t). (5.183) Отметим, что так как ^-[%*(/), Р*(О, «*(01 = 1, (5.184) уравнение (5.183) можно также получить из соотношения -g-[x*(O, P*U), u*(t)] = u*(t) + p*(t) = O. (5.185) Таким образом, решения уравнений (5.177), (5.178) и (5.183), удов¬ летворяющие граничным условиям (5.180), определяют оптимум. По¬ пытаемся найти все решения этих уравнений. Иначе говоря, мы хотим знать все три функции х (/), р (/), и (/), для которых х(/)-_=—%(/)-(-£/(/); (5.186) р(/) = р(/)-х(/); (5.187) u(t) = —p(t); (5.188) и х(0)=1, х(Т) = 0. (5.189) Итак, мы ищем решения системы x(t)= — x(t) — p(ty (5.190) ЙО = р(/) — х(/) с граничными условиями х (0) = 1 и х (Г) = 0. Решение такой системы единственно и выражается формулой х(/) = ^1_(х(0)[(/2 + 1)е-^ + + (/2 — 1)е^] +р(0)(е-і^'—(5.191) + р(0)[(/2- +(У2+ 1)е^ф, где х(0) =--- 1 и р(0) = -0<2+.1).е~^Г +j^~ l)g-'---. (5.192) eY —е у 232
Следовательно, если решение задачи управления существует, то оно должно иметь вид u*(t) = —zL. L- К2Г + (Г2+1>е-^ + (К2-1)Л;.7.. х ’ 2/2 I еѴ‘2Т _е-Ѵ2Г X [(]/2— 1)6-^' + (Vî + 1)«Г2/]|- (5.193) Таким образом, если мы докажем, что решение нашей задачи сущест¬ вует, то управление и* (/) выражается формулой (5.193). В последующих главах будут приведены другие примеры использования необходимых условий при определении оптимальных управлений. Упражнение 5.10. Требуется показать, что уравнение (5.191) действительно пред¬ ставляет собой решение системы (5.190), удовлетворяющее заданным граничным условиям. Используйте метод преобразования Лапласа, рассмотренный в § 3.23. Упражнение 5.11. В шаге 3 введите функцию Н (х, р, и), заданную как Н (х, р, и) = — L (х, и) + р (— X + и) вместо Н (х, р, и), и получите следующие необходимые условия. Пусть и* (/) — допустимое управление, переводящее х (0) = 1 в х (Т) = 0. Для опти¬ мальности и* (/) необходимым условием является существование функции р* (/) такой, что а) если X* (t) — траектория, соответствующая и* (/), то х* (/) и р* (/) — решения системы уравнений /(() = (X* (t), р* (t), и* (0]; ~ (5.194) ?(О = (О, 'р*(Ѵ> «*<0]; б) функция Н [х* (/), р* (/), и] имеет абсолютный максимум по и при и = и* (/) для t из [0, Т], т. е. max Н [х* (/), р* (/), и] = H [х* (t), р* (/), и* (£)]. (5.195) и Таким образом, наши необходимые условия могут быть получены как принцип макси¬ мума, а не минимума. Покажите, что отыскание решений уравнений (5.194) и (5.195) дает управление и* (0 в соответствии с формулой (5.193). ВАРИАЦИОННЫЙ ПОДХОД К ЗАДАЧЕ УПРАВЛЕНИЯ 5.7. НЕОБХОДИМЫЕ УСЛОВИЯ ДЛЯ ЗАДАЧИ С НЕЗАКРЕПЛЕННЫМИ КОНЦАМИ После общих замечаний, высказанных в § 5.5 и примере § 5.6, мы подготовлены к решению задачи управления на основе вариационных методов. Рассмотрим задачу с незакрепленным концом, минимизируя коор¬ динаты конечного состояния («стоимость»). Мы не встретим трудностей при доказательстве того, что оптимальное управление для этой задачи должно экстремизировать гамильтониан. Затем введем вторую производ¬ ную и эвристически покажем, что экстремум гамильтониана должен быть минимумом. В следующем параграфе необходимые условия будут усилены для получения локальных достаточных условий, которые окажутся полез¬ ными в гл. 9. Далее кратко рассмотрим задачу с закрепленным концом и отметим определенные трудности, возникающие из-за того, что вариации управления должны удовлетворять соотношениям, аналогичным (5.122). Для того, чтобы преодолеть эти трудности, мы должны изменить наше представление о задаче управления, что и приведет нас к принципу мини¬ 233
мума Понтрягина. Ниже наши рассуждения будут нестрогими. Более строгие доказательства приведены в соответствующей литературе х. Сформулируем поставленную задачу. Рассмотрим динамическую си¬ стему x(t) = f[x(t\ /], (5.196) где x(t) и f — /г-мерные векторы и u(f)—m-мерный вектор, причем О </л < п. Будем считать, что рассматриваем задачу без ограничений (см. § 4.13), т. е., что любая кусочно-непрерывная функция является допустимым управлением. Пусть tQ — начальное время и х(/о) = лго (5.197) является исходным состоянием системы. Множество S имеет вид Rn X X {/х}, где — заданное время, tx > /0. Другими словами, конечным состоянием может быть любой элемент из Rn. Пусть L(x, а, /) и К(х) (5.198) — «достаточно» дифференцируемые действительные функции. Рассмотрим функционал J (и), определенный как G J(u)= Kprft)] + J Ь[х(0, «(0. t]dt, (5.199) to где X (Z)—траектория, удовлетворяющая уравнению (5.196), начинаю¬ щаяся из х(/0) = и произведенная управлением и. Итак, задача формулируется следующим образом: Найти допустимое управление и (t), минимизирующее функционал J (и). Такая задача называется задачей с незакрепленным концом и фик¬ сированным временем. Мы получим необходимые условия, полностью аналогичные условиям теоремы 5.2, и будем двигаться шаг за шагом, точно так же, как и в § 5.6. Шаг 1. Предположение существования оптимума. Пусть а* (/) — оптимальное управление и х* (/) — соответствующая оптимальная траек¬ тория. Другими словами, а* (/) и х* (/) удовлетворяют условиям 1) x*(t) = /[ѵ*(/), а*(/), /]; (5.200) 2) x*(t.) = xQ, (5.201) 3) если и (t) — любое допустимое управление, причем соответствую¬ щая ему траектория начинается в точке х (/0) = х0, то t1 J* = J(u*) = H- JL[x*(t), и* (t), t]dt <J(u) = to tl = K{x(t1)] + L[x(t), u(t), t]dt. (5.202) tQ Шаг 2. Возмущение. Дадим возмущение управлению й* (/), положив й(/) = д*(/)^еп(/)_ (5.203) Если X (/) — траектория, производимая управлением и (/), то мы можем написать х(/) = X* (/) + 805(/), (5.204) 1 См. строгие доказательства в [179], [228]. (Прим. ред.). 234
так как малая вариация управления приводит к малой вариации дви¬ жения системы. Так как x(t) — решение уравнения (5.196), имеем х(/) = /|х(/), «(/), Л = (5.205) = /|х*(О + ед5(/), и*(/)4-8П(/), /]. (5.206) Дифференцируя выражение (5.204), получим а:(/) = x*(t) + еф (/). (5.207) Разлагая f\x* (t) J- eg6(/), «*(/) +ei] (/), /] в ряд Тейлора, найдем f\x* (/)-f-8$(0, «*(/) +ет](/), Л = =/іх*(/), «*(о, л+4rLe$(z)+^Len(z)+ о(е)’ (5-208) где -^-1 — якобиан f по х, вычисленный при \х* (t), и* (f), t] [см (3.87)]; — якобиан f по а, вычисленный при [х* (/), а* (/), Н, и О (е) - вектор, удовлетворяющий условию !іт-^Д= 0. (5.209) е->0 8 Вертикальную черту со звездочкой внизу мы будем в дальнейшем использовать для обозначения того, что функция должна вычисляться вдоль оптимальной траектории. Из уравнений (5.206) и (5.208) следует, что e$(0 = -^L<W) + #|.>”1(0+О(8), (5.210) или, эквивалентно, в”'»-|.Ч<-')+ (5.211) Так как траектория х (/) начинается в точке х (t0) = х0, то должно быть $(М = 0. (5.212) Предположим, что ф (/) — решение линейного уравнения <5’213> где Wo) = 0; (5.214) отсюда следует \ что x(t) = х* (/) + гф(/) = х* (/) + 8ф(/) + О (е), (5.215) и поэтому в дальнейших вычислениях мы часто будем заменять х(/) на X* (/) + 8ф (/) вместо более строгого выражения лг* (/) + ьф (/). Упражнение 5.12. Пусть член о (s) в уравнении (5.210) имеет вид е2ЛІ (/), где М (/) — ограниченная функция. Требуется доказать соотношение (5.215). Указание: рас¬ смотрите функцию ф (t) — ф (/), причем 1 [ф (О — ф (01 + + еЛІ (0; Ф (^о) — М5 (^о) = После этого найдите || X*(Z) + &ф (t) — [х* (t) + £ф (/)] ||. 1 См. [179]. Отметим, что выражение (5.215) может быть строгим без дополнитель¬ ных предположений (см. упражнение 5.12). 235
Шаг 3. Гамильтониан. Введем в рассмотрение гамильтониан и допол¬ нительную переменную. Пусть p(f) — некоторая, пока еще неопределен¬ ная, кусочно-непрерывная n-мерная векторная функция, которую будем называть дополнительным или сопряженным вектором. Так как и х(/), их* (t) являются решениями уравнения (5.196), имеем f[x(t), u(t), t\ — х(/) = 0; (5.216) f[x* (Z), а* (0, И — х*(0 = 0. (5.217) Тогда G f (р(0. u(t), t]—x(t)} dt = to tl tt = /І-m u(t), t])dt-\(p(t), x(t))dt- (5.218) to tn tl J (p(t), f \x* (t), u*(t), t] — x*(t)', dt = to '1 f' = J <p (/),/[** (0, #*(0, x*W;dt (5.219) to tn и, следовательно, ti J(U)= К[х(А)] -у $ {L[x(t\ u(t), t] + (p(t), f[x(ty u(t), /]) — to X(t))}dt (5.220) и G J(«*) = K[x*('i)] + f {L «*(0. Л + (Р(О. «*(/), /])- 10 — (p(t), x*(t))}dt. (5.221) Если определить скалярную функцию H (х, р, a, t), положив Н (х, р, u, t) — L(x, u, t) 4- (p, fix, u, t)), (5.222) то уравнения (5.220) и (5.221) можно записать в виде G J(u)= Klxtt,)] + f {H(x(t),p(t),u(t), t] — (p(t), x(t))}dt (5.223) to и G J(u*) - K |x* 0 4- J {H\x*(t), p(t), u*(t)]—{p(t), x*(t)}} dt. (5.224) 10 Функцию H называют гамильтонианом. Непосредственно получим, что вариация функционала имеет вид G J(u)-J(u*)=[K[x(t1)]-K[x*(t)]} + \ {Hlx(a p(tl 10 tl — H \x* (t), p(t), «*(/)]}d/ 4- J (p(t), x*(l) — x(t))dt. (5.225) to 236
Шаг 4. Вычисление разности J(a) — J (а*). Вычислим влияние воз¬ мущения на величину J. Для этого используем различные уравнения возмущений шага 1, определение Н, разложение в ряд Тейлора и интег¬ рирование по частям. Прежде всего, если 8 мало, то H |x(Z), р(/), #(/), t] = И |х*(/), р(/), #*(/), t] + + |х(/)-x*(z)l/ + \4r|.p’ І«(0-«*(01) + О(8). (5.226) где -^-1* обозначает градиент Н по х, вычисленный при \х* (/), р (/), а* (/), /], и |* — градиент Н по и, вычисленный при [х* (t), р (/), а* (/), /]. С помощью уравнений (5.203) и (5.215) получим //[х(0,Р(0, «(/),/] = // [лг*(/), р(/), «*(/), /Н- е/^-І (5.227) Далее из выражения (5.215) найдем К |х(/і)] = К[х*(/і)] + х(^~ х*(Л)^> + О(е) = = К \х* (ZJ] 4- + О(е)’ (5.228) где —j обозначает градиент К по х, вычисленный при х* (/J. Затем из уравнений (5.210) и (5.213) определим = eij, (/) + е -g- j, [#(/) - ^(/)] + О (в). (5.229) Откуда при помощи выражения (5.215) получим едб(/)= 8г|)(0+ 0(4 Таким образом, х* (Z)— X (Z) = — еір(/) + О(е). (5.230) (5.231) Подставляя полученные соотношения в выражение (5.225), получим /(«) —У(и*) = е/-^^, 4(/і)\ + ej t(0>^ + to fl ’ fl + e f(p(O, 0(8). (5.232) ! * P / j 10 f 0 Проинтегрируем член выражения (5.232), содержащий ф (/), по частям: fi f {P (/), ф(t) > dt = (P (Л), ф (Z,)) - {P (Zo), -Ф (/0)) - to fl — J (₽(0> (5.233) fo 237
Так как ф (/0) = 0, уравнение (5.233) можно записать в виде + е J [<^-|> + Р(/)’ '*’(Z)/ + \^I^ 0(8). (5.234) ^0 где /г-мерный вектор р (t) все еще не определен. Так как и* —оптимальное управление, то J(u) — 7(и*)^0 (5.235) и поэтому по аналогии с § 5.6, получим G 1.-р''>>' Ч’<'‘>/ + П\5ГI■ р''>■ f<z>/ + <о L + \Sr|v П('Л>р = °. (5.236) Шаг 5. Дифференциальное уравнение для р (t). Сформулируем усло¬ вия, которым должна удовлетворять функция р (/). Прежде всего потре¬ буем, чтобы она была решением дифференциального уравнения = Р<Л /]= (5.237) = <5-238> где —якобиан f по лг, а штрих (') обозначает транспонированную матрицу. Уравнение (5.238) есть линейное дифференциальное уравнение относительнор (t). Однородные части уравнений (5.238) и (5.213) являются сопряженными (см. определение § 3.25). Далее, из уравнений (5.236) и (5.238) следует: 1 = (5.239) to где p (t) — решение уравнения (5.238). Так как Н (х, р, и, t) = L (х, и, t) + (p, f(x, и, t)), имеем также х*(/) = /[х*(0, «*(0, t]= ^-lx*(t), p(t), /]. (5.240) Таким образом, опять обе функции х* (0 и p(f) являются решениями дифференциальных уравнений, содержащих гамильтониан Н. В отличие от задачи § 5.6 дополнительную переменную можно опре¬ делить полностью благодаря наличию в уравнении (5.239) члена, вклю¬ чающего конечную стоимость. Итак, будем считать, что/?* (/) является (единственным) решением уравнения (5.238) с граничным условием (5.241) Если принять: /НО. «’(O. '1. (5.242) 238
то из уравнений (5.239) и (5.241) можно заключить, что g Л(О)>Л = 0 (5.243) t о для всех кусочно-непрерывных функций т] (/). На следующем шаге из уравнения (5. 243) мы получим, что и* (f) есть экстремум Н [х* (/), р* (/), а, /], если Н рассматривать как функ¬ цию и. Далее мы получим, что этот экстремум должен быть минимумом. Для этого нам понадобится вторая вариация J, Шаг 6. Основная лемма. Докажем теперь следующую лемму. Лемма 5.2. Пусть h (/) — кусочно-непрерывная функция на и предположим, что G [/о, *11 J (й (/), а(/)) dt = 0 10 для всех кусочно-непрерывных функций а (/) на [/0, Тогда (5.244) Л(/) = о, te [/о, М. (5.245)1 Доказательство. Прежде всего из леммы 5.1 следует, что постоянная, т. е. h(t) = с\ te По, ^11- А(0- (5.246) Для доказательства этого заметим, что если (/) — любая кусочно¬ непрерывная функция, удовлетворяющая условию G Ja1(/)d/ = O, (5.247) to то полагая (5.248) О получим ~ ~ (Л(0, = ^і(0аі(0 (5.249) и G G J (ft (Z). a1 (t))dt = h^a^tjdt = 0. (5.250) Ï» to Таким образом, hr (f) = const = на [/0, /J по лемме 5.1. Анало¬ гичным образом можно показать, что каждая компонента h (/) есть по¬ стоянная величина на Ио, М- Но если с Ф 0, то можно выбрать функцию a(/) = f=^0 (5.251) такой, чтобы получить противоречие G G G J (Л (0, а (/)) dt = J (с, с) dt = J II с ||2 dt > 0; (5.252) t O G to это и доказывает лемму 5.2. 1 За исключением, возможно, счетного подмножества А из [/0, £х]. 239
Из леммы и уравнения (5.243) непосредственно следует, что = (5'253) Итак, Н [л:* (/), р* (/), и (t), /], рассматриваемая как функция и, имеет экстремум при и = а* (/) для t из [/0, /х]. Последний вывод пони¬ мают следующим образом: Пусть t — некоторый элемент из [/0, тогда х* (t) и р* (/) — вполне определенные векторы, и мы можем рассматривать действитель¬ ную функцию Н (и) от m-мерного вектора а, определенную как Н (и) == H [х* (t), Р*(0> Л- (5.254) Тогда и = a* (t) является экстремумом Р(а). Шаг 7. Необходимое условие. Как мы видели в § 5.5, необходимым условием того, чтобы экстремум функционала являлся его минимумом, служит неотрицательность его второй вариации [см. условие (5.98)1. Используем это обстоятельство. Предположим, что вторая вариация ÔV (а*) существует и 0Ѵ(и*)> 0. (5.255)1 Найдем ÔV (а*) в явном виде и используем формулу для получения (эвристическим способом) аналога теоремы 5.2. Во-первых, напомним, что #(/) = а* (0 + Eî] (0- (5.256) Во-вторых, предположим, что х(і) = x*(t) -b Еф(0 4- e2ê(Z) + о (е2), (5.257) где ф (/) — решение линейного дифференциального уравнения + (5.258) и Фао)-О; = (5.259) В-третьих, напомним, что приращение функционала выражается формулой J(u) - = К [х(/х)] — К [X* О + 4 J IH р* (t), и(Г), t]-H [х* (Z), p* (Z), «* (Z), /1} dt + t» il + J (P*(0. x*(0 — (5.260) to где p* (t) — решение дифференциального уравнения P*(0 = ~(5.261) удовлетворяющее граничному условию (5.262) 1 Далее, при обсуждении принципа минимума, мы увидим, что этого упрощения не требуется для получения искомого результата (см. теорему 5.3). 240
Теперь докажем, что вторая вариация определяется соотношением ô2J(«*)(« — «*) г|5(Л)\ + (5.263) д2К \ , дК „ ч где -ч-^г —якобиан — по х, вычисленный при х*(Л); ОХ* I ОХ ’ ‘ 4“т-| —якобиан по X, вычисленный при [лег* (/), р* (/), а* (/), /]; ох* I ОХ ’ 1 ѵ X X X - —якобиан 4" по «.вычисленный при [х* (t), р* (t), и* (/), /]; —якобиан пох, вычисленный при [х* (/), р* (/), а* (Л, Л и ох \ ou / I OU 1 V X /' 1- X /' X /' 3 якобиан по и, вычисленный при |х*(/), р* (/), #*(/), Л1- 1 Для иллюстрации принятых обозначений предположим, что п — 3, т — 2, и запи¬ шем в развернутой форме правую часть уравнения (5.263): Выделенные блоки матрицы, содержащей Н, соответствуют различным якобианам, входящим в уравнение (5.263). Фі (/і) ф2 (^і) Ч'з (^і) ~ д2К с)х~ д2К 1* д2К 1* дхі дх2 dxY дх3 * д2К I д2К д2К 1* дх2 дх, 1* дхі дх2 дх3 * д2К I д2К 1 д2К дх3 дх і 1* дх3дх2 2~ 1* дх^ * _ Фі (Л) ф2 (/]) фз (^і) - д2Н 1 д2Н 1 дг” 1 і д2Н 1 д!ІІ 1 ■ дх^ дХ' дх2 1* дхх дх3 L 1 дх, ди 1 1* дХі ди2 1* 1 1* 1 д2Н 1 д2И 1 д2Н 1 ! д2Н I 1 д2н 1 дх2 дх! * дх^ дх2 дх3 1* 1 дх2 ди 1 1 * дх2 ди2 1* 2 1* 1 д2Н 1 д2Н 1 д2Н I 1. дгН 1 1 д2Н I дх3 дхг 1* дх3 дх2 1* дх2 ! дх3 дих 1* дх3 ди 2 1* з I* 1 — - - 1. д2Н 1 д2Н 1 1 д2Н 1 ! д2Н 1 д2Н I dut дхі 1* dui дх2 ди% ди t ди2 1* 1 1 1 1* д2Н 1 д2И 1 д2н 11 д2Н • 1 д2Н 1 ди2 дхі 1* ди2 дх2 1* ди2 дх3 ди2 dut 1* ди^ 1 2 1* . 241
Следующие вычисления совместно с соотношениями (5.261) и (5.262) и с учетом того, что 1 =0, доказывают справедливость уравнения (5.263): X I* / + ^-/8i|5(/1) + e2I(/1), -g-|jei|,(/1) + e2|(/])]\+o(82)= (5.264) = e\^r| ’ + 82\1f| ’ + + 4 <4 (U > t (Л)) + ° (e2); (5-265) G j(p(O> x*(t) — X(t)}dt = (pttj, x*(t1) — x(tl)) — to t — $ {p(t), x*(t) — x(t))dt = (5.266)1 <0 = e(-p(/1), -ф (/,)> -f-e2 <—p (/x), I('i)) + + 8 j (p (/), (/)) dt + 82 J {p (/), I (0> dt + o (82); (5.267) p*(t), u(t), /] - H [л* (/), />*(/). «*(/), /] = =<<L ”»<')+'!б«>+<4£- L- '”('>>+ + 4 /et (0 + e2l (0. J, let (0 + (01> + + 4<84(0 + 82|(^ -4«)|ЛП(^)> + + 4\et’<Z)’ ^(^r)|j8t(0 + e2|(0|/+ O(e2)= (5.268) Так как мы приняли, что ô2J (zz) >0 и 82> 0, то /ш), 4Ц'ч,(/і)>+ д2Н I I д ( дН \\ Т I ^L| Ln(oJ/ - дх \ ди J I, ! ди2 I, J (5.270) 1 Так как x* (t9) = X (Ze). 242
для всех т] (/) 0. Прежде всего заметим, что в силу уравнения (5.258) и условия гр (/0) = 0 малые изменения т| (/) будут вызывать малые изме¬ нения гр (/). Обратное утверждение несправедливо; иначе говоря, можно выбрать больше изменения т) (/), для которого гр (/) будет мало. Причина этого в том, что т] (/) есть вход (или управление) системы с переменными параметрами, которая вначале находится в покое и выход которой равен гр (0* Это положение иллюстрируется рис. 5.8. Таким образом, для того чтобы неравенство имело место, члены уравнения (5.270), содержащие т] (/), должны быть положительны. В частности, член (5.271) «наиболее» зависим от т] (/), и поэтому он должен быть положительным для всех т] (t) 0. Очевидно, это возможно лишь в том случае, когда l(t) Рис. 5.8. Возмущение управления т| (/) воздействует на линейную систему гр (/) = I гр (t) 4- I т)(/). «Большому» сигналу т] (/) может соответ- I* uU I* ствовать «малый» 1|> (/) д2 H I матрица | положительно определенна 1 для t из [/0, /х]. Но если I положительно определенна, (5.272) то экстремум Н [х* (/), р* (/), и, /], рассматриваемый как функция от а, при и = и* (t) является минимумом. Таким образом, эвристически дока¬ зана следующая теорема. Теорема 5.3. Пусть a* (t) — допустимое управление и х* (/) — траек¬ тория системы (5.196), соответствующая а* (/), исходящая из х0 [т. е. х* (^о) = ко 1 • Необходимым условием оптимальности а* (/) является существование функции р* (/) такой, что а) х* (/) и р* (/) есть решения системы уравнений р* (о = —і** (о. р*(о. «*(0. и. (5.273) (5.274) удовлетворяющие граничным условиям X* (Ц = -Ѵо; Р* (/і) = -^-[х* (/,)!; б) гамильтониан Н [х* (/), р* (/), и, /], рассматриваемый как функ¬ ция и, имеет минимум (возможно локальный) при и = а* (/) для t из Прокомментируем эту теорему. Во-первых, мы не доказали ее строго; однако строгое доказательство, опирающееся на вариационные методы, довольно сложно, требует различных предположений (например, соответ- 1 См. § 2.15. 243
ствующую дифференцируемость функций) и, во всяком случае, находится вне рамок настоящей книги. Во-вторых, в противоположность теореме 3.2 мы показали лишь, что и — и* (t) является локальным минимумом Н 1-Ѵ* (О, Р* (О, ^1- На практике, как мы это увидим при обсуждении принципа минимума, и = и* (t) является абсолютным минимумом Н [лг* (/), р* (/), и, t], Таким образом, можно обнаружить необходимость другого математического аппарата, помимо основных вариационных принципов. Действительно, в последующем параграфе, где рассматривается задача с закрепленным концом, обнаружится трудность доказательства того, что оптимальное управление экстремизирует Н. Это и определит необходи¬ мость искать новый подход к решению подобного рода задач. Наконец, заметим, что полная производная от Н по времени вдоль оптимальной траектории равна частной производной Н по времени: dH [X* (/), р* (О, а* (О, / дН I , di I/ Х (0/ + <'’/ + <-гг “• <'>> + 4?-1. - <5-275> на основании уравнений (5.273) и (5.253). Это означает, что если Н от t явно не зависит, то Н постоянна вдоль оптимальной траектории [сравните с (5.176)]. Пример 5.8. Для иллюстрации характера трудностей, возникающих при проведении строгого доказательства вариационными методами, покажем, что из соотношения (5.270) для частного случая п = т — 1, т. е. случая, когда х (t) и и (t) являются скалярными функциями времени. Запишем уравнение системы х(0 =f[x(i), и (t), /]. д2Н I следует неотрицательная определенность - Уравнение возмущения (5.258) примет вид Ф (/) — a (t) ф (0 + b (О Î] (0, (5.277) где для удобства обозначим a(t) — - j и b(t) — | . При принятых предположениях уравнение (5.270) можно записать в виде 4f*L4'2<z,) + I [4^_|л2(/)'і’2та’ІЛ(Оті(О+'^'І.т13(/)]dt>Q (5278) to для всех 1] (/) =f= 0. Покажем, что из уравнения (5.278) следует п д2И I Допустим, 0 при t — t. В силу д2Н I непрерывности , можно пред¬ че положить, что в малой окрестности S точки t (т. е. на малом интервале около t) 4^1 < —а, а > 0. (5.280) ди2 U Покажем, что b (/) =/= 0 на любом подынтервале из S. Если b (/) = 0 на подынтер¬ вале Œ S, то, полагая г) (/) ^ 0 на дополнении к Si (т. е. г) (t) — 0 для t Ç [/0, іг ] — Sx) и принимая, например, т] (/) — 1 на Sx, найдем, что левая часть уравнения (5.278) окажется 244
отрицательной [так как гр (t) при таком выборе т] (t) тождественно равно нулю]. Таким образом, можно считать, что b (/) =/= 0 на S. Из выражения (5.277) следует, что П (0 = b"1 (0 гр (0 — Ь-1 (0 а (0 гр (/). (5.281) Ограничим выбор Л (0 функциями, которые равны нулю на дополнении к S (т. е. на [/0, /, ] — S) и для которых гр равно нулю в конечных точках S. Иначе говоря, если S = = [Z — е, t + 8], то Т) (0 = 0 для t < t — 8 и ?+ 8 < t а гр (Î — ‘е) = = гр (t -h 8) = 0. Для таких функций т] (t) уравнение (5.278) запишется в виде Н“е f ( H I I J ’ IF | Л (0 + 2 dTdù I* (<) [6’1 (Z) *(Z) ~(t} a (t) (0J + i—e (5.282) Проинтегрировав по частям член, содержащий гр (t), получим неравенство H-е 2 J [QW(O + S|*n4n]*>o. t—е где (5.283) (5.284) Полагая, что <р (t) — Ф (/, t — г) есть фундаментальное решение (матрица) урав¬ нения (5.277) и что ф (/) =j= 0, имеем t гр (/) = ф (t) J ф"1 (т) b (т) т] (т) du. (5.285) t— Е Так как q (/) =f= 0 и b (t) 4= О’ то можно считать, что для достаточно малого 8 -^>₽>0 (5.286) при t ИЗ [/ — 8, t 4- 8]. В силу непрерывности, можно также считать, что max I Q (t) ф2 (t) I < М < сю. (5.287) (€Û-e. ?+е] Уравнения (5.286) и (5.287) остаются справедливыми и при уменьшении 8, выбе¬ рем 8 настолько малым, чтобы — ар — + 2Л1е < 0, (5.288) где а определяется уравнением (5.280). Далее положим ті (/) = Ь"1 (/) ф (f) — sin • (5.289) 8 8 Тогда соответствующее решение гр (/) уравнения (5.277) запишется в виде t гр (t) = q (/'. У sin ?£L£L—É1 = ф çf) sin2 Л , (5.290) t—Q 245
и поэтому ф (t — е) = гр (t 4- е) — 0. При таком выборе т] (t) уравнение (5.283) будет иметь вид t+e У Q (і) ф2 (О sin4^—J/ _|_ ?—е д2Н I ф2 (/) л2 ди2 I* Ь2 (/) 82 . 9 2л (t — t) sin2 i - 8 ^>0. (5.291) Левая часть уравнения (5.291) вследствие условий (5.286) и (5.287) меньше, чем 2Ме — сф . 8 Таким образом, приходим к противоречию, которое и доказывает справедливость соотношения (5.279). Иначе говоря, считая, что неравенство (5.280) справедливо, мы ока¬ зались в состоянии отыскать управление т] (t), для которого неравенство (5.278) не выпол¬ няется. Это приводит нас к заключению, что условие (5.280) не может быть справедливо (см. [80]). 5.8. ДОСТАТОЧНЫЕ УСЛОВИЯ ДЛЯ ЗАДАЧИ С НЕЗАКРЕПЛЕННЫМ КОНЦОМ Усилим необходимые условия предыдущего параграфа, с тем чтобы получить некоторые локальные достаточные условия, которые будут использоваться нами в гл. 9. Ранее мы предполагали, что оптимальное управление и* существует, и нашли определенные условия, которые при этом должны удовлетворяться. Теперь допустим, что для управления и удовлетворяются определенные условия. На основании этого докажем оптимальность управления (локальную) а. Исследования покажут раз¬ личия между необходимыми и достаточными условиями. Рассмотрим динамическую систему вида х = /(х, a, t\ (5.292) где хи/ — /г-мерные векторы и и — m-мерный вектор, причем 0 <<т < п. Будем считать, что и не ограничено и t0—начальный момент времени, причем х(/0) = х0 (5.293) — начальное состояние. Множество цели S имеет вид Rn X {/J, где tr — фиксировано и tr > tQ. Функционал преобразования имеет вид G J (и) = К [at(G)1 + f L a(t), л dt, (5.294) где К и L — достаточно дифференцируемые действительные функции и X (t) — траектория, удовлетворяющая (5.292), исходящая из х(і0)=х0, являющаяся результатом действия управления и. Нашей задачей вновь является: Найти управление и (/), минимизирующее функционал преобразо¬ вания J (а). Прежде чем перейти к достаточным условиям, посмотрим, к чему приводят возмущения управления и (которое может и не быть оптималь¬ ным). Обозначим через х траекторию, удовлетворяющую уравнению (5.292), исходящую из X (/0) = х0 и произведенную управлением и. 246
Если и — возмущенное управление и: u(t) — и(t) 4 ет] (/), (5.295) то соответствующую и (0 траекторию х (0 можно записать в виде x(t) = x(t) 4- егр (t) + О (е), (5.295) где гр (0 — решение линейного дифференциального уравнения Ч>И-Й|ДЧ>(')+^|ЛЧИ (5.297) с начальным условием t(U = 0, (5.298) где значок |Л обозначает, что величина должна вычисляться вдоль х (0. Например, -|^|Л — якобиан от f по лг, вычисленный при [лг (0, а(0, /]. Полагая, что Н (лг, р, и, t) — гамильтониан данной задачи, т. е. H [х, р, и, t] — L \х, и, t] + (р, /(X, и, t\)y (5.299) и обозначив через р(0 решение линейного дифференциального уравнения Р(0= — Р(О. ЩІ), /]= (5.300) = <5-301> удовлетворяющее граничному условию = <5-302> мы, как и в предыдущем параграфе, можем заключить G где |Л обозначает, что величина вычисляется вдоль х; например -ч— — ІД градиент Н по отношению к иу вычисленный при [лг(0, p(t), u(t), /]. Итак, имеем 11 ÔJ(zz)(« —и) = е [\-^| , n(0zd/ (5.304) J \ OU IЛ ôv («) (« - «)=4 S |л *(Zi)/ + 247
Получив последние выражения, можно доказать следующую теорему. Теорема 5.4. Пусть и удовлетворяет условиям: а) -^-|Л = 0 для * из lZ0> 411 (5.306) б) для и, достаточно близкого к и. существует неотрицательная кусочно-непрерывная функция М (t) такая, что величина члена О (е2) в уравнении (5.303) удовлетворяет неравенству |О(е2)| (/,) И3 ЛШ+ I е I3 jh(W№ (5-307) в) существует положительное число kx такое, что <®. (5.308) о I для всех векторов ѵ из Rfl, т. е. симметричная матрица -у-у положи- ОХ" I а тельно определенна, если М (/х) > 0, и положительно полуопределенна, если М (/J = 0 х; г) существует положительное число k2 такое, что для всех ѵ из Rn, w из Rm и для / из [/0, /J. В выражении (5.309) ра- венство имеет место лишь при w = 0. Это означает, что матрица положительно определенна для t из [/0, /J и вся матрица размера п + + т X п + т, входящая в уравнение (5.309), положительно полуопре¬ деленна. В этом случае и есть локальный минимум J. Доказательство: Предположим, что условие б) удовлетворяется, если IIи— и\\ max I |ія(/) — u(t)\\} < ô. (5.310) Тогда, по условию а), для и, удовлетворяющего соотношению (5.310), получим /(«)—/(») > ÔV(м)(м— «)— |е|3j)t|>((i)ll3 W1) — -|е|3 j'hWlPWH- (5.311) to Используя соотношение (5.305) и условия в) и г), получаем, что J (и)-J (и) > 4 Н (*і) F м (^) 4-^2 -ÿ- J11П (О II2 м (/) dt - to G — I 8 |3||i|> ((,) ||3Л1 (^) — | е |3 (5-312) to 1 См. § 2.15. 24a
откуда j(и)[4— івіналі]ншмш + J [-^-ІеІІІпЮІі] (5.313) tb Но поскольку ф (/) есть решение уравнения (5.297) с начальным условием 4» (/0) -= 0, получим |8|ІІЧ>(Л)ІІ <-М|8| max ЦпЮІІ = Ihil (5.314) <£[Л>. «il для некоторого N > 0, которое не зависит от г). Так как k± и k2 положи¬ тельны, то существует ô0 такое, что 0<ôo<ô (5.315) и ^>Ô0. (5.316) Следовательно, J(u) — J (и) >0 (5.317) для всех и, удовлетворяющих условию || и — и i| <ô0. Итак, мы пока¬ зали, что и есть локальный минимум J. Следствие 5.1. Предположим, что М (t) 0. Для того чтобы и было локальным минимумом J, достаточно выполнения условий а) ^| 1 ди |л д2Н I б) -j-т положительно определенна; в) матрица размера п + т X п + т, входящая в уравнение (5.309), должна быть положительно полуопределенна. Следствие 5.2. Предположим, что динамическая система линейна, т. е. х(0 - д- В (/) и (0, х(/0) - лг0, (5.318) и функционалом преобразования J является квадратичная форма J («) = Y {X ((,), Fx (/,)) + y j [ 'X (t), Q (t) X (0) + («(/), R (0 U (0>] dt, (5.319) где F, Q (t) и R (t) — соответственно nXn, пХпитХт матрицы. Для того чтобы управление и было локальным минимумом функционала J, достаточно выполнения условий: а) /? (/) положительно определенна для I из По, /Д; б) Q (/) положительно полуопределенна для t из [/0, /Д; в) F положительно полуопределенна; г) и — решение уравнения Я(/)и(/) + ВД/)р(0==0, (5.320) где р (/) — решение линейного дифференциального уравнения р = (5.321) 249
удовлетворяющее граничному условию Упражнение 5.13. Докажите следствие 5.2. В § 5.7 мы показали, что если а* есть дН I п д2Н I j = 0 и матрица 1 положительно Как было принято выше, управление p(t1) = Fx(t1)f (5.322) где, в свою очередь, х (/)— решение уравнения (5.318), соответствую¬ щее и. Следствие 5.2. будет часто использоваться в гл. 9. оптимальное управление, то определенна. и удовлетворяет этим двум условиям и, кроме того, дополнительным условиям б), в) и г) теоремы 5.4, а затем доказано, что и является локальным оптимальным управлением. Поэтому дополнительные условия теоремы 5.4 были названы усиливаю¬ щими необходимые условия § 5.7. Упражнение 5.14. Рассмотрите систему первого порядка уЗ (t\ X (t) = — X (о + и (0 ; X (0) = х0 о с функционалом стоимости вида 1 J (и) = ў х2 (1) + у j [х2 (/) + и2 (t)]dt. о Предположим, что и* (/) — оптимальное управление, х* (/) — соответствующая оптимальная траектория, а возмущенные управление и траектория задаются следу¬ ющими соотношениями: U (0 = W* (0 + 8Î] (/) и X (/) = X* (0 + 8ф (/)• При этом необходимо: а) показать, что X (0 = - х* (0 — 4-х*3 (0 + и* (t) — е <р (t) [1 + X*2 (/)] + и + ет] (/) — е2<р2 (0 X* (0 — 6 ; О б) найти в выражении пункта (а) члены, соответствующие следующим членам уравнения (5.208): в) проверить уравнение (5.215) для этого частного случая; г) показать, что гамильтонианом данной задачи является выражение н (X, Р, и, 0 = -g- X2 + -Ь и2 — хр Ь х3р + up; д) показать, что члены уравнения (5.226) для данной задачи имеют вид =х*(0-Р(0-х*2(/)р(0; О (е) = -1- [1 - 2х* (0 P (t)] [X (0 - X* (О]2 + у,- [« (О - и* (/)12 - 250
--2p (t) [x (t) - x* (/)]’ = O J 1 1 2 == -y П — 2x* (/) P (/)] 82ф2 ОТ + -y eV (0 ~ y P ОТ е3Ф3 ОТ; е) определить члены, соответствующие обозначенным через о (в) в уравнениях (5.227), (5.228) и (5.230); ж) записать условие (5.232) в развернутом виде; з) показать, что р (/) должно быть решением линейного дифференциального урав¬ нения p(t) = —х* (0 + [1 + х*2 От] РОТ, а р* (/) должно быть единственным решением этого дифференциального уравнения, удов¬ летворяющим условию р*(1) = х*(1); и) используя условие (5.253), показать, что и* (/) и р* (t) должны быть связаны соотношением и* (/) =— р* (0; к) показать, что уравнение (5.263) для данной задачи имеет вид â2z/ 2|2/1ч( 9C/W)] Г1--2х*(0Р*ОТ 01 1 ÔV(u*)(u — u*) = eV (1) + е- I / , „J /dt>\ J\Ln(<)J L 0 iJLn(OJz J 0 л) показать, что x* (t) и р* (/) удовлетворяют системе уравнений //\ x* (t) ~ —х* (/) р* (/); Û р* (/) = —x* (t) 4- р* (/) + x*2 (t) р* (0 с граничными условиями х* (0) = х0; р*(1) =х*(1); м) предположив, что и — управление, для которого существует соответствующее р, причем и, р и x удовлетворяют необходимым условиям и кроме того соотношению х(0рОТ^-у Для t из [0, 1], показать, что и должно быть локальным минимумом J. Упражнение 5.15. Рассмотрите систему *i (t) = ~*2 (/); Хі (0) = gf, х2 (0 = — х2 (0 t2 + и (t)\ х2 (0) = g2 с функционалом стоимости 1 J (и) = j (t) t- + xf (t) + u? (/)] dt 0 и напишите в развернутом виде следующие уравнения: (5.208), (5.211), (5.213), (5.215), (5.225), (5.227), (5.228), (5.230), (5.236), (5.237). (5.239), (5.240)—(5.243), (5.263), (5.271), (5.273), (5.303) и (5.309). Упражнение 5.16. Повторите то же самое для системы ; (/) = —е~хг wx (t) +u(t)x (0 + и (t); x (0) = x0 с функционалом J (u) =- J k4 (0 + u2 (Z)] dt. 0 251
5.9. ЗАДАЧА С ЗАКРЕПЛЕННЫМ КОНЦОМ Рассмотрим задачу с закрепленным концом, пользуясь вариацион¬ ными методами. Пытаясь показать, что оптимальное управление должно экстремизировать гамильтониан, мы не можем решить задачу до конца, и это вынуждает нас искать другой подход к задаче управления. Рассмотрим динамическую систему »(/), t] (5.323) где х (/) и f — n-мерные векторы и и (/) — /77-мерный вектор, причем О <^т < п. Будем считать, что управление не ограничено, tQ — на¬ чальный момент времени, т. е. аг(/о) = лго, (5.324) и область цели имеет вид S = (Хр ^}, (5.325) где xt — заданный элемент из Rn и tx — фиксированное время tr > /0. Иначе говоря, мы хотим, чтобы наше движение начиналось в точке лг0, а заканчивалось в точке хг. Пусть L (х, и, t)— «достаточно» дифференци¬ руемая действительная функция и G J(u) = J L[x(/), u(t), t]dt (5.326) ^0 — функционал, где x (Z)—траектория, удовлетворяющая уравнению (5.323), начинающаяся в точке х (/0) -- -*о и произведенная управле¬ нием и (f). Задача формулируется следующим образом: отыскать допу¬ стимое управление и (t), переводящее х(/0) *ѵ0 в х (^) х± и мини¬ мизирующее функционал J (и) относительно всех таких управлений. Попытаемся получить необходимые условия, подобные тем, которые даются теоремами 5.2 и 5.3 с помощью пошаговых операций (аналогично § 5.6 и 5.7). Шаг 1. Предположение существования оптимума. Пусть и* (/) — оптимальное управление и x* (t) — соответствующая оптимальная траек¬ тория. Функции и* (0 и x* (/) удовлетворяют условиям x*(t) = f [x* (/), #*(/), /]; (5.327) х* (/0) = -Vo, х* (/х) = хг. (5.328) Если и (/)— любое допустимое управление, для которого соответ¬ ствующая ему траектория начинается в точке х(/0) = х0 и оканчивается в x(/J = хх, то G «/* = /(#*)= J L[x*(/), #*(/), t]dt < G </(«) = J L\x(t), a(t), t]dt. (5.329) t0 Шаг 2. Возмущения. Поступая так же, как и в § 5.7, получим соот¬ ношения u(t) = а*(/) + ет)(О’> (5.330) x(t) = х*(/) + 8ф(0 + О (е); (5.331) ^(0+ Wo) = 0» (5.332) 252
которые связывают возмущения управления с соответствующими им воз¬ мущениями траектории. Однако требуется, чтобы возмущенная траекто¬ рия заканчивалась в точке xY [т. е. х (/J = xj. Это означает, что 0(8). (5.333) Отметим, что ф(/) не зависит от 8, так как ф (/) является функцией только т| (/) (и оптимальной траектории), и поэтому ф(/і)-О. (5.334) Следовательно, вариация управления ет] (/) не может быть совершенно произвольной. Действительно, если Ф (/, /0) — фундаментальная матрица линейной системы (5.332), то т](/) должно удовлетворять уравнению 0 = J ф-'(/, /0)>| (5.335) to * это условие аналогично условию (5.121). Теперь можно ввести гамильтониан Н и дополнительную переменную р (/), точно так же, как в § 5.6 и 5.7. Пусть р (/) — произвольная кусочно¬ непрерывная функция и гамильтониан Н дается выражением Н(х, р, и, t)^L(x, и, t)+(p, /(х, а, /)). (5.336) На основе доказательств, аналогичных предыдущим, заключаем, что ti / х^-L’п(/)/Л=0 (5-337) to для всех т] (/), удовлетворяющих (5.335), где р (t) есть решение линей¬ ного дифференциального уравнения = РУ), /]= (5.338) = —«*(0- zl — (-^-І^*(0> «*(0. л) p(t). (5.339) Очень трудно показать, что существует решение этого уравнения р* (t), для которого -^-|х*(/), /?*(/), «*(/), /] =0. (5.340) Вопрос о существовании такого р* (t) весьма важен, так как он свя¬ зан с понятиями управляемости и нормальности вариационной задачи, но последний находится вне рамок настоящей книги. Советуем читателю самостоятельно рассмотреть этот вопрос и убедиться в тех трудностях, которые лежат на пути его решения. При этом рекомендуем воспользо¬ ваться работами [26] и [158]. Для преодоления этих трудностей примем другой подход к решению задачи, который и приведет нас к принципу минимума Понтрягина. Перед тем, как приступить к детальному исследованию этой новой поста¬ новки задачи, посвятим следующий параграф трем вопросам: обзору сде¬ ланного ранее, обсуждению общих результатов и рассмотрим другие причины (например, естественные ограничения в задачах и устранение жестких требований в отношении дифференцируемости L), служащие осно¬ ванием для перехода к новой точке зрения. 253
5.10. ОБСУЖДЕНИЕ ВАРИАЦИОННОГО МЕТОДА Основной целью настоящего параграфа является рассмотрение необ¬ ходимых и достаточных (локальных) условий, полученных в § 5.7 и 5.8. В заключение параграфа мы укажем причины, по которым целесообразно решать задачу управления, основываясь на другом подходе. Рассмотрим систему x(t) = f\x(t\ u(t\ /], (5.341) где состояние x(f) есть /г-мерный вектор и управление и (t) —т-мер- ный вектор, причем 0 << т < п. Будем считать, что управление неогра- ничено, что t0 — начальное время, при котором х(/0) = х0 (5.342) есть начальное состояние, а область цели имеет вид 5= (5.343) где tx — фиксированное время, tr > /0. Иначе говоря, мы имеем дело с задачей с фиксированным временем и незакрепленным концом. Предпо¬ ложим, что функционал имеет вид g J(«) = J L [*(/), »(/), t]dt, (5.344) G t. e. в него не входит «стоимость» конечного состояния, А? |лг (/Д 1 = ~ 0. Итак, задача заключается в том, чтобы отыскать и, минимизиру¬ ющее J (и). Так как мы собираемся иллюстрировать необходимые и до¬ статочные условия с помощью «символических графиков», напомним, что: 1. обозначает величину управления в момент времени t, / J, т. e. u (/) — элемент из Rm. 2. gjобозначает всю функцию управления на интервале [/0, /Д. Для упрощения мы часто будем писать просто а, имея в виду, что и = u[to, G1- (5.345) Имея дело с различными управлениями на [/0, /х], мы будем для их различения использовать верхний индекс, например, =■ GP (5.346) что для заданного значения і будет обозначать конкретную функцию управления, а вектор и1 (t) будет обозначать величину этой конкретной функции управления в момент времени /, ZÇ [/0, /Д. 3. Записывая $([/0, ^Д, Rm)> будем иметь в виду функциональное пространство 1 всех кусочно-непрерывных функций, преобразующих [?0, М в Rm. Так как это множество допустимых управлений, то в даль¬ нейшем вместо символа ^3 ([/0, /Д, Rtn) будем пользоваться символом U, т. е. U = {и : и есть допустимое управление} = $([/0, /Д, Rrn). (5.347) Конкретные функции управления и1 будем называть точками функ¬ ционального пространства U. 4. Говоря «а близко к а», будем иметь в виду, что расстояние в функ¬ 1 См. § 3.15, в частности (3.136). 254
циональном пространстве U между и и и мало. Напомним, что в § 3.15 [уравнение (3.124)1 мы определили расстояние d(u, и), положив d(u, а) = ||а— «|| = sup ||а(/) — «(/)||. (5.348) гб>, м Функция U[t0, G1 на Рис- 5.9 «ближе» к функции G], чем функ¬ ция u[tn, м Если к системе, которая при t = t0 находится в известном состоя¬ нии Хо, прикладывается управление и1 = u{to, /д, то в результате полу¬ чится вполне определенная траектория х1 = x\tQ, G], соответствующая и' и, следовательно, вполне определенная (скалярная) величина J1. Иначе говоря, имеем G Ji = J(a<) = J L \xi(t), а1 (О, Л dt. (5.349) ^0 Строго говоря, функционал J1 зависит от многих обстоятельств, и его следует записать как Ji = J(ui ) = J(ul, xQ, tlf /) (5.350) для того, чтобы отразить зависимость J1 от следующих факторов: началь¬ ного состояния х0, начального времени /0, конечного времени tly системы х (/) = fïx (/), и (t), t] и управляющей функции и1. г п Рис. 5.10. Символический график Рис. 5.9. Управление « «ближе» к и, чем управ- зависим0Сти функционала J (а) от « ление и Однако для фиксированных х0, 4, h и f величина J является функ¬ цией только элемента и1 из Ц. Таким образом, мы можем нарисовать символический график зависимости J (и) в функции от а, как показано на рис. 5.10. Подчеркнем, что «ось» U на рис. 5.10 представляет собой функциональное пространство U и что каждая «точка» и на «оси» U есть функция u[to, tl]. Функционал J (и), показанный на графике рис. 5.10, имеет: абсо¬ лютный минимум при а3, относительные минимумы при а1 и а5, относи¬ тельные максимумы при и2 и а4; перегиб при иь. Иначе говоря, J (и) обладает следующими свойствами: а) первая вариация J (а) равна нулю при и1» а2, а3, и4, а5 и а6; 255
б) имеют место неравенства: J(u3)<J (и3) J(u5)<J (и5) J(«2)> J(«2) (и*) для всех и1 «близких» »l; для всех и3 и3\ для всех и3 «близких» и5; для всех »2 «близких» и2\ для всех »4 «близких» и4. (5.351) Управление и3 оптимально глобально, а управления и1 и и5 назы¬ ваются оптимальными локально. Рассмотрим теперь поведение гамильтониана И нашей задачи с функ¬ ционалом, показанным на рис. 5. 10. Сначала мы обсудим свойства Н с аналитической точки зрения, а затем проиллюстрируем эти свойства символическими графиками. Гамильтониан нашей задачи имеет вид H(xt Р, и, t) = L(x, и, /) + (р, /(х, и, 0), (5.352) а каноническая система векторных дифференциальных уравнений запи¬ сывается в форме х(/)= Р(Ѣ «(0. d; (5.353) up р(/)=/?(/), «(/), t\ (5.354) co следующими граничными условиями: х(/0)=гХ0; (5.355) р(/і) = 0. (5.356) Нас особенно интересуют решения этих уравнений для управлений и1, . . ., а6, которые соответствуют экстремумам J (и) (см. рис. 5.10). Предположим, что а1, и2, . . ., и3 показаны на рис. 5.11, а и со¬ ответствующие им переходные процессы нашей системы (5.323) х1, X2, . . ., X6, исходящие из одного и того же начального состояния X (/о) — х0, изображены на рис. 5.11, б. Так как-^- =/(х, », /), траекто¬ рии X1, X2, .. ., X6 не зависят от дополнительной переменной. На рис. 5.11, в показаны решения уравнения (5.354) р1, р2, .. . , р6, соответствующие управлениям а1, »2, . . ., »6. Иначе говоря, рі = p[tot есть решение (линейного) дифференциального уравнения p(t) = -^[*‘(a p(t), u(t), /], (5.357) удовлетворяющее граничному условию pz (ZJ = 0 для і = 1, 2, . . ., 6. Так как управления а1, я2, . . ., »б соответствуют экстремумам J (и), p‘(t), /]=0 (5.358) для і — 1, 2, . . ., 6 и tQ Ио, Далее, так как я1, и3 и и5 — минимумы, и2 и »4 — максимумы J (и), а при »6 имеет место перегиб J (»), можно обнаружить следующие свойства матрицы размера т X т: 256
положительно определенна при [х'(/), р'(/), «'(/), /] для /= 1, 3, 5; (5.359) д2н отрицательно определенна при \x\t), pk(t), uk(t), /] для k = 2, 4; (5.360) д2Н не является ни положительно, ни отрицательно определенной Рис. 5.11. а) Экстремальные управления и1, . . ., и6, б) Со¬ стояния х1, ...» х6, соответст¬ вующие управлениям а), в) До¬ полнительные переменные р1, . . .,р6, соответствующие управ¬ лениям а) и состояниям б) при [х6 (0, 0е (0. «6 (0>- N. Можно отметить, что матрица - д2н ; д2Н - дх2 і дхди ~д2Н I д'2Н - _ дидх I dit2 (5.361) (5.362) = Q(x, р, и, t) обладает свойствами: а) Q положительно определенна при [.?(/), p'(t), ti'(t), /] для / = 1, 3, 5; (5.363) б) Q отрицательно определенна при [xk(t\ pk(t), uk(t), /] для k = 2, 4; (5.364) в) Q не является ни отрицательно, ни положительно определенной для p\t), t\. (5.365) 9 Атанс и др. 257
Эти результаты дают основания считать, что для t Ç [Zo, ZJ имеют место неравенства H\x\t\ рЦі), ^(Z), Z] /^(Z), яа(0, t] (5.366) для а = 2, 3, 4, 5, 6; H[x3(t\ p3(t), a3(Z), Z] </У [x3(Z), p3 (Z), #0(Z), Z] (5.367) для p = 1, 2, 4, 5, 6; tt[x6(Z), p5(Z), tt5(Z), Z] <H[x5(Z), p5(Z), #y(Z), Z] (5.368) для у = 1, 2, 3, 4, 6; H[x2(t), p2(t), Z]^tf[x2(Z), p2(Z), aô(Z), Z] (5.369) для ô = 1, 3, 4, 5, 6; H[x*(t), p4(t), t]^H[x*(f), p*(t), #e(Z), Z] (5.370) для 8 = 1, 2, 3, 5, 6. Ha рис. 5.12 для иллюстрации неравенств (5.366) показана зависи¬ мость H [х1 (Z), р1 (t), и (Z), Z] от и (Z). Плоскость и1и2 на рис. 5.12 пред¬ ставляет собой пространство Rm. H [х1 (Z), р1 (Z), и (Z), Z] имеет минимум при и (t) = и1 (Z). Несмотря на то, что и (t) — и3 (Z) является глобаль- Рис. 5.12. Гамильтониан H [х1 (Z), р1 (/), и (t), /] имеет минимум при и1 (/) и не имеет минимума при и3 (t) условия могут быть установлены ным минимумом J (а), гамильтониан H [х1 (Z), р1 (Z), и (Z), Z] при управле¬ нии и (t) = и3 (t) минимума не имеет. На рис. 5.13 показано, что Н [х4 (Z), p*(f), и (Z), Z] имеет максимум при и (t) = a4 (Z) [см. неравенство (5.370)1, ас помощью рис. 5.14 иллюстрируется перегиб Н [х6 (Z), р6 (Z), и (Z), Z], имеющий место при и (Z) = д6 (Z). Эти символические графики иллю¬ стрируют локальность необходимых условий теоремы 5.3. Минимум функ¬ ционала имеет место как в случае гло¬ бально оптимального управления, так и для управлений, локально миними¬ зирующих функционал. Они иллюстри¬ руют также то, что соответствующие для управления локально минимизи¬ рующих функционал. Эти символические изображения подчеркивают ло¬ кальный характер необходимых условий, которые не дают достаточной информации для определения оптимального управления. Например, все три управления а1, и3 и и5 удовлетворяют необходимым условиям тео¬ ремы 5.3. К выводу о том, что и3 оптимально глобально, можно придти, лишь вычислив J (и1), J (и3) и J (и5) и выбрав наименьшее из получен¬ ных чисел. Еще раз вернемся к рис. 5.10. Если ограничить допустимые управле¬ ния замкнутым множеством Q, показанным на рис. 5.10, то легко видеть, что J(tt7)<J(tt) для всех и из Q. (5.371) Однако и7 не является экстремумом Н, т. е. [х7 (Z), р7 (Z), и1 (t), t] =^= 0 и матрица ^^-Іх7 (Z), р7 (Z), и7 (Z), Z] может не быть положи¬ тельно определенной. Таким образом, если разыскивается минимум функ¬ ционала J (и) на множестве Q, необходимые условия не имеют места, 258
и использовавшиеся ранее вариационные методы оказываются бесполез¬ ными. Читатель должен иметь в виду, что и1 является граничной точкой Q и рассматривать это положение в свете результатов, полученных в § 5.2 и 5.3 с учетом замечаний § 5.5. Мы уже отмечали, что при получении соответствующих необходимых условий для задачи с закрепленным концом на базе вариационных методов, использовавшихся в задаче со свободным концом, возникают значитель¬ ные трудности. Эти трудности возникают прежде всего из-за отсутствия уверенности в том, что имеется достаточное количество вариаций [см. уравнение (5.335)]. Необходимо указать на дальнейшие причины, по кото- рым следует вести рассмотрение с другой точки зрения. Рис. 5.13. Гамильтониан Н [х4 (/), р4 (/), и (/), /] имеет максимум при а4 (t) Во-первых, мы требовали, чтобы L и f были «достаточно» дифферен¬ цируемыми, и, в частности, чтобы была определена. Это исключает критерий tx (5.372) который, как мы увидим в гл. 8, весьма важен. Поэтому ищем подход, не накладывающий жестких требований к дифференцируемости L и /. Во-вторых, рассмотрев поведение J (и) на Q (см. рис. 5.10), найдем что наши необходимые условия неприменимы в случае замкнутого огра¬ ничивающего множества Ч Таким образом, ограничения управления типа |uz(/)| і = 1, 2, ..., т (5.373) далеко не элементарны. Далее, если Q состоит из конечного числа точек, то вариационный подход вообще неприменим. Так как ограничения имеют исключительно большое практическое значение, следует попытаться найти метод, позволяющий легко их учитывать. Наконец, мы рассматривали только такие задачи, в которых множество S представляло собой либо все пространство либо единственную точку. Однако во многих за¬ дачах множество S является «гладким» и поэтому нужен метод, позво¬ ляющий рассматривать такие задачи. Всем этим требованиям удовлет¬ воряет принцип минимума Понтрягина, который требует относительно слабых предположений о дифференцируемости и очень хорошо подходит для задач с ограничениями, а также позволяет легко учитывать «гладкие» множества конечных состояний. 1 Вариационные методы можно распространить и на случай таких ограничений [54], однако доказательства этого очень сложны. 259
ПРИНЦИП МИНИМУМА ПОНТРЯГИНА 5.11. ВВЕДЕНИЕ Приступим к изучению знаменитого принципа минимума Понтрягина (см. [179]). При его изучении поставим перед собой следующие основ¬ ные цели: 1. Дать строгую и точную формулировку принципа минимума. 2. Дать эвристическое доказательство, основанное на доказательстве, приведенном в [179], и тем самым подойти к строгому доказательству. 3. Интерпретировать принцип минимума различными способами для того, чтобы показать глубину его содержания. В последующих главах книги рассматривается, как можно исполь¬ зовать принцип минимума для решения различных задач управления. Прежде всего еще раз сформулируем общую постановку задачи управле¬ ния. Далее мы выделим два частных случая задачи управления и сфор¬ мулируем необходимые условия оптимальности, которые в этих двух случаях составляют принцип минимума. Затем с помощью различных замен переменных будет показано, как принцип минимума для общего случая может быть получен на основе результатов для частных случаев. После этого производится эвристическое доказательство, основанное на строгом доказательстве из работы [179]. Наконец, прокомментируем по¬ лученные результаты и затем обсудим некоторые достаточные условия оптимальности. 5.12. ФОРМУЛИРОВКА ЗАДАЧИ УПРАВЛЕНИЯ Сформулируем задачу управления (см. определение 4.9) в том виде, в котором к ней можно приложить необходимые условия оптимальности. Читатель может найти этот параграф довольно формальным.Однако, необ¬ ходимо точно сформулировать предположения, при которых устанавли¬ вается принцип минимума. Предположим, что нам задана динамическая система порядка /г, которая на интервале (Тѵ Т2) описывается диффе¬ ренциальным уравнением x = f(x, и, /). (5.374) Будем считать, что Q — заданное подмножество из Rm и что область до¬ пустимых управлений U есть множество всех ограниченных кусочно-не¬ прерывных функций и (/) на (7\, Т2) таких, что tt(/)£Q для любого t из (7\, Т2); (5.375) а(/—)=«(/) для любого t из (Т1У Т2), (5.376)1 * * * Как обычно, переходную функцию системы будем обозначать через «(/„./г •*<))• (5-377) Пусть L (х, и, t) — действительная функция на Rn X Rfn X (Т19 Т2) и К (х, t) —действительная функция на Rn X (Т^ Т2). Наконец, пред¬ положим, что S — заданное подмножество из Rn X (Т19 Т2), так что эле¬ ментами S являются пары (х, /), состоящие из состояния системы х и точки t на интервале определения системы. 1 См. определение 3.24. Мы делаем это предположение, чтобы избежать необходимости добавлять фразу «за исключением, возможно, счетного подмножества» ко многим утвержде¬ ниям. Любая ограниченная кусочно-непрерывная функция на (7\, Т2), удовлетворяющая условию (5.375), эквивалентна, в смысле § 3.15, функции, удовлетворяющей этому пред¬ положению. 260
Сделаем теперь следующие предположения: I. Если (х, и, t), f2(x, и, f), . . ., fn (х, a, t) обозначают компоненты f (х, и, t), будем считать, что функции £(•*, a, t), ^(х, и, t), ^-(х, и, t), Z = 1, 2, п, (5.378) а также функции Цх, и, t), £(х, и, /), ^-(х, и, t) (5.379) непрерывны на Rn X Q X (Ть Т2), где Q обозначает замыкание Q в Rni (см. определение 3.9). Отметим, что мы не требуем непрерывности част¬ ных производных Д. и L по компонентам и. II. Если S — заданное подмножество из Rn X (Т19 Т2), то будем считать, что S относится к одному из видов: а) S == {лг!} X Т, где х1 — фиксированный элемент из Rn и Т — подмножество из (Т19 Т2); б) S = Rfl X Т, где Т — подмножество из (Т19 Т2); в) S = S, X Т, где S] — гладкое Æ-мерное многообразие, 1 < k < < п — 1, из Rn (см. определение 3.30) и Т — подмножество из (Т19 Т2); г) S = {(g* (Z), t) : t Ç (Т19 T2)}, где g (t) — непрерывно дифферен¬ цируемая функция из (Т19 Т2) в Rn, т. е. g (/) — кривая в Rn с непрерывно вращающейся касательной; д) S — гладкое k + 1-мерное многообразие, 1 < k < /г — 1 ъ Rn X X (7\, Т2), непрерывно дифференцируемое по t. Иначе говоря, имеется п — k функций gi (х, /), g2 (х, /), . . ., gn_k (х, /) на Rn X (Т19 Т2) таких, что: 1. S= {(х, t): gi(x, /) = 0 и g2(x, /) = 0 и ... и gn_k(x, /) = 0); 2. функции gL(x, t), ^-(х, t) и (х, t) непрерывны на Rn х (T lt с/*» Т2) для i = 1, 2, . . п — é; 3. векторы 4^- (х, Z), Z = 1, 2, . . п — k — линейно независимы в каждой точке из S. III. Если Æ (х, Z) — заданная действительная функция, определен¬ ная на Rn X (Т19 Т2), то будем считать, что: а) если б) если и функции S имеет вид Па, то Æ (х, t) = 0; S имеет вид ІІб, то К (х, t) не зависит от Z[t. е. /С (х, Z ее /С (х)] к (х), -^(х), ^-(х) непрерывны; в) если S имеет вид Пв, то /< (х, t) не зависит от t [т. е. R (х, t) — К (ж)] и функции К (х), (х), ЕЕА (х) непрерывны; г) если S имеет вид Иг, то К (х, t) не зависит отх [т. е., К. (х, t) — = К (/)] и функции К (t), (f), (t) непрерывны; д) если S имеет вид Ид, то функции К (х, t), (х, t), ^~(х, t). и ~dï^x' Z) непрерывны. При этих предположениях будем называть S множеством цели (мно¬ жеством конечных состояний) и К — функцией конечной стоимости. Мы подготовлены теперь дать определение, приводящее к формальной по¬ становке задачи управления. 261
Определение 5.8. Пусть /0 — элемент из (Тъ Т2) и х0 — элемент из Rn, тогда допустимое управление и переводит xQ в S [или, точнее, переводит (л:0, 60) в S], где S —множество цели, если множество {(#(/; »(/„,/]’ *о)> о : (5.380) встречает (или пересекает) множество S. Если и переводит хов S и tx — первый момент времени после /0, когда движение х (Z) = ф (/; u{t t ]f х0) вступает в S, а ~ х (^і) = Ф (^г U(tQ, g]’ Ло)’ (5.381) то вполне определенное число: ti 7(х0, Zo, ») = /<(х1, /J+ Jl[x(Z), a(Z), t]dt = (5.382) = K[$(tv; u{lo iiV x0), /J + j L [g6(/; «Uo, 6]> x0), u(f), t]dt (5.383) to называется величиной функционала (или, просто, стоимостью) управле¬ ния и, tx — конечным временем и хг — конечным состоянием. Если и не переводит х0 в S, то полагают J (х0, «)=оо. (5.384) Определение 5.9. Задачей оптимального управления (или просто зада¬ чей управления) для системы (5.374) при предположениях 1, 2 и 3 отно¬ сительно множества S, для функционала J (лг0, tOi и), области допусти¬ мых управлений U и первоначального состояния х0 в начальный момент времени t0 является отыскание управления и из 67, минимизирующего функционал преобразования J (х0, 60, и). Часто не указывают в явном виде зависимость J от х0 и t0 и записывают J (и) вместо J (лг0, 60, и). Поставив общую задачу управления, выделим два специальных слу¬ чая, которые будем называть «частным случаем 1» и «частным случаем 2». Укажем теперь дополнительные предположения, которые должны быть сделаны при определении каждого из случаев, и предоставим чита¬ телю самому их детально сформулировать. Частный случай 1. Список дополнительных предположений: а. Уравнение системы (5. 374) от t явно не зависит, т. е. уравнение системы имеет вид x = f(x, и). (5.385) б. Множество S определяется как S = {xj X (Л, Т2), (5.386) где хх — фиксированный элемент из Rn. Таким образом, частный слу¬ чай 1 представляет собой задачу с закрепленным концом и нефиксиро¬ ванным временем. в. Функция L явно от t не зависит (см. условия За), и функционал дается соотношением J(u) = Jl|x(/), u(t)]dt, (5.387) to где не зафиксировано. Частный случай 2. Список дополнительных предположений: а. Уравнение системы (5.374) явно от t не зависит: лг = /(л\ а). (5.388) 262
б. Множество имеет вид S = S1X(7\, Т2), (5.389) где S — или гладкое подпространство размерности k из Rnf или все Rn. Таким, образом, частный случай 2 также представляет собой задачу с нефиксированным временем. в. Функция L явно от t не зависит, а функция Æ тождественно равна нулю Іт. е. К (х, /) = 0]. Функционал дается соотношением ц ./(«)= Jl [*(/), а(/)] Л. (5.390) G Эти два случая отличаются друг от друга лишь видом множества S. В следующем параграфе для них будет сформулирован принцип минимума. Упражнение 5.17. Необходимо детально сформулировать частные случаи 1 и 2. 5.13. ПРИНЦИП МИНИМУМА ПОНТРЯГИНА Сформулируем принцип минимума Понтрягина. Будем считать, что все предположения § 5.12 остаются в силе. Прежде чем сформулировать теорему, введем некоторую дополнительную терминологию и обозначения. Определение 5.10. Пусть Н (х, р, и)— действительная функция n-мерного вектора х, /г-мерного вектора р и m-мерного вектора ил Н(х, р, u) = L(x, и) + (р, f(x, »)), (5.391) где f (х, и) — функция, определяющая систему [т. е. f (х, у) — правая часть уравнения состояния], и L (х, и) — подынтегральное выражение функционала; Н (х, р, и) называют гамильтонианом задачи и р — допол¬ нительным вектором. В силу предположения 1 из § 5.12 функции Н (х, р, и) и (х,р, и) непрерывны на Rn X Rn X Q, где Q есть замыкание Q в Rm. Далее, (х, р, и) является вполне определенной функцией и равна р, и) — f (х, и). (5.392) Предположим теперь, что х0 — начальное состояние и t0 — началь¬ ное время. Если и (/) —некоторое допустимое управление, ах (/) — траек¬ тория системы, исходящая из х0 = х (/0) и полученная за счет управле¬ ния и (/), то тогда для любой функции р (/) получим x(t) = ^{x(t\ p(t), «(/)] =/[*(/), «(/)]• (5.393) В дополнение к этому, если л — любой n-мерный вектор, то линей¬ ное дифференциальное уравнение вида р(/)= — p(t), »(/)] = ^[x{t),u(t)]-^\x(t), »(/)])'p(f) (5.394) имеет единственное решение р (/, л), удовлетворяющее начальному условию р(/0, л) = л. (5.395) Эти обстоятельства позволяют дать следующее определение: 263
Определение 5.11. Система дифференциальных уравнений порядка 2п х==^-(х’ р> = U); 1 Л/ / I (5.396) Р-- Р> = "О Р I называется канонической системой, связанной с основной задачей. Если и (/) — допустимое управление и х (/) — соответствующая траектория, то говорят, что любое решение р (/) системы (5.394) соответствует и (t) и X (t). Иначе говоря, р (/) соответствует и (/), если р (/) и х (/) — реше¬ ния канонической системы. Теорема 5.5. Принцип минимума для частного случая 1. Пусть (/)— допустимое управление, переводящее (х0, /0) в S = {xj X (Tlf Т2). Пусть х* (/) — траектория по (5.385), соответствующая и* (/), исходящая из (х0, /о) и встречающая S (в первый раз) при (хг, /х), т. е. х* (/J = = Хр Необходимым условием оптимальности и* (/) (для частного слу¬ чая 1) является существование функции р* (/), удовлетворяющей усло¬ виям: а) р* (/) соответствует и* (/) и х* (/), т. е. р* (/) и х* (/) являются решениями канонической системы: **(0 = 4^ [лг*(/), /?*(/), »*(/)]; дн (5.397) р*(а «*(оі и удовлетворяют граничным условиям х*(/0) = *о; •v*(/1)<S1; (5.398) б) функция Н [х* (/), р* (/), а], рассматриваемая как функция и на Q, имеет абсолютный минимум при и = и* (/) для t из [/0, /J, т. е. min Н [х* (/), р*(/), u] = H[x*(t)t p*(t), u*(t)] (5.399) и £ Q или, эквивалентно, #[х*(/), р*(/), й*(/)] <//[х*(/), р*(0, и] (5.400) для всех и из Q; в) функция H [х* (/), р* (/),. и* (01 равна нулю для t из [/0, /J: W[x*(Z), р*(/), «*(/)] = 0, /£[/0, М. (5.401) Теорема 5.6. Принцип минимума для частного случая 2. Пусть а* (/) — допустимое управление, переводящее (х0, /0) в S = Т2), и х* (t) — траектория, удовлетворяющая уравнению (5.388), соответствующая tt* (t), исходящая из (х0, /0) и встречающая S (в первый раз) при tr (т. е. л:* (Zi) = Xi. Необходимым условием оптимальности управления »*(/) (для частного случая 2) является существование функции р* (/), удовлет¬ воряющей условиям: а) р* (/) соответствует #*(/) и х*(/), т. е. р* (/) и х* (/) являются решениями канонической системы: х* = P* (z)> “* (5.402) P* = I** (z)> P* w> u* (z)] (5.403) 264
и удовлетворяют граничным условиям х*(/о)-лг0; лг* (Л) CS; (5.404) б) функция Н[х*(/), р* (/), и], рассматриваемая как функция и на Q, имеет абсолютный минимум при а* (/) для t из [/0, /J, т. е. min Н [х* (/), р* (/), и] - H [х* (/), р* (/), а* (/)] (5.405) и ей или, эквивалентно, Н [х* (/), р* (/), и* (/)] < Н [аг* (/), р* (/), и] (5.406) для всех и из Q; в) функция // [лг* (Z), р* (/), »*(/)] равна нулю для t из [/0, /J: Н [х* (/), р* (/), я* (/)] = 0; t Ç [Zo, /J; (5.407) г) если — гладкое подпространство из Rn размерности k, то век¬ тор p*(G) трансверсалей к Sj в точке х* (4): (р*(/і), х —х*(/х)) ~0 для всех х из М [л:* (/х)]; (5.408) где A4 [X* (/JJ — плоскость, касательная к Si в точке х* (/J, т. е. М [х* (ZJ] = |Х : [х* (Zj)], X — X* (Л)/ = 0 ДЛЯ 4=1,2, ..., п— где gг (х) == 0, g2 (х) = 0, . . . gn_k (х) — 0 — уравнения Sj (см. § 3.13). Итак, вектор р* (/J нормален к множеству цели Si в точке х* (/J. Если Si = Rn> вектор р* (/г) будет нулевым вектором, р* (/J = 0. Нетрудно заметить, что вторая теорема отличается от первой допол¬ нительным предположением г), где отмечается трансверсальность допол¬ нительной переменной к множеству цели. Пункт б) каждой из теорем можно сформулировать следующим образом. В любой конкретный момент времени, допустим /, из интервала I/o, /J, л:* (/), и* (/) и р* (?) являются вполне определенными векторами. Пункт б) теоремы утверждает, что число Н [х* (/), р* (/), а* (/)] меньше или равно числу Н [х* (/), р* (/), о], где о — любой вектор из Q. Мы сформулировали теоремы в том виде, в котором они будут исполь¬ зоваться в последующих главах. Для того чтобы иметь возможность рас¬ сматривать исключения, введем в формулировку теорем дополнительную постоянную р*. Будем рассматривать функцию §(х, р, и) вместо функ¬ ции Н (х, р, и), убедившись в том, что существует неотрицательная по¬ стоянная р*, р*^0и вектор р* (/) такие, что р* (о — 4г К р* и* Ро ] = = ~р0* 4гІх* »*(01) P* (О- Все остальные утверждения теорем 5.5 и 5.6 удовлетворяются при замене И на Исключения имеют место при р* = 0. Если р* =^= 0, то можно выбрать р* == 1 Ч 1 Мы можем это сделать, так как уравнение относительно р (t) линейно. 265
Задачи, которые мы будем рассматривать ниже, не являются исклю¬ чениями. Поэтому в дальнейшем не упоминается р* (за исключением § 5.15 и 5.16, где приводится эвристическое доказательство принципа минимума, и § 6.21 и 6.22, в которых и рассматриваются вырожденные задачи). 5.14. ЗАМЕНА ПЕРЕМЕННЫХ С помощью различных замен переменных покажем, как можно вывести принцип минимума для общей задачи управления из теорем 5.5 и 5.6. Предположения и обозначения § 5.12 снова остаются в силе. Начнем с того, что снимем требование, касающееся независимости системы и функционала от времени; затем рассмотрим случай, когда ко¬ нечное время фиксировано и в заключение рассмотрим задачу, в которой имеется конечная «стоимость». В каждом случае мы укажем дополни¬ тельные предположения и затем выполним замену переменных, которая сведет нашу задачу к одному из частных случаев. а. Система и функционал зависят от времени. Предположим, что уравнение системы имеет вид x(t) = f[x(t), #(/), /]. (5.409) Предположим, для начала, что множество цели S имеет вид S={x1}x(T19 Л), (5.410) где Хі — фиксированный элемент из Rn; и что L имеет вид L(x, и, t). (5.411) Функционал определяется соотношением ti J L[x(t)t u(t\ t]dt, (5.412) t0 где /і — нефиксированно. Как обычно, х0 и tQ обозначают начальные состояние и время. Мы хотим свести задачу управления для системы [см. уравнение (5.409)] и функционала (5.412), зависящих от времени, к одному из част¬ ных случаев — в данном примере, как это станет ясно из дальнейшего, к частному случаю 2. Мы сделаем это, введя дополнительные фазовую координату и уравнение состояния и применив затем принцип минимума к этой новой задаче. Пусть хп+1 обозначает вспомогательную переменную. Рассмотрим систему порядка п + 1 вида X (t) =- f [Л (/), « (Z), х„+1]; I ? (э.41о) хп+1 (/)=1 J и задачу управления для этой системы. Даны начальное время /0 и начальное условие х0 to [т. е., хп+1 (/0) = = /01 в пространстве Rn+1. Пусть S = Sj X (Tlf Т2) —множество S в І^п+і X ?\), где Si —прямая (одномерная), определенная уравне¬ ниями Хі — xlt J = 0, х2 — xlt 2 = 0, . . ., хп — хы = 0, где — ком¬ поненты вектора х± из уравнения (5.410). Найдем допустимое управле- х0 to ние и, переводящее этом функционал 7і(а): ^о) в S1X(Tі, T2) G Л(«) = J L[x(t), u(t), xn+1 и минимизирующее при (/)Ж (5.414) 266
Мы видим, что эта задача эквивалентна исходной задаче [для системы (5.409)] в том смысле, что если управление оптимально для одной из них, то оно будет оптимальным и для другой. Новая задача имеет точно такой же вид, как и частный случай 2. Таким образом, можно применить теорему 5.6 для доказательства того, что если и* (/) оптимально, то существуют функ¬ ции р* (/) и р*+1 (/), для которых удовлетворяются следующие условия: [** (/), p*(t), «*(/), Х*+1(О, р*+1(/)]; P*(t)=-^- [х*(0, «*(0. <+1(0, Р„*+1(0]; <+1(0=^г[х*(0, р*(0, »* (0, <+1(0, р:+і(/)]; Р*+1(0 = —^-[**(0. и*X*+1(Z)> Р*+1(0], где Нх (х, р, », хп+1, рп+1) дается соотношением Нх (х, р, и, хп+1, рп+1) = = L(x, «, хп+1) + (р, f (х, и, х„+1)) -і-р„+1-1 X* (to) = Хо x*+i (to) = fa X (t\) = Х\ Xn+l(t\) = ti’, (5.415) (5.416) (5.417) (5.418) 2) гамильтониан [х* (t), р* (t), и, х*+1 (t), р*+1 (/)], рассматри¬ ваемый как функция от и на Й, имеет абсолютный минимум при и — и* (t) для t из [Zo, /,]; 3) Нх [х* (t), р* (t), и* (t), х*+1 (t), p*+ï (/)] = 0 для t из [Zo, Zj; 4) п + 1 — мерный вектор Р*(Л) Рп+ЛЧ) трансверсалей к Sj при х} t, , так что р:+і(о = о. (5.419) Полученные результаты можно использовать для решения исходной задачи. При этом достаточно заметить, что вспомогательная переменная хп+1 представляет собой просто время t. Для исходной задачи опреде¬ лим функцию Н(х, р, и, t) n-мерных векторов х ир, /n-мерного вектора и и времени /, положив //(х, р, », /) = Л(х, », /) + (р, /(х, », /)). (5.420) Здесь Н называют гамильтонианом задачи, а функцию р —дополнитель¬ ной переменной. Теорема 5.7. Принцип минимума для задачи с закрепленным концо