Текст
                    ИЗДАТЕЛЬСТВО  С.-ПЕТЕРБУРГСКОГО
 В.  С.  Новоселов,  В.  С.  Королев
 АНАЛИТИЧЕСКАЯ  МЕХАНИКА
УПРАВЛЯЕМОЙ  СИСТЕМЫ
 УЧЕБНОЕ  ПОСОБИЕ


УДК 531.01 ББК 22.21 Н24 Рецензенты: д-р физ.-мат. наук, проф. А. С. Шмыров (С.-Петерб. гос. ун-т), канд. физ.-мат. наук, доц. А. Н. Коваленко (Сев.-зап. ин-т пе¬ чати С.-Петерб. гос. ун-та технологии и дизайна) Печатается по постановлению Редакционно-издательского совета факультета прикладной математики — процессов управления Петербургского государственного университета Новоселов В. С., Королев В. С. Н24 Аналитическая механика управляемой системы. Учебное пособие.— СПб.: Изд-во С.-Петерб. ун-та, 2005.— 298 с. ISBN 5-288-04010-9 Книга представляет собой целостное изложение классических основ аналитической динамики и новых аналитических методов по оптими¬ зации движения управляемых систем. Дается наглядное представление основных результатов математической теории управления. Теоретиче¬ ские положения иллюстрируются решением базовых задач управления орбитальным и вращательным движением тел в гравитационном поле. Предназначено для студентов и аспирантов факультетов математи¬ ческого и физико-технического профиля, а также специалистам, работа¬ ющим в области управления движением. Библиогр. 20 назв. Ил. 36. ББК 22.21 © В. С. Новоселов, В. С. Королев, 2005 © Издательство С.-Петербург- ISBN 5-288-04010-9 ского университета, 2005
Введение Учебный материал настоящего пособия представляет часть курса аналитической динамики управляемых систем, который является про¬ должением основного курса теоретической механики. Своеобразие по¬ становки задач управления движением механических систем связано с иведением в рассмотрение, кроме обычных действующих сил, дополни¬ тельных, так называемых управляющих сил, которые могут изменяться но нашему усмотрению и должны определяться вместе с движением ме¬ ханической системы при выполнении некоторых условий. Тем самым две задачи механики — прямая (определение движения по заданным силам) и обратная (определение сил но заданному движению) — здесь переме¬ шиваются, и возникает новая синтезированная задача. В настоящем пособии для построения общей теории решения задач управления движением используются аналитические и качественные ме¬ тоды теоретической механики при их определенном расширении. Вместе с тем будут рассмотрены и традиционные для курса теоретической меха¬ ники разделы: уравнения движения в обобщенных координатах, теория колебаний, вращательное движение твердого тела и движение в грави¬ тационном поле, связанные с задачами управления движением. Как известно, механика —это наука о движении. Слово теоретиче¬ ская показывает, что изложение не использует постоянного обращения к жсперименту, а проводится математически на основании аксиоматиче¬ ски принятых постулатов, содержание которых определяется глубинны¬ ми свойствами материального мира. Поэтому теоретическая механика является фундаментальной основой научного познания. Трудно прове¬ сти четкую грань между теоретической механикой и математикой, она размыта. Многие методы, созданные при решении задач механики, бу¬ дучи сформулированными на внутреннем математическом языке, полу¬ чили абстрактное продолжение и привели к созданию новых разделов математики. Основной постулат механики заключается в сохранении векторной меры — количества движения при материальных взаимодействиях. Раз- 3
всрнутое его выражение дается тремя законами Ньютона. Можно обнаружить два четко выраженных направления и теоре¬ тической механике. Первое направление, условно названное векторно- матричным, построено на применении законов (теорем) изменения ко¬ личества движения Р = mv, момента количества движения G - г х Р и кинетической энергии Т = mv2/2 как для материальных точек, так и в целом для механической системы (или для отдельных тел, входя¬ щим в систему) при соответствующем определении сил взаимодействия между ними. Выполняется непосредственное проектирование векторных величин на ортогональные оси системы координат. Второе направление, называемое аналитической механикой, исполь¬ зует понятие вариации как разности величин на действительном движе¬ нии и любом возможном в данных условиях движении. Ввиду инвариант¬ ности характеристических функций и скалярных произведений при за¬ мене переменных допускается широкий выбор тина фазовых координат, а проектирование на соответствующую ось в многомерном пространстве получается автоматически путем записи скалярного произведения в со¬ ответствующих переменных. Надо заметить, что соединение; указанных двух направлений и обеспечивает успешное применение методов теоре¬ тической механики к конкретным проблемам. В основном аналитическая механика была создана грудами предста¬ вителей следующих друг за другом трех поколений. К 1087 г. относит¬ ся публикация «Математических начал натуральной философии» Нью¬ тона, а в год смерти Ньютона (1727) 20-летний ’*)йлер публикует свою первую работу по применению математического анализа и механике. Че¬ рез пять лет после смерти Эйлера (1788) Лагранж в Г>2-летнем возрасте публикует «Аналитическую динамику». Пройдет еще ,'Ш лет, и будут опубликованы труды по аналитической динамике трех знаменитых со¬ временников: Гамильтона, Остроградского и Якоби. Векторно-матричные методы также исследованы в трудах названных корифеев механики. Особо отметим важность введения понятия век гора. В 1843 г. Гамильтон в качестве обобщения комплексного числа дал опре¬ деление кватерниона а = ао 4- aiii 4- 0212 4- аз'13. Здесь а0, щ , «2, «з ве¬ щественные числа; ii, i2, i3 — символы неэквивалентных друг другу свое¬ образных мнимых единиц \\ = —1, iii2 = —1211 ~ *з, далее с учетом подстановки 1 —► 2 —> 3 —> 1. Над кватернионами можно выполнять ал¬ гебраические операции: сложение и умножение. Геометрическая интер¬ претация этих действий и привела в конце XIX в. к созданию векторной алгебры и векторного анализа. Если положить ао = 0, то сумма кватер¬ нионов равносильна сумме векторов в Я3, вещественная часть произве¬ дения кватернионов равна скалярному произведению векторов со знаком минус, а мнимая — эквивалентна их векторному произведению. Пример 4
открытия кватерниона показал плодотворность абстрактных обобщений понятия числа. Вводятся понятия матрицы и линейного оператора. Интерес математиков, физиков и астрономов к задачам определе¬ ния движения видимых небесных тел (Луны, планет и комет) также способствовал развитию механики. Открытия и работы Коперника «Об обращении небесных тел», Галилея, Кеплера, опубликованные в XVI- XVII вв., теория движения Луны Даламбера и Пуассона, пятитомная «Небесная механика» Лапласа конца XVIII — начала XIX в. и труды уже упомянутых классиков позволили создать достаточно полную тео¬ рию движения в гравитационном поле, давая возможность применения аналитических и численных методов к исследованиям других задач ме¬ ханики. Необходимость расширения методов теоретической механики для ре¬ шения задач управления движением вызывалась развитием техники. В последней четверти XIX в. И. А. Вышнеградский (бывший в течение че¬ тырех лет при Александре III министром финансов) и Дж. К. Максвелл создают теорию регулятора Уатта. Здесь управляющая сила выбирается в виде функции от фазовых переменных. Такой тип управления получил название управления с обратной связью. Теория оптимального выбора обратной связи имеет тесную связь с теорией уравнения Гамильтона - Якоби теоретической механики. Начиная с работ Лагранжа, в теоретической механике зародилось особое направление по изучению движения с помощью положительно определенных функций фазовых координат. Сначала такими функция¬ ми служили кинетическая и потенциальная энергии, а после создания А. М. Ляпуновым в конце XIX в. теории устойчивости движения стали широко использоваться различные функции. Метод Ляпунова оценки фазовых переменных по изменению некоторой функции или функцио¬ нала на интегральной траектории оказался весьма глубоким и позволил в 70-х гг. XX века В.И.Зубову построить конструктивную математиче¬ скую теорию управления, имеющую широкие приложения. Поскольку курс теории управления является самостоятельной дис¬ циплиной и читается отдельно, теоретические вопросы использования в управлении функций Ляпунова в настоящем курсе не затрагиваются. В этой связи предлагаемое пособие может рассматриваться как дополнение к углубленному изучению математической теории управления. В теоретической механике широко используются геометрические ме¬ тоды. Геометрическая интерпретация повышает образность и строгость изложения. Работами Л. С. Понтрягина [18] и целой плеяды отечествен¬ ных ученых во второй половине XX в. создана математическая теория управления на основе абстрактных геометрических методов. Абстракт¬ ная геометризация требует введения большого количества геометриче¬
ских терминов, изменения математического языка и создает дли непод¬ готовленного исследователя трудности при решении конкретных :шдач. Если от дифференциальных уравнений движения можно перейти (на¬ пример, в линейной системе) к заданию линейного оператора и гиль¬ бертовом пространстве, то оптимизация движения своди гея к решению задачи моментов Н. Н. Красовского с использованием методов функци¬ онального анализа [10]. Настоящее пособие может служит!» также для подготовки к изучению геометрической ветви математической теории управления и методов теории оптимального управления. В аналитической динамике есть своя механическая специфика. В математической теории управления критерий качества выбирается или удобным для исследования, или принимается как минимум времени вы¬ полнения задачи. В базовых нелинейных задачах механики критерий качества определяется физическими условиями, а переход к вспомога¬ тельной задаче оптимального быстродействия приводит к существенно¬ му усложнению. Поэтому возникает необходимость построения общей схемы оптимизации для нелинейной системы с заранее заданным ми¬ нимизируемым функционалом и сложными граничными условиями. Это и предлагается в настоящем курсе. Другой особенностью является по¬ следовательное применение аналитического метода А. Пуанкаре решения уравнений в виде разложения по степеням малого параметра, а также ис¬ пользование в качестве иллюстрации задач по оптимизации движения в центральном гравитационном поле. Книга служит учебным пособием по курсу аналитической динамики управляемых систем, разработанному на факультете прикладной мате¬ матики — процессов управления Санкт-Петербургского университета по инициативе чл.-кор. Академии наук Российской Федерации, лауреата Го¬ сударственной премии В. И. Зубова. Курс основан на работах профессо¬ ров факультета В. И. Зубова [4-8] и В. С. Новоселова [11-15]. Вместе с тем широко используются достижения ряда отечественных и зарубежных ав¬ торов по оптимальному управлению в механических системах. Особо от¬ метим обширную монографию М. Атанса и П.Фалба [1], в которой на иной методической основе решены конкретные задачи управления дви¬ жением, а также книгу по управлению колебаниями Ф. Л. Черноусько, А. Д. Акуленко, Б. Н. Соколова [19]. Глава 1 (кроме разд. 1.1.4) написана В. С. Королевым, гл. 2-5 и разд. 1.1.4 В. С. Новоселовым. Настоящая книга является расширенным пере¬ изданием учебных пособий тех же авторов [16, 17].
Глава 1 Уравнения движения механической системы 1.1. Уравнения движения в форме Лагранжа второго рода 1.1.1. Обобщенные координаты и обобщенные силы Аналитическая динамика занимается исследованием математи¬ ческих моделей механических форм движения конечномерных ма¬ териальных систем. Абсолютное пространство, в котором реализу¬ ется движение каждой материальной точки Р массы га, считается однородным изотропным евклидовым пространством Еп, п=1,2,3. При этом точка Р» рассматривается как элемент М* аффинного пространства, наделенный дополнительными свойствами (имеет в качестве меры инерции массу га*). Абсолютное время t как характе¬ ристика длительности процессов считается независимым парамет¬ ром, который непрерывно изменяется, однородно и одинаково во всех точках пространства. Выделенная каким-либо образом система материальных точек М -- {Mi, i = 1 ,N} называется материальной или механической системой. Под движением системы М мы понимаем совокупность дважды непрерывно дифференцируемых отображений г* : R1 —► /?3, ставящих в соответствие моменту времени t £ R1 точки с ко¬ ординатами xiti, X2,i,X3,i в линейном пространстве Д3, которое ас¬ социировано с Е3. Если расстояния между точками системы не изменяются, то система называется неизменяемой. Сплошная или связная неизменяемая система носит название абсолютно твердого тела или просто твердого тела. Требование связности приводит к тому, что мы имеем единое тело с непрерывным распределением 7
массы бесконечного числа точек. Механическая система состоит из конечной совокупности материальных точек или твердых тел, для каждой из которых движение зависит от положения и движения других элементов системы (они определяют внутренние силы вза¬ имодействия F1), а также может учитывать влияние прочих тел, не включенных в данную совокупность (внешние силы Fft). Если существуют ограничения или условия для точек системы М на их положение г* и скорости v* = то такие ограничения называют связями, а саму систему считают несвободной. Аналити¬ чески эти ограничения записывают в виде уравнений (или нера¬ венств) Л(г«, iri, t) = 0, ( г», t)<0,)i = 1 ,ЛГ, j = TjK. (1.1) Реализация этих условий происходит при действии дополни¬ тельных сил Fr, которые называют силами реакции связи. Соглас¬ но принципу освобождаемости от связи можно отбросить ограни¬ чения на движение, если к действующим силам F добавить силы реакции связей. Основное уравнение динамики точки или второй закон Ньютона для точки с постоянной массой т -j-P = Р = rav = mr = raw = F (1.2) at позволяет записать уравнения движения (1.2) точек системы М с учетом проекций всех сил на оси координат Р/с,г (?1, Tl, i), k — 1,2,3, tjl — 1, AT, а в некоторых случаях сразу получить их решение. Например, хорошо известно решение линейного уравнения с по¬ стоянными коэффициентами х + 2пх + к2х = 0, которое описывает прямолинейное движение точки массы га ( механическая система с одной степенью свободы) под действием упругой силы Fi = —к2тг и силы сопротивления, пропорциональной первой степени скоро¬ сти, F2 = — 2nrav. Если к ним добавляют вынуждающую силу F3 = F(£), то решение можно получить в квадратурах или в ви¬ де явных функций времени и начальных данных. Исследовано движение материальной точки в однородном поле постоянной силы F (например, силы тяжести при малых перемеще¬
ниях над поверхностью Земли) или под действием явно заданных сил в виде функций отдельных переменных F(£), F(xfc) или F(xfc). Ньютоном получено общее решение при движении точки в центральном гравитационном поле, которое также позволяет опи¬ сать решение для задачи двух тел (движение материальных точек 7fti,ra2 под действием сил их взаимного гравитационного притяже¬ ния). Однако более эффективный и универсальный подход для со¬ ставления уравнений движения произвольной механической систе¬ мы был предложен Лагранжем. Вводятся вспомогательные переменные q\(t),... ,qs(t), которые называют обобщенными координатами. Число таких переменных s называют числом степеней свободы положения. Лагранжевы ко¬ ординаты предполагаются независимыми и позволяют полностью определить положение всех точек системы в процессе движения из соотношений n = ri(qu...,qe,t), (1.3) а следовательно, и координаты точек Xk,i = Xfc,i(tfi,..., qs, t) для любого момента времени t. Выражение (1.3) обращают в тождества уравнения связей (1.1). В реальных задачах можно вводить обоб¬ щенные координаты различным образом (в том числе декартовы или криволинейные координаты отдельных точек, углы поворота тел и многое другое), используя уравнения связей для определе¬ ния прочих параметров. Удачный выбор позволяет получить более удобные уравнения и успешнее решить задачу. Например, для свободной системы М в Е3У содержащей только N точек, число степеней свободы s = 3N. При наличии К урав¬ нений голономных связей (т.е. геометрических, вида /(г,t) = 0) получим s = 3N — К. Чтобы определить число степеней свободы для одного твер¬ дого тела, рассмотрим связанное с ним евклидово пространство Нп, в котором координаты точек тела не изменяются. Базисом Еп служит любая последовательность из п + 1 линейно незави¬ симых точек Mo, Mi,..., Мп или совокупность (Mo, ei,..., еп), об¬ разованная произвольной точкой Mo € ЕУ1 и линейно независимы¬ ми векторами из векторного пространства Дп, отвечающего Епу которая называется п-мерным репером в Еп. Точка Мо называ¬ ется началом репера. Каждому базису (Mq, Mi,..., Мп) отвечает 9
репер (Mo, MoMi,..., МоМп), и наоборот, каждому реперу можно поставить в соответствие базис (Mo, Moei,..., Мое„), где под Мое* понимается точка М* из Еп, которая отвечает концу вектора е*, имеющего начало в точке Мо. Поэтому мы не будем делать раз¬ личия между понятиями базиса и репера в Еп. Векторы можно полагать единичными (после нормирования). Заметим, что Еп не является линейным пространством, так как сумма двух точек из Еп не может быть определена. Положение точек твердого тела как неизменяемой системы при движении будет определяться положением ортонормированного ре¬ пера пространства, связанного с телом относительно неподвижного пространства Еп. В случае пространственного движения рассмат¬ ривается перемещение в трехмерном евклидовом пространстве Е3. Возможны и частные случаи движения: плоской фигуры в Е2 или отрезка в Е1. При изучении свойств движения тела мы можем мыс¬ ленно расширить границу реального тела до любых удобных для нас размеров, поскольку эти свойства определяются движением со¬ ответствующего пространства Еп, п = 1,..., 3, жестко связанного с телом. Теорема. Число степеней свободы s для тела при его произ¬ вольном движении в Еп равно - Для доказательства рассмотрим многообразие ортонормирован- ных реперов пространства Еп. Произвольный выбор начала О дает п независимых параметров, произвольный выбор единичного век¬ тора ei дает п — 1 параметров (один параметр снимается за счет нормировки), затем выбираем уже в Д71-1, что добавляет гг — 2 параметров и т.д. В результате получим s = n + (n-l) + (n-2) + ... + l= n(nJ~ . (1.4) z Пример 1. Для свободного твердого тела в трехмерном случае s = 6. Если любое новое положение репера определяется из перво¬ начального с помощью сдвига на вектор а (поступательное движе¬ ние тела), то s равно числу независимо изменяемых компонент век¬ тора а, т. е. 5 = п = 3. Если одна из точек тела не меняет своего по¬ ложения (вращение тела относительно неподвижной точки Мо), то s равно размерности многообразия допустимых положений орл ов, связанных с телом ei,... ,еп. Таким образом, s = п(п — 1)/2 -- 3. 10
Пример 2. Можно определить число степеней свободы s про¬ извольной системы N точек и L тел, ограниченной голономны- ми связями, вводя п параметров для каждой точки и (1.4) пара¬ метров для каждого тела, а затем, вычитая число связей, имеем .s = Nn + Ln(n -f 1)/2 — К. На практике бывает проще опреде¬ лить число степеней свободы, выделяя те параметры, которые мо¬ гут независимо изменяться при движении системы. Функции (1.3) определяют де&ст&ияпелъноелеремещение точки, а его направление задается вектором dr = г(£ 4- dt) — г(t) = vdt = - dxiei 4- dx2&2 + dxзез, который удовлетворяет продифферен¬ цированному уравнению для голономной связи /(xi, Х2, £3, t) = О вида S^-dxi + -j^-dx 2 + jr~dx 3 + Щ-dt = 0. (1.5) OX i OX2 OXз ut Уравнению (1.5) могут удовлетворять и другие вектора вида dr' = dx[ei 4- dx'2е2 4- dx'3e3, определяя множество возможных пе¬ ремещений. Сравнивая близкие возможные положения гиг' точки, которые соответствуют уравнению голономной связи /(г, t) = 0 и /(V, t) = 0, определим понятие виртуального^еремещепия (допу¬ стимого в силу связей малого отклонения) 6г = 6xiei 4- 6x202 4- I бхзвз. Получим их 1 ох 2 Ох% 'Таким образом, виртуальные и возможные перемещения совпадают в случае стационарных связей, когда df /dt = 0. С другой стороны, учитывая (1.3), имеем s гч 6ri = Ti{q', t) - 14(17, t) = ^2 (1.6) fc=i qk I до bqk — Qk{t) — Qk(t) — изохронные вариации обобщенных коорди¬ нат. Пусть Fi — равнодействующая всех сил, действующих на точ¬ ку Pi механической системы. Элементарной работой всех сил на¬ зывают dA = Если вместо действительных перемеще¬ ний точек рассматривают виртуальные, то аналогичное выражение определяет виртуальную работу П
N ЬА = ^2¥г6п. (1.7) г= 1 Если виртуальная работа всех сил реакции связей 6Л О, то та¬ кие ограничения называют идеальными связями. Следовательно, выражение для виртуальной работы (1.7) не будет содержать сил реакции таких связей. В частности, если все силы реакции сии:*ей ортогональны виртуальным перемещениям точек приложении, это соответствует движению по идеально гладкой поверхности Снул тре¬ ния. Если силы реакции неидеальны, то они остаются в уравнениях наравне с другими действующими силами (например, силы трения или силы сопротивления при движении точки в жидкости). С уче¬ том (1.7) запишем “=ххё !£*«*)=d-в) i=l к=1 Чк к=1 г=1 Чк к= 1 Полученные выражения Qk называют обобщенными силами, соот¬ ветствующими координатам qk. Размерность обобщенных сил равна размерности работы, деленной на размерность обобщенной коор¬ динаты. В общем случае это функции от обобщенных координат q, обобщенных скоростей q и времени t. На практике для определения обобщенной силы Qk вычисляют виртуальную работу на перемеще¬ нии, вызванном изменением только соответствующей координаты на бесконечно малую величину Sqk- При равновесии механической системы с идеальными связями виртуальная работа (1.7) всех активных сил равна нулю. Это прин¬ цип виртуальных перемещений, который позволяет получить ре¬ шение многих задач статики. 1.1.2. Общее уравнение динамики. Функция Лагранжа При движении системы с идеальными связями выполняется принцип Даламбера-Лагранжа: в каждый момент движения сумма работ активных сил F и так называемых сил инерции Fm = -mw на виртуальных перемещениях равна нулю. Это позволяет записать общее уравнение динамики 12
N 53(F* - miWi)6ri = 0. (1.9) t=l Переходя к обобщенным координатам (1.3), учитывая выражения для вариаций (1.6) и обозначения для обобщенных сил в (1.8), из (1.<)) получим общее уравнение динамики в обобщенных координа¬ тах 3 N В ^2Sqk(Qk - 53miW*;Ti) = °- (1Л0) k=l t=l Чк 'Гак как вариации обобщенных координат могут выбираться неза- иисимо, то выражения в скобках в (1.10) обращаются в нуль. Запишем выражение для виртуальной работы N N 53 FГ&П = - 53 miwiSri = i— 1 t=l V- dvj drj ч =-£го,*(£^г*>= = <1П) Дифференцируя (1.3) и (1.6), можно проверить равенства d ^.d дп dti d д , d . jtS'< = 4jt'<) = Sv<,Wt = Wt, = <112) Кроме того, можно получить выражение для производной d , Дч 9fi х Д* dvi дт% 5(gm,v‘55) = gm,*-5S+ +X>‘v‘5(Ii) = Bl + D‘' <u3) г=1 13
Введем обозначение для кинетической энергии, которая в де¬ картовых координатах является положительно определенной квад¬ ратичной формой для произвольной механической системы T(q,q,t) = = 5^miViVi- (1Л4) t= 1 г= 1 С учетом полученных выражений (1.11)—(1.14) из общего урав¬ нения динамики (1.10) для голономной механической системы за¬ пишем уравнения движения в форме Лагранжа второго рода Обобщенные силы для механической системы называются ква- зипошенциальными или обобщенно потенциальными, если суще¬ ствует такая силовая функция V(q,t) или функция i7(g, £), у кото¬ рых частные производные по обобщенным координатам дают нуж¬ ные выражения о =Vf —= —= Qk ^ l8qk dqk dqk i— 1 Если при этом ЭП/dt = 0, то обобщенные силы называют по¬ тенциальными, функция II(qx,... ,q9) называется потенциальной энергией системы, а для механической системы, у которой в этом случае сохраняется полная энергия, используют название консер¬ вативной системы. Возможно разделение обобщенных сил на части Q = Q1 -f Q2, если одна из частей имеет силовую функцию (например, Q1 = ^-)- Рассмотрим функцию Лагранжа для квазиконсервативной си¬ стемы =T(q,q,t)~ n(q,t) (1.16) или L(q,q, t) = T(q,q, t) — IIi(q, £), если часть сил Qx квазипотенци- альна. Тогда уравнения Лагранжа второго рода (1.15) имеют вид = (или =<3fc). = (117) Уравнения Лагранжа (1.15) или (1.17) представляют собой си¬ стему из s обыкновенных дифференциальных уравнений второго 14
порядка, которые можно разрешить относительно старших произ¬ водных qk благодаря положительной определенности квадратичной о тносительно qk части кинетической энергии. Если вводятся допол¬ нительные переменные yk = qk, то уравнения имеют вид системы 2.s уравнений первого порядка. В частном случае, если функция Лагранжа не зависит от какой- либо координаты (dL/dqk = 0 при fc = г), то соответствующее урав¬ нение из (1.17) дает интеграл дЬ —- = const. (118) Координата qi и соответствующий ей интеграл называются цик¬ лическими. Пример. Рассмотрим движение точки в центральном гравита¬ ционном поле под действием только силы Ньютона F = — т эе2г г-3. В качестве обобщенных координат при движении точки в плоскости вводим полярные координаты (г, у?). Виртуальная работа 6А = FSr — —тя?г~2 Sr. Следовательно, обобщенные силы Qr = — mae27'-2, Q^ = 0. Кинети¬ ческая энергия точки в полярных координатах Т = \ш(г2 4- т2ф2), потенциальная энергия П = —mae2r_1. Тогда функция Лагранжа _ 1 /.О 9 . 9 \ ЗС L — -m(r 4- г ф) 4 m—. 2 г Уравнения движения (1.15) или (1.17) принимают вид г — гф2 — — ае2г-2, -(г2ф) = 0. at Последнее уравнение можно сразу проинтегрировать: г2ф = const. Для циклической координаты (р получили известный интеграл пло¬ щадей. 1.1.3. Свойства кинетической и потенциалы юй энергии Структура выражения для кинетической энергии Т системы, записанной через обобщенные координаты q и обобщенные скоро¬ сти 7, определяется как сумма квадратичной и линейной формы по 15
скоростям, а также слагаемого, не зависящего от скоростей. Дей¬ ствительно, из (1.14) и (1.3) получим ^ 3 3 = 2 ak'i qk Чэ ^к Чк с^’ t) = Т2 + Т\ + То, (1-19) k,j=l к= 1 где введены обозначения м 9 akj(Qit) — mi тг~ тг~ j Т2 = ~ о>к j qk4j, (1.20) ti dqk dq* 2k% N = 5Zmi Ti = (1.21) dqkdi ^ c(«»t) = ^53mi(^)2 = r°- (L22) i—1 В случае склерономной механической системы (связи стационарны, не зависят явно от времени, dri/dt = 0) получим 1 5 Т — Г<2 = - afcj (1.23) kj=l При этом коэффициенты не зависят явно от времени, матри¬ ца А, составленная из них, является невырожденной (определитель отличен от нуля при любых q, £), а сама квадратичная форма будет определенно положительной при любых преобразованиях коорди¬ нат (обращается в нуль только при одновременном обращении в нуль всех скоростей q). Это условие позволяет разрешить уравне¬ ния Лагранжа второго рода относительно старших производных <7, так как после дифференцирования в (1.15) по обобщенным скоро¬ стям q получим систему линейных уравнений относительно q, опре¬ делитель которой detA Ф 0. 16
13ыразим производные по времени от кинетической и квазипо- тппциальной энергии dT А/ЗГ.. дТ , дТ ^ ~]^ддкЯк + dqk4k)+ dt ^ d ,Лаг ., 4^(d дт &т. дт ~ dtlkdqk S'dtdqk dt ’ ^ - v — • dt —J dqk dt Используя теорему Эйлера об однородных функциях и уравне¬ ния (1.15), запишем _ d (от . т X . ОТ dn дП ^ 2 Ж ~ dt{2T2 + Tl) + ~di + ~dt~'m~PQhqh' к=1 где N2 = X!fc=i <2* Як — мощность непотенциальных сил. Аналогично уравнению (1.24) можно выразить производную функции Лагранжа dL 8L .. dL . dL d dL . dL Tt = + + Ж = 35<‘>+ «' (1'25> Если функция Лагранжа не зависит явно от времени dL/dt = 0, то из (1.25) следует равенство 12§-^-^±§-Як-Т + П = 1г. fi dqk ti dqk Учитывая однородность функций Т2 (1.20) и Т\ (1.21), получим выражение для обобщенного интеграла энергии Т2-Т0 + П = h. (1.26) Если рассмотреть аналог полной механической энергии Е = Т + П для несклерономной системы, можно записать равенство
Для склерономной системы кинетическая и потенциальная энергии не зависят явно от времени, в этом случал! ч\ (1.2(>) получим известное выражение интеграла энергии Е = Т I II h const. Ес¬ ли силы не все потенциальны, то изменение энергии определяется их мощностью dE/dt = N2. 1.1.4. Анализ обобщенных сил на осноис. теории канонической структуры силовых полей В. И. Зубова Если выражение декартовых компонент силы, приложенной к материальной точке, четко определяется физическими свойствами этой силы, то обобщенная сила механической системы представ¬ ляет собой более сложное понятие. Поэтому интересен чисто ма¬ тематический анализ возможных типов обобщенных сил на основе канонической структуры силовых полей В. И. Зубова [8, с. 141 145]. • Пусть обобщенные силы будут линейными однородными функ¬ циями координат Q = А<7, где Q = (Qi,..., Qs) и q = (q\,..., qs) — векторы или матрицы-столбцы с элементами Qi и qi соответствен¬ но; Л —линейный оператор или матрица sxs, элементы которой могут быть функциями времени. Вектор обобщенных сил запишем в виде Q = Q1+Q2, Ql = \iA + АТ) q,Q2 = l(A- A') q, (1.27) где т — знак транспонирования; матрица (А + Ат) — симметричная; матрица (А — Ат) - кососимметричная. Тогда Qi = -?Ej-,n1 = ~q-'(A + A')q. (1.28) Если ввести в рассмотрение функцию Лагранжа L\ = Т — /7i, то уравнения Лагранжа второго рода (1.17) с учетом (1.27) и (1.28) примут вид d дЬ\ дЬ\ _ 2 dt dq dq При этом qTQ2 = \qT [А — AT)q = 0, т.е. сила Q2 ортогональна вектору q. • Если обобщенные силы являются линейными однородными функциями лагранжевых скоростей Q = В q, где элементы ма г- 18
I ищи В могут зависеть от времени и лагранжевых координат, тогда Q = Ql + Q2, Q1 = \{В + ВН q,Q2 = \(B- В*) д. И пом случае Ql=-^,* = -\qT(B + B')q. (1.29) Мели Ф неотрицательная, ее называют диссипативной функцией, (•(.ini Ф положительно определенная — функцией полной диссипа- ци.и. Силы Q1 в случае (1.29) называются диссипативными, кине¬ тическая энергия под действием таких сил уменьшается. Элементарная работа силы Q2 на действительном перемещении и автономных (стационарных) лагранжевых координатах, для ко¬ торых dr(q, t)/dt = 0, будет qT Q2 dt = ^ qT (В — BT) q dt £ и ввиду косой симметрии матрицы В — Вт оказывается равной ну¬ лю. 'Такие силы Q2 называют гироскопическими [8, с. 82-136]. При движении под действием только гироскопических сил кинетическая hi ер гия системы не изменяется. • Пусть обобщенные силы являются нелинейными непрерыв¬ но дифференцируемыми функциями обобщенных координат и по- прежнему могут зависеть от времени Q = Q(q,t). Положим Qi = V(q,t)= f1 iZqkQk(z,t)d\, z = Xq. dqi Jo t[ Иыполним преобразования Ql = f1 Qi(z, t) d\+ Г У> ^ XdX = Jo Jo az* = 03.Ы) A)i - I't g + J\^S<IX = 19
Отсюда находим Qi = Q} 4- , где принято обозначение <**» Покажем ортогональность векторов Q2 и </. Из (1.30) имеем ±<я*-£±«*1т£-%)“*• о-*» Поскольку при перестановке индексов выражение в скобках в (1.31) изменяет знак, а рассматриваемый интеграл не имеет осо¬ бенности, то приходим к утверждению Yli=\Qi Яг = 0. • Для обобщенных сил, нелинейно зависящих от производных лагранжевых координат и непрерывно дифференцируемых по этим переменным, величины t и qi примем в качестве параметров и вве¬ дем в рассмотрение функцию ri 5 У(Ч,ЯЛ)= / Y^qkQk(z,q,t)d\, z = Xq. fc= l Затем получим Qi — Qi +Qh где *i_dV(q,q,t) «2 f'Y'nf9®* dQk\w\ Q> ~ —щ—'Qi - Jo h ~ При этом мощность сил Oft на обобщенных скоростях qi, при¬ нимающих ограниченные значения, будет нулевой. Это значит, что вектор Q2 ортогонален вектору q, т.е. Яг = 0* 20
1.2. Уравнения движения в канонической форме ^ 1.2.1. Канонические переменные. Функция Гамилътона Для механической системы с голономными идеальными свя¬ зями при действии потенциальных или квазипотенциальных сил уравнения движения Лагранжа второго рода можно привести к си- <-т1*мо дифференциальных уравнений первого порядка, разрешен¬ ии х относительно производных обобщенных координат q и новых церемонных р, которые определяются с учетом (1.21) соотноше¬ ниями 11еремонные рк называют обобщенными импульсами, сопряженны¬ ми с обобщенными координатами qk. Таким образом, вместо пере¬ менных Лагранжа q,q переходят к переменным q,p, которые пред¬ ложил Гамильтон. Они получили название канонических перемен¬ ных. Одновременно от функции Лагранжа L(q,q,t) переходят к функции Гамильтона H(q,p,t) в соответствии с преобразованием Лежандра Мдееь it правой части следует подставить выражения для q через </,/>, которые можно получить из линейных относительно q урав¬ нений (1.32) благодаря невырожденности матрицы А. Выражение для функции Н можно представить иначе: - 2Т2 + Тх - (Г2 +7i + Г0) + Я = Т2 - Т0 + П. 1'д ни связи стационарны, то Н = Т2 4* П = Т + 77, т. е. функция I амильтона равна полной механической энергии. s (1.33) fc=l S к=1 (1.34) 21
Полный дифференциал функции Гамильтонм //(*/,'/», О вычис¬ ляется по формуле frr Л9Я, , <)П dH = y'—dqk + y'i7—dpk \ <11 (1.:{Г>) 9qk tx °Рк 1,1 С другой стороны, из (1.33) можно получить имрижсшп' dH = f'qkdpk-jr?±d4k '"'dt. (1.36) hidqk ,n Сравнивая (1.35) и (1.36), находим дН___дЬ_ 9Я_. дН__ i)L diik dqk' дрк qk’ dt 01.' Тогда с учетом определения импульсов р* и уравнении Лагран¬ жа из первых двух уравнений (1.37) получим у/ншпатя Гамиль¬ тона дН . ЗН 1 — = = = (1'38) которые также называют каноническими уравнениями. Отметим, что последнее равенство из (1.37) означает, что ес¬ ли функция Лагранжа не зависит явно от времени, то и функция Гамильтона обладает тем же свойством. В этом случае dH ^ дН . ^ дН . дН dt _ ^ dqk + dpk Pk + dt 7 , (1-39) -V——-V—— dH dH dqk dpk dpk dqk + dt dt Таким образом, функция Гамильтона H(q,p) не меняет своего зна¬ чения на действительном движении, определяя обобщенный инте¬ грал энергии H(QiP) = Т2 — То + П = Ъ = const. (1-40) В случае стационарных голономных связей Н = Т + П = ft. 22
Уравнения движения в каноническом виде можно получить так¬ же другими способами (например, из дифференциальных или ин¬ тегральных принципов механики). Свойства канонических уравнений и функции Гамильтона спо¬ собствуют их интегрированию или исследованию в сложных зада¬ чах. В частности, если функция Гамильтона Н не зависит явно от координаты qi, которая является циклической координатой, то l>, const (циклический интеграл для канонических уравнений). Мели И не зависит от импульса то qj = const. Пример. Для описания движения точки в центральном грави¬ тационном поле определим импульсы р\ = ?nr,p2 = тг2ф, соответ¬ ствующие полярным координатам г, (р, тогда функция Гамильтона (ы1> 1 Циклическая координата^?, так как = 0. Циклический интеграл /ь — тг2ф = const. 1.2.2. Канонические преобразования Удачный выбор обобщенных координат может существенно об¬ легчить исследования уравнений движения, которые при любом выборе независимых координат я[ = q'i е C2i = м, (1.42) можно записать в форме Лагранжа второго рода или в канони¬ ческом виде (1.38). Преобразование (1.42) называется точечным. Если одновременно с заменой координат перейти к новым обоб¬ щенным импульсам по формулам Qi Qi (*7l > • • • » Qs ? P\? • • • •* Vs, , Pi = Pi(qi, - ■ ■ ,4s,pi, ■ ■ ■ (1.43) q' e C2, p' eC2,i = I7s, то в общем случае уравнения движения не сохраняют каноническо¬ го вида (1.38). Однако при определенных условиях преобразование (1.43) к новым переменным позволяет вместо уравнений (1.38) с 23
произвольной функцией H(q,p, t) получить канонические уравне- ния относительно новых переменных с новой функцией Гамильто¬ на Hf(q',pf,t). Формулы (1.43) определяют кшктичс.скос прс.оСцхмо- вание, если любая каноническая система уравнений переводится в каноническую. Отметим, что для преобразования (1.43) п этом случае суще¬ ствует обратное предположение, которое также будет сохранять форму канонических уравнений. Можно рассмотреть другой вариант определения. Пусть вектор х € R2s — это вектор-столбец из элементов q^ и р*, соответственно вектор у € R2s из элементов q[ и р\, Еп — единичная матрица п х п, Jn — кососимметрическая матрица 2п х 2п вида А - ( f ) ■ 0 44) Пусть также К„ — матрица Якоби, преобразования (1-43) Кя = ( д(/ dq' \ dq др Эр' др' \ dq др ) (1.45) Преобразование (1.43) называется каноническим, если матрица Якоби Ks удовлетворяет условию K]J9Ka = Js. (1.46) Уравнения Гамильтона движения системы до и после преобра¬ зования в векторно-матричной форме имеют вид . Т дН . т дН' Х — Js о > У Г\ ох ду Если функция Гамильтона при каноническом преобразовании не изменяется, т.е. #'(g',p',£) = H(q(q,,p\t)1p(q\p\t)1t)1 то в этом случае преобразование называется вполне каноническим. Существуют также другие способы определения и критерии для канонических преобразований. В частности, канонические преоб¬ разования гамильтоновых уравнений можно вывести из принципа 24
наименьшего действия, а в качестве критерия каноничности пре¬ образования использовать скобки Лагранжа [xi,xj] для функций (1.43) f—' dxi dxj Эх , dxi к—Х J J У'ЛМ _ dq'k 9Pk (1.47) п условия = 0, [pi,pj] = О, [,quPj] = Sij, i,j = l,s. (1.48) Аналогичные условия можно записать, используя скобки Пуассона (см. 1.3.1) для функций (1.43), определяющих преобразование. Справедливо также следующее утверждение. Теорема 1. Для каноничности преобразования (1.43) необходи¬ мо и достаточно, чтобы существовала функция V(q,p, t), при кото¬ рой Вариации Sqf в (1.49) вычисляют с учетом замены перемен¬ ных (1.43) в фазовом пространстве канонических переменных q,p. Функцию V можно выразить через новые переменные V'(q',pf, t). Тогда уравнение (1.49) нужно рассматривать в пространстве пере¬ менных q\pf. Более общий случай преобразования от координат х к вектору переменных 2 € R2n при п > s с матрицей Кп размером 2п х 2s на¬ зывают симплектическим преобразованием, если матрица Якоби этого преобразования удовлетворяет условию К* Jn Кп = Js ана¬ логично (1.46). Новые уравнения после преобразования также име¬ ют каноническую форму при изменении размерности пространства. Неоднозначность снимается дополнительными условиями, которые выделяют подпространство размерности 2s или соответствующее многообразие в пространстве R2n. В качестве примера можно ука¬ зать регуляризирующие преобразования Кустаанхеймо-Штифеля для уравнений задачи двух тел или обобщенное преобразование Биркгофа для ограниченной задачи трех тел [20J. Если каноническая замена переменных (1.43) допускает в неко¬ торой области фазового пространства возможность разрешить за¬ висимости q[ = ^(<7,р, t) относительно pi = Pi(q, qf, t) (это возможно s 3 (1.49) 25
при условии det(f£) Ф о), то функция (1.49) приводится к виду S(qyq\t) = V(q,p(q,q\t),t) и называется производящей функцией канонического преобразования. Само преобразование в этом случае носит название контактного преобразования. Уравнение (1.49) в силу независимости величин 5q, Sqf имеет вид Pi = = Pi(q,q',t), p'i = =Pi(q,q\t)- (1-50) Выражения в (1.50) определяют каноническое преобразование по заданной производящей функции S(q,qf1t)i если det(^;^q) ф 0. В этом случае первая часть уравнений по теореме о неявной функ¬ ции допускает выражение q\ = <?$(<?,/?,£)> которое можно подставить в оставшиеся уравнения и получить преобразование (1.43). Теорема 2. Всякое контактное преобразование является кано¬ ническим. При этом новый гамильтониан определяется выраже¬ нием «-*+% Доказательство теоремы использует уравнение (1.49) и основной дифференциальный принцип механики SL = j~t(pSq). Возможны и другие способы определения канонических преоб¬ разований по заданной производящей функции S(q,p\t), S(p,q\t) или S(p,pf,t). Если производящая функция 5 выражена через ста¬ рые' координаты q и новые импульсы р', получим аналогичные урав¬ нения для контактного преобразования: Рг = щ: = pi(q,p',t), q'i = ^ = q'i(q,p\t). (1.51) Пример 1. Пусть s = 1 — производящая функция S(q, qf) = qq'. Тогда (1.50) дает замену переменных р — Щ = q',7/ — — щ? -- -q. Импульсы и координаты поменялись местами в результате контакт¬ ного преобразования, что указывает на равноправность канониче¬ ских переменных q,p. Пример 2. В случае функции S(q, 7/) = qp' при s 1 получим из (1.51) р— Щ — Pf,q' = §jjr = q) что дает тождественное канони¬ ческое преобразование. Для произвольного числа степеней свободы аналогичная производящая функция S(q,p') = 26
Пример 3. Процесс движения механической системы, описы¬ ваемый гамильтоновой системой уравнений (1.38), можно рассмат¬ ривать как каноническое преобразование заданных при t = to на¬ чальных значений qo,po для переменных q,p соотношениями q = <l{<huPo,t), V — P(Qo,Po,t). Проверить это можно, вычисляя мат¬ рицу Якоби К\ (1.45) и затем матрицу / О дя_дЕ. _ j>2L<tL \ К\ J\Ki= [ э3_а^_эа_эЕ_ 840 дро п аро а"° • \ дро dqo dqo др0 / Производная по времени от элементов матрицы оказывается рав¬ но и пулю. Тогда матрица KJ J\ К\ = С постоянна, но при t = to, очевидно, С = J\. 1.2.3. Почти тождественное каноническое преобразование Рассмотрим замену переменных х = (q^p) на переменные у — (</'(£),р'(£:)), зависящие от малого параметра е > 0. Пусть про¬ изводящая функция контактного преобразования также содержит малый параметр S{q,p'(e),e) = qp'(e) + eSi(q,p'(e),e), Si e С1. (1.52) Тогда старые и новые величины связывают соотношения as dSi dq dq п ы 95 dSl (153) q{£)=zty=q + eW При I;' — 0 уравнения (1.53) определяют тождественное преобра- юиание р = р', q' = q. Преобразование (1.53) х —» у называется tic (конечно малым каноническим преобразованием, если q' = q + dq( 0) = q + de—Si(q,p, 0), I (l-M) pr = p + dp( 0) =p-de—Si{q,p)Q). dq 27
Здесь первые дифференциалы dq, dp вычисляются по параметру е при е = 0. Из (1.54) следует, что производные по параметру £ (1.55) совпадают по форме с каноническими уравнениями для функции Гамильтона Ho(q,p) = S\(q,p,0). Если параметр £ отождествить со временем t, то уравнения (1.55) получЬу из канонических уравнений с функцией Ho(q,p) = Я(д,р, t) при t = 0. Разложение в ряд Тейло¬ ра общего решения уравнений (1.56) определяет при малых t бес¬ конечно малое каноническое преобразование с производящей функцией S(qo,p,t) = qop{t) 4- t H(qo,p(t)1t), где go, Po-начальные значения переменных q,p при t = 0, а произво¬ дящая функция определяет почти тождественное преобразование при малых значениях t. Попробуем найти такую производящую функцию S(q,p'yt), чтобы контактное преобразование переводило исходные перемен¬ ные q,p в постоянные величины р[ — с** = const, q[ = = const. Такая функция должна удовлетворять равенствам (1.57) 1.2.4. Уравнение Гамильтона-Якоби (1.58) 28
Кроме того, новые переменные должны удовлетворять канониче¬ ским уравнениям с гамильтонианом Н' — Н + Щ. Ъ этом случае имеем Л дН' Л дН' . — Qi= W,Pi= ( } < ’медоиательно, новая фуикция Гамильтона H'{q\p\t) не зависит от новых переменных q\pf. Тогда должно выполняться уравнение I имчип тона-Якоби н(я,^,1) + ^=т, (1.60) гдг правая часть-- произвольная функция времени. Вместо (1.60) мо/кно рассмотреть другое уравнение в частных производных, ко¬ торому должна удовлетворять производящая функция 5(g, a, t): я<*^‘>+ж=° (L61) мри услоиии, что 5 = 5 + / f(r)dT. Jto 'Таким образом, для решения поставленной задачи нужно найти полное^ решение (полный интеграл) уравнения в частных производ¬ ных (1 .(>()) или (1.61), которое будет зависеть от s постоянных а и аддитшшой постоянной ао в виде S = Ф(я, а, t) + а0. (1.62) Тогда задача интегрирования канонических уравнений заменяется нахождением решения уравнения Гамильтона-Якоби. Если фуик¬ ция (1-62) получена, она порождает контактное преобразование дф _ дф , * = ей'А = «S' <lfS) Разрешая последние уравнения относительно <7, получим явное ре¬ шение исходных уравнений движения qi = qi(t,a,l3), pi = pi(t,a,(3). (1.64) 29
Если рассматривать движение механической системы со стаци¬ онарными связями, то функция Гамильтона не зависит явно от вре¬ мени. Тогда можно искать решение S уравнения Гамильтона Якоби вида Н(д,Щ) = !г. (1.65) После этого получим S(q, a, t) = —ht + S(q, а), где h -- 04. Пример 1. Для материальной точки га в однородном поле си¬ лы тяжести движение в вертикальной плоскости х — q 1, у q2 описывают уравнения с функцией Гамильтона Тогда уравнения Гамильтона-Якоби имеют вид 1 /Э5ч2 1 /95ч2 , __ч +’"»« = '*• (166> Пример 2. Для материальной точки т в центральном грави¬ тационном поле движение в плоскости орбиты г = q\, ip = q2 опи¬ сывают уравнения с функцией Гамильтона (1.41) 2m qf' qi Тогда уравнения Гамильтона-Якоби имеют вид 1 ,dS^2 1 /д§, 2 ae2m 2m 2m^i 3g2 * * 1.2.5. Канонические уравнения возмущенного движения Пусть движение механической системы описывают канони¬ ческие уравнения (1.38) с функцией Гамильтона H(q,p,t) = = Ho(q,p,t) H\(q%p, £), где функция Щ определяется действи¬ ем основных сил, а функция Н\ учитывает действие дополнитель¬ ных или возмущающих сил, которые могут быть в частности малы¬ ми по сравнению с основными (порядка малого параметра е, тогда Hi =eHi(q,p,t,e)). 30
11редположим, что канонические уравнения певозмущенного (Ьт.нсения, которые получим при Н = Но, Н\ =0, дНо . дНо j т;— (л Як = —, Рк = ^—, fc = l,s (1.68) дрк dqk имеют решение вида (1.64) q° = gf(£,a,/3), = p®(t,a,p) , которые получены из полного интеграла 5o(g, a, i) уравнения Гамильтона- Якоби (1.61) для невозмущенного движения. В этом случае Яо(д,^,0 + ^=0. (1-69) Рассмотрим контактное преобразование уравнений движения с учетом возмущений с производящей функцией S(q>q\t) = iS'n(q,a,t) по формулам as ds0 Рг ■ dqi dqi = . (1.70) dq[ oai I «=<*' 11 pii такой замене переменных роль новых координат q' будут иг¬ рать а, которые уже не являются постоянными, а вместо постоян¬ ных (1 будут новые импульсы pf. Преобразование (1.70) определяет с учетом (1.69) новый гамильтониан ll'(<l',p',t) = Н0 + Hi + ^ = Hi{q0{t,q',p'),p0{t,q',p'),t)- (1-71) Тогда канонические уравнения возмущенного движения имеют вид уравнений (1.68) с гамильтонианом (1.71): дНг ^ дНг Чк дР'к' Рк эЧ'к- И случае малых возмущений запишем •/ „dfli(q\p\t,£) , dHi(q',p',t,e) Як = г щ , Рк - щ (1-72) Таким образом, новые переменные qf,p', которые удовлетворяют уравнениям (1.72), являются медленно меняющимися функциями времени. При решении задач небесной механики или космической 31
динамики такого вида переменные называют оскулирующими эле¬ ментами орбиты. Если в момент времени to перестанут действо¬ вать возмущения, то элементы qf{to),pf(to) будут сохранять свои значения при дальнейшем движении, определяя параметры невоз¬ мущенной кеплеровой орбиты. Если удается получить решение возмущенных канонических уравнений (1.72), то подстановка q^t)^^) вместо а, (3 в решение невозмущенных уравнений (1.68) дает общее решение исходной за¬ дачи. Приближенное решение в виде рядов по степеням малого пара¬ метра е > 0 можно получить при определенных условиях методом последовательных приближений, вычисляя коэффициенты разло¬ жения на п шаге qn{t),pn(t) квадратурами от известных функций времени и предыдущих шагов qk(t)iPk(t), к < п. 1.3. Интегрирование уравнений движения 1.3.1. Первые интегралы канонических уравнений и скобки Пуассона Если для всех значений функций qi(t),pi(t), которые являются решениями канонических уравнений (1.38) движения механической системы с гамильтонианом #(<j,p, £), сохраняется постоянное зна¬ чение какой-либо функции =C = COnst, (1.73) то сама функция / и уравнение называются интегралом каноны- ческих уравнений или первым интегралом движения. Например, обобщенный интеграл энергии (1.40) H(q,p) = /1, когда функция Н не зависит явно от времени, или циклический интеграл pi = с*, когда Н не зависит от координаты д*, являются первыми интегра¬ лами. Пусть нам удалось получить 2s независимых первых интегралов fj(x,t) = /j(<7i,.. = cj = const, j = 1,25, (1.74) которые можно разрешить при условии det(|£) Ф 0 относительно канонических переменных q^Pi, тогда qi ~ Qi(^> С], . . . , C2s), Pi Pi(ty ^1, • • • , ^2s)? ® 11 • (1 *75) 32
Полученные уравнения (1.75) определяют решение канонических уравнений. Если число первых интегралов (1.74) меньше 2s, то они позволяют исследовать многие свойства решений, понизить поря¬ док системы уравнений или при определенных условиях предста¬ вить решение в квадратурах. Очевидно, что для решения задачи необходимо достаточное количество первых интегралов. Существует несколько возможностей получения новых первых интегралов, если уже удалось получить другие. При этом исполь¬ зуют свойства выражений, которые называют скобками Пуассона для двух заданных функций fi(q,p,t) и /2(д,р, t) Данное выражение будет также функцией канонических перемен¬ ных и времени f{q,p,t). Кроме очевидных свойств для скобок Пуассона справедливо свойство, которое называют тождеством Якоби Ши /2}, /з> + {{/2, /з}, /1} + {{/з, Л}, /2} = о. (1.77) Можно выполнить проверку тождества (1.77) вычислениями по определению (1.76). Другое доказательство использует то обсто¬ ятельство, что каждое слагаемое в (1.77) содержит вторые про¬ изводные двух функций из внутренних скобок. После упрощений тождество не будет содержать вторых производных. Тогда сумма всех слагаемых обратится в нуль. Следующее свойство можно использовать, как определение пер¬ вого интеграла (1.73) канонических уравнений с гамильтонианом (1.76) {/l,/2} = -{/2,/l}, {с/ь/2}={/1,с/2}=:с{/ь/2}, {/l + /2, /3} = {/li /3} + {/2> /з}, ll(q,p,t): {/,Я}+<£=<>. (1.78) 33
Вычислим производную по времени для функции, которая со¬ храняет значение на решениях системы канонических уравнений ) =с Справедливо и обратное утверждение: если для функции / выпол¬ няется равенство (1.78), то уравнение /(</, />, /,) г является первым интегралом канонических уравнений с функцией //. Таким образом, свойство (1.78) является необходимым и доста¬ точным условием существования первого интеграла /('/,/>, /) — с. Свойства (1.77) и (1.78) позволяют доказать следующее утвер¬ ждение. Теорема Якоби—Пуассона. Пусть известим первые интегра¬ лы /i(g,p, t) = С\ и f2{q,P,t) = С2 Для канонических уравнений дви¬ жения с гамильтонианом H(q,pit). Тогда скобка Пуассона {/ь/2} также будет первым интегралом уравнений. Действительно, если вычислить производную дня скобки Пуас¬ сона {/ь/2}, то аналогично (1.79) получим с учетом (1.77) и (1.78) Следовательно, / = {/ь/2} = сз дает новый первый интеграл. Это выражение можно снова использовать в сочетании с дру¬ гими первыми интегралами. Две функции /ь/а называют н.и-годя¬ щимися в инволюции, если их скобка Пуассона {/ь /.»} П. И >том случае новый первый интеграл не получим. (1.79) |{/1,/2} = {{/ьЛ},Я} + ^/?-} = {{/l)/2}>#} + {-^,/2} + {/1. !^ ) = {{/ь/2},Я} + {-{/ьЯ})/2}-|-{/1, {/.,//}} = Ши/2},Я} + {{Я,Л},/2} + {{/а, //},/,} <>• 34
Кроме того, не все полученные интегралы будут независимы. Пример 1. Для свободной изолированной материальной точки и 1\ л можно получить интегралы количества движения Pl = тх = Cl, Р2 = ту = С2, Рз = rnz = с3, и момента количества движения //I •--= УРз ~ ZP2 = С4, 92 = zpi - хрз = с5, дз = хр2 - ур\ = с6. Имчислим скобки Пуассона , ^ , _ dg 1 д#2 dffi ^2 gpi dg2 dgi дд2 дд\ дд2 ддх дд2 /l,//2 dx dpi dx dy dp2 dp2 dy dz дрз дрз dz = (-P2)(-X) ~ (y)(Pi) = Xp2 “ УР1 =93 = Сц. Другой способ можно использовать для канонических систем, которые имеют обобщенный интеграл энергии H(q,p) — h и еще одни первый интеграл fi(q,p,t) = с. Тогда можно получать новые интегралы дифференцированием по времени M<l,p,t) = {Л, Я} = -?A,...Jk(q,p,t) = {/*_,, Я} = , пока полученная функция на каком-то шаге не вырождается к виду fk fk(q,p), Л+1 =о. Оказывается, что для механической системы s степеней свободы очень важно получить 5 независимых первых интегралов в инво¬ люции. Каждый из них как бы понижает порядок системы на две единицы. Теорема Лиувилля. Система 2s канонических уравнений ин¬ тегрируется в квадратурах, если для них известны s независимых первых интегралов в инволюции. Для доказательства заметим, что 5 интегралов можно разре¬ шить относительно импульсов pi = Piiq^c^t) по условиям тео¬ ремы. Подставив полученные функции в гамильтониан, получим //'(</, с, t) = H(q,p(q, с, £),£), а затем определим производящую функцию S(q, с, t) контактного преобразования, которая в условиях теоремы находится квадратурами от известных функций и являет¬ ся полным интегралом уравнения Гамильтона-Якоби. 35
Пример 2. Если каноническая система с двумя степенями сво¬ боды имеет интеграл f(q,p,t) = с, не зависящий от функции Га¬ мильтона (при H(q,p) = h)y то система интегрируема в квадрату¬ рах. 1.3.2. Метод Якоби интегрирования уравнений движения Теория контактных преобразований для канонических уравне¬ ний позволяет по заданным гамильтониану H(q, р, t) и производя¬ щей функции S(q,q',t) получать в новых переменных q',pf уравне¬ ния с нужными свойствами функции H'{q' ,р' ,t) = H(q(q' ,p',t),p(q' ,р’ ,t),t) + Пусть, например, после преобразования Н' = Hf(q\t). Тогда урав¬ нения движения принимают вид pklJl pkTJl * wr0, * (L80) Первая часть уравнений (1.80) дает q[ = Ci = const, а затем можно проинтегрировать оставшиеся уравнения р' = /(с, £). Наличие циклических координат <71,..., (k < s) и интегралов -dS _ -ГГ Рз ~ dqj ~аз' 3 ~ ’ позволяет упростить систему канонических уравнений и связанное с ними уравнение Гамильтона-Якоби dS dS±, dS Л ** \Qk+ i»• • • > qsi oti-t • • •»’ * ** ’ flq / ^ — Тогда производящая функция частично определяется к s = ^2 азЪ + S'(qk+1, •. *, qs, , • • •, Ois,t). j=i Пример 1. При движении точки в центральном гравитацион¬ ном поле время t и угол у? = <72 не входят явно в гамильтониан Н. 36
Уравнение Гамильтона-Якоби 1 (fdSb 2 1 /95ч2\ ае2т DS _ 2m\rdqi q\ dq2 ) qi dt имеет полный интеграл, который можно представить в виде S = a\t + 0.2 + S'(q\, а). Произвольные постоянные a?i, а2 связаны с постоянной энергии h и постоянной площадей с. Оставшаяся неизвестная функция S" удо¬ влетворяет уравнению q2™2 (dS'V2 аe2m2 a2 r r Тогда можно записать явные выражения для преобразования а - dS -<^dS' а - dS - ^dS' 1 да\ dai’ 2 Эаг ^ 9a2’ где /? — новые произвольные постоянные, которые определяются начальными условиями. Дальнейшее интегрирование определяет движение точки в плоскости орбиты в полярных координатах 1 + е cos ip ае^ ае4 ' Однако общего рецепта нахождения такой производящей функ¬ ции S, чтобы получить заданный вид гамильтониана Н', не суще¬ ствует. Для этого требуется находить полный интеграл уравнения ч частных производных Гамильтона-Якоби. Теорема Якоби. Если получено решение S(q1c) уравнения Га¬ мильтона-Якоби, зависящее от 5 произвольных постоянных с* и такое, что Я2 с то канонические уравнения решаются явно в квадратурах. При )гом функции f{q,p) = с, определяемые из уравнений Щ = р, яв¬ ляются s первыми интегралами канонических уравнений. 37
Можно указать способы нахождения такого полного интегра¬ ла для определенных типов гамильтонианов при помощи разделе¬ ния переменных. Полный интеграл уравнения Гамильтона-Якоби в этом случае ищется в виде суммы функций, каждая из которых зависит только от одной из обобщенных координат qi, времени t и произвольных постоянных Cj\ S = S\(qi, с, t) 4- 52((72,с, £) + ... 4- Ss(qs, с, t) 4 Sq(c, t). (1-81) Получить решение уравнения Гамильтона-Якоби в виде (1.81) моле¬ но, например, если функцию Гамильтона удается сгруппировать и представить как суперпозицию Тогда уравнение Гамильтона-Якоби для гамильтониана (1.82) име¬ ет вид при условии, что каждое из них можно разрешить относительно производных Полный интеграл или производящая функция контактного пре¬ образования имеет вид Пример 2. Решение уравнения (1.66) можно искать в виде (1.81). При разделении переменных уравнение в частных производ¬ ных распадается на два обыкновенных дифференциальных уравне- Н = ..., fs(qa,pa)). (1.82) Его можно заменить решением совокупности уравнений ния 38
которые можно проинтегрировать и получить общее решение, со¬ держащее кроме h и с\ (или с2) еще две произвольные постоянные. Аналогично можно получить решение уравнения (1.67). Другой случай интегрирования методом разделения перемен¬ ных связан с представлением функции Гамильтона в виде последо¬ вательно вложенных фуикций от соответствующей пары канониче¬ ских переменных Я = /i(?i,pi, /2(72, Р2,/з(- ••))), fi = fMu Ри fi+i (•••))• (1-83) При этом последовательное решение уравнений г / 9S3 ^ ^ Js\Qsj о ) Csi d(Js fs— 1 ((7.9— 1 ? j^s) = с.?—1,..., (1.84) OQs-i /1(91, •^•,c2) = ci = h при условии разрешимости уравнений (1-84) относительно произ- иодпых - Г Ч о — 9i\Qit сг? ci+l) Щг дает полный интеграл исходного уравнения Гамильтона-Якоби для случая (1.83) в виде S = -ht + У] I gi{qi,cuci+i)dqi. (1.85) Можно отметить также следующий случай Лиувилля возмож¬ ного применения метода разделения переменных. Рассмотрим голо- иомпую систему, для которой кинетическая и потенциальная энер¬ гия заданы функциями / г=1 г= 1 г=-1 2 Функция Гамильтона имеет вид *-^‘t<5sL +*<«»-*• 39
Удается получить полный интеграл уравнения Гамильтона-Яко- би ^ 5 = Е / (2а«(^)(Сг + ЛД(®) - Яг(<7г)))Ч,. г=1 ^ Для s + 1 произвольных постоянных /г, с* должно выполняться до¬ полнительное условие с\ +... + с3 =0. Примером случая Лиувилля может служить задача двух неподвижных центров, где материаль¬ ная точка движется под действием сил притяжения к двум главным телам системы. 1.3.3. Метод вариации произвольных постоянных для канонических уравнений Данный метод является частным случаем приложения методов возмущений для канонических уравнений (1.68)-(1.72) с функцией Гамильтона H(q,p,t) = Ho(q,p,t) + H\(q,p, t). Пусть при Н\ = 0 уравнения имеют решение Qi = Pi =Pi(t,a,P), i — TTs, (1.86) где a, /3 — произвольные постоянные. Можно искать решение урав¬ нений при Я = Но + Н\ в том же виде, считая величины а, /3 функциями времени. Предположим, что уравнения (1.86) можно разрешить относительно а, /3, тогда <Хг =<*i(q,p,t), 0i = 0i(q,p,t), г = М- (1.87) Вычислим производные полученных функций (1.87) по времени yr^/doti . doti . \ dai fa*) *■' *-1 (1.88) а . , dPi . \ дРг А = Е(аГ« + ezn) + эт £?\dqk дрк С учетом канонических уравнений и свойств скобок Пуассона пре¬ образуем (1.88) к виду 40
дН dai orr doLi s J(r[^dqkdpk dpk „„ dt u Л / uHi U12 UfJi Ull \ fr'^dqk дрк dpkdqk) dt ={A, Я} + ^ = {А, Я0} + {ft, Hy) + 11оскольку при H = Но функции (1.87) являются первыми интегра¬ лами канонических уравнений невозмущенного движения, получим Уравнения возмущенного движения (1.89) можно записать в кано¬ нической форме (1.72), если уравнения (1.86) или (1.87) отвечают преобразованию переменных, для которого существует производя¬ щая функция. 1.3.4. Быстрые и медленные переменные в теории возмущений канонических систем Применение метода возмущений создает возможности эффек¬ тивного исследования канонических систем в задачах механики. 11и, гамильтониан Н удалось в результате преобразований пред- ( гавип. в виде KiiMiM образом, что зависимость функции Н\ от координат qi будет '.*/1 периодической. И ) гом случае получим канонические уравнения (1.89) Я = Я0(рь... ,ps) + cH\(q,p, с) дН дН 1 Pi = =£->—• oqi c)qi (1.90) 41
При £ = 0 уравнения (1.90) имеют очевидное решение: импульсы постоянны pi = р?, а координаты (ft—линейные функции времени Яг = + 9i (ПРИ шг Ф о) ИЛИ ПОСТОЯННЫ ^ (еОЛИ - 0). Параметры оч(р°) = i — l:s составляют вектор основных ча¬ стот невозмущенной системы. Они определяют возможнос ти полу¬ чения следующих приближений для возмущенной системы, а так¬ же свойства решений (устойчивость, проблема резонансов и малых знаменателей при s > 1). Невозмущенное движение можно представить, пользуясь топо¬ логическими понятиями, как перемещение с постоянной скоростью изображающей точки по многомерному тору, который можно счи¬ тать прямым произведением окружностей постоянного радиуса для соответствующих угловых переменных qi(t). При малых е ф 0 им¬ пульсы pi будут медленно изменяться, а координаты остаются быст¬ ро меняющимися переменными, по которым гамильтониан и пра¬ вые части уравнений квазипериодические. Это соответствует мед¬ ленному изменению скоростей движения спо окружностям тора, радиусы которых также медленно меняются. В случае, если канонические уравнения имеют вид (1.90), а пе¬ ременные разделились на медленные и быстрые, то их принято на¬ зывать переменными действие - угол. Пример. Пусть движение гармонического осциллятора с уче¬ том малых возмущений описывает функция Гамильтона Я - Р2 +М ~ 2т 2 ~4~ ’ где ki = const, &2 = const. Канонические уравнения я = —, p = -kiq-ek2q3 т с помощью замены переменных Я = (~Г^)2 sin ж, р = (2тиу)ъ cos х, и = (ki/m)* (1.91) К\ можно привести к виду (1.90) в новых переменных действие-угол \ 2 4 /ШУ \ 2 а —) kzyshi х, у = —4е( —) fc2sin xcosx. (1.92) k\ х ki 7 При е = 0 уравнения (1.92) имеют решение у = i/o, х — u)t + хо, что определяет из (1.91) движения по эллипсу в исходных фазовых 42
переменных <7, р. Размеры эллипса зависят от уо, а, положение точки пт угла (р = х. Для дальнейшего приближенного решения уравнений канониче- гкпх систем при малых е Ф О или анализа основных свойств различ¬ ных сложных задач динамики предложены специальные методы (в том числе, основанные на канонических преобразованиях). Успеш¬ но используется традиционный метод малого параметра, широкому внедрению которого положил начало Пуанкаре.
Глава 2 Оптимизация управляемого движения 2.1. Необходимые условия экстремума 2.1.1. Постановка вариационных задач управления движением Предметом изучения является управляемое устройство или ме¬ ханическая система, в которой действуют управляющие силы или параметры системы могут изменяться по нашему выбору. Движе¬ ние описывается векторным n-мерным обыкновенным дифферен¬ циальным уравнением ± = F{x,u,t), X € С2 Fee1, F'x € С1, (2.1) где х = (x\j..., хп) — вектор фазовых переменных со значениями в Rn (координаты и скорости, координаты и импульсы). Независи¬ мую переменную t £ [£н,£к] С R1 будем называть временем, где £н и tK соответственно начальное и конечное время. Векторную вели¬ чину и = (iii, • • • >иг) назовем вектором управления. Управляющие функции, или просто управления, Uj(t), j = 1, г, пусть принадлежат классу кусочно-непрерывных функций с конечным числом точек разрыва со значениями в r-мерных сегментах U из Rr: Uji < Uj < Uj2> Uji = const, Uj2 = const. (2.2) В частности, для всех или некоторых управлений могут допускать¬ ся равенства: Uji = — оо, Uj2 = 00. Предполагаем разрывы управлений изолированными: для каж¬ дой точки разрыва т можно указать конечный временной интервал 44
(/-1,72) такой, что г € (ti,T2) и г является единственной точкой |);ифыва на ri,T2. Не теряя общности, можно считать управления шло всем перечисленным условиям управления называются допу¬ стимыми. Правые части уравнения (2.1) при выбранной реализации управ¬ лений удовлетворяют условию существования и единственности ре¬ шения задачи Коши в ограниченной области D из Яп х Яг х Я1. Поэтому любому допустимому управлению в ограниченной обла¬ сти задания n + г +1 переменных отвечает единственная непрерыв¬ ная интегральная траектория в расширенном фазовом простран¬ ство Яп х Я1, выходящая из точки с координатами ж" в начальный момент времени tH; х* — координаты в конечный момент времени /к. Пару векторов (и,х) часто называют управляемым процессом. Граничные значения переменных могут быть связаны неявными независимыми условиями 11( прерывную интегральную кривую уравнения (2.1), удовлетворя¬ ющую условиям (2.2) и (2.3), назовем допустимой траекторией. Задача оптимизации программного движения теоретической механики заключается в определении допустимых управлений как явных функций времени Uj(t), а также допустимых граничных зна¬ чений фазовых переменных и моментов времени £н? таких, чтобы функционал вычисленный при выбранных управлениях и граничных значени¬ ях на соответствующей интегральной кривой уравнения (2.1), был наименьшим по сравнению со значениями функционала на всех других допустимых траекториях Ф —> min. H,,W,x«,tH,tK)=0 (р = 1,2, ...,/< 2n 4- 2), Др € С1, (2.3) <9ЯЛ r)R„ f)Rn rang к (2.4) F0 € C\ F^x 6 C\ До € C\ 45
Вариацией любой переменной величины будем называть раз¬ ность значений этой величины на некоторой допустимой траекто¬ рии, называемой основной или опорной, и на какой-либо другой допустимой (в некотором смысле близкой) траектории сравнения. Отметим существенные отличия от традиционной постановки за¬ дачи варьирования в аналитической механике. Прежде всего, име¬ ются дополнительные переменные — управления Uj(t), которые мо¬ гут изменяться скачками. Вариация управления, понимаемая как разность соответствующего управления на основной траектории и бесконечно близкой по х и t возможной траектории, может быть ве¬ личиной конечной и достигать значения Uj2 — Uji. Кроме того, име¬ ем п скалярных связей, отвечающих векторному уравнению (2.1). Уравнения этих связей содержат не только фазовые переменные и время, но и производные от фазовых переменных. Поэтому соб¬ ственно на фазовые координаты наложены удерживающие ограни¬ чения (2.3) для начальных и конечных значений. Уравнение (2.1) дает ограничение на производные от фазовых переменных. На бес¬ конечно близких по х и t допустимых траекториях ввиду конечных вариаций управлений вариации переменных х должны допускаться конечными. Бесконечно малые вариации принято называть слабыми, конеч¬ ные вариации — сильными. Конечные вариации будем считать изо¬ лированными, сосредоточенными на малых интервалах времени, общая длительность которых имеет порядок слабых вариаций. Это позволит рассмотреть вариацию функционала (2.4) как линейную часть его приращения при переходе от основной кривой к траекто¬ рии сравнения. Для сильного варьирования управлений будем использовать так называемые игольчатые вариации. Выберем произвольные ta и v\a,... ,vTa, o' = 1,JV такие, что tn < t\ < ••• < tu < tKy Uji < vja < Uj2, и достаточно малые числа Дta > О, AtH, AtK так, чтобы не пересекались полуинтервалы га = [ta,t<r -f Д£<г) и Для управлений на основной траектории сохраним обозначение u(t). Введем в рассмотрение управления сравнения u'(t), равные u(tH) при t € гн, va при t € га, u(t) при £€t„U*aU*Ki u(tK) при Д*„ > О Д£„ < 0 ’ Д*к > О Д£к < О 46
/ < /к. Разность u'(t 4- At) — u(t) назовем игольчатой вариацией вектора управления. / Замечание. Прежде чем проводить оптимизацию в задаче управляемого движения механической системы, следует убедить¬ ся в управляемости системы, т.е. в существовании хотя бы одной кусочно-непрерывной функции и G U такой, что соответствующая ей интегральная кривая уравнения (2.1) удовлетворяет условиям (2.3). В математической теории управления для линейных систем доказывается следующее утверждение. Теорема Калмана. Пусть уравнение (2.1) имеет вид где Л постоянная матрица п х п; В — постоянная матрица п х г. Чтобы для любого ограниченного начального состояния хн, £„ существовали значение tK > tH и кусочно-непрерывный вектор управления u(t) € U С Яг, tH < t < tK такие, что хк = х(£к) = О, необходимо и достаточно условие Систему, удовлетворяющую этому условию, называют вполне ущхмляемой. Критерии управляемости для нелинейных систем не разработаны. Поэтому управляемость нелинейной системы в меха¬ нике' управляемого движения приходится устанавливать из физи¬ ческих соображений. Ввиду наличия связей вида (2.1) целесообразно ввести лагран- жеаы множители Ai(t) по числу скалярных уравнений, т.е. i = I, н. Указанные множители представляют собой некоторые неиз¬ вестные функции времени, которые должны определяться в процес¬ са ! решения задачи при удовлетворении уравнений связей. Функци¬ онал (2.4) на допустимых траекториях равносилен условному функ¬ ционалу вида (2.5) rang[£?, АВ,..., Ап 1В] = п. (2.6) 2.1.2. Вариация условного функционала 'К (2.7) 47
где принято обозначение для функции Лагранжа L = F0 + Х(х - F). (2.8) Мы используем векторные обозначения. Второй член правой части (2.8) представляет собой скалярное произведение вектора Л G Rn и разности векторов х £ Rn и F Е Rn. При решении некоторых задач может оказаться полезным вве¬ дение лагранжевых множителей vp по числу граничных условий (2.3). Множители ир будут определяться при удовлетворении этих условий, поэтому их следует рассматривать зависящими от гранич¬ ных значений переменных и не зависящими явно от времени t. На допустимых траекториях функция Rq эквивалентна функции р= 1 Функционал (2.4) на допустимых траекториях может быть заменен условным функционалом Согласно методу множителей Лагранжа оптимизацию условного функционала (2.9) целесообразно проводить в расширенном про¬ странстве допустимых траекторий при игнорировании связей (2.1) и (2.3). Рассуждают так. Если определена оптимальная траекто¬ рия для более широкого класса допустимых и, в частности, эта траектория удовлетворяет связям (2.1) и (2.3), то указанная тра¬ ектория будет отвечать минимуму функционала и для требуемого узкого класса допустимых. Удовлетворение уравнений связей (2.1) и (2.3) можно обеспечить с помощью совместного решения этих уравнений с уравнениями, представляющими собой условия экс¬ тремума в расширенной постановке. Если лагранжевы множители vp не вводятся и вместо формулы (2.9) рассматривается форму¬ ла (2.7), то будет использована частично расширенная постановка, при которой рассматривается класс траекторий, удовлетворяющих граничным условиям (2.9). Будем сопоставлять значение функци¬ онала (2.9) на бесконечно близких по х и t непрерывных траекто¬ риях, допустимых в расширенной постановке. Одну из траекторий R = Ro + ^2 VpRp. (2.9) 48
шпоном основной или опорной, остальные — траекториями сравне¬ ния. Величины, относящиеся к траекториям сравнения, будем от¬ мечать штрихами. Разность некоторой величины на основной тра¬ ектории и бесконечно близкой по х и t траектории сравнения рас¬ сматриваем в качестве вариации этой величины на основной траек¬ тории. Вариация, вычисляемая в один и тот же момент времени t, на- 1ы кается изохронной 8. Если при составлении вариации величина п.ч траектории сравнения берется в некоторый смещенный момент времени t -h At, то это полная вариация Д. I [редположим, что величины 8х, 8\, At, а также общие длитель¬ ности участков с конечными вариациями как управлений Uj, так и ирои'шодных фазовых координат хг- имеют порядок малости неко¬ торой величины е. Непосредственно устанавливается соответствие полных и изохронных вариаций: А.г, xfa + Afy—Xify) = Xfa + Afy—Xity + Sxi = Sxi+x'iAt. (2.10) ( jiafjyio вариацию функции определим в виде главной линейной ча- сги ее приращения при варьировании аргументов. Если x[(t) отли¬ чается от Xi(t) на бесконечно малую величину, то штрих в формуле (2.10) опускается. Вместо х* в этой формуле может быть поставлена некоторая другая функция или функционал. / Замечание. В силу соотношения х^ —х* = ^{х[ — х*), принима¬ вшего вид 5±i = -jfiSxi, вариация переменной х* определяется вы- Ьором вариации переменной х*. Конечное значение х\ — х* = 8х{ не пр< )ти»оречит требованию бесконечно малого значения х\—х{ — Sxi. Действительно, пусть \х[ — х*| < а*, а* = const > 0, тогда \х\ — х*| < \х[ - xi\r 4 ai(t — т). При малой величине Ат = t — т > 0 имеем на полуинтервале [т,т 4- Ат) величину |£х*| порядка |5х*|г н Ат. Перейдем к определению полной вариации функционала Ф. Для п ого напишем Величину S называют функционалом действия. При вычисле¬ нии вариации функционала действия целесообразно от функции 'К (2.11) -II 49
Лагранжа L перейти к соответствующей функции Гамильтона Н с помощью так называемого преобразования Лежандра: dL Н(х, А, и, t) = 'qT% — L(x, х, А, и, £). (2.12) На основании формул (2.8) и (2.12) получим Q Г — = А, H = -F0 + XF. (2.13) ОХ Для вариации функционала действия A\S, вызванной слабыми вариациями фазовых координат, лагранжевых множителей, управ¬ лений и времени, а также слабыми и сильными вариациями произ¬ водных по времени фазовых координат с помощью формул (2.11)- (2.13) напишем £К4~Д£К tK Ai5 и J X'x'dt - J Xxdt - Д J Hdt* in t» « f (A'±' - Ax) dt -f A'x' AtK - A'rr'l Д£н— J til — J* 5H dt — HKAtK -f HHAtH. Это равенство предварительное, так как в правой части следует опустить члены второго и более высокого порядка малости. Здесь знак ««» следует понимать, как эквивалентность бесконечно ма¬ лых. Напоминаем, что мы предполагаем слабые вариации и дли¬ тельность участков сильных вариаций порядка некоторого беско¬ нечно малого параметра £. Полагая А' — А + <$А, запишем tK tK tK J (Хх* — \x)dt = J \(x'—x)dt + J x'dXdt. iM £ii tt i Будем использовать порядковые символы 50
/ = 0(e), если lim|//e:| < оо при е —► О, / = о(е), если lim f/e = 0 при е —> 0. 'Лл исключением промежутка длительности порядка е, 11 м(‘(*м х! = х 4- 0(е). Поэтому во втором интеграле правой части «■пустим штрих tк tK tK j(A'x*' — Xx)dt = J X^Sxdt -I- J xSXdt 4- o(e) = /■i, in tn /l*« (-A&r 4- x5X) dt 4- A&r + o(£). I tii 1I оскольку для слабых вариаций управлений 6Н(х, А, и, £) = -^—дх 4- -тгг-дА 4- -^—ои, дх дХ ди го при сохранении членов порядка е с помощью формулы (2.10) окончательно получим «к Д| 5=- / ((ir+A>fa+<f -iWA + 1г{“)л+ - £|| + (АДх — HAtJ . (2.14) Кудом обозначать через A2S вариацию функционала действия, вы¬ шли иую сильными игольчатыми вариациями управлений. На ос- попании формул (2.11)—(2.13) условное равенство эквивалентности Ьескопечно малых величин A2S « ^ f (H(x,X,uyt) — H(x,X,va,t)) dt. (2.15) <Xr=l / *>o 51
2,1.3. Непрерывность лагранжевых множителей и функции Гамильтона. Формула полной вариации условного функционала Выделим произвольный момент времени т 6 (^н^к), который может совпадать с точкой разрыва управлений на основной траек¬ тории, и напишем для функционала действия Применим формулу типа (2.14) к каждому из интегралов правой части На основании сопоставления полученного выражения с формулой (2.14) получим В силу непрерывности основной траектории и траектории сравне¬ ния имеем Дя?|т-_0 — Дх|т--|-0 — Ах, Д£|-г—о = Д£|т».{.о — Ат. Вариации Ах{ и Дг являются независимыми, поэтому •^г|т—0 “ ^г|т+(Ь ^ = 1?^? Н\Т—0 = Н|г+0* (2.16) Соотношения непрерывности (2.16) получили название условий Вейершгпрасса - Эрдмана. Т т (АДх — HAt)T_0 — (АДх - HAt)T+0 = 0. 52
l b (2.16) следует, что лагранжевы множители и функция Н бу¬ му г непрерывными на опорной траектории, в частности, и в так на- м.шаемых угловых точках, в которых х имеет разрыв. Эти условия ммряжают свойство лагранжевых множителей опорной траектории игл принятой схемы варьирования. 11а основании условий Вейерштрасса - Эрдмана заключаем, что подынтегральная функция правой части формулы (2.15) является непрерывной. После выделения линейной части эта формула при¬ нимает вид N A2S = ^2 (н(х,\,u,t) - #(х, А,г>а,£)) Дta, (2.17) <7=1 ° где т), ЛД^)—значения фазовых переменных и лагранжевых множителей на опорной траектории. 11олная вариация функционала действия AS = A\S + Д2S. По- пому на основании формул (2.11), (2.14) и (2.17) получим оконча¬ тельное выражение полной вариации условного функционала л"'=- / ((1г+О41+(^ ■ *){л+л+ (218) N t I (н^х. A, u, t) — Н(х, A, va,t)\ Ata I- AR 4- Г АДх - HAt\ . \ /1—tfj \ / 2.1.4. Необходимые условия сильного относительного экстремума 11редположим, что на опорной траектории достигается сильный ноотносительный минимум, если значение функционала на этой траектории не превосходит (меньше или равно) значения функци¬ онала на любой допустимой траектории, получаемой при слабых и сильных изолированных вариациях х*, а также при слабых вариа¬ циях переменных х*, i/j, t. Если на опорной траектории имеется хотя бы локальный мини¬ мум, то ДФ > 0. Поскольку в общей постановке задачи ограничения п г.иде неравенств наложены только на управления, то при частном 53
выборе на траекториях сравнения управлений, ранных оптималь¬ ным, т. е. 5и = 0, ь! = и, будем иметь внутренний экстремум и, как следствие, необходимо общее условие стационарности: ДФ = 0. В расширенном пространстве допустимых кривых сравнения ва¬ риации Sxiy SXi, Дх", Да£, Д£н> Д^к являются независимыми. Од¬ ну или несколько вариаций можно выбрать отличными от нуля, остальные полагать равными нулю. Согласно формуле (2.18) и учи¬ тывая (2.13), получим следующие необходимые условия стационар¬ ности: так называемые уравнения Эйлера - Лагранжа <=_дн = д£о ^ т * dxi dxi к dxi ’ к~ 1 уравнения движения (2.1) в виде ВМ х, = -=^ (2.20) и общее условие трансверсальности с Ь|| Подставляя в (2.21) выражение AR + (АДа; - HAtY* = 0. (2.21) ' / t п AD OR . „ dR dR ,9ЯЪ R~dx« dx« dt„ " dtK K и приводя подобные члены, находим 2п + 2 развернутых условий трансверсальности .н dR хк dR __ . dR __ /п пм ш:+Ни~0' т;-Нк-0-(222) Уравнения (2.22) должны решаться совместно с уравнениями связей (2.3). При рассмотрении слабых вариаций управлений из (2.18) полу¬ чим необходимое условие минимума - / ^5udt> 0. J ди i’K. 54
11оскольку допускаются только изолированные разрывы, можно иыбрать Suj Ф 0 на столь малом интервале, где подынтегральное Iпоражение не меняет знак. Если Uj € (v>ji,Uj2), то, как и для случая иарьирования и Xi, рассматриваемое значение является внутрен¬ ним, поэтому должно выполняться условие стационарности дН = 0, Uj\ < Uj < Uj2- (2.23) Имея в виду, что при Uj = Uji выполняется неравенство Suj > 0 и ири u,j = Uj2 соответственно Suj < 0, получим дН дН — 0? 'Uj = Uji\ ~Qy~ ~ ^ = (2.24) <’ помощью дифференцирования по параметру необходимые усло- иия экстремума получены в книге В. И. Зубова [4]. / Замечание 1. В курсе вариационного исчисления для сильного но i относительного (слабого по ж и t) минимума функционала дей¬ ствия с нелинейно зависящей от х функцией Лагранжа L(x, х, t) при отсутствии связей необходимо условие Вейерштрасса. Для форму¬ лирования этого условия рассматривается представление функции .Плграпжа при замене х на некоторую величину £ L(x, f, t) = L{x, х, t) + - x) + o(||£ - x||). Тогда функция Вейерштрасса я г Е = L(x, f, t) - L(x, х, t) - 0г(€ - x). Условие Вейерштрасса имеет вид Е > 0. Для задачи механики управляемого движения по формулам (2.12) и (2.13) д± L = Fo(x,u,t) + а(х — F(x, и, tfj, I (кюда Е = F0 + А(£ - F) - F0 - А(х - F) - А(£ - х) = 0. 55
Условие Вейерштрасса выполнено. Оно просто вырождается ввиду линейной зависимости L от х. Следует указать на вспомогатель¬ ное значение проведенного рассмотрения, так как в вариационном исчислении принята иная постановка задачи. / Замечание 2. Система уравнений Эйлера - Лагранжа (2.19) и уравнений движения (2.20) представляет собой каноническую си¬ стему с функцией Гамильтона Я, импульсами А* и координатами Xi. Указанная система отличается от стандартной канонической си¬ стемы аналитической динамики линейной зависимостью Я от А* и наличием дополнительных переменных Uj, являющихся неизвест¬ ными функциями времени. На участках, не содержащих угловых точек с разрывами управлений, Поэтому на основании формул (2.19)-(2.21) и ввиду неизменяемо¬ сти граничных значений управлений, т. е. Uji = const, uj2 = const, полная производная по времени от функции Я на указанных участ¬ ках равна частной производной по времени от этой функции при наборе переменных х*, А*, щ, t, принимаемых за аргументы. Для любого участка экстремальной траектории, т.е. удовлетво¬ ряющей необходимым условиям экстремума, имеем где h = const и to — время начала данного участка. Если функции Fq и F явно не зависят от £, то Я = h. По условиям Вейерштрас¬ са - Эрдмана в угловых точках функция Я непрерывна, поэтому постоянная h оказывается одной и той же для всей экстремальной траектории. ^Замечание 3. Если dFo/dxi = 0, то уравнения Эйлера - Лаг¬ ранжа (2.19) сопряжены с уравнениями в вариациях для (2.20) вида у = Ау, где A(t) = [^] Как известно, сопряженной называют систему ф = —Атф, где т —знак транспонирования матрицы А. Поэтому А называют вектором сопряженных переменных. Отметим также, что L и Я на интегральной кривой уравнения (2.1) можно рассматривать, как сопряженные преобразованием Ле- dH дН дН . дН • ЭН . dt dt дх Х дХ ^ du U' t Г)(>
жандра характеристические функции, так как в силу (2.13) и (2.20) формула (2.12) приводится к виду L = TjT-A — Н = Fq. дХ При dFo/dxi ф 0 можно ввести дополнительную переменную хо, определяемую дифференциальным уравнением хо = Fo(xi,Uj,t)9 где Fo — функция под интегралом в (2.4). Векторы х и F будут из /”'11. Введем дополнительный лагранжевый множитель Ао = —1, то- I да Н = AoFo + ^ZILi = AF. Теперь матрица А имеет га 4-1 стро¬ ку и и 41 столбец с элементами первой строки = 0, ..., и ранными нулю элементами первого столбца ..., До¬ полнительное уравнение Эйлера - Лагранжа Ао = —§= 0 бу¬ дет первым скалярным сопряженным уравнением по отношению к и«*кторному уравнению в вариациях -ffaSx = ASx. При таком рас¬ смотрении задача минимизации функционала (2.4), состоящего из интегрального и неинтегрального слагаемых и называемая вариа¬ ционной задачей Вольца, заменяется так называемой вариационной тдачей Майера с неинтегральным функционалом Ф = х£ — xg 4 Rq. / Замечание 4. При решении конкретных задач часто бывает удобным минимизировать функционал (2.7) и не вводить множите- чи Вместо (2.21) имеем общее условие трансверсальности вида ДДо 4- (АДх - HAt)tK = 0. (2.25) Решаем его так же, как и общее уравнение механики Даламбера - Лагранжа: с помощью перехода к независимым вариациям на ос- иоиапии соотношений dRp dRp 8RP 8RP ARP = ^Ахн + ~Ахк + + -^А«к - 0. ах11 дхк dtH atK Например, для задачи оптимального быстродействия можно при¬ мять F0 = 0, Ro = tK-tH, т.е. решать вариационную задачу Майера. Помучим общее уравнение трансверсальности (2.25) в виде t п (АДх + (1 - Я)дЛ к = 0, H = XF = Y1 Xipi- l" i= 1 57
Пусть заданы начальное и конечное положения, а также то¬ гда Дх" = 0, Дхк = 0, AtH = 0. Поскольку AtK > 0, получим Нк = AF|fK = 1. Если ^ = 0, будем иметь первый интеграл совместной системы уравнений движения и уравнений Эйлера - п Лагранжа: = h = const. Можно также принять Fo = 1, i=i Ro = 0. Тогда приходим к задаче с интегральным функционалом, которую называют вариационной задачей Лагранжа. Общее урав¬ нение трансверсальности (аДх - ЯД*)‘К =0, Н = -1 4- AF. В тех же условиях получим AF|tK = 1 и для стационарной задачи тот же интеграл. / Замечание 5. Пусть функция Гамильтона Н линейно зависит от управления Uj, тогда будет непрерывной функцией времени. Как показывают формулы (2.23) и (2.24), во всех временных точ¬ ках, в которых управление Uj изменяется (так называемая точка переключения управления), = 0. 2.1.5. Условие экстремальности, отвечающее сильной вариации управления Из общей формулы вариации функционала (2.18) для ненуле¬ вой игольчатой вариации индекса а и нулевых значениях других вариаций получим #(х,\,u,ta) - Я(х,\va,ta) >0, va £ t/, (2.26) где x(ia), A(ttT), u(ta) - значения указанных величин на оптималь¬ ной траектории. Необходимое условие (2.26) вместо с правилом определения множителей А по уравнениям (2.19) получило назва¬ ние принципа максимума Понтрягина, так как при выборе огра¬ ниченного множества U в виде (2.2) оно равносильно соотношению Я(х, A,u,£) = max Я(х, А, ?/,/). (2.27) В левой и правой частях формулы (2.27) х и А одни и те же. Они равны значениям этих переменных в момент времени / па oiпи- 58
малы-юй траектории. Максимум функции Н рассматривается толь¬ ко по управлениям. Из формулы (2.27), в частности, следуют ранее полученные условия (2.23) и (2.24). Соотношения (2.19)—(2.25), (2.27) выражают необходимые условия сильного по и, х относительного минимума функционала (2.4) при условиях (2.1)-(2.3). / Замечание 1. Пусть управление Uj, значения которого при- падлежат отрезку uj\ < Uj < Uj2, входит в функцию Н линейно, I. е. Н = H\Uj 4- #2, гДе Hi и не зависят от Uj. Это соотноше¬ ние можно интерпретировать, как уравнение прямой на плоскости К,/0- ГСсли = Н\ > 0, то прямая имеет положительный тангенс угла, наклона к оси Uj и на отрезке [uji,uj2] функция Н возрастает. Максимум Н отвечает значению uj = Uj2. Если же = Н\ < О, ■го тангенс угла наклона прямой к оси Uj отрицательный, функция II на отрезке [uj\,Uj2] убывает и максимум Н отвечает значению //, iij\. Как отмечалось выше (см. замечание 5, разд. 2.1.4), в точках переключения управлений, как и на участках с внутренним управ¬ лением Uj е (uji,Wj2), выполняется соотношение = 0. Если по уравнение удовлетворяется только в изолированных точках, то участков с промежуточным управлением Uji < Uj < Uj2 не будет и оп тимальный режйм заключается в чередовании граничных управ¬ лений Uj 1 И Uj2- i / Замечание 2. Некоторые авторы считают, что можно избе¬ жать введения сильных игольчатых вариаций управлений за счет рассмотрения дополнительных управляющих функций, т.е. путем да льнейшего расширения пространства допустимых. Пусть, напри¬ мер, имеем только одно управление и, значение которого принадле- жит отрезку — 1 < и < 1. Рассмотрим дополнительное управление if, подчиненное ограничению v2 4- и2 = 1. Казалось бы достигается существенное упрощение, а именно, получим несложное уравнение связи, которое заменяет собою весьма сложную ситуацию с конеч¬ ными границами. Однако варьируя это уравнение связи, напишем ()v —uv~lSu. Поэтому при v = 0, т.е. при граничных значениях пе рвоначального управления и вариация Sv должна быть бесконеч¬ но большой и не может относиться к классу слабых вариаций. 59
2.1.6. Определение лагранжевых множителей на участке компланарного баллистического полета е центральном гравитационном поле Пусть отыскивается оптимальный перелет, который может включать участок полета с выключенным двигателем. Для сопря¬ жения (состыковки) необходимых условий оптимальности участ¬ ков управляемого движения и получения общей замкнутой системы уравнений необходимых условий экстремума потребуются выраже¬ ния не только фазовых переменных, но и лагранжевых множителей для начала и конца участка баллистического полета. На участке баллистического полета принимаем подынтеграль¬ ную функцию Fq функционала вида (2.4) равной нулю. Так будет для задачи оптимального быстродействия, если Ro = tK — tH (см. замечание 4, разд. 2.1.4) и при оптимизации по энергетике, так как энергия (топливо) расходуется только на участках активного дви¬ жения. Как известно, траектория движения представляется кониче¬ ским сечением, удовлетворяющим в полярных координатах 7’, ip уравнению где р—фокальный параметр, р — г при <р = - + е — эксцен¬ триситет', и) — полярный угол перицентра, т.е. самой близкой к фокусу конического сечения точки траектории. Изменение полярного угла определяется интегралом площадей где ае — квадратный корень из произведения гравитационной посто¬ янной на массу центрального тела. Для составления уравнений Эйлера - Лагранжа надо иметь яв¬ ный вид уравнений движения, которые также запишем в полярных координатах. Из кинематики известны выражения для проекций ускорения точки на обобщенные оси криволинейной полярной си¬ стемы координат 1 + е cos (ip — ш) ’ (2.28) 2 • - гф = аер2 Wr =Г - гф2, W<p = г 60
Ц-^I-— =Qqi Я\ = Г> Я2=<Р- Действует только сила Ньютона F = —mae2r/r3 притяжения к нпюдвижному центру. Отсюда получим уравнения движения г — гф2 = —ае2г~2, —-(г2ф) = 0. at 11 \ второго уравнения следует интеграл площадей, а из первого при использовании интеграла площадей и перехода к новой переменной / 1 и новому аргументу tp вместо t получается приведенное выше уршшение конических сечений (2.28). Уравнения движения точки в гравитационном поле в полярных координатах можно получить и с помощью уравнений Лагранжа иторого рода (1.15). Для этого напишем представление кинетиче¬ ской энергии и обобщенных сил или потенциальной энергии Т = ^77i(r2 -I- rV), Qr = —raae2r“2, = 0 и составим выражения (1.15) ±дТ_дТ dt dq dq (' исдовательно, получим те же уравнения движения. Дня записи уравнений движения в нормальной форме Коши, т.е. и и иди, разрешенном относительно производных, будем рассматри¬ вать в качестве скоростных фазовых координат проекции скорости точки па полярные оси: vr = г, v^ = гф. Получим следующие урав¬ нения движения: vr г-1 у2 — эе2г“2, Уф = —r~lvrv(p, г = vT, ф = r~lv(p. Теперь составим выражение функции Гамильтона (2.13) Н = - ^) + Аа(^) + А3г>г + А4^ (2.29) п уравнения Эйлера - Лагранжа (2.19) Ai = А 2 — Аз, Аг = —2Aj — + А2 — - —, г гг (2.30) Аз = ХЛ - 2АЛ - А2^ + \Л, А4 =0. 61
Из последнего уравнения находим Л4 = const. Оставшиеся урав¬ нения составляют систему трех линейных уравнений относительно Ai, Л2 и A3 с переменными коэффициентами. Угол / = (р — ш назы¬ вают истинной аномалией. По формуле (2.28) г = р/( 14- ecos/). Напишем выражения для скоростных фазовых координат с исполь¬ зованием интеграла площадей в виде г2/ = аер1/2: Vr=r- pef sin/(1 +ecos/)-2 = aeep~5 sin/, (t) . vv = гф = аергг-1 = аер~г (1 + ecos/). Продифференцируем по времени первое уравнение Эйлера - Лагранжа и преобразуем его с помощью второго и третьего урав¬ нений А, + Ai(3vv2r~2 - 2ае2г_3) + 2А4v^r~2 = 0. (2.32) Уравнение содержит лишь одну неизвестную величину Ai. Введем вспомогательные величины v 1 = Ai(1 4-ecos/), V'Z = A2(l 4- ecos/) и преобразуем полученное уравнение, а также второе уравнение системы (2.32) (см. приложение, п.1) к виду ~~грт’ + "1(4 - 3rp~l) 4- 2А4ае-1р* = 0, ^ 4- 2ui + А4аe~1p? = 0. а}г aj (2.33) Получили линейную систему обыкновенных дифференциальных уравнений относительно v\ и с переменным коэффициентом при v\ в первом уравнении. Функция Гамильтона (2.29) не зависит яв¬ но от времени, поэтому существует первый интеграл Н = const. Запишем этот интеграл (см. приложение, п.1) в виде е sin / (1 4- е cos/) + (1 4- е cos/)2^~4- dj dj +i/\ (2 4- e2 4- 3 e cos /) = -яГ V2 II. (2.34) Прямое получение этого интеграла на основании системы (2.33), исключая непосредственную проверку дифференцированием, пред¬ ставляется довольно сложным. 62
Если выразить d^/df с помощью второго уравнения системы (2.33), то соотношение (2.34) примет вид линейного дифференци¬ ального уравнения первого порядка относительно v\ и будет ин¬ тегрироваться в квадратурах с введением третьей, кроме Л4 и Я, произвольной постоянной. После подстановки полученного выра¬ жения для v\ во второе уравнение системы (2.33) получим урав¬ нение с разделяющимися переменными. При его интегрировании ииедем четвертую произвольную постоянную и получим явное вы¬ ражение для 1/2- Лагранжев множитель Аз может быть определен из первого уравнения системы (2.30). В результате будем иметь явные представления для всех четырех лагранжевых множителей, содер¬ жащие четыре произвольные постоянные. Тем самым первое урав¬ нение системы (2.33) удалось обойти. Имея в виду дальнейшие применения, ограничимся случаем II 0 и е Ф 0. Получим соответствующее представление лагран- женых множителей, зависящее от трех произвольных постоянных. 11л основании второго уравнения системы (2.33) и (2.34) имеем г sin /(1 + е cos/) ^ + (1 + е cos/)2(-2^i - ^*2—)+ df эе +^i(2 + е2 + Зе cos/) = 0. (1 помощью соотношения (л . /.ч dX\ . — = (1 + е cos/) — - eAi sin/ df df перейдем к переменной Ai a sin / (1 + е cos /)2^г — е2 sin2 /(1 + е cos/)Ai + «/ I (с2 sin2/ — е2 cos2/ — е cos/)(l+e cos/)Ai = —Ae(l + e cos/)2. Здесь введена постоянная А вместо A4 по формуле А = —Х43e~le~lp^ = const. I loc ue приведения подобных членов и сокращения на е (1 + е cos /)2 приходим к уравнению
При интегрировании по известной формуле для линейного диф¬ ференциального уравнения первого порядка, п которой постоянную обозначаем через Be, находим Ai = sin f(B е + A ctg /) — A cos / 4- В е sin /, где В — вторая произвольная постоянной решения уравнений Эйлера - Лагранжа. Теперь второе уравнение системы (2.33) имеет вид = —2(1 4- е cos f)(A cos/ 4- В е sin/) 4- еА = df = (--2cos / - е cos2/) А — 2е sin/(l 4- е cos/) В. После интегрирования получим v2 = —A sin /(2 4- е cos f) + В(1 + е cos /)2 4- где D — третья произвольная постоянная. Лагранжев множитель Аз определим из первого уравнения системы (2.30): Аз == —аер“2(-А sin / 4- Be cos/)(l 4- е cos/)24- 4-аер“2 (_^4 sin/(2 4- е cos/) 4- £(1 4- е cos/)2 Н- D)(l 4- е cos/) = = аер~^(1 4- е cos f){—A sin/ 4- #(1 4- е cos/) 4- D). Выпишем для рассматриваемого случая Н = 0, е ф 0 выражения всех четырех лагранжевых множителей: Х\ = A cos/ 4- Be sin/, А2 = {—A sin/(2 4- е cos/) + В( 1 4- е cos/)2 -I- D)(l 4- е cos/)-1, Аз = аер“^(1 4- е cos f)(—A sin/ 4- В(1 4- е cos/) 4- D), А4 = —aЛе, (2.35) где A, В, D — постоянные интегрирования; ае квадратный корень из произведения гравитационной постоянной на массу центрально¬ го тела; р — фокальный параметр; е — эксцентриситет орбиты; / — истинная аномалия, т. е. полярный угол, измеряемый от перицентра орбиты. 64
2.1.7. Условие экстремальности при фазовом ограничении 11усгь движение управляемой системы описывается обыкновен- м и ми дифференциальными уравнениями: х = F(x, u(t),t), xeRn, F G Rn, t G [£Hj£k] С Я1, (2.36) 1Ж F G C\ F'x G Cl\ x — вектор фазовых переменных; t — время. Управление u(t) из класса кусочно-непрерывных функций с конеч¬ ным числом точек разрыва со значениями в г-мерных сегментах: Uj 1 < Uj < Uj2i Uji = const, Uj2 = const, j = l,r. (2.37) 11(‘которые или все Uj\ = —oo, Uj2 = oo. Будем считать управления непрерывными справа. Кроме связей с уравнениями (2.36) могут быть наложены в об¬ щем виде неудерживающие ограничения на фазовые координаты. Для упрощения выкладок будем рассматривать только одну такую сияй»: /(*,*)< 0, fee1. (2.38) Ограничение (2.38) в отличие от материальных связей теоретиче¬ ской механики не создает реакции. Уравнения движения при выхо¬ де системы на связь (2.38) будут иметь тот же вид (2.36). «Реакции» реализуются выбором управлений. ' Зададим удерживающие ограничения на начальные и конечные шачения переменных: R/t(x",xK, t«, tK) = О, Rp € С1; p = U; l<2n + 2. (2.39) Мели / > 27i, то уразнения (2.38) и (2.39) должны быть согласова¬ ны. Уравнения связей (2.39) предполагаются независимыми: rang 0Ro dR0 dR0 dRc дхн ’ дхк ’ dtH ’ dtK = I. Кслп управляемый процесс (x, и) удовлетворяет ограничениям (2.36)—(2.39), то его называют допустимым. Задача оптимизации за¬ ключается в определении допустимого управляемого процесса, ко- 65
торый на множестве допустимых траекторий минимизирует функ¬ ционал tK Ф = J Fo(x,u,t)dt+Ro(xH, хк,t„,£K), ib & Сl, Fqx 6 С1, До € С1. (2.40) Для получения необходимых условий экстремума применим ме¬ тод варьирования условного функционала, который получаим из (2.40) с помощью добавления нулевых величин на допустимых тра¬ екториях: tK 1) / Х(х - F)dt, A(£) Е Rn — неопределенные лагранжевы мно- жители; tK 2) f f(x, t)da — неотрицательная мера сг сосредоточена лишь на til точках множества, для которого f(x,t) = 0; I 3) vpRpi где — независимые от времени неопределенные р= 1 лагранжевы множители. Тем самым исходная задача заменяется задачей варьирования функционала где & — обобщенная производная по t от функции, о = х(Мь*2)л(*)> x = 0(t-ti)-e(t-t2), л(t) е С1, £i — момент выхода на связь (2.38), t2 — момент схода с этой связи. Введем функции Хевисайда: *<‘-т>=Ц Ill **->={?: !>; • С помощью функции Дирака 6(t — т) <т = [<J(f - ti) - - £г)]Л(й) + хА. 66
Функционал (2.41) преобразуем к виду Ф = J Ldt + A(ii)/(xx, ti) - A(t2)f(x2, г2) + R, (2.42) ■Ж L = L 4- хА/, Ь(х, £, Л, щ t) = F0 4 Х(х — F). (2.43) Согласно методу Лагранжа функционал (2.43) варьируется в расширенном пространстве кривых, свободных от связей (2.36), (2.38), (2.39), а лагранжевы множители А, Л и v выбираются из условия удовлетворения указанным связям на экстремалях. Допускаемая разрывность управлений не позволяет ограничи¬ ваться слабыми или малыми вариациями управляющих функций. Для сильного варьирования управлений будем использовать иголь¬ чатые вариации (см. разд. 2.1.1). Для управлений на действитель¬ ной траектории сохраним обозначение u(t). Введем управления сравнения u'(t), равные u(tH) при t Е гн, va при t Е га, u(t) при / </ U ia U гк, u(tK) при t Е гк. Разность u'(t 4- At) — м(£) является игольчатой вариацией. При этом вариации интегральных управле¬ ний, как интегралов от u(t), будут слабыми. ('ильным (конечным) игольчатым вариациям управлений будут отмечать на траекториях системы (2.36) кратковременные сильные вариации переменных х. Поэтому при варьировании (2.40) в расши¬ ренном пространстве допускаются конечные вариации этих пере¬ менных на бесконечно малых промежутках времени. В силу соотно¬ шения х' — х = принимающего для слабых вариаций пере¬ менных х вид 5х = $i&x, вариации переменных х определяются вы- |»ором вариаций переменных х. Конечное значение х\ — Х{ не проти¬ воречит требованию бесконечно малого значения x\—Xi = Sxi. Дей- « гвительно, пусть \х[ — ±i\ < а*, тогда \x\-xi\ < \х[ — Xi\T +a,i(t — т). Мри малой величине Дт = t — т > 0 имеем на полуинтервале | /, / I- Дт) величину |<5xi| порядка |<5xi|r и Дт. И отличие от неголономной механики, в которой в силу физи¬ ческих причин имеются ограничения на выбор компонентов каса- ими.пых векторов Sxi, для рассматриваемого случая принятые пе¬ рестановочные формулы для вариаций не противоречат уравнени¬ ем связей (2.36). Так, например, для кинематически допустимых кривых сравнения при и' = и имеем 67
Вариации фазовых переменных в этом частном случае определя¬ ются уравнениями в вариациях для (2.36) вида -^Sx = ^6х. Пе¬ рестановочные формулы выполняются. Еще раз отметим, что для получения конструктивных условий экстремальности схема варьи¬ рования условного функционала не ограничивается только кинема¬ тически допустимыми траекториями, а расширена до произвольно¬ го варьирования х, А. При этом управления должны удовлетворять ограничениям (2.37). Индексом 1 обозначим вариацию функционала, полученную при слабом варьировании х, A, u, t, а также при слабом и сильном варьи¬ ровании х в указанном выше смысле. На основании (2.43) напишем для трех возможных участков: il — 0 — 0 t2~0 t2~0 А\ J Ldt = Ai J Ldt, A\ J Ldt = A\ J Ldt+ t„ t„ ti +0 £i 4*0 ^2—0 tK tH -f J хЛ^ЛхсЙ, A\ J Ldt = A\ J Ldt. ti+o t2+ о t2+ о Как и при отсутствии ограничения на фазовые координаты, для любого (71,72) С [t„>tK] имеем т\ дНя —5и ди dt-Ь dL +(АДx-HAt)rT\ , Я = -qtX-L , Я(х,А,и,t) = -F0+\F. (2.44) Поэтому может быть написано следующее развернутое представле¬ ние слабой по х, А, и, t и сильной по х вариации условного функци¬ онала (2.42):
Л {ti) <П_ дх1 At2 + «2 + A(fi - 0)Дх1 - Н + А(<2 — 0)Дх2 — Н Ati - Х„Ахн + H„At„+ 11-0 Д^2 — X(t\ -f~ (З)Дх1 -j- H t2- о Aii 4- ti-fO 4 AKAxK — HKAtK — Л(^2 "Ь 0)Дх2 H At2 4 ДД. (2.45) t2+o Сильная вариация функционала Д2Ф, вызванная варьировани¬ ем управлений, сводится на основании (2.42)-(2.44) к выделению линейного члена в приращении: J | Ь(х, х, А, и\ t) — L(x, х, А, и, £)j dt = *». = J \н(х, A, u, £) — #(x, A,u',£)j dt, tn где x, x, A, u, £ — соответствующие величины на оптимальной тра¬ ектории. Обозначая t„ = to, tK = £w+i, получим условное равенство к смысле эквивалентности бесконечно малых величин: N+1 Д2Ф - ^2 / [^(х’ А»* О] (2.46) <7 = 0 / ta I (олная вариация условного функционала ДФ = ДХФ 4 Д2Ф. (2-47) / Замечание. Если в качестве кривой сравнения принята, в частности, удовлетворяющая уравнениям (2.36) траектория, силь¬ ная вариация условного функционала: 7V+1 I jZ(x,x',A, u',£) — L(x, х, A, it, £)j dt = a=0 ^ 69
N+l LfT = ^2 I \L(x, J.), \% ii J) //(./•, /'’(•/', u,, /.), A, u\ £)1 dt-\- n J <7=0 \-A-2 A ' hxdl | Д2Ф. at Однако член, содержащий А-^Л;/;, нам и уже изучен при выводе формулы (2.45). Поэтому здесь сохраняются представления (2.45)- (2.47). Развернутый вид необходимых условий минимума следует из неотрицательности Д1Ф и Д2Ф. Поскольку при варьировании условного функционала лишь на управления наложены ограниче¬ ния вида (2.37), то при закреплении управлений получим Д1Ф = 0. Приравняем нулю совокупность членов с одинаковыми вариация¬ ми в правой части выражения (2.45). Получим уравнения (2.36): х = = F. Это свидетельствует о том, что экстремаль является допустимой траекторией. Имеем уравнение Эйлера-Лагранжа: дН . df ' дх +х дх' (2.48) а также условия Вейерштрасса-Эрдмана в точке выхода на связь при <1 ф t„ df H(h + 0) - H(tj - 0) = -A(fi) и в точке схода с этой связи при £2 ф tK df dt (2.49) А(<2 + 0) — X(t2 — 0) — — ^(^2) «2 H(t2 + 0)-H(t2-0) = A(t2)2£ (2.50) 70
Но всех других точках экстремальной траектории будут выпол¬ няться условия Вейерштрасса-Эрдмана в виде непрерывности Л и /У. Получим также условия трансверсальности: -А„ + !^=0, ни + £=о, 1афи, С/ОС || л V ндх £|| 9R „ — + —— — О, иХн Ли df dt dR 7й~ ~ *н - ^1’ dt„ (2.51) dR Л ,, 9й „ , (1 Ак + д— — 0, —Нк + —— — 0, tK ^ <2) ахк atк * 21 к а:/; tK Л д 9/ 4 Ак 4* « — 07 Лк ахк dt OR Як 4 7Г—• = 0, tK = t2- utK Уелоиия Д1Ф > О, Д2Ф > 0 при варьировании только управлений в илу (|юрмул (2.45) и (2.46) равносильны максимальности на опти- мд.»1ык)й траектории функции Н по управлениям при закреплении /, \ и t. Это условие, вместе с правилом вычисления множителей \ но уравнениям Эйлера-Лагранжа, называют принципом макси¬ мума. Пример 1. Интегрирование изложенным выше методом урав- мгнпП Эйлера-Лагранжа можно провести для случая, когда Н Ф 0. Иипдя четвертую постоянную по формуле С = — ае“2 е~1 р2 Н, по- |учпм представления лагранжевых множителей вида \ | Л cos / 4 В е sin / 4 С /, V* (-А sin/(2 -1- е cos/) 4 В(1 + е cos/)2 4- £>)(1 4- е cos/)-14 4С(1 4 е cos/) J, \ 1 2(1 4- е cos f)(—A sin/ 4- 23(1 4- е cos/) 4 /?) — -азр“2(1 4- в cos f)2C К, \ | znp~ 2 А е. 71
Здесь введены обозначении df / / = sin / , , J sin /(14-ecos/)2 j = ctg/ 1 4- с cos/ t e(l +e cos/) e sin/ Zf = (e sin2 / — cos/)(e sin/(1 4- e cos/)2) * — J (e sin/) Пример 2. Полагая в формулах (2.31) и (2.33) е = 0, г = р,/ = = 99, придем к выражению лагранжевых множителей для круговой орбиты Ai = A cos ip + В sin ip 4- 2С, Аг = —2Л sin у? 4- 2Б cosy? - ЗС</? 4- D, Аз = —аер”2(Л sin у? - В cosip + ZC ip — D), А4 = —&р~?С. Значок « ~ » показывает, что произвольные постоянные здесь в ос¬ новном другие. Пример 3. Для построения универсальных теорий, пригодных для описания круговых орбит (е = 0), а также эллиптических, па¬ раболических и гиперболических орбит, для которых е ф 0, в небес¬ ной механике применяются элементы (постоянные интегрирования) Лагранжа вида h = esinus, k = ecoscj, которые заменяют элементы е и и. При стремлении е к нулю эле¬ мент и, как угловое расстояние перицентра, становится неопреде¬ ленным. Элементы h и к остаются определенными и стремятся к нулю вместе с е. Запишем при использовании лагранжевых элементов представ¬ ления для фазовых координат г = р( 1 4- к cosip 4- h sin</?)_1, vr = eep~l^2(k sin ip — h cosip), Vy = aep_1/2(l 4- к cos ip 4- h siny?). В уравнениях Эйлера-Лагранжа перейдем к независимой неремен¬ ной ip и получим аналог уравнений (2.33) и формулы (2.34) i-tl _ 2 ^ - 3vip~ir — 0, ^ + 21/1 + А/1 а;"■'/>* = 0, dup1 сир dip 72
(// cos ip—k sinip)(l+h simp+k cos ip) ^^-+(14 A sin^+A; cosy?)2 ^7-^4 dip dip I u\ (2 4 h2 4- A;2 4- 3/i siny? 4 ЗА; cos ip) = С, С = —ae_2p2 // = const. 11айдем выражения для универсальных формул лагранжевых мно¬ жителей: Ai — A cosip 4 В sirup -I- CG\y Х2 = ((2 + h sin у? + к cos<p)(—A sin ip + В cos ф)+ +CG2 4 ^>)(1 4 h sirup + к cos ip)~11 А.ч = —ае(1 4- h sin у? 4 к cos(р)(А sinip — В cosip — CG3 — D), = — аер-2 (С + Ак В К). ■ 1десь приняты следующие обозначения: (h sin ip -I- A; cos <p)2(2 -I- h sin ip 4- к cos ip) n (h2 4 k2)(l + h sinip + к cosy/)2 42W(—h cosip 4- h sinip)(h2 4- k2)~*, + / (*""?+*°"У> ay, J (1 4 /г smy? + A: cosy?)3 0 u (V2 = ip — 2 J(1 + h sinip + к cosip) Gi dip, 0 63 = —G2 4* (/г sin у? 4 A: cosy>)(A; siny? - /1 cosy?4 4/f (1 4- /1 sin v? 4 A; cosy?))(/i2 4- A;2)-^, /v = —2Ж 4- (A: siny? — /1 cosip)(h2 4- A:2)'^(l 4 h siny>4- к cosip)~2. 2.2. Исследование необходимых условий экстремума 2.2.1. Преобразование необходимых условий минимума функционала при замене переменных Рассмотрим диффеоморфизм класса С2 для фазовых перемен¬ ных и времени У = 2/ОМ)» т = Т0М), х = х(т/, г), t = t(y, г), (2.52) 73
£ 1Г, F с- /Г, (,тё /?'. Векторное дифференциальное уравнение движения (2.1) в новых переменных у и г В новых переменных рассмотрим задачу минимизации с тем же физическим функционалом (2.4) и с граничными условиями, эк¬ вивалентными условиям (2.3). Поэтому подынтегральная функция преобразованного к новым переменным функционала Теорема, Если Н — функция Гамильтона и А — вектор лагран¬ жевых множителей, отвечающих переменным х и t, далее Н и /х — функция Гамильтона и вектор лагранжевых множителей той же задачи оптимизации в переменных у и т, то справедливы утвер¬ ждения Для доказательства возьмем V£ € (tH,tK). Через т будем обо¬ значать отвечающее этому моменту значение новой независимой переменной. По формуле (2.14) напишем два выражения одной и той же величины f=Y(y,u,T), Ye с1, где у=(§^+1) т = Grf+й)(§^+%)"■ \дх at/ат \дх dt/\ax at) (2.53) (2.54) АДх — HAt = цАу — НАт. д-5=-/((f+*М1Н),А+^*‘)л+(лд*-яд0!.- т 74
Ограничиваясь рассмотрением в расширенном пространстве Нп xRnxRrxR траекторий сравнения, получаемых при нулевых с лабых вариациях управлений, а также при нулевых вариациях в начальной точке фазовых переменных и времени, имеем (АДх — HAt)t = (fiA у — НАт)т, г. с. соотношение (2.54). По непрерывности это соотношение рас¬ пространим на начальный и конечный момент времени. Полагая в (2.54) а ду а ду к а 9т а дт Ау = -^-Ах 4- ~rZ7 At, Ат = —Ах 4- — Дt дх dt дх dt и приравнивая члены с одинаковыми вариациями Дх* и At, полу¬ чим выражения (2.53). Следствие. Пусть выполняется автономная замена независи¬ мой переменной т = т(£), t = £(т), dr/dt > 0, тогда формулы (2.53) принимают вид р-55> / Замечание. Формулы (2.53)-(2.55) показывают, что, взятая со таком «минус», функция Н, как и в аналитической динамике, при- оьротает смысл своеобразного обобщенного импульса, сопряженно¬ го со временем t, приобретающего смысл своеобразной обобщенной координаты. Соотношения (2.52)-(2.54) можно интерпретировать как точечное контактное (каноническое) преобразование канониче¬ ских переменных х, А с функцией Гамильтона Н и временем t в канонические переменные у,/х с функцией Гамильтона Н и новым временем т согласно соотношениям для линейных дифференциаль¬ ных форм АДх — HAt + уД/х — тАН — Д (/ху(х, t) — Нт(х, £)). 75
2.2.2. Управляемая гамилътопова система Механическую систему будем называть управляемой гамильто¬ новой, если её уравнения движения при выбранных управлениях как функциях времени u(t) являются каноническими. Если выпол¬ нены условия _0 т? - дЙ г7 - дЙ и — 2s, к — 1)5, Fk о j Fs-j-k — , OXs+k OXk то уравнения движения (2.1) имеют вид канонических уравнений Як = о—, Рк = » Як = Хк, Рк = х3+к- (2.56) орк oqk Теорема. Пусть Я € С1, Я' € С1, Я' Е С1, функция Fo мини¬ мизируемого функционала не зависит от g и р. Если известно общее решение уравнений (2.56) при выбранной реализации управлений u(t) в виде qk{cv, £), Pk(cu, t), v = 1, n, n = 2s, где cu — произвольные постоянные, то общее решение уравнений Эйлера-Лагранжа будет А* = -Jp-Cv, К+к = (2.57) (JC у С/С]/ где Cv — новые произвольные постоянные. По дважды повторяющимся индексам выполняется суммирова¬ ние от 1 до п. Функция Гамильтона задачи оптимизации в этом случае ЯН H = -F0- С„. (2.58) Для доказательства запишем на основании (2.56) выражение (2.13) в развернутом виде: h=-fo+a‘^-a-+‘S' <2'59> Поскольку по условию dFo/dqk = 0, dFo/dpk = 0, то уравнения Эйлера-Лагранжа (2.19) с функцией Н, определяемой формулой (2.59), имеют вид d\a _ д2Н , _ д2Н —тг — о—о г As+fc dt dqadpk 3 dqadqk ’ 76
d\3+<T ч д2н , ч д2н _ _ /чвпч J. — ^ о о + ^s+A: ГУ о » С7 — 1,5. (2.60) аС Орайрк UP(jUQk 11 роварьируем уравнения (2.56) d . д2Н . Э2Н . зт<>9а = д—^s—ор*. dt ОЦ.к@Ро upkiypfj dr д2Н t д2Н /а„,ч dt Ра dqkdq<j dpkdqa Рк' 11<> условию вторые смешанные производные от Н по q и р непре- рынпы, поэтому можно изменить порядок вычисления производ¬ ных. На основании сопоставления систем (2.60) и (2.61) устанавли- иием соответствие \а — —8ра, А5+,у = Sqa. (2.62) I Ьк-.кольку Sq = 8си, Sp = Jjp- 6сиу где постоянные 8cv не зависят и г постоянных Cv, то общее решение уравнений (2.60) на основании (2.(12) будет иметь вид (2.57). С помощью формул (2.57) представ¬ ление (2.59) преобразуется к виду (2.58). Следствие. Условиям доказанной теоремы удовлетворяет уча¬ сток баллистического движения в центральном гравитационном по¬ ме. Функция Гамильтона Н равна сумме энергий: кинетической Т и потенциальной П. Будем иметь для единичной массы т = \(г2 +г2ф2), п = Z г Рассмотрим канонические переменные: ЭТ . дТ о <7l = г, q2 = <р, Pi = -qT = г, р2 = щ=г ср. Имеем диффеоморфизм типа (2.52), определяемый на основании -И) равенствами у\ = х\,у2 = х2х$, уз = хз, у\ = Х4, т = t. Здесь и отличие от обозначений, принятых при доказательстве теоремы, ш риме две фазовые переменные являются импульсами, а две дру- | не координатами. Формулы преобразования лагранжевых множителей (2.53) дают Ai = мъ А2 = М2Х3, А3 = д2х2 + цз, А4 = щ. (2.63) 77
Лагранжевы множители //ь/Х2,А*з и можно определить по фор¬ мулам вида (2.57) с помощью вычисления изохронных производных др/дси, dqjdcu, как это предлагается в следующем примере. Пример. Вычислим изохронные производные от переменных У1 = Р1 = aeep_1/2sin/, у2 - р2 = а&р~ 1/2, Уз = Qi = P/i 1 + ecosf), yA = q2 = (p = f f w по так называемым кеплеровым элементам С\ С, С2 Р) Сз W, С4 — где - момент прохождения точки через перицентр орбиты. Ис¬ тинная аномалия / будет зависеть от этих элементов. Исходя из интеграла площадей г2/ = аер1/2, можно написать соотношение / j (1 -f ecos f)~2df = aep“3/2(i - ip), b с помощью которого определяются df /дси, и = 1,4. Используя со¬ отношения (2.57), можно получить формулы лагранжевых множи¬ телей /х„. Формулы (2.63) должны приводить к представлениям \и в примере 1 (см. разд. 2.1.7). Можно выполнить аналогичные действия при записи канониче¬ ских переменных с применением элементов Лагранжа У\ = Pi = asp~x^2(ksm(p — h cos<£>), У2 = P2 = Уз = Яг = P/(l + A sin (р 4- k cos <р), y4 = q2 = ip. Постоянными будут служить Cl = fc, С2 = Л, Сз=р, C4 = fo, где ^ — момент прохождения точки через полярную ось. Для опре¬ деления изохронных производных дч>/дси используем соотношение ч> J(I 4- hsin(p 4 kcos(p)~ld(p = aep~3^2(t - ta). о 78
2.2.3. Управляемая механическая система 4—' с малым параметром Мы называем экстремалью кривую расширенного простран¬ ства, удовлетворяющую необходимым условиям экстремума. По¬ скольку необходимые условия экстремума удовлетворяются сов¬ местно с уравнениями движения и ограничениями на граничные значения фазовых траекторий, то экстремаль будет допустимой траекторией и значение условного функционала на ней равно зна¬ чению исходного функционала. При постановке экстремальной задачи могут быть введены «фи¬ зические» малые параметры. Кроме того, процедура получения ре¬ шения может потребовать введения так называемых «методиче¬ ских» малых параметров, т.е. таких величин, при нулевых значе¬ ниях которых удается найти решение с нулевыми «физическими» параметрами. Затем можно пытаться перейти от этого представ¬ ления к решению исходных уравнений с помощью рядов по сте¬ пеням некоторого единого числового малого параметра, если рас¬ сматривать, вместо разрывных управлений, соответствующие ин- t тегральные управления f Ujdt и моменты переключения управле- т ПИЙ Т. Пусть совместная система уравнений движения, уравнений свя¬ зей, а также необходимых условий экстремума, которые состоят из уравнений Эйлера-Лагранжа, условий трансверсальности и урав¬ нений, получаемых из максимальности Н по управлениям, приве¬ дена к явному заданию аналитического оператора Е(£, 77, £, г) = 0. Термин оператор применен в смысле общего названия системы, со¬ стоящей из различного типа уравнений: дифференциальных, инте¬ гральных и интегрально-дифференциальных. Здесь t £ - {x(t),X(t),u(t), J udt,T,i/,t„,tK} T вектор неизвестных величин, причем непрерывные управления мо¬ гут входить явно, а разрывные —в виде некоторых интегралов по времени; ^ — вектор лагранжевых множителей граничных условий (2.3). Через г/ обозначен вектор исходных величин, е — числовой неотрицательный малый параметр. 79
Полагаем известным решение £° уравнения г/, /,, 0) == 0. Вве¬ дем замену £ = £° + г и перейдем к операторному уравнению Z{z,^yTf,t,e) =0, левая часть которого представлена в виде абстрактного ряда Тей¬ лора Z = Bz + Z0i£+ ' (2-64) i+}> 2 где В —линейный оператор в соответствующем функциональном пространстве; Zij — частные производные Фреше от Z в точке 2 = = 0, е = 0 порядка г по z и порядка j по е. Теорема [3). Если оператор В обратим, то при достаточно ма¬ лом е уравнение Z(z,£0,r],t,£) = 0 имеет единственное решение, представимое в виде сходящегося ряда по степеням £ вида zv = оо = ^2 aUj€К Если оператор В необратим, то возможно ветвление з=1 решения, т. е. существование при достаточно малых е бесконечного или конечного числа решений, непрерывно зависящих от е и стре¬ мящихся к нулю при е —> 0. Если число решений конечное, то каж- °о дое из них представимо в виде zu = £ bvj£^s, где s — натуральное з=1 число (свое для каждой ветви решения). Чтобы пояснить процедуру представления решения в виде схо¬ дящегося ряда по степеням малого параметра, рассмотрим постро¬ ение решения системы обыкновенных дифференциальных уравне¬ ний с малым параметром ±i = Xi(xj,t,£), t,j = l,n (2.65) в заданной ограниченной области и с начальными данными при t = 0 в виде Xi = Xio. Здесь £ - малый параметр, управляющие функции u(t) явно не выделяются, т.е. X(x,t,£) = F(x, u(£), £, б). Пусть получаемая при £ = 0 система уравнений х? = Xi(z?,t,0) (2.66) = XiO имеет единственное решение с начальными данными xf t=o вида x° = x°(xjQ ,t). (2.67) 80
Систему (2.66) называют невозмущенной или системой дифферен¬ циальных уравнений нулевого приближения. Введем в рассмотрение так называемые возмущения перемен¬ ных Zi = Xi- х(2.68) 11усть правые части уравнений (2.65) могут быть разложены в ряды но степеням возмущений и малого параметра при \zi\ < р, е < р, где ^ — некоторое положительное число, именно: оо Xi(xj,t,e) = Xi(x°,t, 0)+ ^ alkpzk£p. (2.69) fc+p=l '{дееь использованы сокращенные обозначения: А: = к\ + • • ■ + fcn, акр = , zk = Zj1 ... znn, где (\гк р — некоторые непрерывные функции времени; к\... кпур — целые неотрицательные числа. Предположим также, что ряд Е Кр1^Р (2-70) fc + p=l сходится равномерно относительно t на заданном временном отрез- ко [(), Г] при \zi\ < р, е < р. Индексы г и j для сокращения запи¬ си будем опускать. Формулы (2.65), (2.66), (2.68), (2.69) позволяют мшшсать дифференциальные уравнения возмущенного движения оо ak,pzk£p, (2.71) fc+P= 1 которые в силу (2.67) и (2.68) следует решать с нулевыми началь¬ ными данными. Решение уравнений (2.71) будем отыскивать в виде z = ez(1) + £2z(2) + ... (2.72) Подставим представления (2.72) в уравнения (2.71) и приравня¬ ем ( лева и справа члены с одинаковыми степенями е. Для членов первого приближения имеем (1) — <*1,0,...,о 2|1^+ao,i,...,o• -+<20,0,...,1,о "f“^o,o,...,o,i (2.73) 81
с начальными условиями = 0. Члены последующих прибли¬ жений определим уравнениями также с нулевыми начальными условиями. Величины Л^ состав- где 1<^<т — 1,и коэффициентами при к -\- р < т. 2.2.4. Теорема Пуанкаре о решении системы обыкновенных дифференциальных уравнений с малым параметром Сформулируем теорему Пуанкаре. Пусть правые части уравне¬ ний (2.65) разлагаются в сходящиеся ряды (2.69), при этом соответ¬ ствующие ряды (2.70) сходятся равномерно относительно t в задан¬ ном отрезке [0, Т]. Если при отмеченных условиях решение системы (2.66) известно, тогда 1) общее решение однородной системы для (2.73) и (2.74) может быть получено при помощи дифференцирований; 2) решение уравнений (2.73) и (2.74) выполняется в квадрату¬ рах; 3) полученные ряды (2.72) будут сходиться при достаточно ма¬ лом е и в сумме с нулевым приближением (2.67) будут давать ре¬ шение системы (2.65), разложенное по степеням малого парамет¬ ра е. Докажем первый пункт сформулированной теоремы. Как сле¬ дует из представления (2.69): лены при помощи сложений и умножений над переменными z^q\ дХ а1А...,о = — дх\ х=х°,е=0 ах(х°,«, о) дх\ ’ дХ 1’° = Я ax{x°,ty о) dxl (2.75) Составим изохронные вариации решения (2.67): (2.76) 82
где Cj — независимые постоянные, входящие в общее решение урав¬ нений (2.66), Cj = Xjo. Вариации этих постоянных могут принимать произвольные постоянные значения. Обозначим их через Cj. Вели¬ чины &с° формулы (2.76) удовлетворяют уравнениям в вариациях для системы (2.66). Учитывая (2.75), напишем Чем самым доказано, что общее решение однородной системы для 71 я о уравнений (2.73), (2.74) будет Первый пункт теоремы j=1 3 1 Пуанкаре доказан. Перейдем к доказательству второго утверждения теоремы. Как первое приближение z^l\ так и любое последующее определя¬ ются решением линейных неоднородных дифференциальных урав¬ нений, начальные данные для которых равны нулю, а неоднород¬ ные члены функционально зависят от предыдущих приближений. 11оскольку общее решение однородной системы для этих уравнений получено, то любое приближение может быть построено, на¬ пример, с помощью метода вариации произвольных постоянных в виде формулы Коши о где матрица п х п с элементами z^ и — матрицы- <-голбцы. При т = 1 полагаем А^ = ао,о,...,о,ь Второе утверждение доказано. Для доказательства третьего утверждения теоремы можно по¬ строить мажорантный ряд. Поскольку ряд (2.70) сходится по усло¬ вию теоремы равномерно, то его сумма непрерывна по t и на рас¬ сматриваемом отрезке ограничена. Пусть G > 0 есть верхняя гра¬ ница рядов (2.70), тогда имеем HU и - ди *.,р = о,-<*»«■■■«■*». 83
Рассмотрим дифференциальные уравнения оо (2-77) k+p=l которые мажорируют уравнения (2.71). Если ряды для 0* будут сходиться, то должны сходиться и ряды (2.72), поскольку |^т^| < < ^т). Уравнения (2.77) запишем в виде Эти уравнения ввиду неотрицательности в г мажорируются уравне¬ ниями ОО k вг = G + * - * “1" 0п 4- s)p — G = /1=0 = ^^1 ~ (®i • • • ~Ь 4 s)p — G = G0(1 —- 0) 1, (2.78) где 0 = (в\ 4-... 4- вп 4- е)р~1. Для удобства интегрирования уси¬ ливают правую часть уравнения (2.78), умножая ее на 1 4- 0. Сле¬ довательно, будем рассматривать вспомогательную систему урав¬ нений вг = G©(1 + 0)(1 - 0)"1. (2.79) Суммируя уравнения (2.79) и учитывая, что е и р постоянные, напишем ё = n<?e(i + 0) (p{i - ©)) . Отсюда получим уравнение с разделяющимися переменными (I - Т^ё)<Ю-Л. Проинтегрируем это уравнение 0(1 4 0)~2 = Сехр (nGp~lt^J, С = const. 84
Для мажоранты принимаем те же нулевые начальные условия Qi\t=o = поэтому ©|t=0 = sp~l и С — ер{е 4- р)~2- Примем обо¬ значение j(t) = ер{е + р)~2 exp(nGp~lt). (2.80) Величину © определим из квадратного уравнения 02 + (2-7_1)0 + 1 = 0 в виде 0 = —1 + (l ± (1 — 47)1/2) (27) Величина 0 должна быть порядка £, поэтому перед радикалом знак минус. Если 7 < то радикал может быть разложен в сходящийся ряд по степеням 7. Уравнения (2.78) показывают, что 9\ = 02 = ... = вп. Поэтому 6i = п“1 (0р — б). Тем самым при 7<|ив силу обозначения (2.80) при £р(е + р^ exp (nGp~lt^ < ^ (2.81) вспомогательные переменные 0* являются голоморфными функци¬ ями. Условие (2.81) для любого конечного Т при t <Т может быть выполнено за счет выбора достаточно'малого е. Поэтому при указанном выборе величины малого параметра е мажорирующие переменные 0* представляются в виде сходящихся рядов по степеням е. По свойству мажорантных функций и ряды (2.72) будут равномерно сходиться. Последний пункт теоремы до¬ казан. / Замечание. Неравенство (2.81) налагает жесткое ограничение на величину малого параметра, для которого степенные ряды ре¬ шения системы дифференциальных уравнений сходятся. Пусть ве¬ личина параметра е задана, тогда из (2.81) получим ограничение на интервал времени «< -4in.<£+^ nG 4ер При € = р интервал времени сходимости рядов исчезает. Для £ = р/4 имеем t < ^ 1п| « 0,44^ . Оценка (2.81) может быть 85
немного улучшена, а в случае линейности относительно х правых частей исходных дифференциальных уравнений (2.65) можно по¬ казать, что радиус сходимости рядов (2.72) будет равен р. Если нельзя гарантировать сходимость полученных рядов, то оо говорят об асимптотическом разложении решения. Ряд ehz(/l) /1=1 называют асимптотическим для решения z. Обозначим z ~ ОО ~ ehz^h\ Если при любом целом N > 1 /l=1 N z(t) = Yjehz{h\t)+o(eNz(N)(t)). /1=1 Здесь использован ранее применяемый символ <р\(е) = о{(р2{е)), е —> 0, означающий, что = 0 при е —» 0. Асимпто¬ тические представления широко применяются для получения при¬ ближенных решений. Надо заметить, что все естественно научные теории являются асимптотическими, так как при их построении не учитываются некоторые мало значащие факторы. 2.2.5. Ветвление решений вырожденных нелинейных уравнений необходимых условий экстремума Ограничимся рассмотрением часто встречающегося случая, для которого задача выбора экстремальной траектории приводит к ре¬ шению нелинейной системы п конечных уравнений по типу (2.64) в виде Z(z,^°,77, t,e) = 0, относительно такого же числа неизвест¬ ных z. оо Отыскивая решение в виде ряда zu = avh£h и приравнивая /1=1 нулю члены с одинаковой степенью е, находим п £ az/ad + эг/де I г=0 = о, (2.82) и-l £=0 е=0 п YldZ/dz„\г=0а„т + В(т) =0, т > 2. (2.83) U=l е = ° Здесь В(т) получаем при помощи сложений и умножений над ве¬ личинами avq, l<q<m—1и коэффициентами Zij разложения Z в ряд по типу (2.64) при 1 < i 4- j < т. 86
Линейный оператор В теоремы (см. разд. 2.2.3) в рассматрива¬ емом случае представляется матрицей пхп с элементами dZy/dzuy вычисленными при z = 0 и € = 0. Если якобиан, т. е. определитель этой матрицы, не равен нулю, то будет существовать единственное решение уравнений (2.82) и (2.83) указанного типа в виде ряда по степеням е. Пусть оператор В необратим. Это означает, что ранг матрицы Якоби ае меньше п. Не теряя общности, будем считать отличным от нуля определитель, составленный из коэффициентов первых ае уравнений при первых ае неизвестных в уравнениях (2.82) и (2.83). Из первых уравнений (2.82) найдем представление ац,... ,а&\ че¬ рез a-E+ij,..., ani, подстановка которых в оставшиеся уравнения (2.82) приводит к п — ае так называемым уравнениям ветвления первого порядка. Эти уравнения не содержат ауi, так как при ()Z/де| г=о = 0 тождественно относительно а„i обращаются в нуль. е=0 Условия совместности уравнений ветвления первого порядка опре¬ деляют множество тех значений £°,77 и t, которым могут отвечать жстремали рассматриваемого типа. Подобное рассмотрение урав¬ нений (2.83) приводит к п — ае уравнениям ветвления т-го порядка, определяющим возможные значения aae+i)m_i,... ,an>m_i. Вместе с тем в соответствии с теоремой (см. разд. 2.2.3) можно искать решение тех же уравнений в виде разложений по дробным степеням е. Возьмем, например, за методический малый параметр < */2, т.е. примем s = 2 и напишем уравнения для первых двух оо приближений типа (2.82) и (2.83) решения вида zv — ^ Ъ^е1^2: 7=1 71 =0, (2.84) V—\ £=° п Y^dZ/dzv\z=obv 2 + dZ/de I г=0 + B(2) = 0. (2.85) V-\ € = 0 е=0 Последние п — ае уравнений системы (2.84) будут следствиями первых ае уравнений этой системы, с помощью которых выража¬ ем £>ц,..., 1 через бае+м, • • •»Условия совместности уравне¬ ний (2.85) дают уравнения ветвления порядка е. Уравнения (2.84) получены в результате приравнивания нулю суммы членов, име¬ ющих множителем е. Поэтому в В^ величины Ьг,\ войдут в виде 87
квадратичных членов. Отсюда следует, что уравнения приближе¬ ния порядка е будут квадратичными относительно 6гЕ+1,ь • • • i^ni* Для получения уравнений ветвления можно первые ж уравнений системы (2.84) разрешить относительно 612,..., ЬЖ2 и тем самым представить их в виде линейных выражений от Ьае+1,2» • ■ чЬп,2> а также квадратичных относительно b«+i,i,... ,Ьпд. После подста¬ новки этих выражений в оставшиеся п — ее уравнений системы (2.84) члены, содержащие Ьге+1,2, • • •, &п,2, взаимно уничтожают¬ ся. Условия существования решения уравнений ветвления относи¬ тельно величин Ьае+1,1, • • • >^п,1 определяют допустимое множество значений £°,77 и t, которым могут отвечать экстремальные реше¬ ния, соответствующие разложению по степеням квадратного кор ня из £. 2.2.6. Упрощенное асимптотическое представление управляемого процесса Предположим, что управления, для которых граничные значе¬ ния Uj 1 и Uj2 конечны, входят в функцию Н линейно. Приращение условного функционала, вызванное сильными вариациями таких управлений, в смысле эквивалентности бесконечно малых величин на основании формул (2.11)—(2.12) запишем в виде ДФ fa- J - щ) dt, (2.86) t.. 3 где J-jp не будет зависеть от разрывных управлений. Лемма. Вариация функционала Ф, вызванная разностью ли¬ нейных разрывных управлений на точном решении и приближен¬ ном с точностью до £ решении, имеет порядок б2. Поскольку = 0 при Uji < Uj < Uj2 и в точках переключения управлений, то подынтегральное выражение правой части (2.86) будет равно нулю за исключением моментов времени, когда и/ и щ принадлежат разным граничным значениям Uj\ и Uj2. Пусть Uj определяется с помощью приближенных уравнений, которые от¬ личаются от точных уравнений движения и условий экстремаль¬ ности на члены порядка е. Предполагая разложимость уравнений по параметру £, можно утверждать, что разность интегральных 88
управлений [// — Uj = fu/dt — Jujdt для tn < т < t < tK 6y- r r дет порядка e. Поэтому Uj может принадлежать противополож¬ ной Uj границе управления лишь для моментов времени £, близких к точке переключения этого управления на оптимальной траекто¬ рии. Для таких моментов в силу непрерывности dH/duj и обраще¬ нию в нуль в точках переключения управлений этой производной 0(\дН/duj\) = е. В рассматриваемом случае вызванная сильными вариациями управлений вариация условного функционала оказывается порядка е2. Лемма доказана. Теорема. Пусть функция Н линейно зависит от разрывных управлений. Опустим в уравнениях Эй лера-Лагранжа, в услови¬ ях трансверсальности и в функции Н при получении условий ее максимальности члены порядка /х™""1, а в уравнениях движения и граничных условиях — члены порядка /хт. Тогда ошибка оптималь¬ ного значения функционала имеет порядок /хгп при m > 2. Доказательство. Будем отмечать волной решение упрощенных управлений, штрихом — соответствующее решение, если уравнения движения и граничные условия сохраняются без изменения. Пере¬ менные со штрихом отличаются от переменных с волной на члены порядка /хт, где /х — некоторый малый параметр, и от переменных на оптимальной траектории на члены порядка /хт-1. Траектория со штрихом является допустимой, для нее В силу условия стационарности для слабых вариаций Sx} SA, 5щ At и сильных вариаций х! — х имеем ДФ = 0. Поскольку по лемме при £ = /хш“1 для сильных вариаций управлений О(ДФ) = /х2^т_1\ то 0(Ф' —ФОПт) = /х2(т-1). Учитывая оценку 0(Ф —Ф') = /хт, приходим к доказательству высказанного утверждения, так как при т > 2 будет 2(га — 1) > т. та+0(е) * ° т„—0(е) Ф'-Фопт = ДФ + ^Д2Ф + ... 89
2.3. Оптимальный переход в центральном гравитационном ноле 2.3.1. Задана оптимизации переходных орбит в декартовых координатах Рассмотрим задачу оптимального маневрирования точки пе¬ ременной массы в центральном гравитационном поле. Пусть 2/ь 2/2» Уз~ декартовы координаты точки относительно неподвиж¬ ной системы координат с началом в центре планеты, принимаемой за притягивающий центр. Производные координат по времени обо¬ значим соответственно V\,V2,V3. Уравнения движения, составлен¬ ные на основе уравнения И. В. Мещерского для точки переменной массы [12J, имеют вид Vi = 9г 4- /шгт_1а*, ijt = Vi, т = -д, (2.87) gi = -a?yi{y\ + у\ + Уз)"5, г = 1,2,3, где gi — компоненты ускорения притяжения к планете; ц > 0 — рас¬ ход массы в единицу времени; иг — положительная постоянная от¬ носительная скорость истечения частиц; т — масса точки; щ — на¬ правляющие косинусы тяги; ае2 — произведение универсальной гра¬ витационной постоянной на массу центрального тела. Управлениями будут величины а*, подчиненные ограничению а\ +а1 + аз = !> (2-88) а также величина /i, которая вследствие ограниченности тяги дви¬ гателя должна удовлетворять условию О < fi < I/, v — const > 0. Общая задача оптимизации по минимуму расхода массы содержит семь фазовых переменных и*, т и четыре управляющие функ¬ ции /а, т.е. х € Я7, и € R4. Задача заключается в минимиза¬ ции функционала: Ф = J к fidt. Поскольку используются зависимые управления а*, следует расширить постановку вариационной зада¬ чи механики управляемого движения и при переходе к варьиро¬ ванию условного функционала ввести дополнительный лагранжев множитель, отвечающий уравнению связи (2.88). Соответствующая функция Лагранжа с учетом уравнений (2.87) и (2.88) 90
L = fi + A i(vi - gi- fjLurm~lai) f А:м г(уг - гг*) + -f A7(m + /i) + A8(a? + a\ 4- «3 - 1). По дважды повторяющимся индексам предполагается суммиро¬ вание от 1 до 3. Перейдем к функции Гамильтона dL U = —x-L = -fi+\i(gi+fjLurm~1ai)+Аз+г1/г-А7/2-А8(а?+а|+аз-1). ох 11апомним, что с помощью введения лагранжевых множителей ис¬ ходная задача заменяется задачей оптимизации условного функ¬ ционала в расширенном пространстве допустимых, в котором все фазовые переменные, лагранжевы множители и все управления ва¬ рьируются независимо. Экстремум по управлениям а* внутренний, поэтому в числе условий максимума Н имеем дН д2Н т;— = цигт~1 \ - 2A8ai = 0, -г—у = -2А8 < О, А8 > 0, i = 1,2,3. oai босI (2.89) Максимуму H ввиду линейной зависимости от д могут отвечать следующие варианты участков движения: а) /х = 0 при Уц < 0 — режим нулевой тяги; б) ^ = 0 — режим промежуточной тяги; в) [1 = v при > 0 — режим максимальной тяги. В точках переключения управления //, как и для режима про¬ межуточной тяги, имеем дН —— = — 1 + urm~l\iai — А7 = 0. (2.90) дц (-оставим уравнения Эйлера-Лагранжа л К = —Аз+i, Аз+i = -АА7 = iiuTmr2\i<Xi. (2.91) дуг Решение задачи связано с интегрированием 14 дифференциальных уравнений (2.87), (2.91) на указанных выше участках траектории движения, стыковке этих участков и удовлетворению граничным условиям и условиям трансверсальности. 91
Из (2.89) находим а7; = iurm *АгА8 1. Поэтому на основании (2.88) получим А? + А| + A3 = «i = А*А-х, А = y^Af + А| + А|. (2.92) Из формул (2.92) следует коллинеарность вектора Л с компонента¬ ми Аь А2, Аз и единичного вектора тяги с компонентами аьа2,аз. Пусть г — радиус-вектор точки с координатами 2/i, 2/2» 2/з« Первые шесть уравнений движения (2.87) эквивалентны векторному диф¬ ференциальному уравнению г = -ae2r~3r + fiurm^1 А-1 А. (2.93) Обозначим через Л вектор с компонентами А4, А5, Xq. Первые три уравнения Эйлера-Лагранжа (2.92) примут вид А = -А. Поскольку выполняется соотношение ^2 (-ае2% (ух + у\ + yl)~%) = -ae2r“3Ai+3ae2 у{г~5 А г, j-1 У* последующие три уравнения (2.91) приводятся к виду А = —ае2г-3 А + Зае2 (А г) г~5г. (2.94) Умножим уравнения (2.93) и (2.94) векторно справа соответ¬ ственно на А и на г, а затем сложим результаты гхА + Ахг = 0. Отсюда имеем “(г X А + А X г) — 0. dv ' Получаем векторный интеграл систем (2.87), (2.91) гхА + Ахг = С, (2.95) 92
который можно записать в исходных переменных задачи vxA + rxA = C. Формула (2.95) дает три скалярных интеграла системы дифферен¬ циальных уравнений (2.93), (2.94). Поскольку уравнения движения явно не зависят от времени, имеем еще один интеграл Н = h = const. В соответствии с отмеченными выше режимами управления оп¬ тимальная переходная траектория может состоять из дуг баллисти¬ ческого полета при отключении двигателя, режима промежуточной пли программируемой тпяги и, наконец, движения с наибольшей тя¬ гой. Если на участках первого и третьего типа управление /х извест¬ но (на первом нуль, на третьем и), то для режима программиру¬ емой тяги имеем вырождение, так как условие (2.90) не содержит величины /х. Если имеется участок промежуточной тяги, то соотношение (2.90) должно выполняться не только в изолированных точках (точ¬ ках переключения управления /х), но и на некотором конечном ин¬ тервале времени. В этом случае производная по t любого порядка от левой части (2.90) должна быть равна нулю. Условие (2.90) с помощью (2.92) приведем к виду urm~l А = 1 + Л7. Продифференцируем это соотношение но времени цигт~~2 А + urm~l\ — А7. С учетом (2.91) и (2.92) для участка программируемого режима по¬ лучим игт~1 А = 0, т.е. длина вектора А на дуге промежуточной тяги не изменяется. Снова получили вырождение, так как содер¬ жащие /х члены взаимно уничтожились. Выполним еще одно диф¬ ференцирование по времени fj,urm~2\ 4- urm~lX — 0. 11оскольку А = 0, то равно нулю первое слагаемое. Имеем снова вы¬ рождение. Так будет и при последующем дифференцировании. По¬ этому величина /х на программируемом режиме может быть опре¬ делена приравниванием нулю развернутых на основании уравнений 93
(2.93) и (2.94) выражений для производных по времени от Л. При этом только четвертая производная будет явно содержать управле¬ ние д. Проведенное рассмотрение выявляет сложность проблемы опре¬ деления оптимального перехода в гравитационном поле. Выбор условий на граничные значения переменных приведет к постанов¬ ке конкретных задач, для некоторых из которых при упрощающих предположениях удалось построить решение. Конечно, упрощения можно достигнуть выбором другого ми¬ нимизируемого функционала, т. е. для другой физической задачи. Например, если взять в качестве минимизируемого функционала интеграл от /i2, то вместо единицы в (2.90) будет стоять 2ц. Полу¬ чим простое соотношение, связывающее управление \i программи¬ руемого режима с величиной изменяемой массы и лагранжевыми множителями. 2.3.2. Постановка задачи перехода с эллиптической орбиты на круговую Рассмотрим компланарную задачу оптимизации перехода точки переменной массы в поле притяжения ньютоновой силы. Первона¬ чальная орбита предполагается эллиптической. Требуется ее под¬ нять и сделать круговой. Фазы движения по граничным орбитам могут быть любыми. Будем исходить из уравнения движения в форме Мещерского raw = —ае2гаг_3 г + mur, где га — масса точки; ае2 — произведение гравитационной постоян¬ ной на массу центрального небесного тела; г — радиус-вектор; ur — относительная эффективная скорость истечения частиц, которая в современных химических двигателях оказывается практически постоянной по величине, не зависящей от интенсивности расхода массы. Имеется два управляющих фактора: расход массы в единицу времени и направление реактивной тяги, обратное направлению ur. После деления на га, спроектируем уравнение движения на оси полярной системы координат. Учитывая проведенное рассмотрение (см. разд. 2.1.6), напишем 94
vr = r lVp — ae2r 2 + рсояф, v^ = —r ivrvip Ь (Ыпф, f = vri ф = г~1у1р, (2.96) где $ = — wrdinm/dt — величина реактивного ускорения; ф — угол между направлением радиус-вектора и направлением реактивной тяги. Имеем два управления: и\ = /? и г^2 = Ф- Ввиду ограниченности мощности двигателя или допустимой пе¬ регрузки следует принять ограничение О < Р <b, b = const > 0. (2.97) Поскольку двигатель можно произвольно ориентировать, на на¬ правление тяги U2 ограничения отсутствуют. Переход будет энергетически оптимальным, если на его осу¬ ществление израсходовано наименьшее количество топлива: горю¬ чего и окислителя. Можно считать конечную массу га заданной, так как вес последней, как говорят, сухой ступени ракеты определяется поставленной технической задачей. Поэтому надо минимизировать начальную массу ган, что равносильно минимизации ln(mH/mK) или функционала вида tK Ф = J(3dt = urln(mH/mK). (2.98) Для завершения постановки задачи следует задать граничные усло¬ вия. Учитывая формулы (2.28) и (2.31), напишем начальные усло¬ вия при t = tH v“ = <ве„р~1/2 sin v” = жр“1/2(1 + e„ cos /„), rH = PhJ(1 И- cos/н)? <Ph = /н "4" (2.99) где е„,рн и о;н--заданные постоянные (кеплеровы элементы на¬ чальной орбиты), истинная аномалия точки старта /н подлежит определению. Фаза движения, т.е. момент времени t* прохождения точкой на начальной орбите своего перицентра, может выбираться произвольно. 95
Напишем условия для конечного момента времени /к: г;* = 0, v* = aer"1/2, rK - const. (2.100) Угол срк может быть любым и подлежит определению. Момент вре¬ мени tfi прохождения точкой на конечной орбите пересечения этой орбиты с полярной осыо допускается произвольным. I гудем предпо¬ лагать конечную орбиту более высокой, а именно: гк > /;„( 1 —сн)~1. 2.3.3. Исследования функции Гамильтона задачи оптимизации Составим функцию Гамильтона (2.13) на основании формул (2.96) и (2.98) Н = Р(—1 -t- Ai cos ф + A2sinV0 H- #ъ (2.101) где H\ не зависит явно от управлений /?, ф и совпадает с функцией Гамильтона (2.29) для баллистического полета. Вычислим производные функции Н по управлениям дН дН —г- = — 1 + Ai cos ф + A2sin ф, —- = /?(—Ai sin ф 4- A2co sip), д/3 дф (2.102) д2Н п д2Н . . , . , д2Н а/ч , . . ,, ~д(Р = = ~AlSin^+A2COS^’ 2 = -Р(л1С05ф-\2атф) (2.103) Необходимое условие стационарности по ф будет дН/дф = 0. От¬ сюда имеем q2jj —Ai sin ф + А2 cos ф = 0, —:— = 0. д/Здф К числу необходимых, согласно формулам (2.23), (2.24) и (2.97), относятся также условия: дН/д/З = 0 при 0 < (3 < Ь\ дН/д/З < 0 при /3 = 0; дН/д/З > 0 при (3 = Ь. В точкам переключения управления дН/д0 = 0 . Поэтому для программируемого или вырожденного режима, ко¬ торому отвечает промежуточное значение Д и для точек переклго- 96
чения управления /? имеем Ai cos ф + Х2 sin ф = 1. Вместе с условием дН/дф = 0 в силу формул (2.102) получим Ai = cos^>, А2 = sin^. (2.104) По формулам (2.103) и (2.104) для программируемого режима ()2Н/дф2 отрицательна, поэтому эти участки отвечают условию максимальности Я при изменении угла ф. Однако для програм¬ мируемого режима Я = #1, а для /? максимального Я > Н\. Огра¬ ничимся, исходя из условия максимальности Я, рассмотрением ак¬ тивных участков с максимальным реактивным ускорением b, что по существу равносильно использованию на этих участках макси¬ мальной тяги. На баллистических участках Н = Н\ нет зависимости от управ¬ лений. Эти участки не противоречат свойству максимальности Н. Па них не увеличивается значение функционала (2.98). Поэтому участки, на которых /? = 0, могут включаться в состав оптималь¬ ной траектории. Будем рассматривать траектории с двумя включе¬ ниями маршевого двигателя. Поэтому искомая экстремальная тра¬ ектория включает первый участок активного движения с макси¬ мальным реактивным ускорением формулы (2.97). Начало участка совпадает с точкой старта на начальной орбите. Затем идет участок баллистического полета. Перелет заканчивается вторым участком активного движения с максимальным реактивным ускорением, ко¬ нец участка в конфигурационном пространстве полярных коорди¬ нат совпадает с точкой финиша. Если обозначить через га* массу точки в конце первого участка активного движения, то формула (2.98) примет вид Ф = V\ + V2, V\ = ur In(raH/ra*), V2 = ur In(ra*/raK). Величины V\ > 0 и V2 > 0 называют характеристическими скоростями соответствующих участков. /Замечание. Рассмотрим вектор Л с компонентами Ai и А2, а также единичный вектор тяги Т с компонентами Т\ = cos ф, т2 = sin ф. Формулу (2.101) запишем в виде # = /3(-1+Ат) + Яь Согласно «принципу максимума» /? > 0, т\ и т2, (т2 + т| = 1) доставляют наибольшее значение Н2 =/?(-!+ Ат). 97
Отсюда можно сделать следующие выводы: 1) пусть /3 ф 0, тогда Ат > 1; 2) если Ат < 1, то 0 = 0; 3) при Ат > 1 должно быть Р = /Зтах = Ь\ 4) в точках переключения управления /? и для программируе¬ мого режима Ат = 1; 5) поскольку в качестве Т может быть взят любой единич¬ ный вектор, на участке баллистического полета Ат < 1 и в точ¬ ке переключения Ат = 1, то для баллистического движения Л2 = = А2 4- А2 < 1 и Л2 достигает наибольшего значения А2 = 1 в точке сопряжения с участком активного движения. 2.3.4. Участки экстремали с максимальным реактивным ускорением Маршевые химические двигатели создают мощную тягу и за сравнительно короткое время позволяют ракете изменить скорость на конечную величину. Поэтому при выполнении переходов между орбитами суммарное время участков активного движения на поря¬ док меньше длительности всего перехода. Обозначим через Tj от¬ резок времени j-го активного участка, j = 1,2, а через Т = tK - tH время всего перехода. Можно ввести в рассмотрение малый пара¬ метр е = \{Т\ + Т2)/Т. При изучении j-го участка активного движения целесообраз¬ но использовать вспомогательную независимую переменную Tj = = €~1(t — tj), где tj - время начала соответствующего участка. При изменении t от tj до tj + Tj переменная Tj изменяется от 0 до Tj = 2TTj /(Ti 4- Т2). Поэтому переменная г, получает прира¬ щение того же порядка, что и другие переменные задачи. Для применения метода малого параметра следует ввести такой масштаб, чтобы время перелета и фазовые переменные X\=Vr, Х2=Уф, Хз = Г, Х4 = (р (2.105) были порядка единицы. Для этого достаточно взять единицу вре¬ мени порядка Т, а единицу длины порядка наибольшего удаления от притягивающего центра точек, двигающихся по граничным ор¬ битам. Эффективная скорость истечения в современных реактив¬ ных двигателях, равная 3-4 км/с , близка к космическим скоростям 98
и может считаться в этом масштабе также порядка единицы. На¬ помним, что первая космическая скорость для Земли « 7,91 км/с, а вторая « 11,2 км/с. Длительность активных участков в этом масштабе порядка £, поэтому из формулы для функционала (2.98) Поскольку первый член функции Я формулы (2.101) не зависит от фазовых координат, уравнения Эйлера-Лагранжа для участков активного движения имеют тот же вид (2.30), что и для участка баллистического полета. Перейдем в уравнениях движения и урав¬ нениях Эйлера-Лагранжа к дифференцированию по новой неза¬ висимой переменной т и примем обозначения (2.105) для фазовых [ временных Здесь фазовые переменные х\,х2,хз,х4 и управления d/3/dr, ф имеют порядок единицы. Формула (2.101) принимает вид В нулевом приближении при е = 0 : — 1 -I- A? cos ф° + A^sin^0 = 0, что вместе с равенством дН/дф = 0 приводит к формулам вида (2.104) : А? = cosф°, А§ — sin^°* Из уравнений (2.107) следует: А* = = const, А§ = const, A® = const, А4 = const. Поэтому угол наклона тяги в нулевом приближении ф° оказывается постоянным. Обозначим через Ь максимальное значение управления d(3/dr. следует, что /? будет большим параметром порядка е 1. = 0. (2.107) (2.108) Величина Ъ = еЪ порядка единицы. Решение уравнений (2.106) в нулевом приближении X?(т) - Х°(0) = Ът COSIp0, Х°(т) = £3(0), 99
х2(т) — х2(0) =Ьт simp0, х°(т) - ;r”(0). (2.109) Полученные формулы отвечают импульсному изменению скоро¬ сти на величину 6т при неизменном конфигурационном положении точки. Обсуждение построения следующих приближений участков максимального реактивного ускорения проведем после решения за¬ дачи оптимизации в нулевом приближении. Отмстим только то, что характеристические скорости Vi = frrf = ЬТи V2 = Ьт£ = ЬТ2. (2.110) 2.3.5. Аналитический оператор задачи Аналитический оператор задачи оптимального перехода (см. разд. 2.3.2) состоит из уравнений движения (2.106), уравнений Эйлера-Лагранжа (2.107), граничных условий (2.99) и (2.100), усло¬ вий трансверсальности, условия постоянства Н вдоль всей траек¬ тории, а также из условий стыковки участков экстремали между собой. Начнем с условий трансверсальности, которые можно записать согласно формуле (2.25) в виде (АДх - HAt)iu = 0, (АДх - HAt)tK = 0. (2.111) Вариации фазовых переменных на начальной орбите будут опре¬ деляться вариацией истинной аномалии /н на основании формул (2.99). Выражение для истинной аномалии на эллиптической орби¬ те можно получить с помощью интеграла площадей, как это пред¬ лагалось в примере (см. разд. 2.2.2), а именно: r2/ = aep^, (1 + ecos/)-2/ = гер~*, rf / (1 4- ecos f)~2df = аер“*2 (£ _ tp), (2.112) Jo где tp — момент прохождения перицентра эллипса, в котором ано¬ малия / = 0. Варьируя (2.112), напишем (1 - ecos/)”2Д/ = эер~2(Д£ _ Д*р). 100
Поскольку но условию задачи Д£„ и Д£“ независимы, то из (2.111) следует Н = 0 и на основании (2.99) следующее уравнение транс¬ версальности в точке старта дхн -1 -1 Ан — = аее„р„ 2 (A" cos /„ - А2 sin /„ + ае- LpH 2 г2A3 sin /„) + А" = 0. OJ н (2.113) Для конечной круговой орбиты с помощью интеграла площадей 2 • h 7— = аагк напишем _ 3 V?K =аегк 2(£к - <&)• Первые три фазовые переменные в конечной точке постоянны и их вариации равны нулю. В силу независимости вариаций Д£к и Д^ из (2.111) получим А$ = 0 и снова Н = 0. Функция Гамильто¬ на (2.101) явно не зависит от угла ip. Поэтому для любого участ¬ ка экстремали четвертое уравнение Эйлера - Лагранжа имеет вид d\\jdt = 0. Отсюда А4 = const на основании условий Вейерштрас- са- Эрдмана не только Я, но и лагранжев множитель А4 будет равен нулю на всей экстремальной траектории. Равенство нулю А4 приведет к обращению в нуль постоянной А в формулах (2.35) лагранжевых множителей на баллистическом участке траектории: Ai — Be sin/, А2 = В(1 -f ecos/) + £>(1 И-ecos/)-1, A3 = азр”2 (1 -f- ecos/)(S(l 4- ecos/) 4- D), (2.114) где e,p и / — эксцентриситет, фокальный параметр и истинная ано¬ малия соответственно на переходном эллипсе. Обозначим через ф\ и Ф2 углы наклона тяги в конце первого участка активного движения и в начале второго. Условимся обо¬ значать значком «-» величины в начале переходного эллипса, а значком «+» соответственно в конце. На основании формул (2.104) и (2.114) запишем условия Вейерштрасса - Эрдмана для указанных точек Be sin /- = cos ф\, Be sin /+ = cos ф2, B(1 -f ecos/“) 4- D{ 1 4- ecos/-)”1 = sin^i, (2.115) B{ 1 4- ecos/+) 4- D( 1 4- ecos/+)-1 = sin^2- 101
Кроме формул (2.115), должны быть удовлетворены условия непре¬ рывности фазовых переменных в моменты времени стыковки участков экстремальной траектории. 2.3.6. Решение задачи в нулевом приближении Согласно формулам (2.109) в нулевом приближении скорость точки меняется импульсно. Учитывая также формулы (2.110), на¬ пишем выражения для приращения радиальной х\ = vr и трансвер- сальной Х2 = скоростей на первом и втором участках активного движения в нулевом приближении левом приближении, которые после их определения в сумме дадут значение минимизируемого функционала нулевого приближения. С помощью представлений (2.28), (2.31), а также (2.99), (2.100) полученные условия можно записать в развернутом виде Здесь использовано следующее из (2.109) условие неизменяемости величины радиус-вектора на участках активного движения в нуле¬ вом приближении: Согласно формуле (2.109) полярные углы также не изменяются: аееоРо 2 sin /0 - аее„р„ 2 sin /° = V° cos Ф®, зеРЙ1 С1 + е„ cos/°)(р| - р2) = V? sin </>?, -аееоРо 5 sin /o’ = v° cos V>2. аегк 4^1 -Po) = ^2° sin ^2 • (2.117) (2.118) (2.119) (2.116) pH(l + e0 cos/q ) = p0(l + e„ cos/°), rK(l + e0cos/0+) -po. (2.120) (2.121) ¥>» = /н + = ¥>o =fo + wo, (2.122) 102
4>l=4>i =/o++wo. (2.123) Восьми уравнений (2.116)-(2.123) явно недостаточно для опре¬ деления 11 следующих величин нулевого приближения: кеплеровых элементов переходного эллипса ео,Ро>^о> параметров управлений ^1°» ^2°> угловых положений точек старта и финиша rfl.vS. а также истинных аномалий переходного эллипса /0 , /q', отвечаю¬ щих указанным точкам. Добавим четыре уравнения (2.115) условий Вейерштрасса Эрдмана в нулевом приближении Boeosin/^" =cos^i, Boeosinf^ = cos'02> #o(l + e0cos/0“) + D0(l + eocos/o-)-1 =sin^?, (2.124) B0(l + e0cos/q ) -f Z>0(1 + e0cosf£)~l = sin^- К 11 перечисленным неизвестным добавляются еще два: Во и Do- Имеем 12 уравнений относительно 13 неизвестных. Замыкающим тринадцатым уравнением будет служить усло¬ вие трансверсальности (2.113), которое при Л4 = 0 для нулевого приближения, учитывая (2.104) и первое соотношение обозначения (2.124), запишем в виде В0е0 sin cos f° - (Л20 - эе-1рн 5гн,оАзо) sin f° = 0. (2.125) Приступим к решению системы 13 трансцендентных уравнений (2.116)—(2.125). Подставим значения cos^? и cosV>2 из (2.124) соот¬ ветственно в уравнения (2.116) и (2.118) — - _ — - аееоРо 2 sin fo ~ женРн 2 sin /„ = VfBoeo sin /0~, (2.126) -гееоРо* sin /q" = V£B0e0 sin f£. (2.127) Уравнения (2.125) и (2.126) удовлетворяются значениями sin = 0 и siu/q = 0, а уравнение (2.127) — значением sin/g" = 0. Равенство нулю sin /£ означает, что старт в нулевом приближении происходит в одной из вершин начальной эллиптической орбиты (перицентре или апоцентре). Равенство нулю синусов истинных аномалий на¬ чальной и конечной точек переходного эллипса нулевого приближе¬ ния показывает, что эти точки являются его вершинами, а угловая дальность перелета равна 180°, т.е. = тт. 103
Рис. 1 Указанным значениям отвечают два решения нулевого прибли¬ жения I и II для переходного эллипса (рис. 1). Мы не будем останавливаться на доказательстве отсутствия других решений указанной выше системы 13 уравнений ввиду гро¬ моздкости соответствующих выкладок. Отметим, что для задачи перехода на круговую орбиту равенство sin f~ = sin /+ =0 следует из замечания (см. разд. 2.3.3, приложение, п. 2). Из первых двух уравнений обозначения (2.124) следует, что ^ J = гр® = %, т.е. трансверсальность импульсов. Второе и третье уравнения (2.124) примут вид Во(1 4" во) -f- jDo(1 4- ео) 1 = 1» -Во(1 — во) -J- Д>(1 — ео) 1 = 1. Отсюда получим Во = Do = |(1 — е^). Рассмотрим и другие уравнения (2.116)—(2.123) в обратном по¬ рядке их нумерации. Соотношения (2.122) и (2.123) определяют полярные углы точек старта и финиша. При этом для решения I ljq = а>н, а для решения II соответственно ши = u>q f п. Уравнения (2.120) и (2.121) принимают вид г° =ро(1+ео)-1, гк=ро(1-Со)-1. (2.128) Будем употреблять обозначения из двойных знаков, для которых 104
верхний отвечает первому решению, а нижний — второму. В нуле¬ вом приближении радиус-вектор точки старта г2=ри(1±еи)-1. (2.129) Из уравнений (2.128) получим ео = (гк - г°)/(гк + r°), po = 2г°гк/(гк + г£). (2.130) Уравнения (2.116) и (2.118) уже удовлетворены, а из уравне¬ ний (2.117) и (2.119) находим характеристические скорости нулево¬ го приближения vi = ®(О-1(Р0 - Рн). V* = ггГкЧгк -Ро)- (2.131) Перелеты вида I и II с кеплеровыми элементами (2.130) и характе¬ ристическими скоростями (2.131) называют перелетами типа Го¬ мана. Собственно гомановским перелетом принято называть ре¬ шение рассматриваемого вида, когда не только конечная, но и на¬ чальная орбита является круговой. В этом случае при произволь¬ ной фазе движения хотя бы по одной из граничных круговых орбит любая точка начальной орбиты может быть точкой старта. Неопре¬ деленность положения точки старта делает нулевое приближение в такой задаче вырожденным, имеющим якобиан для уравнений вида (2.116)—(2.125), равный нулю. Каждая из траекторий I и II обнаруживает свойство быть ло¬ кальным минимумом, так как для каждой из указанных точек стар¬ та величина первого импульса, меньшая соответствующего значе¬ ния Vi°, не обеспечивает достижения удаления от центра притяже¬ ния на величину гк. Однако наименьшему значению функционала задачи в нулевом приближении Ф° = v,° + v2° отвечает траектория I, для которой в формуле (2.129) надо взять знак плюс. Убедиться в этом можно с помощью сравнения сум¬ мы характеристических скоростей (2.131). Заметим, что в общем случае это сделать непросто. Дальнейшее рассмотрение будем про¬ водить на основе нулевого приближения оптимального перехода в виде траектории I. 105
2.3.7. Режим управления с точностью до членов второго порядка Как следует из теоремы об упрощенном асимптотическом пред¬ ставлении управляемого процесса при решении задачи оптимиза¬ ции с линейными разрывными управлениями с точностью до е2 условия экстремальности можно решать с точностью до членов по¬ рядка £, а уравнения движения и уравнения граничных условий с точностью до членов порядка е2. Предполагая получить решение задачи оптимального перехода с эллиптической орбиты на круговую с точностью до второй сте¬ пени отношения времени активного движения ко всему времени движения, сохраним в функции Гамильтона (2.108) для участков активного движения члены порядка е, т. е. положим Н = —^(—1 4- Ai cos V; 4- А2 sinф) 4 еН°. ат Напомним (см. разд. 2.3.3), что Н\ определяется формулой (2.29), и для участков активного движения в силу А? = 0,xj = 0 и А4 = 0 получим И0 = 0. Поскольку из условий трансверсальности Н = 0, то с рассматриваемой точностью на участках активного движения —1 4 Ai cos ф 4 А2 sin^ = 0. Поэтому для принятой точности не только в точках переключения управлений, но и в любой точке участка активного движения вы¬ полняются соотношения (2.59) вида Ai = собФ, Х2 = sin ф. С целью определения закона изменения направления тяги обра¬ тимся к уравнению Эйлера-Лагранжа (2.77) для Ai -sm^^ = -А°) +0(е2), где величины нулевого приближения А§ = sin^o = 1, по формуле (2.68) х2 = #2(0) + &т, х*з = Хз(0). Нулевое приближение третьего лагранжевого множителя из последнего обозначения (2.114) для первого и второго участков активного движения *3,Н = \&Ро (гн)~2(2 - ео), А° к = ер05(г°)~2(2 + е0). 106
Обозначим штрихами поправки первого и двумя штрихами по¬ правки второго по е порядка, например ф = фо+еф' + £2фп -ЬО(е3). При определении перелета второго порядка в условиях экстремаль¬ ности члены порядка е2 и выше можно не учитывать, поэтому <ir = e^dr' Для первого участка активного движения на основа¬ нии формулы (2.131) имеем ^ = (O_1(Vi0 - \&eopUrl)~l ~ Ьп)- Для второго участка х® = аерд г* 1 + ^т2 и соответственно получим Отсюда находим ^ = V’j-(O) + djTj + bjT?, j = 1,2, “i = (0_W - \&eoP% Ю"1), bi = 2rj] 1 4 _o , b a2 = -aee0po rK ", b2 = - — . Постоянные 0'(О) как и другие характеристики перелета второго порядка определяются при удовлетворении условий трансверсаль¬ ности с точностью до членов порядка £, а также граничных условий и условий стыковки с помощью соотношений, получаемых при ин¬ тегрировании уравнений движения (2.102) с точностью до членов порядка е2, а уравнений Эйлера-Лагранжа (2.103) с точностью до членов порядка £. Поскольку bj < 0, а,2 > 0, величина а\ в зависимости от соот¬ ношений величин рн,еи,гк может быть нулевой, положительной и отрицательной, то полученные простые формулы позволяют сде¬ лать следующие выводы. Линейные по т2 увеличивают 02 > а, квад¬ ратичные уменьшают этот угол. Функция агТ2 — 62^2 имеет корни 72 = 0,72 = и в точке \о>2^21 максимум, равный £а2&2 Сна¬ чала *02 возрастает до указанной точки максимума, затем уменьша¬ ется. После момента времени Т2 = «2^2 1 становится меньше ф^О) и непрерывно уменьшается. То же будет и для ф[ при а\ > 0. Если 107
а\ < 0, то картина изменения ф[ будет обратная. При а\ = 0 имеем монотонное убывание поправки первого порядка угла ф\. 2.3.8. Деухимпульсный компланарный переход между орбитами с малыми эксцентриситетами Метод малого параметра может быть применен и к постро¬ ению оптимальных импульсных переходов. Если переход осу¬ ществляется между двумя эллиптическими орбитами, то усло¬ вия Вейерштрасса-Эрдмана и граничные условия (см. разд. 2.3.4; 2.3.5), относящиеся к конечной точке, приобретают тот же более сложный вид, что и для начальной точки рассмотренного примера. При произвольных фазах движения на граничных орбитах условия трансверсальности как в точке старта, так и точке финиша будут иметь вид (2.107) аее„рй 5 (A" cos /„ - A" sin /„ + ае~ 1рЙ s г2A" sin /„) + А" = 0, аеекРк 5(А* cos/K - А£sin/K + ае-1рк 5?"к^з sin/K) + А£ =0. (2.132) Хотя по формуле (2.34) Л4 = —аеЛер“2 = const и Л4 = AJ, однако эта постоянная может быть не равной нулю, как в случае круго¬ вой граничной орбиты. И все еще не удается получить не только конечное решение задачи перехода между двумя произвольными эллиптическими орбитами, но даже удовлетворительно численно запрограммировать совместную систему уравнений необходимых условий экстремума и граничных условий. Будем предполагать экс¬ центриситеты начальной и конечной орбит много меньше единицы ен = ее'н, ек = ее'к, где е — положительный безразмерный малый параметр; е'н и е'к — положительные величины порядка единицы. Если ограничиваться членами первого порядка малости по е, то в скобки формулы (2.132) можно подставить выражение лагранже¬ вых множителей в нулевом приближении ири е = 0, т. е. для пере¬ хода между круговыми орбитами. Соответствующее решение пред¬ ставляется формулами (2.116), в которых надо положить ен = 0. Отсюда при рк > Рн имеем Г° = Р„ = Ро(1 + ео)-1, Г® = рк = р0(1 - <-•(,)“1, ео = (Рк Рн)/(Рк -Ь Рн), Ро = (2ркрн)/(рк -Ь Рн), (2.133) В0 = ±, D0 = \{l-el), /°- = 0, /°+ - тг. 108
Нулевое приближение постоянной А получается из условий транс¬ версальности (2.132), если в них положить е„ = 0 и ек = 0, т.е. Ао = 0. С помощью формул (2.35) и (2.133) для нулевого приближения значений лагранжевых множителей в начальной и конечной точках напишем А" = А* = О, \"2 = [i(l + ео)2 + \{1 - е20)\(1 + е0)= 1, AS = ае(1 + ео)[^(1 + е0) + ^(1 - е1)]рй5 = аеро 5(1 + е0)2(1 - ^е0), А5 = [|(1-ео)а + |(1-е2)](1-еоГ1 = 1, А$ = »(1 - e0)[i(l - ео) + ^(1 - е1)]рц 5 = аеро 5(1 - ео)2(1 + ^е0). Исключая А4 из уравнений (2.132), приходим к следующему уравнению трансверсальности первого порядка: енР«5[—sin/°+p,!po5(l + eo)2(l - ^e0)sin/l(,)) = = екРк 5[-sin/° +р|ро 5(1 -е0)2(1 + |e0)sin/£]. (2.134) Введем обозначения Р„ = е'нР^ [1 - (1 + ео)*(1 - ^ео)] = e'„pZ* (1 - (1 - ^eg + ^eg)*], Рк = екРк 5[1 - (1 - ео)*(! + \е0)\ = е^рй5[1 - (1 - |eg - Jeg)*]. Поскольку 0 < ео < 1 , то Р„ > 0 и Рк > 0. Пусть ip0 — полярный угол точки старта в нулевом приближении, тогда ц>о = шн + и (ро + 7Г = ljk + /£, где о;,, и ик — полярные углы перицентров начальной и конечной орбит. Уравнение (2.134) принимает вид Р„ sin(<po - <^н) 4- Рк sin(</?0 ~ ^к) = 0. (2.135) Преобразованное условие трансверсальности (2.135) определяет угловое положение точки экстремального старта tg ip0 = (P„sincj„ + PKsino;K)(P„cosa;H + PKcoso^)”1. (2.136) 109
Из двух ветвей решения, отвечающих формуле (2.136), можно вы¬ брать предпочтительное с помощью сравнения значений характери¬ стических скоростей. Например, при о>н = ljk имеем два решения ip° = ин и <р° = + 7г. Оптимальным при рк > рп будет первое решение. Метод малого параметра можно использовать при построении оптимального перелета различных задач в импульсной постановке. При этом длительность участков активного движения предполага¬ ется на много порядков меньше, чем вводимый малый параметр. В задаче оптимального двухимпульсного перелета между близ¬ кими круговыми орбитами радиусов г„ и гк можно ввести малый параметр ц = (гк — г,,)?’"1 > 0. Тогда гк = гн(1 + /х) и формулы (2.130) и (2.131) для фокального параметра и характеристических скоростей можно записать в виде Рг = 2г„гк(7-„ 4- Гк)-1 = г„(1 + i/i - i/z2 + i//3 - -^/i4 + ...), Vi =®Гн1(Рг -rl) = aer,T5(^- ^2 + ^/^3- •••). \ 1 *7 OQ V2 = eer-^rS -P?) = aerH 5(-jt - —/a2 + — M3 - • • •)• Длительность перелета по полуэллипсу Гомана Гг = ra-i(*L+£l)i = га-1г!(1 + |м + _ _LM3 + .. Требуется минимизировать сумму характеристических скоростей при условии, что время движения tK — tH не превосходит величины Г, где Т = 7гае_17’й -f /хТ', Т' < 77гае_1Гн. 4 Решить эту задачу предлагается с помощью минимизации функ¬ ционала /? А + Ао(<к“*н). (2.137) Значение неопределенного множителя До — const > 0 может быть установлено в результате приравнивания времени движения ука¬ занной величине Т. Можно показать, что
и отличие характеристических скоростей от указанных значений гомановского перехода будет только в третьем приближении, имен¬ но тгш _ 13 ~h . Ijp-з i \ft2 yfft _ \ l -з ? y/'2 ~~ 128 2 ’ ~~ 128 2 0 ’ Пусть время движения ограничено любой величиной Т, не пре¬ восходящей полупериода обращения по начальной орбите. В каче¬ стве нулевого приближения для переходной орбиты можно принять _ 3 дугу начальной орбиты с центральным углом (р = яегн 2 Т. При ми¬ нимизации функционала (2.137) с точностью до величин первого по (г порядка характеристические скорости и углы наклона импульсов VH = VK = i/xaerj5(l +4ctg2^)5, COS= - costpK = 2ctg^(l + 4ctg2^)~5i sin Vh = sin фк = (14- 4ctg2|)-5.
Глава 3 Оптимальное управление колебаниями 3.1. Движение при выключенном управлении 3.1.1. Колебания при сопротивлении, пропорциональном переой степени скорости Пусть движение неуправляемой механической системы описы¬ вается скалярным дифференциальным уравнением Так будет, например, если на точку постоянной массы т действует упругая сила Fi = —сг и сила сопротивления F2 = —2ranv, где г — радиус-вектор, п = const > 0,v = г —скорость точки. Рассматри¬ вая прямолинейное движение точки в проекции на ось х и полагая к2 = ст~1 = const, приходим к уравнению (3.1), которое будем интерпретировать, как уравнение движения точки при сопротивле¬ нии, пропорциональном первой степени скорости. Уравнение (3.1) линейное однородное, его общее решение долж¬ но содержать две произвольные постоянные. Характеристическое уравнение А2+2пА+Л2 = 0 имеет два корня Ait2 = —п±(п2 — к2)1^2. Общее решение может быть принято в виде где С1 и C<i — произвольные постоянные. Пусть п < к, тогда Ai,2 = — п + го/, и = \А2 — гг2. Решение (3.2) принимает вид х 4- 2пх 4- к2х = 0. (3.1) х = CieXlt 4- С2вЛ2*, (3.2) х = е nt((Ci 4- С2) cos u>t 4- i(C\ — C2) sin art) = = e~nt(Acoscut 4- Bsinutt), (3.3) 112
где А = С\ + С2, В = г(Ci — С2). Поскольку разыскивается ве¬ щественное решение уравнения (3.1), то достаточно ограничиться вещественными значениями произвольных постоянных А и В. Вместо постоянных А и В можно ввести новые постоянные а и а по формулам а = (А2 + В2)^2, sina = Аа~г, cosa == Ва~1. Общее решение (3.3) примет вид х — ae~nt sin(cjt + a). (3.4) График функции (3.4) на плоскости (х,£) представляет собой колеблющуюся кривую, которая последовательно переходит от воз¬ растания к убыванию и неограниченное число раз пересекает ось t. Эта колеблющаяся кривая касается кривых х = ±ae~nt через Т/2, где Т = 27го;-1. Для изучения экстремумов решения (3.4) напишем х = ae”nt (—nsm(ut + а) -Ь cos(a)t -f a)) = = ane~nt cos(cvt + a) (am-1 — tg(u>t + a)). В моменты времени, удовлетворяющие уравнению tg(ut + a) = -= wn-1, производная x изменяет знак, проходя через нуль. Поэто¬ му через Т/2 повторяются экстремальные значения х. Поскольку в эти моменты времени cos(wt + о?) отличен от нуля и через Т/2 изменяет знак, то имеет место чередование моментов максимумов и минимумов (рис. 2). Для указанных моментов времени запишем cos (u)t -fa) = =Ь(1 + u2ri~2) = ±nk~*, sin{ujt -f a) = :tuk~l. I [оэтому для двух последовательных экстремумов |x’i| = aujk~le~ntl, \х21 = au>k~le~n(ti + . Отношение |x2|/|xi| = е~ *пТ — декремент затухания, соответ¬ ственно — \пТ называется логарифмическим декрементом зату¬ хания. Декременты затухания показывают, как интенсивно умень¬ шаются размахи колебаний. 113
X Рис. 2 / Замечание 1. Декременты затухания могут определяться так¬ же по отношению двух последовательных амплитуд колебаний, взя¬ тых через Т/2. Действительно, имеем а\ = ae~ntl, а2 = ae~n(tl + 2T\ 0>20>i1 = е~*пТ, 1п(а2а^[1) = — \пТ. Величины трёх последователь¬ ных амплитуд колебаний указаны на рис. 2. Они отвечают точкам касания графика функции (3.4) с графиками граничных экспонент. / Замечание 2. Пусть п = О, т.е. отсутствует сопротивление, тогда движение имеет вид простых гармонических колебаний с ам¬ плитудой а и периодом То = 2пк~1. При наличии сопротивления происходят колебания с периодом Т = 27га;-1 и с уменьшающейся в равные промежутки по геометрической прогрессии амплитудой. Поскольку ш < к, то сопротивление удлиняет период и уменьшает частоту колебаний и = 1 /Т. / Замечание 3. Если сопротивление среды велико, т. е. n > fc, то корни Ai и — вещественные и решение (3.2) будет апери¬ одическим. Оно лишь один раз пересечёт ось t. В случае п = к Ai = Х2 = п. Из теории интегрирования линейных дифференци¬ альных уравнений х = (С\ 4- C2t)e~nt. 3.1.2. Вынужденные колебания при наличии сопротивления Пусть колебание механической системы изучается относитель¬ но оси х системы отсчёта, которая сама совершает поступательное колебание вдоль той же оси с ускорением w% = — Р sin pt. За начало 114
отсчета времени принят момент, при котором фаза этого так назы¬ ваемого вынужденного ускорения равна нулю. Проекция абсолют¬ ного ускорения равна сумме проекций относительного ускорения х и переносного w%. Дифференциальное уравнение относительных колебаний примет вид х + 2 пх 4- k2x = Р sin pt. (3.5) Общее решение неоднородного линейного дифференциального уравнения (3.5) может быть получено, как сумма общего решения (3.4) однородного уравнения и какого-либо частного решения х\ уравнения (3.5). Частное решение будем искать в виде xi=bsin0, 6 = pt + (3, b = const > 0, /3 = const. (3.6) Подставим (3.6) в уравнение (3.5) Ь(—р2 sin в 4- 2рп cos в 4- к2 sin в) = Р sin(0 — /3) = = Р{sin в cos /3 — cos 9 sin (3). Приравняем коэффициенты при одинаковых тригонометрических функциях переменной фазы в в левой и правой частях Ъ(к2 — р2) = Р cos /3, 2 bpn = —Р sin /3. Отсюда получим Ь = Р((к2-р2)2+4р2п2)~\ cos/3 = b(k2 —p2)P~l, sin/3 = —2bpnP~1. (3.7) Тем самым установлено, что общее решение уравнения (3.5) со¬ стоит из суперпозиции (наложения) двух колебаний х = ae~nt sin(o;t 4- а) 4- bsin(pt 4- /3). (3.8) Первое слагаемое формулы (3.8) называется свободным или соб¬ ственным колебанием, а второе слагаемое — вынужденным коле¬ банием. Амплитуда свободного колебания уменьшается с течением времени по экспоненциальному закону. Поэтому свободные колеба¬ ния затухают. Они должны учитываться на начальном переходном 115
участке движения. При достаточно большом моменте времени си¬ стема будет находиться н режиме вынужденных колебаний. Чтобы изучить зависимость амплитуды Ь вынужденных колеба¬ ний от частоты р вынуждающего ускорения, будем при выбранных Р, к и п изменять частоту р. Вид графика 6(р), который называют амплитудно-частотной характеристикой, и будет давать ответ на поставленный вопрос. Непосредственно устанавливаются следу¬ ющие свойства зависимости Ь(р): • b —> 0 при р —> оо для любых конечных Р, А;, п; • если 2п2 > к2, то Ь(р) монотонно убывает; • пусть 2п2 < к2, тогда Ь(р) имеет один внутренний макси¬ мум при так называемой резонансной частоте Рр = (к2 — 2п2)*. Амплитуда резонансных вынужденных колебаний Ьр = ^Р/(по;), UJ = (fc2 — п2) 2 или Ьр = Р(к4 — Рр) 2 . С уменьшением п амплитуда резонансного колебания возрастает и стремится к бесконечности при п —► 0. Зависимость амплитуды вынужденных колебаний от частоты вынуждающего ускорения представлена на рис. 3. / Замечание. При п = 0 по формулам (3.7) получим b = Р/\к2 — р21, далее (3 = 0 при к > р и (3 = 7Г при к < р. Частное решение (3.6) принимает вид Р Xl = fc2_p2 Sin^- (3 9) При резонансе р = к решение (3.9) не имеет смысла. Чтобы постро¬ ить корректное частное решение можно к решению (3.9) присоеди- Рис. 3 116
нить подходящее частное решение однородного уравнения. Напри¬ мер, можно взять частное решение уравнения (3.5) при п = 0 в виде х2 = 1л 2 (sinPt ~ sin/:£). (3.10) /с р Правая часть выражения (3.10) представляет неопределенность ти¬ па 0 : 0 при р —► к. Раскроем неопределенность по правилу Лопи- таля pt • ■ (3.11) Х2уР = lim Ptcospt/(—2p) = — — cos kt. ’ p—*k 2 к Поэтому при резонансе в отсутствии сопротивления, когда п — 0 и р = к, общее решение дифференциального уравнения (3.5) имеет вид Pt (3.12) х — a sin (kt Ч- а) — 9гг cos kt. 2 к В рассматриваемом случае (3.12) амплитуда резонансных колеба¬ ний неограниченно возрастает пропорционально времени, фаза вы¬ нужденных колебаний отстает от фазы вынуждающей силы на угол 7г/2. Выясним особенности вынужденного решения (3.10) при часто¬ те р, близкой к, т. е. в случае \р — к\ 1 и р Ф к. Это решение запишем в виде К2 А Рис. 4 117
./ ч р + к л/ ч 2 Р . к —р х2 = -А(р, t) cos ——t, А{р, t) = -fc-2-_^2 sin —— Амплитуда Л(р, £) изменяется по синусоидальному закону с боль¬ шим размахом 4Р/\к2 — р2\ и большим периодом Т\ = 4п/\к — р\. Это колебание является медленным по сравнению с основным коси¬ нусоидальным колебанием, которое называется несущим и период которого Т2 = / (кр). Быстрые колебания с медленно изменяю¬ щейся амплитудой получили название биений. График вынужден¬ ного решения х2 представлен на рис. 4. 3.1.3. Гармоническое колебание с сухим трением Пусть на механическую систему, совершающую прямолинейные колебания под действием упругой силы, действует еще постоянная по величине сила трения скольжения. Проекция силы трения на ось х пусть будет равна: —mv sign х, v = const > 0, где разрывная функция signx равна 1 при х > 0, или 0 при х = 0 и — 1 при х < 0. Для определенности представим, что тело весом тд положено на негладкую горизонтальную плоскость с коэффициентом трения к и прикреплено к концу пружины, жесткость которой с. Массой пружины будем пренебрегать. Другой конец пружины пусть за¬ креплен неподвижно. Сила трения будет иметь величину v = ктд и направлена в сторону, противоположную движению. Поэтому при движении слева направо проекция на ось Ох, направленная так¬ же слева направо, будет —mi/, а при движении справа налево mv. Поместив начало координат О в равновесное положение, когда пру¬ жина не напряжена, получим различные дифференциальные урав¬ нения: для движения слева направо х + к2х = — v; для движения справа налево х 4- к2х = v. Здесь к2 = с/т. Пусть при t = 0 будет х = хо, х = 0. Чтобы тело, поставленное в это положение, пришло в движение, упругая сила в указанном (3.13) (3.14) 118
положении с|хо| должна превышать силу трения mv, что соответ¬ ствует условию А;2|яо| > Поэтому необходимо, чтобы |хо| > vk~2 и по обе стороны от положения равновесия существовала зона за¬ стоя от —vk~2 до ик~2. Если хо > 0 и хо > ик~2, то тело начнет двигаться справа нале¬ во, удовлетворяя уравнению (3.14). Общее решение будет х = A cos kt + В sin kt Н- vk~2. Для начальных данных х = xq, х = 0 получим А = хо — vk~2, В — О и соответствующее решение я = {х0 — vk~2)coskt 4- ик~2. (3.15) Через t\ = 7гА;-1 тело остановится, т. е. х = 0. При этом ко¬ ордината xi = —хо 4- 2ик~2. Пусть хо взято настолько большим, что хо < —у. Тело начнет двигаться слева направо, удовлетворяя уравнению (3.13). В этом случае имеем х = А\ cos kt 4- В\ sin ki — vk~2. Определим A\ и B\ из новых начальных данных: А\ = хо — 3isk~2, В\ = 0 и для второго участка я = (я0 — 3i/k~2) cos kt — i/k~2. (3.16) В момент t2 = 2пк~1 тело снова остановится, имея на этот раз координату Х2 = хо — 4vk~2. Если эта величина окажется внутри зоны застоя, то движение прекратится. При Х2 > vk~2 указанный процесс повторится с новыми начальными данными. График зави¬ симости x(t) представлен на рис. 5. Этот график состоит из кусков косинусоид одной угловой частоты А:, но с уменьшающимися ам¬ плитудами. Центрами колебаний поочередно служат точки ик~2 и —vk~2. Построенное решение не является удобным для изучения свойств движения, так как дает представление интегральной кри¬ вой в виде состыкованных друг с другом отдельных кусочков. Рас¬ смотрим вопрос о едином аналитическом представлении решения уравнения х 4- к2х = — 2/sign х. 119
Рис. 5 Для отдельного г-го кусочка из формул (3.15) и (3.16) следует: х = = Ai cos kt Н- Ci, Ai — const, Ci = const. Поэтому имеем Поскольку к > 0 и Ai > 0, то signrr = —sign sin ip, где ip = kt. Функция f(ip) = sign sin у? является нечетной, т.е. при измене¬ нии знака аргумента ip она изменяет знак, но сохраняет абсолют¬ ную величину. В курсе математического анализа показывается,что кусочно-непрерывная 27т-периодическая и нечетная функция f(ip) с ограниченным изменением может быть представлена в виде сле¬ дующего сходящегося ряда Фурье: х = —кAi sin kt. (3.17) 7Г <7=1 О Для рассматриваемой функции коэффициенты Фурье 2 Г 47г 1а 1 при нечетном </. —(cosqn - 1) = < Л ^ wq 10 при четном q. при нечетном </, при четном q. Дифференциальное уравнение (3.17) принимает вид оо х + к2х = 41/тг 1^(27 + 1) 1 sin(27 + l)kt. (3.18) 7=0 120
Поскольку уравнение (3.18) является линейным, то его частное ре¬ шение равно сумме частных решений, вызываемыми отдельными гармониками правой части. При 7 = 0 имеем резонансное частное решение вида (3.11), а при 7 ф 0 — нерезонансное решение вида (3.9). Поэтому общее решение уравнения (3.18) будет х = (А — 2^7г“1А:-1£) cos kt 4 В sin kt- оо —vir~'k~2 ^ (7(7 4 1)(27 + I))-1 sin(27 -f 1 )kt. (3.19) 7=0 Продифференцируем представление (3.19) x = — (kA — 21утг~lt) sin kt + (кВ — 2vn~lk~l) cos kt— 00 —ип~1к~1 ^ (7(7 4- l))”1 cos (27 4 1 )kt. (3.20) 7=1 Поскольку (7(7 4-1))-1 = 7-1 — (7 4-1)-1 и £(7(7+1))-1 = 1 + 5^(7+1)_1 - 5^(7+i)~l =1 - 7=1 7=1 7=1 00 то (7(7 + I))-1 ” 1- При t. = 0 по формулам (3.19) и (3.20) 7=1 oo получим xq = A, 0 = кВ — 2i/n~lk~l — i/n~lk~l ]Г] (т(7+ 1))_1 или 7=1 В = 3v7T~l k~2. С помощью формул (3.19) и (3.20), а также вычисленных зна¬ чений постоянных А и В можно сделать вывод о том, что перемена направления движения происходит в моменты времени, кратные пк~1. При этом каждая новая остановка приближается к началу координат на величину 2и'к~1к~1'^ = 2ик~2. Таким образом из гло¬ бального аналитического представления движения (3.19) и (3.20) легко получаются общие качественные выводы, обнаруженные ра¬ нее на основе последовательной стыковки кусков интегральной кри¬ вой, описываемых различными дифференциальными уравнениями (3.13) и (3.14). 121
/ Замечание. Отмеченные выше качественные выводы можно получить, если сохранить в формулах (3.19) и (3.20) лишь гар¬ моники первой кратности. Для этого достаточно в правой части формулы (3.18) удержать только первую гармонику. С помощью формулы (3.17) напишем х 4- к2х = —4i/(TikAi)~lx. (3.21) Процедура замены уравнений (3.13), (3.14) на уравнение (3.21) носит название метода гармонической линеаризации. Указанный метод сводит рассматриваемую задачу движения с кулоновским трением к соответствующему движению под действием сопротивле¬ ния, пропорционального первой степени скорости с коэффициентом пропорциональности п = 2v(KkAi)~l. Пример l. Для защиты измерительных механизмов приборов от вибраций и ударов используются резиновые амортизаторы в ви¬ де резиновых колец. Согласно модели Кельвина-Фохта напряже¬ ние в резиновом образце определяется формулой а = Ее + г]ё, где е — относительная деформация; £ —динамический модуль упру¬ гости; tj — коэффициент вязкости. Пусть е = A sin pt, тогда о — = А(Е2 4- г}2р2)2 sin(ujt 4- 6), tg 5 = rjpE~l. Величина S носит назва¬ ние угла механических потерь. Будем считать эту величину неиз¬ менной и напишем а = E(e+p~ltg5i). Для статических (при £ = 0) больших (е > 0,3) деформаций резины имеет место зависимость а = G(l/a — а2), где а = 1 — е; G — модуль сдвига. С точностью до 0,03% G — \Ei, где Ei — модуль упругости при малых (линейных) деформациях. Можно показать, что при 6 = 0 имеем 6 = Ее, где Е = = £?i(l 4- ^е2/(1 — с))- Пусть корпус прибора в проекции на ось х имеет ускорение Р sin pt. Обозначим через h толщину резинового кольца, а через S — его опорную площадь. Полагая х = eh , полу¬ чим дифференциальное уравнение для определения вынужденных колебаний частоты р в виде * + 2В ('+ Щк-1»|)) * + е 0 + зh(h- И))1 ° +Psinpt' где 2В = k2p~ltgS, к2 = ES(mh)~l; m — масса подвижного меха¬ низма. 122
Пример 2. Для изучения вынужденных колебаний изме¬ рительного механизма применим к дифференциальному уравне¬ нию предыдущего примера метод гармонической линеаризации. Решение дифференциального уравнения находим в виде х = = В sin (р£ 4- в). Нелинейные члены уравнения после замены х но указанной формуле разлагаются в ряды Фурье и в разложениях удерживаются только первые члены. Получим представления 2В 0 + щ£- И)) 4 = МВА,0“+ ",- 0 + зh(h- М)) х =bkVeta ^ + *>• где Р = тг-(37г 4 2Ь — 3(1 - Ь2)7) , b = bh~x, У7Г 7 = -Ь-1 + \Ъ~2 - 2Г2(1 - , 2 ~ ае2 = — (37г — 46 4 67). У7Г Дифференциальному уравнению примера 1 по методу гармониче¬ ской линеаризации будет тем самым поставлено в соответствие сле¬ дующее линейное уравнение вида (3.5): х 4- 2В/Зх 4 к2ге2х = -f Р sin pt. Для амплитуды вынужденного колебания частоты р получим ана¬ лог формулы (3.7) в виде b = P((fc2ae2 - р2)2 4 4В2/32р2)~*. Однако здесь ае2 и 02 зависят от амплитуды Ь по указанным фор¬ мулам. Пример 3. С помощью заключительной формулы предыдуще¬ го примера можно построить амплитудно-частотную характеристи¬ ку. Для случая нелинейных колебаний ее часто называют резонанс¬ ной кривой зависимости амплитуды колебаний от частоты. Можно 123
левую и правую части указанной формулы поделить на толщину амортизатора h и разрешить полученное соотношение относитель¬ но р2 в виде р2 = к2*2 - 2В2/?2 ± (P2b-2h~2 - 4В2/32(к2аг2 - В2(32))*. Поскольку Ъ < /?., то можно задавать значения для b от 0,1 до 0,9 че¬ рез 0,1 и получить девять значений для р2. Этого будет достаточно, чтобы установить вид резонансной кривой. Примем следующие значения: Р = 300д, h = 0,2 см, к = = 1580 с-1, В = 190 с-1. Ориентиром могут служить соответству¬ ющие значения: ь 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 370 370 380 420 Р> Гц 660 500 430 380 380 120 180 250 340 Построенная по этим значениям резонансная кривая имеет вид, изображенный на рис. 6. Штрихами отмечена скелетная кривая р2 = к2ае2 — 2В2/32. Зона, выше прямой Ь = 0.5, отвечает нели¬ нейному резонансу, который может быть достигнут с помощью по¬ степенного изменения р. При быстром изменении частоты р происходит срыв амплитуды колебаний в линейную зону (ниже указанной прямой). Пример 4- Наиболее ответственную деталь измерительного ме¬ ханизма прибора, его подвижную часть, для защиты от вибрации Рис. 6 124
и ударов часто помещают между подпятниками с предварительно поджатыми пружинами. На рис. 7 представлена принципиальная схема такого амортизационного устройства. 2 1 12 Рис. 7 Зависимость от х упругой характеристики амортизатора, яв¬ ляющейся отношением упругой реакции амортизатора к массе по¬ движной части, изображена на рис. 8. 125
Если ускорение корпуса невелико, то перемещен и я подвижной части могут ограничиться зоной люфта: —do < х < do. Если же ука¬ занное переносное ускорение превысит значение щ, то амортизатор раскроется и дальнейшие перемещения подвижной части будут со¬ провождаться деформациями одной из пружин 1 (см. рис. 7), для которой величина щ равна отношению величины силы предвари¬ тельного поджатия к массе подвижной части. При |х| > d происхо¬ дит совместная деформация пружины 1 и ограничителей 2. Пусть через к\ обозначено отношение коэффициента жесткости пружи¬ ны 1 подпятника к массе подвижной части, а через А;2 — отношение жесткости упругого ограничителя к той же массе. Напишем аналитическое представление для v(x). Для прибли¬ женного интегрирования уравнения х 4- i/(x) = 0 воспользуемся ме¬ тодом гармонической линеаризации, предполагая, что это решение можно представить в виде х = asm(ut 4- а). Упругую характери¬ стику v(x) = v(a sin у?), ip = cut 4- а заменим первым членом С\ sin ip разложения ее в ряд Фурье. При |х| < d Cl = 4/ir(i* - kldo) ((1 - (do/a)2) * + + ак\( 7г/4 — i arcsindo/a + i — (l — (do/a)2)2 V 2 2 a Принимая I/ = Ci, siny> = Cia-1, x = k\x и предполагая do/а <C <l,c учетом только членов первого порядка получим к\ = к\+ 4-4(7ra)_1(i/o ~ k\do). Поскольку и = к\, а по начальным условиям а = (Xq 4- Xq/cj2)* , то можно получить уравнение для амплитуды свободных колебаний при | х | < d в виде а3 4-47Г-1 A:£“2(^o — k2do)a2 — (х2 — x*ofc]~2)a —47г_1А;|~2(ц) — k2do)x% = 0. При |х| > d соответствующий коэффициент Фурье упругой ха¬ рактеристики Сг =4/»{(ц, - k\d0)[(1 - (d0/a)2)* - (1 - (d/a)2)*] + +iafc2 ^arcsind/a—arcsindo/a—d/a(l—(d/a)2)s+do/a(l—(do/a)2)5|-|- “b {щ 4- k2(d — do) — k\d)(\ — (d/a)2)5 4- 126
+ [тг/2 — arcsind/a -I- d/a( 1 — (d/a)2) 2 J j. Предполагая ограничители достаточно жесткими, т.е. к2 fci, (a —d)/a 1, можно получить соответствующий коэффициент эк¬ вивалентной жесткости, равной квадрату частоты свободных коле¬ баний, в виде к2 = к\ + 8у/2к\((а — d)/a)2/(37r) + 4(i/o — k2do)/(7ra). Для принятых выше упрощающих предположений рассмотрим вынужденное решение х = Ъ sinpt уравнения х + ^(х) = Р sin pt при замене и{х) первой гармоникой Dsmpt разложения в ряд Фурье. При \х\ < d имеем £>1 = 4/7t(i/0 - k\do) + Ьк\, Ь = (Р - 4/ir(i/0 - k‘(d0))/\ki - р2\. Для случая \х\ > d получим D2 = 4/7r(i/o - k\do) + bk\ + 8л/2((a -- d)/a)ik2/(3nb^) и уравнение для определения амплитуды вынужденных колебаний (А;2 — p2)b* -f- (4/7t(i/o — k%do) Т -Р)&* + 8\/2A;|((a - d)/a)2/(37r) = 0. 3.2. Теория фазового пространства для системы с одной степенью свободы 3.2.1. Фазовые траектории автономной системы обыкновенных дифференциальных уравнений Рассмотрим систему дифференциальных уравнений со стацио¬ нарными правыми частями х = Х(х), х = (хь.. . ,хп), X = (Хь... ,Х71), (3.22) предполагая выполненными условия существования и единственно¬ сти решения задачи Коши. Пространство переменных х* называют фазовым. Если к п указанным фазовым переменным присоединя¬ ют t, то говорят о расширенном фазовом пространстве. Обычно 127
фазовое пространство наделяют структурой евклидова простран¬ ства Rn. Решение задачи Коши определяет интегральную кривую в рас¬ ширенном фазовом пространстве. Вместе с тем это и параметриче¬ ское уравнение траектории в фазовом пространстве, которую назы¬ вают фазовой траекторией. Фазовая траектория представляет со¬ бой проекцию интегральной кривой на фазовое пространство. Ес¬ ли интегральная кривая, отвечающая частному решению уравне¬ ний (3.22), полностью определяет это движение, то фазовая кри¬ вая определяет его с точностью до задания закона движения по траектории. Вектор х можно интерпретировать в виде точки фа¬ зового пространства. При этом можно мыслить некоторую изобра¬ жающую точку, которая последовательно перемещается по фазовой кривой. Укажем основные свойства фазовых траекторий. 1. Точка х* = (х^,... ,£*) называется состоянием (положени¬ ем) равновесия или точкой покоя, если уравнения (3.22) допуска¬ ют решение х = х* = const, что равносильно условию Х(х*) = 0. Тем самым состоянию равновесия соответствует частное решение x(t) = х*, которому отвечает целая фазовая траектория в виде точки х* фазового пространства. 2. Непосредственной подстановкой в систему (3.22) убеждаемся, что если x(t) — решение (3.22), то и х(£) = x(t + т) при любом посто¬ янном т также решение (3.22). В фазовом пространстве x(t) и x(t) дают одну и ту же траекторию. При этом изображающие точки, отвечающие указанным двум частным решениям, будут сдвинуты по фазе параметра t на т. 3. Фазовая траектория, не являющаяся точкой покоя, будет при X Е С гладкой кривой. Изображающая точка перемещается по ней в одном направлении не останавливаясь. Действительно, на осно¬ вании (3.22) ±i = Xi, где Xi~ по предположению непрерывные функции. Поэтому интегральная кривая — гладкая. Квадрат ско¬ рости изображающей точки х2 = X? > 0, так как все Xi при сделанном предположении не могут обратиться в нуль. 4. Если задача Коши при t € (—оо, оо) имеет единственное реше¬ ние, то фазовые траектории не пересекаются. Пусть две фазовые траектории xi(£) и x2(t) пересекаются в некоторой точке фазового пространства. Тогда существуют t\ и t2 такие, что Xi(£i) = x2(t2). Если t\ = t2, то в силу единственности решения задачи Коши имеем Xi(£) = x2(t) и указанные фазовые траектории совпада¬ 128
ют (но не пересекаются). Пусть оказалось т = ti — t2 ф 0, тогда xi(t + т) решение той же задачи Коши, что и х2(t). В самом деле, x\{t2 + т) = х\(t\) = ^2(^2)* Поэтому xi(t + r) и x2(t) тождественно относительно t равны, т. е. соответствующие фазовые траектории совпадают. В частности, фазовые траектории не могут пересекать самих себя. Возможны следующие типы фазовых траекторий: • незамкнутая непересекающаяся кривая, для которой выпол¬ няется x(£i) ф x(t2) ни при каких t\ ф t2\ • простая, т. е. без пересечения, замкнутая кривая. Ей соответ¬ ствует так называемое периодическое движение, при котором су¬ ществует Т > 0 и для любого t имеем x(t + Т) = x(t). Кроме того, x(t\) ф x(t2) при 0 < t\ < t2 < Т\ • точка покоя (положение равновесия), для которой x(t 1) — = x{t2) при любых t\,t2. После общего введения перейдем к рассмотрению случая одной степени свободы. Движение механической системы с одной степе¬ нью свободы описывается системой обыкновенных дифференциаль¬ ных уравнений второго порядка, т.е. п = 2. Фазовое пространство с евклидовой структурой R2 называется фазовой плоскостью. По¬ скольку через каждую точку фазовой плоскости проходит толь¬ ко одна фазовая траектория, то указанная плоскость разбивается фазовыми траекториями на классы эквивалентности. Это разбие¬ ние называется фазовой картиной или портретом данной систе¬ мы обыкновенных дифференциальных уравнений второго поряд¬ ка. Для углубленного изучения поведения интегральных кривых на плоскости рекомендуется книга В. И. Зубова [6]. 3.2.2. Фазовая картина консервативной механической системы с одной степенью свободы Пусть за счет выбора обобщенной координаты х уравнения дви¬ жения механической системы с потенциальной энергией в виде од¬ нозначно дифференцируемой функции П(х) приведена к стандарт¬ ному виду ЛП(х) х=У, У = (3.23) 129
Следствием этих уравнений будет интеграл механической энергии iy2 + П(х) = h = const. (3.24) Фазовой плоскостью является координатная плоскость (х,у). Отметим основные свойства фазовых траекторий консерватив¬ ных систем с одной степенью свободы. 1. Существование состояния равновесия равносильно условию: у* = Q,dll/dx\x+ = 0. Поэтому состояния равновесия принадлежат оси х в фазовой плоскости и им отвечают стационарные точки по¬ тенциальной энергии. 2. Из формулы х = у следует, что в верхней полуплоскости х воз¬ растает, т.е. перемещение изображающей точки происходит слева направо. В нижней полуплоскости х отрицательно. Соответствен¬ но перемещение изображающей точки происходит справа налево. 3. Интеграл (3.24) не зависит от параметра (времени), поэтому он выполняется не только на интегральной, но и на фазовой кри¬ вой. Следовательно, фазовая траектория целиком лежит на неко¬ тором множестве уровня механической энергии, т. е. на множестве {(х,у) : h = const}. Любую компоненту линейной связности мно¬ жества уровня энергии называют линией уровня энергии. Тем са¬ мым фазовые траектории, не являющиеся точками, будут линиями уровня механической энергии. ,4. Верно и следующее обратное утверждение. Удалим из фазо¬ вой плоскости все состояния равновесия, тогда на ней любая ком¬ понента линейной связности любого множества уровня полной ме¬ ханической энергии будет целой фазовой траекторией. Рассмотрим это подробно. Выберем какую-либо точку М(х,у) фазовой плоскости после удаления положений равновесия. Ввиду предполагаемой однозначности П(х) точка М лежит на одном и только одном множестве уровня: h = у2/2 -I- П(х). Поскольку точка М не совпадает с состоянием равновесия, то по крайней мере одна из производных dh/dy = у, dh/dx = dll(x)/dx отлична от нуля, и по теореме о неявных функциях указанное урав¬ нение имеет единственное непрерывно дифференцируемое решение 130
у = у(х) или х = х(у) в некоторой окрестности точки М. Поэто¬ му упомянутое множество уровня представляет собой точки един¬ ственной гладкой кривой, проходящей через точку М. Отсюда ука¬ занная кривая в рассматриваемой окрестности будет совпадать с соответствующей фазовой кривой, которая целиком лежит на этом множестве уровня. Повторяя то же рассуждение для концов рас¬ сматриваемого промежутка, можно единственным образом продол¬ жать кривую множества уровня до тех пор, пока не окажутся на¬ рушенными условия теоремы о неявных функциях. Но эти условия нарушаются только в точках равновесия, которые по условию уда¬ лены. Отсюда получим линию уровня, проходящую через точку М, единственной и потому совпадающей с соответствующей фазовой траекторией. На основании интеграла (3.24) с помощью (3.23) для линии уров¬ ня получим у =х = ±х/2(/1-Я(х)), (3-25) 5. Если линия уровня содержит состояния равновесия, то они разделяют линию уровня на отдельные фазовые траектории, при¬ чем время движения по указанным фазовым траекториям до от¬ меченной точки равновесия будет бесконечно большим. Действи¬ тельно, состояния равновесия являются целыми фазовыми траек¬ ториями, и фазовые траектории не могут пересекаться, поэтому они могут лишь примыкать к состоянию равновесия. В силу пред¬ полагаемой единственности решения дифференциальных уравне¬ ний (3.23) для любого конечного промежутка времени приходим к выводу, что указанная точка, к которой примыкают несколь¬ ко решений, должна отвечать бесконечному времени. Заметим, что в состоянии равновесия нарушены условия теоремы о неяв¬ ных функциях, и, следовательно, к состоянию равновесия могут примыкать несколько фазовых траекторий. Фазовая траектория, примыкающая к состоянию равновесия, называется сепаратри¬ сой. 6. Формула (3.24) показывает, что фазовая картина симметрич¬ на относительно оси х. 7. Согласно той же формуле фазовая траектория может пере¬ секать ось х только под прямым углом. Из формулы (3.25) также следует, что стационарные точки любой фазовой траектории лежат 131
на прямых, параллельных оси у и проходящих через состояния рав¬ новесия. Перечисленные свойства позволяют построить фазовую карти¬ ну для консервативной системы с одной степенью свободы. Рас¬ смотрим общую схему построения фазового портрета на основе примера. Пример. Пусть материальная точка массой т движется в од¬ нородном поле тяжести ускорения д по заданной кривой £(х), г}(х), С(х), где х — дуговая координата, для которой х2 = £2 4- rj2 4- £2 — квадрат скорости точки, а ось С направлена вертикально вверх. Будем иметь dUjdx = mgd£/dx. В целях удобства построения фазового портрета аппликата £(х) определим полином четвертой степени с экстремальными точками: х\ = 0, х2 = 1, хз = 3, т.е. d^/dx = А(х — х\)(х — х2)(х — хз), А = const. Примем значение А = 1 /(mg). Поэтому имеем “jj“ = (х ~ xi)(x - Z2)(x - Х3) = X3 - fix2 + f2X - /з, где f\ = xi4-£24-X3 = 4; /2 = Х1Х24-Х1Х34-Х2Х3 = 3; /3 = Х1Х2Х3 = 0. Принимая Я(0) = 0, получим П(х) = ^х2(х2 — ■““Х 4- 6). Теперь изложим принцип построения фазового портрета и од¬ новременно (рис. 9) выполним конкретное построение для рассмат¬ риваемого примера. 1. Строим график 77(х). Особое внимание уделяем экстремаль¬ ным точкам. Для рассматриваемого примера значение потенциаль¬ ной энергии в экстремальных точках П\ = 0, П2 = 5/12, 77з = = —9/4. Нули функции П(х) отвечают значениям х: 0, (8 — \/l0)/3, (8 4- \/Г0)/3. 2. Под графиком П(х) на некотором удалении проводим вторую ось х, параллельную первой, и продолжим вниз ось /7(х), которая в новой системе обозначена через ось у. 3. Проведем через экстремальные точки графика П(х) пря¬ мые, параллельные оси у. Пересечение этих прямых со второй осью х будет давать состояния равновесия на фазовой плоскости (*,!/)• 132
Рис. 9 4. Проведем через экстремальные значения прямые 77 = /7*. Линии уровня для hi = IJi являются разграничительными линиями фазового портрета. Рассмотрим различные варианты: • если h < min/ii, в нашем случае h < /13, то из первой форму¬ лы обозначения (3.25) следует, что вещественного решения нет, т. е. невозможно движение рассматриваемой системы; • при h = /13 множество уровня — точка Мз(хз, 0) фазовой плос¬ кости; • пусть h G (hi, /13), движение становится возможным, если, ко¬ нечно, П(х) < h. Множество уровня состоит из замкнутой фазовой траектории, определяемой первой формулой обозначения (3.25) при X € [xmin, Xmax], где xmi„ и xmax — корни уравнения Л(х) - h = 0. В этом случае имеем дело с потенциальной ямощ • при h = hi множество уровня состоит из замкнутой фазо¬ 133
вой траектории, охватывающей точку М3 и состояния равновесия • множество уровня энергии при h £ {h\,h2) состоит из двух замкнутых фазовых траекторий, охватывающих точки М\ и М3. Имеем две потенциальные ямы; • если Л = Л-2, то линия уровня энергии проходит через точку М2(#2,0) и состоит из трех целых фазовых траекторий: состояния равновесия М2 и двух примыкающих к нему сепаратрис — почти замкнутых кривых, охватывающих точки М\ и Мз; • множество уровня при h > h2 состоит из одной замкнутой волнистой (по свойству п. 7) кривой; 5. Качественно изобразим фазовые траектории в соответствии с особенностями области их расположения и свойствами пп. 6, 7. 6. Укажем направление перемещения изображающей точки на основании свойства и. 2. У Замечание. Движение, отвечающее любой замкнутой кривой, будет периодическим, так как по формуле (3.25) Через промежуток времени Т повторяется движение предыдущего цикла. Поскольку xmin и хтах не являются состояниями равновесия, то в этих точках dll/dx ^ 0 и xmin, xmax являются простыми корнями уравнения П(х) — h = 0. Следовательно, несобственный интеграл в формуле для периода Т сходится. Согласно свойству 5 время движения, отвечающее перемеще¬ нию изображающей точки по сепаратрисе до состояния равнове¬ сия, должно быть равно бесконечности. Действительно, время дви¬ жения из некоторой точки х в конфигурационном пространстве до точки х2 Mi(zb0); х = ±y/2{h - П(х)), l-Т= j(2(/i — 77(x))) * dx. X так как х2 кратный корень уравнения П(х)—к = 0 в силу ^ |Х=Х2 = 0, и интеграл расходится. 134
3.2.3. Математический маятник Многие задачи движения консервативной системы с одной сте¬ пенью свободы сводятся к модели математического маятника. Под этим понимают материальную точку, подвешенную на неве¬ сомой нерастяжимой нити в однородном поле тяжести и соверша¬ ющую движение в неподвижной вертикальной плоскости. Возьмем систему координат с началом О в точке подвеса маятника, ось ОС направим вертикально вниз, ось Or) — перпендикулярно к плоско¬ сти движения. Если / — длина нити и ip — угол ее отклонения от вертикали, то дуговая координата х = hp. Напишем следующие параметрические уравнения траектории движения в конфигураци¬ онном пространстве R3: £ = Zsin<p, 77 = 0, t^ — lcosip. (3.26) Закон изменения угловой координаты ip может быть получен, например, проектированием на касательное направление уравнения движения m v = F-j-N, где т — масса; v — скорость точки; F — сила тяжести; N — направленная по нити реакция в виде т1ф =—mg sin ip, фи>2 sin ip = О, co2 = gl~l. (3.27) Если допустимо ограничиваться линейным приближением, то уравнение (3.27) превращается в уравнение гармонических колеба¬ ний ф-\-ш21р = 0 с периодом Тл = 2тти~1 = 2ъ1*д~ъ. Период линей¬ ного приближения Тл не зависит от начальных условий. Поэтому малые колебания математического маятника будут изохронными. Построим фазовый портрет модели математического маятника. Запишем интеграл механической энергии для единичной массы \рф2 - = const. На основании (3.26) приходим к представлению ф2 — и2 cos ip = h = const, П(у>) — —uj2 cos ip. (3.28) Отсюда для множества уровня энергии получим ф ~ ±\/2(h и>2 cosip)*. (3.29) 135
Рис. 10 Отметим основные фрагменты построения фазового портрета (рис. 10). 1. Находим состояния равновесия дП/dip = 0, равные по фор¬ муле (3-28) значениям: ip = 277т, которым отвечает ттП = —и2 (устойчивые положения) и ip = (2у + 1)7г, которым соответствует maxП = и)2 (неустойчивые положения), 7 = 0,1, — 2. При h < —(jj2 движение невозможно. 3. Для любого h из интервала (—lj2,lj2) фазовые траектории представляют собой замкнутые кривые, охватывающие соответ¬ ствующие устойчивые состояния равновесия, отвечающие h = —и2. Движение периодическое, колебательное. 4. Уравнение множества уровня (3.29) при h = и2 принимает вид ф = ±2ucos(ip/2) и представляет две пересекающиеся в неустой¬ чивых состояниях равновесия косинусоиды. Указанные состояния равновесия разделяют косинусоиды на отдельные фазовые траек¬ тории — сепаратрисы. Поэтому при h = о;2 движение в конфигу¬ рационном пространстве из любого начального положения до соот¬ ветствующего неустойчивого положения равновесия требует беско¬ нечно большого времени. \ 5. При h > и2 имеем ф /- 0. Фазовые траектории — волнистые линии, не пересекающие ось ip. Движение маятника вращательное и периодическое, так как на основании формулы (3.29) имеем ¥?1+27г 136
Y?i4-27r <pi v?i-t-27r ч>\+2ъ 2п <£>1+27г y>i+27r <p\ I hI • I h I'll' 0 0 (pi <p\ <pi 2тт 2тг 0 4>\ 2n t = ti+T, <i-t0 = J, T = j. 0 0 Следует отметить, что использование фазовой плоскости для изучения траекторий математического маятника имеет то неудоб¬ ство, что двум одинаковым физическим состояниям ф и ip + 27г, ф отвечают различные состояния на фазовом портрете. Представ¬ ляется полезным фазовый портрет натянуть на поверхность кру¬ гового цилиндра единичного радиуса. В этом случае будем отож¬ дествлять любой угол ip с ip mod 27г. 3.2.4. Определение периода колебаний математического маятника В предыдущем разделе было установлено, что при h Е (—а;2, а;2) происходят периодические колебания. Для определения периода этих колебаний проведем следующее рассмотрение. Подставляя ф — 0 в формулу (3.28) для наибольшего отклонения щ < 7Г ма¬ ятника от вертикали, получим соотношение h = — и2 cos ip$. Тогда формула (3.29) имеет вид ф = ±2o;^sin2 ^ — sin2 2. (3.30) Введем новую переменную ф в виде sin(<^/2) = Arsing, k = sin(<^0/2), tp € [-<£сь<Ро], Ф £ [0,27т]. Имеем при sign cos ф = signф следующее соответствие: ч> 0 <£>о 0 -Ч>0 0 ф 0 7г/2 7Г Зтг/2 27Г Поскольку dip = 2A;cosV>cos 1 ^dф, cos ^ > 0, то соотношение (3.30) имеет вид ф = 2ыксозф, что дает 137
1ф F(0,fc) = J (I - к2 sin2 ф)~*(1ф = ut, to = 0. (3.31) о Левая часть соотношения (3.31) F(ip,k) называется нормальным эллиптическим интегралом Лежандра первого рода (неполным). Интересующая нас переменная ф получается обращением интегра¬ ла F(0, к). Результат обращения интеграла (3.31) обозначается как ф = = am u)t (амплитуда ujt). Далее, sin(amort) называется эллиптиче¬ ской функцией Якоби sncj£. Будем иметь sin ^ = ksnut. Как следу¬ ет из формулы (3.31), функция snort имеет период Т, отвечающий изменению ф на величину 27г. Отсюда напишем тг 2 Т = 4и~1К, К = J (I — к2Бт2ф) 2с1ф. (3.32) о Величина К = К(k) = F(^,k) называется полным нормальным эллиптическим интегралом Лежандра первого рода, значения ко¬ торого протабулированы (например, в справочнике [9], с. 760). По¬ скольку между (риф установлено взаимно однозначное соответ¬ ствие, то ip(t) будет иметь тот же период Т. Переходим к вычислению периода. Будем иметь равномерно сходящийся биномиальный ряд (l — к2 sin2 ф) 2 = 1 + ^2 где (-'А = H)(-i)-'-(-2-g + 1) „(2?-1)11 [q J q\ ( } 2 q!l ' 2L 2 Поскольку J sin2q ф с1ф = " 1 (интеграл Валлиса, см. прило- о жение, п. 3), то формулу (3.31) преобразуем к виду T = 2nl*g-i 2 14- k2q
Первый член этого представления равен периоду Тл линейных колебаний математического маятника. Поскольку величина к = = sin</?o/2, где ipo — наибольшее угловое отклонение, период коле¬ баний Т будет зависеть от начальных условий и, следовательно, имеет место факт неизохронности нелинейных колебаний матема¬ тического маятника. 3.2.5. Приближенное решение задачи колебания маятника Рассмотрим задачу колебания математического маятника, со¬ храняя два первых члена разложения sin ip в степенной ряд. Исхо¬ дим из уравнения (3.27) и полагаем и = 1, что равносильно замене независимой переменной t на ujt . Будем иметь <р = -<р + ^<р3• (3.33) Применим метод многомерной линеаризации. Для решения зада¬ чи с точностью до третьего порядка относительно (риф введем следующие зависимые переменные: XI =<р,х2= ф, Х3 - <р2, х4 = <рф, х5 = ф2, х6 = (Р3, х7 = <р2ф, XS = <рф2, Х9 = ф3. (3.34) Сохраняя члены до третьего порядка, на основании (3.33) и (3.34) образуем систему девяти линейных уравнений Х\ 2<2) *^1 "Ь Т*^6 j ^3 — 2X4, О 2<4 — £3 4 *^5) £5 — 2x4j ^6 = 3x7, (3.35) Х7 — — Хс + 2X8, Х& = —2X7 + Яд, Хд = — 3X8- Характеристическое уравнение системы (3.35) записывается как равенство нулю определителя Дп матрицы 9x9 139
-A 1 0 0 0 0 0 0 0 -1 -A 0 0 0 1/6 0 0 0 0 0 -A 2 0 0 0 0 0 0 0 -1 -A 1 0 0 0 0 0 0 0 -2 -A 0 0 0 0 0 0 0 0 0 -A 3 0 0 0 0 0 0 0 -1 -A 2 0 0 0 0 0 0 0 -2 -A 1 0 0 0 0 0 0 0 -3 -A Для удобства вычисления определителя Дп будем обозначать через Дп_г определитель матрицы, полученной из А — XI после вычер¬ кивания первых i строчек и столбцов. Выполняя разложения по элементам первых столбцов, запишем Дп = АДп_1 Н“ Дп—2> Дп—1 ~ АДп_2, Дп = (А2 4* 1)Дп—2) Дп—2 = АДп_з 2Дп_4, Дп—3 = АДп_4 4 2Дп_5, Дп—4 = А Дп_5, Дп—з = (А2 4- 2)Дп_5, Дп—2 = —А(А2 4- 4)Дп_5, Дп—5 = — АДп_б 4- ЗДп_7, Дп—6 = — АДп_7 — 4А, Дп—5 = (А2 4- 3)Дп_7 4 4А2, Дп—7 = А2 4- 3, Дп—5 = А4 + 10А2 4- 9 = (А2 + 1)(А2 + 9). В результате получим характеристическое уравнение А(А2 4 1)2(А2 4- 4)(А2 4 9) = 0. Поскольку ранг матрицы А — XI равен восьми, то элементарные делители, отвечающие характеристическим числам г и —г, не будут простыми, и общее решение системы (3.35) для переменной х\ = <р можно записать в общем виде tp =: Во 4- {А\ 4* C\t)sint 4 (В\ 4- Di£)cos£4- +А2 sin 21 4 В2 cos 21 + As sin 31 4 B3 cos St. (3.36) С целью определения постоянных Bq, Ai, Ci, B\, Du A2, B2, Л3, B$ найдем выражения производных 140
ф =С\ sint 4- (Ay 4- C\t) cos t + Di cos t — (B\ + D\t) sin£4- 4- 2A2 cos 21 — 2B2 sin 21 + ЗА3 cos 31 — ЗВ3 sin 31, ф =2C\ cost — (A\ + C\t)sint — 2D\ sint — (B\ 4- Dit)cost— — 22A2 sin 2£ — 22B2 cos 2£ — 32A3 sin 31 — 32Вз cos 31, = — 3Ci sin£ — (Ai 4- C\t) cost — 3D\ cost 4- (B\ 4- D\t) sint— — 23A2 cos 21 4- 23B2 sin 21 — З3As cos 3t 4- 33B3 sin 31, ip^ = ..., ip^ = ..., ip^ = ..., ip^ = ..., ip^ = ... С помощью уравнения (3.33) можно с точностью до членов тре¬ тьего порядка относительно сро и фо записать значения указанных производных в начальной точке ip(0) = <р0, ф(0) = фо, Ф(0) = -tpo + i'Po. ¥>(3)(0) = ~Фо + ^Ч>оФо, 2 ¥,(4)(0) = <Ро~ з^о + ФоФо, <Р{5)(0) =фо~ 4ф%Фо + Фо, 25 69 ¥>(6)(0) = -<Р0 + у¥>0 - U^Wo. V(7)(0) = -Фо + y¥>0V>0 - 11^0. <Р(8)(°) = (fo - “^-^о + Ю2^оУ>о- Приравняем правые части полученных соотношений при t = 0. Будем иметь девять линейных уравнений для определения иско¬ мых девяти постоянных выражения (3.36). Пусть сро — наибольшее отклонение маятника, тогда фо = 0. Уравнения для определения постоянных А\, D\, А2, A3 будут однородными. Ввиду невырожден¬ ности системы эти постоянные окажутся нулевыми. Для оставших¬ ся пяти постоянных получим уравнения Во 4- В} 4- В2 4- В3 = сроч 2С\ — В\ — 22В2 — Ъ2Вз — —ipo 4- о -4Ci 4- В\ 4- 24В2 4- 34Вз = ipo — -<£о, (3.37) 6Ci - в! - 26В2 - 36Вз = -<Р0 + —8С\ 4- В\ 4- 28В2 4- 38#з = (ро з~ 141
Второе уравнение системы (3.37) умножаем на 2, -3, 4 и складываем с третьим, четвертым и пятым уравнениями —В\ 4 8#2 4- 6ЗВ3 = — ц>о — 2^0» 2В\ — Ъ2В2 — 7025з = 2(ро 4- — <£>о, о —ЗВ\ -|- 240В2 4" 6525Бз = —З^о — 34у?д. Исключая J5i, получим В2 4- I6B3 = — 18В2 4- 528Вз = —^"^о* Отсюда находим 1?2 = 0, 2?з = — • Затем определяем величи¬ ны Bi = 4- = Тб<Ро’ во = 0. Соотношение (3.36) примет вид х\ = Citsint 4- В\ cost 4- Bscos3t. Поскольку с точностью до членов порядка (рq будет С\В^ 1 = можно принять jfiiPot да sin( jj:(pQt) , тогда C\t sin 14- B\ cos t = B\ cos fit, $1 = 1 — 16 С указанной точностью запишем (р = В\ cos Sit 4- В3 cos ЗШ. (3.38) Если не учитывать члены порядка ip$ и выше, то по формуле для периода колебаний математического маятника (см. разд. 3.2.4) для и) = 1 имеем Т = 27г(1 4 По формуле SIT = 2п получим соответствующую угловую частоту SI = 1 — Будем отыскивать решение уравнения (3.33) непосредственно в виде отрезка ряда Фу¬ рье ip = b\ cos Sit 4- Ь2 cos 2Sit 4 Ь3 cos 3Sit. Проведем вычисление производных ф = —Sl(bi sin Sit 4- 2b2sin2ft£ 4- 3&3sin3Q£), ф = — Sl2(bi cos Sit 4- 4^2 cos 2Sit 4- ЭЬзсобЗШ), <p(3) = Sl3(bi sin Sit 4- 862 sin 2Sit 4 27Ьз sin 3Sit), <p(4) = Sl4(b\ cos Sit 4 16&2COs2ft£ 4- 8163Cos3fi£). 142
При t = 0 получим соотношения типа (3.37) Ь\ 4- Ъ2 + &з = (ро, П2(Ь\ 4 4&2 + 9Ьз) = — g^o» 0,4(Ь\ + 16&2 4- 8I63) = (ро — 2^о* С точностью до членов порядка (р% запишем Q 2 = 1 + -<£q, Q, 4 = 1 + -<£о* Приходим к матричному уравнению 11 1 ‘ bi ' 1 4 9 b2 = Vo 1 16 81 bs Vo фо 1$ 12 ' Получим &1 = <Л) + 77^7^0 = Вь Ь2 = В2 = 0, 63 = - — (pi = В$. 192 Чтобы утвердиться во мнении, что метод многомерной линеа¬ ризации для периодических колебаний неуправляемого математи¬ ческого маятника равносилен построению решения в виде отрезка ряда Фурье, сохраним в уравнении (3.27) при разложении siny? в степенной ряд три первых члена 1 з 1 5 V--V + -Й5<е- Введем дополнительные вспомогательные переменные Z10 = Ч>Л, Хц = <р3ф, Х\2 = <Р2Ф2, Х13 = >рф3, Х14 = ф4, ^15 = </>5, Х16 = <р4ф, Х17 = <Р3Ф2, ХШ = (р2ф3, Х19 -- (рф4, Х20 = фЬ- Составим дополнительные дифференциальные уравнения ±10 = 4хц, ±11 = 3xi2 — ^10) ±12 = 2х‘13 _ 2хц, ±13 = Х14 — 3X12, ±14 = —4xi3, ±15 = 5xi6, ±16 = 4х*17 — Xir,, ±17 = 3xi8 — 2xi6, (3.39) 143
Xi8 2xj9 *^19 — ^20 ^181 *^*20 Первые девять уравнений изменятся. Они будут иметь вид урав¬ нений (3.35), в которых правые части второго, четвертого, пятого, седьмого, восьмого и девятого уравнений получат следующие до¬ полнительные слагаемые: — ^£15, 5-^16, ^17- Приходим к характеристическому уравнению Дп = 0, п = 20. В определителе Д20 первые 9 столбцов имеют вид столбцов ранее записанного определителя det(А —XI), дополненного нулевыми эле¬ ментами, а первые 9 строк дополняются указанными значениями и нулевыми элементами. По-прежнему обозначим Дп-г определи¬ тель, полученный после вычеркивания первых г строчек и столбцов. Если проводить разложение по элементам столбцов, то сохраняют¬ ся ранее записанные соотношения между усеченными определите¬ лями. При этом следует использовать представления вида Дп—5 = -АДп_б + ЗДп_7, Дп._б = —ЛДп_7 + 4Дп_з, Дп—7 = —ЛДп-8 + ЗДп_9, Дп—8 = —АДп_9, Дп—5 = (А4 4- ЮА2 + 9)Дп_9 = (А2 4- 1)(А2 + 9)Дп_9. Поэтому получим Дп = —А(А2 4- 1)2(А2 4- 4)(А2 4- 9)Дп_9. В соответствии с уравнениями (3.39) -л 4 0 0 0 0 0 0 0 0 0 -1 -л 3 0 0 0 0 0 0 0 0 0 -2 -л 2 0 0 0 0 0 0 0 0 0 -3 -А 1 0 0 0 0 0 0 0 0 0 -4 -А 0 0 0 0 0 0 0 0 0 0 0 -А 5 0 0 0 0 0 0 0 0 0 -1 -А 4 0 0 0 0 0 0 0 0 0 -2 -А 3 0 0 0 0 0 0 0 0 0 -3 -А 2 0 0 0 0 0 0 0 0 0 -4 -А 1 0 0 0 0 0 0 0 0 0 -5 -А Продолжим вычисление определителей Дп—9 = -АДп_ю 4- 4Дп_ц, Дп-10 = —АДп_ц 4- 6Дп„12, Дп-п = -А(А2 4- 10)Лп„14, Дп-12 = (А2 4- 4)Дп-14, 144
Дп-ю = (A4 4- 16A2 4- 24)Дп_14, Дп—9 = —A(A2 4 4)(A2 4 16)Дп_14т Дп—14 = —АДп-15 + 5An_i6, Дп—15 = “АДп„1б 4- 8Дп-177 Дп-16 = -АДп-17 4 9ДГ1_18, Дп—17 = — АДп-18 - 8А, Дп—18 = А2 4 5, Дп—17 = —А(А2 + 13), Дп—14 = (А2 4- 1)(А2 4 9)(А2 4" 25). В результате имеем Дп_9 = —А(А2 4- 1)(А2 4- 4)(А2 4- 9)(А2 4 16)(А2 4- 25), Д20 = А2(А2 4 1)3(А2 4 4)2(А2 4 9)2(А2 4 16)(А2 + 25). Движение маятника периодическое, поэтому будет существо¬ вать приближенное решение в виде отрезка ряда Фурье ip = &i cos fit 4 62 cos 2fit 4- b$ cos 3fit 4- 64 cos 4flt 4 65 cos 5 fit. (3.40) При этом угловая частота ft отвечает периоду колебаний матема¬ тического маятника, вычисленного по формуле (3.32) с точностью до членов порядка </9q, т.е. Поскольку движение математического маятника периодическое, то элементарные делители, отвечающие корню А = 0 уравнения Д20 = 0, должны быть простыми. По методу многомерной линеа¬ ризации общее решение записывается в виде = В0 4 (-^1 4 C\t 4 £2) sin t 4 (-^i 4* D\t -I- D\t2) cost-\- -b (A.2 4 C^t) sin 21 4 {B2 4- D21) cos 2£4 4 (A3 Н- C3£) sin 31 4 (B3 4- cos 3t-\~ 4- A4 sin 41 4 B\ cos At + A$ sin bt 4 £5 cos 51. К выражению (3.40) приходим после вычисления постоянных. На¬ пример, для первого слагаемого правой части (3.40) можно запи¬ сать 1 1 cos tot = cosicos(—— ]45
-sintsin(—+ l2]l&4%)it « ^ ~ 2^6^<2)coet + i^(1 - 12^16^°^sint' Отсюда следует Ai = 0, Ci = Yg^oC1 “ 12. 16^^b = B\ = bu D\ = 0, D\ = —2 .Тб-2^ь 3.2.6. Циклы и условия их существования Движение стационарной механической системы с одной степе¬ нью свободы в общем виде может быть описано автономной систе¬ мой обыкновенных дифференциальных уравнений второго порядка х = Х(х,у), у = У(х,у). (3.41) Правые части уравнений (3.41) предполагаются непрерывно диф¬ ференцируемыми. Интегральная траектория, отвечающая частно¬ му решению системы (3.41), проектируется на фазовую плоскость в виде некоторой фазовой кривой. Скорость перемещения изобра¬ жающей точки по фазовой кривой называют фазовой скоростью. Компоненты этой скорости равны X и Y. Правые части системы (3.41) задают векторное поле фазовых скоростей. Точка, в которой вектор поля обращается в нуль, называетсяособой точкой вектор¬ ного поля. Указанные точки, отвечающие состояниям равновесия механической системы, будут особыми точками для дифференци¬ ального уравнения векторного поля, получаемого из (3.41) в виде dy = Y_ dx X' В состоянии равновесия имеем особенность вида неопределенности: нуль делим на нуль. Замкнутые фазовые траектории называются циклами. Если в достаточно малой окрестности цикла нет других циклов, то ука¬ занный цикл называется предельным. Достаточным условием от¬ сутствия циклов в некоторой области D С R2 может служить сле- 146
дующий критерий Бендиксопа. Если выражение ^ не из¬ меняет знак, то в указанной области циклы отсутствуют. Действи¬ тельно, пусть имеем цикл I, тогда по формуле Грина для области £>', заключенной внутри замкнутой кривой /, получим //(§£+%)*“*=l(xdv -Ydx)■ D' I Поэтому интеграл в правой части должен быть отличен от нуля. Однако из (3.41) или (3.42) следует Xdy — Ydx = 0. Полу чешки; противоречие и доказывает критерий Бендиксона. Для определения условий существования цикла разработан ме¬ тод, использующий специальные понятия: отрезка без контакта и функции последования. Конечный замкнутый отрезок S (не обяза¬ тельно отрезок прямой линии) назовем отрезком без контакта, ес¬ ли его направление нигде не совпадает с направлением векторного поля и он не проходит ни через одну особую точку. Это определение эквивалентно условию: ни в одной точке отрезка нормальная к нему составляющая векторного поля не обращается в нуль. Введем па¬ раметризацию на отрезке без контакта. Пусть положение точек на отрезке S определяется координатой £, т. е. £ : S —> R. В качестве £ может служить любое непрерывное отображение, для которого производная по направлению отрезка д£/дз отлична от нуля, где 5 — дуговая координата на отрезке. Рассмотрим фазовую траекто¬ рию, проходящую через точку с координатой & отрезка S. Назовем функцией последования зависимость &+1 = £(&)> где &+1 — пер¬ вое последующее пересечение отрезка указанной фазовой траекто¬ рией. Теорема. Если фазовая траектория пересекает отрезок без кон¬ такта S более одного раза, то она пересекает его всегда в одном и том же направлении. Действительно, в силу непрерывности нормальной составляю¬ щей поля вдоль S между отмеченными точками пересечения, в ко¬ торых нормальная составляющая имеет противоположные знаки, должна существовать точка с нулевой нормальной составляющей, что невозможно. Следствие 1. Функция последования является монотонной. Утверждение непосредственно получается из теоремы и условия отсутствия самопересечения фазовой траектории. 147
Следствие 2. Чтобы фазовая траектория была циклом, необхо¬ димо и достаточно выполнение равенства S(£i) -6=0. (3.43) Достаточность очевидна, так как при выполнении (3.43) фазовая траектория оказывается замкнутой. Необходимость вытекает из следствия 1, поскольку при ф & ввиду монотонности Н(£) фа¬ зовая траектория не может замкнуться в точке 3.2.7. Возмущения консервативных систем с одной степенью свободы Рассмотрим возмущенную систему, близкую к консервативной, в следующем виде: x = y + efi(x,y), у = +ch(x,y), (3.44) где е — числовой неотрицательный малый параметр; f\ и /2 — непрерывно дифференцируемые. Решение системы (3.44) на любом конечном интервале времени непрерывно дифференцируемо по па¬ раметру е и по начальным данным хо, уо. При е — 0 имеем невозмущенную систему, которая является кон¬ сервативной системой с одной степенью свободы. Для нее построим фазовый портрет. При этом полезно иметь в виду следующую тео¬ рему из курса обыкновенных дифференциальных уравнений. Для консервативных систем вида X = у, Y = —dll(x)/dx вбли¬ зи невырожденного (d2Il/dx2 ф 0) положения равновесия фазовые кривые диффеоморфны гомотетичным эллипсам при d2IJ/dx2 > 0 и гомотетичным гиперболам и их двум асимптотам при d2II/dx2 < < 0. В первом случае имеем особую точку типа центр (рис. 11), во итором случае - типа седло (рис. 12). Будем рассматривать некоторую область D фазовой плоскости, включающую устойчивое состояние равновесия. Фазовые траекто¬ рии представляются простыми замкнутыми линиями уровня, вло¬ женными одна в другую. Рассмотрим отрезок прямой, параллель¬ ной оси у и проходящей через отмеченное состояние равновесия невозмущенной системы. Если этот отрезок не включает состояние 148
Рис. 11 Рис. 12 равновесия, то может служить отрезком без контакта S. Действи¬ тельно, при € = 0 он ортогонален фазовым траекториям и, вслед¬ ствие непрерывности, не может быть параллелен касательной ни для одной фазовой траектории при малом € в ограниченной обла¬ сти D. Зададим координату £ на S формулой £ = h = ^У2 + П{х), (3.45) что допустимо, так как д£ ду дП дх ду дх ds~Vds + ~dxds,d^~ ’д^~ Возьмем на S некоторую точку с координатой £ = h и рассмотрим проходящую через эту точку фазовую траекторию /о невозмущен¬ ной системы и фазовую траекторию 1€ возмущенной системы (3.41). Координату последующего пересечения отрезка S получим из Л с помощью приращения Ah вдоль кривой от одной точки пересече¬ ния S до другой. Для 1о имеем Д/i = 0. Определим Ah для 1€ с помощью (3.44) и (3.45): ДЛ = Jydy + ^dx = j(x-efi)dy + (-y + £f2)dx, IС It Ah = £i](h, e), r](h, e) = J(f2dx- /1 dy).
Функция r}(h, е) является непрерывно дифференцируемой по пара¬ метру е. Поэтому можно написать r)(h,e) = r;(/i,0) + О(е), где r](h, 0) = j) (f2dx - f\dy). (3.46) lo Здесь криволинейный интеграл вычисляется по известному замкну¬ тому контуру, отвечающему уровню h механической энергии невоз¬ мущенной системы. Тем самым с точностью до величины порядка е построена функция последования в виде E(h) = h + £T}(h,0). Согласно изложенному сделаем следующие выводы: 1. Пусть на S функция rj(h, 0) сохраняет знак. Тогда при доста¬ точно малом £ имеем H(/i) ф h. Отсюда ни для одного значения h на рассматриваемом участке не будет циклов. Первоначально замкну¬ тые при £ = 0 фазовые траектории превращаются в спирали: закру¬ чивающиеся при 77(/i, 0) < 0 и раскручивающиеся при 7](h, 0) > 0. 2. Если существует ho такое, что „(А„,0)=0, dh dh h=ho Ф о, /i=/io е=0 3. Пусть T)(h0,0) = 0, d^0) то система (3.41) имеет цикл, у которого he = ho 4- О(е). Действи¬ тельно, при сделанных предположениях уравнение 7/(/г, £) = 0 будет иметь единственное решение h£, причем hA = ho> Поскольку это 1е=0 решение по теореме о неявной функции оказывается непрерывно дифференцируемым, то h£ — ho = О(б). Утверждение доказано. < 0, тогда по только что до- h=ho казанному утверждению существует h£, для которого r](hey£) = 0. Кроме того, по непрерывности ММ1 <0 . Поэтому при h < hE I h=he имеем rf(h, e) > 0, фазовые траектории раскручиваются, приближа¬ ясь к предельному циклу, а при h > he будет r](h,£) < 0, фазовые траектории закручиваются и также приближаются к предельному циклу. Такой предельный цикл называется устойчивым. 150
4. Пусть Tj(ho,0) = О, > 0. Аналогичное рассмот- рение показывает, что предельный цикл становится неустойчивым (фазовые траектории от него отходят). 3.2.8. Автоколебания, примеры автоколебаний Проведенное рассмотрение показало, что в консервативных си¬ стемах возможны установившиеся колебания с произвольными ам¬ плитудами и даже периодами. В неконсервативных системах при различных начальных условиях могут устанавливаться колебания определенной амплитуды и периода. Эти установившиеся устойчи¬ вые колебания часто называют автоколебаниями, или устойчивый предельный цикл называется автоколебанием. Закон изменения ки¬ нетической энергии в виде равенства этого изменения работе сил выполняется и для неконсервативных систем, а изменение кинети¬ ческой энергии как функции состояния за цикл равно нулю, поэто¬ му работа всех приложенных сил за период автоколебаний должна быть равна нулю. Рассмотрим два примера с автоколебаниями. Пример 1. Пусть /i = 0, /2 = х{\ — х2), П — \х2. Получаемое при этом дифференциальное уравнение х 4- х = £х(1 — х2) называется уравнением Ван-дер-Поля. Если х = 0, то и х = 0, от¬ сюда имеем единственное состояние равновесия х = 0, х = 0. При £ = 0 напишем интеграл механической энергии ^(х2 4- х2) = h. Фа¬ зовые траектории невозмущенной задачи, следовательно, окружно¬ сти радиусов R = у/2Тг с центром находятся в состоянии равновесия и перемещении изображающей точки по часовой стрелке. Найдем условия существования предельного цикла возмущен¬ ной задачи по изложенному методу (см. разд. 3.2.7). Контур Iq опре¬ деляется уравнениями х = Rcosip, х = Rsinip, 0 < ip < 2тт. По формуле (3.46) получим 2тг 7](h, 0) = R2 J(l — R2 sin2 ip) cos2 ip dip = tvR?(\ — ^-) = 27i7i(l — ^). 0 Приравняем T](h,0) нулю. Имеем два корня: /io,i = 0, /10,2 = = 2. Первый корень отвечает состоянию равновесия. Хотя отрезок 151
без контакта S не должен включать точку равновесия, он может начинаться в сколь угодно малой близости от нее. Поскольку имеем dr}(h, 0) dh = —nh + 27г(1 - /г/2) = 2п(1 - /г), то получим dr](h,Q) dh >0, d77(/i, 0) dh <0. /l = /lO,2 На основании утверждений 3 и 4 (см. разд. 3.2.7) приходим к ре¬ зультату, что положение равновесия (/го = 0) является неустойчи¬ вым и возникает единственный предельный цикл (/го = 2). Фазовый портрет изображен на рис. 13. Пример 2. Часовой механизм можно интерпретировать как математический маятник (или крутильный маятник) с кулоновым трением и ударным (импульсным) подводом количества движения за счет опускания гирь или воздействия спиральной пружины. Интегральные траектории колебаний точки с кулоновым трени¬ ем описаны в разд. 2.1.3 [15]. Уравнения движения приводятся к виду х Н- к2х — v или х + к2х = —v. 152
Общее решение запишем с учетом знака правой части х = A cos kt + В sin kt ± vk~2. График x(t) состоит из косинусоид одной угловой частоты к, но с уменьшающимися от размаха к размаху амплитудами. Цен¬ трами колебаний по очередности служат точки ик~2 и — ик~2, где ик~2 — полуширина зоны застоя. Фазовый портрет в осях х и к~1х приведен на рис. 14, где [—vk~2, vk~2] — зона застоя. Фазовые траектории — это полуокружности с центрами на оси х в точках: —1/к~2 для верхних полуокружностей и ик~2 — для нижних. В этом случае выполняется равенство ОМ{+ \ = ОМ* — 2ик~2. Часовой механизм осуществляет импульсное приращение кине¬ тической энергии в некоторой точке М*. В результате изображаю¬ щая точка переходит на новую фазовую траекторию, которая пе¬ ресекает ось х в точке Мо. Фазовый портрет колебаний маятника часов в осях х и к~1х изображен на рис. 15. Пример 3. Для консервативной системы с малым параметром будет rj(h,0) = 0. Согласно теории разд. 3.2.6 в этом случае сле¬ дует замкнутость фазовых траекторий. Получим асимптотическое представление колебаний с начальными данными хн = А, хн = 0 в виде Рис. 14 Рис. 15 X -f- X ~h £Х3 — 0 х = A cos г— (cos г—cos 3r)-f * е2Аь (23 cos т—24 cos Зт-t-cos 5т), OZ IUZt: 153
При сопоставлении с результатом разд. 3.2.6 следует положить е = -i/e. 3.3. Оптимальное гашение колебаний механической модели с одной степенью свободы 3.3.1. Задача демпфирования колебаний спутника относительно центра масс Рассмотрим две системы координат с началом в центре масс С обращающегося по круговой орбите спутника: орбитальную (#(ьУ(ь2о) с ортами io, jo, ко, ось Czq направлена по продолже¬ нию радиус-вектора центра масс гс, ось Схо — в сторону движения центра масс в плоскости орбиты ортогонально Сzq, ось Су о ортого¬ нальна плоскости орбиты, а также жестко связанную со спутником систему (x,y,z) главных центральных осей инерции с ортами i,j,k (рис. 16) и моментами инерции /х, 1У, Iz. Обозначая через ае2 произведение гравитационной постоянной на массу планеты (см. разд. 2.1.6), напишем выражение для момен¬ та гравитационных сил относительно центра масс спутника в виде интеграла Стилтьеса по массе т спутника т Z Рис. 16 154
Для принятых обозначений будем иметь г - rc = xi 4- yj + zk, гс = 7'ск0, к0 = ai3i -I- а2зЗ 4- «ззк. Поэтому получим (г - гс) хг = (г - гс) хгс = = г с [(ya33 - za2 3)i 4- (zai3 - xa33)j 4- (ха23 - 2/ai3)k], г2 = г2 4- 27’c(xai3 4-уа2з 4- газз) + х2 4-у2 4- Д _1_ _ _1_ — 1з 2 / \ 2 / \ 2-, -§ 1+2 ±ai3+JLa23+±a33 + £ + £ + = гс 3 [l - 3гс + уа23 + га33) + o(Zrc *)]. Здесь через I обозначен наибольший линейный размер спутника. Поскольку начало подвижной системы (х,у, г) совпадает с центром масс спутника, то статические моменты f xdm = тп = 0, f у dm = 0, f z dm = 0. Для кругового спутника ает\Г3^2 = тп тп = ujo = const — угловая скорость орбитального движения цен¬ тра масс. Учитывая равенство нулю центробежных моментов f ху dm = 0, / xz dm = 0, fm yz dm = 0, с точностью до членов тп тп o(x2ml2r~3) получим следующее выражение для проекции грави¬ тационного момента на ось Сх: Мх = Зае2г~2 I (уа33 — га2з)(— «13 + —0-2з + — азз) dm — J 'гс Гс гс / ТП = Заз2» “3 J(у2 - г2)а2зазз dm = 3oj$(Iz - 1у)а2зазз. (3.47) ТП Две другие компоненты Му и Mz находим из (3.47) с помощью перемещения индексов: х —* у —► z —> х, ai3 —► «23 ~> «зз Л13. В настоящем рассмотрении ограничиваемся изучением колеба¬ ний спутника в плоскости его орбиты, т. е. предполагаем оси Суо и 155
Су совпадающими. Движение спутника относительно центра масс будет иметь одну степень свободы. В качестве обобщенной коор¬ динаты выбираем угол в между осями Схо и Сх или, что то же самое, между осями Czq и Cz. Имеем вращение тела относитель¬ но поступательно движущейся и проходящей через центр масс оси Суо. Закон изменения момента количества движения относительно этой оси приводит к уравнению 1ув = Му. Перемещая индексы в формуле (3.47), получим Му = ЗЦ)(/Х — /г)азз«13- (3.48) Для рассматриваемого случая а13 = cos(2o,x) = — sin#, азз = cos(^o,2) = cos0. Уравнение вращательного движения относительно оси у под дей¬ ствием момента (3.48) принимает вид 1ув + 3uq(Ix — Iz) sin в cos в = 0. Пусть Ix > /z, т. е. спутник как бы вытянут вдоль оси Cz, тогда обозначим ш2 = 3u)q(Ix — Iz)Iyl > 0 и уравнение запишем так: в + и2 sin в cos в = 0. (3.49) Для (р = 29 выражение (3.49) совпадает с уравнением движения математического маятника (2.17). Колебания около положения рав¬ новесия ip — 0 будут незатухающими. При техническом использовании спутника часто требуется, что¬ бы он был ориентирован в орбитальной системе, т. е. угол в был возможно меньшим. После отделения от носителя ввиду неидеаль- ности работы толкателей патрона отделения спутник получает су¬ щественную закрутку с угловой скоростью порядка 100 cjo- Затем включается так называемая система предварительного успокоения, использующая обычно реактивные двигатели, которая переводит спутник в режим малых колебаний по углу в. Дальнейшее гашение колебаний может выполняться с помощью реактивных микродвигателей, обладающих весьма ограниченным 156
запасом энергии, временем работы и допустимым числом включе¬ ний. Два двигателя могут создать пару сил с моментом, направлен¬ ным в положительную сторону оси у, два других — соответственно момент, направленный в отрицательную сторону этой оси. Обозна¬ чим через щ и отношения величин указанных моментов к мо¬ менту инерции 1У спутника. Исходя из (3.49), получим следующее дифференциальное уравнение управляемых малых колебаний спут¬ ника в плоскости орбиты: х 4- со2х = и\ — и2. (3.50) Общий расход массы для микродвигателей пренебрежимо мал но сравнению с массой спутника, и величину и)2 можно считать посто¬ янной. 3.3.2. Постановка линейной задачи оптимального демпфирования колебаний Ввиду ограниченности мощности двигателей следует принять во внимание ограничение на управление, которое для однотипных микрореактивных двигателей можно принять в виде 0 < щ < I/, i = l,2, v = const > 0. (3.51) Напишем граничные условия: .7;“ = х", хн = х% при (t = £н); хк = 0, хк = 0 при (t = £к)- (3.52) Величины х", xj и £н будем считать заданными. На вопрос о том, будет ли задача (3.50)-(3.52) управляемой, можно ответить положительно. Действительно, если включать управления по типу воздействия сухого трения (см. разд. 3.2.3), то колебания демпфируются, и за некоторый конечный промежу¬ ток времени точка остановится внутри зоны застоя: хк < иш~2, хк = 0, и = const > 0. Уменьшением величины управления и мож¬ но сделать зону застоя сколь угодно малой. Таким образом, закон управления по типу сухого трения позволяет решать задачу, но с бесконечно большим числом переключений. Проверим выполнение условий Калмана (2.6) управляемости для рассматриваемой задачи. Обозначая х\ = х, х2 = х, из (3.50) получим 157
±1 = X2, ±2 = —UJ X\ -f- Xl\ — U2, которая имеет вид линейной системы (2.5), где (3.53) А = О -ы2 В = О -1 rang[B, АВ] = rang -1 , АВ = 1 -1 О О 1 О = 2. -1 О Поскольку в данной задаче п = 2, то условие Калмана выполняет¬ ся. Рассматриваемая система управляема. Выбор закона управления обладает определенным произволом, и можно дополнительно потребовать выполнения заданного крите¬ рия качества. Возможен, например, физический выбор минимизи¬ руемых функционалов : 1) функционал энергетически оптимальной задачи Ф1 — J (ui + и2 )dt, tti (3.54) 2) функционал оптимального быстродействия ф2 = j* dt = tK ttl. L (3.55) Если функционал (3.55) в комментарии не нуждается, то функ¬ ционал (3.54) требует пояснения. Реактивная тяга одного микро¬ двигателя равна \хиг, где \i — расход массы в единицу времени, иг — постоянная эффективная относительная скорость истечения. Пусть — расход в единицу времени двух микродвигателей, со¬ здающих положительный момент, тогда щ — }^1у11иг где / — расстояние между двигателями (плечо пары реактивных сил). Со¬ ответственно для двигателей, создающих обратный момент, напи¬ шем U2 “ \ly4urii2* По формуле (3.54) получим 1 «'К , ix2)dkt = ^I~llur(mH - tи 771, О, 158
где тн — тк — суть разности начальной и конечной массы, т. е. об¬ щий расход массы топлива. Тем самым функционал Ф1 оказывается пропорциональным с постоянным положительным коэффициентом величине расхода топлива. Сформулированная в виде формул (3.50)-(3.55) динамическая модель демпфирования колебаний системы с одной степенью сво¬ боды может быть названа стандартной. Она применима не только к задаче колебания спутника около центра масс. 3.3.3. Исследование функции Гамильтона Рассмотрим схему решения энергетически оптимальной задачи, ('оставим функции Н на основе формул (1.15), (3.53) и (3.54) Я = -(ui + U2) 4- Л1Х2 4- A2(-cj2Xi + U\ - U2). (3.56) ()таода имеем уравнения Эйлера-Лагранжа (2.19) следующего вида: ч _ дН _ 2ч ч _ дН _ Ч /О С7Ч Ai — — ш А2, А2 — —— 1 * (3.57) Как отмечалось в замечании 3 (см. разд. 2.1.4), уравнения (3.57) будут сопряженными к однородной системе, отвечающей уравнени¬ ям (3.53). Ищем общее решение уравнений (3.57): А2 4* cj2A2 — О, Ai = — auQ,os(u)t + с*), Х2 = asin(u;£ -f a), (3.58) а = const >0, а = const. Значение a = О опустим, так как в этом случае Ai = О, А2 = 0 и мо (3.56) Н = — (и 1 4-^2)- По условию максимальности Я, согласно формуле (2.27), U[ =0, U2 = 0. Этот режим отвечает выключенным управлениям и может иметь место, если задача перехода из началь¬ ного положения в конечное выполняется на свободном движении f)<*з расхода массы. Для рассматриваемой задачи это невозможно. Режим, отвечающий стационарности функции II по управлени¬ ям, называют программируемым, а в задачах с линейным управле¬ нием его называют вырожденным. Покажем невозможность про¬ граммируемого режима в рассматриваемой задаче, т.е. отсутствие 159
существования конечного пусть и достаточно малого промежутка (ti,t2), на котором = О, = 0. Из формулы (3.56) получим (3.59) Наличие вырожденного режима, как показывают формулы (3.58) и (3.59), равносильно тождественному выполнению на промежут¬ ке (£1^2) равенства — 1 ± Х2 = 0 или —1 ± asin(u;£ 4- ot) =0. Но это невозможно, так как указанное тригонометрическое уравнение при а / 0 имеет изолированные решения. Будет удобнее соответ¬ ствующие точки рассматривать как смещение фазы от нечетного кратного \ в виде Величина а должна быть больше единицы. Поскольку не выполнены условия стационарности Н по управ¬ лениям, то максимум Н не может достигаться внутри области (3.51) и оптимальный режим состоит из участков с граничными урав¬ нениями. Управления и\, и2 входят в функцию Н линейно, по¬ этому согласно замечанию 5 (см. разд. 2.1.4) моменты времени т2, гз, 74, определяемые формулой (3.60), отвечают точкам пе¬ реключения управлений. -— = 0, ljti + а = (4п + 1)^ - a, cjt2 4- а = (4п 4-1)77 4- сг, uU\ 2 2 1 а = arccosa 1 > 0, п = 0,1,2,... (3.60) -1 ► ujt+a Рис. 17 160
На рис. 17 представлены графики зависимости Л2 и величины uu~l = = (и\ — и2)и~1 от времени. Как показывает формула (3.58), Х2 — функция кусочно-монотонная на участках: (оd + a)mod27r £ (—f, f) строго возрастает; (u>t + a)mod27r € (|, ^) строго убыва¬ ет. До начала первого участка, т. е. до момента времени т\, имеем < 0, < 0, что отвечает свободному движению. В момент времени т\ будет = 0. До момента т2 включается первое уираи- ление максимальной величины I/, так как при t <Е (т\^т2) получим > 0, а при t = 72 - снова = 0. На интервале (т2,г;<) бу¬ дет свободное движение. В момент времени 73 производная им- меияет знак с минуса на плюс, проходя через нуль, и включается до максимального значения управление и2. В момент времени 74 управление и2 выключается и начинается очередной режим сво¬ бодного движения. Ситуация повторяется через период свободных колебаний. Поэтому процесс управления является периодическим с периодом Т = 2ъ/ы, не зависящим от граничных значений. Решение задачи свелось к определению неизвестных величин, входящих в формулу (3.60), т.е. а и а. Обратимся к общему усло¬ вию трансверсальности вида (2.25), в котором Rq = 0. По формуле (3.52) начальные и конечные значения фазовых переменных явля¬ ются заданными постоянными величинами так же, как и Вари¬ ации указанных величин равны нулю. Условие трансверсальности приводим к виду —HKAtK = 0. Поскольку вариации AtK можно придавать произвольные значения, то Нк = 0. Функция Гамиль¬ тона (3.56) явно не зависит от времени, поэтому Н = const = 0. 11римем £н = 0 и на основании (3.56) и (3.58) получим 0 = Н = Х\х2 — cj2X2xi = —иа(и)х\ sin a + x2 cos a). I Гоэтому a находим по начальным данным tga = -x"(wx")-1. (3.61) 3.3.4. Фазовый портрет энергетически оптимальных траекторий Поскольку оптимальная траектория состоит из чередования участков трех типов: 1) щ = v,и2 = 0; 2) ui = 0,и2 — 0; 161
3) ui - 0,7/2 =- v\ то уравнения движения (3.53) равносильны урав¬ нению х -I- ш2х = и, где и = Ui — и2 = const. Отсюда полупим xj = х = frsin(cj£ 4- /3) 4 иш~'2, b = const > 0, .т2 = x = bucos(ujt -I- /3), (i = const. (3.62) Для участка начального движения при и = 0 имеем 6 = ((xy)2 + (xS)2w-2)5, tg/^wxfCrS)-1. (3.03) Формулы (3.61) и (3.63) показывают, что начальная фаза коорди¬ наты х\ и начальная фаза множителя Л2 сдвинуты по фазе синуса на - : а — (3 ± Поскольку угловая частота гармонических ко¬ лебаний х\ и Л2 одна и та же о;, то начальное смещение фаз будет сохраняться во все время движения. Из формулы (3.62) следует, что х2 также имеет смещение фазы на | относительно фазы величины Х\, именно: опережает по фазе синуса на Для рассматриваемой задачи успокоения колебаний принимаем Л2 в иротивофазе со скоростью х2 — х, так как при совпадении фаз будет раскачка. С помощью (3.62) можно получить уравнение фазовой траекто¬ рии вида (cjxi — иш~1)2 4- х2 = w2b2 = const. (3.64) Поэтому фазовые траектории в осях и)Х\ и х2 — дуги окружностей. На участке включенного управления и = и\ = v имеем дугу окруж¬ ности с центром Оу в точке (w-1,0), на участке с выключенным управлением - дугу окружности с центром в начале координат, на¬ конец, участку с включенным управлением и = —и2 = — v отвечает дуга окружности с центром 02 в точке (—i/o;-1,0). Как следует из рис. 17, фазы середин участков активного дви¬ жения (длительностью по фазе 2а) будут нечетно кратны j относи¬ тельно фазы ut 4-0? лагранжевого ммножителя А2. Поскольку фаза этого множителя смещена относительно фазы переменной х\ на то середины указанных участков отвечают нулевому значению ко¬ ординаты xi. Поэтому точкам переключения управлений отвечают фазы, соответствующие точкам на линиях, составляющих с двух сторон углы а с осью х2. Фазовая картина начального этапа движения но оптимальной траектории с заданной величиной а схематично представлена на 162
Рис. 18 рис. 18. Поскольку Л2 находится в иротивофазе с х, то линиями переключения управления и\ будут лучи, составляющие углы ±<т с. отрицательным направлением х2, а линии переключения и2 — со¬ ответственно углы ±а с положительным направлением оси х2. Из начального состояния (wx^xg) изображающая точка пере¬ мещается по часовой стрелке по дуге окружности с центром в точке О и радиусом buj до пересечения с линией переключения в точке А, в которой включается управление щ на максимальный уровень v. От этой точки А включения управления строится участок фазовой траектории активного движения с управлением и\ = г/, который представляет собой дугу окружности с центром Oi и центральным углом 2а. Равенство этого угла углу между линиями переключе¬ ния следует из того, что за время т2 — т\ произойдет одинаковое изменение фаз на угол 2а как для Л2, так и для фазовых коорди¬ нат xi и х2. В точке В управление и\ выключается и будет осу¬ ществляться перемещение изображающей точки по дуге окружно¬ сти с центром в начале координат О на угловую дальность 7г — 2<т, т. е. до пересечения с левым верхним лучом переключения управле¬ ния и2. Определим, насколько уменьшается радиус окружности свобод¬ ного движения после первого активного участка 62о; по сравнению с радиусом начального участка активного движения Ьи. Выполним 163
вспомогательные построения (рис. 18). Из треугольника 00\ А име¬ ем Ь2и>2 = Ь2ш2 4- и2ш~2 — 26*/sin сг, где b\u) — радиус дуги окружности для участка фазовой траектории с управлением и = щ = I/, при этом центром окружности служит точка 0\. Из треугольника 00\В следует Ь2ш2 = Ь2ш2 4- i/2lj~2 — 2b\iysm(2a 4- 7). Для тригонометрических функций вспомогательного угла 7 из тре¬ угольника АСО\ находим sin7 = fcj^ar^i/ur1 — 6o;sincr), COS7 = bYlu>~lbuJCOsa. Отсюда получим sin(2cr + 7) = bb±1 sin 2o cos a — bb^1 sin a cos 2a 4- vb\luj~2 cos 2a = = bil(bsina 4- i/u>“2cos2cr). Теперь запишем b2cj2 = b2w2 -\-2v2u~2 — Abvsina — 2v2uj~2 cos2a = (6a;—2i/a;_1 sin a)2. Окончательно получим b2 = b — 2vlj~2 sin a. (3.65) Если будет ОС > OC\, то вместо угла 2сг 4- 7 окажется угол 2а— —7, а правая часть формулы для sin 7 изменяет знак на обратный. Приходим и в этом случае к выражению (3.65). Формула (3.65) показывает, что за полупериод амплитуда уменьшается на 2иш~2 sin ст. За время, равное периоду свободных колебаний Т = 27га;”1, амплитуда уменьшается на 2 sin а. По¬ этому на гашение начальных колебаний с амплитудой b потребуется время tn — ^bv~lu2T sin-1 а. (3.66) Соответствующий расход
Поскольку величина a sin“1 а = 1 при а = 0 и монотонно воз¬ растает при положительных о, то по формуле (3.67) минимальный расход Фщш = Ьи) соответствует а = 0 и £д = оо. Поэтому энергети¬ чески оптимальный режим без ограничения на конечное время tK не существует. Пусть задано предельное время £*, тогда tK < t*. Величина t* должна быть меньше минимального времени, отвечающего реше¬ нию задачи оптимального быстродействия (см. разд. 3.3.5). Условие трансверсальности в конечной точке HKAtK > 0. Поскольку Д/.к < 0 и строго неравенство выполняется при tK = £*, то получим //к > 0. Постоянную Н, как и <т, следует определять в процессе удовлетво¬ рения условий экстремальности. В конечной точке х* = 0»^2 ~ 0 по формуле (3.56) имеем Нк = -«i(l - А£) - и2(1 + А5). Попробуем решить задачу так, чтобы конечное положение сов¬ падало с точкой переключения управления. Тогда 1 — А£ = 0, г^2 = 0 или 1 + А£ = 0, и* = 0, т. е. Нк = 0. В этом случае и в задаче с ограничением на время движения линии переключения управле¬ ний имеют тот же вид прямых, наклоненных под некоторым углом а к оси Х2. Точный вход в начало координат с управлением и = щ = и осуществляется только по дуге полуокружности с центром в точке 0\ и радиусом vu)~l, указанной на рис. 19 сплошной линией. Соответственно с управлением и = —и^ = —и изображающая точка может войти в начало координат по отмеченной штриховкой дуге полуокружности с центром в точке О2 и тем же радиусом vu~l. Поэтому заключительный участок управляемого движения мо¬ жет начинаться только в точке D пересечения линии переключе¬ ния и одной из упомянутых полуокружностей. При этом угол х между радиусами 0\0 и 0\D равен 2<7, так как для угла при основании равнобедренного треугольника 00\D можно записать \ - а — |(7г — х)- Фазовая траектория, входящая в начало коор¬ динат по дуге правой полуокружности и отвечающая конкретной величине сг, изображена на рис. 19. Величину о можно определить с помощью соотношений f* = ^T+{°}^+2aw-1 + r, (3.68) 165
и - и, - V Рис. 19 „T4i/sin<7 г 0 'i 2v sin a 2/ysincr р b = TV 2— + 1 Г 2“ + 2— + 3-69 о;"5 11) loz и)г где N подлежащее определению натуральное положительное чис¬ ло; т < \Т. При т < \Т - 2сги;-1 будет 5 = 0. Если т > \Т — 2ctlj~\ то начальная точка принадлежит участку активного движения, длительность которого г* = г — -f 2<tcj-1. Поправка J > 0 равна уменьшению величины b = (х2 + cj~2x2)1/2 на участке активного движения за время от tH до tH 4- т*. С помощью уравнений движения (3.54) запишем -^(а>262) = 2и)2х\х2 4- 2х2(-и)2х\ -\-щ- и2), w2bb = x2(ui - и2). Согласно (3.62) находим ЬЪ — b\vuj ~l cos(cot 4 Р\) при x2 < 0, bb cos(u)t -4- Pr) при x2 > 0. Для определенности примем x2 < 0, тогда Ь2 = 26j vu)~x sin(o;£ -f p\) 4 С, G — const, № — b2u 2byvuj~r sin(utH 4 P\) 4 C. 166
В соответствии с обозначением рис. 19 полагаем Ь2 - Ьт.2. Для коор¬ динаты Х\ в точках включения и выключения управлении и\ имеем i>isin(£jf„ +/?i) + VU)~2 = bt„ sin{uit.„ I fi), у bi sin(wr2 + Pi) + vu~2 — />2hin(wr2 I fi). Поскольку СУ = /3— |, TOCJT2+/3 = | -\-U)T2 In- 71 | О . С ПОМОЩЬЮ формул (3.70) и (3.71) получим /;2 + 2b2isu~~l sina = b2 — 2bvu~ 1 sin(ljLu I /I). (3.72) Искомая поправка S = b — b2. В частности, если tn - Т], то и\ /I - a;ri + cv4-f=7r — а. Из (3.72), как и по формуле (3.65), следует 6 — 2vlo~l sin а. Точное определение а по формулам (3.68), (3.69) и (3.72) являет¬ ся сложной задачей. Можно эту задачу упростить, взяв, например, за начальное положение наибольшее положительное по координате 1. Тогда b = ж", S = 0, т - \Т — аи~1 и после исключения из (3.68) п (3.69) приходим к уравнению и>2ЬТ — (£* - ~X* — аш~1)Аия\па -b 2//Tsi)i0-, (3.73) которое может быть получено непосредственно из рис. 19 при ана¬ лизе соответствующей фазовой траектории. Уравнение (3.73) запи¬ шем в виде Л\ sin а = Л2 -Ь Аза sin а, где Ai = 4i/(i* - \Т), А2 = ЬТи2, А3 = 4//CJ-1. Если ГГ"1 » 1, то о — величина малая и в качестве начального приближения мож¬ но принять <то = arcsin (A2A]1). Уточним это значение с помощью итераций по формуле- sin<TK = А^(А2 + Л3СГк-1К1П<Тк-1). Заметим, что при определении а из приближенного уравнения фазовая траектория может не попасть в точку D. В этом случае дугу последнего участка свободного движения проводим до соот¬ ветствующей полуокружности радиуса z/а;-1, по которой и закан¬ чиваем движение в начало координат. Подобную траекторию, по¬ строенную с некоторыми несущественными нарушениями условий жстремальности, принято называть суСнттилшлъной. 167
Таким образом, теоретически энергетически оптимальным без ограничения времени оказывается импульсный режим, при кото¬ ром скорость Х2 = х последовательно уменьшается по величине при прохождении точки через положение х\ = х = 0. Реальный режим будет тем ближе к идеальному теоретическому, чем меньше величина сг. Режим рассмотренного типа можно наблюдать на аттракционе с качелями в виде металлической лодочки на подвеске. Когда за¬ канчивается время аттракциона, то для остановки лодочки с не в меру раскачавшими ее посетителями, служитель нажимает на ры¬ чаг, что приводит к подъему специальной доски, и лодочка начи¬ нает касаться этой доски в своем нижнем положении. Возникаю¬ щая на коротких участках соприкосновения лодочки с неподвиж¬ ной доской постоянная по величине сила трения скольжения при¬ водит к остановке лодочки в течение нескольких периодов ее коле¬ баний. Как же удается двум веселым посетителям аттракциона так рас¬ качивать лодочку, что она даже начинает соударяться с упорами? Они поочередно резко приседают и резко выпрямляются. Тем са¬ мым периодически с частотой, равной частоте свободных колеба¬ ний, возмущают колебательное движение лодочки. Также в резо¬ нансном режиме, но в противофазе, предлагает теория оптимально гасить подобные колебания, и также осуществляется их гашение служителем аттракциона. 3.3.5. Фазовый портрет траекторий, оптимальных по быстродействию Функционал оптимального быстродействия (3.55) в отличие от функционала (3.54) энергетически оптимальной задачи не зависит явно от управлений геi, г^2- В уравнения движения (3.53) управле¬ ния входят в связке и\ — Поэтому целесообразно для задачи оп¬ тимального быстродействия рассматривать одно скалярное управ¬ ление и = и\ — U2 и ограничения на управления (3.51) заменить одним ограничением —v<u<v. Получим следующую функцию Гамильтона: Я = -1 + Х\х2 + Л2(—ы2х\ + и). 168
Множители Лагранжа будут определяться уравнениями (3.57) в ви¬ де (3.58). Управление и входит в функцию Н линейно, поэтому при ^2 ф 0 согласно замечанию 1 (см. разд. 1.1.5) из условия макси¬ мальности Н следует и = v signA2. Как и в разд. 3.3.3, доказана невозможность вырожденного режима для конечного, пусть и до¬ статочно малого интервала. Условие ^ = А2 = 0 определяет точки переключения граничных управлений v и —v. В задаче оптимального быстродействия рис. 17 заменяется на рис. 20, на котором вместе с графиком Л2 представлен график за- иисимости Vх от времени. Режим управления заключается в чередовании участков актив¬ ного движения длительностью тси~1. За время пи~1 фазовая тра¬ ектория проходит ровно половину окружности. Поэтому фазовая траектория состоит из последовательного со¬ единения полуокружностей с центрами 0\ и Ог, а на заключитель¬ ном участке по части одной из полуокружностей радиуса i/o;”1, так как только по этим дугам можно войти в начало координат. На¬ чальная дуга также может составлять лишь часть некоторой по¬ луокружности. Фазовые траектории задачи оптимального быстро¬ действия представлены на рис. 21 и 22. Чтобы убедиться в истинности фазового портрета задачи быст¬ родействия (см. рис. 21), достаточно проследить по входящей в на¬ чало координат фазовой траектории перемещения изображающей точки в обратном направлении. Поскольку центры полуокружно- 169
стей фазовой траектории совпадают с точками 0\ и О2, то через эти точки будут проходить и диаметры замыкающих полуокружностей. Поэтому начинаться и заканчиваться очередной участок активного движения будет на гирлянде (кружеве) полуокружностей радиуса i/o;-1, указанной на рис. 21 пунктиром. Эта гирлянда полуокружно¬ стей и будет представлять собой линию переключения управления. Выше этой гирлянды управление равно —I/, а ниже соответствен¬ но и. Если начальная точка расположена выше линии переключения управления, то изображающая точка начинает двигаться по часо¬ вой стрелке по дуге окружности с центром О2 до пересечения с 170
линией переключения управления. Отсюда начинается второй уча¬ сток движения вида полуокружности с центром 0\ и т. д. Если на¬ чальная точка располагается ниже линии переключения управле¬ ния, то начальный участок движения будет дугой окружности с центром 0\. Движение изображающей точки происходит, как все¬ гда, по часовой стрелке. Затем центры полуокружностей чередуют¬ ся до тех пор, пока фазовая траектория не пересечет левую или пра¬ вую входящую в начало координат полуокружность радиуса ии) 1. Заключительный участок совпадает с дугой этой полуокружности переключения. Пример 1. Примем х" = 1, х2 = 1, £н = 0, lj = и — 1. Оп¬ тимальная траектория (рис. 22) состоит из дуг I и II. Из формулы (3.62) следует, что угловая скорость обращения по этим дугам бу¬ дет одинаковой, для рассматриваемого примера единичной. Поэто¬ му имеем 7Г 14 tK = g +2<P,tg <р = -, sin2<р = -, 3 cos 2<р = -, 2ip да 54 да 0.37Г, £к да 0.87г. 5 Момент времени т переключения управления с —1 на 1 удовлетво¬ ряет условию Х2 = asin(r + a) = 0, т = 2ip, а = —2(р. Следовательно, оптимальное управление и = sign sin (£ — 2ф). Пример 2. Начальная точка принадлежит отрезку АВ прямой |- х2 = 2 в первом квадранте. Требуется перейти с этого отрез¬ ка и начало координат за минимальное время. Проверяем гранич¬ ные точки А и В. Начальный участок движения проходит по дуге окружности с центром 02 с управлением и = —1 до пересечения < полуокружностью ВО с единичным радиусом и центром 0\. По дуге этой полуокружности движение завершается с управлением // - 1. По сравнению с примером 1 движение из точки А потребу¬ ет дополнительного времени, равного радианной мере угла А02С. 11о:>тому точка А не может служить начальной для оптимального перехода. Оптимальная по быстродействию траектория перехода из 171
точки В в начало координат будет осуществляться по полуокруж¬ ности ВО за время 7г. Переход примера 1 требовал меньше време¬ ни, поэтому граничного экстремума с начальной точкой В также нет. Остается внутренний экстремум при варьировании начальной точки. Общее условие трансверсальности (ЛАх — НА1)["=0 = 0 при¬ водит к двум условиям А?Дж? + А2Дж£ = О, Нк = 0. Будем использовать первое равенство. Поскольку Д ж"-}-Дж?> = то А£ — А" = 0. Вспоминаем решение (3.58) для лагранжевых мно¬ жителей Ai = — acos(£ -h a), А2 = asin(t -fa), a = const > 0, a = const и решение (3.62) для фазовых переменных xi = 6sin(£ -f /3) 4- и, ж2 = bcos(t + /3), b = const > 0, /3 = const. Для первого участка и = — 1, для второго и = 1. Теперь рассматриваемое условие трансверсальности принимает вид a cos а 4- a sin a = 0. Примем а = — Момент времени т точки переключения управления удовлетворяет условию Аг(т) = 0 или sin(r 4- a) = 0, т = Подставим значения координат начальной точки ж" = &i sin/3i — 1, Ж2 = b\ cos/3i в уравнения связи. Тогда получим 6i(cos/3i 4-sin/3i) = 3. (3.74) Координаты конечной точки (62 = 1) будут ж? = sin(tK 4- /32) 4-1 = 0, ж$ = cos(tK 4- /32) = 0. Отсюда tK 4- /32 — §7Г. Сопряжение фазовых переменных в угловой точке происходит в нижнем квадранте по формулам Ж1 (т) = bi sin(r 4- /З1) - 1 = sin(r 4- fe) 4-1 > 0, 7Г хг(г) = bi cos(r + Pi) = cos(r + /?2) < 0, т = —. 172
Первое из этих соотношений запишем в виде /rj п —&i(cos/?i 4- sin /?i) = sin(— 4 £2) + 2. Примем во внимание соотношение (3.74) sin(^ + /?2) = ->/2 - 2 = 0.1213, arcsin(^ 4 /?2) = 0.047г. Исходя из неположительности cos( J 4- /?г)» принимаем Т + /?2 = — 0, 047Г, /?2 = 7Г — 0.297Г. 4 Минимальное время tK = ^тг - 02 = £ + 0.29ТГ = 0.79тг. Эта величина меньше полученного в примере 1 значения 0.87т, хотя и мало отличается. Для определения начальной точки используем уравнение связи (3.74) и второе условие сопряжения bi(cos/?i +sin/?i) = 3, fei(cos/?i — sin/?i) = v^2cos(^ -f 7Г — 0,297t) = = — \/2cos(0,047r) = -1.4142-0,9925 и -1.4. Отсюда &icos/?i = 0.8, 6isin/?i = 2.2. Поэтому получим х" = 1.2, =0.8. Начальная точка оптимальной траектории располагается немного ниже точки С. Пример 3. В задаче оптимального по быстродействию приве¬ дения точки из заданного начального положения по прямой в нача¬ ло координат под действием существенно превосходящей все дру¬ гие ограниченной управляющей силы приходим к модели с уравне¬ нием X ~ и, — 1 < и < 1. Введем фазовые переменные х\ = х, х2 = х и получим выражение функции Гамильтона Я = —14- Aix2 4- A2u. Составим уравнения Эйлера-Лагранжа и получим их решения вида Ai = ci, А2 = С2 — cyt, ci = const, C2 = const. 173
Оптимальная траектория состоит из участков движения с управлением и = 1 или и — — 1 и не может иметь более одной точки переключения управления. Фазовые траектории представим в виде семейства парабол, а именно: при и = 1 х\ = \х22 + аи при и = — 1 х\ = — \х22 + /?, где а и (3 - постоянные. Движение изображающей точки по первым параболам происходит снизу вверх, а по вторым - сверху вниз. Линие|й переключения управления будет соединение полу ветвей указанных парабол, проходящих через начало координат: полувет- ви параболы х\ — —\х22 в верхнем левом квадранте и полуветви параболы х\ = \х22 в нижнем правом квадранте. Если начальная точка лежит на линии переключения управле¬ ния, то и = 1 при х\н > 0, а при xiH < 0 имеем и = — 1. Движение происходит по линии переключения управления в сторону начала координат. Если начальная точка лежит выше линии переключе¬ ния управления, то движение происходит с управлением и = — 1 до пересечения фазовой траектории линии переключения, а затем по этой линии с управлением и = 1 в начало координат. Если на¬ чальная точка лежит ниже линии переключения, то движение про¬ исходит с управлением и = 1 до пересечения фазовой траектории линии переключения, а затем по линии переключения с управлени¬ ем и = —1 в начало координат. 3.3.6. Оптимальное демпфирование колебаний, близких к линейным При упрощении уравнения (3.49) примем вместо уравнения (3.50) усложненную математическую модель колебаний маятника по типу уравнения (3.33) (р = -и2(ср - 4- и\ - и2. (3.75) и На управляющие функции u\(t) и u2(t) пусть наложено ограниче¬ ние (3.52). Граничные условия принимаются в виде (3.52). Полагая Х\ = tp, х2 — ф составим функцию Н для энергетически оптималь¬ ной задачи с функционалом (3.54) Я = -(их 4- и2) -f Х\х2 + Х2(-ш2Х1 -Ь ^ш2х^ + щ - и2). С) 174
Запишем уравнения Эйлера-Лагранжа \\ = ы2(1 —-х\)\2, Л2 = - А]. (3.70) Будем исходить из теории упрощенного асимптотического пред¬ ставления управляемых процессов (см. разд. 2.2.0). Исходное* уран пение (3.76) отвечает движению, в котором членами более высокого порядка, чем <р3, пренебрегаем. Фактически пренебрегаем членами порядка </?5 и выше. Примем в качестве малого параметра к над рат наибольшего отклонения маятника </?о на первом размахе, т.е. ji = (ip0)2. Можно считать, что в исходном уравнении движения х\ + uj2 sin Х\ = щ — и2 опущены члены порядка /г2. Согласно теореме (см. разд. 2.2.6) по¬ лучим ошибку того же порядка /х2 для минимизируемого функцио¬ нала, если опустим в первом уравнении системы (3.76) второй член н скобке, который имеет порядок fi. Следовательно, можно при¬ нять уравнения Эйлера-Лагранжа (3.57) с решением (3.58). Полу¬ чим представление (3.60) для точек переключения управлений. Как указывалось выше (см. разд. 3.3.4), теоретически энерге¬ тически оптимальный режим не существует, так как требует бес¬ конечно большого времени. Вместе с тем при выборе пусть боль¬ шого, но ограниченного времени управляемого процесса, т.е. сколь угодно малой, но конечной величины а в формуле (3.60) для точек переключения управлений, может быть построен режим с энерге¬ тическим расходом, близким к предельному. Выберем о так, чтобы sin о был по крайней мере порядка малости /х1>/3, что соответству¬ ет порядку |<0°|2/3. Как следует из рис. 18 и 19, угол отклонения маятника в зоне управляемого движения не будет превосходить ве¬ личины |<£>°|sin<7, имеющей порядок величины (</?0)5/3. Поэтому в указанной зоне tp3 уравнения движения (3.76) будет иметь порядок или //5/2, и может быть опущен. Величина |<£>°|5 уже опущена при замене sin<p двумя первыми членами разложения в степенной ряд. Тем самым обоснована в рассматриваемых условиях возмож¬ ность представления фазовых траекторий на участках управляемо¬ го движения в виде окружностей с центрами О г и 02 (см. рис. 18 п 19). Величины управляющих воздействий и точки переключения управлений те же, что и на рис. 17. 175
На участках неуправляемого движения принимаем приближен¬ ное представление вида (3.40) xi = хi совШ, П = и(1 — Jq(x(i)2)i где х? — величина (положительная или отрицательная) наибольше¬ го отклонения маятника на рассматриваемом размахе. При этом х2 = х\ = —fix? sinfi£. Отвечающий этому размаху участок фазовой траектории в осях шх 1, Х2 будет дугой эллипса с центром в точке О и полуосями cjx®, fix?. Фазовый портрет имеет вид рис. 19, на котором дуги окружностей вне сектора 2а заменяются дугами эллипсов с умень¬ шающимися эксцентриситетами е = ^|х°|\/32 — (х0)2 от размаха к размаху. Управляемое движение будет колебательным с умень¬ шающейся величиной и временем полуразмаха. Для задачи оптимального быстродействия удобно рассматри¬ вать одно управление и = щ — и2 при выполнении ограничения —v<u<v. Для упрощения вычислений принимаем вместо t вели¬ чину art, вместо и величину ии)~2. Имеем дифференциальное урав¬ нение управляемого движения xi = —xi 4- ^х3 4- и, —vuj~2 < u(t) < voj~2. (3.77) 6 Приближенное решение уравнения (3.77) получим по методу мно¬ гомерной линеаризации. Как указывалось выше, при сохранении членов порядка /х = (ц>0)2 в минимизируемом функционале функ¬ цию Н, уравнения Эйлера-Лагранжа и условия трансверсально¬ сти можно принимать в том же виде, что и для линейной задачи разд. 3.3.5. Поэтому на оптимальной по быстродействию траекто¬ рии происходит чередование управлений и = vu~2 и и = —иш~2 через промежутки времени, равные при новой независимой пере¬ менной величине 7г. Вместо уравнений (3.35) будем иметь 1 — Х2, Х2 — —XI 4- — Хб 4* U, Хз = 2X4, о Х4 = XiU Хз 4- Х5, ±5 = 2х2и — 2X4, #6 = 3X7, Х7 = X3U -- XG 4- 2х8, Х8 = 2X4U — 2X7 + Хд, Хд = 3X5*16 — 3xg. (3.78) 176
Поскольку оптимальная траектория состоит из дуг, на которых ве¬ личина и не изменяется, то (3.78) представляет собой линейную неоднородную систему девяти дифференциальных уравнений с по¬ стоянными коэффициентами. Характеристическое уравнение запи¬ сывается в виде равенства нулю определителя -А 1 0 0 0 0 0 0 0 -1 -А 0 0 0 1/6 0 0 0 0 0 -А 2 0 0 0 0 0 0 0 -1 -А 1 0 0 0 0 0 2 и 0 -2 -А 0 0 0 0 0 0 0 0 0 -А 3 0 0 0 0 и 0 0 -1 -А 2 0 0 0 0 2 и 0 0 -2 -А 1 0 0 0 0 Зи 0 0 -3 -А Обозначим через Dn-i определитель, полученный после вычер¬ кивания первых i строчек и столбцов. Выполним разложение по элементам столбцов Dn = (А2 + 1)£)п_2 -Ь -и.Е\ + ХиЕ2, -А 2 0 0 0 -А 2 0 0 0 0 -2 -А 0 0 -1 -А 1 0 0 = и 0 0 2 0 , Е2 — и 0 0 2 0 0 2и 0 -А 1 0 2 и 0 -А 1 0 0 3 и -3 -А 0 0 3 и -3 -А Dn -2 - —A Dn -з - 2АД, -5> Dr i-З = (А2 + 2)Dn. —5> Пп-5 = Дп -5 = (А2 + 1)(А2 ! + 9), Дг-2 = :-А(А2 + 1)(А2 + 4)(А2 + ! Вычисления показывают Ег = —6Au(A2 - 1), Е2 = 6u(2A2 + 3). В результате получим Дг = —АДА), /(А) = (А2 + 1)2(А2 + 4)(А2 + 9) - Зп2(ЗА2 + 7). Возможны следующие варианты слабого управления: vu>~2 по¬ рядка fi = (ip0)2 и vuj~2 порядка дз |(^°|. В первом варианте при 177
решении уравнения /(А) слагаемым, содержащим и2, можно прене¬ бречь и характеристические числа принять такими же, как и у сво¬ бодного колебания маятника (см. разд. 3.2.5). Во втором варианте полагаем и2 = i/2u>~4 = a/i, где a = const >0, a = 0(1). Поскольку при fi = О уравнение ДА) = 0 имеет два кратных корня А? = ±г, то л=±г = 0. Поэтому согласно теореме (см. разд. 2.2.6) решение уравнения /(А) = 0 может быть построено в виде разложения по дробным степеням /х. Заметим, что решение в виде разложения по целым степеням /i в окрестности А? = ±г не существует. Полагаем А = А0 + /хг А' -Ь /iA", тогда 72 = 4/хА°2А'2 + 4/J А°А'(А'2 + 2А°А") + 0(ц2). А2 = А°2 + 7, 7 = 2/х 5 А0 А' + ц(Х’2 + 2А°А"), ,°2А'2 + 4< Будем иметь /(Ai) = 7i(7i + И71 + 24) — 9/xa7i — 12/ia = 0. При¬ равняем нулю отдельно члены порядка /х и /х3/2 8А?2А',2 - a = 0, А; 2 + 24А?А" = 0. Отсюда получим \/ 2 1 \0 \// ^ Л \ // . ^ Л • Ai “ _8 11 ~ 192 ’ 1 “ 192 Имеем четыре корня, порождаемые А? = ±г, вида {*± - m»ai’ Далее запишем /(А2) = (-3 + 72)27г(5 + 72) - 9да72 + 15/ia = 0, А2 = 0, Аз = ±^а*> /(Аз) = (-8 + 7з)27з(-5 + 73) - Эдсгуз + 60/ю: = 0, A3 = 0, A3 = 178
А2 = ±г(2 + Аз = ±г(3 - Частное решение системы (3.78) можно получить в виде Cl - и{1 - ^U2)-1 » и + iu3, С2 = о, С3 = и2( 1 - in2)-1 и и2, О О о С4 = СЪ = О, С6 = и3(1 - \и2)-' « и3, С7 = С8 = С9 = 0. О Запишем общее решение системы (3.78) для х\ = (р V? = и 4- \иг -j- So + А\ sincjit 4- В\ cosu>i£ 4- А\ sina>it 4- В\ cosu>i£4- 6 4-А2 sin ш21 4- B2 cos u>2t 4- A3 sin uj3t 4- B3 cos изЬ, (3.79) где принято обозначение 1 i i 1 _ lii 1 и 1 = 14 p=/i2a2 — — m, u>i = l —ii2 a2 — — m, 2л/2 192P 2л/2 192p ’ ол 1 7 1 V2 = 2 4- —/xa, ^3 = 3- — /xa. Для определения постоянных Bo, А\, В\, А\, В\, А2, B2j A3 и В3 дополнительно к (3.79) выпишем выражения производных до вось¬ мого порядка ф = u>i(A\ coscjit — В\ sincji^) +и)\(А\ cosa;^ — B\ sinu;i£)4- 4-a;2(^2 cosa>21 — B2 sina^O 4- &з{Аз COSCJ31 — B3 smurf), ф — u>i(—Ai sintJitf — B\ cosfjit) 4- 0Ji(—Ai sinu>i£ — B\ cosd>i£)4- 4-cJ2(—^2 sina^ — B2 cosu)2t) 4- cj|(—Л3 sina^t — B3 собшзЬ), (pW = u>*(—Ai cosu)\t 4- B\ sincJit) 4- cosd>it 4- B\ sin<I>i£)4- +uj*(-A2 cosu>2t 4- B2 sina>2*) + ^з(~^з cosu>3t 4- B3 sinu^), ^(4) = ? ^(5) = ^(6) = ^ ^(7) = ^(8) = t I 1а основании уравнения (3.77) запишем с точностью до членов тре¬ тьего порядка относительно ipo и фо значения этих производных в начальной точке </>(0) = (ро, ф(0) = фо, <£(0) = -<Ро + ^<Ро + и1 <Р^(0) = (“1 + 2^0^°’ 179
2 1 V>(4)(0) = Vo-^4>l+4>o4>l~u+-u(pl, <^(5)(0) = (1-Ьр1+ч>1+Ъшро)фо, 25 ¥>(6)(0) = -<fio + -g-^o ~ HyWo + u- 7uipl + 6u<Po + 3uVo> 69 <pm(0) = (-1 + —<fo - 1100 - 48iupo + 15и2)фо, tpW(0) = щ - <pl + 102щф1 -u+ — 81ифо -63u2ip0 + 15u3. o Z Приравнивание правых частей полученных соотношений при t = О позволяет получить девять линейных уравнений для указанных вы¬ ше девяти произвольных постоянных. За ipo принимаем наибольшее отклонение маятника на данном размахе, тогда фо = 0. Уравнения для определения постоянных Ai,Ai,A2 и Аз оказываются одно¬ родными. Ввиду невырожденности соответствующей системы эти постоянные будут нулевыми. Для определения оставшихся пяти по¬ стоянных получим уравнения Во 4- D 4- В2 4- Вз = (ро — и — — и3, о 2С 4- (1 4- —fia)D 4- ы%В2 4- W3B3 = ipo — и — g^o3» 35 2 1 4С 4- (14- — iiot)D 4-CJ2S2 +W3B3 = (ро — и — (3-80) 177 25 6С + (1 + —na)D + и>%В2 + W3B3 — tpo-u - —<ро3 + 7u(pl - 3 и2<р0, Уо о 83 &С 4" (1 4“ —fJiCkjD 4" ^2-^2 4- и%В3 = 104 о 165 о ^2 Фо~и д-<А) + -~2~и<ро - 63и*(р0 4- 15*г, где введены обозначения D = (Bl + Bl), (3.81) а четные степени wi и й)\ вычислены с точностью до величин по¬ рядка /х. Выделим в уравнениях (3.80) члены порядка = |у>°| В'о 4- D' 4- В'2 4- В'3 = (ipo — u)fi 2, 180
2С' + D' + 22В'2 + 32В'3 = (^о - и)ц~ 5, 4С" + D' + 24В£ + 3*В'3 = (<^0 - «)#*" *, 6С" + £>' + 26В^ + 36В'3 = {>ро - и)ц-i, 8С" -Ь D' + 2^ В2 Ч" 3**В3 = (</?о — ^ • Полученная система имеет решение В'0 = С' = О, D' = (v?o - «)#*"*, ^2 = К = 0. Правые части (3.80) не содержат членов порядка /i. Поэтому для I неизвестных величин порядка /i имеем однородные уравнения с от¬ личным от нуля определителем. Отсюда находим С" = D" = В% = В'ъ = 0. Приравняем в уравнениях (3.80) члены порядка д3/2 В'” + D'" + В2 + В'” = -iuV1, 6 2С'" + D'" + 22В'" + 32ВГ = - l±aD', 4с'" + D"> + 2<в'" + ЗХ' = (-■+ \и<р2)»~* - (3.82) + £>"' + 26В'" + 36В"' = (~ f ^ + 7-uv?o - 3«Vo)M“1 - ^ccD', SC'" + D'" + 2* В 2 + 38Вз" = . 104 з 165 2 2 ,r Зч з 83 = (—g-V’o + ~2~U(Po ~ 63uVo + 15tt )/* 2 - —a£>. Второе уравнение системы (3.82) умножаем на 2, 3, 4 и вычитаем из последующих уравнений + 8В1'' + 63В'" = (-i^g + l-Uvl)n-i - 1 «/У, 11 Q -2D'" + Ь2В% + 702Вз" = (-—^ + 7uy?g - Ъи2щ)ц~% - -aD', О и 1 3£>/"+240В2/+6525Вз" = (~34<^+ —и<^-63и2<р0+15ы3)м_ *-3aD'. 181
При исключении Dm учтем вычисленное ранее значение D' и вы¬ ражения Z?2 = \ABf2 , Вз = цъВ'ъ 36(В2 + 16Вз) = -3<Д) + 6u</?0 - ^и2<ро + ^U3, 129 33 72(ЗВ2 4- 88В3) = -33<£о + 81гир% ^-^Vo 4- ‘у^3- Отсюда получим 1 2 13 9 П ^ 1 , w 11 ч Вг = -j2«V>o + эо« Vo ~ Ши = ~й<4* ~ U)(ip° ~ 15 1 , 1 2 29 о 3 , Вз = -^о + 64W»-l9S“ *» + 630“' = * ' w «2 о„.,„ , ^ Л13\ Затем определим 3 ... 1/3 or 2 811 о ^99 оч М = 192(^° ~ 35иу,° + ~q~u W ~ ~q~u )• Из второго уравнения системы (3.82) имеем л з 1 з 3 2 121 2 97 о = -Г» + 8“*’»- 96“^“%“ Поэтому можно записать 1 97 С = -—(</>о - u)(<pl - 2и<ро + y^w2), 1 811 799 £> = <А)-«+—(<^о- 35 utpl + —u Vo - -g"“3)- (3-83) На основании первого уравнения системы (3.82) _ 1/2 1^ 7 9\ 1/ ч/ 7 ч #o = ^(<£0 - —и<ро 4- ~и ) = -Ц<ро - ^)(^о “ ^^). Выражение (3.79) с помощью (3.81) приведем к виду ip = Aq 4- ^D(cosu)\t 4- coso>i£) 4- y/2fi~ *a~%C(cosu\t — cosu\t)-\- 182
-f £?2 cosu^ 4 B3 cos изt, (3.84) где 1 / 2 Ю О 2ч Ао = и 4- -Щу>о ~ ~^и{Ро + 3w )• Выполним в формуле (3.84) тригонометрические преобразования л . г> ^1+^1. . (р = Ао + D cos —— 1 cos 1— z z _ r— _i _i _ . tjj 4Cb\ . cjj —<Di —2v2/i 2a 2Csm ism 1-f- z z +B2 cosu>2t 4- B3 cos с^з£. (3.85) Отсюда получим ip = Ао + D((1 - JquH2) cos(1 - ^u2)t - CD~lts\n(\ - -!^u2)t) + +B2 cos 21 4- B3 cos 31. Примем во внимание обозначения (3.83) ip — Aq — ^t(<Po — U)u2t2 cos 14- D cos Sit 4 B2 cos 214 B3 cos 31, (3.86) 16 Q==1~ JqVo + \uVo - ^u2. (3.87) Продифференцируем (3.86) ф = "(<^o — u)u2tcost 4 ~~z(}Po — u)u2t2sint— / 8 16 —DSI sin Sit - 2B2 sin 21 — ЗВ3 sin 3t. (3.88) Если сохранить в (3.86)-(3.88) только члены порядка /х1/2, то придем к формуле (3.62) при /? = §. Если допустить в (3.86)-(3.88) управление и равным нулю, получим представление движения, от¬ нимающего формуле (3.38). Оптимальное по быстродействию движение в рассматриваемом приближении осуществляется по формулам (3.86)-(3.88) при по- < ;к‘Довательном чередовании управляющих функций v и — v через промежутки времени, равные 7г, и с уменьшающейся величиной \ipo\ пт размаха к размаху. Отличие от линейной задачи (см. разд. 3.3.5) 183
заключается в нестационарности центров даже однонаправленных движений, в изменении частоты колебания от размаха к размаху. На основное колебание с амплитудой порядка ipo налагаются коле¬ бания удвоенной и утроенной частот с амплитудой порядка За¬ метим, что рассматриваемое приближенное решение мало отлича¬ ется от решения линейной задачи. Как следует из рис. 21, значение сро, при котором фо = 0, кроме заключительных полуокружностей, будет иметь знак, противоположный знаку и. Поэтому в формуле (3.87) третье слагаемое отрицательное и угловая частота Q умень¬ шается от размаха к размаху. Покажем, что в отличие от линейной задачи последние дуги фазовой траектории, по которым изображающая точка попадает в начало координат, не имеют другой общей точки с линией абсцисс. Предполагая обратное, положим в формуле (3.88) ф = 0, t —• 7г О = — \(ipo — u)u27TCOS7T = ^(<^0 — и)и2ТГ. 8 8 Это равенство может выполняться только при и = tpo. Коэффи¬ циенты В2,Вз и С обращаются в нуль при и = ipq. Поэтому для такого управления из формулы (3.84) в силу (3.83) следует Ч> = <Ро + -у>о(1-cosi), ф = —sin t. Фазовая траектория представляет собой окружность радиуса с центром в точке (<ро + £V?o>0)- Хотя через промежуток времени, равный 7г, происходит чередование управления, такое движение не может отвечать задаче демпфирования. Этот пример показывает возможность использования релейного управления для обеспече¬ ния колебаний около смещенного положения равновесия. Можно получить параметрическое представление двух заклю¬ чительных витков линии переключения, по которым только и мо¬ жет изображающая точка войти в начало координат. Для этого при¬ мем начало координат за начальное положение, затем в формуле (3.85) фо = 0 и t заменим на —t. Будем иметь 3 , „ 799 о 1 2 2х 11 о 3 , <р = и+-и' ~'u(l~Y^u 1 )cost~ 180W cos2£+ — ^cos34, (3.89) 1 799 1 11 9 ф = cos t -f iz(l — 2|52ц3 ~~ 16 S*n ^ 90 ^ 640 ^ вШ ^ 184
При t = 7Г получим lp=2u~ +5б^и3' ^ = ~Т8и3' ^3'90^ Теперь в (3.89) заменим t на 7г — t 3 3 / 799 о 1 2/ j\2\ ip = u + -u3 + Ti^l - “ 16м ^ ^ ) C0S 11 Q 3 Q ——u cos2t — ——ucos3£. (3.9J) 180 640 v ' Формула (3.91) дает представление двух заключительных витков линии переключения при и = ±v. Начальная точка каждого из >тих витков определяется формулой (3.16). Опустив в (3.86) и (3.88) члены с множителями шр§, и2, полу¬ чим общее решение уравнения управляемого движения для первого варианта (и порядка ) <р = и + {уо - и + v’o) «^К1 - Yf-Vo)1 - 3^2^°°S3*’ Ф = —{'Po - « + - ^Vo)sin(l - jQ<Po)t + ^V§sin3t. Поскольку величина у^т, может быть отнесена к первому порядку малости, то можно ограничиться выражением <p = u + (tp0- и) cos(l - JqVo)*, Ф = -{Vo ~ u)(l - sin(l “ ^Po)L ()тсюда приходим к уравнению для фазовых траекторий {ip - и)2 + (1 - ^4>1)ф2 = (<Ро ~ и)2, которое отвечает эллипсам с центральной точкой (Jiz/, 0) и полуося¬ ми a.= \ipQ\ + v, b = {\ipQ\ + v){l-—ipl). 185
Если ipo существенно превосходит слабое управление величины v, то возможна следующая схема построения оптимальных по быст¬ родействию траекторий. Сначала исиользуем первый вариант. От размаха к размаху величина |у?о| уменьшается. Когда она становит¬ ся порядка v, переходим ко второму варианту. 3.4. Оптимальное управление с ограничением 3.4.1. Оптимальное гашение углового движения Если для создания управляющих моментов используется доста¬ точно мощная реактивная установка, то можно пренебречь грави¬ тационным моментом. В этом случае приходим к рассмотренной выше простейшей стандартной задаче с уравнениями движения ±1 = Ж2, х2 — у>) \и\ < v, v = const > 0, (3.92) где х\ — угол отклонения от равновесного положения; и — момент управляющих сил, деленный на момент инерции спутника. При отсутствии ограничения на величины х\ и х2 в задаче опти¬ мального быстродействия траектория имеет одну точку переключе¬ ния управления. На фазовом портрете линия переключения состоит 1 2 1 2 из двух полупарабол: Х\ = ~—х2 во второй и х\ — ^~х2 в четвер¬ той четвертях. Из начального состояния (ж",^), располагаемого выше линии переключения, движение фазовой точки осуществля¬ ется по параболе Xi = -^X2 + Di, Di = х" + {x2f > 0 (3.93) до пересечения с линией переключения управлений, а затем по вто¬ рой ветви линии переключения в начало координат. Если началь¬ ная точка располагается ниже линии переключения, то движение изображающей точки происходит сначала по параболе Xi = ^х2 + D2, D2 = х" - (xj)2 < о, (3.94) а затем по первой ветви линии переключения в начало координат. 186
Пусть по технологическим условиям работы системы угол от¬ клонения Х\ не должен по абсолютной величине превышать значе¬ ния х\ > 0. Имеем ограничение f(x\) = |xi| — х\ < 0. Наибольшем* отклонение по координате х\ достигается при х2 = 0. Поэтому по¬ лучаем условие для допустимых начальных возмущений: 1)\ * :г], Поскольку на качестве работы космической системы сказывают¬ ся не только отклонения от равновесного состояния по углу х\, но и по угловой скорости х2 = Х\, то возможно ограничение с внешней границей где а = const >0, Ь = const > 0 - полуоси граничного эллипса. В этом случае оптимальная по быстродействию траектория демп¬ фирования может содержать участок движения фазовой точки по эллипсу (3.95). По схеме оптимизации (см. разд. 2.1.7) учет фазового ограниче¬ ния осуществляется добавлением к минимизируемому функциона¬ лу интеграла от граничной кривой по неотрицательной мере, сосре¬ доточенной на множестве точек границы. Если интегральная тра¬ ектория должна удовлетворять фазовому ограничению f(x,t) < 0, то в подынтегральный член функционала задачи оптимизации бу¬ дет входить дополнительное слагаемое в виде произведения /(х, t) на обобщенную функцию (S(t — ti) — S(t — t2))A(t) + Х^(£), где 6 — функция Дирака; х = &(t — h) — 0(t — t2)> A{t) € С1, ti — момент выхода на удерживающее ограничение; t2 — момент схода с этого ограничения. Здесь для функций Хевисайда приняты обозначения В работе [17] было получено уточнение уравнений Эйлера- Лагранжа для лагранжевых множителей А(£), а также условий Вейерштрасса—Эрдмана и условий трансверсальности для этих множителей и функции Гамильтона в угловых точках, расположен¬ ных на ограничении. При движении по границе фазового ограничения к функции Лагранжа задачи оптимизации без ограничения добавляется сла¬ гаемое в виде произведения неизвестной функции времени (допол- х\ + к 2х2 = а2, к = a lb = const > 0, (3.95) нителыюго лагранжева множителя в виде Ао = Л(£)) на левую 187
часть уравнения границы ограничения. Переходя к функции Га¬ мильтона, для участка движения по граничному эллипсу (3.95) за¬ пишем Я = -1 + \\Х2 4- Л2и - Хо(х1 4- к~2х2), дН дН Aj = — -- 2А01ь А2 = --х— = -Ai + 2А0АГ2£2- (3.96) их1 UX2 В условиях рассматриваемой задачи движению с максимальным угловым ускорением отвечает параболическая траектория. Поэто¬ му скольжение по удерживающему ограничению формулы (3.95) может осуществляться только в программируемом режиме, для ко¬ торого ЗН 1 _ = Аз = 0, Ао = -AifcV1. (3.97) На основании (3.92) и (3.95) для этого движения имеем ±1 = х2 = ±к(а2 - x\)l/2, xi = iasinr, х2 = ±ак cos т, т = kt 4- С\, С\ = const. С помощью (3.97) и (3.98) проинтегрируем уравнение Эйлера- Лагранжа для Ai из (3.96) Ai = AifctgT, Ai = ±C2cosr, C2 = const. (3.99) Определим управление на дуге граничного эллипса и = х 2 = ak2sinr = —к2х\. (3.100) В силу (3.92) и (3.100) должно выполняться соотношение ак2 = а~хЬ2 < и. (3.101) Для точки пересечения параболы (3.93) с граничным эллипсом (3.95) находим ^x\v~l = D\ — i/A'Г2 4- (a2 4- v2k~A — 2uk~2D\)1^2. (3.102) 188
Условием пересечения будет D\ < а. Соответственно для точки пересечения параболы (3.94) с граничным элипсом (3.95) = —£>2 — vk~~2 4- (а2 4 v2k~A -4 2vk~2D2)1^2. (3.103) Условием пересечения при выполнении (3.103) D2 > —а. При удовлетворении заданной технологической связи на фазо¬ вые переменные в задаче оптимального приведения в начало коор¬ динат возможны три класса траекторий: а) интегральная траектория не выходит на ограничение; б) соприкосновение с ограничением в отдельной точке; в) наличие участка движения по ограничению. Управляемая траектория может включать участок движения но ограничению, если в условиях рассматриваемой задачи допустимое управление способно создать силу, равную «градиентной» состав¬ ляющей реакции ограничения как механической связи. Фазовый портрет траектории, оптимальной по быстродействию, в случаях а) и б) имеет такой же вид, как и при отсутствии ограничения. Ес¬ ли оптимальная траектория включает участок движения по дуге граничного эллипса (3.95), т.е. случай в), то имеются две точки ] переключения управления. Первая отвечает входу на ограничение, вторая — выходу с этого ограничения. Вторая точка является пере¬ сечением граничного эллипса с линией переключения управлений задачи оптимального быстродействия в отсутствии ограничения. 11о этой линии изображающая точка фазовой траектории входит в начало координат. При решении поставленной задачи оптимального выбора тра¬ ектории с закрепленными концевыми состояниями нет необходи¬ мости проводить анализ множителей Лагранжа на основе условий I кейерштрасса-Эрдмана и трансверсальности. Эти условия при уче¬ те фазового ограничения (3.95) содержат указанный выше допол¬ нительный множитель Лагранжа Л(£) такой, что Л(£) = Ао. По фор¬ мулам (3.97)-(3.99) А0 = jrka~lC2 = \ba~2C2 = const. Z Z Поэтому A(t) = Аоt 4- Е, Е = const. Это соотношение позволяет получить замкнутую систему необходимых условий экстремума при усложнении постановки задачи. 189
Рассмотрим числовой пример. Примем v = 1, ж” = 2, ж2 = 1, g £н = 0, / = х\ 4- -ж2 — 9 < 0, т. е. к = \/2/3, а — 3. Условие (3.101) выполняется. Начальная точка лежит выше линии переключения управления и удовлетворяет ограничению / < 0. По формуле (3.93) D\ = 2.5. Поскольку D\ < 3, то в соответствии с условием выпол¬ нения равенства (3.102) происходит пересечение оптимальной по быстродействию траектории с графиком граничного эллипса. По формулам (3.95) и (3.102) определим координаты точки этого пе¬ ресечения: х\ — 1.9, Х2 = — \/iT2 « —1.1. По формуле ж2 = ж2 — t находим соответствующий момент времени t\ = 2.1. По формуле (3.98), в которой следует выбрать знё.к минус, находим постоян¬ ную С\. Координаты второй точки переключения управления получим из совместного решения уравнений х\ = -ж2, -х\ 4- -ж2 = 1 в виде Zi £ х\ = 0.9, Х2 = —\/ТЯ. На основании формулы (3.98) определим соответствующий момент времени £2 k(t2 — ti) = — arcsin -j- arcsin = 0.38, a a t2 — ti = 0.8, t2 = 2.9. Общее время выполнения перехода из точки ж" = 2, ж2 = 1 в начало координат при наличии указанного ограничения в услов¬ ных единицах £2 4- ^2(^2)| = 4.24. Для сравнения вычислим вре¬ мя перехода в режиме оптимального быстродействия при отсут¬ ствии ограничения. Определим ж2 в точке пересечения парабол: х\ = — -ж2 4- 2.5, х\ = -ж2. Получим ж2 = 2.5, ж2 = —1.58. Искомое время равно сумме жн и удвоенной величине |ж2|, т.е. 4.16. Наличие ограничения привело к увеличению времени маневра. Перейдем к исследованию энергетически оптимального реше¬ ния. Фазовый портрет решения энергетически оптимальной зада- pt К чи с минимизируемым функционалом Ф = / \u\dt и уравнения¬ ми движения (3.92) разделяется линией переключения, состоящей из верхней ветви параболы х\ = ~2^х2 и нижней ветви парабо- 1 2 ^ лы х\ = 2~^2> а также осыо х\ на классы эквивалентности. Два 190
класса включают траектории с начальными точками на указан¬ ных ветвях парабол. Оптимальным будет движение по этим вет¬ вям в начало координат — для первой с управлением и = — v и для второй с управлением и = и. Два следующих класса образу¬ ют траектории с начальными точками соответственно в областях: ниже первой ветви параболы и выше отрицательного направлении оси х\ и другой класс — ниже положительного направления оси х и второй ветвыо линии переключения. Здесь энергетически оп ти¬ мальным будет движение с выключенным управлением от началь¬ ной точки до пересечения с линией переключения управления и вход по ней в начало координат. Еще два класса составляют тра¬ ектории с начальными точками на оси Xi и в следующих обла¬ стях: выше первой ветви линии переключения и положительного направления оси xi, а также ниже второй ветви линии переклю¬ чения и отрицательного направления оси х\. Для этих областей в строгом смысле энергетически оптимальный режим не существу¬ ет, так как требует бесконечно большого времени. Предполагают существование е — оптимального решения. При этом имеют в ви¬ ду следующее. Если к предельной величине расхода, отвечающего режиму с бесконечным временем, добавить сколь угодно малую по¬ ложительную величину, то будет существовать конечная во време¬ ни траектория, удовлетворяющая необходимым условиям экстре¬ мума. Для траекторий, начинающихся в указанных областях, мо¬ жет быть поставлена энергетически оптимальная задача с фа¬ говым ограничением рассматриваемого выше типа и с ограни¬ чением на время движения tK — tH < t* > 0. Рассмотрим предварительно решение задачи только с ограничением по вре¬ мени. Пусть х1{ > 0, х*2 > 0, tn = 0, v — 1. Фазовая траек¬ тория состоит из трех дуг. Движение начинается с управлением // — — 1 до некоторого момента времени t\, для которого Z21 = *2 - *1 < 0, ХЦ = Х'[ + X2t\ ~ ~t\. (’ этого момента времени управление выключается до момента при котором траектория пересекает нижнюю ветвь линии переклю¬ чения. Затем изображающая точка фазовой траектории по этой ли¬ нии входит в начало координат с управлением и — 1. 191
Неотрицательные неизвестные; ноли чины t\ и t2 удовлетворяют соотношениям Х22 = Ж21, х12 — ^11 + X2l{t'2 — ^l)> ^12 = 2^227 t* = t2 + \X22\ = t2 + ti - X2. Отсюда получим ti — 2 (t* + x2 ” 0» ^2 = 2 (^* 4- ^*2 + (3.104) где f = (t* - xg)2 - 4x" - 2(xJ|)2. Заметим, что для задачи оптимального быстродействия min tK = х2 + у^4х" + 2(х£)2. Поскольку £* выбирается большим, чем min£K, то подкоренное вы¬ ражение в формуле (3.104) положительно. Для энергетически оптимальной задачи с фазовым ограничени¬ ем при движении по граничному эллипсу (3.95) запишем Я = —|u| -f Ai£2 + A2U - Ao(xf -I- к~2х\). Уравнения Эйлера—Лагранжа имеют вид (3.96). Поэтому сохраня¬ ются формулы (3.99)—(3.101). Вместо формулы (3.97) получим дН 1 — = Т1 + А2 = 0, А2 = ±1, А0 = -Aifc2X2'• Обозначим через t'x момент времени схода изображающей точ¬ ки с граничного эллипса. Фазовые координаты этого состояния по формуле (3.98) х[ = ±asin(kt\ 4-Ci), х'2 = ±akcos(kt\ + Ci), (3.105) signx'i = — sign £2- Постоянная Ci и момент ti выхода на фазовое ограничение опреде¬ ляются точно так же, как и в рассматриваемой выше задаче быст¬ родействия. Начиная с момента времени t\, фазовая точка переме¬ щается по прямой, параллельной оси xi, до пересечения с линией 192
переключения в момент времени t2. Движение заканчивается пе¬ ремещением по указанной линии в начало координат, на что по¬ требуется промежуток времени t* — t2 = \х'2\. Будут выполняться соотношения Х\2 = х\ +x'2(t2 - t\) = ^22 = Х2. (3.106) На основании соотношений (3.105) и (3.106) можно получить трансцендентное уравнение, определяющее t\. Для иллюстрации обратимся к рассмотренному выше числово¬ му примеру. Определим время маневра t*, которое отвечает энер¬ гетически оптимальной траектории, имеющей только одну общую точку с граничным эллипсом. После соприкосновения с фазовым ограничением управление (и = —1) выключается, и движение происходит по прямой, параллельной оси х\у в обратную сторо¬ ну этой оси до выхода на нижнюю ветвь кривой переключения. Будем иметь t[ = t\, х\2 = ^х2 = ^(1.1)2 = 0.605. Посколь¬ ку ^12 — х\ = x2(t2 — ti), то t2 = 3.28. Окончательно получим t* — t2 + \х2\ = 4.38. Приходим к следующему выводу. Если t* > 4.38, то энергети¬ чески оптимальная траектория располагается внутри граничного эллипса (3.95). При t* < 4.38 имеем участок движения по гранич¬ ному эллипсу. Число переключений равно трем. 3.4.2. Оптимальное демпфирование колебаний при фазовом ограничении Рассмотрим задачу оптимального гашения вращательного дви¬ жения ориентированного спутника при действии гравитационного момента. Без з'чета фазового ограничения упрощенная математиче¬ ская модель оптимального быстродействия для этой задачи изучена » разд. 3.3.5. Пусть величина управляемого момента имеет тот же порядок, что и момент гравитационных сил. В этом случае приходим к стан¬ дартной задаче с уравнениями движения xi = х2, х2 = — со2Х\ -f-1£, | и |< v, v = const > 0, (3.107) 193
где х\ — угол отклонения от равновесного положения; и — момент управляющих сил, деленный на момент инерции тела 1у относи¬ тельно оси у, ортогональной к плоскости орбиты. Принято также обозначение ш2 = 3сс>0 {1Х - Iz)Iyl = const > О, где u>o = const > 0 — орбитальная угловая скорость обращения цен¬ тра масс рассматриваемого кругового спутника; 1Х и /2 — моменты инерции кругового спутника. В положении относительного равно¬ весия ось z направлена по радиус-вектору центра масс, проведенно¬ му из центра планеты, ось х направлена трансверсально в сторону движения. Наличие фазового ограничения приводит к усложнению схемы оптимизации. Для учета влияния фазового ограничения к миними¬ зируемому функционалу добавляется слагаемое, равное интегралу от левой части уравнения граничной кривой по неотрицательной мере, сосредоточенной в точках этой границы. Поэтому на участ¬ ках оптимальной траектории, не выходящих на граничную кривую, функция Лагранжа и уравнения необходимых условий экстремума имеют такой же вид, как и при отсутствии ограничения. Введение дополнительного слагаемого в подынтегральную функцию миними¬ зируемого функционала приводит к изменению уравнений Эйлера- Лагранжа, условий Вейерштрасса-Эрдмана и трансверсальности в точках, принадлежащих границе ограничения. Приведем выражение условий Вейерштрасса-Эрдмана (2.49), (2.50) в момент времени t\ входа экстремали на границу связи f{x, х) < 0 и в момент £2 выхода ее со связи: д/ Ai(£i + 0) — Xi(t\ — 0) — A(t\) ^ 11 Ai(t2 + 0) - Ai(t2 - 0) = -A(t2)f^- UXi (3.108) i = l,2, t2 где Ai и Л2 — лагранжевы множители или сопряженные пере¬ менные, удовлетворяющие уравнениям Эйлера-Лагранжа; A(t) — непрерывно дифференцируемый дополнительный лагранжев мно¬ житель. При отсутствии ограничения решение задачи хорошо иллюстри¬ руется (см. рис. 21) фазовым портретом в осях их\ и х2. Фазовые 194
траектории состоят из последовательного соединения полуокруж¬ ностей с центрами 0i(vu~l,0) и 02(—На начальном и заключительном участках угловые дуги могут быть короче полу¬ окружностей. Причем заключительная дуга принадлежит одной из указанных полуокружностей с радиусом vuj~x, так как только по таким дугам можно войти в начало координат. Пусть по технологическим условиям выполняемой работы угол отклонения х\ по абсолютной величине не должен превышать зна¬ чения х* > 0. Имеем ограничение /(хi) = х2 - (xj)2 < 0. (3.109) Как показывают уравнения (3.107), движение по границе xi = ±х] ограничения (3.109) может выполняться только в импульсном ре¬ жиме при v = оо. Поэтому при конечном v фазовые траектории не пересекают границу ограничения, а могут лишь соприкасаться. При t\ = t2 по формуле (3.108) получим Л = 0, т.е. сохраняется непрерывность лагранжевых множителей. И в этой задаче линия переключения управлений состоит, как и при отсутствии ограни¬ чения (3.109), из гирлянды полуокружностей радиусов Наи¬ большее отклонение по величине х\ также достигается при х2 = 0. Исходя из структуры фазовых траекторий задачи демпфирова¬ ния без фазового ограничения, можно указать область расположе¬ ния фазовых траекторий, не выходящих за границу ограничения (3.109). Она определяется двумя прямыми: х\ = — rrj, х\ = х\ и дугами М2Мз и М4М1 двух окружностей радиусом р = vw~l -\-их\. Выше линии переключения задачи без ограничения - дугой окруж¬ ности с центром 02{—^а;-1,0) и ниже указанной линии переключе¬ ния - дугой окружности с центром 0\(vu>~1,0). Соответствующие точки имеют координаты Mxi-uxl 0), М2{-их\,х*2), М3(сл;*;,0), М4(а^,-^), х2 = yj {их\ + VU)~1)2 — (и)X\ — vu~1)2. Ограничению (3.109) удовлетворяет та и только та фазовая тра¬ ектория, начальная точка которой (шх*,х2) принадлежит области М1 М2М3М4. В качестве второго варианта ограничения примем f(x\,х2) = ш2х\аГ2 4- х2Ь~2 - 1 < 0, а = const > 0, b = const > 0. (3.110) 195
При движении по граничному эллипсу (3.110) в задаче опти¬ мального быстродействия функция Гамильтона Н = -14- Aix2 4- А2(—4- и) - А0/, (3.111) где Ао = Л — подлежащая определению неизвестная функция вре¬ мени. Неопределенные множители Ai и А2 удовлетворяют уравне¬ ниям Эйлера-Лагранжа ; 9Я 2ч 2 _2 Ai = — —— = uj А2 4- 2Аоuj cl £1, дх\ • ЭН ол 2 А2 — — о— = —Ai 4- 2Ао Ъ Х2- 0X2 Движение с граничными значениями управления и = ±и осу¬ ществляется по дугам окружностей с центрами (ii/a;-1,0). Поэто¬ му граничный эллипс (3.110) не может быть фазовой траекторией с граничными управлениями. Приходим к выводу: движение по ду¬ ге граничного эллипса является программируемым с выполнением соотношений ВН 1 = Л2 = О, Ао = -A ifcV1. (3.113) Для определения управления, обеспечивающего движение по гра¬ нице ограничения (3.110), продифференцируем уравнение эллипса в силу дифференциальных уравнений (3.107) uj2a~2x 1X2 4- b~2X2{—uJ2x 1 4- и) = 0. При х2 ф 0 получим и = и2х i(l — Ь2а~2). (3.114) После подстановки (3.114) в (3.107) можно выполнить интегри¬ рование уравнений движения точки х\ = A sin(Qt 4- о:), Х2 = Af2cos(fi£ -fa), А = const > 0, а = const, (3.115) где принято обозначение Q — иЪа~1. 196 (3.112)
По формулам (3.112), (3.113), (3.115) Ai = Aifitg (Ш + а), Ai — jDcos 1(Ш + а), D — const. Из условий трансверсальности для задачи быстродейс твия Ик 0. Поскольку ограничение (3.110), как и уравнения движения (3.107) не содержит явно время, то функция Н будет постоянной и па ос¬ новании соотношений (3.108) сохраняет непрерывность при входе фазовой траектории на связь и при выходе с нее. Отсюда // - 0 на всей траектории. Поэтому при движении по границе ограничения (3.110) на основании (3.111) и (3.113) имеем \\х2 = 1. С помощью формулы (3.115) устанавливаем D = (Ж2)”1. После подстановки Ai в представление (3.113) получим А0 = \-Ь2А~2ОГ2 cos-2(fIt -1-а), Л = ^-b2A~2Cl~3tg (fit + a) + const. Если ввести эксцентриситет эллипса е = (а2 — 62)1/2о-1, то вы¬ ражение (3.114) для управления на граничном эллипсе можно за¬ писать в виде и = и2е2х\. При заданном эксцентриситете фазовая траектория не может выходить на ограничение (3.110) при значе¬ нии и)Х\, превосходящем по модулю величину ujx\ = vuj~le~2. (3.116) Поэтому можно считать, что эксцентриситет е выделяет на множе¬ стве ограничений вида (3.110) класс эквивалентности, для которого предельно допустимое отклонение абсолютной величины координа¬ ты х\ определяется формулой (3.116). Если а < шх\, то в любой точке граничного эллипса абсолют¬ ная величина управления (3.114) не будет превышать допустимого значения v. Пусть а > шх\. Для координаты х\ точки пересечения граничного эллипса (3.110) и примыкающих к началу координат полуокружностей линии переключения управления (шх\ *^-1)2 -f х\ = Ль>“2 получим квадратное уравнение cj2e2x2 2vx\ + b2 == 0. 197
Представляющий интерес корень этого уравнения запишем с помо¬ щью (3.116) в виде ljxi = ±и)х\(\ — y/l - b2uj2e2u~2). (3.117) Второй корень указанного квадратного уравнения, у которого пе¬ ред радикалом должен быть знак плюс, опускаем, так как для него U)|xi| > U)X\. Как показывает формула (3.117), возможны следующие вари¬ анты: 1) если Ь = уто граничный эллипс касается указанных полуокружностей в точках, для которых абсцисса и>х\ удовлетво¬ ряет равенству шх\ = zbc^xj; 2) при b < vu>~le~l может быть участок движения по гранично¬ му эллипсу от точки с первой фазовой координатой =fcjx\ до точки с координатой мх\ того же знака. Из этого состояния до начала ко¬ ординат изображающая фазовая точка перемещается по одной из примыкающих к началу координат полуокружностей. Указанный участок входит в состав оптимальной траектории, если предыду¬ щая дуга фазовой полуокружности пересекает граничный эллипс на интервале, для которого |xi| < |xi| < х\\ 3) пусть b > vu)~le~l, тогда примыкающие к началу коорди¬ нат полуокружности линии переключения управлений оказывают¬ ся внутри граничного эллипса. Найдем наименьшее расстояние р от центров 0\ и 02 дуг фазовых полуокружностей до эллипса р2 = (их\ vu)~1)2 + х\ = (их\ ии~1)2 + b2 — Q2x2, —a < ux\ < a. С помощью формулы (3.116) получим = w2e2(Xl т Минимум достигается при \х\\ = rrj. Это означает, что существует предельная фазовая траектория, которая на участке дуги окруж¬ ности радиусом ,0шт = \J(UX\ - VU)~1)2 + Ь2 - Q2(x\)2 198
касается изнутри граничного эллипса. Любая фазовая полуокруж¬ ность радиусом р < ртin лежит внутри области (3.110) и не выхо¬ дит на ее границу. Если р > Pmim то выполнить ограничение (3.110) невозможно, так как или фазовая полуокружность располагается inie ограничения (3.110), или в точке ее пересечения с граничным эллипсом для перехода на эту границу требуется создать управля¬ ющее воздействие, превосходящее допустимую величину /л Рассмотрим числовой пример. Примем uj 1, и - 1. В классе 4 эквивалентности ограничений с эксцентриситетом с - для кото 5 рого х\ = 25/16 = 1.56, укажем четыре варианта ограничения: 1) а = 6 — 2; 2) а — 2.5, 6 = 1.5; 1о 3) а = 2, Ь = 1.2; 4) а= 6=1. О Вариантам 1 и 2 отвечает касание предельных фазовых полуокруж¬ ностей радиусов р\ = 1.85 и /92 = 1.27 с соответствующими эллип¬ сами в точках Ni(x\ — 1.77) и N2(x\ — 1.14). В вариантах 3 и 4 про¬ исходит пересечение граничных эллипсов с примыкающей справа к началу координат полуокружностью линии переключения управле¬ ний в точках 7Уз(1.1—0.825) и N4(0.625 — 0.346). Поэтому, например, в варианте 3 изображающая точка фазовой траектории, пересекаю¬ щей эллипс гс2/4+25x1/36 = 1 в точке с координатой х\ Е (1.1,1.56], после этого пересечения перемещается по указанному граничному эллипсу до точки N3, а затем по дуге полуокружности единичного радиуса с центром 0i(l,0) в начало координат. Подобный вывод относится и к варианту 4 с заменой числовых значений. Выше ука¬ заны точки касания и пересечения в нижней правой четверти. Ана¬ логичный вывод относится к фазовым траекториям в левой верхней четверти. При этом у координат следует изменить знаки на обрат¬ ные. Исследование задачи построения энергетически оптимальной интегральной траектории для динамической системы с уравнения¬ ми (3.107) без фазового ограничения проведено в разд. 3.3.4. Ока¬ залось удобным рассматривать два скалярных управления u\(t) и u2(t) таких, что 0 < щ < и, v — const > 0, i = 1,2. Минимизируе¬ мый функционал принимает вид 199
а в дифференциальном уравнении (3.107) вместо и следует поста¬ вить и\ —U2- Функция Гамильтона энергетически оптимальной за¬ дачи при движении по ограничению Н = —U\ — U2 4 Х\Х2 + A2(— lc>2Xi 4- U\ — U2) — Ао/. Уравнения Эйлера-Лагранжа имеют вид (3.112). Запишем условия для точек переключения управлений и осуществления программи¬ руемого режима ?— = -1 + (—l)i-1A2 = 0, г = 1,2. 0 U<i Выражение для лагранжева множителя Ао имеет вид (3.113). Решение задачи гашения колебаний по критерию энергетиче¬ ских затрат является б-оптимальным. Чем короче время включе¬ ния двигателя на периоде колебаний, тем ближе общий расход к предельной минимальной величине, отвечающей бесконечному вре¬ мени демпфирования. В разд. 3.3.4 построен фазовый портрет для задачи минимизации расхода при ограничении на время. Линиями переключения управлений без учета фазового ограничения являют¬ ся две прямые линии, наклоненные к оси %2 под некоторым углом сг, который определяется заданной величиной отрезка времени демп¬ фирования и начальными условиями. Вне угла (—сг, ст) управления выключаются и фазовыми траекториями будут дуги окружностей с центром в начале координат. Внутри указанного угла фазовыми траекториями являются дуги окружностей с теми же центрами 0\ и 02. Ограничению (3.109) и в рассматриваемой задаче минимизации энергетического расхода удовлетворяют лишь те фазовые траекто¬ рии, начальные точки которых принадлежат области М1М2М3М4. Можно сделать следующие выводы. Если (ых”)2 4 (я^)2 ^ (^i)2» то оптимальный режим управления (см. разд. 3.3.4) удовлетворяет ограничению (3.109). Пусть 62 = (сОХ})2 - (и)хг{)2 — (х2)2 > 0, далее х" > 0, х2 < 0 или х" <0, х2 >0. Тогда длительность первого участка управляемого 200
движения не короче 2а;-1 а\, где о\ = arcsin и становится 'гочно равной этой величине, если при этом > ^gcri. Начи¬ ная с выхода изображающей точки на ось их\ режим управления будет тот же, что и в 3.3.4. Общее требование состоит в том, чтобы после первого участка управляемого движения фазовая траекто¬ рия выходила на ось шх\ при |xi| < х\. Кроме того, указанный участок должен отвечать отрезку времени, для которого величина \х21 имеет наибольшее значение. Пусть решается задача минимизации энергетического расх<ь да с ограничением вида (3.110). Поскольку формула (3.114) дли программируемого управления при движении по дуге эллипса со¬ храняется, то по-прежнему класс ограничений (3.110) определи¬ лся эксцентриситетом граничного эллипса. Существенное значе¬ ние и в энергетически оптимальной задаче имеют точки с абс¬ циссой (3.117) возможного пересечения граничного эллипса и примыкающих к началу координат полуокружностей с центрами Oi(—vuj~1,Q), 02(W-110) и радиусом //cj”1, так как по дугам этих полуокружностей изображающая точ^ может войти в начало ко¬ ординат. В отличие от задачи оптимального быстродействия точка нхода траектории на граничный эллипс определяется в результа¬ те совместного решения уравнения эллипса и уравнения окруж¬ ности с центром в начале координат, если для указанной точки \ихг\ < и>х\, где х\ определяется по-прежнему формулой (3.116). При b < vu)~le~l все выводы о поведении оптимальной траектории переносятся и на рассматриваемую задачу. Если b > vw~~le~1i то любая траектория, пересекающая ось х\ при значении |xi| < х*, удовлетворяет ограничению (3.110). 3.4.3. Управление колебаниями маятника с подвижной точкой подвеса Колебательное движение маятника (оптимизируется груз А, подвешенный на нерастяжимом тросе) в вертикальной плоскости (х% г/) с углом отклонения от вертикали (рис. 23). Точка подвеса В может перемещаться вдоль горизонтальной оси х со скоростью v(t), при которой \v(t)\ ^ ^ о ^ < v' 201
X + Рис. 23 Требуется за кратчайшее время tK за счет выбора управления v(t) из начального положения х(0),£н =0, при котором (р{ 0) = у>(0) = v(0) = 0, перевести систему в конечное положение (p(tK) = ф{гк) = 0, v(tK) = v, x(tK) = s + х(0). Механически это означает, что из состояния покоя за минимальное время следует разогнать груз и плавно его опустить на подвижный транспортер. В общем случае система имеет две степени свободы с конфигура¬ ционными переменными х = хв и ip. Пусть Мит — массы каретки (крана) и груза; / — длина троса; д — ускорение притяжения Земли. Запишем выражение для кинетической и потенциальной энергий Т = П = mgl( 1 — cos ip). Отсюда запишем ха = хв — I sirup, у а — I cosip, ха = хв — 1ф cosy?, у а = —1ф sin ip, VA — %В + 12ф2 — 21хвф COSip, Т = i(M + m)x2 -f -m/2</92 — 1хф cosip. z z Пусть скорость каретки пропорциональна скорости вращения электромотора привода, тогда можно рассматривать колебательное 202
движение точки А с одной степенью свободы (угол <р) и с ограни¬ чением х = v(t). Предполагая величины (риф малыми, сохраним в функции Лагранжа L = Т — П квадратичные члены относительно этих переменных L = i(M + m)v2(t) + ~т12ф2 — \:mgl(p2 — mlv(t)y. £ Zt £ Составим уравнение Лагранжа II рода по координате (р ф + ш2(р = и’(£)/-1, со = y/gl~l. Это уравнение дополняется уравнениями х = v(t), г> = w(£). Переходя к безразмерным переменным по формулам cot = £, LUX = VX, V = vv, W = VUJW, ip = 1лид~1ф, utx = tx, a = vu>g~1a и опуская значок получим стандартную математическую мо¬ дель [19] задачи: ф -f (р = w, х = v, v = гу, а) —1 < v(t) <1, б) 0 < v(t) < 1, <р(0) — <^(0) — ^(0) = и(0) = 0, У>(*к) = к) = 0» З'(^к) = 5, w(4K) = 1. В работе [19] вводится вспомогательная переменная и решаются для управляемой системы с уравнениями ф = -ф + г», ф = (р, (3.118) при краевых условиях <р(0) = ф(0) = 0, <p(tK) = 0, ф(гк) = 1, x(tK) = s + я(0), (3.119) следующие три типовые задачи: 1) принимается условие на управление а), величина s допуска¬ ется произвольной; 203
2) отличается от первой задачи выбором ограничения 6) на управление; 3) отличается от первой задачи дополнительным условием s = 0. Заметим, что система (3.118) равносильна уравнению ф -Ь ф — v, (3.120) а ограничения (3.119) условию ф(0) = ф(0) = 0, ф(рк) = 1, J v dt = 5. (3.121) о Получим те же условия экстремальности, что и в разд. 3.3.4. Фа¬ зовыми траекториями будут дуги окружностей с центрами в точ¬ ках 0i(l,0) и Ог(—1,0). По сравнению с классической задачей (см. разд. 3.3.4) оптимального по быстродействию приведения в начало координат ф = 0, ф = 0 для рассматриваемой задачи оптимально¬ го разгона линии переключения управлений на фазовом портрете будут получаться как зеркальное отражение относительно оси ф. Вывод следует из простого рассуждения. Из начала координат с управлением v = 1 или v = — 1 в задаче быстродействия фазовая точка может уходить по дугам полуокружностей I и II (рис. 24), по¬ скольку движение фазовой точки должно выполняться по часовой стрелке (см. разд. 3.2.4). Как и при демпфировании, промежуточ¬ ные участки (исключая первый и последний) в задаче разгона без дополнительных ограничений составляют полуокружности с цен¬ трами 0\ и 02. На рис. 24 изображена фазовая картинка решения задачи 1. Войти в точку 01 фазовая точка может только по дуге окруж¬ ности с центром О2 и радиусом, равным двум. Выход из точки О 204
происходит по дуге окружности I, так как начинать движение по дуге окружности II явно неоптимально. Можно записать Фах + (Фм - !)2 = 1. Ф'у1, + + I)2 = 4. После вычитания получим фдх = |. Из рис. 24 непосредственно находим фАх = 1 — COS^I, Фах = 2 COS£2 — 1- Отсюда имеем 1 7 cos£i = -, cost2 = ~, ti = 1.32, to = 0.505, tK = t\ 4t2 = 1.825. 4 8 В задаче 2 нижняя граница управления равна нулю, поэтому фазовые траектории в виде дуг окружностей с центром 02 заменя¬ ются на дуги окружностей с центром в начале координат О. Фазо- rn >1Й портрет представлен на рис. 25. Для рассматриваемой задачи имеем Фа2 + Фа2 = 1. Фа2 + (Фа2 - I)2 = 1. После вычитания находим Фа2 = Из рис. 25 следует Фа2 = 1 - COS^i, Фа2 = cos t2. ()тсюда ti = t2 = tK = t\ -f t2 = |7г. Задача 3 содержит ограничение f*K vdt = 0. Следует ввести до¬ полнительный лагранжев множитель Ао и минимизировать функ¬ ционал /0*к(1 4- Аоv)dt. Функция Гамильтона задачи оптимизации Н = -1 - Xqv + Aiф 4- А2(-ф 4 v). 205
Точки переключения управления удовлетворяют уравнению —Ао + А2 =0. При этом Ai и А2 имеют то же представление в виде формулы (3.58). Промежуточные участки теперь не будут полу¬ окружностями. Решение задачи 1 показывает, что при двух участ¬ ках требуемое ограничение не выполняется. Траектория из трех участков должна начинаться дугой полу¬ окружности II, затем имеем дугу окружности с центром 0\ и неко¬ торым радиусом R. Заканчивается оптимальная фазовая траекто¬ рия в точке 01 по дуге окружности с центром 02. Согласно рис. 26 R2 = + (1 — Фв3)2- Точка Вз принадлежит также дуге О1В3. Поэтому Фв3 + (V’Bn + I)2 = 4, ф% з + ф2в3 = 2фв3 +2, R2 = —4фв3 + 4. Поскольку фв3 = 2cos<з — 1, то R2 = 8(1— сов<з), или R = 4sin(^<3). Условие выполнения ограничения <1 4-<з = <2- Отсюда следует, что <к = <1 + <2 + <з = 2<2. Теперь запишем cosq2 = (1 - i>B3)R~l = sin(^t3), а2 = ^ - у, sinai = Я-1 sinti, ai = t2 — а2, 7Г 1 1 (3.122) 4sin(£2 - - + 2*3)sin(-t3) = sintu — 2sin(f2 4- <з) + 2sint2 = sinti. Продолжим решение cosaj = (1 - фАз = cos ti - 1, 4cos(i2 - ^ + ^3)sin(i*3) = 2 - cosii, (3.123) — 2 cos(t2 +13) + 2 cos t2 = 2 — cos t\. 206
Уравнения (3.122) и (3.123) вместе с соотношением t\ + £3 = £2 определяют неизвестные £ь£2,£з* Умножим (3.122) на cos(£2 + ^з)? (3.123) на — sin(£2 + £3) и сложим результаты —2sin(£2 + £3) + 2sin£3 = — sin 2t2. (3.124) Соответственно умножая (3.122) навт^+^з)? (3.123) насоБ^ + ^з)) придем к уравнению -2cos(£2 4- £3) + 2соб£з = 2 - cos2£2. (3.125) Возведем обе части уравнений (3.124), (3.125) в квадрат и сложим 3 — 8 cos £2 = —4 cos 2£2, cos2£2 - cos £2-^=0. 8 По условию задачи выбираем отрицательный корень cos £2 = = -0.1124. Отсюда t2 = 1.683, £к = 2t2 = 3.366. Уравнение (3.124) приведем к виду cos(£3 + ^£2) = cos £2 cos т*. Поэтому получим £3 = arccos(cos£2 cos у) — у, £3 = 0.804. Определим длительность первого участка t\ = — t2 — £3 = £2 — £3, t\ = 0.879. Рассмотрим решение задач 1-3 с возможным фазовым ограниче- mкем. Пусть требуется выполнить технологическое условие на угол отклонения троса крана от вертикали |<^| < а = const > 0. При дви¬ жении по границе ф = ±а из (3.118) следует, что ф = ±а, ф = v(t). < )тсюдаги(£) = v = ±а, v(t) = vl±a(t—tl)1 где vl = ф(Ь1) - скорость к.чретки в момент времени tl входа фазовой точки на границу огра¬ ничения. Режим движения по границе будет программируемым. Он i.-iкончится в момент времени £2 схода точки с границы, при этом г' - г;1 ± a(t2 — tl) = ф(Ь2). И задачах 1 и 2, если Фах и фд2 превосходят величину а, фа- юиоо ограничение выполняется автоматически. Пусть фд1 или фд2 207
меньше а, тогда соответствующие фазовые портреты вместо одной точки переключения А\ или А2 имеют по две точки переключения Bi,C\ или В2,С2, для которых фвх = Фсх = о, Фв2 = Фс2 = а• Участки фазовой траектории В\С\ и В2С2 являются отрезками прямой линии, параллельной оси ф и отстоящей от нее на рассто¬ яние а. Эти прямолинейные отрезки стягиваются теми же дугами окружностей, что и на рис. 24 и 25. В задаче 1 имеем 1 n qi о 1 / % 1 h = t = arcsin а?, £3 = tK—t = arcsin—, t2 = t —£ = (фс\ —фвх)<х • z Из соотношений (Фв1 - l)2 + a2 = 1, (V’Ci + l)2 + a2 = 4 определяем Фс, - Фв1 = (4 - a2)* - (1 - a2)* - 2. Поэтому получим tK = arcsin a 4 ((4 — a2)* -4 (1 — а2)з — 2)аГ1 4- arcsin —. Z Наименьшее значение tK достигается при значении а = |\/15, ко¬ торое равно VMi> т. е. отвечает решению задачи без фазового огра¬ ничения. В задаче 2 ti = tl = £3 = £к — t2 = arcsin а, фв2 = 1 — (1 — с*2) ^, Фо? - (1 ~ «2)*> £2 = £2 - tl = (2(1 - a2)^ - l)of_1. Время движения £к = 2 arcsin a 4- £2 и достигает минимум при а = — что отвечает решению задачи без фазового ограничения. Решение задачи 3 с фазовым ограничением осложняется, так как требуется выполнить условие 5 = 0, т.е. возвращение ка¬ ретки в исходное положение. Легко проверить, что \Фа3\ < Фвз (рис. 26). Если фв2 < а, то фазовое ограничение выполняется ав¬ томатически. Возможны два следующих варианта, для которых учет фазового ограничения приводит к изменению решения зада¬ чи: \Фаз\ < а < Фвз и {ФазI < а. В первом случае вместо точки 208
переключения В3 будут две точки переключения С на дуге окруж¬ ности некоторого радиуса R\ с центром в 0\ и D на дуге В$0\. Ординаты точек С и D равны а. Величина J?i, а следовательно и фс, определяются из условия s = 0. При перемещении карет¬ ки на прямолинейном участке CD имеем scd = ФЫз + \а2^ где h = (Фо — Фс)&~1 ~ время движения на этом участке. Во втором варианте дополнительно вместо точки переключения А3 будут дно точки переключения Е на дуге окружности некоторого радиуса Ri с центром в 0\ и D на дуге О As. Радиус R2, а следовательно и абсциссы точек С и Е, можно определить из условия s — 0.
Глава 4 Приведение задачи механики управляемого движения к интегрированию уравнения в частных производных 4.1. Поле экстремалей 4.1.1. Управление с обратной связью Рассмотрим управления как функции фазовых переменных и времени u(x,t). Такой режим называют управлением с обратной связью. Соответственно режим, для которого управления являют¬ ся явными функциями t, называют управлением по разомкнутому контуру. Существует представление, что управляющие функции Uj(xi,t) формируются с помощью измерения фазовых координат Xi й создания соответствующего сигнала на управляющие орга¬ ны. Если контур управляющего сигнала разомкнут, то приходится формировать управления в виде функций только времени. Метод Лагранжа варьирования условного функционала (см. гл. 2) рас¬ пространяется на случай управления с обратной связью, поскольку можно в расширенном пространстве допустимых траекторий неза¬ висимо варьировать х, t и функции u(x,t)y аналогично тому, как независимо друг от друга варьировались величины t и Uj(t). Про¬ извольность выбора функциональной зависимости управлений и от х и t обеспечивает независимость слабых вариаций 6и и 6ху а также Аи, Ах и At. На экстремальных траекториях должны выполняться уравне¬ ния Эйлера-Лагранжа в прежнем смысле, когда при написании этих уравнений управления считаются явными функциями време¬ ни. Покажем, что при составлении уравнений Эйлера-Лагранжа 210
Л = — управления можно рассматривать в виде функций фазо¬ вых переменных и времени. Функция Гамильтона по формуле (2.13) Н = —Fq(x, и(х, t), t) -f ЛF(x, и(х, <), t). Имеем выражение ая__а?ь ,dF дН ди дх дх ^ дх ди дх' Поскольку = 0 при Uji < Uj < Uj2, а при движении по границе; управления = 0, то за исключением угловых точек, в которых уравнения Эйлера-Лагранжа не рассматриваются, получим как и ранее dH__dFb xdF дх дх ^ дх' Заметим, что для линейной зависимости Н от разрывных управле¬ ний и в точках переключения управлений ^ = 0. При управлении с обратной связью сохраняется формула (2.14) вариации функцио¬ нала действия при слабых вариациях величин х, А, и, t, а также при слабых и сильных вариациях х. Сохраняется также формула (2.18) для полной вариации условного функционала, которая приводит к заключению о максимальности Н по управлениям на основе введе¬ ния игольчатых вариаций. Управляющие функции uj(xi, t) являю гея компонентами вектор- функции, заданной на точках расширенного фазового простран¬ ства. Поэтому можно говорить о векторном поле управлений. Почему возникает необходимость рассматривать поле управле¬ ний? Пусть решается задача оптимизации по некоторому крите¬ рию для управляемого процесса м(£),х(£), переводящего механи¬ ческую систему из заданного начального состояния хн при t = tH на некоторое конечное, так называемое терминальное многообразие при t = tK. Пусть построена экстремальная траектория, решающая >ту задачу. Тогда любая точка х(т), лежащая непосредственно на >той траектории между начальной и конечной точками, т.е. при < г < £к, может быть взята в качестве новой начальной точ¬ ки. Экстремальным управлением будет в случая неотрицательной подынтегральной функции Fo (ж,и,£) оставшаяся часть ранее по¬ строенного экстремального управления, которая отвечает отрезку 211
времени т < t < tK. Два вектора управления, как первоначаль¬ ного, так и укороченного, будут совпадать на этом отрезке. Если второй вектор управления является сужением первого на отрезке т < t < tK, свойство называют принципом динамического програм¬ мирования. Если же требуется построить экстремальный процесс управле¬ ния и(£),х(£), переводящий систему из точки, не лежащей на по¬ строенной ранее траектории, то надо решать новую задачу опти¬ мизации при выборе в качестве начального состояния этой новой точки. Вектор управления функционально может отличаться от предыдущего. При таком рассмотрении приходим к функциональ¬ ной зависимости u(xll,tH,t), т.е. к полю управлений, заданных на точках пространства начальных данных. Если начальный момент tH считать закрепленным и выразить xli с помощью решения уравнений движения через текущие значе¬ ния фазовых переменных х, то приходим к управлению с обратной связью. Задачу отыскания оптимального управления с обратной связью часто называют задачей оптимального синтеза, поскольку строится закон управления, охватывающий многообразие началь¬ ных данных. Ввиду единственности решения уравнений движения можно го¬ ворить в этом случае о поле экстремалей в расширенном фа¬ зовом пространстве i2n+1. Решение уравнений Эйлера-Лагранжа при высказанных ранее предположениях также будет единствен¬ ным. Поэтому можно рассматривать так называемое расширенное поле экстремалей х и А в ДпхДпх Д1, определяемое начальными значениями х11, Ан,£н. 4.1.2. Варьирование в поле расширенных экстремалей Согласно методу Лагранжа условный функционал варьируется в широком пространстве допустимых траекторий при независимом изменении фазовых координат, лагранжевых множителей, времени и управлений. Рассмотрим в пространстве R2n+1 интегральные траектории си¬ стемы уравнений движения и уравнений Эйлера-Лагранжа, ко¬ торые отвечают некоторым кусочно-непрерывным управлениям u(x,t) € U С Rr. Множество U является г-мерным сегментом вида 212
(2.2). Начальные значения хн,Абудем произвольно изменять. Указанные интегральные кривые мы называем расширенными экс¬ тремалями в отличие от собственно экстремалей, под которыми понимаются удовлетворяющие необходимым условиям экстремума интегральные траектории уравнений движения в Лп+1. При пере¬ ходе от одной расширенной экстремали к бесконечно близкой, кро¬ ме фазовых переменных х*,г = 1,п управлений Uj,j = 1, г и гра¬ ничных значений х*11, tH, х*к, tK, могут варьироваться и лагранжсвы множители Xi. Для простоты изложения расширенную экстремаль часто будем называть просто экстремалью. Построим множество экстремалей, управления для которых равны выбранным допустимым величинам Uj(x,t), отвечающим некоторой опорной экстремали АВ. Начальные условия будем из¬ менять непрерывно. Для этого введем диффеоморфизм класса С1, определяемый выбранной формулой t = £(/х,т), ^ > 0, где /х — некоторый параметр; т — новая независимая переменная. Проведем через начальную точку А опорной экстремали контур С^(т„) х" = (/?"(/*)> К = = t{n, т„). (4.1) Формулы (4.1) дают значения переменных в точке А при /х = ц,\. Контур С^(т„) принадлежит гиперплоскости г = т„ пространства /£271+2 переменных Xi, Ак, t, т. Обозначим через А1 точку контура (4.1) при /х = /Х2 и проведем через точки этого контура при fi\ < ji < /х2 расширенные экстрема¬ ли с управлениями uj(x,t). Проведем также через конечную точку В опорной экстремали гиперплоскость т = тк, где тк определяет¬ ся из условия tK = £(/xi,rK). Точки пересечения указанных экстре¬ малей с гиперплоскостью тк дадут контур С2(тк), определяемый формулами х = x(ipH(n),t»{n,TH),t), А = (4.2) t = t(ix,rK), /х€[мьм2]- Точку этого контура при /х = fi2 обозначим через В*. Напишем выражение полной вариации функционала действия, т. е. интеграла от функции Лагранжа, на рассматриваемом множе¬ стве экстремалей. Интеграл вычисляется на экстремали от точки па контуре С*(ти) в момент времени t\ до точки на контуре С2(тк) в 213
момент времени <2- Поскольку на экстремалях выполняются урав¬ нения движения и уравнения Эйлера Лагранжа, а управления из¬ меняются непрерывно и, в частности, управления можно и вовсе не варьировать, будем иметь на основании формулы (2.14) *2 Д J Ldt = (АД* - #(х, А, и, t)Atj^. (4.3) tl В формуле (4.3) функция Я вычисляется на экстремалях рассмат¬ риваемого множества в точках их пересечения с граничными кри¬ выми (4.1) и (4.2). Левая часть (4.3) представляет собой для близких экстрема¬ лей разность функционалов действия, вычисляемых на этих экс¬ тремалях. Выберем на рассматриваемом множестве экстремалей дискретный набор экстремалей и проведем суммирование форму¬ лы (4.3) для этого набора. В левой части полученного равенства будет с точностью до величин второго порядка стоять разность функционалов действия для крайних экстремалей А'В' и АВ, спра¬ ва — соответствующие суммы Римана, вычисляемые на граничных кривых. Если расстояние между соседними экстремалями устрем¬ лять к нулю, то в правой части получим криволинейные интегралы. В результате интегрирования (суммирования) выражений (4.3) по экстремалям между контурами С*(тн) и С2(тк) приходим к соот¬ ношению J L'dt- J Ldt = J АДх — HAt — J АДх - HAt. (4.4) А'В' АВ СД(гк) С,’(т„) Обратим внимание, что согласно формулам (2.12) и (2.13) имеем L — Хх — Я, поэтому Ldt = Xdx — Нdt. Формула (4.4) принимает вид j\dx~Hdt+ J XAx-HAt = J \Ax-HAt+ J Xdx-Hdt. ЛВ СЦ TK) C*(r„) A'B' (4.5) Таким образом, интеграл действия S = f Xdx — H dt не зависит от пути интегрирования в поле расширенных экстремалей и его можно рассматривать как функцию состояния. 214
/Замечание. Если контур C*(t„) выбрать замкнутым , т.е. ViHbn) = ^г"(д l) = ^гм(м 2), <(М1,Т„) = <(//2,Тн), то экстремаль Л'1?' совпадает с АВ, а контур С2(тк) также будет замкнутым. По формуле (4.5) получим Когда множество расширенных экстремалей обладает относи¬ тельным интегральным инвариантом первого порядка, слово «от¬ носительный» обозначает замкнутость контура интегрирования. Можно, в частности, время не варьировать, тогда относитель¬ ным интегральным инвариантом будет ьудут также отвечать неуправляемой гамильтоновой системе, по¬ скольку для нее имеет место формула типа (4.3). Кроме опорной экстремали АВ будем рассматривать любую другую экстремаль А!В”, управление на которой u'(x,t) в общем «•.мучае не может быть получено с помощью непрерывного измене¬ ния управления и(х, t) опорной экстремали. Можно провести кон¬ тур С*(тп) вида (4.1), соединяющий точки А и А' при соответству¬ ющих значениях параметра /xi и /х2- Проведем через точки экс¬ тремали А!Вп экстремали рассматриваемого в разд. 4.1.2 поля с управлениями и(х, t) до пересечения с гиперплоскостью т = тк. Точки пересечения дадут контур С3(тк) при < /а < Мз и точ¬ ке В" пусть отвечает значение параметра /^3. Схема расположения •кстремалей и контуров представлена на рис. 27. ХАх — HAt = const. (4.(>) СЦт») СЦтк) (4.7) СЧм) Интегральные инварианты (4.6) и (4.7) вида 4.1.3. Конечное приращение функционала в поле экстремалей
Как и в разд. 4.1.2, в результате интегрирования выражений (4.3) по экстремалям между контуром С*(тн) и экстремалью АВ", с одной стороны, и контурами С2(тк) и С^(тк)} с другой стороны, приходим к соотношению J V dt — J Ldt = J ХАх — Н(х, A, u, t) At+ А' В" ,и АВ СД(гк) .+ J ХАх — Н(х, А, и, t) At — J ХАх — Н(х, А, и, t) At— С*{тк) СЦтп) - J X'Ax' -H(x',X',ti,t)At, (4.8) А' В" м' где / -- интеграл по тем участкам экстремали сравнения А!Вп, А'В",и управления для которых равны управлениям опорной траектории, т.е. uf(t) -- w'(x'(£),£) = 7/(ж(£),£) = u(t); f —интеграл по А'В",и’ участкам экстремали А!В", управления на которых отличны от управлений опорной экстремали. Поскольку траектория А!В" является допустимой, то при¬ ращение фазовых переменных Ах вдоль нее можно опре¬ делить с помощью дифференциальных уравнений движения: 216
Дх* = Fi(xf}u\t)At. Тогда согласно формулам (2.12),(2.13) имеем По втором слагаемом правой части соотношения (4.9) интегриро¬ вание распространено на всю экстремаль А В", так как при и — и* подынтегральное выражение обращается в нуль. Обозначая под интегралами в формуле (4.9) At символом dt, соотношение (4.8) с помощью (4.9) представим в виде И формуле (4.10) в трех последних интегралах правой части функ¬ ция Н вычислялась в точках указанных кривых, причем управ¬ ления соответствуют управлениям опорной траектории АВ в том смысле, что управления u(x,t) можно доопределять вне отрезка На допустимых траекториях АВ и А В” функция Лагранжа L равна подынтегральной функции исходного функционала Ф фор¬ мулы (2.4). Поэтому на основании формул (4.10) напишем A'F(x\ и\ t) = Н(х\ А'.и', t) + L(x', я', А', и\ t). Поэтому можно написать А1 В",и' А'В'\и' А’В” LAt+ / (Я(х', А', м', t) - Н(х\ А', 14,0) Д*. (4.9) А’ В" АВ А'В" XAx-HAt. (4.10) Фа'В" - $ав = J (Н(х\ А', и, t) - Н(х', А', и', <)) dt+ А'В" + 217
+ j \Ax--HAt + M'x'l\x'h\t[l,Q-Rv(x",xK,t,l,tK). (4.11) ^(Тк) Если обозначить через Сц(тк) кусочно-гладкий замкнутый контур (см. рис. 23), образованный контурами C2(rK), Cft(rK) и обратным перемещением по контуру С^(тк), то алгебраическую сумму трех криволинейных интегралов правой части (4.11) можно представить в виде следующей алгебраической суммы: j X Ах-HAt- J X Ах — Н At + j X Ах-HAt. С,.'(гк) с,>(т„) Неотрицательность правой части (4.11) или указанной выше ее модификации является необходимым и достаточным условием то¬ го, что на экстремали АВ достигается глобальный минимум исход¬ ного функционала (2.4). Условие это, однако, трудно проверяемо. Если концевые точки траекторий А*В" и АВ совпадают и траек¬ тория сравнения бесконечно близка к опорной траектории, то фор¬ мула (4.11) переходит в формулу (2.17) сильной вариации функци¬ онала действия. Из формулы (4.11) также следует, что необходимым и доста¬ точным условием оптимальности траектории А!В" с управлением u'(x, t) будет неположительность правой части (4.11) для любой до¬ пустимой экстремальной траектории с управлением u{x,t). Рассмотрим множество траекторий, имеющих одинаковые кон¬ цевые точки. В этом случае криволинейные интегралы формулы (4.11) по контурам С2(тк), С*(тп) будут равны нулю, а контур <%(ТК ) становится замкнутым. Неинтегральные члены правой ча¬ сти формулы (4.11) взаимно уничтожаются. Приходим к более ко¬ роткому выражению для разности функционалов - Флв - J (Н{х\ У, и, t) - Н(х\ A', u', t)) dt+ Л'13" 4 j Л Ах — Н(х, А, и, t) At. (4.12) ^“(гк) Формула (4.12) показывает, что для рассматриваемого множества допустимых траекторий необходимое и достаточное условие опти¬ мальности управлений и' заключается в неположительности суммы 218
членов правой части. Соответственно для оптимальности траек¬ тории АВ требуется неотрицательность суммы указанных членов. При этом криволинейный интеграл по замкнутому контуру будет относительным интегральным инвариантом типа (4.5), и поэтому его значение не зависит от величины тк. Пусть неинтегральная часть основного функционала представ¬ ляется как сумма двух непрерывно дифференцируемых функций соответственно от начальных и конечных значений До - Roi(x",t„) + Rm(xK,tK). Кроме того, условия на граничные значения разделяются как огра¬ ничения на .г*11, tH и независимые от них ограничения на хк, £к. Тогда общее условие трансверсальности распадается на два условия: —ДЯю 4- А" Д.хи — H„Atu - О, AR20 4- Ак Дхк — HKAtK = 0. (4.13) Можно построить теорию [13], которая основана на выборе кон- •гуров СЦтп),С*(тк), стягивающих допустимые траектории АВ и Л'В'1 в виде трансверсалей, т.е. кривых, удовлетворяющих усло¬ виям (4.13). Приходим к той же формуле (4.12), в которой контур (1;\(тк) заменяется на упомянутой выше замкнутый контур См(тк). Проведение трансверсалей зависит от выбора гладких или кусочно-гладких функций </?" (/х), ?/;” (/х), (/г), -0Г (м) - Для некото¬ рых задач может оказаться возможным построить первую и вторую трансверсаль так, чтобы I ХАх — НAt = 0. < -оответствующие трансверсапи называются соподчиненными. При соподчиненных трансверсалях получим Фл'О" - Флв - J (#(*', V, ti, t) - Н(х\ A', u', *)). (4.14) А' В" Неположительность правой части формулы (4.14) обеспечивается выполнением в каждой точке траектории А!В" соотношения Я(х', А', и\ L) > Я(х', А', щ /;), € U. 219
Поэтому при существовании соподчиненных трансверсалей прин¬ цип максимума является не только необходимым, но и достаточным условием оптимальности. Соподчиненные трансверсали могут быть выбраны в линейной задаче оптимальног о быстродействия с векторным уравнением дви¬ жения где А -- матрица п х ?г, В — матрица п х элементы которых яв¬ ляются непрерывными функциями времени. При этом надо пред¬ положить, что точка и = 0 является внутренней точкой множества U возможных значений управлений. Рассмотрим задачу минимизации следующего функционала с терминальным неинтегральным членом Начальная точка хн, tH задается и может быть любой из некоторого допустимого множества. Минимизация функционала (4.15) выпол¬ няется за счёт выбора вектора управления u(x,t) £ U С Rr, кото¬ рый может иметь конечное число точек разрыва. Движение управ¬ ляемого устройства по-прежнему описывается системой обыкновен¬ ных дифференциальных уравнений общего вида х = А х 4- В и, 4.2. Уравнение Веллмана 4.2.1. Вывод уравнения Веллмана (4.15) х — F(x,u(x,t),t), FeC1, Fx&Cl. (4.16) Для функционала действия 220
при использовании слабых вариаций 5х, 6\, выбранных управле¬ ний, слабых и сильных вариаций величины х на основании форму¬ лы (2.14) или (4.3) для некоторой опорной экстремали напишем AS = АДх - HAt, Н = -F0 + AF, (4.17) гак как условие трансверсальности в начальной точке будет С другой стороны, функционал S можно рассматривать как функцию t и фазовых переменных (см. разд. 4.1.2). Можно убе¬ диться в этом и непосредственно. Уравнения движения (4.16) при сделанных предположениях и выборе конкретных кусочно- непрерывных функций и(х, t) имеют в некоторой области, вклю¬ чающей начальную точку, единственное решение х = х(хи,£). Экс¬ тремаль является допустимой траекторией и на ней где S\ (хн, t) — дифференцируемая функция указанных аргументов. Общее решение системы дифференциальных уравнений (4.16) раз¬ решимо относительно начальных данных хн = хн(х, £), так как в некоторой области, содержащей начальную точку, det(dx/dxH) ф О (при t = tH он равен единице). Поэтому можно говорить о диффе¬ ренцируемой зависимости S = 5(х, t). Отсюда получим Мри сопоставлении (4.17) и (4.18) в силу независимости вариаций А.тi и At имеем Соотношения (4.19) позволяют получить аналог уравнения Гамиль¬ тона - Якоби для управляемой системы (АДх - HAt)t=in = 0. (4.18)
Пусть на оптимальной траектории выполняется свойство прин¬ ципа динамического программирования. Это означает, что рассмат¬ риваемая задача такова, что участок оптимальной траектории на любом [<1,<2] £ [<н»<к] оптимально решает усеченную задачу соеди¬ нения начального положения x(t 1) с соответствующим конечным положением 3(^2)- Тогда согласно принципу максимума на отрез¬ ке \tH,t\J, < 1К для оптимальной траектории па основании (4.20) имеем ^ + max (~F0 + ~~f) = 0. (4.21) dt. u(x,i)eu \ dx ) Введем в рассмотрение функцию Веллмана /•К В(х, t) = I F0(x, и(х, t), t) dt -I- Ro(xK, (K). (4.22) \ Будем иметь Ф == S-\-B. Проварьируем промежуточную точку (.т, t). Ввиду отсутствия конечных ограничений па переменные хг и t на¬ ходим дФ „ . — дФ л —-=0, г — 1,«, — =0. \Jmb4 L/C Последние равенства равносильны соотношениям дВ dS дВ_ _ _c)S дх дх ’ dt dt' Уравнение (4.21) теперь можно записать в виде Уравнение в частных производных (4.23) получило название урав¬ нения Веллмана. Из формулы (4.22) следует граничное условие B(x\tK) = Ло(хк,«к). (4.24) Проведенное рассмотрение показывает, что если существует оп¬ тимальный управляемый процесс u(x,t),x(xH,t), доставляющий непрерывно дифференцируемому по и t функционалу (4.15) ми¬ нимум на множестве допустимых управляемых процессов, то необ¬ ходимо существование функции В(х, /). Эта функция удовлетворя¬ ет граничному условию (4.24) и уравнению (4.23), в функции Fo и 222
F которого подставлено управление и(х, t) такое, что Оптимальное значение функционала (4.19) согласно (4.22) Проведенное рассмотрение приводит к следующей процедуре решении задачи оптимизации. Сначала надо отыскать удовлетво¬ ряющий (4.25) вектор управления и в виде некоторой зависимости от неизвестной функции B(x,t). После подстановки этого выраже¬ нии в (4.23) получим уравнение в частных производных с одной неизвестной функцией и с краевым условием (4.24) в конечной точ¬ ке. Решение указанного уравнения будет давать функцию Веллма¬ на B(x,t), с помощью которой теперь уже явно определяется век¬ тор управления. По формуле (4.26) находим минимальное значение функционала. На основе теории функций Ляпунова уравнение Веллмана по¬ лучено в книге В. И. Зубова [4|. Если решение уравнения (4.29) при сформулированных усло¬ виях оказывается единственным, то существование этого реше¬ нии будет достаточным условием оптимальности соответствующего у 11 равляемого процесса. Пусть Fo и Fi формул (4.15) и (4.16) явно не зависят от вре¬ мени, а терминальный член Rq формулы (4.15) явно не зависит от /к. Будем находить управления как функции от фазовых коорди¬ нат. Поскольку допустимые траектории движения в этом случае не изменяются при произвольном сдвиге г по времени, то функ¬ ции Веллмана согласно формуле (4.22) также будет инвариантной относительно сдвига по времени, т.е. получим B{x,t) -- B{x,t I г). Положим т — a(t - t|),о* > 0. Тогда min<I> = В(х1\ £„). (4.20) 4.2.2. Уравнение Веллмана для стационарной задачи оптимизации О В dt 223
что равносильно при произвольном ty Уравнение Веллмана (4.23) примет вид (4.27) При этом следует удовлетворить граничному условию: В(хк) = = Яо(хк). Величина оптимального значения функционала Для задачи оптимального по быстродействию перехода из за¬ данной точки хи в начало координат можно принять Fo = 1, Ro = 0. Получим уравнение Веллмана и условие в конечной точке В(0) = 0. Минимальное время перехода min(£K — £„) = В(хн). 4.2.3. Применение метода Веллмана к задаче оптимального гашения колебаний точки Рассмотрим пример оптимального демпфирования колебаний точки, если в качестве минимизируемого функционала принят путь, проходимый точкой. В соответствии с обозначениями (см. разд. 3.3) напишем минимизируемый функционал min Ф = В(хн). min in dBW F 1 iin — r = — 1 дх (4.28) 'К (4.29) уравнения движения Xl = £2, #2 = —0J2X\ 4- и, —и < и < v 224
и условие в конечной точке х* = 0, х2 = 0. Составим уравнение Веллмана вида (4.27) для задачи с минимизируемым функциона¬ лом (4.29) min u£v г дБ дБ .дх\Х2 + дх2 Выражение в квадратных скобках при закрепленных .x*i и х2 прсд- зляет собой лине! к - 2Ш_ дх2 о - дх2. сгавляет собой линейную функцию вида у = а + Ьи, а = £2- х2- дх\ b = Наименьшее значение квадратной скобки па отрезке —w < и < *v достигается при и = —*v sign b = — *v sign . Уравнение Беллманга (4.30) преобразуется к виду ЭВ 2 ЭВ -—х2 - и Х\ дх\ дх2 ЭВ дх2 = -|*2|. (4.31) Целесообразно отыскивать функцию В{х\,х2), при которой ^= Х2' Тогда ПРИ х2 = 0 уравнение (4.31) удовлетворяется, а при х2 ф 0 достаточно выполнить равенство = ш2х1- Функция Веллмана может быть принята в виде в = ^(“2х1+хЪ- Эта функция удовлетворяет граничному условию В(хк) = R0 = 0 при х* = 0 и х% = 0. Минимальный путь до остановки в начале координат В(х?,®5) = ^И*х)2 + (* 2Н)2] и зависит от полной механической энергии точки в начальном со¬ стоянии Ен = Т„ + Ян, Тн = \{х2)2, Пн = \ш2(х\)2. Режим опти¬ мального управления соответствует воздействию силы сухого тре- ния (см. разд. 3.2.7). Фазовый портрет представлен на рис. 14, где величину к надо заменить на и. Линией переключения является ось абсцисс. Режим приводит к остановке в начале координат лишь при спе¬ циально подобранных начальных данных. В других случаях оста¬ новка будет где-то в зоне застоя: —'VoГ? < х\ < уи)~2 (см. рис. 14). Можно построить приближенное решение, продолжив, например, 225
последнюю полуокружность рис:. 14 до линии переключения зада¬ чи оптимального быстродействия (штрихованная линия рис. 21) и по ней войти в начало координат. Э го будет субоптимальный пере¬ ход. Точное е решение, на заключительном участке, как и доказы¬ вается в теоремах существования оптимальных управлений, в об¬ щем случае, будет содержать бесконечное число переключений и представлять собой так называемый скользящий режим по линии переключения, т.е. по оси х\. Как это представить наглядно? Обратимся к рис. 14. Поскольку точка Мз не попала в начало координат О, то движение в этой точ¬ ке не останавливается, а продолжается снизу вверх по той же дуге окружности с центром в точке 0i(*vu;-2,0) с тем же управлением и = v. Но как только фазовая траектория пересечет ось х\у она окажется в зоне действия управления и = —у и последует движе¬ ние уже сверху вниз по дуге окружности с центром С>2(—vo;_2,0). В результате образуется бесконечно малый зубчик, приближающий вторую точку пересечения зоны застоя к началу координат. Цепь бесконечно большого числа таких зубчиков, образованных беско¬ нечно малыми дугами окружностей с центрами О \ и 02> в пределе превращается в отрезок МзО оси шх\, по которой перемещается (скользит) фазовая точка при непрестанном переключении управ¬ ления. 4.3. Применение уравнения Гамильтона — Якоби для построения экстремалей 4.3.1. Построение поля расширенных экстремалей с помощью интеграла уравнения Гамильтона - Якоби Действие S(x, t) удовлетворяет при конкретной реализации управлений и(х, £) уравнению в частных производных Гамильтона- Якоби (4.20). В разд. 1.3.2 рассматривалась теорема Якоби. Пусть имеется полный интеграл уравнения Гамильтона-Якоби V(<?*, а*, £), где <7* — обобщенные координаты; с** — произвольные постоянные. Тогда обобщенные координаты гамильтоновой системы определя¬ ются из соотношений ^ = $, где /% — новые произвольные по¬ стоянные. Обобщенные импульсы находятся по формулам pi = . 226
Полным интегралом называется функция, зависящая от полного набора координат и постоянных, для которой det \д2V/dqidctj] ф О, где i,j = 1, п, п — число степеней свободы. В механике управляемого движения действие £(:г, t) оказывает¬ ся частным интегралом, не содержащим произвольных постоянных. Этот интеграл можно дополнить. Достроим полный интеграл уравнения Гамильтона Якоби зада¬ чи механики управляемого движения. Для простоты рассмотрения закрепим £„, а начальные значения фазовых координат l>i бу¬ дем изменять. На основании формулы (2.14) или (4.3) вместо фор¬ мулы (4.17) напишем AS = АДх - HAt - АнДхн. Возьмем в качестве аналога постоянных начальные значения лагранжевых множителей, т.е. а* = А", тогда АДх — Н At 4- ЬАа = А (£(х, t) 4- ab). (4.32) Пусть уравнения движения проинтегрированы х = x(b, t) и раз¬ решены относительно начальных данных b = Ь(х, £). Можно рас¬ сматривать функцию V(х, а, <) = S(x, t) 4- ab(x, t). Из (4.32) следует х SV и 6V „ dV „ооЧ x~ dx' b~ da' ~H~ ~di • (433) Соотношения (4.33) приводят к следующему уравнению Гамильтона Якоби для управляемой механической системы с выбранной реали¬ зацией управлений: dV(x1a,t) dV(x,a,t) ^ F0(x,u,t)-\ — F(x,u,t) = 0. (4.34) Проведенное рассмотрение, в частности, доказывает существова¬ ние полного интеграла (4.34), линейного относительно постоянных ai. По теореме Якоби, если построен какой-либо полный интеграл (4.34) V(x,a,t) 6 С2, то интегральная траектория для уравнений движения определяется соотношениями = Ь*, где hi — новые произвольные постоянные, а лагранжевы множители вычисляются по формулам Ai = ^. Тем самым будет построено поле расширен¬ ных экстремалей для данной реализации управлений. 227
Если не удается построить полный интеграл уравнения (4.34), то можно пытаться отыскать интеграл этого уравнения с неполным набором постоянных и построить усеченное поле экстремалей. Теорема (аналог теоремы Якоби). Пусть удалось построить ли¬ нейный интеграл уравнения (4.34): V( ж*, av, t) G С2, i = l,n, •v = l,ni, rii < n такой, где rang[g~j~- ] = щ. Тогда соотноше¬ ния 8V — = 6V, “V = 1,щ , (4.35) где — новые постоянные, определяют интегральное многообразие уравнений движения, зависящее от п\ независимых постоянных 6V. Тогда лагранжевы множители ЗУ Ai = —, г = 1,п . (4.36) Доказательство. На допустимых траекториях х = F, поэтому d ЭУ _ д2К Э2К dt доп, dtda-v дхдоу Поскольку V(xi, av, £) удовлетворяет уравнению (4.34) тождествен¬ но относительно av, то после дифференцирования (4.34) по av убеждаемся в обращении в нуль правой части (4.37). Соотноше¬ ния (4.35) доказаны. Равенство ранга матрицы смешанных произ¬ водных числу интегралов (4.35) обеспечивает независимость этих интегралов, т. е. приводит к интегральному многообразию с п\ про¬ извольными постоянными. Ввиду линейности V по а каждое из со¬ отношений (4.35) будет первым интегралом. Имеем п\ независимых первых интегралов. Продифференцируем по времени соотношение (4.36) дК _ д2У д2У dt dtdxi dxdxi Функция V(x{, av, t) тождественно удовлетворяет уравнению (4.34) относительно Xi. Поэтому после дифференцирования (4.34) по Х{ получим д2У | д2У р_ dF0 dVdF _ dH{x,\,u,t) х_дУ dxidt dxidx dxi dx dxi dxi 7 дх 228
Убеждаемся, что А<, определяемые соотношениями (4.36), удовле¬ творяют уравнениям Эйлера-Лагранжа. Теорема доказана. Таким образом, частный интеграл V уравнения Гамильтона- Якоби (4.34), содержащий щ независимых постоянных сц,, при¬ водит согласно формулам (4.35) и (4.36) к построению семейства расширенных экстремалей с 2п\ параметрами, из которых п\ па¬ раметров Оу =const отвечают лагранжевым множителям и п\ па¬ раметров =const определяют многообразие кривых уравнений движения. 4.3.2. Определение лагранжевых множителей на участке баллистического движения в центральном поле по методу Якоби Для задачи (см. разд. 2.1.6) Fo = 0. Поэтому полный интеграл V(x,t) = S(x, t) -f ab(x, t), как следует из разд. 2.3.1 и 2.3.2, на баллистическом движении может быть записан в виде где т* — неизменяемая величина массы точки на рассматриваемом участке баллистического полета; ai — произвольные постоянные. В разд. 2.1.6 и 3.3 использовались представления фазовых пе¬ ременных на участке баллистического полета где е, р, и) — три постоянные Кеплера. Из формулы (3.63) следу¬ ет, что четвертая постоянная Кеплера (момент прохождения через перицентр) tp будет представлена в виде где 7 —гладкая функция указанных аргументов. Введем единое обозначение Sk, к = 1,4 для всех четырех кеплеровых элементов. Па основании формул (4.36) и (4.38) напишем 4 (4.38) xi = seep * sin/, х2 = аер *(1 + ecos/), х3 = р( 1 + ecos/)-1, х4 — f +w, (4.39) tP=t + 7(e, p, /),
При определении постоянной Лл чамсгим, что в силу написанного выше соотношения tp и ty а также формул (4.39) имеем о £хгм. Отсюда А4 = aiдХ* {о( ’ и согласно формуле (4.38) имеем -А4 = = По формуле (4.33) находим А4 = —Н. Для упрощения, как и в разд. 2.1.6 и 3.3, примем Я - 0 и, следовательно, А4 = 0. Определение производных А; = 1, 2, 3 будем выполнять дифференцированием выражений (4.39) . t де 1 _! . dp dsinf “"'йГг6” sm/S- + e-teT = B“' , де 1 , dp dcosf ( ^дх,+е~дхГ= „ де _ч dp dcosf „ “•'a*; (1+ес“яв^+е“^г= **■ dxi + dxi 4г’ где Bij при 1ф j равны нулю, Вц = В22 = ае-1р5, .В33 = -p-l(l + ecos/)2,B44 = 1. Как и ранее, полагаем е Ф 0. С помощью равенства . dsinf £ д cos f sm/_r+(!os/__„o после несложных преобразований получим де _i 1. . др дш _ 1 ] 1 * ST*” агг-0' ST“-* е '”cos/' ~ = аг-|е-1р^[(е2 - 1)(1 +ecos/)-1 +ecos/+ 1], гаг ■тг- = 2ае-1р*(1 + ecos/)-1, = ae_1e-1pi sin/(2 + ecos/), (7X2 ox2 (4.41) 230
dxz ^ У < ^wo/), Изохронные производные (4.41) определяют «чувствитель¬ ность» кеплеровых элементов е, р, w к малому изменению положе¬ ния точки и ее скорости. Можно ввести более удобные постоянные А = — ге~1е~1р? А3, В = агГ1е~1р% А\, D = se~le~lp^(e2 — 1)А\ + 2ae“1p^yl2. (4.42) Учитывая А4 = 0, на основании формул (4.40)-(4.42) приходим к представлениям (2.34). Пример. В условиях примера 3 (см. разд. 3.4.5) рассмотрим свойство дифференцируемости функции Веллмана в начальной точке, в которой она, как показано в разд. 4.2.2, равна jВ(х”, х%) = = <к — <н- Пусть начальная точка (ж*, .т2) лежит выше линии пе¬ реключения. Убеждаемся, что оптимальная траектория, ведущая в начало координат, состоит из куска параболы *i = -i(*2)2 + xy + i(*S)2 до пересечения с ветвью линии переключения х\ = ^(х2)2 в неко¬ торой точке (х\, Х2) в момент т, где х2 — —\Jx\ + ^О1^)2» и Дальше до начала координат по этой ветви линии переключения. На пер¬ нем участке и = —1, т.е. х2 = —1. Интегрируя это соотношение, получим т tH — т — J ±2 dt = х2 - .г2. t„ Для движения в начало координат по линии переключения управ¬ лений примем и — 1, тогда tK - г = х2 - х2 = —Х2. Для начальной точки, лежащей выше линии переключении или па самой линии переключения, имеем
Соответственно для начальной точки, лежащей ниже линии пере¬ ключения, получим представление в виде tK - t„ = В(хЧ, х%) = -хЦ + 2 Можно проверить, что на линии переключения в точке (xi, х2) численные значения двух представлений tK—tH будут одинаковыми, т.е. функция В(х", х2) непрерывна на всей плоскости. Отметим, что Ш"' Ш" теРпят разрыв в любой точке линии переключения и поэтому функция Веллмана с гладкими производными для рас¬ сматриваемой задачи не существует.
Глава 5 Динамика вращательного движения 5.1. Уравнения движения и первые интегралы задачи вращательного движения тела 5.1.1. Задача вращательного движения тела в однородном поле тяжести Задача вращательного движения твердого тела в поле тяже¬ сти вокруг неподвижной точки имеет принципиальную значимость в построении математических методов исследования интеграль¬ ных траекторий для нелинейных систем обыкновенных диффе¬ ренциальных уравнений. Глубокий интерес к этой проблеме про¬ являли математики всех поколений. Существенный вклад в тео¬ рию вращательного движения внесли J1. Эйлер, Ж. JL Лагранж, С. В. Ковалевская, А. М. Ляпунов, наш современник В.И.Зубов и другие крупные математики. Если однородное поле тяжести за¬ менить полем тяготения Ньютона, то рассматриваемая проблема становится еще труднее. Весьма актуальна задача динамики управ¬ ляемого вращательного движения тела. Пусть твердое тело совершает движение вокруг неподвижной точки О под действием силы тяжести. Напишем выражение закона изменения момента количества движения - М, М = т(гс х g), (5.1) at где m = const —масса тела; гс — радиус-вектор его центра масс С относительно указанной неподвижной точки О; g —ускорение силы тяжести. 233
Введем в рассмотрение две» системы координате началом в точ¬ ке О: неподвижную (£, г/, £) и подвижную (:/:, у, z), которая совпада¬ ет с главными осями инерции тела. Ось ()( направлена вертикально вверх. Орт этой оси обозначим е<;, а его направляющие косинусы в системе (х, у, z) через (а, /?, 7). Тогда dec d'ec , ЛЧ g = -рес, </ = const., ш х ес, (5.2) где штрихом обозначена производная в системе (х, у, г); и;—уг¬ ловая скорость вращения тела в системе (£, 77, £). Векторное уравнение (5.1) порождает уравнения Эйлера враще¬ ния тела в главных осях IxVx + (h - Iy)uywz = mg{ftzc - yyc), 1уйу + (Ix ~ 1г)ихшг = тд(ухс - azc), (5.3) IzOJz + (ly - 1х)ихшу = mg (ay с - 0xc). Постоянными параметрами уравнений (5.3) являются моменты инерции 1Х, 1У, Iz относительно осей системы (х, у, z) и коор¬ динаты центра масс хс, ус, zc. Соотношение (5-2) в проекции на оси системы (х, у, z) дает так называемые уравнения Пуассона а = /3wz - 7иу, /3 = 7cjx - aojz, 7 = ашу - (Зих. (5.4) Укажем следующие интегралы: • геометрический а2+^2+72 = 1; (5.5) • сохранения кинетического момента относительно оси ОС, Ge^= const, 1хиха + Iyuyf3 + 1гъ>г7 = = const; (5.6) • сохранения полной механической энергии (суммы кинетиче¬ ской и потенциальной энергий) Т 4- П = const 1хш1 4 Iy^l 4 Iz^z + 2mg(xca + yc(3 4- 2C7) = 2h = const. (5.7) Показано, что если удастся получить четвертый независимый от соотношений (5.5)-(5.7) интеграл, то задача интегрирования си¬ стемы (5.3), (5.4) может быть решена в конечном виде. 234
Теорема Ковалевской. Четвертый алгебраический (точнее, ме- роморфный) на всей плоскости комплексного переменного t инте¬ грал существует только в следующих случаях: • случай Эйлера, когда хс = 0, ус = 0, zc = 0; • случай Лагранжа, если 1Х = 1У, хс = 0, ус = 0; • случай Ковалевской, для которого 1Х = 1У = 2IZ1 zc = 0. Мероморфной в области D называется (см. приложение, п.4) од¬ нозначная функция /(<), t £ С (поле комплексных чисел), если ее единственными особенностями в D являются полюсы. Полюсы могут иметь предельную точку на границе области D. В условиях теоремы область D совпадает со всей конечной комплексной плос¬ костью, т.е. при исключении z = оо. И в любой ограниченной части плоскости имеется только конечное число полюсов, а единственной предельной точкой полюсов может быть бесконечно удаленная точ¬ ка. Следует иметь в виду, что свойство интеграла быть однознач¬ ным и тем более мероморфным на плоскости комплексного пере¬ менного не вызывается задачей определения однозначного движе¬ ния, а представляет собой математическое расширение поставлен¬ ной задачи. Поскольку для задачи движения t — вещественное, то для описания движения могут использоваться любые многознач¬ ные функции на плоскости комплексного переменного, лишь бы их критические точки не лежали на действительной оси. Из формул (5.5) следует, что а,/? и 7 равномерно ограничены при t € [to, 00). Теперь из формулы (5.7) можно получить равно¬ мерную ограниченность и остальных трех неизвестных иХ1 шу, uz. В силу непрерывности решение системы (5.3), (5.4) будет ограни¬ ченным и в некоторой полосе t = т\ 4- гтг, т\ € [<о,оо)? ^2 £ (—£,£). Поскольку в полюсе или в существенно особой точке функция не имеет конечного значения, то в указанной £ — полосе особых то¬ чек нет, и решение системы (5.3), (5.4) в общем случае здесь пред¬ ставляется в виде однозначных голоморфных функций, т. е. в виде степенных рядов по положительным степеням аргумента t. Для указанных в теореме Ковалевской случаев получен четвер¬ тый алгебраический интеграл и построено общее решение задачи о вращении тела вокруг неподвижной точки в поле силы тяжести. Кроме того, удалось выявить целый ряд случаев, для которых мож¬ но написать алгебраический интеграл, отвечающий лишь частным начальным данным. 235
Случаям Эйлера и Лагранжа, имеющим широкие технические приложения, посвятим отдельные' разделы, а в данном разделе ограничимся рассмотрением случая Кошикшской и отдельных во¬ просов задачи вращательного днижсиия теля в центральном грави¬ тационном поле. &.1.2. Четвертый интеграл для случая С. В. Ковалевской Пусть 1Х - 1У = 2/2, zc = 0. Поскольку эллипсоид инерции в рассматриваемом случае является эллипсоидом вращения, то без потери общности в качестве оси Ох примем ось, проходящую через центр масс. Тогда получим хс ф 0, ус — 0. Будем обозначать через ох, ay, аг проекции вектора mgxcI~le^ на главные оси инерции х, у, z. Уравнения Эйлера (5.3) принимают вид 2(jx —- u)yUjz, *2и)у — ^z ~~ &у' (^*^) Уравнения (5.4) запишем в виде &х = (TyUfz CTz(jJy, &у — (7ZUJX (TXLUZ, &z — (7xUJy CyLJx. (5.9) Получили систему дифференциальных уравнений с числовыми ко¬ эффициентами. На основании первого и второго уравнений (5.8) напишем 2(их 4- iuy) = —icoz(ujx 4- гшу) + icrz, г = \/^Т. (5.10) С помощью первого и второго уравнений (5.9) находим дх idy = io’z(u)x 4“ у) ^cjz(&;х ^^у)* (^•■^■•0 Соотношение (5.10) умножим на их + icuy и вычтем из полученного результата уравнение (5.11) ^ [(шх + iuiyf - (сгх + icry)] = -iwz [(ux + iojy)2 - (ax + iay)}. Отсюда получим ln[(u>x + iwy)2 - (crx + io-j,)] = —iu2. (5.12) 236
Перейдем к сопряженным величинам ln[(u>x - ги>у)2 - (ах — /)] = ujz. (5.13) Суммируем соотношения (5.12) и (5.13) [(cjx + iuy)2 - (crx + ioy)] [(<*>* - iujy)2 - (ax - icry)\ = с = const. Выполним преобразование этого интеграла ^U)x U)y (7x-\~%{2iU)xU)y ^"j/)j ^{2(л)хи)у ^"y)j — С — Const, (ux tOy ax) + (2u)xu)y <7y) — c. (5.14) Формула (5.14) дает представление четвертого интеграла для слу¬ чая Ковалевской. С помощью этого алгебраического интеграла за¬ дача интегрирования уравнений (5.8) и (5.9) может быть приведена к квадратурам. Интегрирование выполняется в так называемых ги- перэллиптических функциях. 5.1.3. Уравнения вращательного движения вокруг центра масс спутника на круговой орбите Рассмотрим две системы координат с началом в центре масс спутника С: орбитальную (хо, Уо, ^о) с ортами io, jo, k0, ось Czo направлена по продолжению радиуса-вектора центра масс гс, ось Cxq — в сторону движения центра масс в плоскости орбиты орто¬ гонально Czq, ось Су о ортогональна плоскости орбиты, и жестко связанную со спутником систему (х, у, z) главных центральных осей инерции с ортами i, j, k. В гл. 3 получены выражения (3.47) для гравитационных мо¬ ментов. Поскольку законы изменения главного момента количе¬ ства движения относительно центра масс в относительном дви¬ жении по отношению к системе осей, движущейся поступательно вместе с центром масс, имеет точно такой же вид, как в случае неподвижной точки, то уравнения Эйлера вращения спутника око¬ ло центра масс будут иметь вид уравнений (5.3), в правой части которых моменты силы тяжести заменены на гравитационные мо¬ менты 237
Ix^x 4" (-^z ' Iy)UyUJz (lz 23^33i ly^y “Ь Iz)^;i ^z 'lU{) (/ r Iz )о«1зЛзз, (5.15) Iz^z H” (.Jy 1х)ыхМу ~ Лшц (ly - 1Х)0'130'23'> где <2i3, <2-23) азз— направляющие косинусы оси Czo в системе (х, ?/, г); с^о—угловая скорость, с которой орбитальная система координат (хо, Уо, zq) поворачивается относительно поступатель¬ но движущейся системы, имеющей начало в центре масс спутника. Обозначим через ft = fixi + f^j + 02k угловую скорость вращения спутника вместе с системой (х, уу z) относительно орбитальной системы (хо, уо, zo)• Имеем и) = Q 4- c^ojo- Поскольку положе¬ ние плоскости орбиты не изменяется, то для орта оси Су о напи¬ шем Перейдем к относительной производной в системе (х, у, z) Проекции (5.16) на оси (х, у, z) имеют вид уравнений Пуассона Подставляя в уравнения (5.15) соотношения их = Slx “1“ ^0^12» Ыу = Sly И- U>0&22> — &z H~ k>0&32 и учитывая уравнения (5.17), получим dt 4- (SI 4- <Jojo) x jo — Oj что равносильно (5.16) di2 = SlzO,22 — SlyCL32, &22 = Slxa 32 — Slza\2, «32 = Slyd 12 — Slxa,22- (5.17) IxSlx 4 (I2 Iy)SlySlz — Mq(Ix 4" ly Iz)SlyCL32 vo{Ir — ly 4- Iz)Slza22 + uo2{Iz — /у)(За2зДзз — «22^32), 238
lyfly "4“ (J, — Wo(/y 4“ Iz — LUo(Iy — Iz + Ix)flxa32 + ^0 (/* — -Гг)(ЗЛз3^13 — 0-32^12)? /*П, 4" (-^y -^x)^x^y — ^0(^2 4" -^x Iy)Q‘x0'22 — ^o(^z — /x 4- Iy)flya,\2 4- H)2(Jy - ^x)(3ai3a23 — <*12^22)- (5.18) Для замыкания системы уравнений (5.17) и (5.18) необходимы урав¬ нения, связывающие величины ахз, а2з, ^зз- Дифференциальные уравнения для направляющих косинусов орта к0 выведем с помощью следующей цепочки равенств: dk0 . , d'k0 /Л . ч , , = ^oJo х k0? —+ (ft 4- u>oJo) х к0 = w0Jo х к0, ^ + « х ко = 0. at Поэтому ко удовлетворяет уравнению (5.16). Для искомых направ¬ ляющих косинусов должны выполняться уравнения Пуассона вида (5.17) ахз = flza23 — ^з/Лзз, a23 = ^х^зз ~ flza> 13, <233 = ftya\z — Qxa2з- (5.19) Получили замкнутую систему 9 дифференциальных уравнений относительно9неизвестных:Qx, flyy fiz, а\2, a22l «32» ^13» ^23, ^зз- Уравнениям (5.17) и (5.19) отвечают соответствующие интегралы: &122 4- а22> 4- аз22 = ci, а\з2 4- а2з2 4- &зз2 = с2. Поскольку aij — направляющие косинусы, то полагаем С\ = 1, С2 = - 1. Система дифференциальных уравнений (5.17)—(5.19) имеет мастное решение = 0, fiy = 0, — 0, а\2 = 0, а22 = 1, fl-32 ~ 0, ai3 = — sin 0, а2з = 0, a33 = cos0, где 0 —угол поворота спутника в плоскости орбиты, определяемый вторым уравнением Эйлера системы (5.18) в виде 239
Iy9 + 3u>o2(Ix — Iz) sin0cos0 = 0. (5.20) Это уравнение было независимо получено в разд. 3.3.1. 5.1.4. Интеграл типа Якоби-Остроградского Пусть кинетическая энергия приведена к виду (1.19)—(1.22) Т = Тч + Т\ + То, где 7*2 — однородная квадратичная форма произ¬ водных q обобщенных координат; Т\ — однородная линейная форма этих переменных, То не содержит обобщенных скоростей. Считаем, что кинетическая энергия Т и потенциальная энергия П механиче¬ ской системы не зависят явно от времени. Тогда функция Гамиль¬ тона Я - 5-g - (Т + Я) = 2Т2 + тх - (Та + Тх + Г0 + Я) = Т2 - Т0 + П dq не зависит от времени. Поэтому стационарная механическая систе¬ ма в общем случае имеет интеграл в форме Якоби-Остроградского: Т2 — То + П = h = const. Покажем, что система уравнений (5.17)-(5.19) обладает инте¬ гралом такого типа. Умножим уравнения (5.18) соответственно на Sly, Qz и проведем суммирование. Левая часть полученного соотношения будет равна ”(/.п«2 + /уП»а + /,пЛ Правую часть запишем в виде uq2(Iz — Л/)(За2зйзз — a22«32)^x+ +и>о2(1х — ^г)(3азза1з — аз2а\2)£1у+ +u)Q2(Iy — 1Х)( За1за2з — «12^22)^2 = = wo2(IX — Iz)[Sa\s(Slyass — Slza2z) ~ <212(^^32 — ^2^22)] + -\-и>о2(1у — Iz)[Sa23(Slzo>i3 — ^1хазз) — a22(Slzo>\2 ~ ^л^зг)]- 240
С помощью уравнений Пуассона (5.17) и (5.19) это выражение при¬ ведем к виду 2~dt ~ ~ ^г)а232] + + 2[(^х “ ^)о-122 + (1у — ^)й-222] ' Поскольку а222 = 1 — ai22 — азг2, то получим следующий интеграл Ixftx + IyQy + IZQ2Z + 3uq[(Ix — /2)0-13 + (Iy — ^2)^23]+ +Ц)[(4 - 1х)а\2 + (/у - /*)а§2] = const. (5.21) 5.1.5. Устойчивость относительного равновесия и состояния установившегося движения космического тела около центра масс Система уравнений (5.17)—(5.19) имеет точку покоя: flx = fly = — 0, &ij = 0, ъ ф j, Лц — 1, отвечающую совпадению осей систем (х, у, z) и (хо,уо, zo). Физиче¬ ски это состояние относительного равновесия спутника в орбиталь¬ ной системе (хо,уо? zq). Покажем, что это состояние равновесия будет устойчивым при выполнении так называемого условия гравитационной стабилиза¬ ции: 1У > 1х > /2. Иначе говоря, спутник должен быть вытянут вдоль оси Cz и сплющен в плоскости (х, z). При выполнении отме¬ ченного условия интеграл (4.1) является положительно определен¬ ной функцией. В состоянии равновесия, как отмечалось, эта функ¬ ция обращается в нуль. Поэтому левая часть интеграла (5.21) яв¬ ляется функцией Ляпунова и устойчивость указанной точки покоя следует из теоремы Ляпунова. Можно рассуждать так. При начальных значениях величин flx, fly, flz, ai2, a 13, а2з, <232, близких к нулю, постоянная интеграла бу¬ дет малой положительной величиной второго порядка. Левая часть интеграла представляет собой сумму взвешенных квадратов с поло¬ жительными весами. Поэтому каждая из неизвестных величин мо¬ жет быть оценена и будет оставаться во все время движения малой 241
величиной порядка начальных значений. Орты j и к будут близки к ортам jo и ко. Отсюда следует вывод, что тройка главных осей инерции спутника мало отклоняется от орбитальной системы. По различным техническим причинам приходится использовать спутники, для которых не выполняются условия гравитационной стабилизации. К их числу относятся спутники с кинетической сим¬ метрией, т.е. с двумя равными главными центральными моментами инерции. В качестве примера может служить космическая станция с искусственной гравитацией, получаемой в результате вращения станции с постоянной угловой скоростью относительно оси дина¬ мической симметрии. Пусть lx = Iz = /, т.е. имеем аналог случая Лагранжа. Осью динамической симметрии является ось Су с центральным момен¬ том инерции тела 1у. Второе уравнение системы (5.18) на основании второго уравнения обозначения (5.17) принимает вид IyCty = LOoIy{£tza\2 — Пхаз2) = —U>0IyCL22- Отсюда получим дополнительный интеграл, типичный для случая Лагранжа Sty + ^0^22 = const. (5.22) Линейный интеграл (5.22) показывает, что проекция абсолют¬ ной угловой скорости на ось динамической симметрии спутника остается постоянной. Система уравнений (5.17)—(5.19) имеет част¬ ное решение, представляющее собой состояние установившегося движения в виде вращения с постоянной угловой скоростью отно¬ сительно оси Суо орбитальной системы Slx = Slz = 0, в = Sly = Sly = const, (5.23) aij \ — cos в 0 — sin в 0 1 0 sin# 0 cos0 В матрице направляющих косинусов [а^] осей (х, y,z) относи¬ тельно системы (хо,2/о>2о) первый индекс отвечает номеру оси си¬ стемы (я, у, z) и номеру строчки матрицы, второй индекс — соответ¬ ственно номеру оси системы (xq>2/o, ^о) и номеру столбца матрицы. Решение (5.23) следует, например, из уравнений (5.20). 242
Полагая в интеграле (4.1) Ix—Iz= I, получим Ш1 4- 1УН>1 4 liil 4 cJq{ly - /)(а?2 + За^з 4- а\2) = const. (5.24) Будем рассматривать функцию У = 4 Iy(Sly - (^у)2) 4 4 (1У - J)(ai2 + За-23 4- «з2), которая обращается в нуль в состоянии установившегося движе¬ ния (5.23) и в силу (5.24) не изменяется на интегральной кривой. Предположим Iy > I, т.е. станция как бы сплющена в плоскости орбиты. Однако функция V не является положительно определенной и приходится проводить детальный анализ интеграла (5.24), вводя углы ориентации. Требование мнимости корней характеристическо¬ го уравнения линеаризованных уравнений движения приводит к необходимым условиям устойчивости. Положительная определен¬ ность второго дифференциала левой части интеграла (5.24) отно¬ сительно бесконечно малых возмущений углов ориентации и им отвечающих обобщенных импульсов - соответственно к достаточ¬ ным условиям устойчивости. Необходимые и достаточные условия устойчивости, например, выполнены при 1У>1 иП°у>0. Имеем устойчивость по Ляпунову рассматриваемого установив¬ шегося движения станции. 5.1.6. Уравнения Жуковского вращательного движения тела с подвижными частицами Пусть твердое тело (носитель) с неподвижной точкой О содер¬ жит полость, заполненную подвижными частицами, перемещение которых не изменяет направление главных осей инерции. Скорость частицы относительно неподвижной системы (так называемая аб¬ солютная скорость) va равна сумме Vе 4 vr, где Vе — переносная скорость или скорость той точки жесткой координатной системы носителя, с которой в данный момент времени совпадает частица; vr — относительная скорость частицы по отношению к этой систе¬ ме. Кинетический момент механической системы относительно точ¬ ки О, являясь линейной функцией абсолютных скоростей равных G = Ge4Gr, где Gc — момент относительно точки количества дви¬ жения корпуса носителя, сложенный с кинетическими моментами 243
переносного движения частиц; Gr- момент количества относитель¬ ного движения частиц. Обозначая через UJ мгновенную угловую скорость носителя, за¬ пишем ri'(.q‘ + Gr)+Mx(G° + Gr)=M, at где М — момент относительно точки О внешних сил, приложенных к рассматриваемой механической системе. Кинетический момент мгновенно затвердевшей системы Ge = I U) будет иметь диагональ¬ ную матрицу составляющих тензора инерции I, но главные момен¬ ты инерции оказываются переменными величинами. В проекции на ось х получим Ix^x (/г z ~ Мх “1“ (5.25) Мя,х = —ixux — &2 + UzGy - u)yGrz, х —>?/—> 2: —> х, где МцуХ представляет собой момент относительно оси х суммар¬ ного реактивного момента, вызванного перемещением частиц. Для рассматриваемой задачи более удобной будет запись урав¬ нений вращательного движения в форме Жуковского. В качестве фазовых переменных принимаются компоненты кинетического мо¬ мента системы G\ = 1хсих + Gx, G2 = IyWy + Gy, G3 = Izujz -f Grz. Отсюда получим = I-\Gi - Grx), wy = I~1{G2 - Gy), wz = I~l(G3 - Gz). (5.26) Примем обозначения щ = i~i -i-\ V2 = 1-1 -1~\ = A X2 = I~lGry, A3 = i;lCTz. (5.27) Перейдем к преобразованию уравнений (5.25). Тогда запишем (Iz~~Iy)wyLJz — Wy(G3 — Grz)— Mz(G2~- Gy) = U>yG3—L)zG2~)rWzGy—U>yG z Последние два слагаемых будут взаимно уничтожаться с такими же членами в правой части (5.25). С учетом (5.26) и (5.27) получим MyGs — ujzG2 = — A2G3 4- A3 G%- 244
Теперь уравнения (5.25) принимают вид уравнений Жуковского: Gi + TJ1G2G3 + Аз(7'2 — A2G3 = Mi, Mi = Мх. (5.28) Две другие компоненты найдем перемещением индексов: 1 —> 2 —> 3 —> 1, х—>у—>z—» х. Если движение частиц внутри тела отсутствует, то уравнения Жуковского (5.28) дают иную запись уравнений Эйлера G\ + TI1G2G3 = М\, 1 —♦ 2 —> 3 —► 1. 5.2. Вращательное движение тела в случае Эйлера 5.2.1. Определение проекций угловой скорости Рассмотрим задачу вращательного движения твердого тела относительно неподвижной точки в поле силы тяжести (см. разд. 5.1.1). Пусть неподвижная точка совпадает с центром масс, т. е. хс = 0, ус — 0, zc = 0. Уравнения Эйлера (5.3) принимают вид Ix&x Н" (Д — Iy)ldyLdz = 0, 1уШу + (Ix - Iz)wxwz = 0, (5.29) IZU)Z Н- (-^у ~ 0. Умножим первое уравнение на 1хшх, второе на 1уиу, третье на Izuz и, складывая результаты, получим дополнительный интеграл + Гушу + = G2 = const. (5.30) В рассматриваемом нами случае Эйлера момент силы тяжести М = 0 и из уравнения (5.29) следует G = const в неподвижной системе (£, 77, С)- Интеграл (5.30) использует лишь свойство неизме¬ няемости величины указанного постоянного вектора. Неизменяемо¬ стью направления этого вектора воспользуемся позднее. Интеграл сохранения механической энергии (5.7) принимает вид 1хи>1 -f Iyujy + Iz = 2h = const. (5.31) Рассмотрим частные случаи. 245
1. Пусть Ix -- ly -- Jz - /, тогда h i (5.29) следует u)x = const, ijy = const, ljz = const. Поэтому вектор угловой скорости сО не изме¬ няет положения в толе. Движение тела, при котором вектор угловой скорости является постоянным и неподвижном пространстве, назы¬ вается стационарным вощением. В случае равенства трех главных моментов инерции произвольное движение тела в случае Эйлера бу¬ дет стационарным вращением. Утверждение следует из равенства dev d!(jj d!u> —:— = —: h <jJ X U) = —-—. dt dt dt 2. Вторым частным случаем будет Ix = Iy = /, Iz ф I. Третье уравнение системы (5.29) позволяет получить интеграл = uPz — = const. Два первых уравнения этой системы примут вид + {IzI 1 “ 1 )(л)^и)у = О, Сby 4 (1 — IZI — 0. Отсюда получим при = 0: а)х ~ w® — const, Ljy =и>у = const. При а;!? ф 0 имеем и>х+р2шх = 0, р= \(IzI~l - l)w°| > о, ujx — В sin (pt 4- Ь), Dy = а В cos (pt 4 Ь), (5.32) а = sign[(l - где В и 6 — произвольные постоянные. 3. Пусть 1Х Ф 1У ф /г. Для определенности будем считать, что 1х < 1У < Iz- С помощью интегралов (5.30) и (5.31) можно выра¬ зить, например, и)х и и)у через шг. Подставляя полученные выра¬ жения в последнее уравнение системы (5.29), получим дифферен¬ циальное уравнение с разделяющимися переменными относительно (jz и t. Однако величины и)х, шу и>2 могут иметь разные порядки и некоторые из указанных величин могут обращаться в нуль без остановки движения. Поэтому для корректности и однородности рассмотрения целесообразно получить дифференциальное уравне¬ ние для величины угловой скорости ш. С этой целью выразим шх, иу и a)z через и. 246
Напишем формулу для квадрата угловой скорости 2,2,2 2 ujx 4* Шу 4- u)z — oj . (5.33) Соотношения (5.30), (5.31) и (5.33) разрешим относительно и>2 и и2. Определитель системы имеет вид определителя Вандермонда: Д = 1 1 /г ly Iz I2 I2 12 *х ху xz — (1Х 1у)(1у /*)(/, * Iх)• По методу Крамера имеем шх д и) 1 1 2Л 1у Iz G2 1.2 П = ^ k2/y/z(/2 - /У) - - iy)+g2(i. - iy)]. Отсюда получим 2 2/2 2\ Ux^a^L) -с^), a2 = IyIz(Iz-Ix)-l{Iy-Ix)-\ . W2 = 2/i(/-1+/z-1)-G%-1/2-1. Перемещая индексы х —> у —► г —► х, 1 —> 2 —■> 3, на основании (5.34) напишем (5.34) w2 = —a2(w2 - u>2), a2 = /,/,(/„ - IX)~'(IZ - Iy)-\ u>l = 2h(I~l +1-1) - G2I~lI~\ w2z = а2(ш2 - u,2), a2 = IxIy(Iz - Iy)-l(Jz - Ix)~\ cj2 = 2h(I~l + I^1) - G2i;4~\ Примем величины a*, Ui неотрицательными и напишем = Ix^ylZA (' помощью формул (5.34) и (5.35) получим u>l-u,\ = (2h- с;2/.: ')(';' -i;1). 2-17 (5.35) (5.36)
Поскольку 2hlz — G2 = IX(IZ -Ix)u2 + Iy{Iz —Iy)u)y > 0 и Ix 1 > Iy *, то имеем to\ >uj2. Переместим индексы ^3 — ^2 = [lyiJx ~ Iy)uy 4" Iz(Ix — Iz)w\\(Iy 1 — Iz ) < 0, т. e. u2>w2- Еще раз переместим индексы - -I=[Ц1У - +ix(iy - /,к] (I-1 ~ /-1). Второй множитель отрицательный. Однако знак величины в квад¬ ратных скобках зависит от соотношения величин а;2 и ш2. Для опре¬ деленности будем предполагать 2h > G4- *, тогда выражение в квадратных скобках будет неотрицательным. Полная теория дви¬ жения твердого тела в случае Эйлера дана в книге В. И. Зубова [8]. В рассматриваемом случае и2 > ш2. На основании формул (5.34)-(5.36) имеем > J2 > (5.37) Если а>2 = а;з, то из формулы (5.37) следует и = о>2 = const. Формулы (5.34)-(5.36) позволяют при этом получить их = ±ai(yj2 — ^i)1>/2 = const, cjy = 0, uz = 0. (5.38) Компоненты угловой скорости (5.38) отвечают стационарному вра¬ щению вокруг оси Ох. Пусть и>2 ф ^з- Для получения искомого дифференциального уравнения на основании формулы (5.33) напишем 1 d о иш = - —UJ = LJXCUX -f MyU>y + UJZUZ. Преобразуем правую часть этого соотношения с помощью уравне¬ ния (5.29) ujuj = A(jjxu)yujz, A^(ly- Iz)I~l + (/, - Ix)I~y + (Ix - Iy)I~l = -I-4-lI~lA. Выражая компоненты угловой скорости по формулам (5.34)-(5.36), приходим к искомому уравнению с разделенными переменными du)2 = ±2 dt. (5.39) VV2 - -и2)(ш2 -u>!) 248
Если uj\ = о;з, го уравнение (5.39) можно проинтегрировать в гиперболических функциях (а2 - £2)-1cf£ = ±dt, = и2)1/2, а = (а)| - а>2)1/2, = (t-to), *0 = ^^, £ = atha(*-*0)- Для рассматриваемого случая по формулам (5.34)-(5.36) получим шх = ±a\ach~1 a(t - to), cjy = ±a2atha(t - to), (5.40) = =ЬазасЬ-1 a(£ — £o)- Пусть uji ф ыз, тогда множество возможных значений а?, опре¬ деляемое формулой (5.37), можно полностью представить в виде CJ2 = и>2 — (t^2 — ыз) S^n2 Г* Отсюда имеем о;2 — Ш2 = (^2 — ^з) S*n2 Т» СО2 — СО^ — (^2 ~ Ыз) COs2 Т> иЛ— a;2 = (cj| — ^i)(l — s^n2 т)> ^'2 = ~1—~| < 1- (5-41) U72 — Подстановка этих формул в (5.39) приводит к выражению т J (1 — к2 sin2 т)~^dr = ±a(t — to)- (5.42) о Как и в примере с математическим маятником, задача свелась к обращению нормального эллиптического интеграла Лежандра I рода (неполного) вида (3.31): т F(r,k) = J{1 - к2 sin2 т)~^dr. Результат обращения этого интеграла обозначается так: т = am(±a(t — to)). Из формулы (5.42) следует, что т является 249
нечетной функцией аргумента - to). Поэтому множитель ±1 можно вынести и записать т \ ama(t — to). Введем эллиптические функции Якоби sn v = sin amv, cn v — cos amv, dn v = (1 — k2 sin2 amv) *. С помощью формул (5.34)-(5.37) и (5.41) проекции угловой скоро¬ сти вращения запишем в виде их = ±ai(u>2 — и>2)1/2 dnv, Uy = ±а2(ш% — uj^)1^2 snv, ujz = ±as(uj2 — u^)1^2 cnv, v = (a;! — — to). Эллиптические функции Якоби вырождаются в случаях к = 0 и к = 1. Эти вырожденные случаи были рассмотрены особо и получе¬ но решение вида (5.38) и (5.40). Заметим также, что ввиду нечетно¬ сти snv величина иу будет нечетной функцией t—to, соответственно вследствие четности cnv и dnv величины ljx и uz будут четными функциями t — to- 5.2.2. Определение углового положения в случае Эйлера В разд. 5.2.1 использовано только постоянство вектора кине¬ тического момента G. Чтобы использовать преимущество (особен¬ ность) в решении задачи Эйлера, отвечающее векторному интегра¬ лу G = const, примем направление этого постоянного вектора в качестве направления оси ОС неподвижной системы £, rj, С- Направ¬ ляющие косинусы оси ОС в системе х, у, z выразим через углы Эй¬ лера a = sin0sin<p, /? = sin 0 cos <р, 7 = cos0, (5.43) где 0 — угол между осями ОС и Oz, называемый путациещ <р — угол ротации между осью Ох и линией узлов, т.е. прямой, орто¬ гональной к плоскости (0(,0z) и направленной в сторону, отку¬ да направление поворота от О С к Oz происходит против часовой стрелки. Можно написать уравнения Пуассона вида (5.4), которые будут иметь вид линейных дифференциальных уравнений с переменными коэффициентами относительно а, (3,7 или нелинейных дифферен¬ циальных уравнений с переменными коэффициентами относитель¬ но углов Эйлера. 250
Исследование упростится, если воспользоваться некоторыми из¬ вестными соотношениями. На основании (5.43) имеем Ixux = G sin 9 sin ip, IyUjy = G sin в cos ip, Izuz = G cos в. (5.44) Тем самым углы в и ip определяются по известным шх,шу, и шг. В кинематике доказываются соотношения их = ф sin в sin ip 4- 0 cos ip, u*y = ф sin в cos ip — 6 sin ip, (5.45) = ф cos в 4- ф, где ^ — третий угол Эйлера, называемый прецессией. Это угол в неподвижной плоскости (£, 77) от оси £ до линии узлов. В качестве следствия формулы (5.45) напишем ф sin в = ых sin ip 4- cos y>. (5.46) С помощью (5.44) и (5.46) при sin в ф О находим ф = G(/“1 sin2 ip 4-1~1 cos2 ip). (5.47) Рассмотрим отдельные случаи. • Пусть Ix = Iy = Iz = I. Как указывалось выше (см. разд.'5.2.1), шх — = Ыу, ojz = и®. По формулам (5.44) и (5.47) получим в = во ,<р = Фо, ф = Фо 4 uty(£ — to), и)ф = GI~l = const. • Во втором частном случае 1Х = 1У = I; Iz ф I; ljz = cj®, ujx и Шу определялись формулой (5.32). На основании формулы (5.44) cos0 = IzG~xuPz = const, в = в0. По формуле (5.47) ф = GI~l, Ф = Фо + Uij>(t — to)- С помощью последней формулы обозначения (5.45) имеем ф = L>2 — Gl~x COS0 = ixpz (l — IzI~l) = Шф = const, ip = ipo +wv(t - to). Полученное движение носит название регулярной прецессии. Ес¬ ли и и){р соизмеримы, т.е. линейно зависимы над полем раци¬ ональных чисел, то отвечающая им регулярная прецессия будет периодическим движением тела. При несоизмеримости частот oty и Dip регулярная прецессия относи тся к так называемому классу условно-периодических движений. 251
• Пусть теперь 1Х •/ 1у / /... Поскольку в € [0,7г] и sin в > 0, на основании формул (5.4Л) напишем cosO = IzG~lwz, cosy) lvujy(l'*u)l + 1уШу) 1/2, V = Гхшх(С2 - /;V) Формула (5.47) примет нид sin V = 1хшх (G2 - /IV) '/2 /,ы„ (/>2 4- /2ы2) 1/2. (5.48) V1 = G(/,^ + /у^) (7^* + iyy) 1. (5.49) Правая часть равенства (5.49) является известной функцией времени. Угол ф определяется с помощью вычисления квадрату¬ ры. При интегрировании (5.49) введем еще одну произвольную по¬ стоянную. Три независимые постоянные были введены в разд. 5.2.1 при интегрировании уравнений Эйлера, еще две постоянные — при выборе направления G в качестве оси OQ. Тем самым имеем полный набор из шести независимых постоянных. 5.2.3. Геометрическая интерпретация движения по Пуансо Рассмотрим гак называемый эллипсоид инерции: 5 = { г 11хх2 + 1уу2 4- Izz2 = 1}. Полуосями Э соответственно будут а =/-■/*, Ь = 1~'1\ е = /-■/*. Мгновенная ось вращения тела имеет две точки пересечения с эл¬ липсоидом Э. Определим координаты одной из них М Гм = Aw , \2{1хш% + IyLOy + Izlo2z) = 1. На основании (5.31) полагаем Л = (2/i)^1/2. Уравнение плоскости Р, касающейся Э в А/, запишем в виде 1*их(х - хм) + 1уиу(у - Ум) 4- Izwz(z - zM) = 0. (5.50) Спроектируем Тм на направление кинетического момента G Р = tmGG 1 = G 1 (2/i) 1/2(Ixlu2 4- IyUy 4- Iz^t) = 252
— (2 h)lf2G 1 = const. (5.51) Формула (5.50) показывает, что плоскость Р ортогональна постоян¬ ному вектору кинетического момента G. Из формулы (5.51) заклю¬ чаем, что эта плоскость располагается на постоянном расстоянии р от неподвижной точки С (центр масс тела). Поэтому плоскость Р будет неподвижной. Ее называют неизменяемой плоскостью Пу- ансо. Теорема Пуансо. Движение твердого тела около неподвиж¬ ной точки по инерции можно представить как качение (и верчение) без скольжения эллипсоида инерции по неизменяемой плоскости Пуансо. Для доказательства вспомним, что точка М касания эллипсоида инерции Э с плоскостью Р лежит на мгновенной оси вращения. Поэтому скорость точки vm = 0. Следовательно, проскальзывание места не имеет. Остается качение и, возможно, верчение эллипсоида инерции. Введем дополнительные определения. Подвижный аксоид, яв¬ ляющийся геометрическим местом мгновенных осей вращения относительно подвижной системы (х,у, z), пересекает эллипсоид инерции по кривой, называемой полодией. Неподвижный аксоид, представляющий собой геометрическое место мгновенных осей вра- Рис. 2К •АГ>.Ч
щения относительно неподвижной системы (£,^7, С)> будет пересе¬ кать плоскость Пуансо но кривой, которую называют герполодией. Как известно из кинематики, вращение твердого тела вокруг неподвижной точки можно представить, как качение без скольже¬ ния подвижного аксоида но неподвижному. Как следствие теоремы Пуансо полодий Q\ будет катиться без скольжения по герполоиде Q2 (см. рис. 28). 5.2.4. Стационарные вращения относительно главных осей Уравнения Эйлера (5.29) показывают, что тело имеет три уста¬ новившихся движения в виде стационарных вращений относитель¬ но направлений главных осей инерции (две компоненты угловой скорости равны нулю, а третья — постоянная ). При равенстве трех или двух главных моментов инерции враща¬ тельное движение полностью определено в разд. 5.2.3. Для решения вопроса о возможных стационарных вращениях при различных мо¬ ментах инерции, как и в разд. 5.2.1, можно получить . _ 1 d 2_ (Ix - Iy)(Iy - IZ)(IZ - 1Х) 2АШ IxIyIz ^x(jjyU)z. Из этой формулы следует, что в случае различных моментов инер¬ ции стационарное вращение возможно лишь в случае обращения в нуль по крайней мере одной из величин шХ1ыу,и>2. Пусть, напри¬ мер, обратилась в нуль компонента сих. Из двух последних урав¬ нений Эйлера (5.29) находим шу = 0,и>2 = 0, т. е. Cjx = и = 0. Тогда из первого уравнения системы (5.29) получим обращение в нуль одной из величин и>у,и>2. Следовательно, имеем стационарное вращение относительно главной оси инерции. Тем самым показано, что для тела с различными главными моментами инерции, враще¬ ния вокруг осей инерции являются единственными стационарными вращениями. Из равенства (ко _ d'uj _ dt dt следует Cjx = шу = й2 = 0, и этот же вывод можно теперь непосред¬ ственно получить из уравнений (5.29). 254
Проведем геометрическое рассмотрение изменения указанных стационарных движений при изменении начальных условий. Для этого в качестве переменных выбираем компоненты кинетического момента з*1 == х2 — Gy, хз — (5.52) Уравнения Эйлера (5.29) в переменных (5.52) примут вид xi ■ T71X2I3, Vi — ~ Iyli l-»2-»3-»l,a;-»j/-»z-^x. (5.53) Система (5.53) дифференциальных уравнений третьего порядка имеет интегралы х\ 4- х\ 4- х\ = G2, (5.54) I~lx\ + 1уХх\ + 1~1х\ = 2 h. (5.55) Поэтому фазовые траектории в переменных х\,х2,хз будут кри¬ выми в я3, полученными пересечением эллипсоида (5.55) и сферы (5.54). Величины G и h являются постоянными для конкретной фа¬ зовой траектории. Закрепим h и будем изменять радиус сферы G. Тогда получим фазовые траектории, отвечающие заданному уров¬ ню энергии. Имеем для полуосей эллипсоида (5.55): а, = (2hlx)x/2, fri = {2hly)1/2, d = (2hi,)1'2. Будет выполняться соотношение aai = bbi =- сс\ = (2/г)1 /2, где а, Ь, с — полуоси эллипсоида инерции. Если эллипсоид (5.55) явля¬ ется взаимным по отношению к эллипсоиду инерции, его называ¬ ют взаимным эллипсоидом инерции или гирационным эллипсои¬ дом. Для определенности полагаем Ix<Iy< Iz. Соответственно для полуосей эллипсоидов имеем а > Ь > с, а\ < Ь\ < с\. Если G < а\ или G > ci, то пересечение эллипсоида (5.55) и сферы (5.54) пу¬ сто. Соответствующие значения G и h не отвечают действитель¬ ному движению. Пусть G = а\, тогда пересечение происходит в двух точках в концах малой полуоси гирационного эллипсоида. При 11ебольшом изменении начальных данных можно получить некото¬ рое увеличение G. Это приведет к тому, что эллипсоид (5.55) и шар (5.54) будут пересекаться по замкнутым кривым вокруг малой полуоси гирационного эллипсоида. Действительно, имеем G > а\ пли G2/”1 — 2h > 0. Чтобы получить выражение проекции фазовой 255
траектории на плоскость (жг^’з), умножим соотношение (5.54) на 1 и вычтем из него (5.55): (J-1 - i;l)xl + (I-1 - I^xl = G2/-1 - 2 h, 0, J"1 - I~x > 0. Имеем эллипс. Соответствующая координата х\ определится из ра¬ венства (5.54). И если проекция изображающей точки на плоскости (х2,хз) приходит в исходное положение, то и координата х\ также становится равной своему начальному значению. Кривые пересе¬ чения поверхностей шара (5.54) и эллипсоида (5.55) оказываются замкнутыми. Подобная картина сохраняется при b\ > G > а\. Аналогично при G = с\ получим две точки пересечения оси х$ с эллипсоидом (5.55). Если G немного меньше ci, то вместо каждой из точек имеем близкие к ней замкнутые кривые. В случае G = bi приходим к качественно другому выводу: пе¬ ресечение сферы эллипсоидом равносильно ее пересечению плоско¬ стями - r„)l,w Следовательно, искомое пересечение состоит из двух окружностей. 256
Фазовые траектории решений уравнений Эйлера (5.53) на по¬ верхности уровня энергии (гирационного эллипсоида инерции) в переменных (4.1) изображены на рис. 29. Таким образом, при малом изменении начальных условий, отве¬ чающих частным решениям в виде вращения вокруг осей Сх и Cz, фазовая траектория будет малой замкнутой кривой. Имеем устой¬ чивость в смысле Ляпунова. При малом отклонении от стационар¬ ного вращения вокруг оси Су фазовая траектория становится нема¬ лой замкнутой кривой. Имеем неустойчивость по Ляпунову. Тем самым доказана следующая теорема Пуансо. Стационарные вращения вокруг большей и меньшей осей эл¬ липсоида инерции являются устойчивыми решениями уравнений Эйлера, тогда как стационарное вращение вокруг средней оси бу¬ дет неустойчивым решением уравнений Эйлера. / Замечание. Устойчивость стационарного решения уравнений Эйлера не означает устойчивости по всем шести фазовым перемен¬ ным соответствующего установившегося движения тела. Действи¬ тельно, пусть рассматривается стационарное вращение относитель¬ но оси Сх. Тогда по формулам (5.48), (5.49) имеем состояние уста¬ новившегося движения тела в виде cos 9 = 0, sin<£=l, cos (/5 = 0. ф — GI~X = Отсюда получим 0=|, (? = \' 'Ф = 'Фо+йх(* ~*о)- Неустойчивость по Ляпунову этого движения, если иметь в виду все шесть переменных, доказывает следующее рассуждение. Выбе¬ рем некоторое е > 0 и для W > 0 рассмотрим возмущенную тра¬ екторию уравнений Эйлера с начальными данными: о;® = ujy = 0, = 0, принадлежащими J-окрестности начальных данных невозмущенной траектории. Получим новое стационарное враще¬ ние вокруг оси Сх, для которого ■ф = ф0+ wl(t - t.0) + i6(t -to) = i>+ - to). При t > где ts = 2eS~1 -f to, имеем \ф — ф\ > e. 257
5.2.5. Оптимальное по быстродействию управление вращательным движением тела в случае Эйлера Будем исходить из уравнений Эйлера, написанных для проекций кинетического момента в качестве неизвестных. Имеем обозначения (5.52) и уравнения вида (5.53). Если ввести в рассмотрение управ¬ ляющие моменты Ui,i = 1,2,3 относительно главных осей инерции, то уравнения движения рассматриваемой системы можно предста¬ вить в виде ±1 = Г} 1X2X3 -f- U\, ±2 = Т}2Х\Хз + U2, Хз = Т)зХ\Х2 ^з* (5.56) Примем ограничение на управление ||u|| < М, \\и\\ = (и2 + w2-f -fu2)1/2. При £н = 0 имеем заданные значения х\ = .т”. Требуется перейти в начало координат за кратчайшее время tK. Как указывалось выше (см. разд. 4.2.2), задача сводится к ре¬ шению уравнения Беллмана (4.28) следующего вида: min^^F = -1 ueu ox при выполнении условия B(xf) = 0. Вектор F имеет компонентами правые части системы (5.56). Запишем уравнение Беллмана рас¬ сматриваемой задачи в развернутом виде min 1М|<м эв дв дв , : ^—щх2хз 4- — т)2Х\Хз + — ЩХ1Х2 + (grad В, и) ОХ\ ОХ2 ОХ3 = -1. (5.57) Первые три члена в скобке не зависят от управлений. Поэто¬ му минимальное значение выражения в этой скобке достигается при минимизации величины (gradi?,u). Скалярное произведение (grad В, и) при заданном векторе grad В будет наименьшим, когда второй вектор и имеет наибольшую абсолютную величину и на¬ правлен в сторону, обратную первому вектору. Отсюда получим и = —М\gradl?|-1 grad£. (5.58) Преобразуем уравнение (5.57) с помощью (5.58) дВ дВ дВ . -Z—THX2Xз + w—V2X\x3 + —г)3x1x2 - М| grad В\ = -1. (5.59) ОХ 1 ОХ2 0X3 258
Полезно заметить, что на основании формулы (5.53) выполня¬ ется равенство г]\ + ?/2 -Ь т/з — 0. Уравнение (5.59) упрощается, если функцию £?(.т],.т2,:гз) отыскивать при выполнении условия dB/dXi = ip(x)xi, где <р - некоторая непрерывная функция фазо¬ вых переменных. Будем иметь |gradВ\ = И ||х||, ||х|| = (xl + xl+xl)? и преобразованное уравнение (5.59) -м\<р\ \\х\\ = -1. Отсюда получим \(р\ = M~1\\x\\~l, dB/dxi — M~1\\x\\~1xi, В = М~1(х\+х\+х\)ъ. Полученная однородная функция В обращается в нуль в конечной точке х* = 0 и, следовательно, удовлетворяет граничному условию. По формуле (5.58) определим оптимальное управление и = -Мх ЦхГ1. (5.60) Минимальное время торможения min(iK - tH) = В(х“) = М-1 ((х?)2 + (х£)2 + (х£)2) *. (5.61) Формула (5.60) показывает, что для уменьшения вектора угло¬ вой скорости тела до нуля за наименьшее возможное время вектор управляющего момента надо направлять противоположно вектору кинетического момента. Величина управляющего момента должна быть равна наибольшему значению. В первоначальных физических обозначениях формула (5.60) имеет вид М = u = — MG~lG. С помощью закона изменения кине¬ тического момента dG/dt — М получим GdG/dt = MG = —MG, GG = —MG, G = GH — M(t — £„). Тем самым подтверждается фор¬ мула (5.61). Полезно обратить внимание на следующее обстоятель¬ ство. Оптимальное гашение угловой скорости тела осуществляется не моментом, направленным в обратную сторону скорости, а момен¬ том, направленным в обратную сторону кинетического момента. •Ш)
5.3. Вращательное движение тела в случае Лагранжа 5.3.1. Определение двиэюения в задаче Лагранжа Как отмечалось в разд. 5.1.1, в случае Лагранжа принимаем 1Х = 1у = Л хс = Ус = 0- Тело, удовлетворяющее этим условиям, называют волчком. Примером волчка может служить однородное тело, полученное в результате вращения плоской фигуры относи¬ тельно оси ее симметрии. Составим кинетическую энергию волчка Т = 2^* + + С помощью формул (5.45) имеем Т = ^1(ф2 sin2 в + в2) + ^1г(Ф cos0 -f- ф)2. (5.62) Z Z Как и в разд. 5.1.1, ось ОС направим вертикально вверх. Тогда по¬ тенциальная энергия может быть преобразована по формуле (5.43) к виду П = mg(xca + ус(3 -I- zcj) = mgzc cos в. (5.63) Выражения (5.62) и (5.63) показывают, что угол прецессии ф и угол ротации ip являются циклическими. Получим два цикличе¬ ских интеграла дТ Рф = —г = 1ф sin2 в + 1г(ф cos в + ф) cos в — = const, (5.64) дф дТ р<р = -qT = (ф cos 0 + ф) = Gz = const. (5.65) Интеграл (5.64) выражает неизменяемость момента количества движения относительно неподвижной оси ОС и представляет собой интеграл (5.6). Интеграл (5.65) является дополнительным. Он от¬ вечает собственно случаю Лагранжа и непосредственно следует из третьего уравнения Эйлера обозначения (5.3). Физический смысл интеграла (5.65) заключается в неизменяемости момента количе¬ ства движения относительно оси Oz. 260
Рассматриваемая механическая система консервативна, имеет интеграл энергии Т + Л = h -■ const. С помощью формул (5.62)- (5.65) напишем тр = - Gz cos 0)/”1 sin-2 0, ф ф cos0 = GZI(5.66) J02 + (G^ - Gzcos0)2/-1 sin_20 + G2/71 -f 2ra02ccos0 = 2h. (5.67) Полезно выполнить замену переменной а = cos0. Интеграл (5.67) заменим соотношением <т2 = f(a) = (l — a2)(-2mgzcrla + 2 hl~l — G2ZIZ 1/'*1)--- — {Gq — Gzcr)2I~2. (5.68) Отметим, что /(=Ьоо) = ±oo при 2:с>0и /(=too) = =fоо при гс < 0. Кроме того, /(±1) < 0 и реальному движению отвечают те значения а 6 [—1,1], для которых f(a) > 0. В частности, в началь¬ ной точке должно быть /(его) > 0. Для определенности рас¬ смотрим случай zc >0. То¬ гда f(a) имеет два веществен¬ ных корня а\ и 02 на отрезке -1 < а < 1, которые могут совпадать и при этом равны <то, а также один вещественный корень <7з > 1 (рис. 30). Из со¬ отношения (5.68) получим Рис- 30 а = ±(2mgzc)iI~i y/(cr- <7i)(cr2 - ст)(а3 - а). (5.69) Сопоставляя это уравнение с уравнением (5.39) для случая Эй¬ лера, приходим к выводу, что а = cos0 выражается в эллиптиче¬ ских функциях и угол нутпации 0 изменяется периодически. Назо¬ вем точку, лежащую на оси Oz на единичном расстоянии от непо¬ движной точки О вершиной волчка. Получили следующий качественный вывод. Вершина волчка движется по поверхности единичной сферы в кольце между двумя параллелями в\ и 02, где cos0i = <ti, cos 02 = сг2. Вершина волчка участвует и во втором движении — прецессии с угловой скоростью </», определяемой формулой (5.66). 261
Если а* = cos#* = G^GZ 1 лежит вне интервала (<71,02), то со¬ гласно первому равенству обозначения (5.66) величина ф не обра¬ щается в нуль и угол ф изменяется монотонно. Траектория верши¬ ны волчка> на единичной сфере имеет вид, указанный на рис. 31. Пусть а* € (сгьаг), тогда знаки ф на граничных паралле¬ лях различны. Траектория вершины волчка имеет петли возврата (рис. 32). Если а* = о\ или а* = <72, то на первой или второй паралле¬ ли лежит точка возврата траектории вершины волчка. На рис. 33 указан вид соответствующей траектории для случая а* = 5.3.2. Регулярная прецессия Пусть а\ = <72, тогда в = 9q. По формуле (5.66) получим ф = const, ф = const. Движение тела вокруг неподвижной точки при выполнении условий 0 = во, ф = фо, Ф = фо называют регу¬ лярной прецессией. Из предыдущего раздела следует, что для осу¬ ществления регулярной прецессии в случае Лагранжа необходимо и достаточно существование кратного корня ао уравнения f(a) = 0: f(a0) = 0, df(o)/da\ff:=(To= 0, сг0 = cos0O- (5.70) Вычисляя на основании (5.68) производную в формуле (5.70), на¬ ходим -2<7o/i(cro) “ 2mgzcI~l{\ - ао2) + 2GZI~2(G<; - Gza0) = 0, (5.71) /1(00) = -2mgzcI~Lao + 2/iJ-1 - G2zI~lI~l. 262
Поскольку при /(<то) = 0 будет во = 0, то на основании (5.66) и соотношения (5.67), в котором во = 0, получим /i(ao) = ^osin20o- Условие (5.71) приведем к виду (Iipo cos во — Gzipо + mgzc) sin2 во = 0. (5.72) Выражение (5.72) вместе с условием во = 0 является необхо¬ димым и достаточным для существования регулярной прецессии. Возможны два случая: sin0o = 0; sin#o Ф 0. В первом случае условие /(ао) = 0 на основании (5.68) приво¬ дит к равенству G^ = ±G2, что отвечает стационарному вращению вокруг оси Oz, совпадающей при во = 0 с вертикальной осью 0£ и при во = 7г с обратным направлением оси ОС,. Это так называемый спягций волчок. Во втором случае имеем два корня уравнения, получаемого от приравнивания нулю скобки в левой части условия (5.72), в виде ^1,2 = \GzI~1 cos-1 0о(1 ± yj 1 — 4mgzcIG72 cos 0о)- (5.73) Для вещественности решения (5.73) должно быть выполнено со¬ отношение G2 = /2ы2 > 4mgzcI cos во. (5.74) При выполнении (5.74) в виде строгого неравенства имеем два воз¬ можных значения угловой скорости прецессии. Если кинетическая энергия собственного вращения тела с непо¬ движной точкой много больше потенциальной энергии, то тело с динамической симметрией (1Х = 1У = /, хс = 0, ус = 0) называют гироскопом или быстрым волчком. Для гироскопа напишем i/2u;2 >> mgzc cos 0. Поэтому при IzI~l = 0(1) получим G2 >> AmgzcIcos0. Условие (5.74) выполняется. С помощью (5.73) находим асимптотические представления Фг ~ Gzr { cos"-1 0<), фо ~ mgzvG~l. Прецессия с угловой скорос тью ?/»i называется быстрой, а с угловой скоростью *02 — медленной. Ж\
5.3.3. Устойчивость оси «спящего волчка» Для решения задачи об устойчивости вертикального положения оси Oz «спящего волчка» описание движения в углах Эйлера явля¬ ется неподходящим, поскольку при sinfl - 0 углы ф и становятся неразличимыми. Можно творить о сумме этих углов, но нельзя о каждом из них в отдельности. При sin# = 0 первое соотношение формулы (5.66) теряет смысл. Поэтому введем в рассмотрение де¬ картовы координаты £,77, £ вершины волчка, т. е. координаты конца орта к оси Oz в неподвижной системе (£,77, С)- Вертикальное поло¬ жение оси Oz отвечает решению £ = 0, т] = 0, С = 1* Доказательство устойчивости, как и оценку соответствующей так называемой степени устойчивости, можно получить с помо¬ щью интеграла, являющегося положительно-определенной функ¬ цией интересующих нас переменных. Запишем интеграл энергии в переменных £ и ту и их производ¬ ных, исключив С ввиду наличия соотношения £2 + Т]2 4- С2 = 1- Обозначим орты системы (£,Т7>С) через е^е^е^, тогда -I- т/ет; 4- = к, 4- т/ет, 4- Се< = к = и хк = ujy\ - cjxj, где i, j, к —орты системы (ж,у, z), жестко связанной с волчком. Отсюда получим и^+о^^+^ + С2. Поскольку С = cos0 = (1“£2— V2)2 у то С — — (££ + wn) (1 — £2 ~ v2)*- Учитывая формулу (5.63) для потенциальной энергии, запишем интеграл полной механической энергии для случая Лагранжа ^/(а;2 + и2) 4- 4- mgzc cos в = h = const. Преобразуем интеграл энергии в связке с интегралом (5.65) сохра¬ нения кинетического момента относительно оси Oz к виду /(£24-r)2) — mgzc(£2 +т)2) + 04 = 2h — 2mgzc — G2I~l = const. (5.75) Через О4 обозначены члены четвертого порядка относительно ве¬ личин £, г/, £, 7), которые в окрестности состояния равновесия £ = 77 = 0, С = 1,£ = 77 = С = 0 будут малыми величинами и обращаются в нуль в состоянии равновесия. 264
Если zc < 0, т. е. центр масс волчка расположен ниже точки под¬ веса, то интеграл (5.75) оказывается положительно-определенным и из него следует устойчивость вертикального положения волчка без каких-либо дополнительных условий. При zc = О имеем случай Эйлера, задача об устойчивости ста¬ ционарного вращения в котором уже рассмотрена (см. разд. 5.2.4). Для построения положительно-определенной функции при £с > 0 используем связку интеграла (5.75) и интеграла (5.64) со¬ хранения кинетического момента относительно неподвижной оси 0£. Заметим, что G(; = Ge^ = I(uxi + u>yi)e{ + Izwzkec = I(u>xi + u>yj)ec + Gz cos 0, kxk = kx(u; xk) = LJ —k ( и k) = шх\ + uyj. Поскольку (k x k)e^ = £rj — получим I(& - ПО + Gz cos в = Gc. (5.76) Выполним преобразование соотношения (5.76) GJ-1 = (Gc/"1 - « + 7,0(1 - £2 - n2Tk = = GcJ-‘ - £1) + ni + |GC/"J (€2 + if) + 04= (5-77) = G(I~l -^f) + vi + \GzI~\e + г?) + О a. Добавим в левую и правую части интеграла (5.75) G2/-1 и полу- ченное выражение преобразуем с помощью (5.77) Hi2 + V2) + (\С1Г1 - mgzc)(£* + г?) - Gz(£r] - tf) + О4 = = 2/i - 2mgzc + G2(/_1 - I~l) - GZG<I~] = const. (5.78) Примем обозначения В = GZI~X, A - 1 (5.79) и приведем интеграл (5.78) к виду (i + ^Щ +{п-[-ве.) I ( | и' л )(.<;- i tj1) i оА = const.
Получим требуемый положителыю-определенный интеграл при выполнении условия £В2 > А. Тем самым доказано следующее утверждение. Теорема. Достаточным условием устойчивости вертикального положения оси спящего волчка при zc> 0 будет В2 > 4А. (5.80) Условие (5.80) можно записать в виде G2 > 4mgzcI. Как сле¬ дует из (5.74), условие заведомо выполняется для гироскопа или быстрого волчка. Чтобы судить о необходимых условиях устойчивости полезно исследовать уравнения первого приближения для отклонения оси волчка от вертикального положения. Тело с неподвижной точкой имеет три степени свободы. В качестве обобщенных координат возь¬ мем qi = £, <72 = Vi Яз = ф + <р и применим уравнение Лагранжа второго рода для составления уравнений малых колебаний по ко¬ ординатам £ и 7]. Для этого достаточно в функции Лагранжа со¬ хранить члены второго порядка относительно этих переменных. Будем иметь выражение U)z = -0COS0 + ф = ф(сОБ0 — 1) + <7з. Сопоставляя левые части формул (5.64) и (5.76), напишем фвт2 0 = £f) — т)£. В результате исключения ф находим 9 1 • в = -2(ф) - ni) sin2 - sin-2 в + q3 = --(£») - 77O cos-2 - + q3. Поскольку COS2 I = £(1+C) = 1 — |(£2 -f rj2) -f O4, получим - tv) + <Ь + O4. Функция Лагранжа с помощью выполняемых при получении формул (5.75) преобразований может быть приведена к виду L = i/(£2 + if) + ~ mgzc + ^mgzc(£2 + if) + 04. 266
Составим уравнения Лагранжа второго рода для координат £ и г) с использованием обозначений (5.79) Z + Bri-A$ = 0, (гяи П-в£-Ат, = о. (581) Заметим, что уравнение Лагранжа для координаты </з дает инте¬ грал (5.65). Характеристическое уравнение системы (5.81) А2 - А ВХ -ВХ X2 - А (А2 - А) + В2А2 = О имеет корни \2 -A = ±iB\, A = ±iiS±i(4>l-J52)1/2. Если 4А > В2, два корня имеют положительную веществен¬ ную часть и положение равновесия оси в линейном приближении неустойчиво. Решение линейного приближения не будет ограниченным и при выполнении равенства 4А = В2. Чтобы в этом убедиться, умножим первое уравнение формулы (5.81) на единицу и второе на г, а затем сложим В2 z — iBz —z = 0, z - £ + Щ. Соответствующее характеристическое уравнение 1 1 2 А2 - %ВХ - -В2 = (А - -ъВ) =0 имеет кратный корень А = \гВ. Отсюда получим г = [Ci + гС2 + (Di+ Ш2)ф^*, где Ci, С2, D\ и £>2 — вещественные произвольные постоянные. Подведем итог. Если вертикальное положение оси волчка устой¬ чиво, то при решении задачи в линейном приближении оно будет таким же. Следовательно, необходимое условие устойчивости оси волчка совпадает с достаточным условием (5.80) теоремы. 267
С течением времени и результате диссипации энергии волчка из-за трения и сопротивлении атмосферы кинетический момент Gz уменьшается и наступает момент, для которого условие (5.80) пе¬ рестанет выполняться. Тогда волчок «просыпается». 5.3.4. Устойчивость регулярной прецессии динамически симметричного тела переменной массы Расширим постановку задачи, допуская, что тело с неподвиж¬ ной точкой может изменять массу так, что сохраняются главные направления и 1Х = 1У = /, хс — ус = 0. Будем считать глав¬ ный вектор реактивных сил равным нулю, а главный момент реак¬ тивных сил, вычисленный относительно неподвижной точки тела, пусть направлен по оси Oz и выражается некоторой функцией вре¬ мени M(t). Ввиду наличия процесса изменения массы интегралы (5.64) и (5.65) выполняться не будут. Поэтому следует исходить непосред¬ ственно из уравнений движения. Получим уравнения Лагранжа второго рода для системы переменной массы. Известно уравнение Мещерского движения точки переменной массы: т^ = F + F/*, где Fя = -£г11г — реактивная сила по Мещерскому; ur —относи¬ тельная скорость выделяющихся или присоединяющихся масс. Для реактивной силы может быть получено и более точное выражение, учитывающее влияние движения частиц внутри контрольной по¬ верхности на основе определения относительного и кориолисова ускорений частиц. Существенным обстоятельством, которое надо учитывать при переходе к уравнениям в обобщенных координа¬ тах, является переменность массы. Для этого введем в рассмот¬ рение операцию дифференцирования с индексом «*», при выпол¬ нении которой массы закрепляются. Операция дифференцирова¬ ния со звездочкой в отличие от соответствующей операции диф¬ ференцирования без звездочки будет частной производной, вычис¬ ляемой при наборе аргументов, к которым присоединяются массы точек. Уравнение движения одной материальной точки ^(mv) = F + Ffi 268
приводит к общему уравнению механики системы с идеальными связями в декартовых координатах Соответственно для системы переменной массы с s степенями сво¬ боды получим общее уравнение механики в обобщенных координа¬ тах \^{d* д*Т д*Т \ _ d4i Qi Qft'V 6qt ~ °- Отсюда имеем уравнения Лагранжа второго рода следующего вида: Левые части развернутых уравнений (5.82) имеют тот же самый функциональный вид, что и в соответствующей задаче с постоян¬ ными массами. В рассматриваемой задаче вращательного движения в поле си¬ лы тяжести Qi = — щ:, где потенциальная энергия П определяет¬ ся формулой (5.63). Для вычисления обобщенных реактивных сил Qn,i составим виртуальную работу Qrйф 4- Qr,o SO + Qn,ip Sip = U Й7г, где Sir — бесконечно малый угол поворота относительно оси Oz, со¬ гласно формуле (5.45) Sts = cos 98ф 4- Sip. Получим на основании (5.62) и (5.82) следующие уравнения дви¬ жения: 1^г(Ф sin2 в) 4- Iz ^г. [{Ф cos 9 Н- ф) cos в] = М cos в, dt d с 19 - 1ф2 sin 9 cos 9 4- Iz (Ф cos 0 f ф)ф sin 0 = mgzc sin 0, 1г~п{фьи*0 I' Ф) - М. at Будем считать массы точек явными функциями времени, тогда /, /2, m и zc — известные функции времени. Ш)
Запишем уравнения движения в преобразованном виде с исполь¬ зованием обозначения (5.79) t U)z=w°z +J Ml; ldt, (5.83) ^{Ф sin2 в) — ВО sin в = 0, (5.84) в — ф2 sin в cos в -I- Вф sin в = A sin в. (5.85) Изучим возможность движения, при котором в = во = const, ф = фо = const. (5.86) Учитывая представление (5.72) для соотношение (5.83) приве¬ дем к виду t ф = ш2-фо cos во = ф0 + J MI~l dt. (5.87) to Уравнение (5.84) удовлетворяется частным решениям (5.86). Если исключить случай sin^o = 0, то уравнение (5.85) приводится к виду Фо cos во - Вфо 4- А = 0. (5.88) Движение (5.86), (5.87) можно назвать регулярной прецессией тела переменной массы. Соотношение (5.88) является условием существования регуляр¬ ной прецессии гироскопа переменной массы. Действительно, пусть в некоторый момент времени во и фо удовлетворяют соотношению (5.88) которое для некоторых величин во и фо удовлетворяется в течение некоторого промежутка времени. Тогда система диффе¬ ренциальных уравнений (5.84)-(5.85) имеет единственное решение (5.86), (5.87). Заметим также, что условие (5.88) эквивалентно усло¬ вию существования регулярной прецессии гироскопа постоянной массы (5.72). Теорема. Регулярная прецессия является устойчивым по Ля¬ пунову движением гироскопа. 270
Для доказательства исключим из уравнения (5.85) величину А при помощи условия (5.88) и выразим затем В sin 0 с помощью урав¬ нения (5.84). В результате получим уравнение, одинаковое как для гироскопа постоянной массы, так и переменной массы (см. прило¬ жение, п. 5): 00 — ф29 sin 0 cos 0 4- (ф — фо) -j- (ф sin2 0) 4- ф%в cos в0 sin 0 = 0. (4.8) at Удвоенное уравнение (5.89) приводится к виду jв2 + ф(ф — 2фо) sin2 0 — 2фо cos 9о cos #J = 0. Отсюда имеем обращающийся в нуль для регулярной прецессии интеграл системы (5.84), (5.85) V = в2+ф(ф—2фо)51П2 в-\-фо sin2 0о+2^о cos0o(cos0o—cos0) = const. (5.90) Положим теперь t 0 = 0О 4- ui, Ф = Фо + у2, ф = фо 4- / М1~1 dt + из, to где v\, V2 и г>з — малые величины первого порядка. На основании формулы (5.90) находим V = v2 4 {Фоу1 + vV) s^n2 0о + О3 = const. Постоянная величина, стоящая в правой части этого соотношения, может быть сколь угодно малой за счет малого отклонения началь¬ ных условий от регулярной прецессии. Ввиду положительной опре¬ деленности главного члена интеграла следует устойчивость по Ля¬ пунову относительно величин v\, V2. Соотношение (5.83) с помощью формулы (5.87) можно преобра¬ зовать к виду из = у'з 4 (фо + v!j) cos(0О 4 v") - (фо 4 v2) cos(0O 4 vi). Следовательно, при малых v\, v2, v" и величина г>з также будет малой. 271
5.3.5. Пример оптимального по быстродействию управления в задаче Лагранжа В разд. 5.1.5 рассматривалась задача об устойчивости стацио¬ нарного вращения космической станции относительно оси, ортого¬ нальной к плоскости ее круговой орбиты. Возмущения этого стаци¬ онарного вращения ввиду наличия интеграла сами затухать не бу¬ дут. Для приведения возмущенного движения станции в состояние стационарного вращения следует применять управление с помощью реактивных двигателей. Как в разд. 5.1.5, полагаем Ix = Iz = /, что типично в зада¬ че Лагранжа. Для обеспечения устойчивости стационарного вра¬ щения требовалось выполнить условие 1У > I. Уравнения Эйлера (5.15), если пренебрегать гравитационными моментами по сравне¬ нию с управляющими моментами, заменим следующими: й)х = aojz + ui, Cjz = —аи)х -f u2l uy = u3, где a = uy(Iy — I)/1 > 0; управления u\ и u2 равны отношению соответствующего реактивного момента к моменту инерции /; — отношение реактивного момента относительно оси Су к 1У. Будем считать г*з = 0, и примем ограничение на управления щ и и2 в виде —и < Щ < is, i = 1,2. Уравнения движения в обозначениях х\ = и)х и х2 = шу прини¬ мают вид ±i = ах2 4-^1, х2 = —ахi 4- и2, а = const > 0. (5.91) Пусть заданы начальные условия .т", при t = tH. Требуется при¬ вести систему (5.91) в начало координат за минимальное время. Функция Гамильтона для задачи с интегральным функциона¬ лом задачи быстродействия Н = -14- Ai(ax2 4-ui) 4- A2(-axi +u2). Уравнения Эйлера-Лагранжа . ЭН • ЭН М = — *— = аЛ2, л2 = — —— = —aAi дх\ дх2 имеют решение Ai = Asin(a£ 4- a), \2 = Acos(at + а). (5.92) 272
Моменты переключения управлений определяются условием = 0. Поэтому управление ui переключается при Ai = 0, а и2 при Х2 = 0. Поскольку Х2 = Asin(at 4- а 4- тг/2), то синусоида Х2 опережает по фазе синусоиду Ai на 7г/2. На рис. 34 представлены графики лагранжевых множителей. Знаки в скобках отвечают соответству¬ ющим знакам управлений (5.92). Синусоиды изменяют знак через промежуток времени тга-1. По¬ этому каждое из управлений щ, и2) за исключением первого и по¬ следнего участков фазовой траектории, не изменяются на проме¬ жутке времени тга”1. Интервалы времени, в течение которых оста¬ ются неизменяемыми оба управления и\ и и2, не превышают ^7Га-1. Процесс управления периодический. Можно обратить внимание на следующую последовательность полярности знаков управлений: • ‘ * (++)i (н—)> (—)• (-+)»(+ + )»' ‘' » которая четко прослеживается па рис. М. 273
Запишем решение уравнений движения (5.91) при U\ = ±.v, U2 = в виде х\ = £sin(a£ + /?) + a-1ti2, Х2 = Bcos(at + (3) — a_1ui. (5.93) Фазовые траектории — окружности с центрами в точках (a_1U2, — а~1и\) и радиусом В, зависящим от начальных условий. Как показало решение задачи оптимального по быстродействию гашения гармонических колебаний (см. разд. 3.3.5), важное значе¬ ние имеют окружности, проходящие через начало координат, так как только дугами этих окружностей могут быть финишные участ¬ ки оптимальной фазовой траектории. На рис. 35 указаны четыре возможные окружности, по которым изображающая точка может войти в начало координат. Окружности имеют один и тот же радиус a~lv\f2. Координаты центров окружностей (х1>ц,гг2,ц) соотносят¬ ся со значениями управлений с помощью следующих из формулы (5.93) равенств Х1|Ц = a~lU2, £2,ц = — а~1щ. На рис. 35 в скоб¬ ках указаны знаки управлений, которые отвечают фазовым траек¬ ториям-дугам окружностей с данным центром. Теми же знака¬ ми в кружочках помечены соответствующие фазовые траектории, 274
входящие в начало координат. Стрелочки указывают направление движения изображающей точки. Однако не вся дуга любой из окружностей рис. 35 удовлетворяет необходимым условиям экстремума, так как из чередования знаков управлений (см. рис. 30) следует, что одно из управлений долж¬ но переключаться в течение интервала времени ^7га-1, что отве¬ чает одной четверти каждой из указанных окружностей. Стрелки на рис. 35 показывают, какие именно четверти может содержать оптимальная траектория. Критерий выбора — правило движения изображающей точки по часовой стрелке. Исключая начальный и конечный участки, каждому участку без переключения управлений отвечает перемещение изображаю¬ щей точки по четверти окружности. Поэтому линиями переключе¬ ний будут гирлянды четвертей окружностей, указанные на рис. 36. На этом рисунке в квадратных скобках отмечены знаки первого и второго управлений для данной области, ограниченной линиями переключения. Круглые скобки с теми же знаками служат для обозначения центра соответствующей окружности. Фазовая траектория, изображенная на рис. 36, имеет начальную точку в области [—]. 275
Изображающая точка начинает перемещаться по дуге окруж¬ ности с центром в точке (—) до пересечения с линией переклю¬ чения управления, на которой управление u<i изменяется со значе¬ ния —va~l на значение иа~1. Затем следует движение по четверти окружности с центром в точке (—К) до линии переключения управ¬ ления, на которой управление и\ изменяется со значения —va~l на значеие va~l. Переходим по часовой стрелке от одного центра к другому, пока не попадем на соответствующую финишную дугу, по которой фазовая траектория входит в начало координат. / Замечание 1. Для твердого тела с неподвижной точкой в од¬ нородном поле тяжести пусть выполнены условия 1Х < 1у < -Гг» Ус = 0, Ix{h “ 1у)хс ~ 1*{1у ~~ Ix)zcm Можно показать существование частного интеграла Гесса следую¬ щего вида: Ix%C^x 4" Iz^c^Z = если это соотношение выполняется в начальный момент времени. / Замечание 2. С помощью уравнения Беллмана и принципа максимума Понтрягина можно проверить, что минимизация функ¬ ционала оо Ф = J [х\ 4- х\ 4- х2 4- a2(ul 4- и2 4- и\)\ dt t0 на траекториях задачи Эйлера с уравнениями движения (5.56) для произвольных заданных начальных и нулевых условиях при t—> оо осуществляется при управлениях щ = — a~lXi, а > 0. / Замечание 3. Уравнение подвижного аксоида для случая Эй¬ лера 1х(1х - Р~2)х2 + 1у(1у - Р~2)у2 + Iz{h - P~2)Z2 = О, где р определяется формулой (5.51). Тогда можно получить уравне¬ ния проекций полодий на координатные плоскости системы (ж, у, z) и показать , что полодии имеют вид кривых, указанных на рис. 29. Можно также сделать заключение об устойчивости стационарных решений уравнений Эйлера на основании вида полодий. 276
5.4. Теория В. И. Зубова управления вращательным движением тела 5.4.1. Эвристический подход Рассмотрим вращательное движение тела относительно непо¬ движной точки. Пусть выбраны два орта: неподвижный Т и жестко связанный с телом е. Назовем задачей ориентации тела в заданном направлении определение такого момента М, под действием кото¬ рого е —> т при t —> оо. В частности, пусть тело массой m вращается в однородном по¬ ле тяжести вокруг неподвижной горизонтальной оси, вектор Т яв¬ ляется ортом вертикальной оси, направленной в сторону действия силы тяжести, а орт е направлен по прямой, соединяющей непо¬ движную точку с центром масс тела. Трение в цилиндрическом шарнире точки подвеса создает момент М = — где CJ - угловая скорость вращения тела. Если у? —угол между Т и е; / — рассто¬ яние центра масс от точки подвеса; I — момент инерции тела; g — ускорение силы тяжести, то уравнение вращательного движения рассматриваемого физического маятника 1ф = —ф — rngl sin </?. После умножения на ф получим - mglcos<p) = -ф2. Состояние равновесия ip = 0 будет асимптотически устойчивым по Ляпунову. Поэтому задача ориентации физического маятника ре¬ шается воздействием момента вида М = -сJ + fcex т, (5.94) где к > 0. Формула (5.94) позволяет сделать обобщение на случай вра¬ щательного движения тела вокруг неподвижной точки. Векторное уравнение движения Эйлера при действии момента (5.94) lCj+<jjxIu) = M = -u> + k(ex г), (5.95) 277
где I — тензор инерции тела. Уравнению (5.95) удовлетворяют два состояния равновесия: а) е = т, (jJ = О, Ь) е = - т, о;= 0. Заметим также, что второе слагаемое момента М формулы (5.94) обращается в нуль при е коллинеарным т . Возможны дви¬ жения, для которых uj Ф 0, а е = т или е = — т, например, если е является ортом главной оси инерции тела. На такие движения второй член формулы (5.94) не оказывает воздействия, а первый приводит к затуханию вращения. В жестко связанной с телом координатной системе, в которой записано уравнение (5.95), вектор т является переменным по на¬ правлению единичным вектором. Вычислим от него производную в указанной системе dT df Т df Т . —— = — Ь и) х т = 0, —г— = - и> х г = 0. (5.96) dt dt Теорема 1 (В. И. Зубова). Состояние равновесия (а) системы (5.95), (5.96) при управлении (5.94) асимптотически устойчиво по Ляпунову при любом к > 0. Любое решение системы (5.95), (5.96), для которого е ф — Т, будет обладать свойством ш —> 0, е —* Т при £ —* оо, при надлежащем выборе А; > 0. Доказательство. Вычислим производную ^ от функции Ляпу¬ нова V=\(U,I СО) + -k(T - е)2 (5.97) в силу уравнений (5.95), (5.96). Примем во внимание, что ввиду симметричности тензора инерции I = {Д?} з з ( а>, / OJiPijUj = Y2 = Ц~ i tj'=i 3 = ^2 UiPijUj = ( U), I id). ij=l В результате получим ^jjr = \( ".1 <*>) + w, / w) + k( т - e)(— ш x r) = 278
= —uj2 + к( и>,е х т) + к(е, и> х т) = — ш2. Приходим к доказательству асимптотической устойчивости со¬ стояния равновесия (а). Обозначим нулем величины, относящиеся к начальному момен¬ ту времени. На интегральных траекториях системы (5.95), (5.96) функция V уменьшается и стремится к предельным значениям: ну¬ лю в состоянии (а) и 2к в состоянии (б). Если 2к > Vo, т.е. 4к > ( u;0, / Wo) + к ( т -е0)2, к(4-(т -е0)2) >(ш0,1 и>о), то V < 2 А; и V —> 0 при t —> оо. Указанное значение А; не определяется в случае ео = — т. Если начальным не является со¬ стояние (б) или движение не представляется вращением вокруг оси с ортом е, для которого также е = — т, то можно в качестве ново¬ го начального взять состояние в смещенный момент времени. Для этого нового начального момента не будет выполняться равенство ео = — Т. Теорема доказана. 5.4.2. Управление, обеспечивающее достижение заданного движения Пусть орт Т вращается в неподвижном пространстве с угловой скоростью U). Введем в рассмотрение вектор ft = UJ — UJ , где UJ — угловая скорость вращения тела вокруг неподвижной точки, совпадающей с началом вектора Т . Угловая скорость вращения тела удовлетворяет векторному уравнению Эйлера вида (5.95). Это уравнение имеет вид Ift -f- I(jJ •*!- х Ift -f- UJ x I lo -f• ft x I uj — M. (5.98) Управляющий момент возьмем в виде М = -ft + I tj + Gj х Iuj + ke x r. (5.99) Уравнение (5.98) с моментом (5.99) имеет состояние равновесия Q = 0, е = ± т. Составим уравнение Пуассона изменения орта Т относительно тела dT _ _ dfT d! т - ~ /е —— =CJ X т = —— + uj X т, —— = -11 X т. (5.100) at dt dt 279
Рассмотрим функцию Ляпунова типа (5.97): V=l-{s2,/n) + ifc(r-e)2. (5.101) В системе координат, жестко связанной с телом, вычислим произ¬ водную по времени от функции (5.101) ^ = (П,/П )+*(*-.)" Учтем соотношения (5.98)-(5.100) = —fi2 + kQ(e х т) — к(т — е)(Г2 хт) = — Г22. at Приходим к доказательству следующей теоремы для задачи ска¬ нирования по заданной программе. Термин сканирование происхо¬ дит от английского слова scan — поле зрения, точнее, последова¬ тельное изменение поля зрения, при котором прибор просматривает заданную зону. Теорема 2 (В. И. Зубова). Динамическое состояние равнове¬ сия е = т <jJ = а), системы (5.98), (5.100) при управлении (5.99) будет асимптотически устойчивым по Ляпунову при любом к > 0, и, более того, для любого движения, на котором е ф —Т , молено указать такое к > 0, что е —► Т, U) —» U) при £ —» оо. 5.4.3. Управление вращательным движением гиростата Гиростатом называют твердое тело, имеющее вращающиеся роторы, т.е. динамически симметричные тела. Пусть число роторов /, центр тяжести каждого ротора располагается на неподвижной в теле его оси вращения. Само тело, называемое носителем, может вращаться вокруг неподвижной точки, совпадающей с неизменяю¬ щим положения в теле общим центром масс. Как и при выводе уравнения Жуковского (5.28), запишем кине¬ тический момент системы тел в виде i G = Ge + Gr, G r = Yl Cmei> 1=1 280
где Ge = I U) — кинетический момент носителя с невращающимися роторами; I — тензор инерции тела вместе с роторами; Ci — осевой момент инерции г-го ротора; ipi — угловая скорость; е* — орт оси его вращения в теле. Закон изменения момента количества движения рассматрива¬ емой механической системы относительно центра масс при пере¬ ходе к операции дифференцирования в пространстве, связанном с телом, можно записать в виде следующего векторного уравнения Эйлера: I 1(Х> + О? X 1Ш + * ег) = М0, (Г). 102) i— 1 где Мо — известный момент внешних сил. Ввиду равенства поперечных моментов инерции ротора урав¬ нение Эйлера для проекции на его ось вращения Ciipi = Qi, uJi = (pi ”b (ej,u?). Здесь ф*—проекция момента, приложенного к ротору. Это момент внутренних сил, который можно рассматри¬ вать как управляющий. В результате имеем Ci((fi + (е*, cj)) = Qi, г = 1,1. (5.103) Пусть Т — неподвижный единичный вектор; е —- единичный век¬ тор, связанный с носителем. Задача выбора суммарного управляю¬ щего момента Q — Yli=i Qiei таким, чтобы е —> Т при t —> оо. Теорема 3 (В. И. Зубова). Пусть матрица D = \ Cieie* неособенная. Здесь через е£ обозначен вектор, транспонированный по отношению к е*. Пусть среди ортов е* имеется три линейно неза¬ висимых. Примем I Q = М0 - о? х /cj - CiOJ х ipiGi + DI~~l(u> х /cj - M). (5.104) г— 1 Система уравнений (5.102), (5.103) при управлении (5.104), где М = —ш + кех т, имеет состояние равновесия носителя е = ± Т, OJ - 0, каждое из которых асимптотически устойчиво по отношению к U) и е. При 281
этом любое движение, для которого е ^ — т при к > О, будет удовлетворять условию е —> т, LJ —► 0 при t —> оо. Доказательство. По формуле (5.103) получим (5.105) г=1 г=1 Обозначая через при j = 1,2,3 компоненты векторов е* в жестко связанной с носителем координатной системе, перейдем к матрич¬ ной записи eil^l + eilei2^>2 4* еавгЗ^З (е*, сb)ei = еиег2^1 + e?2w2 + е<2е<3йз е*1е*зо>1 4* £12^3^2 4 е23сОз [ eil ег2 СгЗ ] ец вг2 СгЗ CJi а;2 tL>3 Подставим (5.105) в (5.102) I i (/ - ^2 Ci e, e? )ш + Ш x Jo? + Q + ^ ^ V* (w x e») = M0. (5.106) 1=1 t=l По предположению среди векторов ej имеются три линейно незави¬ симых. Поэтому правая часть (5.105) будет невырожденным трех¬ мерным вектором и трехмерный вектор Q может быть взят равным правой части равенства (5.104). Такой выбор Q приводит уравнение (5.106) к виду DcJ + D 1~1 (и х I(jj + w- fcexr) = 0. Поскольку матрица D по условию невырожденная, то приходим к уравнению (5.95). Доказательство заканчивается, как и в теоре¬ ме 1. Проведенное рассуждение позволяет объяснить следующий ана¬ лог теоремы 2 задачи сканирования. Теорема 4 (В.И. Зубова). В условиях теоремы 3 система (5.102), (5.103) и (5.100) при управлении (5.104), где М = —(uj - и>) + 1и> + и) х Iu> + ке х т, 282
будет иметь динамическое состояние равновесия носителя е = т, и) = асимптотически устойчивое по отношению к е и СдЛ При этом лю¬ бое движение системы, для которого е ф — Т , при надлежащем выборе к обладает свойством U) —► и), е —> Т при £ —* оо. 5.4.4. Управление с помощью внутреннего перемещения вспомогательных тел Пусть основное тело вращается вокруг неподвижной точки и несет на себе некоторую систему тел, положение которых в теле определяется обобщенными координатами Дифференци¬ альные уравнения движения материальных точек, составляющих указанные тела, согласно теории относительного движения rrij vs* = Fj + F' - rrij wj — nij w(5.107) где w? — переносное ускорение перемещающейся в теле j-й матери¬ альной точки или ускорение той геометрической точки носителя, с которой она совпадает в данный момент времени; Fj и F' — равно¬ действующие внешних и внутренних сил, приложенных к j-ft точке; wj и Wj — соответственно относительное и кориолисово ускорения точки. При составлении векторного уравнения Эйлера, левая часть ко¬ торого выражает относительную производную кинетического мо¬ мента носителя и затвердевших носимых тел, моменты внешних сил войдут в состав главного момента внешних сил правой части, а сумма моментов внутренних сил F'- и отвечающих им по третьему закону механики внутренних сил, приложенных к точкам носителя, будет равна нулю. Отсюда получим 1и> 4- и> х Iu = М + Мг + Мс, (5.108) где I — тензор затвердевшего тела; М — момент внешних сил, при¬ ложенных ко всем точкам системы; Мг и Мс — момент относитель¬ ных и кориолисовых сил инерции соответственно. Уравнение (5.107) запишем в виде d!vr- rrij — Fj + F'- — m xv j —mwj, (5.109) 283
где mwj — сила инерции переносного движения. К внутренним си¬ лам относятся и силы реакций связей, с помощью которых отдель¬ ные тела удерживаются в объеме носителя. Указанные связи счита¬ ем идеальными и заменим уравнения (5.109) уравнениями Лагран¬ жа второго рода i=u (5Ш) Здесь Тг — кинетическая энергия относительного движения; — соответствующие обобщенные силы. Векторы а* и величины bi по¬ рождаются центробежными и кориолисовыми силами инерции и не зависят от UJ. Пусть уравнения (5.108) и (5.110) разрешимы относительно старших производных i I * = Ао + 5><Е. 'Pi = Bi0 + '£/BiuQrl/. (5.111) lS—\ v=\ Предполагая среди векторов А„ три линейно независимых, выбе¬ рем обобщенные силы так, чтобы удовлетворить соотношению i/=i где JA0 + ^/AI/<5^+wx/u> = M, (5.112) V= 1 М = —UJ 4- ке х т, к = const > 0. (5.113) Умножим первое уравнение формулы (5.111) на матрицу тензо¬ ра инерции I и сложим с уравнением (5.112), в котором момент М определяется формулой (5.113). В результате получим уравнение вида (5.95) и приходим к доказательству следующей теоремы. Теорема б (В. И. Зубова). При выполнении условий (5.111) (5*113) носитель имеет состояние равновесия е = т, UJ = 0. При этом каждое движеиие, для которого е ф —т, будет обладать свойством е —► Т, UJ —► 0 при надлежащем выборе положитель¬ ной постоянной к. 284
5.4.5. Оптимальное управление движением по отношению к демпфированию функции Пусть на интегральной траектории управляемого процесса (х, и) с дифференциальным уравнением х = F(x, t, и) определена непре¬ рывно дифференцируемая функция V(t,x). Управление и называ¬ ется оптимальным по отношению к демпфированию функции V, если функция V убывает вдоль интегральной траектории для этой реализации управления наибольшим образом. Вычислим производ¬ ную от К в силу дифференциального уравнения движения dV DV dV _ Т1//А -лшЖ + Шр = т'х'',)- Высказанное определение равносильно следующему утверждению. Оптимальное управление по отношению к демпфированию функ¬ ции V доставляет наименьшее значение функции W среди всех до¬ пустимых управлений. Рассмотрим задачу определения в случае Эйлера управляющих моментов, оптимальных по отношению к диссипации кинетической энергии при ограничении |М| < v. Запишем дифференциальные уравнения движения Ix^X “Ь (-^2 z =- } ly&y (-Гг Iz)^x^z ==: (5.114) Iz&z + {ly — Ix)b>xWy Mz и функцию демпфирования у = (5-115) Вычислим производную от правой части (5.115) в силу уравнений (5.114) dV = ихМх 4- и)уМу + u)zMz = сО М. (5.116) Наименьшее значение скалярного произведения 04 М при указан¬ ном выше ограничении на величину момента достигается в слу¬ чае М= -vu-lU. (5.117) 285
Теорема 6 (В. И. Зубова). Управление (5.117) является опти¬ мальным по отношению к демпфированию кинетической энергии. При этом управлении вращательное движение умеряется на отрез¬ ке t G [0,£к]> а затем и вовсе уничтожается при t = tK. Величина tK при 1Х < 1У < Iz оценивается соотношением tK € [pov~l\/Tl, Ро^~1уДг\>Ро = 2Vo- (5.118) Доказательство. Оптимальное управление (5.117) по отноше¬ нию к демпфированию функции (5.115), равной кинетической энер¬ гии тела, построено выше. Для величины P=V2V = (Ixuj2x + Iywl + Izw2z)i с помощью формул (5.116) и (5.117) получим ^ = р-1. (5.119) При соотношении моментов инерции Ix < Iy < 12 будет u\/h<p<w JTZ. (5.120) На основании (5.119) и (5.120) запишем _! dp _1 -Vlx2 <-£<-vIz 2. at Проинтегрируем это неравенство _1 _ I РО - Vlx 2t<p<p0~ Viz 2t. В момент времени tK величина р обращается в нуль. Отсюда при¬ ходим к формуле (5.118). Теорема доказана. / Замечание. Задача оптимального быстродействия для слу¬ чая вращательного движения Эйлера решена в разд. 5.25. Мини¬ мальное время гашения угловых скоростей определяется формулой (5.61) вида min tK = v~1Gq при выборе закона управления M = -i/G"1G1 (5.121) 286
где G — вектор кинетического момента, величина которого С = (12х^х + 1Уу + 1^. Управление (5.121) можно рассматривать как оптимальное по отношению к демпфированию функции V\ = \ G2. Действительно, с помощью (5.114) запишем = I2ujxujx 4- ll^yCoy + I2zu)zCjz = GM. Минимум скалярного произведения GM, а следовательно и достигается при управлении (5.121).
Литература 1. А тане М., Фалб П. Оптимальное управление. М., 1968. 764 с. 2. Беллмин РДинамическое программирование. М., 1960. 400 с. 3. Вайнберг М. М., Треногин Б. А. Теория ветвлеиия решения нелиней¬ ных уравнений. М., 1969. 528 с. 4. Зубов В. И. Лекции по теории управления. М., 1975. 495 с. 5. Зубов В. И. Теория колебаний.М., 1979. 400 с. 6. Зубов В. И. Теория уравнений управляемого движения. Л., 1980. 288 с. 7. Зубов В. И. Динамика управляемых систем. М., 1982. 286 с. 8. Зубов В. И. Аналитическая динамика системы тел. Л., 1983. 344 с. 9. К ори Г., Корн Т. Справочник по математике для научных работников и инженеров. М., 1973. 832 с. 10. Красовский Н. Н. Теория управления движением. М., 1968. 475 с. 11. Новоселов В. С. Вариационные методы в механике. Л., 1966. 71 с. 12. Новоселов В. С. Аналитическая механика систем с переменными мас¬ сами. Л., 1969. 240 с. 13. Новоселов В. С. Аналитическая теория оптимизации в гравитацион¬ ных полях. Л., 1972. 317 с. 14/ Новоселов В. С. Варьирование динамических моделей движения. Л., 1983. 108 с. 15. Новоселов В. С. Аналитическая динамика управляемого движения. СПб., 1998. 146 с. 16. Новоселов В. С., Королев В. С. Аналитическая динамика управляе¬ мых систем. СПб., 2000, 199 с., 2002, 246 с. 17. Новоселов В. С., Королев В. С. Методы аналитической динамики. СПб., 2001. 106 с. 18. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., 1961. 391 с. 19. Черноусько Ф. Л., Акуленко А. Д., Соколов Б. Н. Управление колеба¬ ниями. М., 1980. 383 с. 20. Штифель Е.. Шейфеле Г. Линейная и регулярная небесная механика. М., 1975. 304 с. 288
Приложение 1. Переход к новой независимой переменной / осуществляется с помощью интеграла площадей г2/ = . Учитывая представление (2.28) вида г = р( 1 + ecos/)-1, получим dt з —i/т . г\ 2 — = р*ае А(1 + ecos/) <¥ Для первой производной величины vs,$ — 1,2, но формуле (2.33) напишем — = As(l + ecos/) — - esin/A., = = Asp5ae_1(l + ecos/)-1 — eAs sin/, s = l,2. (1) Вычислим вторую производную ОТ U\ d2V\ з _2/- **\-3 dp = Xipse (1+e cos/) — eA5cos /. При этом члены, содержащие Ai, взаимно уничтожаются. Теперь воспользуемся соотношениями (2.28), (2.31) и (2.32) »2 -щ- = —Ai(3(l + ecos/) - 2 + ecos/) - 2А4р^ге-1 = ц/ = —*л(4 — 3rp~l) — 2А4р^эе-1. Приходим к первому уравнению системы (2.33). С помощью второго уравнения системы (2.30) по формуле (1) соответственно напишем = (-2Aias(l -f ecos f)2p~% -I- A2aeesin/(1 + ecos f)p~% — -A4(l+ecos/)p"1)p2ae“1(l4-ecos/)“1-eA2sin / = —2i/i~\^p^~l. Тем самым получено и второе уравнение системы (2.33). Для преобразования интеграла (2.29) к виду (2.34) воспользу¬ емся первым уравнением системы (2.30) и введенными в разд. 2.1.6 вспомогательными переменными v\ и уч Н = ae2^iecos/(l -f ecos f)p~2 — ae^^sin/(1 f ecos f)p~2 + 289
-Ь(аег/2(1 -f ecosf)p * - Ai)aeesin/p 2 4- aeA^l 4- ecosf)2p 2. Члены с i/2 в правой части взаимно уничтожаются. Перейдем от Ai к dv\/df с помощью формулы (1) р2Н?еГ2 = ^iecos/(l 4- ecos/) — - esin/(l 4- ecos/) - ^ie2sin2 f 4- A4p% (1 + ecos f)2ae-1. (2) 0} Полученное соотношение содержит две прозвольные постоян¬ ные Н и А4. Для приведения к виду первого интеграла выразим А4 из второго уравнения системы (2.33). В результате имеем -р2Нэд~2 = esin/(l 4- ecos/) ^ 4- (1 4- ecos/)2 ^ 4- а/ df 4- v\(—еcos/(1 Н- ecos/) 4- е2sin2 / 4- 2(1 4- ecos/)2). (3) После приведения подобных членов приходим к формуле(2.34). Для проверки правильности написания интеграла (2.34), а так¬ же уравнений системы (2.33) выполним дифференцирование левой части выражения (2.34) и выразим производные от v\ и 1/2 с помо¬ щью уравнений (2.33) esin/(l 4-ecos/) 4- (1 4- ecos/)2 ^г4- dfz dfz +(24-e2+3ecos/) 3ev\ sin/+(ecos/(l4-ecos/)-e2sin2 /) ^77- — df df —2esin/(1 4-ecos/) = df = esin/(1 4- ecos/)(—^i(4 — 3rp~l) — 2A4p^ae-1)— -2(1 4- ecos/)2 - 3ei^i sin / 4- 2(1 4- ecos/)2 «/ a/ —2esin/(l 4- ecos/)(—2г/1 — A4p^ae_1) = 0. 2. В задаче импульсного перехода на круговую орбиту дуга бал¬ листического полета сопрягается непосредственно с окружностью, 290
и первые два лагранжевых множителя по формуле (2.114) будут равны Ai = Be sin/, А2 = В( 1 + ecos/) + D( 1 -f ecos /)_1. По замечанию (см. разд. 2.3.3) в каждой точке сопряжения функ¬ ция А2 = А2 + А2 достигает наибольшего значения, равного единице. Будем иметь А2 = B2(l -Ь 2е cos/ -Ь е2) -4- D2{\ -I- еcos/) 2 -+■ 2BD, d\2 ——- = —2esin f(B2 — D2( 1 -f ecos/)-3). df Возможны следующие решения необходимого условия экстремума dAi = 0- df -и‘ a) sin/ = О, 6)D2(1 + ecos/)"3 = В2. Вычислим вторую производную d2 А2 df2 = -2ecos/(£2 — D2(l -f ecos/) 3) + 6е2 sin2/(1 + ecos/) 4 При sin/ ф 0 второе слагаемое положительно и решение (б) от¬ вечает наименьшему значению А2. Остается решение (а), на основе которого проведено рассмотрение в разд. 2.3. Постоянные В и D бу¬ дут решениями уравнений вида А2 = 1 при cos / = 1 и cos / = — 1. Разность этих уравнений приводится к виду (В( 1 - е2) - D)(B( 1 - е2) + D) = 0. Обращение в нуль первой скобки отвечает решению разд. 2.3. Ра¬ венство нулю второй скобки противоречит условию А2 = 1. 3. Для вычисления интеграла Валлиса получим рекуррентную формулу 7Т 7Т 2 2 l2q = J sin2q tpdlp = J sin2^”1* ^(1 — cos2 ip) dip = о 0 JT 2 = /2(9-1) ~ Jsin2^-"1) ipcosipdsinip. 0 291
Выполним интегрирование по частям: 7Г 2 7Г 2 sin29 1 ф cos ф 4- о + ——г / siп2<1фс1ф. 2q-l J о Отсюда находим Приходим к искомой рекуррентной формуле 2<7—1 7Г 2 Поскольку /о = / (1ф = то получаем указанное (см. разд. 3.2.4) представление интеграла Валлиса. 4. Алгебраической функцией степени к называют решение у = -/(жь—»Яп) уравнения где Pj{xi) — многочлен от х*, Pk ф 0. При А; = 1 у = —Pq/P\ называется рациональной функцией от Х{. При к = 2,3,4 алгебра¬ ическая функция выражается через квадратные и кубические ра¬ дикалы. При А: > 4 такое выражение в общем случае невозможно. Мероморфной одного комплексного переменного называют одно¬ значную функцию, имеющую в этой области изолированные особые точки в виде полюсов. 5. После исключения величины А с помощью уравнений (5.85) и (5.88) приходим к уравнению о Ple(Xi) ук + Pfe-i(Xi) ук 1 + ... + Po(Xi) = 0, 9 — ф2 sin 9 cos 9 4- Вф sin 9 4- (ф% cos 9 — Вфо) sin 9 = 0. Умножим на 9 и подставим вместо i?sin0 выражение, взятое из (5.84). Имеем представление (5.89) вида
которое после умножения на 2 запишем в виде ~ + ^(^sin20) + (^ “ 2^o)^(^sin2 0)4- +2^о cos 0о cos 0 = 0. Отсюда приходим к интегралу (5.90). Для выделения квадратич¬ ного члена этого интеграла получим sin0 = sin(0o 4- vi) ~ sin0o(l — 7^vi) + cos0o, cos0 = cos(0o + v\) « cos0q(1 — ^v\) — v\ sin0q.
ОГЛАВЛЕНИЕ Введение 3 Глава 1. Уравнения движения механических систем 7 1.1. Уравнения движения в форме Лагранжа второго рода 1.1.1. Обобщенные координаты и обобщенные силы — 1.1.2. Общее уравнение динамики. Функция Лагранжа 12 1.1.3. Свойства кинетической и потенциальной энергии 15 1.1.4. Анализ обобщенных сил на основе теории канонической структуры силовых полей В. И. Зубова 18 1.2. Уравнения движения в канонической форме 21 1.2.1. Канонические переменные. Функция Гамильтона — 1.2.2. Канонические преобразования 23 1.2.3. Почти тождественное каноническое преобразование 27 1.2.4. Уравнение Гамильтона-Якоби 28 1.2.5. Канонические уравнения возмущенного движения 30 1.3. Интегрирование уравнений движения 32 1.3.1. Первые интегралы канонических уравнений и скобки Пуассона — 1.3.2. Метод Якоби интегрирования уравнений движения 36 1.3.3. Метод вариации произвольных постоянных для канони¬ ческих уравнений 40 1.3.4. Быстрые и медленные переменные в теории возмущений канонических систем 41 Глава 2. Оптимизация управляемого движения 44 2.1. Необходимые условия экстремума 2.1.1. Постановка вариационных задач управления движе¬ нием — 2.1.2. Вариация условного функционала 47 2.1.3. Непрерывность лагранжевых множителей и функции Га¬ мильтона. Формула полной вариации условного функ¬ ционала 52 2.1.4. Необходимые условия сильного относительного экстрему¬ ма 53 2.1.5. Условие экстремальности, отвечающее сильной вариации управления 58 2.1.6. Определение лагранжевых множителей на участке ком¬ планарного баллистического полета в центральном гра¬ витационном поле 60 294
2.1.7. Условие экстремальности при фазовом ограничении 65 2.2. Исследование необходимых условий экстремума 73 2.2.1. Преобразование необходимых условий минимума функ¬ ционала при замене переменных — 2.2.2. Управляемая гамильтонова система 76 2.2.3. Управляемая механическая система с малым парамет¬ ром 79 2.2.4. Теорема Пуанкаре о решении системы обыкновенных дифференциальных уравнений с малым параметром .. 82 2.2.5. Ветвление решений вырожденных нелинейных уравнений необходимых условий экстремума 86 2.2.6. Упрощенное асимптотическое представление управляе¬ мого процесса 88 2.3. Оптимальный переход в центральном гравитационном поле ... 90 2.3.1. Задача оптимизации переходных орбит в декартовых ко¬ ординатах — 2.3.2. Постановка задачи перехода с эллиптической орбиты на круговую 94 2.3.3. Исследование функции Гамильтона задачи оптимиза¬ ции 96 2.3.4. Участки экстремали с максимальным реактивным уско¬ рением 98 2.3.5. Аналитический оператор задачи 100 2.3.6. Решение задачи в нулевом приближении 102 2.3.7. Режим управления с точностью до членов второго поряд¬ ка ; 106 2.3.8. Двухимпульсный компланарный переход между орбита¬ ми с малыми эксцентриситетами 108 Глава 3. Оптимальное управление колебаниями 112 3.1. Движение при выключенном управлении . — 3.1.1. Колебания при сопротивлении, пропорциональном пер¬ вой степени скорости — 3.1.2. Вынужденные колебания при наличии сопротивления .. 114 3.1.3. Гармоническое колебание с сухим трением 118 3.2. Теория фазового пространства для системы с одной степенью свободы 127 3.2.1. Фазовые траектории автономной системы обыкновенных дифференциальных уравнений — 3.2.2. Фазовая картина консервативной механической системы с одной степенью свободы 130 3.2.3. Математический маятник 135 3.2.4. Определение периода колебаний математического маят¬ ника 137 3.2.5. Приближенное решение задачи колебания маятника.... 139 3.2.6. Циклы и условия их существования 146 3.2.7. Возмущения консервативных систем с одной степенью свободы 149 3.2.8. Автоколебания, примеры автоколебаний 151 295
3.3. Оптимальное гашение колебаний механической модели с одной степенью свободы 154 3.3.1. Задача демпфирования колебаний спутника относитель¬ но центра масс — 3.3.2. Постановка линейной задачи оптимального демпфирова¬ ния колебаний 157 3.3.3. Исследование функции Гамильтона 159 3.3.4. Фазовый портрет энергетически оптимальных траекто¬ рий 161 3.3.5. Фазовый портрет траекторий, оптимальных по быстро¬ действию 168 3.3.6. Оптимальное демпфирование колебаний, близких к ли¬ нейным 174 3.4. Оптимальное управление с ограничением 186 3.4.1. Оптимальное гашение углового движения — 3.4.2. Оптимальное демпфирование колебаний при фазовом ограничении 193 3.4.3. Управление колебаниями маятника с подвижной точкой подвеса 201 Глава 4. Приведение задачи механики управляемого движения к инте¬ грированию уравнения в частных производных 210 4.1. Поле экстремалей — 4.1.1. Управление с обратной связью — 4.1.2. Варьирование в поле расширенных экстрема¬ лей 212 4.1.3. Конечное приращение функционала в поле экстремалей 215 4.2. Уравнение Беллмана 220 4.2.1. Вывод уравнения Беллмана — 4.2.2. Уравнение Беллмана для стационарной задачи оптими¬ зации 223 4.2.3. Применение метода Беллмана к задаче оптимального га¬ шения колебаний точки 224 4.3. Применение уравнения Гамильтона-Якоби для построения экс¬ тремалей 226 4.3.1. Построение поля расширенных экстремалей с помощью интеграла уравнения Гамильтона-Якоби — 4.3.2. Определение лагранжевых множителей на участке бал¬ листического движения в центральном поле по методу Якоби 229 Глава б. Динамика вращательного движения 233 5.1. Уравнения движения и первые интегралы задачи вращательно¬ го движения тела — 5.1.1. Задача вращательного движения тела в однородном поле тяжести — 5.1.2. Четвертый интеграл для случая С. В. Ковалевской 236 5.1.3. Уравнения вращательного движения вокруг центра масс спутника на круговой орбите 237 5.1.4. Интеграл типа Якоби-Остроградского 240 296
5.1.5. Устойчивость относительного равновесия и состояния установившегося движения космического тела около центра масс 241 5.1.6. Уравнения Жуковского вращательного движения тела с подвижными частицами 243 5.2. Вращательное движение тела в случае Эйлера 245 5.2.1. Определение проекций угловой скорости — 5.2.2. Определение углового положения в случае Эйлера 250 5.2.3. Геометрическая интерпретация движения по Пуансо.... 252 5.2.4. Стационарные вращения относительно главных осей .... 254 5.2.5. Оптимальное по быстродействию управление вращатель¬ ным движением тела в случае Эйлера 258 5.3. Вращательное движение тела в случае Лагранжа 260 5.3.1. Определение движения в задаче Лагранжа — 5.3.2. Регулярная прецессия 262 5.3.3. Устойчивость оси «спящего волчка» 264 5.3.4. Устойчивость регулярной прецессии динамически сим¬ метричного тела переменной массы 268 5.3.5. Пример оптимального по быстродействию управления в задаче Лагранжа 272 5.4. Теория В. И. Зубова управления вращательным движением тела 277 5.4.1. Эвристический подход 5.4.2. Управление, обеспечивающее достижение заданного дви¬ жения 279 5.4.3. Управление вращательным движением гиростата 280 5.4.4. Управление с помощью внутреннего перемещения вспо¬ могательных тел 283 5.4.5. Оптимальное управление движением по отношению к демпфированию функции 285 Литература 288 Приложение 289
Учебное издание Виктор Сергеевич Новоселов, Владимир Степанович Королев Аналитическая механика управляемой системы Учебное пособие Редактор Н. И. Сочивко Художественный редактор Е. И. Егорова Верстка И. М. Беловой Лицензия ИД №05679 от 24.08.2001 Подписано в печать 28.06.2006. Формат 60x84 1/i6- Бумага офсетная. Печать офсетная. ^ у л Уел. печ. л. 17,44. Тираж 300 экз. Заказ № 3 , Издательство СПбГУ. 199004, С.-Петербург, В.О., 6-я линия, 11/21 Тел. (812) 328-96-17; факс (812) 328-44-22 E-mail: editor@unipress.ru www.unipress.ru По вопросам реализации обращаться по адресу: С.-Петербург, В. О., 6-я линия, д. 11/21, к. 21 Телефоны: 328-77-63, 325-31-76 E-mail: post@unipress.ru Типография Издательства СПбГУ. 199061, С.-Петербург, Средний пр., 41