Текст
                    В. . P- E
,П ill -Г ЕВ К
Е


МЕХАНИКА КОСМИЧЕСКОГО ПОЛЕТА ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1973
В. Н. БРАНЕЦ, И. П. ШМЫГЛЕВСКИЙ ПРИМЕНЕНИЕ КВАТЕРНИОНОВ В ЗАДАЧАХ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1973
675.2 Б 87 УДК 629.19 Применение кватернионов в задачах ориентации твердого тела. В. Н. Бранец, И. П. Шмыглевский. Главная редакция физико-математической литературы, Изд-во «Наука», М., 1973, 320 стр. Книга посвящена вопросам применения аппарата кватернионов к общим теоретическим проблемам кинематики вращательного движения твердого тела и к практическим задачам управления. Теория конечного поворота и кинематика углового движения твердого тела представлены на основе операций умножения кватернионов. Рассмотрены вопросы исследования кинематических уравнений и их численного интегрирования, вопросы использования кватернионов в задачах управления угловым движением твердого тела и оптимизации пространственных разворотов. На ряде примеров показаны удобства и преимущества использования кватернионов в задачах управления. Книга может представлять интерес для специалистов в области систем управления движением летательных аппаратов и для всех, кто интересуется общими проблемами механики твердого тела. Табл. 7. Илл. 57. Библ. 67 назв. © Издательство «Наука», 1973. Владимир Николаевич Бранец, Игорь Петрович Шмыглевский Применение кватернионов в задачах ориентации твердого тела М., 1973 г.» 320 стр. с илл. Редактор Ю. Г. Гуревич. Техн. редактор С. Я. Шкляр. Корректоры Е. А. Белицкая, В. В. Сидоркина. Сдано в набор 22/XI 1972 г. Подписано к печати 3/IX 1973 г. Бумага 84Х108'/ц, тип. № 1. Физ. печ. л. 10. У с лови. печ. л. 16,8. Уч.-изд. л* 14,28. Тираж 2400 экз. Т-11080. Цена книги 1 р. 45 к. Заказ № 415. Издательство сНаука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой "Союзполиграфпрома: при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли г. Ленинград, Л-52, Измайловский проспект, 29 265-1806 Б 042(02)-73 159 73
ОГЛАВЛЕНИЕ Предисловие 7 Глава 1. Кватернионы и их свойства 11 § 1.1. Алгебра кватернионов .11 § 1.2. Представление кватерниона на сфере 20 § 1.3. Преобразование вращения 26 § 1.4. Геометрия на сфере 32 Глава 2. Теория конечного поворота твердого \ тела ... 41 § 2.1. Ортогональные преобразования 43 § 2.2. Представление ортогонального преобразования в форме умножения кватернионов 54 § 2.3. Преобразование базисов 57 § 2.4. Преобразование компонент неизменного вектора. Гиперкомплексное отображение 60 § 2.5. Инвариантность операции вращения. Параметры Род- рига — Гамильтона • . 62 § 2.6. Сложение поворотов .68 § 2.7. Связь параметров Родрига — Гамильтона с другими кинематическими параметрами ......... 76 Глава 3. Кинематические уравнения .92 § 3.1. Бесконечно малое преобразование. Вектор угловой скорости 93 § 3.2. Вывод кинематических уравнений 97 § 3.3. Кинематические уравнения в других параметрах . .105 § 3.4. Исследование кинематических уравнении 120 § 3.5. Решение частных случаев кинематических уравнений 131 § 3.6. Формальное решение кинематического уравнения • .142 Глава 4. Приближенное и численное интегрирование кинематических уравнений .147 § 4.1. Построение численных методов 147 § 4.2. Кинематические уравнения для ненормированных кватернионов. Коррекция нормы .153 § 4.3. Численные методы коррекции нормы 156 § 4.4. Погрешности численных методов при постоянном шаге 160 § 4.5. Численные методы интегрирования с переменным шагом 176 | 4.6. Погрешность квантования 182 § 4.7. Стабилизация модуля и угла в уравнениях Пуассона 185
в ОГЛАВЛЕНИЕ Глава 5. Использование кватернионов в задачах управления движением твердого тела 190 § 5.1. Зависимость сигналов управления от кинематических параметров 192 § 5.2. Кинематическая задача ориентации в инерциальной системе координат 197 § 5.3. Кинематическая задача ориентации во вращающейся системе координат . 205 § 5.4. Динамическая задача ориентации . 226 § 5.5. Примеры 229 Глава 6. Оптимальные пространственные развороты твердого тела 240 § 6.1. Кинематический оптимальный разворот. Постановка задачи 241 § 6.2. Решение задачи кинематического оптимального разворота ... 245 § 6.3. Оптимальное управление для случая ограниченного модуля вектора угловой скорости 260 § 6.4. Оптимальное управление при ограничениях на компоненты вектора угловой скорости .;...... 256 § 6.5. Динамический оптимальный разворот. Постановка задачи 290 § 6.6. Частный случай решения задачи динамического оптимального разворота для тела со сферической симметрией при ограничении на модуль управляющего момента 295 § 6.7. Дополнительные замечания . 308 Основные обозначения 314 Литература 316 Предметный указатель 320
ПРЕДИСЛОВИЕ Основные* результаты классической теории углового движения твердого тела были получены в прошлом веке. Для описания движения твердого тела около неподвижной точки был предложен ряд кинематических параметров, таких, как параметры Родрига — Гамильтона, параметры Кейли — Клейна, углы Эйлера — Крылова и направляющие косинусы. Усилия исследователей в то время были направлены на поиски удобной формы представления уравнений и к отысканию интегрируемых случаев движения. После этого центр тяжести исследований переместился в область прикладной теории гироскопов. При этом движение твердого тела задавалось исключительно углами Эйлера — Крылова, которые нашли широкое применение во всех работах по механике, в том числе и в работах по исследованию управления движущимися объектами. Кроме того, в теоретических работах применялся также матричный аппарат; при этом положение тела задавалось направляющими косинусами. Другие способы описания углового движения упоминались главным образом для полноты изложения. За последнее десятилетие положение изменилось. Развитие систем управления летательными аппаратами, использование цифровых вычислительных машин в управлении движением привели к тому, что практическое значение приобрело рациональное описание пространственного движения твердого тела в различных задачах управления. К таким задачам относятся,
8 ПРЕДИСЛОВИЕ в частности, построение бесплатформенных (бескардано- вых) инерциальных систем, построение систем управления пространственными разворотами, ориентацией и стабилизацией твердого тела. Использование углов Эйлера — Крылова в этих задачах связано с некоторыми неудобствами. Любая система углов, по существу, моделирует некоторый карданов подвес. При определенных значениях углов происходит вырождение кинематических уравнений, отражающее эффект складывания рамок этого подвеса. Такое вырождение уравнений не вызвано реальными физическими ограничениями, накладываемыми на угловые движения твердого тела. Кроме того, интегрирование кинематических уравнений и преобразование координат в углах Эйлера — Крылова связаны с тригонометрическими операциями, которые снижают эффективность использования электронных вычислительных машин. Среди всех кинематических параметров особое место занимают параметры Родрига — Гамильтона и Кей- ли — Клейна. Эти параметры не вырождаются при любом положении твердого тела, в отличие от углов Эйлера. Число этих параметров равно четырем, поэтому они имеют одно уравнение связи, в отличие от шести для направляющих косинусов. Все это упрощает задачу численного интегрирования кинематических уравнений. Кроме того, параметры Родрига — Гамильтона (и Кей- Ли — Клейна) дают возможность эффективно решать Многие вопросы теории конечного поворота твердого тела, устойчивости управляемого движения и т. п. Несмотря на такого рода преимущества, использование Зтих параметров осложняется тем, что оно приводит к применению векторной теории конечного поворота или же к стереографическому проектированию и унитарным преобразованиям, не имеющим простого геометрического смысла. Применение кватернионов позволяет соз-
ПРЕДИСЛОВИЕ 9 дать весьма удобный и наглядный формализм, использующий параметры Родрига — Гамильтона. Кватернионы впервые были введены в математику в 1843 г. В. Р. Гамильтоном. С 1833 г. он занимается теорией созданных им кватернионов, стремясь найти для изучения геометрии пространства столь же удобный аппарат, который мы имеем в виде комплексных чисел при решении задач на плоскости. Результатом его трудов явились две книги: «Лекции по кватернионам» [55] и «Элементы кватернионов» [54]. В дальнейшем теорией кватернионов занимались Г. Ганкель и Ф. Клейн. Однако до последнего времени кватернионы не нашли какого-либо практического применения и служили примером формальной математической модели четырехмерной линейной алгебры. В настоящей монографии представлены работы авторов по применению кватернионов к исследованию углового движения твердого тела. На основе известной формы представления ортогонального преобразования в виде операций умножения кватернионов развивается формализм ортогональных преобразований и теории конечного поворота твердого тела. Сделана попытка связать разработанный формализм, использующий кватернионы, с другими кинематическими параметрами. Подробно проведено исследование общих свойств кинематических уравнений. Предложен общий метод вывода этих уравнений, справедливый для различных кинематических параметров и хорошо поясняющий их физический смысл. Применение кватернионов позволило представить в единой векторной форме бесконечно малые вращения, определяющие вектор угловой скорости, и произвольные преобразования, являющиеся конечными поворотами. Кватернионы дают чрезвычайно удобный аппарат для исследования кинематики движения твердого тела, что
10 ПРЕДИСЛОВИЕ объясняется дуализмом кватернионных единиц, являющихся, с одной стороны, ортами реального трехмерного пространства, а с другой, операторами преобразования. Благодаря такому свойству кватернионов параметры Родрига — Гамильтона и Кейли — Клейна получают простое и ясное физическое содержание. В книге рассмотрены также вопросы применения кинематики углового движения к практическим задачам управления движением твердого тела. Подробно исследованы вопросы численного интегрирования кинематических уравнений, вопросы использования кинематических параметров (в частности, элементов кватерниона) в управлении, а также рассмотрены частные случаи задачи оптимизации пространственных разворотов. Авторы ставили целью показать возможность применения аппарата кватернионов как к общим теоретическим проблемам, так и к практическим задачам управления движением твердого тела, а также привлечь к этому мощному аппарату внимание широкого круга специалистов в области систем управления движением летательных аппаратов, бесплатформенных систем и всех, кто интересуется общими проблемами механики твердого тела. Авторы пользуются случаем выразить свою глубокую признательность Б. В. Раушенбаху и Т. М. Энееву за помощь в работе над настоящей книгой.
ГЛАВА 1 КВАТЕРНИОНЫ И ИХ СВОЙСТВА § 1.1. АЛГЕБРА КВАТЕРНИОНОВ Необходимость расширения операций трехмерной векторной алгебры до операций умножения и деления привела Гамильтона (1843 г.) к введению алгебры для четырехмерных чисел, или кватернионов [54, 55]. Под кватернионом понимают число, составленное из действительной единицы 1 и трех мнимых единиц*) iu h, к> с действительными элементами следующего вида: А = (Ло, A»i, Л2, Л3) = Ло1 ~г ^1*1 "Г ^2*2 \ ^3*3* Изложим основные постулаты, определяющие действия над кватернионами. Г Два кватерниона Л и М равны, если равны их элементы Xi = \ц (i = О, 1, 2, 3). 2° Суммой кватернионов Л и М называется кватернион, элементами которого являются величины Яг+щ: А + М = (Ло + ц0) 1 +(*i + *xi)*i + (Я2 + Ц2) h + (*з + Из) to' 3° При умножении кватерниона Л на скаляр а происходит умножение на это число всех его элементов: а А = аЯо1 + aX\i\ + аК^ + я^з'з- В частности, отрицательным будет кватернион — Л = — А()1 — Aj*i — Л2<2 — ^3*3» а нулевым — кватернион (0,0,0,0). *) Гамильтон обозначал три мнимые единицы через I, /, fc, однако мы для удобства изложения используем обозначения, введенные Ганкелем: iu fe, h. Заметим, что возможно дальнейшее расширение гиперкомплексных чисел на случай, когда сами А.» также комплексны. Построенные таким образом числа называется бикватернио- нами и находят применение при описании винтового движения твердого тела. В настоящей работе бикватернионы не рассматриваются.
12 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 Из этих определений следует, что сложение кватернионов и умножение их на скаляр подчиняются правилам обычной алгебры: 4° А + М = М + А, (A + M) + N = A + (M + N); б° аА = Аа, (ab)X = \(ba)\ 6° (a + b)\=a\ + b\9 а(А + М) = аА + аМ. Единицы 1, iu *2, Н можно рассматривать как единичные векторы (орты) четырехмерного пространства, которое обозначим Н. Тогда любой кватернион можно представить в этом пространстве точкой или радиусом- вектором. Сложение векторов и умножение их на скаляр в пространстве Н происходит так же, как и в обычном векторном пространстве. Особенность пространства Н состоит в том, что оно является замкнутым относительно операций умножения и деления. 7° Чтобы определить произведение кватернионов, необходимо задать правила умножения единиц 1, i\t Ч> h- Эти правила следующие: 1 oix=i{o \=iu 1 oi2=j2o 1=*2, 1 o/3=i3° 1=*з> 1° 1 = 1, iloil=—\t i2oJ2=— 1, f3oJ3=— 1, '1°*2=—*20'1=*3> *3°*1= — *1 °*3 = *2> *2°*3 = — *3 0*2='l. При таком правиле умножения произведение двух кватернионов также является кватернионом. Правила умножения чрезвычайно удачны*)—благодаря им алгебра кватернионов содержит в себе алгебру действительных и комплексных чисел, а также трехмерную векторную алгебру. Кватернионы содержат действительные числа (а, 0,0,0) с единственной единицей 1, комплексные *) Относительно изобретения кватернионов Гамильтон писал: {Они появились на свет окончательно сформировавшимися 16 октября 1843 г., когда я с миссис Гамильтон прогуливался по Дублину и взошел на Брукгамский мост, который с этого момента студенты называют Кватернионным мостом. Можно сказать, что в этот момент замкнулась цепь мыслей и ярко представились основные соотношения i, /, k точно такие, какими я пользуюсь по настоящее время».
§ 1.1] АЛГЕБРА КВАТЕРНИОНОВ 13 числа (а, 6,0,0) с двумя единицами 1, i и векторы (0, а, Ьу с) в пространстве трех измерений. Однако если действительные и комплексные числа образуют поле (т. е. сложение, умножение и деление дают снова элемент рассматриваемого множества), то произведение двух векторов, как будет показано далее, уже является не вектором, а кватернионом. Правило умножения 7° показывает, что умножение на 1 не изменяет кватерниона, т. е. компонент 1 ведет себя как обычный скаляр; по этой причине в дальнейшем в выражении для кватерниона первый член (Я0) мы будем писать без единицы. Далее, можно идентифицировать единицы lu *2> h с ортами трехмерного векторного пространства *) и рассматривать коэффициенты при этих единицах как компоненты вектора. В соответствии с этим кватернион представим в виде суммы скалярной и векторной частей, которые будем обозначать sqalA и vectA соответственно: 8° А = sqal A + vect А = Л0 + Ь — выражение векторной части для удобства будем записывать в виде, Рис- !•*• принятом для обычных векторов. Правила умножения мнимых единиц легко запомнить, используя следующее представление (рис. 1.1): при умножении двух единиц, расположенных по стрелке, получается третья единица с плюсом; при движении в обратную сторону (против стрелки) единица берется с минусом. *) Поскольку если ввести ортогональное преобразование единицы it в i'f (i'j^Cjili), то в силу ортогональности cflcklsss^fk можно видеть, что if подчиняются тем же правилам умножения кватернионных единиц: «{•«I— - СиСишт -1, <2°'3= — *2ЛИ + *! *2 h 021 022 023 I 031 032 033 I в0Ц*1 + 012*2 +с13*Зяш'/1 И Т' А
И КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 Выполняя умножение двух кватернионов Л и М, получим А о М = ЛоЦо — A^j — Л2Ц2 — Л3Цз + ^° ^ А + ^2 + Мз) + *1 *2 *3 Aj Aj A3 Hi 1*2 1*3 + Ho(Wi + *A + AA) + X, Ла А3 . (1.1) Если поменять порядок сомножителей, т. е. рассматривать произведение МоЛ, то в формуле умножения (1.1) изменится детерминант, а именно, строки К и \х поменяются местами (т. е. изменится знак детерминанта). Используя формулу (1.1), можно доказать основные свойства умножения. 9° Умножение кватернионов обладает ассоциативными и дистрибутивными по отношению к сложению свойствами. Для доказательства этого положения рассмотрим произведение трех мнимых единиц, поскольку для действительной единицы это свойство очевидно. Имеем о*2)о*з = *з°*3=-1, *1°(*2°*з) = *1°*1=-1, ° *з) ° h = — Л ° h = 1, о i2) о i{ = i3 о ix = i2f of,)oi2= — i2f ° *з) ° *i = — *2 ° *i = h> °*i)°*3 = — *з, остальные произведения получаются аналогично циклической перестановкой (возможность которой следует из правил умножения 7°, иллюстрируемых рис. 1.1). Отсюда следует, что справедливо равенство (AoM)oN = Ao(MoN) для любых кватернионов. Точно так же можно непосредственно убедиться, что Ao(M + N) = AoM + AoN, поскольку компоненты произведений в обеих частях равенства совпадают при каждой единице. *, *■ ii h ii °(*з° °(*2° °(*1 ° °(*3° °(*1° У-- *.)=- W-*i <i)-*i i3)=- -ti -ii °t3 o*2 -i,« •ii-1. э*3=*2. -~*2, -h. >i2=-l
§ MI АЛГЕБРА КВАТЕРНИОНОВ 15 10° Умножение кватернионов некоммутативно; перестановка сомножителей допустима только тогда, когда один из сомножителей является скалярным или когда векторные части сомножителей пропорциональны. Действительно, рассматривая формулу умножения (1.1), можно видеть, что АоМ=МоА только тогда, когда исчезает детерминант. Последнее возможно либо когда Xj = Яг = Яз = 0 или \i\ = цг = Цз = 0, т. е. когда А или М является скаляром, либо когда Из формулы (1.1) имеем также sqal (А о М) = sqal (M о А). Используя это соотношение, можно показать, что 11° Скалярная часть произведения кватернионов не изменяется при циклической перестановке сомножителей. Рассматривая равенство sqal [А о (М о N)] = sqal [(M о N) о А] = — sqal [М о (N о А)] = sqal [(N о А) о М], получаем, что sqal[AoMoN] = sqal[MoNoA] = sqal[NoAoM]. (1.2) 12° Кватернионом, сопряженным данному кватерниону А, является следующий кватернион, обозначаемый А: А = Ло — k. Можно видеть, что сопряженное сумме кватернионов равно сумме сопряженных кватернионов, т. е. (аТ"м)=а + м. Поскольку векторные части кватернионов А и А отличаются знаком, из свойства 10° следует, что А о А = А о А. Это произведение называется нормой кватерниона А и обозначается ||А||. Из формулы умножения (1.1) следует, что 13° || Л || = Л о Л = Л о Л = Ло + Л? + Л1 + ^3*
16 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 Таким образом, норма кватерниона есть скаляр; ||А|| = 0 в том и только в том случае, когда К\ = Х2 = = х3 = Ко = 0 *). Когда норма ||А|| = 1, кватернион называется нормированным. Рассматривая произведение (1.1), можно видеть, что при изменении знаков векторных частей сомножителей меняется знак при членах с Ко и jio, а знак детерминанта не меняется. Меняя строки К и \х в детерминанте местами, получаем кватернион, векторная часть которого изменила знак: (А о М); очевидно, что он получается от умножения М на А: 14° (А о М) = М о Л, т. е. сопряженное произведению двух кватернионов равно произведению их сопряжен- ных значений, взятых в обратном порядке. Используя полученное правило, найдем величину нормы произведения: 15° ||АоМ|| = АоМо(АоМ; = = АоМоМоА = Ао||М||оА = ||М||оАоА=||М||о||А||, поскольку ||М|| есть скаляр. Отсюда следует, что норма произведения двух кватернионов равна произведению норм сомножителей. По индукции можно доказать, что свойства 14° и 15° сохраняются для случая п сомножителей: (А{о\2о\.. oAn)=AnoAn.l0 ... oAlf (1.3) HAjoA.0 ...oAJ = ||A1||||A2||...||AJ|. (1.4) Полученные свойства позволяют получить также следующее: 16° Произведение двух кватернионов равно нулю только тогда, когда один из сомножителей равен нулю. Действительно, если А о М = 0, то || Л о М || = 0, откуда || А || || М ||=0. Поскольку || А || и || М || являются скалярами, то последнее соотношение указывает на то, что либо || А || = 0, либо || М || = 0, что возможно, когда А = 0 или М = 0 соответственно. Из этого же свойства сле- *) Для бикватернионов $tq не выполняется,
S 1.1] АЛГЕБРА КВАТЕРНИОНОВ 17 (1.6) дует, что произведение нормированных кватернионов дает также нормированный кватернион. Пусть даны два известных кватерниона А и М и кватернион N определяется как результат их умножения, т. е. N=AoM. Приравнивая в формуле умножения (1.1) элементы при единицах it, h> h, имеем Vo = Kq\Iq — A'lM'l — ^2^2 — Л3Ц3, ^ Vi = A.qM'I + Л1Ц0 + ^2M-3 — ^2» v2 = Л0ц2 + ^2^0 + ^зИа — ^1^3» V3 = Л0Ц3 + Л3Ц0 H~ ^1^2 — ^ъРХ' J Если же заданы кватернионы N и А (или М), то для определения кватерниона М (или А) необходимо определить операцию деления кватернионов. В координатах эта операция равнозначна решению системы линейных алгебраических уравнений (1.5) относительно неизвестных щ (или А,*); решение системы возможно, если детерминант системы не равен нулю. Если А — не равный нулю кватернион, т. е. ||A||=j£0, то, следуя определению нормы 13°, получаем Aow=woA=1- 17° Кватернионом, обратным данному кватерниону А, называется кватернион А"" = у£у, для которого выполняется равенство АоА~ = А~" оА=1. Исходя из этого, уравнение N = A<>M при неизвестном М можно решить следующим образом: умножим слева данное равенство на А""1, в результате чего получим А~1оАоМ=М = А~1- Для случая неизвестного А получаем аналогично
18 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ.1 Найденное решение соответствует решению системы линейных уравнений (1.5). Следует отметить, что формулы для получения А и М несимметричны; это связано с некоммутативностью умножения. По этой причине нельзя использовать сим- метричную запись деления кватернионов в виде -д- или N тр Отметим также, что полученные решения являются единственными, ибо если есть еще одно решение, например Mi = А"1 о N, то справедливо соотношение А о М, = А о М, т. е. А о (Mj — М) = 0, откуда следует, что М,-М = 0(см. 16°). Свойство 15° указывает на то, что если М = А~ oN, то для их норм выполняется равенство || М || = тр^-тг • Кватернион, обратный произведению кватернионов, находится следующим образом: МоА 1УП1 - S — (А°М> — _ l|N|| — 11АоМ|| — ||М||о||А И (А!оА2° . = М-,оА-1 >К) -1 (А^Аг0 * Ад) _ lA.-At» ... оАл|| — = А„ оАд-jo .. -1 (1.6) Рассмотрим, далее, произведение кватернионов, имеющих нулевые скалярные части, т. е. произведение «векторов». В соответствии с формулой умножения (1.1) получим X о ц = — я^, — К2ц2 — Х3\13 + I Скалярная и векторная части полученного произведения равны: sqal (к о ц) = — (х^ + Л2Ц2 + Л3Ц3) и I1' к h *з| Л2 Л3 1*1 И2 1*3 1 (Х.ц)=- «1 к h 1 К\ Л*2 Лз J*l fl2 Цз 1
§ 1.1] АЛГЕБРА КВАТЕРНИОНОВ 19 Чтобы иметь геометрическую интерпретацию в трехмерном базисе *ь i2, h (рис. 1.2), положим Ь = Uu Ц = \i (i{ cosd + i2 sind). Произведение этих кватернионов равно к о ц = Лц (— cos Ф + *3 sind), откуда имеем sqal (к о ц) = — X\i cos Ф, vect {к о ц) = fg^jm sin d. Рассматривая правую ортогональную систему осей 'ь h> h (см. рис. 1.2), можно видеть, что понимаемое в обычной векторной алгебре [28] скалярное и векторное произведения двух векторов равны соответственно: к • ц = — sqal (к о ц), к X Ц = vect (Ь о ji) } (1.7) (точкой будем обозначать скалярное произведение, знаком X — векторное, а знаком о — кватернионное умножение). Перемена мест сомножителей Рис- 1-2- не меняет скалярной части произведения, но меняет направление орта fa отсюда следует: sqal (к о ji) = sqal (\i о к), vect (к о ц) = — vect (ц о к). Полученные соотношения позволяют получить: 2sqal(koVL)=-2k.VL = koii + liok9 1 2vect(bon) = 2bXH = W-H°*<. J Используя символы скалярного и векторного произведений, приведем формулу умножения двух кватернионов (1.1) в следующем виде: koVL=-kVL + kXV, 1 А о М = Яоцо — *• • Ц + АоМ- + V>o*< + *< X И- J
20 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 Эти соотношения устанавливают соответствие между векторной алгеброй и алгеброй кватернионов. В заключение рассмотрим формулу умножения трех векторов. Обращаясь к (1.2), получаем sqal (к о pi о v) = sqal (ц о v о к) = sqal (vob ji). ПОСКОЛЬКУ (к о Jl о V) = (— V) о (— Jl) о ( — к) = — V о Jl о к и скалярные части кватерниона и его сопряженного совпадают, а для векторных частей они отличаются знаком, справедливы следующие равенства: sqal (k о ji о v) = sqal (к о ц о v) = — sqal (v о ц о к), vect (к о ц о v) = — vect (X, о ц о v) = vect (vojio X,). § 1.2. ПРЕДСТАВЛЕНИЕ КВАТЕРНИОНА НА СФЕРЕ Любой кватернион с действительными элементами А = А»о + k\ti -f- А»2^2 ~Ь ^з может быть представлен в следующем виде: А = л(^-+^1 + Яд2 + ^э) = л(-^- + х)' (1Л°) где Л = /Ло + Я1 + AS + Я* = УЩ\ = I А | носит название тензора данного кватерниона. Очевидно, что тензор единичного кватерниона равен единице. Величина «—- + -Д- называется верзором кватерниона; смысл вер- зора будет выяснен позднее, пока лишь заметим, что это — кватернион, норма которого равна единице. Введем единичный вектор g, направленный по вектору к: Vk\+k\ + k\ ~ V*?+ *!+*! " С учетом этого вектора векторная часть верзора может быть записана в таком виде:
§ 1.2] ПРЕДСТАВЛЕНИЕ КВАТЕРНИОНА НА СФЕРЕ 21 Замечая, что квадрат скалярной части верзора и квадрат коэффициента при £ в сумме дают единицу, введем следующие переменные: cosd=-£, sinft = л -, 0<д<я. С учетом этих обозначений кватернион (1.10) может быть представлен в следующем виде: A = A(costf + &sintf). (i.il) В выражении кватерниона (1.11) знак угла Ф определяется выбором знака единичного вектора £, т. е. выбором его направления (по сути дела, в выражениях для £ и sind следовало бы поставить знаки ±); пока мы не будем устанавливать однозначности выбора положительного направления отсчета угла Ф и положительного направления единичного вектора £. Представление кватерниона в форме (1.11) удобно тем, что позволяет легко находить корни уравнения ЛЛ=М. Действительно, поскольку gog=:g2__i (B чем предлагаем убедиться непосредственно вычислениями), то A2=AoA = A2(cosfl + gsind)2=A2(cos2ft + £sin2d) и для любой степени п справедлива формула Муавра А* = Лл (cos /id + 5 sin /id). Решени? уравнения Ап = М возможно в том случае, когда вектор ji направлен по вектору g; само решение в этом случае аналогично решению сходного уравнения в теории комплексных чисел, и мы не будем здесь на нем останавливаться. Представление кватерниона в форме (1.11) позволяет получить наглядную геометрическую интерпретацию кватерниона. Рассмотрим нормированный кватернион А = cos Ф + £ sin д. Этот кватернион может быть представлен в виде произведения некоторых двух векторов боа-1, удовлетворяющих следующим условиям: 1) a=bt a=V\\*\\, b=V\\b\\; 2) угол между векторами а и Ъ равен Ф;
22 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 3) плоскость аЪ перпендикулярна к единичному вектору g; 4) векторы а, 6, g образуют правую систему осей (рис. 1.3). Имея в виду свойство 1), можем написать Л = cos tj + ь sm Ф = ii—I • Величины ab cos Ф и gaftsind можно представить в виде скалярного и векторного произведений а-6 и аХ& соответственно (результат векторного произведения в правой системе координат направлен по вектору £). Исходя из этого, получаем А а*Ь + аХЬ — sqal (g°6) + vect (a q Ь) л_ iai ~ wi z~ sqal (b° a) + vect (b ° a) rn boa boa , ^_. 1ЙГ-]Й=&оа bf=&e«-'-(1.12). Из рис. 1.3 следует, что когда векторы а, 6, £ образуют правую систему координат, угол Ф < л отсчиты- вается от а к Ь против направления движения часовой стрелки при наблюдении с положительной оси £. Принятые здесь определенность выбора положительного направления единичного вектора £ и соответствующее ему положительное направление отсчета угла д задаются только правилами векторного умножения векторов а и Ъ\ в принципе можно взять обратное направление отсчета Ф и т. п.; однако установленной здесь условности мы будем придерживаться в дальнейшем. Из соотношения (1.12) следует, что каждому нормированному кватерниону Л может быть поставлена в соответствие дуга большого круга сферы радиуса а=Ь9 ♦имеющая направление положительного угла Ф и соединяющая концы векторов а и Ъ (см. рис. 1.3). В связи с этим кватернион Л может быть однозначным образом представлен дугой большого круга arc Л, плоскость ко- Рис. 1.3.
§ 1.2] ПРЕДСТАВЛЕНИЕ КВАТЕРНИОНА НА СФЕРЕ 23 торого определяется вектором g, а длина — углом Ф. Направление кватерниона задано направлением вектора g; положение дуги А на ее большом круге произвольно, т. е. дуга является скользящей (с произвольным началом отсчета). Рассмотрим некоторые частные случаи. Когда Ф = О или Ф = я, кватернион А = 1 или Л= — 1 соответственно, и вектор g может иметь произвольное направление; этот случай является исключительным, так как любой точке на сфере соответствует Л =в 1 и любой половине окружности Л = —1. Единичному вектору g соответствует четвертая часть большого круга. Если кватерниону Л соответствует arc Л = = S&3&, то обратному, т. е. сопряженному, кватерниону Л-"*1 = Л = cos fl^-g sin ft соответствует arc A, p ав- ная дуге 3&st (т. е. дуге обратного направления, ибо в этом случае такое направление дуги положительно относительно вектора £). Кватерниону —Л соответствует кватернион — cos ft — g sin ft = cos (я — ft) — g sin (я — d), т. е. дуга $&'& (см. рис. 1.3), идущая от диаметрально противоположной точки s4>' к точке <%. Рассмотрим, далее, операцию умножения кватернионов и найдем ее представление на сфере. Пусть даны единичные кватернионы Л и М. Оба эти кватерниона можно представить в виде (1.11) и в виде дуг большого круга соответствующих длин. Дуга кватерниона arc Л располагается на большом круге, перпендикулярном к вектору %; дуга arc M — на большом круге, определяемом вектором ц. Поместим конец дуги arc Л и начало дуги агсМ в точку st> пересечения кругов (рис, 1,4).
24 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I Введя векторы а, Ь, с, получаем A—boa"1, M = aoc~l. Дуга большого круга, соединяющая точки V и 31, определяет некоторый кватернион N = &o<r1. Очевидно, что N = 6 о с"1 = 6 о а-1 о а о с""1 = А о М, т. е. произведению кватернионов соответствует операция геометрического сложения дуг на сфере: агсМ + + arc А я= arc (А о М). Поскольку кватернион А — скользящая дуга на сфере, то А равняется также а о/-1 (углы TO$t> и зФОЯ равны и определяются углом Ь)\ аналогично кватерниону М соответствует do а-*1; отсюда следует, что произведению М о А = d о а"1 о а о /-1 = = dof~l соответствует дуга (F3), представляющая кватернион N7=MoA, т. е. arc М агс А + агс М = arc (M о А). Рис 1.5. Здесь особенно наглядно видно, что происходит, когда производится перестановка сомножителей при умножении кватернионов. Аналогичным образом при геометрическом сложении трех дуг больших кругов А, М и N имеем (рис. 1.5) arc N + arc М + arc A = arc (А о М о N), так как А = ао&-1, М = ЬоС-\ N = co<T\ AoMoN = ao<T!. Таким образом,- векторная сумма нескольких дуг больших кругов, каждая из которых задается кватернионом, дает дугу большого круга, определяемую произведением этих кватернионов в обратном порядке. Из условия, что точке на сфере соответствует кватернион, равный 1, следует, что для замкнутого
§ I.2J ПРЕДСТАВЛЕНИЕ КВАТЕРНИОНА НА СФЕРЕ 25 сферического треугольника arc N + arc M + arc A = О, arcAoMoN = 0 и AoMoN=l. т. е. В общем случае дуги, представляющие циклически расположенные кватернионы Х{9 А2, ..., Ап, образуют замкнутый многоугольник тогда и только тогда, когда A^oA^-jo ... oAi=l. Приведенное в этом параграфе представление кватернионов в виде дуг на сфере во многих случаях оказывается весьма полезным. В качестве примера предложим вывод тригонометрических формул сферического треугольника. Пусть для треугольника (рис. 1.6) дано: arc A + arc М = arc N = arc M о А, А* М L-1 а о 6 = cos а + к sin а, »-is (1.13) • с о а-1 = cos р + ц sin р, N = с о б"1 = cos y + v sin у, где а, р, v — длины дуг кватернионов А, М и N. Поскольку N = MoA, т. е. с о б"1 = (с о а"1) о (а о б"1), то (cos р + \i sin Р) о (cos а + X sin a) = cos y + v sin y- Заметим, что цоХ=— |i-& + l*X&SB—A'a ц—^Xl* = cos^— asin^, где (л — s&) — угол между векторами ,и и X, т. е. угол при вершине а треугольника равен s4> (см. рис. 1.6). Производя умножение (1.13) и приравнивая скалярные части, получаем сразу же известную формулу косинусов cos y = cos p cos a + sin p sin a cos s4>.
26 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I Приравнивая векторные части произведения, получаем ц sin p cos а + ^ sin а cos р — a sin st> sin p sin а = v sin у. Умножим полученное равенство скалярно на а; в силу того, что a-ii = ak=0 и а-а=1, получим sin s4> sin p sin а = — а • vsin у= — а • (Ь Х<*), так как v sin у = 6 X с. Отсюда sin^ _ а» (6Хс) sin y sin а sin P sin у # Последнее произведение не меняется при циклической перестановке векторов и углов, следовательно, имеем известную теорему синусов sin бФ sin # _ sin V siny sinP dine ' § 1.3. ПРЕОБРАЗОВАНИЕ ВРАЩЕНИЯ Алгебра кватернионов позволяет представить конечный поворот (преобразование) в пространстве в простой и удобной форме. Такое представление базируется на следующей фундаментальной теореме [26, 49, 66]. Теорема 1.1. Пусть А и R —не скалярные кватернионы, в этом случае величина jR' — AojRoA"1 (1.14) есть кватернион, норма и скалярная часть которого равны норме и скалярной части кватерниона R. Векторная часть vect/?' получается вращением vect/J no конусу вокруг оси vectA на двойной угол Л. Так, если A = A(cos-| + Ssinir), то vecti?' получается вращением vectfl вокруг оси £ на угол Ф. Доказательство. В соответствии со свойствами нормы, имеем для нормы R' l^l-lAojRoA-M-IIAIIIIjRllA^H^IiyAIBAy^HliRI. (1.15)
9 13 ПРЕОБРАЗОВАНИЕ ВРАЩЕНИЯ 27 Аналогично, используя свойство (1.2), получаем sqalU,=sqal(AoJRoA-I)=sqal(A~1oAol{)=sqal/J. (1.16) Более того, записывая R в виде R = г0 + г9 получаем формулу (1.14) в следующем виде: AojRo А""^ А о го о А"1 + A or о А" = ^o + AoroA-Wo + r7 (1.17) и Я'=Го + г', т. е. операция (1.14) изменяет только векторную часть кватерниона R: vect (А о R о А"1) = А о (vect R) о А"*1 или т = А о г о А -1 (1.18) Определим характер преобразования векторной части кватерниона (1.17). Представим кватернион R в виде (1.11) U= 11? |(cosф + е sinф)= = /? (cos ф + е sin ф). Тогда, в соответствии с (1.17), имеем vect fl'ser'e* — А о (Re sin ф) о А~* = ««/^ПфСАоеоА^г^Яе^пф. Рис. 1.7. Чтобы показать геометрическую суть преобразования единичного вектора е', положим (рис. 1.7) е = f j cos ф + i2 sin ф, а вектор кватерниона А направим по оси 1Ь т. е. Бв'ь в этом случае в' = А о е о А-1 = (А о i{ о A"1) cos ф + (А о i2 о A"1) sin -ф.
28 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I Поскольку vect А и i{ параллельны, то A of, о А = t= А о А""1 о *! = *,. Для 12 имеем AofgoA""1 =\cos-2+i\sm-^joi2o(Cos^--ii sin j)3 = (*2 cos^ + *3 sin у) о (cos j — ti sin |) = = к (cos2 у — sin2 ^) + *з (2 sin -^ sin -|), т. е. орт i2 переходит в орт й = i2 cos 0 + *з sin 0, получаемый путем вращения орта i2 вокруг оси i{ (т. е. вокруг £) на угол Ф в положительном направлении. Соответственно и е = lj cos я|? Н- i2 s*n "Ф переходит в е' = i{ cos -ф + *2 sin ф, т. е. совершает вращение по конусу с осью £ на угол О. Таким образом, доказано, что при преобразовании (1.14) векторная часть R вращается по конусу вокруг оси vect А. Операция (1.14) изменяет только векторную часть кватерниона — по этой причине ее можно рассматривать как операцию преобразования вектора г в вектор г',г записываемую в виде (1.18). Поскольку норма кватерниона не меняется преобразованием (1.15), то длина вектора (т. е. его модуль г = V\\ RII — >*о= Vr\ + т\ + ГР также остается неизменной: r'=V\\*'\\-{r'b)2=V\\*\\--rl = r. Отсюда следует, что преобразование (1.18) является ортогональным преобразованием. Согласно теореме Эйлера [16], любое ортогональное преобразование есть вращение вокруг некоторой оси. Преобразование (1.18) определяет сразу же ось этого вращения: этой осью является vect А = X,, поскольку только эта ось не меняется преобразованием к = А о Я» о А"1 = А о А"" о^ = Я».
§ 1.3] ПРЕОБРАЗОВАНИЕ ВРАЩЕНИЯ 29 В соответствии с этим операции (1.18) и (1.14) будем называть операциями (преобразованиями) вращения. Дадим координатное выражение преобразования (1.14). Пусть R = Го + ГД + fjfa + Г3*з> Я' = 'О + ГЙ1 + Г2*2 + '3*3 И А = Xq + ^1^1 Н~ ^2 "Ь ^3*3* Выполняя умножение (1.14) и приравнивая члены при четырех единицах, получаем выражение компонент кватерниона R' в виде линейной функции компонент /?': го = г0, , ^0 + Ъ*\ ~ ^2 "~ ^3 , ^ (^1^2 "~ У*з) \ ^ (^Лз "^ ^(Лг) I П = Д2 Г1Т Д2 Г2Т да г3» I , 2 (^^2 + ^з) , Др + Я2 — ^t — Я3 , 2 (Я2Я>3 ?— ЯдАц) г г2 = д5 Г1П *"д2 Г2И Д2 Г3> , 2(^j^3 —XqA^ 2 (Я^з + AqAg) Я0 + Я3 — Х\ — Я2 1 ^3 = д5 ГН Д2 r2i д5 Г3- I (1.19) Можно проверить, что детерминант преобразования компонент векторных частей кватерниона равен единице. В том случае, когда кватернион Л, задающий преобразование вращения, есть нормированный кватернион (||А|| = Л2=1 и А-1 = А), операции (1.14) и (1.18) запишутся в таком виде *): Я' = ЛоЯоА, г' = ЛоГоЛ. (1.20) А А Пусть Л = cos-2"+ S sin »2— нормированный кватернион. Форму Ло( )оА можно рассматривать как *) Преобразование (1.20) в случае, когда Л не есть единичный кватернион, дает наиболее общую форму преобразования пространства: вращение и растяжение (величина последнего определяется Л2). Отсюда Л получило название тензора («растяжителя») пространства, а А/Л — верзора; однако э.ти названия не употребляются в наше время, так как в понятие тенабра вкладывается более широкий смысл. Величину Л будем далее называть модулем кватерниона.
30 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 оператор вращения, задаваемый кватернионом А; под преобразованием вращения, определяемым А, будем понимать именно этот оператор; будем говорить также, что кватернион А задает вращение на угол Ф, понимая под этим операцию (1.20). Оператор Ао( )оА определяет поворот на угол Ф; рассмотрим кватернион (—А); поскольку (— А)=— А, то вращения Ао( )оА и (— А)о( )о(—А) дают один и тот же результат. Кватернион - А = cos (я — -J-) + (- g) sin (я — -g-) задает вращение на угол 2я— Ф вокруг оси —£, т. е. в обратную сторону; при этом становится очевидным, что результат такого вращения тот же, что и результат вращения на угол Ф вокруг оси g. Поскольку вращение А о А о ( ) о А о А = 1 о ( ) о 1, то вращение А о ( ) о А задает поворот в обратную сторону на угол •&, что, впрочем, очевидно, так как А = cos -у — g sin ^ = cos ( — -у) + E sin (— т) • Пусть нормированный кватернион А задает поворот на угол Ф по оси к, а нормированный кватернион Mf- поворот на угол у по оси ц. Последовательность повЬ- ротов А и М соответствует оператору МоАо( )оАоЙ = (МоА)о( )о(Й7А). (1.21) Поскольку М°А также есть нормированный кватернион, скажем, М о А = cos -J- + v sin -|-, то результат двух последовательных поворотов эквивалентен одному повороту на угол tp вокруг оси v; ось результирующего поворота и угол находятся по компонентам результирующего кватерниона по правилам их умножения (1.5). Таким образом, вращение А и последующее вращение М эквивалентны одному вращению МоА. В более
§ T.3) ПРЕОБРАЗОВАНИЕ ВРАЩЕНИЯ 31 общем случае последовательность вращений Аь А2, ..., Ал эквивалентна одному вращению A^oA^^o ... оА2оА1# Рассмотрим некоторые частные случаи. Если А=Х, т. е. д=90°, то вектор е'=ХоеоХ= — Хое©Х получается поворотом е на 180° по конусу вокруг оси X. Таким образом, преобразование — X о ( ) о X дает тор, симметричный первоначальному относительно оси X (рис. 1.8). Преобразование Х°( ) ©X дает вектор, -Ас*оА обратный вектору —Хо. о( ) оХ, т. е. может рассматриваться как зеркальное отражение вектора относительно плоскости, перпендикулярной к X. Последовательность двух зеркальных отражений, определяемых векторами X и Рис. 1.8. \i [т. е. последовательность вращений Хо( )оХ и цо( )оц], эквивалентна одному оператору JI о X о ( )оХоЦ = ЦоХо( )о(Цо X)"1, задающему вращение. Но так как ц о X = — ji«X — XXf*> то ц о X = — cos ф — 6 sin ф = — (cos ф + 6 sin ф), где ф —угол между векторами X и р. Отсюда следует, что последовательность двух зеркальных отражений относительно двух плоскостей эквивалентна вращению вокруг линии пересечения этих плоскостей на двойной угол между ними. Вспоминая представление единичного кватерниона в виде дуги большого круга единичной сферы, полюсом которой является вектор кватерниона, можно видеть, что операция вращения дает поворот, определяемый двойным углом (т. е. двойной дугой) вокруг этого же полюса. Рассмотрим теперь сферический многоугольник; пусть его стороны, обходимые последовательно (циклически),
32 КЙАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I представляют кватернионы Ль Л2, ..., Ал; в соответствии с результатами § 1.2 имеем K°K-i ° • •• °А,= 1. Поскольку (АЛоАЛ„,о ... оА,)=1, то оператор -An°An-i° ... о А, о ( JoA^^o ... оАп=Ь( )>°1, т. е. такая последовательность вращений А,, А2. ..., АЛ дает исходное состояние. Отсюда, в частности, следует теорема Гамильтона — Донкина: Если s&9ffi? — некий сферический треугольник, то три последовательных вращения, определяемых дугами 23ВФ, 2®\s# и 2st>& (т. е. относительно их полярных осей), приводят тело в исходное состояние. § 1.4. ГЕОМЕТРИЯ НА СФЕРЕ Правила умножения гиперкомплексных единиц получаются довольно естественным образом: квадраты мнимых единиц равны —1 и произведение i\oi2 единственным образом может быть положено равным i3; остальные правила умножения получаются из свойства ассоциативности умножения*). Эти правила определяют числа, имеющие двойной смысл: с одной стороны, это некоторые геометрические образы (векторы в четырехмерном пространстве), с другой стороны, это операторы преобразований в трехмерном пространстве. Чтобы пояснить эти свойства кватернионов, рассмотрим здесь некоторые задачи сферической геометрии, которые исторически способствовали открытию кватернионов. *) Действительно, из этого равенства умножением получаем *l°(*le*2)==*l<>*3 = (*l<>*lW2-=--*2, Перемножим эти два равенства: (Ii'h)*(h°i2) = i2°li=*li<>(h<>it)<>i2=-ii<>i2 = -h, (*3e*2)e(*2e*i) —*1°*з г=^з0(^0<2)°^я= — *1°*з и т. д. Можно проверить, что выполняются все правила умножения гиперкомплексных единиц,
§ 1.4] ГЕОМЕТРИЯ MA СФЕРЕ 33 Геометрия на сфере во многом напоминает геометрию на плоскости. Так, если si и 93— две точки на сфере, то можно аналогично отрезку на плоскости рассматривать величину si93 — 98 — si, понимаемую как расстояние между точками si и 93, т. е. дугу большого круга, идущую от точки si к точке 93. Понятие разности двух точек как дуги, их соединяющей, включает в себя и понятие суммы; очевидно, что (38 — st) + si = &t откуда следует si93 + st = 3B. (1.22) Смысл последней операции можно истолковать так: дуга si93 перемещает точку si в точку 33. Здесь уже появляется новый смысл, приписываемый дуге, а именно, смысл оператора; по этой причине дугу называют также верзором. Приведенное определение приписывает дуге si98 определенное направление: от точки si к точке 93. Под дугой 93si понимается дуга большого круга, идущая от точки 93 к точке si, т. е. дуга обратного направления*): поскольку 93si=si — 93 и si9$+ +&st=93 — si+si — 98 = О, то 93si=—si&. Данного определения разности точек достаточно, чтобы задать сложение и вычитание дуг на плоскости. Рассмотрим уравнение (si — V) + (# — 93) ■■ (si — 93), которое в соответствии с определением запишется как <9si> + a№ = &sl9 (1.23) т. е. сумма двух сторон сферического треугольника равна третьей его стороне (рис. 1.9). Две дуги будем считать равными тогда и только тогда, когда они лежат на одном большом круге, а их длины и направления равны. Равные дуги Могут быть *) Очевидно, что на большом круге есть две дуги, идущие от точки зФ к точке 3S. Пока мы не будем делать различия между ними. 2 В. Н. Бранец, И. П. Шмыглевский
34 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I совмещены движением по большому кругу, на котором они находятся. Замечая, что в соответствии с этим определением (см. рис. 1.9) 9F& = <&&' и $$>'<& = <&st>y получим, переставляя местами слагаемые в равенстве (1.23), т + V&=v& + &'v=ж* $', т. е. получим новую дугу, не равную дуге &$t>. Отсюда следует, что сложение дуг на сфере некоммутативно. Сложение дуг коммутативно только тогда, когда они лежат на одной дуге большого круга: в этом случае сложение сводится к простому арифметическому сложению. Вычитание дуг может быть получено из сложения заменой знака одного слагаемого; так, рассмотрим разность Htsl — Sffl (см. рис. 1.9); поскольку «^ = — «g^, то <еа - т=vst + <вя=<вж + &v—®'&. Поставим в соответствие каждой дуге S&38 ее полюс, при наблюдении с которого вращение от точки si к точке Я происходит против направления движения часовой стрелки. Этим самым осуществляется различие между двумя путями от ${> к 3S (на угол Ф и 2я — Ф), так как каждому пути будет соответствовать свой полюс. В геометрии сферы существуют два ряда образов, для которых справедливы все теоремы: это дуги больших кругов и их полюсы. Соответствие полюса дуге его экватора, т. е. соответствие точки дуге, оказывается настолько адекватным, что необходимо ввести в известном смысле их равенство. Действительно, ранее было дано определение дуги как разности двух точек, однако операция собственно сложения точек еще не определена. Чтобы остаться в рамках того положения, что «аддитивность» точек дает дугу, необходимо сделать новую предпосылку. Положим точку и дугу однородными между собой, т. е. каждой точке, как полюсу, сделаем равной положительную дугу экватора длиной я/2 (квадрант). Покажем, что введенная предпосылка оставляет в силе рассмотренные выше правила.
j M] ГЕОМЕТРИЯ НА СФЕРЕ 35 Действительно, # — s6 = st&t &=&£> и $£ = &<&, т. е. точки равны своим верзорам-квадрантам (рис. 1.10). Имеем # - а = &&> — 8<& = 8£> + Ш = ЪФ, и действительно, <&2) = s4>&f так как они лежат на одном большом круге и длины дуг &&) и sffi равны я/2. Далее, справедливо также равенство (3S — Ж) + & = $, так как &$ = <&&) и si> = 8V9 откуда следует, что (^-^) + ^ = ^^ + ^ = Любой точке s4> на сфере Рис. 1.10. соответствует ее антипод зФ\ антиподу $&' соответствует верзор обратного направления, т. е. а + а'=о и ^=-^'; нетрудно видеть, что эти равенства справедливы и для дуг-квадрантов этих точек. Исходя из этого, можно обратить сумму двух точек в их разность и тем самым определить ее. Рассмотрим, например, сумму я + &=&-&'=&'&=№$ + аа')=ая + п9(1.Щ где через я обозначена дуга s&$4>\ равная половине большого круга. Меняя местами 9& и *я£, имеем ^ + # = &$^ + я, но так как +я равно —я, поскольку дуга не меняется от добавления 2я, получаем si + #= - («^9 + я)= - (Я + ^). Итак, сумма двух точек есть также дуга (верзор), не равная, вообще говоря, квадранту, поэтому сумма (как и разность) не равна, вообще говоря, точке. Сумма меняет знак при перестановке слагаемых. 2* «^5 ~Я>
36 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. Т Существует единственный случай, когда сумма и разность точек дают точку. Пусть &ъ &ъ 3^3 — три точки сферы такие, что дуги З^З^» 5^3 и &Jfx суть квадранты с положительными полюсами в точках 5^3, &х и &ч соответственно (рис. 1.11). В этом случае Эх + 2f2 = 2f22fx + я = 2fx2f2. Но, поскольку, по определению, 5^,5^2=^2 — ^1 = ^3» то 2/х + 5^2 = 5V Из полученного соотношения следует, что сумма или разность двух точек определяет Рис. 1.11. Рис. 1.12. снова точку только тогда, когда угол между ними равен я/2. Меняя циклически 2f\, &2 и 5^, получаем ^1 + ^2=^з, ЗГ2 + ЗГэ = *и Я* + ЗГх = ЗГ* (1.25) Поскольку для антиподов квадранты меняют направления, имеем 2f2 + ух = ffit 2fz + 2f2 = Ги 2fx+2fz = 3fi. (1.26) В этих формулах также можно найти двоякий смысл точки и верзора: кроме непосредственного геометрического образа, точку (верзор) можно понимать как оператор вращения. Так, первое слагаемое является оператором, переводящим второе слагаемое в результат: 2fx вращает точку 5^ на одну четвертую часть круга, после чего она совпадает с 5^, и т. п. Теперь можно доказать теорему о вращении.
§1.4] ГЕОМЕТРИЯ НА СФЕРЕ 37 Пусть на большом круге сферы даны пять точек #"", s&, 38, Ф, 36, отделяющих равные дуги (рис. 1.12). Положим, что имеются две совпадающие сферы —подвижная и неподвижная. Повернем подвижную сферу вокруг оси Оз& на угол я; точка 91 при этом совместится с точкой #". Повернем, далее, подвижную сферу вокруг оси 0& на угол я; при этом точка s£ совпадет с точкой Ф, а точка &~ (т. е. 3$) — с точкой Ж В этом конечном положении дуга st£ окажется смещенной по дуге большого круга до положения St>3№% т. е. смещенной на дугу s&@) = 2st>&. Первый поворот является поворотом на двойной квадрант s&, т. е. на 2,5$, второй — соответственно на 23&. Отсюда следует, что сумма вращений 2$f + 2j£ эквивалентна вращению на дугу 2sl&t т. е. 2^ + 2^ = 2^59 [последнее следует также и из (1.24), поскольку поворот на угол 2я приводит к начальному положению]. Точно так же можно показать, что 2<в + 2% = 2т, а следовательно, выполнив последовательно два таких вращения, получим 2# + 2$ + 2$ + 2а = 2т + 2&Я. Очевидно, что вращение 2$ + 2$ приводит к исходному состоянию; кроме того, 2<& + 2s4> = 2s£<&>, откуда 2st<& = 2т + 2st$9 (1.27) т. е. результат последовательных вращений сферы на удвоенную дугу 2s&3& около ее положительного полюса и на удвоенную дугу 29Й%? около ее положительного полюса всегда эквивалентен вращению сферы около третьей дуги сферического треугольника stm, а именно, на удвоенную дугу 2$№? около положительного полюса дуги stV. Следовательно, если между тремя вер- зорами я, а, т существует соотношение л + а = х9 то всегда по отношению к вращению будет иметь место условие 2я +2а = 2т.
38 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. 1 Из того соображения, что эта эквивалентность независима от начального положения сферы, следует ассоциативность сложения вращений. Полученного материала достаточно, чтобы перейти к изучению операций над векторами в пространстве. Свяжем с каждой точкой радиус-вектор. Необходимо поставить в соответствие найденным операциям сложения верзоров и точек операции над векторами. Поскольку сложение верзоров некоммутативно, ему может соответствовать только операция умножения векторов; по этой причине сферическое сложение назовем умножением, а вычитание — делением. Обозначим векторы точек з4>, &, 99 лежащих на единичной сфере, через аи Ъи С\. Можно показать, что при приведенном нами определении действий над векторами сохраняются все основные положения, задающие действия над точками. Под частным двух векторов bxjax = «r&joap1 будем понимать разность точек <% — $!>, т. е. верзор «я£#. Очевидно, что соотношение сферического ^ треугольника (1.23) при этом со- | храняется: соотношению (s& — <в)-\- + (<& — &) = <&& + && = && COOTIE ветствует равенство т. е. произведение двух частных дает частное того же типа. Поскольку точке, например, <& Рис. 1.13. (рис. 1.13), соответствует верзор JCJf = N — М, то каждому вектору сх соответствует частное лот""1, т.е. сх = п°т~х. Очевидно, что антиподу <&' соответствует вектор с'и противоположный вектору си т. е. Ci = —€?i. С другой стороны, так как точке <g>/ соответствует верзор JfJl = Jl — jr, то с'\ = т°п-\ откуда следует, что сх о с'\ = 1, что и должно быть, так как для верзоров V + V =0. Полученное соотношение показывает, что вектор с'\, противоположный вектору сь удовлетворяет условию
$ 1.41 ГЕОМЕТРИЯ НА СФЕРЕ 39 c[ = cf!, ибо только в этом случае сх ос( = 1. Но, с другой стороны, с\ = —си откуда следует, что сх о (— а) = 1 и с{ о с{ = — 1, т. е. квадрат любого вектора (единичного) равен —1. Эти положения позволяют для системы трех ортогональных единичных векторов iu fc, *з, которые проходят через точки Sfu &2, Зг (см. рис. 1.11), получить, в соответствии с (1.25) и (1.26), следующие соотношения: *i°*i=— 1, h°h=* — 1, ^з ° *з = — 1» ] *1°*2 = *3> *2°*3=*Ь *3°*1 = *2> | J, of, .#=-{,, «3°«2='l= — «1, *1°*3=*2=-*2, i (1.28) где I] — векторы противоположных направлений. Найденные правила умножения единичных векторов можно перенести на умножение произвольных векторов в пространстве. Для этого представим произвольный вектор а в виде где а\ — единичный вектор, а а — число (скаляр), которое назовем тензором вектора. Рассмотрим частное двух векторов, а=аа{ и ft = pfrx, которое обозначим через А: A = j = aob~l = jaiobrl. (1.29) Первый фактор полученного частного а/0 называется тензором, а второй й\оЬТх—верзором. Частное А зависит от отношения длин векторов, от угла между ними и от положения плоскости, а поскольку положение плоскости определяется двумя параметрами, то для определения А нужно всего четыре параметра — по этой причине А называется кватернионом. Ортогональные единичные векторы lu *2, h (1.28) являются поэтому также кватернионами. Правила их умножения обнаруживают тот двоякий смысл, который присущ кватернионам: с одной стороны, они суть некоторые геометрические образы, с другой, — операторы. Так, в произведении i\ ° h можно первый множитель рассматривать как оператор,воздействующий на вектор
40 КВАТЕРНИОНЫ И ИХ СВОЙСТВА [ГЛ. I i% и переводящий его в вектор *3. Поскольку кватернион (1.29) определен как частное, то если угол между векторами а и 6 равен углу между векторами с и d, отношения а/Ь и с/а равны и, кроме того, плоскости, образуемые парами векторов а, 6 и с, d, совпадают (рис. 1.14), то их отношения а°Ь~ =c°d~ образуют один и тот же кватернион. Таким образом, кватернион определяется плоскостью, образуемой векторами а, Ъ и углом между ними. *v—1* I >1а \ \о S\ *\ / ! Рис. 1.14. Рис. 1.15. Заметим, что так как верзору я/2 соответствует точка (вектор), то частное двух взаимно перпендикулярных отрезков есть вектор. С другой стороны, если векторы а и Ь коллинеарны, то их частное есть просто действительное число. Рассмотрим случай произвольного угла между векторами а и Ь (рис. 1.15). Вектор а можно разложить на сумму а = а0 + ап) в этом случае Л = (ао + лл)о6~" =Оо<>Ь~ -\-ап°Ъ~ будет представлять сумму действительного числа, равного отношению модулей ао/Ь9 и вектора. Отсюда следует, что каждый кватернион может быть единственным образом разбит на скалярную и векторную части. Нетрудно видеть, что скалярная часть (1.29) равна ь ь р ъ ' модуль векторной части аналогично равен у sin О. Если разложить, далее, вектор кватерниона по ортогональным единичным осям iu i2, *з, то придем к тому представлению кватерниона как гиперкомплексного числа, с которого начиналась эта глава.
ГЛАВА 2 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА В настоящей главе будут рассмотрены ортогональные преобразования, которые являются математической формой описания вращательного движения твердого тела [16, 44, 66]. Произвольное конечное движение твердого тела может быть разложено на поступательное перемещение, связанное с некоторой произвольно выбранной точкой, и вращение относительно этой точки. Соответственно этому из шести независимых координат, описывающих движение твердого тела, три координаты задают перемещение некоторой фиксированной точки тела в пространстве, а три координаты характеризуют его вращение. Нас будет интересовать только вращение твердого тела относительно фиксированной точки. Эта проблема является самостоятельной задачей механики; решение этой задачи требуется при исследовании любого движения тела, когда учитываются его конечные размеры. В большинстве практических случаев вращательное движение не зависит от поступательного перемещения твердого тела; так, например, когда фиксированная точка является центром масс, тело находится в свободном движении в произвольном поле сил. При решении любой динамической или кинематической задачи, где твердое тело не может быть представлено точкой, требуется рациональное описание кинематики вращательного движения. Существенную роль при этом играет выбор кинематических параметров, соответствующих трем вращательным степеням свободы движения твердого тела. Известен ряд различных кинематических параметров, используемых для описания движения твердого тела: направляющие косинусы, углы Эйлера и Крылова, параметры Кейли — Клейна, параметры Родрига — Гамильтона [19, 31, 44]. Одними из наиболее удобных параметров являются параметры
42 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Родрига — Гамильтона, представляющие собой компоненты кватерниона. Эти параметры не вырождаются при любом положении твердого тела (т. е. не обращаются в бесконечность ни сами параметры, ни скорости их изменения), в отличие от углов Эйлера. Число параметров Родрига — Гамильтона равно четырем, т. е. имеется одно уравнение связи, в отличие от шести уравнений связи в случае направляющих косинусов. С другой стороны, эти параметры характеризуют наиболее естественный способ задания положения твердого тела с помощью плоского вращения. Конечное вращение твердого тела (т. е. движение тела, имеющего неподвижную точку) имеет ту особенность, что оно всегда оставляет неподвижной в пространстве одну ось. Этот факт устанавливается известной теоремой Эйлера; в соответствии с ней любое ера- щательное движение твердого тела эквивалентно плоскому вращению вокруг некоторой оси и может быть задано конечным поворотом вокруг этой оси, или вектором конечного поворота, направленным по оси эйлерова вращения и имеющим длину, зависящую от угла вращения. Плоское вращение имеет один и тот же угол, не зависящий от центра вращения; при этом, естественно, оси вращения остаются параллельными друг другу. В этом смысле вектор конечного поворота является инвариантом произвольного перемещения тела. В частности, произвольное перемещение можно разложить на два поступательных перемещения — вдоль оси вектора поворота и в плоскости вращения — и собственно вращение. Выбором оси (или центра) плоского вращения можно поступательное перемещение в плоскости вращения свести к нулю (т. е. объединить его с вращением; при этом ось вращения становится так называемым центром вращения); в этом случае произвольное перемещение твердого тела сводится к винтовому движению [19]. Вектор конечного поворота определяет параметры Родрига — Гамильтона (так же, как и параметры Кей- ли — Клейна). Применение такого рода кинематических параметров естественным образом приводит к использованию кватернионов. Кватернионы дают аппарат, позволяющий наиболее удобным образом записывать все one-
§2.1] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 43 рации, связанные с описанием и исследованием движения твердого тела. В этой главе рассматриваются ортогональные преобразования, являющиеся в соответствии с теоремой Эйлера конечными поворотами. Устанавливается изоморфное соответствие операции ортогонального преобразования и операции умножения кватернионов. Применение кватернионов позволяет наиболее полным образом исследовать теорию конечного поворота. В частности, все известные результаты теории конечного поворота [31] получаются в виде операций умножения кватернионов. Использование кватернионов позволяет получить ряд новых результатов: теорему сложения преобразований (поворотов) для параметров Родрига— Гамильтона, обобщение теоремы переставимости конечных поворотов и т. д. С другой стороны, полученные формы операций над кватернионами, соответствующие ортогональным преобразованиям, имеют достаточно универсальный вид и повторяются при записи аналогичных операций в любых параметрах. Приведенное ниже исследование связи параметров Родрига — Гамильтона с другими кинематическими параметрами довольно четко иллюстрирует этот факт. Развитый в этой главе аппарат позволяет в удобной форме представлять все операции, связанные с ортогональными преобразованиями. § 2.1. ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ Вращательное движение твердого тела может быть описано различными способами. Наиболее общим из них является способ, при котором ориентация твердого тела определяется ориентацией связанной с телом ортогональной (декартовой) системы координат. Будем считать, что с твердым телом жестко связана прямоугольная система координат £, имеющая единичные векторы еи е2, ег. Движение тела рассматривается относительно прямоугольной системы координат J с ортами осей iu i2t н. Системы координат Е и J будем называть соответственно связанным и неподвижным базисами; будем считать, далее, что начала обоих базисов
44 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 расположены в одной точке, вокруг которой осуществляется движение твердого тела. Положение любой оси е* базиса Е в системе координат / определяется тремя направляющими косинусами, образуемыми этой осью с осями ij (k, /=1, 2, 3): ак\ = ек * *b ak2 = Ck * *2> акЪ = Ck • *3- Система девяти направляющих косинусов определяет полностью ориентацию связанного базиса Е относительно исходной системы координат /; расположим эти косинусы в матрицу размера 3X3, называемую матрицей направляющих косинусов: A = ||fl*,||- а\\ а\2 Д13 ^21 ^22 ^23 #31 #32 #33 = 11 **•*/!!. (2.1) Любой орт связанной системы Е может быть выражен через орты базиса / с помощью соотношений*) ek = (** • i\) i\ + (** • У h + (ek • *з) *з = 2 я*/*/ • (2-2) Данное соотношение является одним из способов задания движения твердого тела, т. е. преобразованием одной координатной системы в другую. Рассмотрим теперь, как направляющие косинусы позволяют выразить компоненты некоторого неизменного вектора в системе координат £, если известны его компоненты в системе /. Пусть г — неизменный вектор, а г/ и rk — его пРоекВДи на базисы / и Е соответственно. Очевидно, что г = Гх1х + r2i2 + r3i3 = r[e{ + r'2e2 + r'3ey *) Отметим для справки, что определяемые соотношением (2.1) элементы да,- суть ковариантные составляющие вектора ек в базисе J; разложение же вектора ек на орты базиса задается контравариант- ными компонентами е*. в базисе /. Для ортогональных систем координат Е и I ковариантные и контравариантные компоненты совпадают [28], благодаря чему возможна формула (2.2).
§ 2j] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 45 Отсюда легко получить, что ГН = Г * 'А=ГА ' ek + Г2*2 • '* +Г3*3 ' •*• т. е. r'k=%akJrh (2.3) Очевидно, что преобразование (2.3) может определять преобразование системы координат; это есть другой способ задания преобразования базисов, когда описывается изменение компонент неизменного вектора, задаваемое соотношениями (2.3), тождественными соотношению (2.2). Соотношения (2.3) являются уравнениями линейного преобразования, определяемого матрицей \\ац\\. Ввиду того, что это преобразование описывает движение твердого тела, матрица (2.1) является матрицей ортогонального преобразования; элементы ац удовлетворяют известным условиям ортогональности: з з fl при j=k,\ Se^-Se/'e«-e/*-l0 при /^}'М Условия ортогональности являются отражением свойства твердого тела сохранять неизменным расстояние между любыми его точками. Неизменность длины вектора г означает, что должны выполняться равенства -|Х|"''Г')(1"'ЛКШЛ0''ЬГ'' M откуда и следует первое соотношение (2.4). Рассмотрим обратное преобразование, переводящее базис Е в базис /; оно будет определяться матрицей А~ =|а^|, обратной матрице А. Аналогично соотношениям (2.2) и (2.4) обратные преобразования могут быть записаны в виде равенств, связывающих орты
46 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 (2.6) базисов Е и /, или в виде соотношений между проекциями неизменного вектора на эти базисы: з з Повторяя вывод (2.5), можно получить, что элементы обратной матрицы должны также удовлетворять условиям ортогональности С другой стороны, рассмотрим следующее представление вектора г: з з з/з \ г = 2 гД = Ц г^у== 2 г,' 2 ау*{* . Изменим порядок суммирования в полученной сумме, при этом вначале будет происходить суммирование по второму индексу, а затем по первому: '-i(|v;)v т. е., во-первых, происходит транспонирование матрицы А, во-вторых, получаем, что з г*—21 V*;. (2.8) Сравнивая полученное соотношение (2.8) с равенствами (2.6), можно видеть, что flM-V (2-9) т. е. элементы обратной матрицы равны элементам транспонированной матрицы. Очевидно, что при этом равенство (2.7) переходит во второе условие ортогональности (2.4). Кроме этого, условия (2.9) сами по себе являются условиями ортогональности, совершенно эквивалент-
§2.1] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 47 ными*) условиям (2.4); обозначая транспонированную матрицу |ал/|=Ат и обратную |а^|=А~\ запишем условие (2.9) в виде А-' = АТ. (2.10) Условия ортогональности следуют и непосредственно из соотношений (2.2) и (2.6), если учесть, что для орто- нормированного базиса выполняются равенства '/•** = */*. е*-*/ = д*/. (2.11) Подставляя в эти равенства выражения для ортов (2.2) или (2.6), получим непосредственно условия (2.4), которые, очевидно, есть отражение условий ортогональности. Для удобства задания преобразований используем матричную символику. Введем матрицы-столбцы, составленные из единичных векторов ц и е*, которые обозначим теми же символами, что и базисы, т. е. 1 = 1*1 к к , Е- «1 1 е2 \е3 1 (2.12) Используя операции умножения матриц, преобразование (2.2) можно записать в таком виде: Е=А1, 1 = А~'Е = АТЕ. (2.13) Введем также матрицы-столбцы, составленные из компонент вектора* г в каком-либо базисе, т. е. из величин г* и г у. R = В этом случае представление (2.3) может быть записано в матричной форме: г = R'T£ — ETR' = RrI = ITR, (2.14) *) Это можно проверить непосредственно, вычисляя элементы обратной матрицы, которые равны соответствующим дополнениям; при этом равенства (2.9) выполняются при наличии равенств (2.4) и обратно- 1Г| \г»\ \гя\ !, R'=-| 1 г{ 1 гч г'Л
48 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 и эти соотношения могут быть легко получены с использованием введенной матричной символики*): ETR' = (AI)T R' = ITATR' = ITR, откуда R = ATR', R'=AR (2.15) (здесь АТА = ААТ = 1, где 1 = || 6if || — единичная матрица). Ортогональное преобразование в форме (2.13) и (2.15) определяется матрицей А, которую можно рассматривать как оператор, преобразующий / в Е (при первом способе задания вращения), или как оператор, задающий переход между компонентами неизменного вектора при преобразовании базисов (при втором способе задания преобразования вращения). Очевидно, что оба эти способа совершенно эквивалентны и достаточно задать вращение любым из этих способов. Однако существует еще один способ задания вращения твердого тела, имеющий другую интерпретацию ортогонального преобразования. Рассмотрим вектор, положение которого не меняется относительно преобразуемого базиса, т. е. вектор, совершающий вращение совместно с системой координат. Очевидно, что такой вектор изменяет свое положение в пространстве в результате вращения базиса; соответственно этому вектор г при преобразовании базисов переходит в новый вектор г'. Вектор г' можно определить, так как компоненты вектора г в исходном базисе и компоненты вектора г' в преобразованном базисе одинаковы: 3 3 r=llrJiJ= RTI, r'= Sr/e/=RTE. (2.16) Используя соотношение (2.13), можно найти преобразованный вектор г' = rte = RTAI = (ATR)T I = R,TI, *) Используется также следующее свойство матриц: транспонированная матрица произведения двух матриц равна произведению транспонированных матриц в обратном порядке.
§2.1] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 49 где R'—матрица-столбец компонент вектора г' в базисе J. Из полученного равенства следует, что R'=ATR, (2.17) а поскольку матрица Ат преобразует вектор г в вектор г7, ее можно рассматривать как оператор, задающий преобразование векторов; при этом можно условно записать r' = AV. (2.18) Полученное условное равенство (2.18) есть следствие равенства (2.17), которое в матричной форме задает компоненты нового вектора. Это — еще одна форма задания движения, при которой задается вращение вектора относительно неподвижной системы координат. Следует отметить, что преобразования (2.17) и (2.18) суть форма общего аффинного преобразования (линейного преобразования; см., например, [28]). Матричное соотношение (2.17) определяет следующее ортогональное преобразование: з г;=2а*/г,. (2.19) Важно отметить, что соотношения (2.17) или (2.18) формально подобны соотношениям (2.15) или (2.3), вследствие чего последние часто трактуют также как операции преобразования вектора в вектор. Однако формулы (2.3) и (2.15) определяют координаты одного и того же вектора в разных базисах, тогда как соотношения (2.17) и (2.18) определяют действительно разные векторы в одном базисе (в нашем случае в базисе /). Вследствие этого преобразование R в R' в случае (2.15) выполняется матрицей А, а в случае (2.17)—обратной матрицей Ат. Операция (2.18) преобразования вектора в вектор позволяет задать преобразование базисов еще и в форме ek = K4k (*=1, 2,3), (2.20) при которой каждый орт базиса / преобразуется в орт
60 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 базиса Е путем применения преобразования (2.18). Можно проверить, что орты ek образуют ортогональную систему осей. При этом следует отметить, что в первом рассмотренном случае преобразования базисов (2.2) или (2.13) орты нового базиса Е выражаются через орты старого базиса /, тогда как в преобразовании (2.20) компоненты ортов нового базиса выражаются через компоненты ортов старого базиса, причем эти компоненты берутся в одной и той же координатной системе. В связи с этим нужно различать следующие возможные способы задания вращения твердого тела: а) преобразование задается в виде операции преобразования базисов (2.2), (2.13) или, что то же самое, в виде преобразования компонент неизменного вектора при преобразовании базисов (2.3), (2.15); при этом вращение вектора задается обратной операцией; б) преобразование задается в виде операции вращения вектора (2.18) или (2.17). Если совместно с этим происходит и вращение базиса, то положение преобразуемого базиса относительно исходного определяется обратной операцией. Легко понять причину различия этих двух интерпретаций: при одном и том же вращении связанной системы координат относительно исходной движение связанного вектора в неподвижной системе координат кажется обратным движению неподвижного вектора относительно связанной системы координат. Хотя ортогональные преобразования (2.15) и (2.17) формально одинаковы, необходимо дополнительно указывать и вид задаваемой операции*). Матрица ортогонального преобразования А имеет определитель, равный +1; кроме того, преобразование, определяемое матрицей А, оставляет неизменной одну ось. Следствием этого является известная теорема Эйлера, утверждающая, что любое перемещение твердого тела, имеющего неподвижную точку, эквивалентно вращению вокруг неподвижной оси. Ось вращения является собственным вектором матрицы А, соответствующим собственному значению +1» и определяется из *) Этот вопрос обсуждается у Голдстейна [16],
5 2.1] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 61 характеристического уравнения *) (A-M)R = 0, где К — собственное значение матрицы. Характеристическое уравнение в координатах имеет следующий вид: (аи — Я) г, + а12г2 + а13г3 = 0, | а21г, + (а22 —Л)г2 + а23Гз = 0, J (2.21) ^31^1 + ^32^2 + (ЯЗЗ — ^) Г3 = 0, ) и его решение для Х= 1 определяет с точностью до произвольного множителя вектор оси вращения. Для решения этого уравнения необходимо рассмотреть, как изменяется оператор при преобразовании базиса. Пусть имеется вектор s, преобразуемый оператором G в вектор t [аналогично (2.18)]: t=Qs, (2.22) и для матриц-столбцов Т и S аналогично (2.17) имеем T=GS; (2.23) при этом оператор G задается матрицей WguW. Пусть, далее, происходит преобразование системы координат, осуществляемое матрицей А; в этом случае матрицы-столбцы, определяющие векторы t и s ъ новом базисе, найдутся в соответствии с (2.15) как Т'=АТ, S'=AS. (2.24) С другой стороны, матричное равенство (2.23j, отражающее равенство векторов (2.22), также должно подвергнуться преобразованию (2.15), т. е. имеем AT = AGS. (2.25) Отсюда можно получить Г = AT = AGS = AGA"1 AS = AGA^'S' = G'S', (2.26) т. е. векторному равенству (2.22) отвечает в новом базисе равенство (2.26), аналогичное равенству (2.23), *) Доказательство теоремы изложено в книге Голдстейна, и мы считаем излишним повторять его здесь.
52 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 причем матрица оператора G также преобразуется к новым координатам. Такое преобразование называется подобным и в соответствии с (2.26) имеет вид -1 G' = AGA_1 = AGA (2.27) В общем случае характеристическое уравнение (2.21) имеет три корня; обозначая номер корня вторым индексом, можно записать характеристическое уравнение (2.21) в следующем виде: з * /=1 /=1 Если обозначить матрицу ||rjAff = R, то полученное характеристическое уравнение может быть записано в матричном виде AR=R2, где ^ О О 0 Х2 0 0 0 Л3 — диагональная матрица, содержащая собственные значения. Из полученного соотношения следует, что g = R-IAR, т. е. для того чтобы найти собственные значения матрицы А, нужно найти такое преобразование базиса, при котором матрица А приводится к диагональному виду. Известно, что матрица ортогонального преобразования имеет одно собственное значение, равное +1 (и два комплексно сопряженных [16]), которому соответствует собственный вектор оси эйлерова вращения. Пусть матрица В дает ортогональное преобразование к осям базиса £', в котором преобразование матрицы А есть вращение вокруг оси е[, т. е. матрица А', определяемая в соответствии с (2.27) как А'=ВАВТ, (2.28)
§2.1] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 63 вид А'= 1 0 о 0 cosd — sinfl1 0 sinfl1 cos ft (2.29) где ft— угол поворота вокруг оси вращения. Очевидно, что положение оси собственного вращения матрицы А, т. е. направление е[9 будет определяться первой строкой матрицы В [в соответствии с (2.15)], элементы которой и должны быть решением характеристического уравнения (2.21). В соответствии с (2.29) можем записать так: А=ВТА'В. Вычисляя полученное произведение трех матриц, образуем разности элементов матрицы А, симметричных относительно ее диагонали: fli2 — а2\==3 2&i3 sin ft, ) аг\ — а\з = 2&i2 sin ft, | (2.30) 023 *— аз2 = 2&п sin ft. ) След матрицы А не изменяется подобными преобразованиями и равен SpA=a„ + a22 + a33=SpA,= l + 2cosd. (2.31) Из полученных равенств (2.30) и (2.31) находятся элементы ftjj, являющиеся направляющими косинусами собственного вектора (оси эйлерова вращения) матрицы А: гх = Ьи = (а**, — aZ2) [4 — (1 — ап — a^— Язз)]", г2 = ЬХ2 = (а31 - а\ъ) [4 - (1 - а„ - оа - Язз)Г Т, I <2-32) 'з = *1з = (ап — <*2i) [4 — (1 — ап — а^ — a^)] 2. Рассмотренных здесь основных соотношений, определяющих ортогональные преобразования, достаточно для дальнейших исследований. Более детальное рассмотрение этого вопроса читатель может найти в цитированной литературе.
64 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 § 2.2. ПРЕДСТАВЛЕНИЕ ОРТОГОНАЛЬНОГО ПРЕОБРАЗОВАНИЯ В ФОРМЕ УМНОЖЕНИЯ КВАТЕРНИОНОВ Рассмотренное в предыдущем параграфе представление ортогонального преобразования, определяемого матрицей направляющих косинусов А, является наиболее общим способом задания движения твердого тела. Сама матрица А содержит три независимых параметра: два из них определяют ориентацию оси вектора эйлерова плоского вращения [т. е. величины (2.32) гь г2, г3 при условии rf + г| + г|= 1] и один — угол вращения Ф. Соответственно этому элементы \\а^\\ могут быть выражены в функции этих трех параметров. Однако матричная форма записи ортогональных преобразований при этом становится весьма неудобной и зависящей от представления операции в том или ином базисе. Значительно более удобным оказывается представление ортогональных преобразований с использованием алгебры кватернионов. Это представление базируется на фундаментальной теореме 1.1, рассмотренной в § 1.3. В соответствии с этой теоремой операция вращения (1.14) задает преобразование векторной части кватерниона г в г' (1.20) и поэтому может рассматриваться как ортогональное преобразование в вещественном трехмерном пространстве. Пусть в трехмерном базисе J, образованном ортами *ь h, h> задан вектор r=l>rili. Пусть, далее, матрица В определяет линейное ортогональное преобразование вектора г в вектор г', заданное в форме (2.19), которое может быть также записано и в операторном виде (2.18): г'=Вг (в данном случае В = АТ). Будем рассматривать четырехмерное гиперкомплексное пространство Н, образованное гиперкомплексными единицами i\> h, *з, формально совпадающими с ортами трехмерного базиса /.
§ 2.2] ПРЕДСТАВЛЕНИЕ ОРТОГОНАЛЬНОГО ПРЕОБРАЗОВАНИЯ 65 Пусть в пространстве Н задана операция вращения (1.20), определяемая единичным кватернионом, которая вектору г ставит в соответствие вектор г': г' = АоГоА. (2.33) Очевидно, что векторы г7 и г определены своими компонентами в гиперкомплексном базисе Н, при этом операция вращения (1.20) аналогично операции (2.20) задает преобразование вектора в вектор, выполняемое относительно фиксированного базиса. Запишем эти два преобразования в координатной форме, полученной из формул (2.19) и (1.19) соответственно: т\=Ъьцть (2.34) Т\ = \ко + ^1 — ^2 — ^з) П + 2 {Х\к2 — Л(Аз) Г2 + | + 2 (Л^з + ЛоЯ2) Гз, I Гг = 2 (АДг + ХоЯз) п + (^о + ta — ^i — fa) ^2 + I to 35) + 2 (Л2Л3 — %ък\) г3, I гз = 2 (A,i fa — Ы*) ri + 2 (Я2Л3 + AoXi) Г2 + + (fa + Яз — fa — ta) Гз. J Отождествим коэффициенты Ъц преобразования (2.34) с коэффициентами линейного преобразования (2.35); при этом устанавливается однозначное соответствие между формами представления ортогонального преобразования (1.20) и (2.18). Это соответствие является изоморфным, т. е. любой операции группы вращений в трехмерном пространстве /, определяемой ортогональной матрицей В (оператором В), соответствует операция вращения в гиперкомплексном пространстве, задаваемая кватернионом А, причем В и А взаимно определяются друг другом. Действительно, рассмотрим условия группы. 1. Обратной операции (2.34) или (2.18) r = B"V
66 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 соответствует преобразование причем имеют место равенства ВВ"1=В~1В = 1 и АоА = АоА=1, т. е. существует единица, определяемая тождественным преобразованием. 2. Произведению двух преобразований r'=Br, г"=Сг', т. е. преобразованию, определяемому оператором-матрицей D r"=Dr, D = CB, отвечает произведение кватернионов последовательных преобразований г' = АоГоА, г" = МоГ'оМ, r" = NoroN, где N = MoA. Аналогично элементам матрицы В, являющимся направляющими косинусами, компоненты кватерниона могут служить кинематическими параметрами, поскольку они однозначно определяют положение одного базиса относительно другого. Отсюда следует, что их можно использовать для описания движения твердого тела относительно некоторой выбранной системы координат. При этом следует иметь в виду, что одному положению тела соответствуют два кватерниона (А и —А), определяющих одно и то же преобразование вращения. Из формул (2.34) и (2.35) непосредственно следует, что компоненты кватерниона А определяют элементы матрицы В. Отсюда же можно определить и компоненты А (как и следовало ожидать, они получаются двузначными), если заданы величины Ьц\ действительно, в соответствии с (2.35) имеем Ь\\ ~Н Ьчи + &зз = ЗЛо — A,i — %2 — Яз = 4^q -г- 1, ^=±ХШИШлБ, (2.36)
$ 2.3.] ПРЕОБРАЗОВАНИЕ БАЗИСОВ 5? и, рассматривая разность симметричных относительно диагонали элементов, получаем Л,= ± &32 — ^23 &32 — ^23 bis ~~ &3i ^1з "~ &з! 1 4Х0 2^1 + 6,1 + 622 + ^33 А2= ± &21 "" ^12 ^21 — &12 4Ь0 2К1 + 6,, + 622 + ^3 (2.37) Сравнивая соотношения (2.36), (2.37) и (2.31), (2.32), легко убедиться, что векторная часть кватерниона А является осью эйлерова вращения, т. е. является собственным вектором матрицы В (следует учесть, что в нашем случае В = Ат и компоненты Л* суть направляющие косинусы единичного вектора £ кватерниона А). § 2.3. ПРЕОБРАЗОВАНИЕ БАЗИСОВ Полученное соответствие между двумя формами представления преобразования вектора г в вектор г' позволяет операцию ортогонального преобразования (2.19) записать в форме (1.20). Преобразование (1.20) всегда преобразует вектор, поскольку базис / остается неизменным, формально совпадающим с ортами ij гиперкомплексного пространства Н, в котором выполняются операции умножения кватернионов. Тем не менее известным операциям преобразования базисов и координат неизменного вектора можно найти однозначно им соответствующие операции над кватернионами. Рассмотрим задачу преобразования базисов. Пусть в трехмерном пространстве помимо базиса / задан орто- нормированный базис Е с ортами ей причем ek = ^ekiit (/. k=l, 2, 3). (2.38) Рассмотрим, далее, ортогональное преобразование, осу* ществляемое над компонентами векторов еъ,: з e'ki = 2 bifiui. (2.39)
68 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Очевидно, что элементы e'ki определяют новые векторы з которые получаются из еь ортогональным преобразованием (2.39). Это преобразование можно записать также в матричном виде: e'k=Bek (fc=l, 2, 3). (2.40) Можно убедиться, что векторы e'k образуют ортонор- мированный базис Е' (это выполняется вследствие условий ортогональности матрицы В). В силу изоморфизма операции ортогонального преобразования (2.34) и операции вращения (1.20) преобразование базисов (2.39) или (2.40) может быть записано в виде < = AoeftoA (*=1, 2, 3). (2.41) Такое преобразование действительно определяет преобразование базисов. Векторы e'k будут единичными (так как преобразование вращения не изменяет норму вектора) и взаимно ортогональными. Рассматривая скалярное произведение, можно видеть, что выполняются условия ортогональности е'и • е' = 4-01 о е' + е' ° *') = *= j(^ °ek°enoX + \oenoekoA) = -jXo(ek'en) ° A =6kni т. е. векторы е'к образуют базис Е'. Отсюда видно, что преобразование базисов, заданное в форме операции вращения (2.41), соответствует только одной из рассмотренных выше форм задания движения твердого тела, а именно: ортогональному преобразованию в виде (2.20). Другая форма представления преобразования базисов (2.2) и (2.13) выражает орты нового базиса в виде их разложения по векторам исходного базиса. Такая форма преобразования не может быть записана в виде операции вращения (1.20), Тем не менее элементы матрицы преобразований (2.2) и (2.13) могут быть выра-
§ 2.3.] ПРЕОБРАЗОВАНИЕ БАЗИСОВ 59 жены через элементы матрицы преобразования вращения, так как преобразования в форме (2.18), (2.40) и в форме (2.2), (2.13) имеют взаимно обратные матрицы (т. е. транспонированные матрицы). Действительно, пусть задано преобразование базисов в форме (2.39). Покажем, что орты нового базиса е'к выражаются через орты исходного базиса е& с помощью обратной матрицы Вт. В соответствии с (2.39) имеем 3 3 3 е'н=^е'к1гь= 2 biIekJil= 2 bifekiemiem, где орты U выражены с помощью преобразования, обратного (2.38). Поскольку элементы ||е^|| образуют матрицу ортогрцального преобразования, то справедливо равенство 3 2 ekmemk= 1. Вставляя эту единицу в сумму, определяющую е£, получим з з e'h=* 2 biiekieknfimk^miem^ 2 Ьцд]т6к1ет = 3/3 \ 3 = 2(2 bn6(m6kl)em= 2 bmkem (2.42) — здесь были использованы условия ортогональности (2.4). Из (2.42) следует, что элементы матрицы Вт, определяющей разложение векторов базиса Ег по векторам базиса /?, эквивалентны элементам матрицы преобразования вращения (2.35), задаваемого обратным кватернионом Л. Рассмотрим, далее, представление векторов базиса Е (2.38); можно убедиться, что коэффициенты ем образуют матрицу ортогонального преобразования, переводящего орты ik в орты ek9 причем формой преобразования, аналогичной (2.39), будет очевидное тождество з е«=2е/Л/. (2.43)
60 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 которое ставит в соответствие единичным компонентам разложения исходного базиса (т. е. /) новые компоненты вы базиса Е. В силу изоморфизма операции ортогонального преобразования и операции вращения существует такой кватернион S, компоненты которого определяются элементами ekj по соотношениям, аналогичным (2.36) и (2.37), что выполняется равенство ek = Soiko§. (2.44) Из того же представления можно видеть, что в формуле разложения векторов (2.38) и ортогонального преобразования (2.43) участвуют элементы обратных (транспонированных) матриц ||ем||. Еще раз отметим, что преобразование (2.44) задает вращение вектора, т. е. оно изоморфно преобразованию (2.40), а не (2.2). § 2.4. ПРЕОБРАЗОВАНИЕ КОМПОНЕНТ НЕИЗМЕННОГО ВЕКТОРА. ГИПЕРКОМПЛЕКСНОЕ ОТОБРАЖЕНИЕ В предыдущих двух параграфах преобразование вектора и преобразование базиса были заданы в форме операции вращения (1.20). Рассмотрим теперь, как можно представить в этой же форме преобразование компонент неизменного вектора, происходящее за счет изменения базиса. Рассмотрим неизменный вектор г; пусть его проекциями на оси базисов Е и Е' будут величины г{Е и г1Е, соответственно: з з r=^riEei^^riE,e'i. (2.45) Введем следующие кватернионы, составленные из компонент вектора в базисах Е и Е'\ **Е ~ Г1£*1 * Г2£*2 * ГЗЕ*3' RE, = ^1£/*1 + Г2Е'Н "Т" Г3£'*3 * Назовем кватернионы (2.46) гиперкомплексными отображениями (или просто отображениями) вектора г на базисы Е и Е' соответственно. Гиперкомплексное отобрз- (2.46)
§ 2.4] ПРЕОБРАЗОВАНИЕ КОМПОНЕНТ ВЕКТОРА 61 жение вектора на некоторый базис совпадает с самим вектором, если этот базис совмещается с тремя векторами iu *2, к гиперкомплексного пространства Н или, что то же самое, совмещается с базисом /. Орты базиса Е' выражаются через орты базиса Е с помощью операции вращения (2.41). Подставим соотношения (2.41) в равенства (2.45): з з _ / з \ Если теперь совместить орты базиса Е с векторами l\, i2t is гиперкомплексного пространства, то в полученном равенстве г = 2 riEet = А о ^2 rlE,et] ° А 3 3 величины 2 rtFei и 2 riE>ei совпадут с гиперкомплекс- ными отображениями вектора г на базисы Е и Е' (2.46), откуда следует, что /?£ = Ло#£, оА. Умножая это выражение слева на А и справа на А, получаем #£, = Ао#£оЛ. (2.47) Таким обр.азом, справедлива следующая теорема. Теорема 2.1. Если преобразование единичных векторов базиса Е в векторы базиса Ег определяется операцией вращения (2.41), то преобразование координат неизменного вектора на эти базисы задается обратной операцией (2.47), выполняемой над отображениями. Полученйый результат естествен, так как ортогональные преобразования, задающие преобразование базисов в форме (2.20) и преобразование компонент неизменного вектора (2.15), являются обратными. Поскольку операции вращения (2.33) и (2.41) задают преобразования единичных векторов, каждый из которых представлен в кватернионной форме, т. е. задан своими компонентами в базисе J, то обратная операция (2.47), задающая
62 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 преобразование компонент неизменного вектора в этих базисах, выполняется над кватернионами, которыми и являются отображения (2.46). Компоненты г1Е, вектора г могут быть найдены по компонентам г/£, если в формуле (2.47) выполнить умножение кватернионов и приравнять элементы при ортах пространства Н. В соответствии с теоремой 2.1 можно ожидать, что если при преобразовании базисов [например, при преобразовании (2.41)] некие величины преобразуются обратной операцией [например, (2.47)], то они определяют неизменный вектор. Найдем связь проекций вектора г на базис Е и его проекций на базис J. Обозначим проекции вектора г на базис / величинами г/7: з г = 2 г JL Переход от базиса 7 к базису Е определяется кватернионом S с помощью операции вращения (2.44); в соответствии с теоремой 2.1 компоненты г/7 должны выражаться через riE с помощью обратной операции, выполняемой над отображениями. Действительно, отображение г на базис J совпадает с самим вектором: 3 3 R,= r = %rJliJ=%rlEel. Подставляя е* через их значения (2.44), получаем ^i = %nESoiiQS = So^rlEi^oS = SoR£o§t откуда следует RE = SoRfoS. (2.48) § 2.5. ИНВАРИАНТНОСТЬ ОПЕРАЦИИ ВРАЩЕНИЯ. ПАРАМЕТРЫ РОДРИГА - ГАМИЛЬТОНА Рассмотрим теперь, как выглядит операция (2.33) преобразования вектора г в вектор г', если ее записать в проекциях вектора г не на базис /, а на другой базис, скажем, В. Обозначим проекции вектора г на базис Е через riE> а проекции вектора г7 на базис Е через т\Е.
$ 2.51 ИНВАРИАНТНОСТЬ ОПЕРАЦИИ ВРАЩЕНИЯ 63 Имеем 3 3 Гш2г'Ля2г/Ав*я где rjr т'у— проекции векторов г и г' на базис / (обозначавшиеся ранее как rf и г^), а /?7 и Я,—гиперкомплексные отображения векторов г и г' на базис /, совпадающие с векторами г и г'. Составим отображения гиг' на базис Е: з з RE = 2j r*£*p fl^ = Zi rfiEir В соответствии с теоремой 2.1 проекции векторов г и г' на орты базиса Е связаны с их проекциями на орты базиса / операцией, выполняемой над гиперкомплекс- ными отображениями и обратной операции преобразования базисов. Поскольку преобразование ортов базиса Е определяется операцией (2.44), то аналогично (2.48) имеем %Е = S о R, о S, Re =* S о R', о S. Найдем связь Re и RE. Отображения R/ и Rr совпадают с векторами г' и г и, следовательно, они связаны соотношениями (2.33); поэтому К'Е = S о Ri о S — S о А о #7 о А о S =** = SoAoSoJJ£oSoAoS = A£o/f£o А/г, (2.49) где через Ая обозначен кватернион S о А о S, и тогда, очевидно; \e = So\oS. Можно видеть (см. § 1.3), что кватернион \е имеет ту же скалярную часть, что и кватернион А; векторная часть кватерниона А£ получается из векторной части кватерниона А преобразованием вращения (1.20), т. е. *Ке= S °*К о S,
64 теория конечного ftoeoPotA твердого тела [Гл.. 2 Из этого равенства можно заключить, используя результаты теоремы 2.1, что векторная часть кватерниона Л, задающего операцию вращения (2.33), является неизменным вектором, поскольку при преобразовании базиса она изменяется в соответствии с правилами преобразования координат неизменного вектора. Кроме того, легко заметить, что операция преобразования (2.49) сохранила свою форму идентичной (2.33). Отсюда следует такая теорема: Теорема 2.2. Операция вращения (2.33) инвариантна относительно преобразования базисов, если векторы г и г' и векторная часть кватерниона преобразования А выражаются в координатах одного и того же произвольного базиса, причем преобразование координат этих векторов происходит в соответствии с правилами преобразования неизменного вектора. Итак, операцию преобразования вектора г в вектор г' можно записать в компонентах г и г' на любой базис, при этом векторную часть кватерниона Л также следует спроектировать на этот же базис. Ввиду того, что можно записать 3 3 3 г = 2г/£в<) r' = ^r'iEet, A = USV(> (2.50) содержание теоремы 2.2 можно истолковать и таким образом, что операцию (2.49) можно записать в виде (1.20) над величинами (2.50), причем «правила» умножения ортов е\ аналогичны правилам умножения гиперкомплексных чисел. Легко понять, что это получается благодаря тому, что с любым базисом трехмерного вещественного пространства могут быть совмещены орты lu fe, h гиперкомплексного пространства Н; при этом векторы трехмерного пространства совпадают с кватернионами — отображениями этих векторов. TejpeMa^ 2.2 устанавливает еще одну особенность операции вращения (2.33) — тот факт, что эта операция имеет векторный смысл. Используя представление умножения кватернионов с помощью операции умножения векторов (1.9), можно представить преобразование (2.33) с помощью векторных операций в трехмерном пространстве.
§ 2.5J ИНВАРИАНТНОСТЬ ОПЕРАЦИЙ ВРАЩЕНИЯ 65 Для этого необходимо кватернион преобразования Л представить функцией от трехмерного вектора. Это можно сделать, рассматривая величину /V»o Л0 Л0 Л0 Л0 ^ которая определяет кватернион Л одним вектором 9 = 2-^. (2.51) Вектор 9 называется вектором конечного поворота [31, 44]; используя представление кватерниона в форме (1.11), можно видеть, что вектор конечного поворота равен e = 2£tg4- (2.52) Применяя формулу (1.9), заменим операции умножения кватернионов в соотношении (2.33) операциями умножения векторов в трехмерном пространстве: г' = А о г о А = (Ао + к) о г о (Ло — к) = = (V - к • г + к X г) о (Л0 - к) — — Лог — k0k • г + М, X г + Аог • к — V X *< + (*• • г) к + + (*Хг).Х-(ЛХг)ХЬ. Приводя подобные члены и учитывая, что (ЛХг) • Х = 0, а также то, что (ЛХг)Х* = кХ(гХк) =г (X, • Л)-Л(г • X), полученное выражение для г' запишем в виде г'= Лог + 2АД X г + гк2 - 2(гЛ2 - кг • Л) = = г + 2Ло^Хг-2ЛХ(гХ>-) = где Л = Л • А* = А*1 —|— А/2 -f- Л3. Используем введенный вектор конечного поворота (2.51); учитывая, что в соответствии с (2.52) л2 2 ft ! Ло = COS -5- = 2 1 1+-£|в|« 3 В. Н. Бранец, И. П. Шмыглевский
ев Теория конечного поворота твердого тела [ГЛ. 2 получаем известную формулу Родрига для преобразования вектора при конечном повороте: г'=г + / вх(г +±ВХг). (2.53) Заметим, далее, что кватернион А, задающий операцию (2.41) ортогонального преобразования базиса Е в базис Е\ также определяет вектор конечного поворота 9 (2.51). Это преобразование действительно является вращением вокруг оси О, поскольку сам вектор в при таком преобразовании не меняется: А о 6 о А = 4- А о к о А = 4- *• = в. Aq Aq Используя представление кватерниона в форме (1.11), его компоненты можно записать в следующем виде: А А А А Яо = соз^-, ^! = Yi sin-^-, A,2 = Y2Sin-2-, Л3 = Уз sin If, (2.54) где Yi» Y2» Y3 — направляющие косинусы вектора 8, равно как и Л, в осях рассматриваемого базиса. В соответствии с этим вектор конечного поворота или кватернион преобразования может задаваться своими компонетами в любом базисе. Аналогично гиперкомплексному отображению неизменного вектора на некий базис будем рассматривать кватернион, составленный из компонент (2.54), где y* — проекции вектора £ кватерниона на данный базис. Последний назовем отображением кватерниона А на рассматриваемый базис. Очевидно, что отображение кватерниона имеет ту же скалярную часть, что и исходный кватернион, и векторную часть, равную отображению векторной части кватерниона на этот базис. Так, отображением кватерниона Л = ^о + Я на базис Е будет введенный ранее [см. (2.49)] кватернион з Ая = Яо + Ъ»е = Ло + 2 ^ieU = S о А о S. Отображение кватерниона на базис будем обозначать индексом этого базиса, в отличив от исходного ква-
§ 2.51 ИНВАРИАНТНОСТЬ ОПЕРАЦИИ ВРАЩЕНИЯ 67 терниона без индекса. В соответствии с теоремой 2.1 отображение кватерниона находится операцией вращения, обратной операции преобразования базисов. Особый смысл имеют компоненты кватерниона в той системе координат, которая преобразуется этим кватернионом. В рассматриваемом случае такой системой является базис £, преобразуемый кватернионом Л в базис Е'. Преобразование базиса Е в базис Е' определяется операцией (2.41), причем в соответствии с теоремой 2.2 это преобразование может быть записано в проекциях единичных векторов е{ и е\ и кватерниона А на базис Е (так же, как и на любой другой базис). Компоненты кватерниона А в базисе Е определяются отображением Ад. Ввиду того, что преобразование (2.41) ортов базиса Е в орты базиса Ег в соответствии с теоремой 2.2 может быть записано в виде (2.49), т. е. в форме то компоненты А в базисе Ег определяются отображением А на базис Е' с помощью обратной операции: А£/ = Хе ° &е ° Л.£ = А^. Отсюда видно, что компоненты кватерниона Л в базисах Е и Ег одинаковы. Компоненты кватерниона в базисе, преобразуемом этим кватернионом, заданные в форме (2.54), называются параметрами Родрига —Гамильтона [31]. Кватернион, компонентами которого являются параметры Родрига — Гамильтона, будем далее отмечать звездочкой. Этот кватернион имеет равные компоненты в двух системах координат вследствие того, что именно этим кватернионом определяется переход от одной системы координат к другой. В связи с этим кватернион, параметрами которого являются параметры Родрига — Гамильтона, имеет особый смысл: он является как бы «собственным» кватернионом преобразования. В дальнейшем условно будем называть кватернионы, составленные из параметров Родрига — Гамильтона, собственными кватернионами преобразований. В рассмотренном случае таким кватернионом будет А* = Ая = Ая' = S о А о S, 3*
68 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Точно так же, поскольку переход от базиса / к базису Е определяет кватернион S (2.44), в соответствии с теоремой 2.1 получаем следующие величины отображений кватерниона S на базисы J и Е: Sf=S, SE = S о Si о S = S, откуда S =S/= S£ = S. § 2.6. СЛОЖЕНИЕ ПОВОРОТОВ При выполнении последовательности двух, трех и т. д. ортогональных преобразований осуществляется сложение конечных поворотов. Этому соответствует операция умножения матриц составляющих преобразований: если первый переход (например, от базиса Е к базису Е') задается матрицей А, а второй (от Ег к Е") определяется матрицей В, то матрица результирующего поворота С (от базиса Е к базису Е") будет задана произведением С = ВА. (2.55) Если операция перехода от базиса Е к базису Ег определяется изоморфной операцией вращения, задаваемой кватернионом А (2.41), а операция перехода от базиса Е' к базису Е" задается аналогичным образом кватернионом М ef=Mo</oM (/=1, 2, 3), то кватернион результирующего преобразования N, определяемый операцией перехода находится как произведение кватернионов составляющих преобразований: N = М о А (2.55) (это было рассмотрено в § 1.3). Отметим здесь сходство формул умножения операторов (2.55) и (2.56). Компоненты кватерниона N = vo + vi*i + V2*2 + v3*3 определяются компонентами кватернионов составляющих
§2.6] СЛОЖЕНИЕ ПОВОРОТОВ 69 3 3 преобразований А = Яо + 2 Л/'/ и ^ = ji0 + 2 М/ Э соответствии с правилами умножения кватернионов (1.5). Выполняя это умножение и приравнивая коэффициенты при ортах, получаем четыре скалярных равенства: Vq = АоЦо — A*iHi — Я2^2 Vl = Л0Ц1 + ^0 + ^2 v2 = X0\i2 + Л2Ц0 + ^iM-з V3 = Я0Ц3 + ^3^0 + ^2^1 Компоненты Я,*, \ц и Vi составляющих и результирующего кватерниона определяют в системе координат J (т.е. в той системе, где заданы кватернионы) векторы первого, второго и результирующего поворотов. Однако в предыдущем параграфе было показано, что операция вращения справедлива в любой системе координат, если в ней выразить преобразуемые векторы и векторные части кватерниона преобразования. Рассмотрим, как выглядит операция сложения преобразований (2.56), если ее выразить в другом базисе. Пусть переход от базиса J к базису Е определяется кватернионом S в соответствии с (2.44). Тогда компонентами этого кватерниона в базисах / и Е будут величины Si (i = 0,1,2,3), поскольку отображение кватерниона на базис / совпадает с самим кватернионом (81 = 8), a отображение S на базис Е определяется операцией вращения, обратной (2.44), т. е. SE = SoSoS = S,= S\ Рассмотрим кватернион А, определяющий конечный поворот, переводящий базис Е в базис Е'. Отображением кватерниона А на базис Е будет (см предыдущий параграф) кватернион Поскольку переход от базиса / к базису Ег определяется последовательным применением S и А, то, согласно (2.56), результирующий переход определится произведением ApS. В соответствии с этим отображение А Ш* А*зИз, ' ^2^3» Л3Ц1, ^1^2- (2.57)
70 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 базис Ег найдется как А£/ = (А о S) о А о (А о S) = S о А о А о А о S = = SoAoS = A£ = A*, (2.58) что и было показано ранее. Переход от базиса / к базису Е" определяется последовательностью переходов, задаваемых кватернионами S, А, М; результирующий кватернион перехода от базиса / к базису Е" будет равен M°A°S. Отображением кватерниона А на базис Е" будет величина А£* = (MoAoS)oAo(MoAoS) = SoAo]M[oAoMoAoS. (2.59) Рассматривая аналогично кватернион М, задающий переход от базиса Ег к базису Е'\ найдем величины отображений М на базисы Еу Ег и Е"\ M£ = SoMoS, М£/ =§о АоМо AoS, ] МЕ» = (S о А о М) о М о (М о А о S) = } (2.60) = SoAoMoAoS = М£/ = М\ j Проекции вектора результирующего поворота на базисы Еу Ег и Е" определяются отображением кватерниона N на эти базисы: N£ =SoNoS, N£/ = SoAoNoAoS, j N^ = SoAoMoNoMoAoS= I (2.61) = SoNoNoNoS = N£ = N\ j Отметим, что отображения, кватерниона М на базисы Е' и Е'\ так же как и отображения N на базисы Е и Е", получились равными, определяющими собственные кватернионы (параметры Родрига — Гамильтона) этих преобразований. Теорема 2.3. Компоненты кватерниона результирующего поворота (N) определяются nQ компонентам пер- вого (А) и второго (М) поворотов по правилу умножения кватернионов (2.56) и (2.57). Правило умножения сохраняется для отображений этих кватернионов на произвольный базис. Доказательство. Частным случаем этой теоремы является сама формула (2.56), лоскольку кватернионы
$2.6] СЛОЖЕНИЕ ПОВОРОТОВ 71 N, А и М совпадают с их отображениями на базис /. Найдем отображение кватерниона N на базис Е в зависимости от отображений составляющих кватернионов А и М на этот же базис. В соответствии с соотношениями (2.56), (2.58) —(2.61), имеем = SoMoSoSoAoS= ШЕо А*. Аналогично можно получить выражения для отображений N на базисы Е' и Е"\ N/r/ = SoAoNoAoS = = S°AoMoAoSoS°AoS_ од£, 6 \Е,^ N£*«= 3 oAoMoNoMoAoS = — SoAoMoMo(MoAoSoSoAoM)oAoMoAoS = Таким образом, эта теорема позволяет использовать формулы (2.57) для нахождения компонент кватерниона результирующего поворота в любом базисе, при этом компоненты кватернионов составляющих поворотов должны быть выражены в этом же базисе. Кватернионы N, А и М определяют векторы конечных поворотов рассматриваемых преобразований; каждый кватернион можно записать в виде А —Л + S V/ ~ Ао + |§ *тг/«/ = 3 3 - *о + 2 *>е>/,=К+ 2 К»?",. 3 3 М = ц0 + 2 ^Л - И„ + 2 РЕ1е, = 3 3 —1*0 + 2 »B4e'f = Но + Д *efi> 3 3 = v0 + 2 v£7e; - v0 + s v/«7- (2.62)
te ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Из теоремы 2.3 следует, что правила нахождения произведения двух преобразований N==M<>A сохраняются для любых проекций векторных частей кватернионов на один и тот же базис. Последнее можно интерпретировать как возможность использования в качестве ортов гиперкомплексного пространства Н единичных векторов базисов Е, Ег и Е" (что и должно быть, так как гиперкомплексный базис iu *2, h можно совместить с любым из трехмерных базисов). С другой стороны, поскольку операция умножения N = MoA инвариантна относительно преобразования базиса, она имеет векторный смысл. Получим векторную формулу сложения конечных поворотов. Используя представление (1.9) умножения кватернионов и введя аналогично (2.51), (2.52) векторы конечных поворотов е,=2А 0,-2^. ev=2^. получаем N —v0 + v —MoA=:(|io + |i)o(Ao + X) = = цоЛо + Ц^о + Хц0 — ц • X + ц X X. Разделим скалярную и векторную части полученного выражения: v0= \iqKq — ц • X, v = А,0Ц + щХ + Ц X X. Очевидно, что Взяв отношение этих выражений, получим векторную формулу сложения конечных поворотов Рассмотрим, далее, три последовательно выполняемые ортогональные преобразования. Если переход от базиса Е к базису Ег определяется кватернионом Л, от Ег к Е"— кватернионом М, а от Е" к Е"' — кватернионом Р, то кватернион результирующего преобразования N,
§2.6| СЛОЖЕНИЕ ПОВОРОТОВ 73 переводящего базис Е в базис Е"\ определится произведением (см. § 1.3) N = PoMoA, (2.64) причем аналогично предыдущему можно показать, что формула умножения операторов (2.64) справедлива для отображений N, Р, М, А на любую одну и ту же систему координат. В качестве примера спроектируем равенство (2.64) на базис Е. Очевидно, что аналогично (2,58) —(2.61) получим N£ = SoNoS, P£ = S°P°S, M£ = S°MoS, А£ = S о А о S, N£ = S о Р о М о А о S = (S о Р о S) о (S о М о S) о (S о А о S) = = Р£оМ£о А£. Точно так же можно расширить теорему умножения 2.3 на произвольное число кватернионов, задающих ряд последовательных переходов. Правило нахождения результирующего поворота по известным составляющим обладает тем недостатком, что кватернионы необходимо проектировать на одну и ту же систему координат. В связи с этим это правило не по-' зволяет связать параметры Родрига — Гамильтона результирующего и составляющих преобразований. Действительно, проектируя равенства (2.56) на любую из систем Еу Е' и Е'\ будем получать соответствующие отображения кватернионов, из которых только какие-либо два будут собственными кватернионами, составленными из параметров Родрига — Гамильтона. Кватернион, компонентами которого являются параметры Родрига — Гамильтона, имеет особый смысл. Это объясняется тем, что кинематические уравнения, определяющие связь производных от кинематических параметров с величинами угловой скорости, записываются для проекций вектора конечного поворота на начальную (неподвижную) и конечную (связанную) системы координат, в связи с чем именно эти параметры и используются для приложений. Развитый здесь аппарат проектирования кватерниона на различные системы координат позволяет доказать
74 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 следующую теорему, определяющую связь результирующего кватерниона N* с составляющими Л* и М*. Теорема 2.4. Пусть А*, М* и N* — собственные кватернионы соответственно первого, второго и результирующего поворотов. Тогда компоненты кватерниона результирующего поворота N* определяются через компоненты кватернионов первого Л* и второго М* поворотов по правилу умножения кватернионов (1.5), причем сомножители берутся в обратном порядке: N* = A*oM*. (2.65) Доказательство. Выражая кватернионы N*, А* и М* с помощью соотношений (2.58), (2.60) и (2.61), сразу же получаем формулу (2.65): N*«=N£=SoNoS = SoMoAoS = = S о А о S о (S о А о М о А о S) = А£ о М£/ = А* о М\ Выполняя умножение кватернионов (2.65) и приравнивая составляющие при ортах, находим • А** - * * Л* * Сравнивая соотношения (2.57) и (2.66), можно убе-. диться, что изменился знак двух последних членов векторной части кватерниона. Отметим также, что формулы (2.66) можно получить из соотношений (2.57), если записать их в проекциях, например, на базис Е'\ при этом нужно перепроектировать компоненты вектора N на базис Е или Е" с помощью матрицы направляющих косинусов типа (2.35). Теорема 2.4 остается справедливой и для случая трех последовательно выполняемых преобразований, определяемых соответственно кватернионами Л, М и Р. В этом случае, учитывая соотношения (2.58) и (2.60), а также то, что результирующий кватернион N определяется Л * « А • * Л3^2» А • * ■кк (2.66)
$2.6] СЛОЖЕНИЕ ПОВОРОТОВ 76 соотношением (2.64), найдем N* = N£ = N£~, A* = A£ = A£,, М' = М£=М^ Р* = Р£„ = S о А о М о Р о М о А о S = = §°AoSfoPoPoPoMoAoS= Р£/// и далее N* = SoPoMoAoS = = (SoAoS)o(SoAoMoAoS)o(SoAoMoPoMoAoS) = = А*оМ*оР\ Поскольку любые два поворота, записанные в форме (2.65), могут быть объединены в один, то последователь* ное применение этой формулы умножения позволяет сразу же получить только что доказанную формулу умножения для трех поворотов. Очевидно, что методом индукции эту теорему можно распространить на случай произвольного числа последовательно выполняемых преобразований. Проведенное исследование показывает, что собственные кватернионы преобразований при их сложении перемножаются также по правилам умножения кватернионов, однако эта форма сложения преобразований уже не имеет векторного смысла. Тем не менее именно эта форма сложения справедлива, как будет показано далее, при сложении относительных движений. В этом отражается свойство кватернионов более полным образом описывать трехмерное пространственное движение. В заключение рассмотрим известную теорему о пере- ставимости конечных поворотов. Теорема 2.5. Результирующее преобразование будет тем же самым, если вначале выполнить второй поворот, а затем первый вокруг оси, преобразованной предыдущим поворотом. Доказательство этой теоремы получается сразу же из формулы умножения кватернионов: если кватернион А определяет первый поворот, а кватернион М — второй, то результирующий поворот будет определяться кватернионом N = MoA=MoAoMpM = Am°M,
76 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 где через Ам обозначен кватернион МоАоМ, который получается путем преобразования кватерниона А операцией вращения, определяемой кватернионом М. Кроме этого, можно видеть, что N = MoA = AoAoMoA = AoMI, где М-—кватернион, векторная часть которого преобразована обратным преобразованием Л. Отсюда следует, что повороты можно переставить и таким образом: сначала сделать второй поворот вокруг оси, преобразован* ной обратным первым поворотом, а затем выполнить первый поворот вокруг первоначальной оси. Можно распространить теорему о переставимости поворотов на случай трех поворотов. Пусть первый поворот определяется кватернионом Л, второй — кватернионом М, третий — кватернионом Р; тогда результирующий поворот будет задан кватернионом N=PoMoA=PoMoAo(Mo£oPoM)o(PoP) = = (Р о М о А о Й о Р) о (Р о М о Р) о Р = АрМ о Мр о Р, где Арм = (Р о М) о А о (Р о М), Мр = Р о М о Р, т. е. тот же результирующий поворот получается, если вначале выполнить третий поворот, затем второй вокруг оси, преобразованной предыдущим поворотом, затем первый поворот вокруг оси, преобразованной предыдущими двумя. Формально нетрудно распространить эту теорему на случай произвольного числа последовательно выполняемых преобразований. § 2.7. СВЯЗЬ ПАРАМЕТРОВ РОД РИГА—ГАМИЛЬТОНА С ДРУГИМИ КИНЕМАТИЧЕСКИМИ ПАРАМЕТРАМИ Собственный кватернион преобразования имеет компоненты, которыми являются параметры Родрига — Га- Мильтона. Связь между компонентами кватерниона, задающего преобразование вращения, и направляющими косинусами, являющимися элементами матрицы ортогонального преобразования, была подробно исследована во втором параграфе этой главы.
§2.7] СВЯЗЬ ПАРАМЕТРОВ 77 При этом преобразованию вращения (2.33), (2.35) было поставлено в соответствие ортогональное преобразование в форме (2.18), (2.19), (2.34). В соответствии с этим направляющим косинусам, определяющим преобразование базиса в форме (2.13) или (2.40) и преобразование компонент вектора (2.15) или (2.17), поставлены в соответствие элементы кватерниона. Элементы матрицы преобразования В = Ат выражаются через компоненты кватерниона соотношениями (2.34) —(2.37). Установим связь кватерниона преобразования с другими кинематическими параметрами. I. Углы Эйлера и Крылова. В целом последовательность трех вращений вокруг различных несовпадающих осей задает произвольное преобразование; преобразование такого рода носит название вращения на эйлеровы углы. При вращении вокруг координатных осей различают две последовательности вращений: поворот на углы Эйлера и поворот на углы Крылова. Рассмотрим вначале эйлерову последовательность трех плоских поворотов, переводящих базис / в базис Е и совершаемых вокруг координатных Рис. 2.1. 2.1). h на осей (рис. Пусть первый поворот осуществляется вокруг оси угол прецессии ср, второй поворот — вокруг оси i\ на угол нутации -ф и третий поворот — вокруг оси е% на угол вращения Ф. Матрица преобразования А, задающая переход от системы координат / к системе Е в форме (2.13), получается в виде произведения трех матриц последовательных поворотов: — sin ф А=| — sind cosd 0 ОН 1 0 COS1J) X J cosO sinO 0| — sinfl1 cosd 0 1 о oil 110 1 l|o cosi|> 0 sin -ф | X cos <p sin ф 0 — sin<p cos<p 0 0 0 1
78 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Выполняя умножение, получаем Ц cos О совф — sin О sin ф cosф cos Фзтф + зШФсозфсовф sinOsiniM| А«| — в^Осовф—cosOcosiJ) в1пф — в1пф sin 0 + cos О cos Ф cos ф cos&sini|> . || 8Шф$1пф — в1пфС08ф COSlf || (2.67) Аналогичным образом можно найти кватернион результирующего преобразования по кватернионам каждого плоского поворота. В соответствии с фундаментальной теоремой 1.1 кватернион плоского вращения на угол Ф равен cos-g- + £sin-j-, где g — единичный вектор оси вращения. Для нахождения результирующего кватерниона можно было бы в соответствии с теоремой 2.3 представить каждый из составляющих кватернионов в одном базисе, однако при этом как минимум два вектора вращения не проходили бы по координатным осям и их выражения были бы достаточно сложными. Удобнее использовать результаты теоремы 2.4. Пусть А—кватернион первого поворота, совершаемого вокруг оси 1з на угол ср, тогда, очевидно, A* = cos-|- + *3sin-f-. Второй поворот происходит вокруг оси i\ на угол -ф; собственный кватернион М* этого поворота равен М* = cos -у + ix sin —•. Третий поворот совершается вокруг оси е3 на угол Ф; кватернион этого поворота Р* Ф , . . Ф = COS-2-+*3Sin-2-. Согласно теореме 2.4 результирующий собственный кватернион N* будет равен произведению А*оМ*оР = =(cos-J + *3sin |-j о (cos |- + i{ sin-|-) o^cos y+*3sin|-)= = cos у cos ^—Ь ii sm -|- cos ^—\- + *2sin-f-sin2-^ + *3cos-£-sin£ir^ (2.68)
§2.7] СВЯЗЬ ПАРАМЕТРОВ 79 Отсюда вытекает следующая связь компонент кватерниона с углами Эйлера: ф — ^ COS -у COS ^— lb . ф — Ф Sin-|-Sin ^—2—, v*= sin -у cos Ф . v3 = cos-y sin 2 Ф + ft (2.69) Используя эти выражения для составляющих кватерниона N*, с помощью операций вращения можно получить формулы перехода от базиса / к базису Е [например, в виде (2.44)] и формулы для нахождения компонент неизменного вектора [вида (2.48)]. Можно проверить, что элементы матрицы перехода вида (2.35) с учетом (2.69) совпадают с полученной выше матрицей Ат (2.67). Рассмотрим теперь последовательность трех поворотов на углы Крылова (рис. 2.2), совершаемых также вокруг координатных осей преобразуемого базиса. Первый поворот выполняется вокруг оси h на угол курса <р, второй поворот происходит по оси i[ на угол крена \р и третий — вокруг оси в\ на угол тангажа д. Матрица преобразования А, задающая переход от системы координат J к системе Е, получается путем умножения трех матриц плоских вращений: А= 1 О О О cosfl sind О — sinfl cosft cosip 0 —sin-ф О 1 О sin -ф 0 cosij) cos<p sin<p 0 —sin<p costp 0 0 0 1 Выполняя умножение матриц, получаем 1cos<pcos$ cos ф sin Ф — sini|> II sin Ф sin ф cos ф —cqs Ф sin Ф sind sin ф sin<p + cosdcos<p sinФ cos ф II cos Ф sin ф cos ф + sin 0 sin Ф cos Ф sin ф sin Ф — sin Ь cos ф cos0cosi|>|| (2.70) Получим, далее, кватернион преобразования вращения, осуществляющего переход от базиса / к базису Ц.
80 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ, 2 Аналогично предыдущему случаю найдем сначала собственные кватернионы последовательных плоских поворотов. Первому повороту, происходящему вокруг оси ц на угол ф, соответствует кватернион A*=cos-| + *3sin-|-. Второму повороту вокруг оси *2 на угол -ф отвечает кватернион М* = cos ■£- + *2 sin-|*. а третьему повороту (вокруг оси е\ на угол Ф) —кватернион = cos у + %\sln "у * В соответствии с теоремой 2.4, имеем для кватерниона результирующего вращения N*=A*oM*oP* = =(cos -I + f3sin|-J о (cos -|- + i2sin-|-) о (cos j + ix siny). (2.71) Выполняя умножение кватернионов, получаем следующие значения для .его компонент в функции углов Крылова: * Ф Ф Ф . . ф . ib . Ф v0 = cos -f- cos -f cos -y + sin -jjr sin -f sm -^. Ф Ф sin Ф - cos tt » v; = cosf cosf sin T-sin 2 .... 2 _ 2 * . гЬ ф Ф . . ф гЬ . Ф va=sin -|- cos -|-cos -y + sin -f cos y sm y , * Ф ib Ф гЬ ш . Ф V3=Sin-ycos 2 C0ST"" SU1-J-COS ySlIlj, (2.72) Полученные величины кватерниона позволяют записать операции ортогональных преобразований в форме операции вращения [например, в виде (2.44), (2.48)]. Читатель может убедиться, что элементы матрицы операции вращения вида (2.35) совпадает с элементами матрицы Дт (2.70) f
§2.7] СВЯЗЬ ПАРАМЕТРОВ 81 При заданных осях вращений и заданных углах поворотов последовательность трех эйлеровых поворотов полностью определяет преобразование. С другой стороны, если задано требуемое преобразование и заданы оси вращений и их последовательность, то этим однозначно определяются эйлеровы углы вращения. Действительно, преобразование определяется компонентами Vi кватерниона преобразования; можно видеть, что формулы (2.69) или (2.72) однозначно разрешимы относительно величин углов поворотов. Вращение на эйлеровы углы есть вращение вокруг координатных осей (разумеется, последовательно преобразуемых). Поставим вопрос: можно ли выполнить произвольно заданное преобразование путем трех поворотов относительно произвольных осей и, если нельзя, какие существуют условия на расположение осей вращения? Применение кватернионов позволяет достаточно полно и наглядно исследовать этот вопрос. Рассмотрим произвольное преобразование, которое определяется заданным кватернионом N. Представляя кватернион N дугой единичной сферы, можно видеть (см. § 1.2), что эта дуга занимает свободное положение на большом круге, определенном векторной частью v кватерниона, а длина ее равна половине угла вращения кватерниона N. Пусть то же самое преобразование выполняется путем вращения вокруг некоторых заданных осей. Каждая ось вращения определяет на сфере боль- Рис. 2.3. шой круг, на котором должна располагаться дуга соответствующего кватерниона, составляющего результирующее преобразование. Рассмотрим сначала случай, когда заданы две оси вращений, составляющих заданное преобразование; эти оси определяют круги А и М на сфере (рис. 2.3). Очевидно, что заданный кватернион N можно представить дугой sfflg в виде произведения двух кватернионов, представленных дугами S&3& и 9Р8\
82 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Дуга М' получается из «разрешенной» дуги М (т. е. &ЗГ) путем ее переноса преобразованием вращения. Действительно, из треугольников &)<$& и 85Г& находим или, обозначая дуги #0 = 0^ и &~& = 2)& кватернионами Р и А! соответственно, имеем Р=МоА1 = А1оМ\ откуда М, = А1оМоА1. В соответствии с этим имеем следующее выражение заданного кватерниона N через «разрешенные» направления вращения: N = AoM, = AoA1oMoA1. Поскольку вращения А и А, происходят вокруг одной оси, то преобразование А о А, представляет одно вращение вокруг этой же оси, которое обозначим Аг, в результате чего N = A2oMoA,. (2.73) Очевидно, что это есть эйлерова последовательность вращений вида (2.68). Заметим, что сложение дуг кватернионов можно производить в двух точках пересечения дуги N с дугами А и М; на рис. 2.3 показано одно из таких сложений на обратной стороне сферы, приводящее также к соотношению (2.73). На рис. 2.4 представлено сложение, начинающееся от точки пересечения дуг N и М. В соответствии с рис. 2.4 имеем N = A,oM, A,oMI=M1oA, откуда N = M1oAoM1oM = MloAoM2, что, очевидно, соответствует другой последовательности эйлеровых поворотов. Можно видеть, что требование «перпендикулярности» дуг составляющих кватернионов (т. е. «разрешенных» осей вращения) не является обязательным. Однако из рассмотрения рис. 2.5 следует, что для приведенного расположения больших кругов составляющих поворо-
§27] СВЯЗЬ ПАРАМЕТРОВ 83 тов А и М не всякое вращение N может быть представлено их произведением. Действительно, преобразование вращения вокруг оси А может «перенести» дугу М не в любую точку сферы, а только в область, ограниченную малыми кругами 2 и 8. Аналогичное условие имеем и для другой последовательности вращений, которая определяет аналогичную область, ограниченную Рис. 2.4. Рис. 2.5. плоскостями SB' и 8' (показано на рис. 2.5 пунктиром). Заметим, что максимальные длины дуг кватернионов N' и N" для обеих последовательностей могут быть различны. Следовательно, с помощью произведения кватернионов М и А может быть представлена такая дуга N', которая умещается в области, ограниченной плоскостями SB и 8 или SB' и 8'. Отсюда видно, что произвольный кватернион с углом ffvs р,-| может быть выражен эйлеровой последовательностью вращений только при перпендикулярности осей составляющих поворотов, хотя при ftv < -у возможно использование и неперпендикулярных вращений. Рассмотрим представление кватерниона N с помощью произведения трех различных вращений. Пусть заданы три направления вращений, определяющих большие круги А, М и Р на сфере (рис. 2.6). На этих кругах будут располагаться дуги кватернионов, составляющих заданный кватернион N; дуга кватерниона N расположена на соответствующем большом круге. Если задана последовательность вращений (например, Л, М, Р — как
84 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 8 в данном случае), то этим однозначно задается геометрия сложения дуг на сфере. Действительно, из сферического треугольника ЯтЯя^ находим N = AoK, а из треугольника &)8$F такого, что 3)8 = 4!?$, имеем К = МоР, откуда N = AoMoP, (2.74) т. е. получили последовательность сомножителей, соответствующую поворотам на углы Крылова (2.71). Можно видеть, что положение большого круга кватерниона К фиксировано точкой ^ (концом дуги кватерниона N) и условием равенства дуг 3)& и *&&. Точно такой же треугольник существует и на обратной стороне сферы. Другой последовательности вращений будет соответствовать другая геометрия сложения дуг. Из рис. 2.6 видно, что требование взаимной перпендикуляр- Рис. 2.6. ности составляющих вращений не является обязательным. Тем не менее не при любом положении составляющих дуг возможно указанное разложение; анализ показывает, что достаточным условием выполнимости разложения является требование, чтобы дуга кватерниона К (дуга ЪЗй) была не больше максимально возможного расстояния между соответствующими точками дуг кватернионов М и Р. Так, например, можно видеть, что при близких кругах М и Р может иметь место случай, когда дуга @)<8 будет всегда меньше дуги 9^, т. е. разложение невыполнимо. Если же хотя бы две из трех осей вращений перпендикулярны, то разложение возможно всегда, причем при непрерывном приближении одного большого круга к другому последовательность вращений приближается к эйлеровой. I II. Параметры Кейли — Клейна. Параметры Кейли — Клейна являются комплексными комбинациями компо-
«2-Я СВЯЗЬ ПАРАМЕТРОВ 86 нент кватерниона. Они вводятся в кинематику вращения твердого тела либо посредством стереографического проектирования сферы на плоскость и задания дробно- линейного преобразования плоскости в себя [31,44], либо с помощью изоморфной операции линейного преобразования, задаваемой унитарной матрицей [16]. Для установления связи кватерниона с параметрами Кейли — Клейна удобнее использовать второй путь. Здесь мы кратко изложим суть этого метода; более полное изложение читатель может найти в работе [16]. Пусть задано комплексное двумерное пространство uv и задано его линейное преобразование и' = аи + $v, v'=yu + 6v9 определяемое матрицей Ik 3|| U-1 " Матрица, комплексно сопряженная и транспонированная относительно матрицы U (комплексно сопряженные величины будем отмечать звездочкой), т. е. называется матрицей, эрмитово сопряженной с матрицей U. Будем рассматривать такие преобразования, для которых выполняются условия detU-1 ) (2J6) (здесь 1 = L J—единичная матрица). Матрицы, удовлетворяющие первому условию (2.76), называются унитарными матрицами. Условия (2.76) приводят к следующим соотношениям, которым должны удовлетворять элементы а, р, 6 и у: а\х + ГР=1, Y*Y + 6*6=1, a*Y + p*d=0, I (2-77) аб — Pv=l.
86 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. f Здесь первые три равенства являются условиями унитарности матрицы U, а последнее соответствует требованию единичного определителя матрицы. Из третьего равенства (2.77) получаем соотношение - £_ _а^ у - р* • которое при подстановке в четвертое приводит к выражению С учетом первого равенства (2.77) получаем следующие условия на элементы матрицы U, к которым сводятся условия (2.76) и (2.77): V Р\ а--М «»• + №•-1. J (2J8) Четыре элемента а, р, v и й» удовлетворяющие условиям (2.78), называются параметрами Кейли — Клейна. Всего матрица линейного преобразования (2.75) содержит восемь величин, так как каждый из ее элементов является комплексным. Равенства (2.77) содержат следующие условия: первые два равенства — вещественные, третье — комплексное, поэтому требование унитарности матрицы преобразования содержит четыре условия. Пятым условием является требование к детерминанту матрицы U. Таким образом, матрица U при выполнении условий (2.76) и (2.77) содержит только три независимых параметра, т. е. как раз такое число, какое нужно для описания ориентации твердого тела в трехмерном пространстве. Рассмотрим в двумерном комплексном пространстве матричный оператор R = | гз ri-/r4 (2.79) \rx + tr2 — г3 I вещественные компоненты г и ?2> Гв которого будем интерпретировать как координаты вектора г в трехмер-
§ 2.7J СВЯЗЬ ПАРАМЕТРОВ 87 ном пространстве. Пусть посредством унитарной матрицы U матрица R подвергается следующему преобразованию: R'=URU+. (2.80) Соотношение (2.80) описывает подобное преобразование матрицы R, которое происходит, когда пространство uv испытывает унитарное преобразование [заметим, что U~1==U+, что следует из (2.76)]. Поскольку матрица R является эрмитовой (т. е. эрмитово сопряженная матрица равна самой матрице: R+ = R) и ее след равен нулю, то и матрица R' также должна быть эрмитовой и иметь след, равный нулю (последнее следует из того факта, что подобное преобразование не меняет обоих этих свойств матрицы). Отсюда следует, что матрица R' должна иметь вид II г' г' — ir' II К ~\r' + tr' -r' У || ' 1 \ " 2 ' 3 || где г[, г'2 и Гд — вещественные числа. Поскольку детерминант матрицы также не меняется при подобном преобразовании, то det R - - (г? + т\ + г]) = det R' - - [(r[f + (r'2f + (г^]. (2.81) Соотношение (2.81) является условием ортогональности преобразования; в соответствии с этим операцию (2.80) можно рассматривать как операцию преобразования вектора г в новый вектор г7. Выполняя умножение матриц в соотношении (2.80), получаем следующую связь компонент г[ с компонентами Т\ (i= 1, 2, 3): "Г1 + 'Г2 ~Г3 II I(ae+0Y) r.-aY (г,-*г2)+рв (г,+*га)' -2сфг8+а* (г,-*га)-р« (rt+ir2) П
88 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 Если представить связь компонент г\ с rt в виде соотношения (2.18), то матрица преобразования в соответствии с полученным равенством будет равна АТ=В = |y(a2-Y2+62-P2)4(Y2-«2 + e2-P2) Yfi^aP i.(a2 + Y2-P2-62){(a2 + Y2 + P2 + 62)^(ap--Y6) рб — <xy *'(<XY + P6) ad + pY 1 (2.82) Можно показать, что ортогональное преобразование (2.81) изоморфно операции (2.80), и развить данный формализм на все преобразования, связанные с движением твердого тела. Однако удобнее установить связь параметров Кейли — Клейна с кватернионами, чтобы использовать полученные выше результаты. Эта связь легко устанавливается с помощью спиновых мат- риц Паули. Спиновыми матрицами являются следующие три двумерные матрицы: 4!i 4?.'l- Hi-?l-<"» Отметим, что все спиновые матрицы — эрмитовы (т. е. pf = J),), унитарные и след каждой из них равен нулю. Совместно с единичной матрицей 1 -П спиновые матрицы образуют систему четырех независимых матриц двумерного комплексного пространства. Любая матрица размера 2X2 в двумерном пространстве может быть представлена в виде линейной комбинации указанных четырех матриц: а Ъ с d = i(b + c)h+±(b-c)p2+±(a-d)p3 + + ±(a + rf)1. (2.84)
$2.71 СВЯЗЬ ПАРАМЕТРОВ В9 Если след этой матрицы равен нулю, то последний член в (2.84) исчезает. Если, кроме того, матрица эрмитова (т. е. a, d — действительные числа и b = c*)t то коэффициенты при спиновых матрицах в разложении (2.84) суть действительные числа. Матрицы Паули позволяют представить оператор R в следующем виде: \г\ +ir2 ~r3 = /-,)>!+ г2р2 + г3р3. (2-85) Благодаря этому матричный оператор R, которому поставлен в соответствие вектор г, представлен в форме разложения вектора по «ортам» трехмерного пространства. При этом в качестве таких ортов выступают спиновые матрицы Паули; этим самым устанавливается связь двумерного комплексного пространства и трехмерного вещественного пространства. Рассмотрим, как может быть представлена унитарная матрица U с помощью спиновых матриц. В соответствии с (2.84) имеем U=hJ|=j(P + Y)Pi + |(P-Y)p2 + j(a-d)p3 + + j(a + 6)h (2.86) Можно видеть [см. соотношения (2.78)], что коэффициенты при pi суть мнимые числа, а коэффициент при единичной матрице — действительное число. Отсюда следует, что матрица, эрмитово сопряженная с матрицей U, равна т. е. изменился знак коэффициентов при спиновых матрицах. Покажем теперь, что каждая спиновая матрица определяет оператор единичного поворота вокруг своей оси. Действительно, операция преобразования (2.80) для матрицы U, равной, например, U-al+Pfc
90 ТЕОРИЯ КОНЕЧНОГО ПОВОРОТА ТВЕРДОГО ТЕЛА [ГЛ. 2 (что имеет место при а = б и Р = у)> оставляет неизменным вектор, имеющий то же направление, т. е. Подставляя указанные величины в соотношение (2.80), получаем R'=URU+ = (a1 +p|>1)r1Ma1 -РМ-П (а2-р2)р1=г1р1 (нужно учесть, что J>i1=1Pi=J>i и р{р1=1). Можно показать, что если у* — направляющие косинусы единичного вектора, то унитарная матрица U - 1 cos -у + / (YiPi + Y2P2 + УзРз) sin -§- (2.87) определяет преобразование (2.80), оставляющее неизменным вектор YiPi + Y2P2 + Y3P3» который и будет осью вращения (угол поворота равен Ф). Представление унитарной матрицы (2.86) и преобразования (2.80) становятся эквивалентными соответственно представлению кватерниона (1.11) и операции вращения (1.14), если учесть, что спиновые матрицы, позволяющие осуществить «векторное» представление операторов R и U, подчиняются правилам умножения гиперкомплексных единиц: РгРз = — Р3Р2 = tPu ftl = 1Pi = Рь Ы\ = — Pi & = 'J>2> &1 = 1 ^2 = J>2> PlJ>2 = ~ №\ = #3» Рз1 = 1Рз = fc. , (2.88) Таким образом, спиновые матрицы позволяют установить соответствие между кватернионами и унитарными матрицами. Заметим, однако, что спиновые матрицы несколько по-разному представляют матрицу-вектор (с действительными коэффициентами) (2.85) и матрицу-оператор преобразования U (2.86) (коэффициенты мнимые у векторной части). Вследствие этого не такими симметричными получаются и формулы умножения спиновых матриц (2.88). Тем не менее эквивалентность матрицы преобразования (2.87) кватерниону
§2.71 СВЯЗЬ ПАРАМЕТРОВ 91 показывает, что выполняется соответствие Ло !Cos-s- = T(a + 6), 2 2 в частности, пара- (2.89) 2 2 х^ , v/, „t— Т1.11Л 2 — 2 A,2 = Y2siny = y(P — Y)t ^3 = Y3sin-5- = —T(a —б), где Яг- (t = 0, l, 2, 3) могут быть, метрами Родрига — Гамильтона. С учетом этих соотношений, следующих из равенства (2.86), можно связать параметры Кейли — Клейна с компонентами кватерниона: a = Ло п~ /Лз> о ^ Ло — /Лз> Р = %2 + ik\t Y === *^1 — ^2* Представляя унитарную матрицу в выражении (2.86) через компоненты Аг-, можно преобразование (2.80) свести к преобразованию (2.33), при этом применимы все результаты, полученные в § 2.2—2.6. Отметим только, что операция (2.80) изоморфна ортогональному преобразованию в форме (2.18). В заключение, пользуясь соотношением (2.89) и ранее полученными равенствами (2.69) и (2.72), свяжем параметры Кейли — Клейна с углами Эйлера и Крылова. Подставляя вместо A* (i = 0, 1, 2, 3) величины vt- из (2.69), получаем для углов Эйлера a = cos 2 е*—2~, d = cos-ye"-' Р '/sin^-e* ф-ф Y = JSin-ire' 2 I (2.90) 2 * * # J Используя соотношение (2.72), находим зависимость параметров Кейли — Клейна от углов Крылова: a = е 2 (cos-*- cos у — / sin-|-sin -у), 6=^(cosfcos-£ + /sinf sin-I). /ф p = e 2 (cos у sin y + / cos -|- sin y), У- — e2 (cosysmy — jcosysuiyj. (2.91)
ГЛАВА 3 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ Кинематические уравнения связывают вектор угловой скорости вращения твердого тела с производными по времени от кинематических параметров. Вид кинематических уравнений определяется в зависимости от кинематических параметров, поэтому для углов Эйлера, направляющих косинусов и параметров Родрига — Гамильтона уравнения различны. Желательно иметь единый подход к исследованию кинематических уравнений, а следовательно, и к их получению. При выводе уравнений будем полагать, что читателю известна такая физическая величина, как вектор угловой скорости [9, 16, 29]. Основываясь на понятии угловой скорости как предела отношения бесконечно малого поворота к элементу времени, в этой главе приводится вывод кинематических уравнений. Показывается, что запись этих уравнений с использованием кватернионов является универсальной и повторяется для всех кинематических параметров при соответствующей формализации. Получен общий вид кинематических уравнений. Использование кватернионов позволяет представить кинематические уравнения в наиболее естественном виде, когда связываются однородные параметры, характеризующие элементарное вращение (вектор угловой скорости) и конечное вращение (компоненты кватерниона). В связи с этим использование кватернионов позволяет доказать теорему об общем решении кинематического уравнения, построить формальное решение и исследовать ряд простых случаев, когда удается получить решение в элементарных функциях. Проведенные исследования оказываются полезными для приближенных методов решения, рассматриваемых в следующей главе.
§ 3.1] БЕСКОНЕЧНО МАЛОЕ ПРЕОБРАЗОВАНИЕ 93 § 3.1. БЕСКОНЕЧНО МАЛОЕ ПРЕОБРАЗОВАНИЕ. ВЕКТОР УГЛОВОЙ СКОРОСТИ Кватернион преобразования вращения, например (2.41), определяет вектор конечного поворота, переводящего систему координат Е в положение Е*\ Рассмотрим бесконечно малое преобразование, при котором положение систем Е и Е' отличается на малую величину. Этому преобразованию должен отвечать кватернион, осуществляющий вращение на бесконечно малый угол Ад; в соответствии с представлением кватерниона (1.11) можно видеть, что приближенное значение этого кватерниона с точностью до членов второго порядка относительно ДФ равно AA = l+g-^, (3.1) где АА — кватернион бесконечно малого преобразования, g— мгновенная ось вращения, Ад — угол поворота. Пусть теперь кватернион (3.1) задает преобразование вращения (2.33), благодаря чему связанный с системой координат вектор г переходит в новое положение г'. Выполняя операции умножения, можно видеть, что г' = ДЛоГоДЛ = (1 + ^)оГо(1_^) = . о ДА о ДА о о ДФ2 = Г+ g-g-or— rog-^ gorog —# Отбрасывая член второго порядка малости, имеем следующее приращение вектора: Ar = r'-r = gor-^-rog^ = (gAd)Xr. (3.2) В формуле (3.2) было использовано представление умножения кватернионов с помощью умножения векторов (1.8). Беря отношение обеих частей равенства (3.2) к А/ и переходя к пределу, получаем 4г=Иг)хг=«>хг. (з-з)
94 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Это равенство убеждает нас в том, что величина f db fc dt равна вектору угловой скорости <о движения системы координат Ег относительно Е. В соответствии с этим кватернион бесконечно малого преобразования (3.1) может быть записан и в таком виде: ДА = 1 + -j юД t, dX = 1 + j <*dt. (3.4) Приведенный вывод, позволивший связать вектор угловой скорости с кватернионом бесконечно малого поворота, носит иллюстративный характер. В действительности мы имеем право, исходя из определения вектора угловой скорости как отношения вектора бесконечно малого поворота к элементу времени dt и основываясь на фундаментальной теореме 1.1 и соотношении (2.51), сразу же написать соотношение (3.4). В случае направляющих косинусов вектор угловой скорости вводится через элементы матрицы бесконечно малого преобразования. Изоморфная операция преобразования вектора (2.18) задает преобразование матрицей В = Ат, которая может быть представлена в виде суммы единичной и некоторой матрицы, соответствующей малому преобразованию: В = 1+е. Такая матрица задает почти тождественное преобразование, отличающееся от него бесконечно малым оператором. В соответствии с (2.18) имеем r'=(1+e)r = r + er, т. е. Дг = г' — г = ег, (3.5) где е — оператор бесконечно малого приращения. Матрица обратного преобразования В~1 должна быть равна
§ 3.1] БЕСКОНЕЧНО МАЛОЕ ПРЕОБРАЗОВАНИЕ 96 так как в этом случае выполняется соотношение ВВ-1 = (1 +е)(1 -е)=1 с точностью до членов второго порядка относительно е- Но для ортогональной матрицы обратная матрица совпадает с транспонированной, следовательно, Вт=1+ет=1-е, ет=-е. Таким образом, матрица бесконечно малого преобразования является антисимметрической, т. е. имеет вид €//= — €/ь е = 0 ^21 €31 €12 0 €32 €13 €23 0 = 0 — е12 -еи е 12 «13 0 е23 — ем 0 ! = = 0 - ДФ3 ДФз 0 -ДО 2 Д«1 Д#2 - А*! 0 Рассматривая отношение этой матрицы к элементу А/ и обозначая предел этого отношения при Д/~►О через fi, а величины -тт1 через со*, получаем I 0 — ©з со2 I 0= ©з 0 — ©1 . (3.6) I — ©2 ©1 О I Каждой антисимметрической матрице в трехмерном пространстве соответствует вектор со, компонентами которого являются величины ©ь ©2, юз- Связь элементов матрицы с компонентами вектора устанавливается формально с помощью символа Леви-Чивита 6*#. Этот символ равен нулю, если среди индексов i, /, k имеются одинаковые, и равен +1 или —1 в зависимости от чет- / 1 2 3 \ ности или нечетности перестановки ( . ,1. Соотношение, устанавливающее связь матрицы ||е^|| с компонентами вектора, имеет такой вид: АО* =4 2 *i/*ert. (3.7)
se КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Три величины ДФ* (или dbi) матрицы е являются тремя независимыми параметрами, определяющими вращение. Подставляя значение е в (3.5), получаем для приращений вектора dt\ = г3 йЬч — г2 й$ъ, dr2 = Г\ d$3 — гз d$\f dr$ = r2 dft\ — г i dd2> что можно записать также в виде векторного равенства или Поскольку величина <о определяется векторной частью кватерниона преобразования вращения, то в соответствии с теоремой 2.2 она является вектором. Отсюда следует, что определяемые компонентами кватерниона с/Л (3.4) величины со* суть проекции вектора угловой скорости со (так же, как и кватерниона) на любую систему координат, в том числе и на базис Е. Очевидно, что проекции на базисы Е и Е' в данном.случае одинаковы, так как dX определяет переход между этими базисами. Рассмотрим в заключение последовательность двух бесконечно малых преобразований, определяемых кватернионами dAi и dA2. Результирующее преобразование будет равно JA = c/A2odA1 = (l +-j<»**)o(l +^<*>i<w) = = l+^(^+^2)dt + j^2o^dt2^l + j(^ + &2)dtf т. е. с точностью до малых второго порядка происходит сложение бесконечно малых поворотов и соответственно угловых скоростей. Отметим, что порядок умножения здесь не играет роли; это говорит о том, что проекции вектора ©i + Щ на близкие системы координат с точностью до малых второго порядка не отличаются.
§ 3.2] ВЫВОД КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ 97 Полезно полученную формулу записать отдельно как правило умножения кватернионов малых вращений. Согласно (3.4) кватернионы малого вращения с точностью до малых второго порядка от величины угла поворота Ф можно представить в виде ДЛ=1+1е + о(д), где в = £Ф — вектор бесконечно малого поворота. Формула умножения кватернионов малых преобразований с точностью до членов второго порядка малости будет такой: ДА3=ДА! о ДА2= [l +1в, + о^)] о [l +1 в2 + о(#2)] = Отсюда видно, что бесконечно малые повороты складываются как векторы. § 3.2. ВЫВОД КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ При выводе кинематических уравнений следует учитывать, что практически нашли применение уравнения, в которых фигурируют проекции вектора угловой скорости © движения подвижной системы координат относительно исходной либо на эту исходную, либо на подвижную систему координат (а не вообще на какой-либо базис). Этим объясняется, что в кинематических уравнениях используются проекции кватерниона на начальный и конечный преобразуемые базисы,/вт. е. параметры Родри- га — Гамильтона. Приведем два вывода кинематических уравнений. I. Будем рассматривать исходную систему координат / и движущуюся относительно нее с угловой скоростью <о систему координат Е. Пусть переход от базиса / к базису Е определяется кватернионом Л с помощью операции вращения типа (2.44), которую запишем в таком виде: Е = Ао/оЛ. (3.8) 4 В. Н. Бранец, И. П. Шмыглевский
98 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Вследствие относительного движения базисов кватернион А будет переменной величиной. Это означает, что компоненты кватерниона U (i = 0, 1, 2, 3) будут функциями времени МО, и соответственно этому временной функцией А(0 будем обозначать также кватернион А. Чтобы получить величину скорости изменения компонент кватерниона, рассмотрим два близких положения системы координат Е в моменты времени t и t + dt. Очевидно, что эти положения будут опреде- . ляться относительно исходного W базиса J кватернионами А (0 и \-^4/tj A{t + dt). С другой стороны, \"^^\ J?E(t) взаимное положение базиса Е \A(£&< у<С в моменты t и t + dt будет за- \^у^\^^ висеть от угловой скорости Х/^,**0*01^ E(t*dt) движения базиса Е и будет за- ^■""^ даваться кватернионом беско- Рис 3.1. нечно малого перемещения dX (рис. 3.1). Отсюда легко получить связь между кватернионами А (О, А (/ + *#) и dA. Однако прежде всего рассмотрим, на какие системы координат следует проектировать полученное равенство, т. е. какие отображения данных кватернионов следует использовать. При этом нужно исходить из того, что кватернион dA желательно выражать в проекциях либо на оси системы координат £, тогда его компонентами будут проекции угловой скорости на связанную систему координат, либо на базис /, в этом случае компонентами dA будут проекции на неподвижную систему координат. В первом случае используем теорему 2.4, согласно которой собственные кватернионы каждого преобразования перемножаются следующим образом: A*(t + dt) = A*(t)odA\ Здесь кватернионы A*(t + dt) и А* (0 имеют параметры Родрига — Гамильтона в качестве компонент преобразований, переводящих базис / в базисы E(t) и £(/+^0 соответственно. Кватернион dA* имеет компонентами равные величины проекций угловой скорости на связанные системы координат E(t) и E(i-\-dt). Используя представление кватерниона dA (3,4) и обозначая кватер-
§ 3.2] ВЫВОД КИНЕМАТИЧЕСКИХ УРАВНЕНИИ 99 нион-отображение вектора <о на базис Е через ю^, получаем окончательно A*(t + dt) = A'(t)o(l +±<*Edt). (3.9) Обратимся к теореме 2.3, согласно которой сумму поворотов A(t) и dA, составляющих поворот A(t + dt), можно проектировать на один и тот же базис. При этом, чтобы получить в результирующем соотношении собственные кватернионы преобразований (кватернионы, составленные из параметров Родрига — Гамильтона), в качестве базиса для цроектирования можно использовать только базис /. Для базисов E(t) и E(t-\-dt) либо кватернион A(t + dt)9 либо кватернион A(t) не будет собственным кватернионом преобразования. Согласно теореме 2.3 имеем Л*(* + Л) = М* + Л) = ^А/оЛ/(0 = ^Л/оЛ*(*), т. е. компонентами кватерниона dAj будут проекции вектора угловой скорости на исходную (неподвижную) систему координат. Используя представление (3.4), запишем полученное соотношение в таком виде: A* (t + dt) = (l + \ null) о Л* (/). (3.10) Соотношения (3.9) и (3.10) и есть две формы кинематического уравнения. Уравнения в такой форме имеют смысл для всех численных методов решения, так как связывают значения кватерниона в последующий момент времени с его значением в текущий момент времени. Однако чаще используется еще одна форма записи кинематического уравнения. Рассмотрим величину А*(/ + <К)-А*(0 dt представляющую собою формальную производную от кватерниона как четырехмерного вектора dA* uXq ф dXi d%2 . dX^ 4*
100 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Эта производная взята, естественно, в предположении неизменности базиса /, являющегося составным гиперкомплексного пространства Н. Можно видеть, что с учетом этого равенства кинематические уравнения (3.9) и (3.10) могут быть соответственно записаны и в такой форме: ^1=1^0^, (3.11) -^=1%оЛ'. (3.12) Заметим, что кватернион Л* задает переход от базиса / к базису Е операцией вращения (3.8); в соответствии с теоремой 2.1 преобразование компонент неизменного вектора угловой скорости должно определяться обратной операцией вращения, выполняемой над гиперкомплексными отображениями, т. е. <д£ = Л*о(|)/оА*. (3.13) Очевидно, что соотношение (3.13) однозначно удовлетворяет уравнениям (3.11) и (3.12). Уравнениям (3.9) и (3.10) соответствуют две возможности сложения кватернионов на сфере (рис. 3.2). Согласно этому рисунку A* (t + dt) = d\i о А* (0 = А* (/) о dA£, и связь дуг d\j и dS.E определяется операцией переноса d\.E = А* о dA/ о А*, являющейся выражением равенства (3.13). II. Кинематические уравнения можно получить еще одним способом. Пусть переход от опорного базиса / к базису Е определяется кватернионом Л (3.8); тогда для любого орта, как и вообще для любого вектора, неподвижного в базисе Ef преобразование определяется этой же операцией: г, = А*огоЛ*. Рассматривая изменение г' в исходном базисе, т. е. движение, происходящее только за счет изменения Л*, Рис. 3.2.
ВЫВОД КИНЕМАТИЧЕСКИХ УРАВНЕНИИ Ю1 получаем величину локальной производной от радиуса- вектора _= —oroA +Aoro- = = ^oA-or'-r'o^:oA-, (3.14) так как г ° Л* = Л* о г' и А* о г = т' о Л*, и из равенства Л*°Л*=1 следует, что ~dToX +А °-ЗГ=0' 4—Х-.-^-.А-. (3.15) а величина производной от кватерниона понимается в смысле (3.11), т. е. представляет собою локальное изменение кватерниона относительно опорного базиса. С другой стороны, локальная производная от вектора, неподвижного в базисе Е, определяется соотношением (3.3). Чтобы получить связь величины —тт- с вектором угловой скорости со, необходимо векторное равенство (3.3) представить в виде произведения кватернионов ©Хг'^уЦог^г'о©/), (3.16) что следует из представления (1.8), где о/ = Q,f, + Q2fc + Qafa (3.17) — кватернион, составленный из проекций вектора со на оси исходного базиса, т. е. отображение со на J. Сравнивая соотношения (3.14) и (3.16), сразу получаем ю/=2^оЛ\ (3.18) откуда следует форма кинематического уравнения (3.12). Форма (3.11) получается из Л(&18) с учетом того, что
102 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 кватернион-отображение ю£ получается из ©7 операцией (3.13). Из соотношения (3.11) следует, что о Г* dA* и величина этого кватерниона ©£=©!*! + ©2*2 +0*3*3 (3.19) (3.20) определяется проекциям» вектора © на связанную систему координат Е. Используя представления (3.17) и (3.20), запишем уравнения, определяющие компоненты вектора угловой скорости через производные от кватерниона преобразования (3.18) и (3.19), в виде скалярных соотношений (здесь и далее будем опускать звездочки у компонент кватерниона, понимая, что в кинематических уравнениях фигурируют только параметры Родрига — Гамильтона): ill === ~ (ЛоА»1 — Ao^i -\- Л2Л3 — ^2^3), 02 == ^ (Л0Л2 — Ло^2 Н~ Лз^1 — ^1^3/> йз == 2 (a,qX$ — Л0Л3 "г МЛ2 — Л2Л1); J ©1 = 2 \A\Kq —• AqAj ~т~ Л3Л2 — ^2^3/» J ©2== 2 (А^Ло — Л0Л2 Н~ Л1Л3 — Л3Л1), ©з = 2 (Л3Л0 — Ао^з "Г Л2Л1 — AjA^). (3.21) (3.22) Уравнения (3.21) и (3.22) определяют величину угловой скорости, которая является физической характеристикой движения и может быть измерена. Можно показать, что определитель из коэффициентов при скоростях [т. е. при производных Л* в системах (3.21) и (3.22)] всегда равен единице. Это означает, что, во-первых, обращение этих систем всегда выполнимо и, во- вторых, кинематические уравнения в форме (3.11), (3.12) не вырождаются при любых значениях параметров. Это свойство весьма важно для приложений, в осо- Оенности при численном решении уравнений.
§3.2] ВЫВОД КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ 103 Запишем уравнения (3.11) и (3.12) в виде скалярных соотношений 2Яо = — COjA»! — G>2^2 — СО3Я3, 2Х\ = ©jAq + ©3^2 — С02Яз, 2А»2 = ©2^0 + ©1Л3 — ©3^1* 2^з = ©3^0 "Ь ®2^1 — ©1^2» ^Ло == — wjAi — &22Л2 ~~~ "»з^з> 2Aj = QjA^) -J- Й2Л3 — ь2зЛ2, 2А»2== 02^0 "г в2з^1 """" вй^з, ^Лз == вйзЛо "г «"1^2 """* Ьй2'М. (3.23) (3.24) Отметим еще раз, что кинематические уравнения описывают движение одной системы координат относительно другой, поэтому в них фигурирует вектор относительной угловой скорости. Рассмотрим в заключение, как происходит сложение относительных движений. Пусть кватернион Л* задает переход от системы координат J к системе £, а кватернион М* — переход от системы координат Е к системе £'. Пусть угловая скорость системы координат Е относительно системы J равна ©ь а угловая скорость системы координат Ег относительно системы Е равна ©2. Кинематические уравнения, описывающие движение системы координат, согласно (3.11) и (3.12) имеют вид А* = -J ©и ° А* = ^ А* ° ©i£. (3.25) Аналогично этому такие же соотношения определяют и относительное движение базиса Ег относительно базиса Е: М* = -о" ©2£ оМ* = 7М*о Ю2£', (3.26) где ©2£ и ©2£' — кватернионы, составленные, из проекций вектора ©2 на исходный (Е) и связанный (Е') базисы. Рассмотрим результирующий кватернион N*; как следует из теоремы 2.4, для собственного кватерниона,
104 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 составленного из параметров Родрига — Гамильтона, справедливо соотношение Дифференцируя это равенство, получаем Подставим в него значения производных от составляющих кватернионов в соответствии с первыми равенствами (3.25) и (3.26): ^ = 1©1/оА-оМ* + уА-о©2£оМ- = = l©1/oN' + 4A*0®2iroA*oN*- Поскольку проекции вектора ю2 на базис Е связаны с его проекциями на базис / операцией вида (3.13), то отображение вектора щ на базис / будет равно ю2/=Л*ою2£оА\ Подставляя это соотношение в полученное выше равенство, имеем т. е. кинематическое уравнение для сложного движения имеет вид (3.12), причем, поскольку в нем представлены отображения векторов щ и ©2 на один и тот же (исходный) базис, происходит сложение векторов угловых скоростей. Равенство (3.27) есть отражение известного кинематического закона сложения угловых скоростей при сложении относительных движений. Аналогично, рассматривая вторые равенства (3.25) и (3.26), получаем 451=4'А"о©1£оМ* + 1а%М*о©^ = at 2 * «= 1N* о М* о ©11? о М'+ J-N* о ю21„.
§3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 105, Проекции вектора ©i на базис Ег определяются операцией вращения, обратной операции преобразования базисов: ©1£/ = Й* О ©1£ О М*, откуда следует, что ^ = |n*o((o1£,+g>2H (3.28) т. е. уравнение принимает форму (3.11) и происходит также сложение векторов угловых скоростей. Отметим, что соотношения (3.27) и (3.28) можно было бы сразу получить из (3.11) и (3.12), учитывая, что скорость системы координат Е' относительно системы / равна ©1 + ©2- Полученный вывод иллюстрирует справедливость кинематических соотношений. § 3.3. КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ I. Направляющие косинусы. Для вывода кинематических уравнений, связывающих производные от косинусов с компонентами вектора угловой скорости, рассмотрим соотношение (2.18), задающее преобразование вектора в вектор при ортогональном преобразовании. Этому соотношению соответствует матричное равенство (2.17). Запишем эти равенства, заменив матрицу Ат на равную ей матрицу В: r'=Br, R'=BR. (3.29) Преобразование описывает изменение вектора, неподвижного в связанной движущейся системе координат, происходящее за счет движения базиса. Компоненты г в исходном / и конечном Е базисах одинаковы, откуда следует, что матрица R постоянна. Рассматривая изменение вектора, происходящее за счет движения базиса, имеем для матричного соотног шения (3.29) r'=BR = BBtR'. (3.30) С другой стороны, в § 3.1 было рассмотрено изменение компонент вектора при бесконечно малом преобразовании (3.5),
106 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Найдем зависимость величины R' от угловой скорости. Пусть имеем два близких значения R'(t + dt) и R'(0, которые отличаются на бесконечно малый оператор (3.5): R'(/ + A0 = (1+e)R'(0. Из этого соотношения имеем AR' = R' (t + М) - R' (0 = eR7 (0; взяв отношение этой величины к А/ и перейдя к пределу, получим R'=(de/dt) R' = QR', (3.31) где de/dt — матрица угловой скорости (3.6). Отметим, что равенство (3.31) есть матричная запись векторного соотношения (3.3). Кроме того, поскольку соотношение (3.29) описывает движение вектора г относительно исходного базиса, элементами матриц R и R', также как и матрицы угловой скорости Q являются соответственно проекции векторов г, г' и © на неподвижную систему координат /. В связи с этим матрицу 12 в равенстве (3.31) будем в дальнейшем отмечать индексом базиса; так как проекции вектора со на базис / обозначены величинами Q* (© = Qxix + ^2*2 + + 03*з). то -G3 0 Й/= Q2 "3 -Q2 Qi Сравнивая соотношения (3.31) и (3.30), получаем Q/= BBT. (3.32) Умножая справа выражение (3.32) на ненулевую матрицу В, имеем (ВВТ=ВТВ = 1) B = Q/B. (3.33) Это есть первая форма кинематического уравнения для направляющих косинусов, в которую входят величины проекций вектора угловой скорости на неподвижный
§ 3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 107 Для получения второй формы уравнения рассмотрим матрицу fi/, которая, очевидно, является матричным оператором. В § 2.1 было показано, что при преобразовании базиса матричный оператор подвергается подобному преобразованию (2.27). Поскольку А=ВТ, то в соответствии с (2.27) оператор 12 в базисе Е (обозначим его Не) будет связан с Q/ следующим подобным преобразованием: Q£=BTQ/B. (3.34) Соотношение (3.34) позволяет найти проекцию вектора угловой скорости со на базис Е\ эти компоненты определяются полученным оператором II 0 —©з ©2 &£= ©з 0 — ©j | — ©2 ©1 0 где © = ©!*! + со2е2 + ©звз> а ®* ~~ проекции вектора © на базис Е. Подставляя в (3.33) матрицу угловой скорости Q/, выраженную через Не согласно (3.34), получаем вторую форму кинематического уравнения, в которую входят величины проекций угловой скорости на связанную систему координат: B=BQ£. (3.35) Сразу же отметим, что форма кинематических уравнений (3.33) и (3.35) сходна с формой уравнений соответственно (3.12) и (3.11). В том случае, когда ортогональное преобразование задается в таком виде, где используется матрица А, кинематические уравнения для матрицы А получаются из (3.33) и (3.35) с учетом того, что АВ = ВА=1, АВ + АВ = 0, В = -ВАВ. Имеем A=-Q£A=- АО/. (3.36) Аналогично соотношению (3.32), исходя из равенства (3.35), получим матрицу, определяемую проекциями
108 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 вектора угловой скорости на связанные оси, в функции от направляющих косинусов и их производных: Q£=BTB=-AAT. (3.37) Поскольку определитель матрицы ортогонального преобразования равен единице, то обращение уравнений (3.32) и (3.37) всегда выполнимо; поэтому кинематические уравнения (3.33), (3.35) и (3.36) не вырождаются при любом значении параметров, т. е. при любом положении твердого тела. Запишем кинематические уравнения в скалярном виде. Поскольку при записи ортогональных преобразований чаще используется матрица А, уравнения запишем для элементов aij9 имея в-виду, что bij = uji. Используя уравнения (3.36), запишем следующие 18 скалярных уравнений, являющихся уравнениями Пуассона: аи = — ю2а3* + ®за2ь &k\ = — йза*2 + ^2^з> а21 = — со3аи + ©i%, ak2 = — Qi^3 + Q3a*i» a3i = — ща21 + G>2a\it Ufa = — &2ak\ + ^1^2 (/. k=\y 2, 3). (3.38) Соотношения (3.32) и (3.37) определяют величины компонент угловых скоростей Q£=~AAT и Q,= -ATA. Имеем ©J = —#31^21— #32^22— #33fl23 = #21^31 "Ь* #22^32 ~Ь#23аЗЗ> С02 = — йиа3\~~ Я12%2~Я13аЗЗ = Дз1а11+Дз2Я12+ЯзЗа13> ©з = —^21^11—а22^12~^23а13==^11а21 + Й12^22+^13а23; Qj = —#12^13— #22^23— #32 #33 = ^13fl 12 Н~ #23#22 "Ь #33#32> Q2= — ^I3aIl —^23^21 — &ЪЪаЪ\^й\\а\Ъ~\~й<1\а2Ъ~\~&Ъ\аЪЗ> й3 = — #12^11 — ^22^21 —Й32^31 =^12allH~^22fl2lH~^32a31 • Девять кинематических уравнений Пуассона (3.38), содержащие проекции вектора угловой скорости на связанные или на неподвижные оси, описывают движение (3.39)
§3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ Ю§ трех ортов связанного базиса. Очевидно, что для ориентации тела достаточно задать положение только двух его осей, поэтому любая тройка уравнений может быть опущена. Одна тройка уравнений описывает движение одной оси; при этом имеется одно уравнение связи (уравнение, фиксирующее длину орта, т. е. уравнение нормы). Кроме того, когда задано движение одной оси (первая тройка уравнений), на вторую тройку уравнений налагаются две связи: фиксируется длина орта и его перпендикулярность к первому. Таким образом, система кинематических уравнений содержит три независимых параметра. Уравнения (3.33), (3.35) и (3.36) имеют наиболее общую форму кинематических уравнении, совпадающую с формой уравнений в кватернионах (3.11), (3.12). В случае кватернионных уравнений осуществляется умножение кватерниона преобразования и кватерниона- отображения вектора угловой скорости на тот или иной базис. В случае же уравнений для направляющих косинусов происходит умножение матрицы преобразования на матрицу угловой скорости. Отметим, что из уравнений (3.33), (3.35) и (3.36) могут быть получены уравнения в любых кинематических параметрах, если только в них выражена матрица ортогонального преобразования (что всегда возможно). В заключение покажем, что уравнения (3.33), (3;35) и (3.36) подчиняются известному закону кинематики, по которому происходит векторное сложение угловых скоростей при сложении относительных движений. Рассмотрим два преобразования: переход от базиса / к базису £, определяемый матрицей Аь и переход от базиса Е к базису £', задаваемый матрицей А2. Результирующее преобразование будет определяться матрицей А3= А2А,. Пусть ©1 — угловая скорость базиса Е относительно базиса /, а щ — скорость вращения базиса Е' относительно базиса £; пусть, далее, Q, и Q2 — соответствующие матрицы этих скоростей. В соответствии с (3.36) имеем две системы кинематических уравнений, определяющих взаимное движение базисов /, Е, Е'\ Ai = — Qi^Ai = — AiQi/, А2 = — Q2£'A2 = — A2Q2E.
no КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Дифференцируя матрицу Аз результирующего преобразования, получаем Аз = А2А1 + A2Ai = — Q2£'A2Ai — AiAfAi = = - A2Q2£Ai - A2A,Qi/. (3.40) Матрица fii£ есть оператор, «спроектированный» на базис Е\ при переходе к базису Е' он испытывает подобное преобразование: Qi£' = A2Qj£A2. С учетом этого из равенств (3.40) следует кинематическое уравнение Аз= — (Qi£' + Q2£') A3, являющееся первой формой кинематического уравнения для движения с угловой скоростью ©| + <*>2. Если выразить оператор Q2E в базисе /, то он будет иметь вид Q2/= AlQ2£Ai, благодаря чему из равенств (3.40) получаем вторую форму кинематического уравнения A3=-A3(Qi/+Q2/). В этом уравнении также происходит сложение компонент угловых скоростей. II. Углы Эйлера и Крылова. Кинематические уравнения в параметрах, которыми являются углы Эйлера или Крылова, хорошо известны [9, 16, 31], и поэтому мы остановимся на этом очень коротко. Связь компонент угловой скорости с производными от углов Эйлера или Крылова можно получить из соотношений (3.32) и (3.37), используя значение матрицы (2.67) или (2.70) соответственно. Однако легче использовать тот факт, что вектор угловой скорости равен сумме векторов угловых скоростей относительных составляющих движений. Так как преобразование задается тремя последовательными плоскими поворотами на углы ф, О и г|), то угловая скорость каждого вращения направлена по оси
§3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 111 поворота и равна ф, ft и -ф. Из рис. 2.1 имеем для углов Эйлера Qj = -ф cos ф + ft sin ф sin ф, ©! = ф cos ft + ф sin ft sin ф, q2 == ^ sin ф —• ft sin -ф cos ф, 02= — ^МпО+фсоздзтф, £3=ф Ч-^созг!); ©3 = ft +фсоз-ф. (3.41) Для углов Крылова в соответствии с рис. 2.2 получаем следующие соотношения: Qx = ft cos ф cos ф — <ф sin ф, ©1 = ft — ф sin ф, q2 = ft cos ф sin ф + ф cos ф, со2 = ф cos ф sin ft + ij) cos ft, q3= ф — ^sin-ф; ©3 = фсо8/фсозд — ^ sin ft, (3.42) где, как и в (3.41), Qh и ©a (k = 1, 2, 3) суть проекции вектора угловой скорости на неподвижный (J) и связанный (Е) базисы. Кинематические уравнения получаются обращением уравнений (3.41) и (3.42). Определитель системы уравнений (3.41), разрешаемой относительно ф, ф и ft, равен 5тф и, стало быть, система (3.41) необратима при ф = kn (& = О, 1, ...). Этим значениям соответствует потеря одной степени свободы (совпадение осей вращения фи#); при ф ф kn имеем ф = Й! cos ф + Q2 sin ф, if = ©1 cos ft — ©2 sin ft, ft = ©з — ©i sin ft ctg г|) — — ©2 COS ft Ctg l|), 6 = QliEJL_Q2I£iiL 1 sin ф * sin ф sin ft в1пф cos ft (3.43) ф=£23 —Qj 8ШфЫ^ф + ф = ©, + Q2 cos ф ctg -ф, Как видно из этих уравнений, при приближении к точке ф = kn стремятся к бесконечности скорости изменения углов ф и ft. Для решения уравнений (3.42) относительно величин ф, ф и ft необходимо, чтобы определитель каждой
.12 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 из систем, равный cosip, был не равен нулю. В точках -ф=(2& + 1) -у происходит совпадение направлений ф иди система таких параметров теряет одну степень свободы. В точках -ф Ф (2k + 1)-^ имеем согласно (3.42) tj)=Q2cos<p — Qi sin<p, tj) = co2cosd —co3sind, + ©з cos ft tg -ф, гь i r^ x • i • cos Ф , sin Ф (p=Q34.QlCOS<ptgl|) + ф===03——. + (o2 + Q2 sin Ф tg ф, cos ф z cos if (3.44) Как и в предыдущем случае, при приближении к точке -ф=(2&+1) y обращаются в бесконечность скорости изменения углов ср и Ф, хотя Йг- и о)г- остаются конечными. Выше мы отмечали, что равенства (3.41) и (3.42) можно получить из общих соотношений (3.32) и (3.37). Однако кинематические уравнения (3.43) и (3.44) не соответствуют общим уравнениям (3.33) и (3.35), в которых фигурируют производные от направляющих косинусов, являющиеся комбинациями углов <р, Ф и ф и их производных. Поэтому кинематические уравнения (3.33) и (3.35) не вырождаются при любом движении твердого тела, чего мы не имеем в случае кинематических уравнений в углах Эйлера и Крылова. III. Параметры Кейли — Клейна. Развитый в § 3.2 метод вывода кинематических уравнений может быть применен (как и в случае кватернионов и направляющих косинусов) для параметров Кейли — Клейна. Найдем вначале параметры Кейли — Клейна для бесконечно малого преобразования, т. е. определим их зависимость от вектора бесконечно малого поворота, а следовательно, и от угловой скорости. Для этого удобнее всего воспользоваться представлением унитарной матрицы преобразования в виде ее разложения по спиновым матрицам Паули (2.87), т. е. представить
г 3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 113 параметры Кейли — Клейна в таком виде: A A A А 1 a = cos^- + ^Y3sin-2-, б = cos-$ — гуз sin-j , | Р = (Y2 + *Yi) sin-y, Y = - (Y2 — 'Yi) sinT . Эти соотношения получаются из сравнения двух представлений матрицы преобразования в виде (2.86) и (2.87); они позволяют выразить параметры Кейли — Клейна в функции угла поворота и направляющих косинусов единичного вектора преобразования. Отметим, что соотношения (3.45) соответствуют равенствам (2.89), связывающим параметры Кейли — Клейна с компонентами кватерниона. В соответствии с (3.45) бесконечно малому преобразованию, т. е. преобразованию с малым углом вращения ДФ, будет отвечать матрица ди = со. б|| | , , . Д« 1 + «Ys — - (Y2 — 'Yi) — (Y2 + /Yi)4" 1 -*Ys —I получаемая, очевидно, с учетом величин первого порядка малости относительно ДФ в формулах (3.45). Представим эту матрицу, определяющую почти тождественное преобразование, в виде суммы единичной матрицы и матрицы бесконечно малого вращения: ди=1+и=1 + 1Ъ ДФ — (Y2-'Yi)-nT <Y2 + /Y»>-tt . ДО — «Уз — (3.46) Рассмотрим отношение матрицы 1)д к элементу времени Д< и возьмем предел этого отношения при Д*-*0. этом случае величины Y*~£T переидут в величины проекций вектора угловой скорости; обозначая матрицу отношения \Sjhd через V, получаем /со3 со2 + /©1 — ©2 + К*>1 "~ '°>3 v 2 (3.47)
114 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Используя разложение матрицы по спиновым матрицам Паули (2.84), можно видеть, что V = у (cujft + со2р2 + ©зРз). (3.48) т. е. матрица угловой скорости V подобно вектору разлагается по «ортам», которыми являются спиновые матрицы. Здесь, естественно, проявляется полная аналогия кватернионов и спиновых матриц. Отсюда следует, что матрица бесконечно малого преобразования (3.46) с учетом (3.47) представима в следующем виде: Рис. 3.3. AU = 1+VA/.(3.49) Теперь мы можем перейти к составлению кинематических уравнений. Пусть положение ортов базиса Е относительно исходного базиса / определяется преобразованием типа (2.80), задаваемым унитарной матрицей U; рассмотрим два близких положения базиса Б, определяемых значениями U (t) и U (t + АО- Очевидно, что переход от базиса / к базису Е в момент tf + Af, задаваемый матрицей U (t + А/), может быть представлен в виде суммы преобразований: преобразования U (t) и бесконечно малого преобразования AU (рис. 3.3). В соответствии с правилами умножения операторов при сложении преобразований имеем U(/ + A/) = AUU(0- Следует заметить, что поскольку матрица AU задает переход между двумя положениями базиса £, то матрица угловой скорости V должна содержать компонентами проекции вектора угловой скорости на связанные оси. В соответствии с этим в полученном выражении матрица бесконечно малого поворота (3.49) будет содержать своими компонентами проекции вектора угловой скорости <о на оси базиса £, т. е. величины, обозначаемые нами через со*; заменим в полученном выраже-
§ 3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 115 нии матрицу AU согласно (3.49), а также в соответствии с приведенным замечанием отметим матрицу V индексом базиса: U (t + M)=\J(t) + WE\J(t) М. Обозначим At->0 м и согласно правилам дифференцирования матрицы получим II й Ml II У ^ II Переходя к пределу при А/-* О, получаем первую форму кинематического уравнения для параметров Кейл и —Клейна: U = VeU. (3.50) Из этого уравнения сразу же получаем величины проекций вектора угловой сдеорости на связанные оси умножением справа на матрицу, эрмитово сопряженную с матрицей U: V£ = UU+, (3.51) Отметим сразу же формальное сходство соотношений (3.50) и (3.51) с аналогичными уравнениями (3.35) и (3.37), а также сходство (3.50) с (3.11). Разный порядок умножения в формулах (3.36), (3.50) и (3.11) объясняется порядком умножения рассматриваемых операторов последовательных преобразований и собственных кватернионов (см. теорему 2.4). Запишем эти уравнения в координатах; из уравнения (3.50) имеем 4 Р Li У б I 2 /со3 со2+ Ш{ II а Р — со2 + ^1 — *©з II у 6 Выполняя умножение матриц, получаем • "о3 . /о>1 — (о2 ; /со3 * | /coi — со2 Q Y=-—Y+ 2 а> 6 = _"2"6-| 2 Р- (3.52)
116 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Отметим, что из приведенных четырех уравнений вторая пара (для р и 6) является следствием первой пары (для а и у) и получается из нее с учетом связи (2.78) между параметрами Кейли — Клейна (является комплексно сопряженной с первой парой уравнений). Если же подставить выражения для а и y через элементы кватерниона (2.89), то можно убедиться, что уравнения (3.52) перейдут в уравнения (3.23) для кватерниона. Следует заметить, что так как в уравнениях (3.52) а и у (а следовательно, р и б) — комплексные величины, то собственно скалярными действительными уравнениями, соответствующими уравнению (3.50), будут именно уравнения (3.23) для кватерниона; при этом уравнения связи (2.78) переходят в уравнение нормы кватерниона. Чтобы получить вторую форму уравнений, содержащую проекции вектора угловой скорости на оси неподвижного базиса, рассмотрим другую последовательность преобразований. Пусть положение системы координат Е в момент времени / + АЛ определяется, как и ранее, унитарной матрицей U (t + Д^Ь В отличие от предыдущего случая, это положение можно представить в виде бесконечно малого преобразования — перехода от базиса J к базису V такому, что последующий переход от /' к Е в момент t + А* определяется матрицей U (t).. Таким образом, если в предыдущем случае матрица U (t + ДО представлялась в виде последовательности матриц U (t) и AU (см. рис. 3.3), то в данном варианте последовательность обратная, причем матрица AU определяется уже бесконечно малым преобразованием, происходящим в базисе /. Соответственно этому матрица бесконечйо малого преобразования будет содержать проекции вектора угловой скорости <о на оси неподвижного базиса J, т. е., согласно (3.49) и (3.47), iu-,+iv^=i+i|_Ql+1(Q| :Ta, (3.53) Исходя из определенной выше последовательности преобразований, получаем U(t + At) = U(t)AU.
§3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 117 Из этого равенства с учетом (3.53) после деления на Д* и перехода к пределу, получим вторую форму кинематического урабнения: U=UV/. (3.54) Умножая это уравнение справа на U+, получаем уравнение для матрицы угловой скорости V/=U+U. (3.55) Отметим формальное сходство кинематического уравнения (3.54) с полученными ранее (3.36) и (3.12). Запишем уравнение (3.54) в координатах: d р Y 6 а Р III /Q3 Q2 + ^i Y б HI — Q2 + /Qi — 1Q3 Производя умножение матриц и приравнивая элементы, получаем | (3.56) Р=__|з.й + 2 Q2 + «! Р, — a, 0 = 2"б + Заметим, что вторая пара уравнений (для y и б) есть следствие первой пары (комплексно сопряженные с ними уравнения). Уравнения (3.56), так же как и (3.52), еще не скалярные действительные уравнения, так как параметры a, p, y и б — комплексные. Разделяя действительную и мнимую части (3.56), с учетом (2.89) получаем уравнения для кватерниона (3.24). Выпишем еще в скалярном виде уравнения для компонент угловой скорости согласно уравнениям (3.51) и (3.55): 1 2 1 2 1 '®з 1 — со2 + toi Й2з — Q2 + *Qj CU2 + *®1 I ~ '©3 II 1 Q2 + №\ — /Q3 a P Y Ц 1 6 1 -Y I б ~Р 1 ~Y a -P||u P a 1| у 6
118 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 откуда имеем ©i=-/(ap + p* + YO + ev)f a>2 = аЭ + рб — va — fry, I (3.57) ©з = 2/ (y£ + 66) = — 2/ (ad + pv); Q, = - i (сф + yu + P6 + Ay). Q2 = ap + pd — Ya — 6y, J (3.58) Q3 = 2/ (yP + 66) = - 2/ (aa + Py). Можно проверить, что при подстановке в (3.57) и (3.58) соотношений (2.89) получаются равенства (3.22) и (3.21) для компонент кватерниона. Поскольку на практике решаются действительные скалярные кинематические уравнения, то уравнения в параметрах Кей- ли — Клейна тождественны уравнениям в компонентах кватерниона, отличаясь от них только формой записи. Можно, далее, по аналогии с кинематическими уравнениями в направляющих косинусах показать, что полученные формы кинематических уравнений (3.50) и (3.54) удовлетворяют закону сложения относительных движений, при котором происходит сложение векторов относительных угловых скоростей. Это доказательство может быть проведено исходя из аналогии представлений операций вращений (2.80) и (1.20); при этом используются все результаты, полученные для кватернионов. IV. Уравнения для вектора конечного поворота. Поскольку среди кинематических параметров есть параметры, определяемые вектором конечного поворота (величина угла поворота Ф и единичный вектор g конечного поворота), выведем кинематические уравнения для этих параметров. Обычно, поскольку эти величины определяются компонентами кватерниона преобразования, в качестве таких уравнений используются кинематические уравнения для кватерниона, однако формально уравнения для О и g отличны от кватернионных. Для вывода этих уравнений используем, например, уравнение (3.19), согласно которому Ю£=2А*оА\
§ 3.3] УРАВНЕНИЯ В ДРУГИХ ПАРАМЕТРАХ 119 где ©£ — кватернион-отображение вектора угловой скорости на базис Et а А*—собственный кватернион преобразования, т. е. кватернион, компонентами которого являются проекции вектора конечного поворота на базис Е. Если в этом уравнении заменить кватернионное умножение операциями в трехмерном пространстве, то, поскольку векторные части каждого кватерниона заданы в одном и том же базисе, это уравнение просто перейдет в векторное уравнение. Следовательно, согласно (1.9), имеем со = 2 (ЛДо + XQX — iQX + X . i - X X i). При этом, исходя из формы представления (1.11), A,o = cos-2", A = £sin-2-f ^о= — ysiny, X = £sm-y + -у £ cos у. С учетом этих равенств, получаем уравнение для вектора угловой скорости <о = Ы +1 sind + 6 X £(1 - cosd). (3.59) Уравнение (3.18) представляет собой ту же операцию, записанную в другом базисе (/). Предоставляем читателю доказать, что она также приводит к векторному уравнению (3.59). Уравнение (3.59) определяет вектор угловой скорости через кинематические параметры и их производные. Для получения кинематических уравнений необходимо разрешить (3.59) относительно производных от кинематических параметров. Умножим (3.59) скалярно на £. Учитывая, что £•£ = (), так как £ — единичный вектор и & X &) • £ = °> имеем £ = ©.£. (3.60) Для получения производной от вектора g используем кинематическое уравнение (3.11) и способом, аналогичным описанному, превратим его в векторное уравнение 2 <Ло + х) = V° — * • © + * X ®»
120 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 С учетом равенств, выражающих XQ и X через Ф и g, получим А А А - * sin -у + Н cos у + 2£ sin-j = А А А = © с os у — © • £ s i n y + £ X © s i n у • Исключая из этого равенства скалярную часть, учитывая, что А А* А А / *\ * А © COS у — Ag COS у = Ю COS у — (<» • £) £ COS у = = £X(«>Xe)cos4-> и деля на sin y^O (не рассматриваем ft=0t 2я, соответствующие тождественному преобразованию), получим окончательно 2£ = [6 X (*> X С)] ctg у + 5 X *>• (3.61) Можно проверить, что уравнение (3.12) приводит к такому же векторному уравнению. Уравнения (3.60) и (3.61) суть кинематические уравнения для вектора конечного поворота. § 3.4. ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ Проведенные исследования различных кинематических параметров, с помощью которых может быть задано движение твердого тела, показали, что существуют, вообще говоря, только три различных типа параметров. Это — направляющие косинусы, углы Эйлера и компоненты кватерниона, являющиеся параметрами Родри- га — Гамильтона. Такие параметры, как компоненты вектора конечного поворота и параметры Кейли — Клейна, сводятся к кватернионным параметрам, так как они определяют различным образом одну и ту же физическую величину — эквивалентное эйлерово вращение вокруг одной оси. Различие параметров определяется способом описания движения твердого тела или, что тр же, связанной
§ 3.4] ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ \$\ с ним системы координат. В случае направляющих косинусов задается «координатное» положение связанной системы координат относительно исходной; при этом каждая ось связанного базиса может быть различным образом представлена в исходном базисе (см. § 2.1). В случае углов Эйлера положение твердого тела задается с помощью трех последовательных плоских поворотов, таких, что их сумма дает эквивалентное положение связанного базиса. Для параметров Родрига — Гамильтона положение твердого тела задается одним эквивалентным плоским поворотом вокруг некоторой оси, определяемой как ось эйлерова вращения. Соответственно этому кинематические уравнения, описывающие движение твердого тела в функции от величины угловой скорости, имеют, вообще говоря, три различные формы: уравнения в направляющих косинусах, углах Эйлера и кватернионах. Кинематические уравнения в направляющих косинусах представляют собой систему девяти скалярных линейных уравнений, удовлетворяющих шести связям, являющимся условиями ортогональности; эти уравнения не имеют особых точек, т. е. в принципе всегда разрешимы. Уравнения в углах Эйлера (и Крылова) являются системой трех независимых линейных уравнений, имеющих одну особую точку, в которой система параметров вырождается. Кватернионные уравнения представляют собой систему четырех линейных невы- рождающихся уравнений, удовлетворяющих одному уравнению связи (на норму кватерниона). Среди всех кинематических параметров и соответственно способов задания движения твердого тела использование кватернионов представляется наиболее удобным. В отличие от направляющих косинусов, операции ортогонального преобразования однозначно задаются формальными операциями над кватернионами (в случае направляющих косинусов, как было показано в главе 2, существуют два различных способа задания движения матрицами ортогонального преобразования А и В). В случае кватернионов имеется минимальное число невырождающихся параметров и соответственно минимальное число связей; это обстоятельство дает существенное преимущество этим параметрам при
122 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЙ [ГЛ. d численном интегрировании кинематических уравнений. Наконец, использование кватернионов позволяет представить в едином виде две наиболее важные физические величины, характеризующие движение твердого тела: характеристику его локального движения (угловую скорость) и характеристику его положения (вектор конечного поворота). Обе эти величины представляются векторами мгновенного эйлерова вращения и эквивалентного эйлерова вращения. Аппарат алгебры кватернионов позволяет в явном виде представить эти величины векторами пространства Н, которое всегда можно совместить с реальным трехмерным пространством. При этом вектор конечного поворота и вектор бесконечно малого вращения (угловой скорости) имеют один и тот же физический смысл. Применение другого формализма приводит к более сложным представлениям оператора преобразования и оператора угловой скорости. Все это делает кватернионы наиболее удобными кинематическими параметрами для исследования общих свойств движения твердого тела и, в частности, для исследования общих свойств кинематических уравнений. Поскольку кинематические уравнения описывают одно и то же движение, они, естественно, должны сводиться друг к другу; однако этот переход не всегда тривиален и далее он будет рассмотрен. Полученное в предыдущем параграфе формальное представление кинематических уравнений в общей форме умножения двух операторов (оператора преобразования и оператора угловой скорости) позволяет легко распространить полученные для случая кватернионов результаты на случай любых кинематических параметров. Рассмотрим кинематические уравнения для кватерниона-преобразования, записанные в форме (3.11) и (3.12), где кватернионы ®£ и ©/ заданы в функции времени. В скалярном виде каждое из этих уравнений представляет собой систему четырех линейных дифференциальных уравнений (3.23) и (3.24). Коэффициентами этих уравнений являются проекции со* вектора угловой скорости на связанный базис или проекции Q* на неподвижный базис, так что в общем случае коэффициенты уравнений суть заданные функции времени.
§ 3.4] ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИИ 123 В соответствии с общей теорией линейных дифференциальных уравнений [40] можно ожидать, что должна существовать система четырех линейно независимых решений, образующих фундаментальную систему решений этих уравнений. Фундаментальная система может быть получена из решений, для которых, например, в качестве начальных значений взяты орты четырехмерного пространства Н, т. е. векторы (1, 0, 0, 0), (0, 1, 0,0), (0,0, 1,0), (0,0,0, 1). С помощью фундаментальной системы может быть построено общее решение кинематических уравнений в виде линейной комбинации линейно независимых решений (их число должно соответствовать размерности пространства Н). Однако операторное представление кинематических уравнений (3.11) и (3.12) в виде произведения искомого кватерниона на кватернион угловой скорости позволяет находить общее решение кинематических уравнений в другой форме. Это решение определяется следующей теоремой. Теорема 3.1. Пусть задано кинематическое уравнение в первой (3.11) или второй (3.12) форме для кватерниона, описывающего движение твердого тела при заданной временной функции <©/(/) или юеЦ), и пусть известно одно решение этого уравнения N(0- Тогда кватернион A£=C£oN(/) (3.62) является решением уравнения (3.11), а кватернион A7=N(0oC/ (3.63) — решением уравнения (3.12), причем Се и Ci—постоянные кватернионы. Кватернионы (3.62) и (3.63) являются общими решениями уравнений (ЗЛ1) и (3.12) в том смысле, что любое решение этих уравнений, удовлетворяющее требуемым начальным условиям, получается из (3.62) и (3.63) соответствующим выбором констант С/ или Се* Доказательство этой теоремы получается сразу же при подстановке в исходные уравнения (3.11) и (3.12) решений (3.62) и (3.63). Здесь следует учесть, что производные от кватернионов-произведений берутся
124 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 обычным образом: A£=C£oN, A/=NoC/. Для нахождения решения уравнения (3.11), удовлетворяющего начальному значению А£0, необходимо выбрать следующую величину кватерниона-константы С£: A£o = A£(0) = C£oN0, откуда Се = А£о ° No и решение (3.62) примет вид A£(/) = A£0oN0oN(0. (3.64) Аналогично решение уравнения (3.12), удовлетворяющее начальному условию А/0, получается в таком виде: A/(/) = N(/)oNooA/0. (3.65) Можно видеть, что N0°N(/) есть решение уравнения (3.11), удовлетворяющее начальному условию (1, О, О, 0), точно так же, как и N(/)oN0 для уравнения (3.12) удовлетворяет этому же начальному условию. Решения (3.62) и (3.63) или же в записи (3.64) и (3.65) являются единственными решениями, удовлетворяющими заданным начальным условиям; это следует из теоремы единственности, поскольку ^(0 = 0 (/ = 0, 1, 2, 3) также являются -решениями кинематических уравнений. Перейдем к обсуждению теоремы. Формально уравнения (3.11) и (3.12) суть линейные уравнения первого порядка, если исходить из алгебры кватернионов (т. е. допустить возможность выполнения операций линейной алгебры на множестве кватернионов). Поэтому вполне естественно, что их общие решения записываются в виде (3.62) и (3.63)—в виде частного решения, умно^ женного на константу (кватернион). Если допустить в качестве констант кватернионы, то можно видеть, что начальные условия (1, 0, 0, 0), (0, I, 0, 0), (0, 0, 1, 0) и (0, 0, 0, 1) уже не будут линейно независимыми, т. е. и определяемые ими решения также будут зависимы. Этот факт показывает, что кинематиг
§ 3.4] ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИИ 125 ческие уравнения имеют одно фундаментальное решение. С другой стороны, нетрудно показать, что к такому же выводу можно прийти и в результате анализа скалярных уравнений (3.23) и (3.24). Для этого, например, можно использовать представление *) ортов гиперкомплексного пространства в виде следующих матриц размера 4X4: 1 = 11 0 0 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 -1 0 0 0-10 . 01 -1 0 0 «1= 0 -1 0 0 . «3 = 0 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 1 -1 0 » 0 -11 -1 0 0 0| 0 о) *2= В этом случае рассмотренному выше частному решению, удовлетворяющему начальным условиям (1, 0, 0, 0), будет соответствовать фундаментальная система решений, имеющая начальной матрицей матрицу 1. Рассмотрим физический смысл полученных общих решений. Всегда будем считать, что обе формы кинематических уравнений описывают одно и то же движение твердого тела. Отметим, во-первых, что решение Ае (3.64) не удовлетворяет уравнению (3.12), ибо, выполняя подстановку решения \е в указанное уравнение, получим 2Ляо о N0 о N (/) = Л^о о N0 о N о ©£ = ©/ о \Е0 о N0 о N, и, так как ©/=Noa£oN, то видно, что полученное равенство может быть выполнено, если либо один из кватернионов есть нуль, либо все они коллинеарны, либо Аео°^о= 1, чего не может быть в общем случае. Точно так же решение (3.65) не удовлетворяет в общем случае уравнению (3.11). Отсюда можно заключить, что каждому из кинематических уравнений (3.11) и (3.12) *) Такое соответствие изоморфно.
126 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 отвечает свое множество решений &E(t) и А/(/), которые определяются единственным образом своими начальными условиями. Как только что было показано, множества Л.е#) и A/(t) не совпадают, т.е. элементы A.E{t) в общем случае не удовлетворяют уравнению (3.12), а А/(/)- уравнению (3.11). Оказывается, что справедлива следующая теорема. Теорема 3.2. Множества решений (3.62) и (3.63) для одного и того же движения твердого тела пересекаются в одной и только од- ной точке, причем этим решением, принадлежащим обоим множествам, является ре- £ шение N(/). Действительно, то, что N(tf) удовлетворяет обеим формам уравнений, было предположение в самом начале. Обратно: каждое частное решение, по- Рис- З-4- лученное из общего (3.62) или (3.63), определяется начальными условиями; при этом решение (3.62) удовлетворяет уравнению (3.12) только при единственном начальном условии Аяо ° No = 1. Точно так же можно проверить, что решение (3.63) удовлетворяет уравнению (3.11) при N0oA/o= 1, а при этих условиях решениями (3.62) и (3.63) является кватернион N(0- Физический смысл общих решений А^(^) и А/(/) поясняет рис. 3.4, на котором условно каждый базис представлен вектором. Кватернион N(/) дает переход от базиса / к базису Е и тем самым описывает движение базиса Е относительно базиса /, происходящее из-за наличия угловой скорости ©. Это движение может наблюдаться из базиса /; этому случаю движения соответ-
§ 3.4] ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ 127 ствует уравнение (3.12). Очевидно, что точно таким же будет наблюдаться из базиса J и движение любой другой координатной системы Е\ вращающейся относительно / с той же угловой скоростью ю, так как это движение характеризуется теми же проекциями вектора <о на базис / (т. е. кватернионом <*>/). Поскольку движение базисов Е и Е' происходит с одной и той же угловой скоростью относительно базиса /, их относительное положение не меняется и может быть задано постоянным кватернионом С/. Таким образом, общее решение (3.63) соответствует описанию движения произвольного базиса Е относительно базиса /, наблюдаемого из базиса / и заданного функцией ©/(О- Аналогично рассмотренному случаю общее решение (3.62) соответствует движению базиса £, описываемому не только относительно исходного базиса /, но и относительно любого другого базиса /', повернутого относительно базиса / на постоянный угол, определяемый кватернионом С^. При этом наблюдение движения происходит из связанного базиса Е\ этому соответствует уравнение (3.11), так как при наблюдении из базиса Е движение характеризуется проекциями вектора угловой скорости <о на базис £, т. е. кватернионом ©е. Очевидно, что это движение выглядит одинаковым относительно любого исходного неподвижного базиса /'. При этом не следует забывать, что рассматривается движение базисов Е и Е' относительно базисов / и /', происходящее с одной и той же заданной скоростью ©(/). Любое из общих решений Ая(/) или A/(f) удовлетворяет одной форме уравнения (3.11) или (3.12); при этом обеим формам уравнений в соответствии с теоремой 3.2 удовлетворяет единственное решение N(/). Найдем вторую форму кинематического уравнения для движений, описываемых функциями A/(f) и A£(f). Рассмотрим решение Л/(/), удовлетворяющее уравнению (3.12): 2А/=ю/о А/. Очевидно, что второй формой этого уравнения, описывающего движение базиса Е' относительно базиса J, будет уравнение, содержащее проекции вектора угловой скорости со на базис Е\ т. е. величину ©£'. Отобра-
128 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 жение вектора w на базис Е' определяется операцией вращения ©£' = А/ о со/ о А/, откуда получаем вторую форму уравнения для движения Л/(/): 2А/=А/о©^ (3.66) Аналогично для кватерниона А£(/) имеем также две формы уравнения: 2А£ = А£ о ю£ = ©// о А£, (3.67) где ©/' = Л£ о <о£ о А£ определяется проекциями вектора о на базис Г. Подставляя в полученные соотношения для юу и ©£' величины А/ и Л£ из (3.63) и (3.62), имеем Ю£/ = С/о "К о ©/о N о С/= С/о ©£ о С/, ©// = С£ о N о ©£ о N о С£ = Се о ©/ о С£, что удовлетворяет известным правилам проектирования неизменного вектора. Отсюда следует такая интерпретация теоремы 3.2: Если заданы два ряда временных функций ®i(t) и <о£(£), определяемые проекциями вектора ю(0 на базисы I и Е9 то этим самым однозначно определено и начальное положение этих двух базисов. С другой стороны, если задана одна форма уравнений, определяющая кватернион-проекцию вектора угловой скорости ю(0» и задано начальное положение базисов I и £, то этим самым однозначно задается и вторая форма кинематического уравнения. Примером такой связи и служат соотношения (3.68), так же как и уравнения (3.66), (3.67). Отсюда же следует, что решение Л(/), удовлетворяющее двум заданным формам кинематического уравнения [заданным в том смысле, что определен конкретный вид функций toi(t) и Qi(t) — проекций вектора угловой скорости на исходный и связанный базисы], является единственным, поскольку начальные условия этого решения однозначно определены. (3.68)
ИССЛЕДОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ 129 Следует иметь в виду, что одна из функций ©£(0 и ©/(0 может быть произвольной и однозначно определять вектор угловой скорости, однако обе они связаны соотношением (3.13) ортогонального преобразования, причем не произвольного, а определяемого решением кинематического уравнения в одной из двух форм. Проведенные здесь исследования позволяют доказать еще одну теорему, касающуюся расширения частного решения на другие случаи движения. Согласно теореме 3.1 можно находить различные решения для заданного уравнения, в котором ©/ или ©£ суть конкретные функции времени, по одному известному частному решению. Однако это. же частное решение позволяет найти в некоторых случаях решение и для других ©/(/) или ©£(0; эти решения определяются следующей теоремой. Теорема 3.3. Пусть N(0 есть решение кинематического уравнения для движения с угловой скоростью ©(/). В этом случае для движения с угловой скоростью &'(t), получаемой из ©(/) путем ортогонального преобразования ©/=So©o§, (3.69) где S — постоянный кватернион, существует частное решение, получаемое как N' = SoNo§ (3.70) и удовлетворяющее уравнению 2А,= ©;оА, = А,о©^. (3.71) Частично с результатами этой теоремы мы встречались при исследовании вторых форм уравнений для общих решений А/(/) и A^(/) [см. (3.66) и (3.67)]; в этом случае в уравнениях присутствовали кватернионы ©£' и ©//. Решения же для этих кватернионов угловых скоростей являются в свою очередь решениями и для угловой скорости, имеющей отображение на базис /, равное ©//, так же как и для другой угловой скорости, отображением которой на базис Е является ©£'. Доказательство теоремы 3.3 проведем для единственного решения, удовлетворяющего двум заданным 5 В. Н. Бранец. И. П. Шмыглевский
130 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 формам кинематического уравнения (3.11), (3.12): 2А = ©/ о А = А о ©£. Очевидно, что если угловая скорость ю' получается из <о путем преобразования (3.69),то и отображения на базисы / и Е связаны с ©/ и ©£ теми же соотношениями. Действительно, если ©7 совпадает с ю, то ©^ также совпадает с ю', т. е. Подставляя (3.69) и (3.70) в уравнение (3.71), получаем 2SoNoS = So©7oNoS, откуда очевидно, что N' удовлетворяет первой форме уравнения. Покажем, что N' удовлетворяет и второй форме уравнения; для этого, очевидно, нужно, чтобы имело место соотношение ю^=л/ою;оЛ', что получается из следующих соотношений: = SoNoSoco;oSoNoS = N'o<i>/oN'. Отметим, что решение N'(0 удовлетворяет тому же самому начальному условию (взаимному положению базисов), что и N(tf). Физический смысл теоремы достаточно прост: вектор относительной угловой скорости ©(0 может быть повернут на постоянный угол в различное положение в базисах J и Е\ при этом соответствующие решения (3.70) отличаются на постоянный кватернион. В заключение укажем еще одно важное свойство кинематических уравнений: Кинематическое уравнение для заданной векторной функции угловой скорости &(t) может быть приведено к кинематическому уравнению с единичным вектором
§ 3.5] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 131 угловой скорости МО со (0 ' Такая возможность следует из однородности кинематического уравнения; для этого в уравнениях (3.11) и (3.12) необходимо сделать замену независимой переменной dx = a>(t)dtt cd(0#0 (3.72) и соответственно этому заменить аргумент согласно соотношению т = j © (/) dt = Ф (0, t = Ф"1 (т). (3.73) о Подставляя (3.72) и (3.73) в кинематические уравнения (3.11) и (3.12), получаем их в такой форме: 2 = : : г- о Л = Л о ■ г . (3.74) dx cofO"1^)] ©[<&(*)] Здесь <*>//© и ®еЫ суть единичные векторы, так как длина (норма) вектора не меняется при его проектировании на различные базисы, т.е. |©/|=со и |©£| = со. Представление кинематических уравнений в виде (3.74), где угловые скорости суть единичные векторы, иногда может оказаться удобным при их решении. Рассмотренные в этом параграфе свойства кинематических уравнений являются общими и остаются справедливыми для любых кинематических параметров. Этот результат следует непосредственно из полученной в § 3.3 общей операторной формы кинематического уравнения, тождественной уравнениям (3.11) и (3.12). Тем самым все проделанные выводы могут быть дословно повторены для любых кинематических уравнений. § 3.5. РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ КИНЕМАТИЧЕСКИХ УРАВНЕНИЙ I. В первой главе были рассмотрены различные способы представления кватерниона и, в частности, было показано, что любой кватернион представим дугой на сфере [см. (1.11)]. Ввиду *того, что з этом представлении 5*
132 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 единичный вектор кватерниона играет роль.мнимой единицы, т. е. £°£=— 1, аналогично известной формуле Эйлера для комплексных чисел возможно такое представление кватерниона *): A=cos^- + £sin4- = e'T. (3.75) Очевидно, что для сопряженного кватерниона выполняется соотношение A = cos y"~ С sm-у = в 2, а рассмотренная в § 1.2 формула Муавра с использованием такого представления будет иметь вид Art = cos/z-2- + £sinn-2- = е 2. Однако такое удобное представление кватерниона в виде экспоненциальной функции от вектора, длина которого определяется углом поворота, не нашло широкого распространения, как это имело место, например, в случае комплексных чисел. Дело в том, что произведение двух кватернионов не может быть представлено в общем случае в виде экспоненциальной функции, показателем которой является сумма показателей составляющих: A1oA2 = el 2 oel2 2 Фе 2 2 2 . (3.76) В этом можно убедиться хотя бы из того факта, что сумма векторов в показателе обладает свойством коммутативности, т. е. * ^1 l f $2 f #2 l f ^1 fei ~2 ■" *2 ~~2~ — *2 ~2 ! ~2Г * а это должно привести однозначно к возможности перестановки сомножителей-кватернионов, что в общем случае недопустимо. *) На возможность такого представления указывается у Ганке» ля [12]. •
§ 3.5] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 133 Выполним умножение кватернионов, представив их операциями в трехмерном пространстве (1.9): Л, о А2 = (cos ^ + & sin ^ о (cos ^ + £2 sin-^-) = Ai А2 *• * • А1 • А2 i 9- • Al А2 1 = cos ~y cos -у- — ?! •C2sin-^sin-y- + C1sin-^cos-2T + + g2 sin ^-cos ^ + Ь X £2 sin-§- sln«*f-. (3.77) Можно видеть, что операция умножения кватернионов приводится к сложению показателей экспонент только в двух случаях. а) Векторы d и £2 коллинеарны. Как видно из (3.77), при £i = £2=£ имеем £ 2 о£ 2 _g 2 # Геометрически этому случаю соответствует сложение дуг одного и того же большого круга; очевидно, что этому сложению соответствует и сложение коллинеар- ных векторов, у которых длина определяется пропорционально углу дуги. б) Углы fli и #2 — бесконечно малые величины. Как следует из (3.77), в этом случае произведение А А А А sin -у- sin -у- « —*р- есть малая величина второго порядка, с точностью до которой выполнимо следующее соотношение: = е 2 <?е 2=е 2 2ф На тот факт, что для бесконечно малых углов произведение кватернионов дает векторное сложение векторов бесконечно малых поворотов, указывалось ранее [см. (3.8)]. Геометрически это означает, * что бесконечно малые дуги на сфере складываются как векторы (вследствие того, что при малых дугах сфера мало отличается от касательной плоскости).
134 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 II. Рассмотрим теперь, чему равна производная от кватерниона, представленного в виде (3.75). Ввиду того, что кватернион, описывающий движение твердого тела, является переменным, величины J и * также будут функциями времени. Согласно определению производной имеем А-НшА" + ?-А^ ton е- г^ • Показатель степени первой экспоненциальной функции можно разложить в ряд: + $(t)b(t)M + o(M). Тем не менее, как было показано выше, нельзя представить в общем случае экспоненциальную функцию от суммы в виде произведения экспоненциальных функций. Очевидно, это возможно только в том случае, когда вектор g является постоянным; можно видеть, что при этом ±W(t+At) ±t[iKt)+bAt+o(Af)\ U&(t) it[*A/+o(A/)] е2 =ez =e2 °e2 = |;[*A/+o(AO] \t<Ht) Производная от такого кватерниона будет равна Д*-»0 = е2 о Iim д*->о М 4«l*A/+0(A/)| , = urn т-т °е2 Д*-»0 ДГ Можно убедиться в том, что 1 5!$Д*+о(Д*)1 ,. в2 ' - 1 1 . Iim = --га
§ 3 5] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 135 [например, представляя экспоненциальную функцию в виде разложения по синусу и косинусу (3.75)]. С учетом этого получаем окончательно A = ^^olgd = ygdo^№. (3.78) Это соотношение показывает, что в том случае, когда вектор конечного поворота 8 = 2£tgY имеет постоянное направление, производная от кватерниона представима в виде произведения производной от показателя экспоненты (3.75) на сам кватернион: Здесь возможна перестановка сомножителей, так как кватернионы £ и .А имеют коллинеарные векторные части. Сравнивая соотношение (3.78) с кинематическими уравнениями (3.11) и (3.12), можно видеть, что N(0 = e2 (3.79) является решением кинематического уравнения в том случае, когда вектор угловой скорости имеет постоянное направление, причем <o(/) = g(D (0 = £<»(/). (3.80) Частное решение (3.79) должно определять все решения кинематических уравнений для данного случая движения. Если вектор угловой скорости задан с помощью его проекций на базис /, то тем самым задан кватернион <*>/: так как при проектировании меняются только направляющие косинусы единичного вектора, а не его длина. В соответствии с теоремой 3.1 формула (3.79) определяет общее решение уравнения (3.12) в таком виде: \i(t) = e*llMoC/. (3.81)
136 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Аналогично, если вектор ©(/) задан с помощью своих проекций в связанном базисе Еу общее решение кинематического уравнения (3.11) получаем в таком виде: AE(t)=CEoeTl**(t). (3.82) Пусть теперь кинематические уравнения описывают движение базиса Е относительно базиса /, происходящее с данной угловой скоростью (3.80), причем начальное положение базиса Е определяется кватернионом С/. Поскольку величина угла поворота Ф(0 согласно (3.80) равна [см. также (3.60)] / t Ъ (t) = J © (/'). $df = j © (О dt\ (3.83) о - о то в начальный момент О(0) = 0. Найдем, какой вид имеют решения (3.82) и (3.81) для этого случая движения; очевидно, что должно вы: полняться равенство А£(/) = А7(0. В начальный момент имеем А£(0) = С£ = А7(0)=С/, откуда решение (3.82) должно иметь такой вид: А£=С,о<Л5/*. Отсюда следует, что А/ тогда и только тогда будет разно А*, когда выполняется соотношение т. е. точно так же, как и ©£=С/о©/оС/, т. е. вид о/ и ©£ и двух форм кинематического уравнения определяется только начальными условиями.
§ 3.5] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 137 В том случае, когда С/= 1, рассмотренное решение переходит в частное решение N(/) (3.79); если же кватернион С/ направлен по вектору £, т. е. возможно представление то имеем решение (3.81) в виде \i = e* удовлетворяющее начальному условию типа сдвига фазы. Рассмотренный пример хорошо поясняет содержание теорем предыдущего параграфа. Укажем еще одну возможную форму представления частного решения для случая, когда вектор угловой скорости имеет постоянное направление: N(J) = e ' . (3.84) Эта форма получается из (3.79) с учетом (3.83). Физически рассмотренное решение представляет простой случай вращения в одной неподвижной плоскости. ♦ III. Согласно теореме 3.3 по известному решению кинематического уравнения для данного вектора угловой скорости может быть получено решение для любого другого случая движения с угловой скоростью, получаемой из данной постоянным преобразованием. Попробуем применить такой же подход к случаю произвольной угловой скорости. Очевидно, что вектор угловой скорости со может быть представлен в виде <*(t) = S(t)ofa(t)oS(t) = (i>(t)So$oS9 т. е. в виде переменного единичного вектора, положение которого определяется кватернионом S(t) и временной функцией co(f). Выше определено решение для случая постоянного направления вектора угловой скорости £(о(/), которое обозначим N(/). Найдем теперь, как отличается решение кинематического уравнения для движения Л(/) с угловой скоростью ©(/) от величины
138 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 N/ = SoNoSl Будем рассматривать уравнения в проекциях на исходный базис /. Исходным уравнением будет (3.12); найдем, какому уравнению удовлетворяет кватернион N'. Дифференцируя, получаем N' = SoNoS + S°NoS — S0N0S0S0S. Пусть кватернион S удовлетворяет такому уравнению: 2S = ft/oS. Подставляя выражение для производной в уравнение для N' и учитывая, что кватернион N определяется уравнением 2N = g/(o(OoN, получаем 2N' = 2(SoS)oSoNoS + So£7©(/)oNoS- — S о N о S о (2S о S) = (П7 о N' — N' о Q7) + ©/ (t) о N\ (3.85) Отсюда видно, что N удовлетворяет тому же уравнению, что и А (/), с точностью до члена Q/oN'-N'o Q7; решение же N' может быть всегда получено по известному решению N описанным способом. Случай Q/о N'== = N'ofl7 сводится к Q/=0, т. е. S= const, что и было рассмотрено в теореме 3.3, либо к требованию параллельности Q/ и vectN'. IV. Соотношение (3.85) показывает, что в некоторых случаях движения решение кинематического уравнения может быть получено в виде произведения кватернионов, каждый из которых удовлетворяет более простому кинематическому уравнению. Рассмотрим этот вопрос более подробно. Пусть дано кинематическое уравнение (3.11) или (3.12); его решение будем искать в виде произведения двух кватернионов А = \{ о А2, что соответствует представлению искомого преобразования в виде двух последовательно совершаемых преобразований (например, переход от базиса / к базису
§ 3 5] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 139 Г и затем к базису Е). Дифференцируя А, найдем, что А = А! о А2 + Aj о А2 = у ©1/ о А! о А2 + ~2 ^i ° ©г/' о А2 = = -j(©1/+ А! о ©2/'о А,) о А. Задача состоит в том, чтобы выбрать такое разложение данной угловой скорости ©7 (t) = ©17 + Aj о ©2// о Aj = ©17 + ©2/ (3-86) на составляющие щг и Щ/= А, о©2/о Ль чтобы для каждой из них решение было известно. В частности, если ©1/ и ©2/' имеют постоянные направления, то решения Aj (t) и Л2 (t) могут быть получены в виде (3.84). Заметим при этом, что, хотя &и и ©2/' будут иметь постоянные направления, результирующая скорость <*>/(/) (3.86) будет переменным вектором по величине и направлению. Рассмотренный здесь метод позволяет получить решение кинематического уравнения для случая конической прецессии. Пусть вектор угловой скорости обращается по круговому конусу вокруг некоторой оси, например *з> так что имеет место равенство ©/ = aii cos bt + ai2 sin bt + rf3, (3.87) где a, b9 с — произвольные константы. В соответствии с теоремой 3.3 достаточно найти решение для этого конкретного положения конуса прецессии вектора ©(0; все другие его положения в базисе / могут быть получены из рассматриваемого простым поворотом. Представим этот вектор угловой скорости в виде разложения (3.86), причем в качестве ©i/ выберем вектор Ъ = Ыг. В этом случае, так как Ы3 определяет изменение кватерниона Ль имеем 2Ai = ©,/о А = W3° A» и Ai может быть представлено в соответствии с (3.84) в таком виде: t Т \bW 1 1 \l(t) = e ° =e2 =е2 .
140 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Пусть, далее, <о2/' = aii + (c — b)i3 = ®/o — ft, где ©/о = ©/(0) в начальный момент времени. Тогда о2/ получается из ю2/' операцией вращения, выполняемой кватернионом \i (f), т. е. имеем ©2/ = Ai о ©2/' о Л.1 = е2 о [а*! + (£ — ft) У ° * 2 = = а*! cos Ы + М2 sin W + {с — ft) *3- Отсюда видно, что при таком выборе Щг и ©i/ мы действительно получаем скорость ©i/ + ©2/ в формуле (3.86), равную ©/ (3.87). Решение для кватерниона Л2, удовлетворяющего уравнению 2А2 = ©2/' ° А2 = [aii + (£ — &) *3] ° А2 = (®/о — 6) ° А2, получается в виде (3.84), так как соответствующий вектор угловой скорости имеет неподвижное направление: А,-ле*->'. Окончательно получаем такое частное решение кинематического уравнения для угловой скорости (3.87): Xl=eibtoeh-'o-b)t (388) Аналогичным образом находится решение и для другой формы кинематического уравнения, имеющего угловую скорость в виде (3.87). Дифференцируя (3.88), можно непосредственно убедиться, что Л/(/) удовлетворяет кинематическому уравнению (3.12). V. Как было показано в § 2.7, любой кватернион может быть выражен произведением трех кватернионов, имеющих заданные направления. Рассмотрим возможность представления решения кинематического уравнения в виде произведения трех решений, каждое из которых может быть получено каким-либо образом, например в виде (3.84). Будем рассматривать кинематическое уравнение в форме (3.12) (для краткости опустим индексы базиса у кватерниона и угловой скорости) .
§ З.б] РЕШЕНИЕ ЧАСТНЫХ СЛУЧАЕВ 141 Пусть кватернион преобразования представлен в виде произведения Л = Л1оЛ2оЛ3, (3.89) где Alf А2, Л3 задают три последовательных преобразования, сумма которых эквивалентна данному преобразованию. Допустим, что каждый кватернион удовлетворяет уравнению 2А, = ю£оА| (/=1, 2, 3). (3.90) Дифференцируя соотношение (3.89), получаем 2А = 2 (А! о А2 о Л3 + Л! о А2 о А3 + Л! о А2 о Л3) = = (©J + Aj о со2 о Aj + Aj о А2 о ©3 о А2 о Aj) о А. Из полученного выражения видно, что А(/) (3.89) будет удовлетворять исходному уравнению (3.12) в том и только в том случае, когда выполняется равенство ©(/) = ©! + А! о ©2 о Л^ + А! о Л2о(о3о А2 ° А,. (3.91) Рассмотрим случай, когда составляющие кватернионы А* суть плоские вращения, т. е. векторы m(t) имеют постоянные направления. В качестве примера выберем следующие угловые скорости: ©1 = Ф*з> ©2 = ^2, ©3 = <Mi. (3-92) В этом случае частными решениями уравнений (3.90) будут такие кватернионы: \г = е**\ \2 = е**\ А3 = е2 '. (3.93) Поставим теперь вопрос: можно ли выбрать величины ф(£), г|)(0 и д(0 так, чтобы для любого ©(/) выполнялось равенство (3.91)? Подставляя в (3.91) выражения для кватернионов (3.93) и угловых скоростей (3.92) и выполняя операции умножения кватернионов, получаем со (t) = Qxix + Q2*2 + ^з*з = Ф*з + Ф («2 cos ф — ix sin ф) -f + Ь (i2 sin ф cos ф — i3 sin \f> — lx cos ф cos ф).
142 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Приравнивая коэффициенты при ортах, находим следующую систему уравнений для определения углов ф, \|? и О: Q{ = # cos ф cos \|? — -ф sin ф, Q2 = Q sin ф cos \|? + ip cos ф, й3=ф — # sin\|). Эта система является ничем иным, как системой кинематических уравнений для углов Крылова (3.42). Этого можно было ожидать, так как выбор вращений (3.92) имеет последовательность поворотов для углов Крылова. Точно так же выбором другой последовательности (3.92) можно свести решение кинематических уравнений к уравнениям Эйлера; аналогичным методом можно построить решение и для второй формы кинематического уравнения. Следует отметить, что рассмотренное представление Последовательности плоских вращений типа (3.89) может оказаться полезным при исследовании кинематики движения сложных подвесов гироскопических систем. С другой стороны, представление решения кинематического уравнения в виде (3.89) позволяет получить разложение движения на сумму более сложных известных движений (3.91), а не только движений с постоянными направлениями вращения (3.92), как это только что было проделано. § 3.6. ФОРМАЛЬНОЕ РЕШЕНИЕ КИНЕМАТИЧЕСКОГО УРАВНЕНИЯ Для получения формального решения кинематического уравнения рассмотрим еще одно возможное представление кватерниона бесконечно малого преобразования. В первом параграфе этой главы были приведены соотношения (3.1) и (3.4), связывающие этот кватернион с вектором угловой скорости. Используя представление кватерниона (3.75), можно получить и такое соотношение: AA0 = ^M'+U')A', 0<g<l. (3.94)
§3.6] ФОРМАЛЬНОЕ РЕШЕНИЕ УРАВНЕНИЯ 143 В этом соотношении предполагается, что во временном интервале [/, t + ДО величина угловой скорости принимается постоянной и равной ее значению в какой- то средней точке. Сравнивая (3.94) с решением (3.84), можно видеть, что значение ДА получается как решение кинематического уравнения в предположении, что в интервале [/, / + ДО величина угловой скорости не меняется. Точное значение приращения кватерниона имеем только при переходе к пределу, устремляя Д/ к нулю: dAL(t) = eT*it)dt. (3.95) Рассмотрим первую форму кинематического уравнения (3.11) и обратимся к ее записи в виде (3:9). Разобьем весь временной интервал решения [О, Т] на N интервалов Д/г-, причем Д*,+1 = *,+,-*,, max| Д*,|<-«£- (/=1, 2, ,.., АО, где N — ограниченное число. В соответствии с соотношением (3.9) значение кватерниона в момент ti+\ будет определяться по его значению в момент ti с помощью кватерниона бесконечно малого преобразования (3.94): A (tU{) = A (tt) о ДА (td = А (*,) о е^Е <'<+*'+i А''+>) *'<+■, ) (3.96) Здесь, поскольку каждый кватернион является собственным кватернионом преобразования, вектором угловой скорости является отображение <о на связанный базис. Из соотношения (3.96) видно, что если движение начинается с кватерниона Ао в момент / = О, то значение кватерниона A(^+i) может быть приближенно представлено в таком виде: ... o^e*('i+«*+,A'i+i)A'i+.. (3.97)
144 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 Соотношение (3.97) поясняется рис. 3.5, на котором кватернионы представлены дугами сферы. Будем увеличивать теперь число интервалов до бесконечности, уменьшая длину каждого ttytGitWt, интервала; тогда решение уравнения на каждом интервале (3.94) будет стремиться к точному значению (3.95); при этом можно ожидать, что выражение (3.97) будет стремиться к точному решению кинематического уравнения (3.11). Аналогично интегралу Римана, получаемому как предел частных сумм, рассмотрим величины, являющиеся пределом произведений (3.97), взятых в прямом и обратном порядках: lim f[^*£l'<K<+iA'<+i)A'<+i Рис. 3.5. lim neT^Ci+ei+i^+iJ^+i, (3.98) Эти величины обозначим символами Si •£<*><« Q ■§■•/(')<« /0 ЛЛЧ е2 и Or . (3.99) о г Если предел существует, то он определяет общее решение кинематического уравнения (3.11) в таком виде: A£(r) = A0oSa2°£ т 1 Т °£ (0 dt (3.100) Повторив аналогичным образом все рассуждения для второй формы кинематического уравнения (3.12) ?
§ 3.6] ФОРМАЛЬНОЕ РЕШЕНИЕ УРАВНЕНИЯ 145 получим общее решение, удовлетворяющее начальному условию Ао в соответствии с (3.99) в таком виде: о , A7(r) = S^e/^oA0. (3.101) Покажем, что функции (3.100) и (3.101) действительно являются решениями уравнений (3.11) и (3.12). Рассмотрим производную от кватерниона как следующий предел: А£(* + д/)-А£(0 \Е= lim At+o М t+At I S -Ao.S*T-w"lim-l Se*'E{ndt'-l о л/->о м -« dt Исходя из определения величины Se2 E как предела произведения (3.98), можно показать, что lim — т = lo£(f). Для нахождения этого предела учтем тот факт, что вели- t+Af i е2 может быть приведена к величине t t+At 1 2 i • w#j \*') dV e * , что следует из предельного перехода (3.98), где для малого А/ можно произведение экспоненциальных функций [в соответствии с замечанием б) § 3.5] заменить экспоненциальной функцией с суммой показателей. Предел ее величины t+At (t+At ч I 7 J •*«*>« 1/ 9 i - WW
146 КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ [ГЛ. 3 находится обычным образом: 1 f mE{V)df i i* e — 1 ,. e2 —1 ,.x lim It = hm \i = <M0- Отсюда следует, что (3.100) есть решение уравнения (3.11). При отыскании производной А/(/) следует учесть, что Л,(, + Д,)-М„_ Ц„ ~ . Д*-»0 Д' ДО0 Д' W и аналогично предыдущему О е — I Пт ^ 5 =4 МО, т. е. (3.101) есть решение уравнения (3.12). В заключение заметим, что в бесконечном произведении (3.97), так же как и в пределе (3.99), в общем случае не происходит сложения (т. е. интегрирования) показателей экспоненциальных функций. В частном случае, когда вектор угловой скорости имеет постоянное направление, суммирование показателей возможно. Очевидно, что только в этом случае можно получить такое выражение для величин (3.99): * t 4 *Е С> 6Г 2 i О i Ч (П dt> 2 J QeT*£^dt' = eU , Set*/(t')dt' = e ° о t и при этом, как нетрудно видеть, решения (3.100) и (3.101) переходят в найденное ранее решение (3.84).
ГЛАВА 4 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ КИНЕМАТИЧЕСКИХ УРАВНЕНИИ Точное решение кинематических уравнений в общем случае не может быть выражено в элементарных функциях. Поэтому на практике приходится использовать приближенные методы, моделирование на аналоговых вычислительных машинах и численное интегрирование. Особый интерес представляет численное интегрирование кинематических уравнений в бесплатформенных системах управления. В данной главе проводятся построение и анализ численных методов интегрирования кинематических уравнений в связанном базисе, т. е. уравнений (3.11). Аналогичное построение может быть проведено и для уравнений (3.12). § 4.1. ПОСТРОЕНИЕ ЧИСЛЕННЫХ МЕТОДОВ В предыдущей главе было показано, что общее решение уравнения (3.11) .может быть выражено через частное решение с единичными начальными условиями. Этот же результат можно выразить в несколько иной форме. Интегрируя (3.11) почленно, имеем А (0 - A (t0) +1 J A (f) о <d£ (f) dt'. (4.1) Положим A(0 = A(*o)oN(0. (4.2) Подставляя соотношение (4.2) в равенство (4.1), находим N (0 = 1 + 1J N (О о <оЕ (f) dt'. (4.3) Таким образом, N(/) удовлетворяет кинематическому уравнению (3.11) с начальным условием N(/0)=l.
148 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Для построения алгоритма численного интегрирования положим в соотношении (4.2) где h — некоторый интервал, имеющий смысл шага интегрирования; имеем Aa-A^.oN». (4.4) В данной формуле приняты такие обозначения: Ая-А(а N„ = N(a Точное решение уравнения (4.3) может быть построено методом Пикара и представляет собой кватер- нионный аналог матрицанта: N(0 = = 1 +1 \ <*E{t')dt' + 1 J |<о£(Г)^" о mB(f)df + ... (4.5) На основе формулы (4.5) могут быть построены численные методы различных порядков. Следует заметить, что при построении численного метода нельзя, вообще говоря, считать, что величина ©я (0 доступна измерению в произвольный момент времени. В частности, при интегрировании кинематических уравнений в бескарда- новых системах первичная информация обычно поступает в виде интеграла от угловой скорости за шаг интегрирования. Соответственно этому введем вектор кажущегося поворота e* = J©£(f)<«'. (4.6) о Тогда первичная информация на л-м шаге представляет собою первую разность этого вектора, взятую «назад»: Ve; = в* (/„) - в* (/„__,) = J <d£ (f) dt'. (4.7)
§ 4.1] ПОСТРОЕНИЕ ЧИСЛЕННЫХ МЕТОДОВ 149 Аппроксимируем 6*(/) внутри шага интерполяционным полиномом четвертого порядка. При этом, не уменьшая общности, можно считать, что в начале шага «•(Ь-О-о. Имеем: в* (т) ~ (ve; - 4 v*e; -1 узе; - -1. ^ х + + (-^ v2e- — й v4e-)т2+(i"узв- + A v4e«) ^+i v^e^^, (4.8) d*£l«(ve; -1 v2e; -1 узе; - -1 v<e;) + + (v2e; - ± v<e;) т + (1 узе- + j У4в;) T2 +1 У4в* тз> (4.9) где х-безразмерное время внутри шага: Т = г • Подставляя введенную величину вектора кажущегося поворота с помощью соотношений (4.6), (4.8), (4.9) в формулу (4.5) и удерживая члены до четвертого порядка малости включительно, получаем следующее выражение для решения в момент tn: N,= i + |ve;-l|ve;p + -l-(ve;xv2e;)- - ж I ™*n l2 ve; + JL (ve; x v3e;j - —ig-ive;pv«e;+1jrive;r+ ... (4.ю) Здесь для получения данной формулы операции умножения кватернионов были представлены в виде операций умножения векторов (1.9). Оставляя в соотношении (4.10) члены соответствующего порядка малости, получаем алгоритмы численных
150 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 методов: N;=l+jve;, (4.11) N;=l+YVe;~-i|Ve;p, (4.12) n;- i + \ ve;—i| ve« P+i(ve-XV2e;)-l|ve;pve;. (4.13) При этом значение кватерниона А, вычисленное на данном шаге, определяется выражением В данном соотношении, как и в (4.11) — (4.13), звездочкой отмечены величины, вычисленные по приближенным формулам. Методы (4.11) и (4.12) получили в литературе [22, 38] названия соответственно обычного и модифицированного методов Эйлера. Формула (4.13) определяет метод третьего порядка. Само выражение (4.10) можно, разумеется, рассматривать как метод четвертого порядка. Вторая группа численных методов может быть построена непосредственно для вектора истинного поворота. Пусть lea \(t) = e2 Введем вектор истинного поворота*) Дифференцируя данное равенство и исключая g с помощью уравнения (3.61), получаем кинематическое уравнение для вектора в l-i-etg± e = ©£-|-ctg-| + в (в* • в) \.2 + 1(вХ©£) (4.14) *) Такой вектор вводится, например, в работе [14] и имеет там название вектора конечного поворота. А\ы будем называть его вектором истинного поворота, в отличие от 9 [см. (2.52)].
§ 4.1] ПОСТРОЕНИЕ ЧИСЛЕННЫХ МЕТОДОВ 151 Выражения yctg-^- и (1 — -yctg-Hd являются аналитическими функциями Ф. Поэтому для решения уравнения (4.14) можно воспользоваться методом малого параметра [4, 34], считая в и J ®Eclt величинами первого порядка малости; представим решение в таком виде: в= 2е(*>. (4.15) &=i Уравнения для 9<ft) получаются подстановкой (4.15) в исходное уравнение (4.14) и приравниванием членов одинакового порядка малости: в(" = ш£, в<2>=4е(1>х«*. ё<» - --£-Ч | в"» |2 + ± 0<'> [тв ■ в(1)] +1 [в<2> X •*]. в<4'=-1о)£[в(,,.в(2,] + + ±- е(,) {е»> fa • е<2>] + е<2> fa • е(1>}} + ± [е,3> х •*]. Далее необходимо выполнить интегрирование полученных соотношений. Используя (4.6) — (4.9), имеем в момент tn при условии, что e(/n-i)==0 с точностью до членов четвертого порядка малости включительно: е<2> - ± (ve; х v2e;) + -£■ (ve; x v3e;). в<,3, = 0. Окончательно получаем е„=ve; + -1 (ve; x v2ey+-L (ve;xv3e;) +... (4.16) Удерживая в (4.16) только первый член, получаем численный метод, который можно назвать методом средней скорости: N;=^ve", (4.17)
152 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Аналогично получаются методы третьего и четвертого порядков: ^-ЛК+ТгС***'*»}. (4.18) n;=Д{*в»+тт(*в»х*2в»)+1?- (v»»xv3ey} (4 19) Заметим, что высшие разности в полученных формулах можно выразить через первые разности на предыдущих шагах. В частности, выражения (4.13), (4.18), (4.19) могут быть преобразованы соответственно к следующему виду: N;=i+|ve;—live; p- - й те х ve;_o - ^i ve; р ve;, N._pT{ve«-T*(ve«xve«-')} 11 я С? t N. _ Л У*п-Т (ve« * К-О+ТГ (ve»x ve"-2)}. 11 п — & Третья группа численных методов основана на ис- чпользовании разностных схем численного интегрирования по Стилтьесу [25]. С учетом (4.6) уравнение (3.11) может быть представлено в форме уравнения Шеннона: d\ = ±\ode\ (4.20) Можно показать, что соответствующие формулы численного интегрирования по Стилтьесу для уравнения (4.20) имеют вид*) Aj^Aju + ^AjUove;;, (4.21) а* = л;_1 + 4 Ai-i • ve; + J va; о ve^, (4.22) а;=AS-i + у а;», о ve; +1 va; о ve^+ + ± {va; о v2e; - v*k о vey (4.23) *) Здесь, по аналогии с (4л), принято обозначение
§ 4.2] УРАВНЕНИЯ ДЛЯ НЕНОРМИРОВАННЫХ КВАТЕРНИОНОВ 153 и представляют собою соответственно интерполяционные формулы прямоугольников, трапеций и квадратичных парабол. Заметим, что величины VA„ и V2A*, входящие в эти формулы, не известны к началу вычислений на данном шаге и их следует вычислить путем экстраполяции разностей на шаг вперед. Экстраполяци- онная формула для (4.22) имеет вид VAJ; « VAJUi + V^-! + V»a;.i. (4.24) Для формулы квадратичных парабол имеем VA; ~ VA*., + VAJ-i + V3A;_! + V*A;-lf v*K « v2a;_! + v»a;.i + v«a;_i. Как и в предыдущих случаях, высшие разности можно выразить через первые разности на предыдущих шагах. Необходимость экстраполяции разностей является недостатком этой группы методов. § 4.2. КИНЕМАТИЧЕСКИЕ УРАВНЕНИЯ ДЛЯ НЕНОРМИРОВАННЫХ КВАТЕРНИОНОВ. КОРРЕКЦИЯ НОРМЫ При численном решении кинематических уравнений возникает специфическая трудность, связанная с ухо* дом нормы кватерниона. Дело в том, что в предыдущих главах предполагалось, что норма кватерниона равна единице, т. е. АоА=1. (4.26) В частности, при этом предположении были определены операции над кватернионами, соответствующие ортогональным преобразованиям. В то же время условие (4.26) не следует из вида кинематического уравнения. В самом деле, умножая (3.11) справа на А, имеем А.оА=уАо<о£оА. (4.27) Переходя к сопряженным величинам, получаем АоА = -о-Ао©^оА= — уАо©£оА. (4.28) (4.25)
154 ч ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Складывая почленно (4.27) и (4.28), имеем АоА + АоА = 0, т. е. А(ЛоА) = 0. (4.29) Таким образом, уравнение (3.11) имеет первый интеграл А о А = const, причем конкретное значение константы не следует из вида самого кинематического уравнения, а определяется лишь заданием подходящих начальных условий. На практике из-за методических ошибок и ошибок округления равенство (4.26) с течением времени перестает выполняться, если не принять специальных мер. В этой связи представляется полезным выяснить вид кинематического уравнения для ненормированных кватернионов. Рассмотрим кватернион А такой, что АоА=Л2>0, и кватернион А<п), получающийся из А в результате нормировки: А(^ = ^-А. (4.30) Пусть кватернион А(п), описывающий движение системы координат, удовлетворяет уравнению А(Л)=^А(Л)о©£. (4.31) Дифференцируя (4.30) и подставляя в (4.31), получаем дифференциальное уравнение для кватерниона А: А=-д-А + _-Ао<о£. Обозначим (4.32) (4.33)
§ 4.2] УРАВНЕНИЯ ДЛЯ НЕНОРМИРОВАННЫХ КВАТЕРНИОНОВ 155 Имеем окончательно А = /(0А + |Ло(о£. (4.34) Уравнение (4.34) эквивалентно (3.11) в том смысле, что результат нормировки решения (4.34) удовлетворяет уравнению (3.11). Таким образом, независимо от величины и характера изменения А(/)>0 кватернионы А(п) и А, являющиеся решениями этих уравнений, описывают одно и то же движение системы координат, т. е. задают одно и то же преобразование. При этом, однако, преобразованию A(rt)o( )oA(rt) для нормированного кватерниона соответствует преобразование Ао( )оА" для ненормированного. Мы видим, что добавление в кинематическое уравнение члена f(t)Л не меняет физического смысла данного уравнения. Уравнение (4.34) является, так же как и (3.11), кинематическим уравнением, описывающим то же движение. На вид функции f(t) не налагается никаких ограничений; при этом вместо уравнения для нормы (4.29) имеем в силу соотношения (4.33) такое уравнение; ^f=f(t)A. (4.35) Используя произвол з выборе вида функции f(t), можно сделать точку Л = 1 асимптотически устойчивым положением равновесия уравнения (4.35). Например, можно принять / = *(1-Л) ' или /=-fc.lgA, но для практических целей наиболее удобно положить /=-МЛ2-1) и решать кинематическое уравнение в форме Л = уЛо©£_£Л(Л2-1). (4.36)
156 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 В этом случае (4.35) интегрируется в конечном виде: ( Л2 — 1 ^ ~!/* При Ло > 0 имеет место Л(/)~> l(tf —юо). Таким образом, введение в кинематическое уравнение члена — &Л (Л2 — 1) обеспечивает автоматическую коррекцию нормы решения. § 4.3. ЧИСЛЕННЫЕ МЕТОДЫ КОРРЕКЦИИ НОРМЫ Результаты, полученные в предыдущем параграфе, показывают, что уход нормы решения от единицы не приводит к ошибке построения системы координат. Тем не менее этот уход весьма нежелателен, так как может привести к переполнению разрядной сетки вычислительного устройства либо, наоборот, к ее недоиспользованию и в пределе к вырождению решения в нуль. Кроме того, операции ортогонального преобразования, сложения поворотов и т. п. для ненормированных кватернионов имеют более сложный вид по сравнению с соответствующими операциями для нормированных кватернионов. Все эти обстоятельства приводят к необходимости ограничивать уход нормы решения от единицы. Для численных методов, рассмотренных в § 4.1, это может быть достигнуто периодической нормировкой решения. При этом, однако, требуются достаточно сложные вычислительные операции — извлечение корня и деление. В данном параграфе будет построена группа численных методов, основанных на решении кинематического уравнения в форме (4.36), в котором обеспечивается автоматическая коррекция нормы. Положим А; = id о {N; - k (Л2*-! - 1)}. (4.37) Здесь N„ определяется по одной из формул численного интегрирования § 4.1. Беря квадрат модуля (норму) от обеих частей (4.37), имеем 4 = Л'-, {|vect N;|2 + [sqal K~k (A2ft_, - Ш (4.38)
§4.3] ЧИСЛЕННЫЕ МЕТОДЫ КОРРЕКЦИИ НОРМЫ 157 В случае, когда |vectN„|= const, sqal N« = const, выражение (4.38) определяет функцию последования для Лл с такими установившимися значениями: Л2оо= 1 +|{sqalN* ± У 1 -| vect N* р], Л2оо = 0. (4.39) Нас будет интересовать значение Л», определяемое нижним знаком первого соотношения (4.39), поскольку именно это значение близко к единице или в точности равно ей. Для методов, определяемых формулами (4.11) — (4.13), имеем соответственно A2oo~i+-^ive*p, aL« i + ^i vex. Л*оо«1 1 192/5 ive-i Для методов (4.17) —(4.19), использующих экспоненциальное представление, всегда имеем Л2оо=1. Таким образом, установившееся значение Л2» близко к единице или в точности равно ей. Для анализа устойчивости рассмотрим производную д\1 дК и потребуем, чтобы дЛ.1 <-i <1. (4.40) Ln-18 Дифференцируя (4.38) и подставляя Л2-1 = Л2Х>, имеем после некоторых преобразований = 1 -2fcA2co/l-|vectN*|2. ал£ дА п-\ (4.41) 'л-Г При этом неравенство (4.40) приводит к условию 0<-£<[Л2„ (1-| vect N-ftJ"'7'
158 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 или, с учетом (4.39), °<k< ,/1-lvectN-p + ^-!VectN*I2 - S4al N*- (4-42) Неравенство (4.42) будет заведомо выполнено, если потребовать соблюдения условия 0<k< 1. Можно показать, что при этом условии другие два установившиеся значения Л2» (4.39) оказываются неустойчивыми. Естественно выбрать k = 1/2, тем более что при этом выражение (4.41) весьма близко к нулю, т. е. к тому значению, при котором обеспечивается максимальная скорость сходимости. Рассмотрим теперь устойчивость процесса коррекции нормы при произвольном ограниченном V9„. В этом случае функция последования зависит от /г, причем выражения *) Л2_ = Л2(1,5-0,5Л2) (4.43) Л2+ = Л2 {| vect N* |2 + [sqal N* - 0,5 (Л2 - l)]2} (4.44) являются минорантой и мажорантой функции последования (4.38), получаемыми, когда |Ve„| принимает соответственно нулевое или максимальное значение. Для методов (4.17) — (4.19) миноранта и мажоранта имеют одну и ту же неподвижную устойчивую точку AL== 1. При этом сама функция последования будет, очевидно, иметь ту же самую устойчивую неподвижную точку. Для методов (4.11) —(4.13) выражения (4.43) и (4.44) определяют хотя и близкие, но различные неподвижные точки. Поэтому Л2, сходится к некоторому предельному отрезку, содержащему эти точки. Можно показать, что границы этого отрезка равны: Л2пах= max (Л2+(Л2)}, о<л<лай оо Amin= Л_(Лтах). *) Здесь и во всех последующих формулах принято,, что к — 1/2.
§ 4.3] ЧИСЛЕННЫЕ МЕТОДЫ КОРРЕКЦИИ НОРМЫ 159 Наибольшую длину имеет, естественно, предельный отрезок для метода Эйлера: 1 --|-|Ve*|4<A2<l+||Ve*|2. Теперь, после того как устойчивость коррекции нормы доказана, преобразуем формулу (4.37) к виду, удобному для оценки погрешности. С этой целью попытаемся исключить Ля-1, выразив его через первичную информацию. Положим в равенстве (4.38) Л2Д=1+*Я. (4.45) Имеем x» = (l+xJI-l){|vectN;p+[sqalN;--ixJl.i]2}-l. После замены п на п—1 и некоторых преобразований получим выражение Хд^ = (1+^-2)[(^-, о fife-,)- — кЛ_2 sqal N;_i + j 4-2] — 1, из которого окончательно получаем кЛ-1 = [(N;-i о SS-i)—1] + кЛ-2 [(N;_, о N^O-sqalN;.,]- - 4-2 [sqal iCi -1] +14-2. (4.46) Чтобы свернуть рекуррентное соотношение (4.46), подставим в него хп-2> вычисленное по тому же соотношению, затем аналогично исключим кп-з и т. д. С точностью до членов четвертого порядка малости включительно имеем соответственно для методов (4.11) —(4.13): *„_,« \|ve;_,p+l| ve;_x pi ve;_2 р-А jve-_2|", (4.47) х„_, ~ JL| V0;_i р, (4.48) **ы**ш*™'я-1*- (4>49> Используя равенства (4.47) — (4.49), с учетом (4.45), можно исключить Лд_1 из формулы (4.37).
160 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Таким образом, для указанных методов можно заменить (4.37) выражением a;-a;_,on;t, (4.50) где соответственно Nr-i + lve;--i-ive;_,p- - JL1 ve;_, p 1 ve;u p + ±\ ve-_, p, N;*=i+i-ve;-|-ive;p--ii- ive;.,i«, кг=1 + ±ув;-1|Ув;р+-^(Ув;х^;)- Для методов (4.17) — (4.19) с точностью до членов четвертого порядка малости получается и»-1 ~ 0. Таким образом, для методов (4.17) — (4.19) выражения для N" и N* совпадают. § 4.4. ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ ПРИ ПОСТОЯННОМ ШАГЕ Обозначим через АЛП разность между значениями An, вычисленными по приближенным и точным формулам: АЛЛ= An — Ая. Сравнивая (4.4) с (4.50) и полагая, что предыдущее значение An«i было точным, имеем Здесь 6Nn = Nn-Nn (4.51) — погрешность на шаге интегрирования для методов без коррекции нормы. Для методов с коррекцией нормы соответственно aN„=Nr-Nn. (4.52)
§ 4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 161 Явный вид 6Nn для различных численных методов приведен в таблице 4.1. Для оценки погрешности, накопленной на большом интервале интегрирования, представим Ап в виде An = A0oNlO ... oN^oN.; (4.53) аналогично представим А„ с учетом (4.51) и (4.52): А* = А0 о (N, + 6N,) о ... о (Na_, + Mn-i) ° (Nrt + 6Nn). (4.54) Для кватерниона накопленной ошибки А„ относительно Ап имеем 6Art = AioArt. (4.65) Поскольку Ап — нормированный кватернион, то | 6Art | = | А* | = П N^, (4.56) л—1 где n; = |n;i. Для накопленной погрешности модуля получаем выражение 6Л;= П N1- 1 = П (1 +UN*) -1-2 6N, + 0(6N|). (4.57) Здесь через 6Nn обозначена погрешность модуля N£ на данном шаге. Явный вид 6Nn для различных численных методов приведен в таблице 4.2. С точностью до членов более высокого порядка малости можно заменить сумму в выражении (4.57) интегралом t 4A*~jJ6N(t')dt'. (4.58) о В таблице 4.3 приведены явные выражения для накопленной погрешности модуля бЛ* и скорости ее ухода. 6 В. Н. Бранец, И. П. Шмыглевский
Таблица 4.1 ~ Погрешность численных методов на шаге интегрирования Численный метод Метод Эйлера A„ = An_,o(l+i-ve;) Модифицированный метод Эйлера a„=a._1.(i+-|-w;—rW) Ая=Ая_,.[ц-1ув;—i|ve;|4 +-a-(Kx*3--i-|ve;p™;] Метод средней скорости А А 2 Л л.-^.М**™**"® Метод Эйлера с коррекцией нормы А» = А„_,. [l + i- ve; + ±(1 _ ЛЛ_,)] 6Nn tW -^(го;х*ч)+жК12^ -i(ve;xv4)+-^|ve;p^e;-^|ve;r --^-(ув;х^„) -JL(ve;xvae„) _ | ve;. v2e; - ±- (ve; x v2©;)+± I *й f ve„ 3 •a S cd s * Я я о га л: S о m Я Я о га я я н m -1 •о S ^ О > Я S м -1
Модифицированный метод Эйлера с коррекцией нормы , А.-А*-,-.[1 + 4-ув;-4-К|Ч^(1-А«„о] A„=An_I.[i+-ive;-i-|ve;i2+ + i(Ve«XV4)-4rlVe«|2ve"+i(,-A»-«)] Метод средней скорости с коррекцией нормы An = A„_,^e + -(1-A„_,)J АП=А„_, + уА„_1»Увп А„ = А„_, + у А»-|» ve; + i- V А» • Ve; V^-VA,,.,+ *%,_,+ *«*,,_, Л„ = А„_, + 1 A„-i»ve; +-1 VA„<»ve; + + -^ (VАп с V2eA - V2A„ o ve;> VA„ = VA„_, + V2A„_, + V»An_, + V«A„_, V*A„ = V2A„_, + V3A„_, + V<An-, -1? <ve« x v2e»)+-^ I ™»I2 ve» ■ ^ (ve; x v3©;)+-l-i ve; p v2e; - -ig-i ™; i< 3 О -I a я о Я я £ A H О о to
Погрешность модуля на шаге интегрирования Таблица 4.2 — Численный метод Погрешность модуля 6Nn Я S 01 и S * и X X о -с Я о X X о га •в о > х S и *1 A„=A„-lo(i + lve;-l|ve;p) A#=All_I.i[i+-ive;--i|vesp+ •ove; .An.= An-i°<? A„ = Ал_,о [l+-lve; + -l(l- Л* _i)] A*-A._I.[i+ive;-4..|ve;|4^(i-Ai.1)] i-lveiP тк1"^ 384 I veil4 .(|ve;p-|ve;_,p) -j^g-d ve;r-i vei-ij4)
§4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 165 * С! Ф * б Ф S • в Ф - 00 Ч£ •5е 1С \Oi 1 •J* t> X • С Ф 1> + -|С0 1 ф -|« + о Т II с < г—, "* 1 «Ntt 1 + * С ф о "М Hi i 7 см е < | 1 н£ + > о» о •• 1 < II в - < ..• ж. 1 s>/ + > X ф > •ф + # « ф > О ~ 4 и с < Ф* о 7 < + — 1 II в .<< е > + Ф о 7 4 + — 1 II -в < 1 О + 7 > 7 < о 3 + • С! Ф О < > + *<* О 0 7 4 + - 1 4 в с <! •-? Ф > о * 1 О о е -Is + г + 7 < €0 > + 7 > + 7 4 > || с 2 7 < * > + 7 с* < СО > + 1 1 > II С 2» >
166 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 3h •*г|оо 00 •*|2 3 I I К о о о о. о ы о I о о к в 43 3 •*г да м 3 еч •«г -loo 3 *• •«г loo —■ сч • е Ф о ей фе -I* О 3 х + £ « с» Ф + ем « С Ф > __ ~|« 1 « С ф > ф еч 1> X # е Ф > -|а + ф > ф > X -1« + ф > I см е < I i -1« + V 1> — С* —00 » с ф + I -|см ^ _, ~ е «< II с < 1 ^ II - 4 е •«J II 4 1 < II 4 i i < < II II ■ < < 1 ^ II
§ 4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 167 1 ♦ 3 т* 8 + * с Ф о Н«> 1 Ф > + о ■" 1 < II С < i ( | о С < 1 ^н ч—' -|м + ф о W # е Ф •Л* 1 **"« ф > X S На 1 + i i i " i 7 < I 1 -|« + -|<N О ** 1 е < II £ < | 1 У - * 'Ч ^N 1 (N в < 1 1 О -|<N + ф > X « С! Ф > ч^ + » с Ф > о •* 1 < II е < ъ •*г|оо ч 3 •*г|оо # е Ф о т < + mm 1 < II С < 3 « ю ос |ео "«•* •« 3 **» t €0 Н« Ф* в- -1* + *в 0 7 + гн i II с ^ ►в 7 «г т О + 7 с < > 7 < II с < о 43 3 *© 5s llN ю № + 0 -|* + Ф 0 7 < + •и 1 II е ^ » с Ф > о 3 > | 1 Ф о С < О Hi + 7 с + _ I < <** to r> + + it - 1 II II С С < <
168 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 При этом учитывается, что Заметим, что составляющая накопленной погрешности, определяемая формулой (4.58), не приводит к ошибкам в определении системы координат (см. § 4.2) и может быть устранена периодической нормировкой А*. Рассмотрим теперь составляющую накопленной погрешности, которая не может быть устранена нормировкой. Нормируя (4.55), имеем 6А п) = 4- 6АП = Д- Л; о Ап. (4.59) п п Преобразуя (4.59) с помощью (4.53), (4.54), (4.56), получаем 6Ajr) = A0o[N1 + 6Nirt)]o...o[Nn + 6N|r)]oNrto...oN1oA0- Здесь ;6Nir) = Tir(Nn + 6Nn)-N/l представляет собою погрешность на шаге, остающуюся после нормировки. Явный вид dN^ для различных численных методов приведен в таблице 4.4. Заметим, что именно эта составляющая приводит к ошибке в построении системы координат. Имеем, далее, по аналогии с предыдущим случаем 6А(п)=1 + 2А0°^о ... /s=l ...oNfc-ioaNJ^offik-io ... oN,oAo + o(6Nf) = -1 + S A*-i о 6N£> о А* + О (6N Д
§ 4 4j ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 169 Заменяя сумму интегралом, получаем t 6А<П) ~ 1+ ^ J* А (О о dN<"> (О о А (/') Л'. Представим 6А(Л) через вектор истинного поворота в: бЛ^ = cos у бв + S sin - бв. Отсюда находим I vect [6A(rt)l |; d0 = 2£arctg- sqal (6A(rt)) или 6e«2vect[6A(rt)]. Величина бв определяет отклонение истинного положения системы координат от расчетного, т. е. ошибку положения. Легко видеть, что vect И А о 6N(rt) о A dt') = J А о vect (6N(rt)) о A dt'[ С учетом этого, получаем следующее выражение для накопленной погрешности вектора истинного поворота («угла»): t бв « | j А (О о vect [6N(rt) (/')] о А (О Л7. (4.60) В таблице 4.5 приведены явные выражения для бв и скорости ее ухода для различных численных методов. Заметим, что порядок величины бв не ниже А2 для всех методов, в том числе и для метода Эйлера.
Погрешность на шаге, не Численный метод .Ae-A_,.(l+4-*ei) An=A„_Io(i + lve;-l|ye;|2) а„=а„_, о [i +1 ve; —11 ve; |2+ +-^-(ve»x V2ei)-^"l ve»Pve»] А А Т*в» A.-A_I.>[Ve;+^(Ve;X?-a)] A„ = A„_, • [l + 1 Ve; + 1(1 - A|_,)] ^-^..[l+lve^llve^'+lO-A^)] устраняемая нормировкой «tf> -iwxwj-ii^ip^ - -я- <ve»x V2e»)+-ffi-ive» i2 ve» - ж <ve»x v*e»)+ж've» i2 v*e» —p-^xw,) -i(ve»xv3e») -^(ve»x v2e«)+ж1 ve« P™* - -s- (ve« x V2e«)+-s-i ve« f ve« Таблица 4.4 Zj •a S Dl s * и Я я о m л я о £а И Я о m Я Я н и "1 ъ Я о > Я Я и
§4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 171 « е Ф еч > CL- « е Ф > |<м + * с 9 > X * С! Ф -|? 1 1 1 + ем « С Ф Hi 1 ф о- -1*. + О т < II в < ♦ t 1 ем «J < 1 ч£ + см Фе 1> Hi J^ # с с* > X Е> ~1я |01 + Гв ф еч X Ф > -Is i ,-—г i + « £ Ф > о т II е < Гв о X « £ 5 > Н* 1 - "7 1 см С н^. ф еч > X * с ф > 42 + « с ф > Нем О 7 < II < # в ф О <2L_ ф" ~|см 1 Ге * X # « ф v—*' см 1 1 1 • Ф 0 7 + С < II С < • е Ф о см Ф -1» + #"е Ф еч X *в ф "ч—* -I* О* 1 1 1 # « Ф о < + фс 0 7 1 + 7 < II е <J 7 «о > + 1 С + 7 < 1 е < о # С Ф > СО i — • е Ф ф" -Is 1» + ф «1 X ф > 1 + г о -1* + Ф о 7 < + 7 я е < ^^ • с ф > еч 1 о < 1 + 1 < + 7 « + 7 в * > + и е < > < + 7 > + • i К в ^ еч 1> '
Накопленная ошибка положения и скорость ее ухода Таблица 4.5 ^ Численный метод Накопленная ошибка положения 68 Скорость ухода do9 dt •о S от m X X о to ►С X О to X X о to Я X to X S > X X to Ae-A«_l.(i.+ '|-ve;) ^-A^.fl + i-Vei-llWip) -■§■ J*Ao(©X®)«>Aif/'- о — -j£- J Ао(о>2о)о£де о --^ J A*(©X ©)•£<*/' + o о JjLJAo(<bXto)*Zdt + 0 + -§g-J А.(А)»А«Й' о £.y|eX-#|* + e». -g--|/ri*x-i-+4--^ ^. I («x •)--!■•*•
§4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕГОДОВ 173 X X 3 X +- •S X V V 4 2 43 X 3 43 1< X о 43 n И4 о з4 X о <N Ы4 V » е Ф > -1^ о> о 1 1 < II. е < • с ф > X * С! Ф > ~-1 — + « С Ф > ~|<N *> О 7 1 < II с < <n e <J | >---^ -|<м I + » с ф > 1 — |<N + ^ I i о 7 1 < II £ < » с ф ф* -|« + I е < 4
Численный метод An = An_,.[i+i-ve;-l|ve;p+ + yO-A^-,)] A^A^.^^ + i-O-A^)] ЛЛ = АЛ_1о(г J + +т0-л»-)} Таблица 4.5 (продолжение) ~ я Я 01 Я м Я Я о м Я о 24 м я я о и я я га -i -о Я о со > Я я Накопленная ошибка положения ов 1 <*ае | Скорость ухода о + -§g-j Л«(©*ю)о£л' о ~ J Ao(©X©)oAd/' -|jj Ao(©x©)oArf/' Irhx^-T^ -5L 12 ®X- Jl*Xi|
§ 4.4] ПОГРЕШНОСТИ ЧИСЛЕННЫХ МЕТОДОВ 175 1 + •3 IX 3-2 -12 + еч X * :3 X + 43 X о 43 о 43 к о •з X А V 43 К о 3 3 43 X з о •в I 4|9 + ■в еч •М I + т ф ^ > + «J I е < + 7 II + 7 + 7 + • е ф > о е ^ > -к + « с г о 1 + 7 < II tt ^ &? £ > i 9 о < > ■"о—•" -|а + 1 с < > + 1 «о + < + 7 е «4 > и с ^ _ 7 о + •* 1 в < + С < > II е <
176 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 § 4.5. ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ С ПЕРЕМЕННЫМ ШАГОМ Ввод информации об угловой скорости в цифровое вычислительное устройство требует представления этой информации в квантованном виде. В бесплатформенных системах, как правило, процесс квантования угловой скорости (точнее, приращений вектора в*) совмещен с процессом его измерения. Другими словами, информация на выходе блока измерителей (датчиков) угловой скорости представлена в виде квантованного потока приращений Ув** (квантованные величины будем отмечать двумя звездочками). При этом элементарное приращение (импульс) в данном канале*) имеет вид Vep=±eep Ve2"=±ee2, Ve^=±ee3 где е — величина кванта. Для реализации алгоритмов численного интегрирования с постоянным шагом требуется накапливать элементарные приращения на входе вычислительного устройства в специальных счетчиках и периодически (в конце очередного шага) опрашивать эти счетчики. При достаточном быстродействии вычислительного устройства можно исключить процесс накопления приращений и связать конец очередного шага интегрирования с моментом поступления очередного элементарного приращения по любому из каналов. При этом, естественно, величина шага интегрирования оказывается переменной, зависящей от темпа поступления элементарных приращений на вход вычислительного устройства. В этих условиях можно непосредственно применять численные методы интегрирования, использующие только первые разности, т. е. обычный и модифицированный методы Эйлера (4.11) и (4.12), метод средней скорости (4.17) и соответствующие методы с коррекцией нормы. Формулы оценки погрешности, выведенные выше, непосредственно к данному случаю неприменимы. *) Будем предполагать, что канал содержит чувствительный элемент и преобразующее устройство, измеряющие проекцию углово$ скорости на данную ось.
§ 4.5] МЕТОДЫ ИНТЕГРИРОВАНИЯ С ПЕРЕМЕННЫМ ШАГОМ 177 Введем угол суммарного поворота t ф= J ©(ОЛ' о в качестве независимой переменной в кинематических уравнениях. Как показано в § 3.4, при такой замене переменных вид кинематических уравнений сохраняется, но роль вектора угловой скорости (в нашем случае ©£) выполняет его орт £© = (£©!> £©2, вщ). Таким образом, обозначая штрихом дифференцирование по Ф, имеем согласно (3.74) Точно так же сохраняется вид всех формул данной главы, только вместо шага по времени h в соответствующих местах войдет шаг по углу суммарного поворота g. Итак, замена аргумента позволяет распространить формулы предыдущих параграфов на случай переменного ft, но постоянного g. При этом vfte*~sft^r(eB). При работе по каждому элементарному приращению шаг g", вообще говоря, не остается постоянным, но изменяется в достаточно узких пределах: Рассмотрим среднее значение шага g на некотором интервале интегрирования. Пусть общее число импульсов (элементарных приращений) в t-м канале равно /С*. Положим _ Ф С другой стороны, t ф Ki ~ | J*| со, Мт = J 11 ещ \йФ' ~ \\ещ |Ф, О 9
178 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Тогда или окончательно где X Очевидно, что 1 I *©, I +1VI +1ЧI Естественно допустить, что %, а следовательно, и gCp являются медленно меняющимися переменными. В этом случае, по аналогии с (4.58) и (4.60), можно получить оценку накопленной погрешности при работе по элементарным приращениям: ф о ф бв=2 JAovect(6N(rt))oA -^. (4.61) Явные выражения для 6А*, бв и соответствующих скоростей ухода для различных численных методов приведены в таблицах 4.6 и 4.7. Анализируя формулы интегрирования (4.11), (4.12), (4.17) и соответствующие формулы интегрирования с коррекцией нормы, можно показать, что при работе по приращениям их реализация приводит к сравнительно малому объему вычислений на шаге. При этом для обычного и модифицированного методов Эйлера следует выбирать величину кванта, равную 2гк, где k — целое число. В таком случае операции умножения исключаются или заменяются сдвигом. Для метода средней скорости по тем же соображениям выгодно выбирать e = 2arcsin2~\
Таблица 4.6 Накопленная погрешность модуля при работе по приращениям и скорость ее ухода Численный метод Скорость ухода d6\* dt 5 m ч о и S Д н м "1 Я Т} О со > д S га m i д д Е 5: Е > § A,-A,-l.(i + iw;l An = A„_,ee 2"ve„ А„ = A»-,, [l + -i- ve;- +1 (1 - A2„_,)] A.-A.-..[l + ^-ve;-4.H-l(l-A«_1)] A.-A._I.[jVer + l(l-AU,)] -8-ехш 128 esx3<o
Таблица 4.7 Накопленная ошибка положения и скорость ее ухода при работе по приращениям Численный метод An-An-.oji + i-ve;*) A.-wfi + lver-l.») Накопленная ошибка 66 Ф 0 ф --^/лоешоАх2<*Ф' 0 ф 0 ф + ^-|лоефоЛХМФ' 0 Скорость ухода 1 е2 _/ |Ж>.| е2 _/ 1 12^У Т + de "5ф" 2 12 3 •а S СП Я и Я Д о га £ Я О га Д Д S Я д н га Я о СП > д S га
§'4.5] МЕТОДЫ ИНТЕГРИРОВАНИЯ С ПЕРЕМЕННЫМ ШАГОМ 181 ill с? чз рз V е п «1 ••к + I •5 г* I еч •8 Ь» X ф + + ? ем I -I» - Ф 1« I + ф ~|* I «* i в < И i < «5 I <
182 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 С другой стороны, использование счетчиков на входе интегрирующего устройства позволяет применять численные методы высокого порядка со сравнительно большим шагом: при этом среднее количество операций в секунду при той же погрешности может оказаться даже меньшим, чем при работе по приращениям. Таким образом, выбор метода интегрирования может быть сделан только на основе подробного анализа конкретной задачи. Следует также иметь в виду, что в реальных условиях информация, поступающая на вход вычислительного устройства, может содержать помехи, поэтому следует избегать алгоритмов, которые прямо или косвенно используют операцию дифференцирования. В этом смысле алгоритмы (4.11) —(4.13) и (4.17) —(4.19), использующие приближенное решение кинематического уравнения, имеют определенные преимущества перед классическими разностными схемами, в том числе перед формулами (4.22) —(4.25). Кроме того, сама функция g>£ (t) не всегда бывает достаточно гладкой, и в этом случае использование методов высокого порядка может даже увеличить погрешность интегрирования. § 4.6. ПОГРЕШНОСТЬ КВАНТОВАНИЯ При выводе формул предыдущих параграфов не рассматривалась специфическая погрешность, вызванная тем, что вместо истинного значения вектора Ув* используется квантованная величина V9**. Процесс квантования осуществляется вне вычислительного устройства, поэтому погрешность квантования не зависит ни от шага интегрирования, ни от применяемого численного метода и обусловлена некоммутативностью сложения конечных поворотов*). Для оценки погрешности квантования рассмотрим плоское вращение, задаваемое ортом е.. *) В процессе вычислений в цифровом вычислительном устройстве с конечной длиной разрядной сетки возникает дополнительная составляющая погрешности, вызванная округлением. Ее величина зависит от длины шага, количества операций на шаге, способа округления, количества разрядов, а также от того, выполняются ли вычисления с фиксированной или с плавающей запятой. В данном параграфе эта составляющая не рассматривается.
§ 4.61 ПОГРЕШНОСТЬ КВАНТОВАНИЯ 183 При плоском вращении векторы в, в* и еаФ совпадают, поэтому — е~Ф Обозначим угол суммарного поворота на интервале между соседними импульсами в t-м канале через Ф*. Очевидно, что Ф<Я7ГТ С"1. 2,3). Пусть для определенности Ф,>Ф2>Ф3 (4.62) При этом, очевидно, количество импульсов Кг в t-м канале на интервале Ф удовлетворяет условию К\ ^ /Сг ^ Кз* Выберем интервал Ф, равный Ф[. При этом К\ = 1; кроме того, в среднем *) за несколько интервалов Введем в рассмотрение среднее количество импульсов в третьем канале между соседними импульсами во втором канале: I *« *" КГ Для оценки погрешности следует задаться наиболее неблагоприятным распределением импульсов на интервале Ф. Предположим, что вначале поступают /С2з импульсов в третьем канале, затем один импульс во втором канале. Этот процесс повторяется Къ раз, после чего поступает один импульс в первом канале. Такой последовательности импульсов (элементарных приращений) соответствует кватернион *) Величины КгУ Кг, /Сгз, рассматриваемые как средние на некотором интервале, могут, вообще говоря, не 0ыть целыми числами.
184 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ "ИНТЕГРИРОВАНИЕ [ГЛ.4 В то же время истинному движению соответствует кватернион Кватернион рассогласования равен Полагая ■оА. 1, (4.63) ©11 после соответствующих преобразований получаем Ар = 1 + т еФ {Мсоз sign (ej + + *2е©3 sign (e») — 13ещ sign (*ф|)} + Из (4.61) имеем dbS или dO dbS = 2 vect(^. dQ> = ±У2е9 +е2 9 * &йь • fi), • ©з ©2» Аналогичные формулы можно получить не только при условии (4.62), но и при любом соотношении между Фь Ф2, Фз- Отличие будет только в номерах соответствующих индексов. Величины во, представляют собою направляющие косинусы, поэтому ^©, i *Чо? ^ ^©з * dbe dO (4.64) Можно показать, что оценка (4.64) остается справедливой и в том случае, когда нарушается условие (4.63), использованное при ее выводе. Из формулы (4.64) следует, что для уменьшения накопленной погрешности положения необходимо в первую очередь уменьшать величину кванта,
§ 4.7] СТАБИЛИЗАЦИЯ МОДУЛЯ И УГЛА 185 § 4.7. СТАБИЛИЗАЦИЯ МОДУЛЯ И УГЛА В УРАВНЕНИЯХ ПАУАССОНА Как известно, уравнения Пуассона (3.38) могут быть записаны в векторной форме. Например, для левой группы уравнений (3.38) имеем at = atX<» ('=1,2, 3), (4.65) где a{ = (aUt a2i, a3{)9 ®=(©i, co2, ©3)- По аналогии § 4.2 рассмотрим уравнение, эквивалентное (4.65), для ненормированного вектора. Пусть нас интересует положение тела относительно некоторой оси и не интересует вращение вокруг нее. В этом случае можно ограничиться одним уравнением (4.65) а = аХ<*>- Легко видеть, что оно эквивалентно уравнению а= — а + аХ<* а в том же смысле, как (4.31) и (4.32). По аналогии с (4.34) для стабилизации модуля можно положить a=af(a) + aX<», где, например, /(a)=-fc(a2-l). В общем случае следует задать положение тела относительно двух несовпадающих осей: а = аХ<», ) ь=ьх«.\ (466) Эквивалентность сохраняется, и для стабилизации модулей можно заменить (4.66) уравнениями a = af(a) + aX<», 1 i = 4/(i) + iXe.) (4'67) Одоновременно со стабилизацией модулей векторов, входящих в уравнения Пуассона, необходимо
186 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 стабилизировать величину угла между ними. В самом деле, умножая первое уравнение (4.66) скалярно на 6, второе — на а и складывая, имеем dt ~и* Для уравнений (4.67) соответственно получаем -Sf(a-b) = (a-b)\f(a) + f(b)]. Обозначим о; = cos (а, 6). Тогда а • Ь = abw. Рассмотрим производную от w по времени. В силу (4.67) dw __ d na.b)lablt^b)^{a'b)4f{ab) ,A dt ~ dt L ab \~ а2Ь* ~Ue Таким образом, уравнения (4.67) имеют первый интеграл w (t) = w0. К сожалению, при отклонении w от заданного значения не имеет места эквивалентность в том смысле, как мы ее понимали выше. В самом деле, при w Ф w0 не ясно, какой из векторов отклонился от первоначального направления и в какую сторону. Поэтому без дополнительных предположений не ясно, как в этом случае восстановить положение тела. Несмотря на это обстоятельство, можно построить устойчивое управление величиной w, поддерживающее w ж w0. При этом следует позаботиться о том, чтобы процессы стабилизации w и модулей протекали по возможности независимо. Для устранения неопределенности, о которой шла речь выше, можно потребовать, например, чтобы в процессе управления векторы а и ft двигались навстречу друг другу по кратчайшему пути с одинаковой скоростью. С учетом сказанного приступим к построению закона управления. Процесс стабилизации модулей не нарушается, если сохранить структуру уравнений (4.67).
§4.7] СТАБИЛИЗАЦИЯ МОДУЛЯ И УГЛА 187 Поэтому положим а = а/(а) + *Х(<» + *>к), л \ (4.68) *~»/№) + *Х(»-«Л I где ©к — угловая скорость коррекции. При юк = О уравнения (4.68) совпадают с (4.67). Умножая первое уравнение (4.68) скалярно на а, второе — на &, имеем % = bf(b). Аналогично dw __ __ 0 (аЬ®к) dt ~ L ab • где (а6о)к) обозначает смешанное произведение векторов а, &, ©к. Чтобы движение векторов а и ft происходило по кратчайшему пути, положим юк=Л(аХ&). (4.70) В качестве коэффициента пропорциональности возьмем нечетную функцию рассогласования (w — w0)9 например, Л--£ ("-«*)• (4.71) С учетом (4.70) и (4.71) имеем после некоторых преобразований ■^-= — 2/5(1 — w2) {w - w0). (4.72) Уравнения (4.68) принимают вид а=а/(а) + аХ«>--^[6а2-а(а.6)](ш-ш0), *-«(« + »Х«-^[^-Кв-»)](»-^. Очевидно, что (4.69) и (4.72) независимы. (4.73)
188 ПРИБЛИЖЕННОЕ И ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. 4 Для доказательства устойчивости возьмем функцию Ляпунова в виде W = а (а - I)2 + p(ft - О2 + Y (w - w0)\ а > 0, р >0, у > О- В соответствии с уравнениями (4.73) или, что to же самое, (4.69) и (4.72), имеем ^-=2аа(а-1)/(а) + + 2р6 (ft - 1) / (6) - 4fcY (1 - w2) (w - Wo)2. Поскольку а > 0 и Ь > 0, для устойчивости достаточно потребовать, чтобы (а — 1)/(а)<0 при а=#=1, (6— 1)/(6) < 0 при ft^l, k>Qt т2ф\. Для практических целей достаточно, чтобы управления по модулю и по углу были независимы лишь в первом приближении. Поэтому уравнения (4.73) можно несколько упростить. Во-первых, в выражении в квадратных скобках можно положить а«6«1 и а-ft» « ojq. Тогда а = af (а) + а> X ® — k (w — w0) (6 — аш0), ft = б/1 (6) -f ft x © — k (w — а>0) (а — 6ay0). (4.74) Далее, можно приближенно заменить (w — Wq) на (a-ft — Wo), так что a= a/ (a) + a X © — * (^ • 6 —1^0) (6 —- aa>0), ft = bf (ft) + b X <*> ~ * (л • 6 — a>o) (^ — bw0). ) (4.75) В важном частном случае, когда векторы а и ft должны быть взаимно перпендикулярны, т. е. когда Wo = 0, уравнения (4.75) принимают более простой вид: а = af (а) + а X <*> — k (а • 6) 6, л v ; б Ь = bf {Ь) + ft X © - * (а *Ь)a. f
§ 4.7] СТАБИЛИЗАЦИЯ МОДУЛЯ И УГЛА 189 Можно показать, что упрощенные варианты управления (4.74) — (4.76) устойчивы, хотя область устойчивости уже по сравнению с (4.73). Уравнения (4.73)-—(4.76) более сложны, чем, например, (4.36). Тем не менее для них можно построить вполне работоспособный алгоритм численного интегрирования. Использование уравнений Пуассона со стабилизацией модуля и угла особенно целесообразно, когда векторам а и Ъ можно приписать конкретный физический смысл, например когда исследуется ориентация твердого тела относительно направлений на две заданные звезды.
ГЛАВА 5 . ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ В ЗАДАЧАХ УПРАВЛЕНИЯ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА Кинематические параметры являются обобщенными координатами, позволяющими описывать угловое движение твердого тела. С другой стороны, кинематические параметры находят применение в задачах управления угловым положением твердого тела при его движении. Сигнал об угловом отклонении твердого тела от заданного положения в системе управления является функцией кинематических параметров. Рассмотрим в общем виде систему автоматического управления движением твердого тела вокруг его центра масс. Система должна состоять из датчиков углового положения, определяющих угловое положение (ориентацию) тела относительно заданной системы координат и задающих сигнал углового отклонения, функционального преобразователя, формирующего по сигналу углового отклонения управляющий сигнал, и, наконец, управляющего устройства, с помощью которого может изменяться угловое положение твердого тела. Описанная система управления образует обычный замкнутый контур автоматического регулирования; именно по такой схеме строятся системы управления угловым положением космических аппаратов, самолетов, ракет, кораблей и т. д. Рассмотрим вопрос о получении сигналов углового отклонения твердого тела относительно заданной системы координат (исходного базиса). Традиционно в качестве таких сигналов используются чаще всего функции от углов Крылова или углов Эйлера. Это связано с тем, что в автоматике управления угловым положением в первую очередь нашли применение различного рода гироскопические устройства, имеющие кардановы подвесы. Такого рода устройства позволяют измерять углы поворота осей кардановых колец, которые и являются углами Эйлера и Крылова. Развитие техники управления и в особенности космической техники привело к появлению датчиков угло-
ГЛ. 5] ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ 191 вого положения негироскопического типа. Примерами таких датчиков являются оптические датчики ориентации на центр планеты, на Солнце, датчики ориентации на звезду и т. п. Сигналы углового рассогласования, определяемые этими датчиками, являются функциями направляющих косинусов, а не углов Эйлера. В тех случаях, когда в системе управления используются вычислительные устройства и определение углового положения тела производится путем интегрирования кинематических уравнений, как это имеет место в бесплатформенных системах управления, в качестве сигналов углового рассогласования' могут использоваться любые кинематические параметры. Вид кинематических параметров в этом случае будет определяться типом интегрируемых кинематических уравнений. Таким образом, в принципе возможно использование различных кинематических параметров в задачах управления. Применение кватернионов оказывается наиболее удобным по двум обстоятельствам. Во-первых, исследование устойчивости процессов ориентации, проведенное с использованием параметров Родрига — Гамильтона, позволяет судить об устойчивости системы в целом. Кватернионы позволяют найти наиболее общий вид функциональных зависимостей, осуществляющих устойчивое управление. Во-вторых, компоненты кватерниона могут быть использованы в качестве управляющего сигнала, что может иметь место, когда эти параметры вычисляются в системе управления. Применение компонент кватерниона как сигналов управления позволяет получить не только устойчивое управление угловым движением твердого тела, но и в ряде случаев управление, достаточно близкое к оптимальному (см. гл. 6). Под задачей ориентации твердого тела в некоторой заданной опорной системе координат / будем понимать задачу приведения связанной с телом системы координат Е к опорной. Мы будем рассматривать две постановки задачи ориентации: кинематическую и динамическую. В первом случае будем предполагать, что процесс ориентации заключается в том, что связанной системе координат Е сообщается абсолютная угловая скорость
192 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 коррекции Як, назначение которой — изменять таким образом ориентацию базиса Еу чтобы вызвать его совпадение с системой координат J. Процесс приведения базиса Е к базису J, происходящий за счет наличия угловой скорости йк, будем условно называть процессом коррекции. Такая постановка будет называться кинематической задачей ориентации. На практике она очень близка к задаче ориентации и управления угловым положением твердого тела. Дело в том, что система управления ориентацией, например, космического аппарата, осуществляет регулирование величины его угловой скорости, которая задается в функции углового отклонения аппарата от требуемого положения. Несмотря на то, что управление реально выполняется путем приложения к телу управляющих моментов (от реактивных двигателей или путем изменения кинетического момента внутренних масс), характер движения при достаточно больших ускорениях от управляющего момента близок к тому, который будет рассматриваться в кинематической задаче ориентации. Во втором случае — динамической задаче ориентации— будет предполагаться, что управлением является не угловая скорость коррекции QK, а величина управляющего момента М, прикладываемого к твердому телу. Управляющий момент вызывает соответствующее движение твердого тела; при этом целью ориентации остается также совмещение связанного базиса с опорным. В данной главе будут исследованы типы управления, т. е. вид функциональных зависимостей QK и М, обеспечивающие выполнение процесса ориентации. Исследуется устойчивость процесса управления; показывается, что для некоторых типов управления кинематические условия устойчивости являются необходимыми условиями и для динамической устойчивости. § 5.1. ЗАВИСИМОСТЬ СИГНАЛОВ УПРАВЛЕНИЯ ОТ КИНЕМАТИЧЕСКИХ ПАРАМЕТРОВ Необходимым условием для решения задачи ориентации является получение сигналов управления, характеризующих угловое рассогласование системы координат твердого тела Е и опорной системы /. В действи-
§ 5.1] ЗАВИСИМОСТЬ СИГНАЛОВ ОТ ПАРАМЕТРОВ 193 тельности управление ориентацией твердого тела строится на основе измерений некоторых датчиков углового положения, определяющих положение связанных осей относительно некоторых направлений в пространстве (направление на планету, Солнце, звезду, космический аппарат и т. п.). Будем считать для общности, что датчики углового положения определяют положение осей ih базиса /, связанного с направлениями ориентации. Будем различать два типа ориентации: ориентацию, при которой базис J является инерциальной не- вращающейся системой координат, называемую инерциальной ориентацией, и ориентацию во вращающейся системе координат, когда базис / совершает заданное вращение. В любом случае выходные сигналы датчика могут определять одну, две или три угловые координаты рассогласования базисов. Каждому выходному сигналу будем приписывать направление оси чувствительности датчика таким образов, что при вращении вокруг этой оси из положения совпадения базисов Е и / возникает только этот выходной сигнал. Из общих соображений ясно, что для пространственной (трехосной) ориентации необходимо иметь не менее трех сигналов датчиков, оси чувствительности которых не лежат в одной плоскости ( образуют пространственный базис). Выходные сигналы датчиков углового положения можно представить в функции кинематических параметров, характеризующих взаимное положение базисов. Рассмотрим различные способы представления выходных сигналов датчиков углового положения. Пусть переход от системы / к системе Е определяется с помощью некоторых кинематических параметров и представлен матрицей А, выраженной через углы Крылова (2.70) или компоненты кватерниона (1.19). При этом, очевидно, одни параметры могут быть выражены через другие; однако мы будем рассматривать только такие параметры, которые суть физически измеряемые величины. В том случае, когда ориентация выполняется с помощью трехстепенной гиростабилизированной платформы, положение осей карданова подвеса которой 7 В, Hs Бранец, И. П. Шмыглевскнй
194 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. б соответствует выбранной последовательности углов Крылова (рис. 5.1), выходными сигналами будут сигналы, снимаемые с измерителей углов в осях подвеса. Эти сигналы будут функциями непосредственно углов Крылова Ф, ф и ф: f\{b), Ыф), Ы^). Так, например, при использовании индуктивных измерителей угла будем иметь /i (#) = sin #, /2 (ф) = sin ф, f3 (-ф) = sin -ф. Отметим, что направлением каждого выходного сигнала гироплатформы /ь, т. е. осью чувствительности, будет соответствующая ось карданова подвеса, и ориентация с помощью гироплатформы выполнима всюду, кроме положения совпадения двух осей ее карданова подвеса. В качестве другого примера рассмотрим датчик, реализованный в виде визирующего устройства в двухстепенном кардановом подвесе (рис. 5.2). Выходными сигналами этого датчика могут быть сигналы измерителей углов в осях подвеса. Если последовательность углов перехода от системы координат датчика к осям объекта соответствует рассмотренной выше последовательности (см. рис. 5.1, на котором третий угол принимается равным нулю), то измеряемыми углами будут д и ф. Соответственно этому оси чувствительности такого датчика располагаются по осям подвеса. Можно рассмотреть датчик, установленный неподвижно в осях базиса Е и визирующий некоторое направление, которым может быть направление на планету, Солнце, звезду и т. п. В этом более общем случае выходные сигналы такого датчика будут функциями направляющих косинусов линии визирования с осями системы координат Е. Так, если визируется ось i\ и оптическая ось датчика расположена по оси ей то выходными сигналами могут быть функции t\(e2'U) и Рис. 5.1.
§ 5.1] ЗАВИСИМОСТЬ СИГНАЛОВ ОТ ПАРАМЕТРОВ 195 Ыез-fi). Очевидно, что третий косинус е\-1х не несет информации о направлении отклонения оси в\ от i\, являясь в то же время мерой этого отклонения. Положение датчика относительно осей системы координат Е характеризуют две его оси чувствительности Si и h (Рис 5.3). При отклонении от направления визи- * рования путем вращения во- _/ S круг осей \\ и |2 возникают сигналы /i и /2 соответственно. Малое угловое отклонение базиса Е от заданного положения, определяемое вектором малого поворота 9, может быть частично из- Рис. 5.2. Рис. 5.3. мерено датчиком. Выходные сигналы датчика будут зависеть от величин 9 • gj и 9 • g2» которые суть направляющие косинусы осей чувствительности gi и £г с век. тором углового отклонения. Очевидно, что такого рода двухкоординатный датчик измеряет только компоненты углового отклонения, не являющегося вращением вокруг оси линии визирования, и не дает полной информации об угловом рассогласовании. Полностью вектор 9 может быть измерен только в случае, когда существует не менее трех осей чувствительности, не лежащих в одной плоскости. Для трехосной ориентации твердого тела необходимо иметь информацию об отклонении двух осей, скажем ех и е2, от опорного базиса. Если связать с каждой осью 7*
196 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 неподвижный датчик, оси чувствительности которого расположить по осям базиса £, то выходные сигналы этого датчика будут функциями от направляющих косинусов между осями 1ъ, и ek. Пользуясь формулами (1.19), можем записать следующие соотношения для направляющих косинусов: м * ^2 — 2 (A,iA,2 — ^(Аз)» *2 * ^з — 2 (A»3^2 — Л0Л1), ', • е3 = 2 (Я,,?1з + А0Я2), i3 • «i = 2 (Я,Яв - W. *2 ' ^1 === 2 (Я»0^3 "Г ^1^2/» *3 ' ^2 === 2 (Л3Л2 "Т Aoty). (5Л) В случае малого отклонения базиса £ от базиса / из сравнения (2.70), (1.19) и (2.1) получим с учетом величин только первого порядка малости относительно угла пространственного вращения: ft « в\ ' i% я* — в2' i\ ^ 2A»oA»3, Ф « е2 • г'з « — е3 • *2 « 2Я0ЯЬ -ф ** е3 • *i « — ei • *3 « 2ЯД2' (5.2) Эти соотношения связывают различные кинематические параметры для случая малых отклонений. Практически именно они и имеют значение при описании функциональных зависимостей выходных сигналов датчиков, поскольку большинство датчиков имеет выходную характеристику с малой «линейной» зоной, в которой выходной сигнал несет информацию о величине угла отклонения. В остальной «рабочей» зоне, как правило, датчик дает информацию только о знаке отклонения; рабочая зона также часто бывает ограничена. В соответствии с этим выходная характеристика датчика может быть представлена в функции величин (5.2). Соотношения (5.2) указывают, что для управления наряду с традиционно используемыми углами ft, ф и ф могут быть применены величины Х0Х{. Ниже будет дано строгое обоснование этого утверждения. При последующих рассмотрениях сигналы управления, формируемые на основании выходных сигналов датчиков углового положения, будут задазаться э функции величин (5.1) или (5.2).
ЗАДАЧА ОРИЕНТАЦИИ В ИНЕРЦИАЛЬНОИ СИСТЕМЕ 197 § 5.2. КИНЕМАТИЧЕСКАЯ ЗАДАЧА ОРИЕНТАЦИИ В ИНЕРЦИАЛЬНОИ СИСТЕМЕ КООРДИНАТ Рассмотрим кинематическую задачу ориентации твердого тела в базисе J, являющемся инерциальной системой координат. Пусть движение связанного базиса Е относительно базиса J описывается кватернионом Л(t) и абсолютная угловая скорость вращения базиса Е равна QK — скорости коррекции, формируемой по сигналам датчиков углового положения. Исследуем процесс приведения системы Е к инерциальной системе J при различных зависимостях сигналов коррекции от кинематических параметров и найдем требования к управлению, обеспечивающему устойчивость системы коррекции. Уравнениями движения базиса Е относительно базиса J будут кинематические уравнения в форме (3.11), поскольку скорость коррекции йк задается в осях базиса Е системой управления, регулирующей величины проекций угловой скорости Qm- (i = 1, 2, 3) на оси тела. Запишем эти уравнения в скалярном виде: 2Ло === ~~ ™1"к1 — Л2"к2 — ^3"кЗ» I 2%х = Лойк1 + ^2^кЗ — ^3^к2» I /г оч | (*>-ч) 2Л#2 == Л()Ь2К2 ~Г ЛзййК1 Л|Ь2кз» I 2Лз = АюйкЗ "Ь ^1**к2 — ^Acl- J Исследуем достаточные условия устойчивости ориен- ш тации и вид функциональных зависимостей величин QKi9 обеспечивающих такую ориентацию. I. Введем положительно определенную функцию W =1 - ti = ±[{l - $ +ti + ti + ti]. (5.4) Эта функция в ориентированном положении твердого тела, т. е. при совпадении базисов £ и /, обращается в нуль [этому положению соответствует кватернион (1, 0, 0, 0)]; при всех остальных положениях базиса Е относительно опорного базиса J она имеет положительное значение. Производная от этой функции, составленная
198 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 в соответствии с уравнениями движения (5.3), будет равна W = — 2KqKq = ^o^jQki -|- ЛоА,2Йк2 Ч" ЛоЯзЙкз. (5.5) Рассмотрим сначала случай, когда для управления используются компоненты кватерниона, т. е. управляющий сигнал формируется в функции величин Kj (/= 1, 2, 3). Такой случай может иметь место, когда компоненты Kj вычисляются в системе управления. Соотношения (5.2) показывают, что в качестве меры углового отклонения служат величины KoKj, совпадающие при малых отклонениях с соответствующими углами. Если учесть, что одному положению тела соответствуют два кватерниона (А и —Л), то можно видеть, что величины KqKj несут информацию о направлении кратчайшего пространственного разворота, величина которого меньше я. В случае линейной коррекции величину угловой скорости коррекции следует задать в виде QK/= — kfaKj. (5.6) Можно видеть, что при kj > 0 производная (5.5) будет отрицательно определенной формой везде, кроме ориентированного положения: — W = k\KoK\ + Й2Л0Я2 + ЬзКоКг. Таким образом, функция (5.4) является функцией Ляпунова, и управление (5.6) обеспечивает асимптотическую, сходимость процесса коррекции к положению равновесия, т. е. к положению А = (1, 0, 0, 0), во всей области изменения Л, кроме точки Ко = 0 (вообще говоря, точке Яо = 0 соответствует некоторая область положений). Как следует из соотношения (5.6), при Я0 = 0 скорости QKj также обращаются в нуль; обращается в нуль и производная 1^. Это состояние является неустойчивым положением равновесия. Для определения характера движения в этой точке положим kj = k\ в этом случае В? = - АЛр(1 - Ао)= - kW(\ - W).
§ $.2] ЗАДАЧА ОРИЕНТАЦИИ В ИНЕРЦЙАЛЬНОЙ СИСТЕМЕ ]<$ Интегрируя это уравнение, находим 1 + 1Гв(в-"-1) # где Wo равно значению W в начальный момент времени. Отсюда видно, что скорость сходимости зависит от коэффициента коррекции kt и W(t) стремится к нулю при k>0 для начальных значений B?0<1. Очевидно, что W не может быть единицей нигде, кроме точки Яо ■■» 0; для Н?о= 1 имеем W(t) = 1. Пусть W0=l — б, где б — бесконечно малая; тогда w 1 + 6*** т. е. особая точка Яо = 0 является неустойчивым узлом. Управление по величинам ЯоЯ,- будет асимптотически устойчивым и при нелинейных функциях коррекции. Пусть управление имеет такой вид: QKf=-kjFj(X0)OJ(Xf)9 (6.7) где функции Fj(x) и Ф](х) удовлетворяют условиям x'F,(x)>09 *Ф/(*)>0, |х|<1. (5.8) В дальнейшем будем говорить, что управление (5.7) принадлежит к классу (6.8). При таком управлении производная функции Ляпунова (5.5) будет отрицательно определенной при kj > 0 везде, кроме особой точки Яо = 0, в которой она обращается в нуль. Отсюда следует, что любого типа нелинейное управление по компонентам кватерниона (5.7), принадлежащее к классу (5.8), обеспечивает асимптотическую устойчивость процесса управления всюду, где Яо ф 0. Для асимптотической устойчивости во всей области положений твердого тела достаточно доопределить управления (5.6) и (5.7) таким образом, чтобы они не обращались в нуль в точке Яо = 0. В этом случае, несмотря на то, что производная от функции Ляпунова обращается в нуль в точке Я0 = 0, это положение уже не будет положением равновесия (хотя и неустойчивого), как в рассмотренном ранее примере линейного управления (5.6). Для доказательства этого факта со-
200 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 шлемся на теорему Ляпунова [1] в такой формулировке: если существует положительно определенная функция фазовых координат такая, что ее производная неположительна и обращается в нуль на некотором множестве, не содержащем целых траекторий кроме положения равновесия, то положение равновесия системы асимптотически устойчиво. II. Рассмотрим случай управления по направляющим косинусам: будем исследовать управление, являющееся линейной функцией направляющих косинусов (5.1). Очевидно, что для выполнения трехосной ориентации достаточно использовать две пары косинусов, определяющих ориентацию двух осей системы координат J в связанном базисе; при этом из четырех косинусов независимы только три. Пусть, например, используются косинусы осей 1\ и i2\ тогда можно сформировать три величины угловой скорости коррекции QKi как линейные функции косинусов (1.5). Учитывая, что при малых отклонениях формируемые сигналы коррекции должны в соответствии с (5.2) принимать вид (5.6), получаем QK1 = -g- (*2 • £з) = — #1 (Л|Л»о — Л3Л2), Qk2 = g" (*1 ' ез) = ~~ ^2 (^2*0 + *1*з)» QK3 = J- (i2 • е{) = — &з (А,3А,<> + ^М> ^кз = ~2"d • ег) = — К (*з*о — К*^* т. е. имеются две возможности формирования трех сигналов коррекции из четырех направляющих косинусов. Покажем, что для обоих случаев возможно выполнение достаточных условий устойчивости. Для доказательства будем искать функцию Ляпунова в следующем виде: W = а(1 - Ло) + Р*з + У*! + б*?, (5.10) где а, Р, у и 6 — произвольные положительные параметры. Очевидно, что эта функция — положительно определенная и обращается в нуль только в положении равновесия. (5.9)
§ 5.2) ЗАДАЧА ОРИЕНТАЦИИ В ИНЕРЦИАЛЬНОИ СИСТЕМЕ 201 Производная от этой функции, составленная в соответствии с уравнениями (5.3), имеет следующий вид: _ 1 W = k 1 (а + 6) А&? + h (а + у) kW2 + k3 (а + р) Х%х1 + + *i(p-v)^3 + fe2(p-6)^3±/j3(6-Y)^2 + + [AJi (Y — Р - « — 6) + ^2(а + у + Р — 6) + + &з (6 - Y ± « ± Р)] ЬоКЪК (5.11) где верхний знак соответствует третьему, а нижний — четвертому равенству (5.9), определяющим управление Qk3. Чтобы производная (5.11) была отрицательной функцией, необходимо выполнение следующих условий: kt>0, p>Y, P>6, ±(6-Y)>0 (/=1, 2, 3). (5.12) Покажем, что выбором параметров a, p, y» 6 можно получить знакоопределенность функции W во всей области изменения величин Я*. Представим функцию (5.11) в следующем виде: - 1 w = k\ (a + 6) А&1 + *i (P - Y) Я|Я« + аЛЛЯ^з + + ^2 (С6 + Y) ^оА»2 + &2 (Р — 6) АДз + 6Л0Я1Я2Л3 + + *з (а + Р) ЯоЛз ± Мб — Y) ^2 + сХоЫЖг, (5.13) где величины «, Ь, с подчиняются условию a + b + c=k{(y — p — а — 6) + + Ma + Y + p-fi) + M6-Y±<*±p). (Б. 14) Потребуем знакоопределенности каждой из трех квадратичных форм в соотношении (5.13); для этого должны выполняться следующие условия: а2<46?(а + 6) (р - y)= А2 > 0, | Ь2 <4*2(а + Y) (Р - 6) = В2 > 0, [ (5.15) c2<±4£3(a + P)(fi-Y)=C2>0. ] В соответствии с необходимыми условиями (5.12) /4, 5 И С —действительные величины. Условия (5.15) можно
202 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. S записать также в таком виде: -А^а^А, — В < Ь < В, (6.16) Полученные неравенства удовлетворяются при любых а, Ь и с, лежащих внутри параллелепипеда со сторонами Л, В, С. Если учесть дополнительную связь (5.14), то неравенства (5.16) могут быть выполнены тогда и только тогда, когда плоскость d = а + b -J- с пересекает параллелепипед ABC, т. е. когда -(Л + В + С)<£*<(Л + В + С). Последнее неравенство получается суммированием неравенств (5.16); заменяя в нем величины Л, В, С и а, 6, с в соответствии с (5.14) и (5.15), получаем - 2ft, /(a + d)(p-Y) - 2*2 У(а + у)(Р-в) - _2*3/±(a + P)(«-Y)<MY--P--a-*) + + Ma + Y + p-6) + Mfi-Y±<*±PX < 2*, /(а + вХр-у) + 2й2 /(а + уХР-в) + + 2*3Vr±(a + P)(e-V). Исследуем полученное выражение; его можно разбить на два следующих неравенства: -^{(a + 6) + (P-Y)~2^(a + 6)(p-Y)} + + Ь{(а + у) + ф-6) + 2У(* + У)(Ь-Ь)}± ±fe3{(« + P)±(6-Y)±2Vr±(a + P)(6-Y)}>0, . *i{(a + *) + № —Y) + 2VF(a + e)(p —у)} — -*2{(a + Y) + (p-6)-2/(a + Y)(P-6)} + ^fe3{(a + P)±(6-Y) + 2^±(a + p)(6~Y)}>0. Положим a + 6 = p —YJ тогда a + Y=P~~S; это равенство не противоречит рассмотренным выше HeoOxq-
§ 6.2] ЗАДАЧА ОРИЕНТАЦИИ В ИНЕРЦИАЛЬНОИ СИСТЕМЕ 203 димым условиям устойчивости (5.12). Тогда первое неравенство (5.17) примет вид t,^',"^,;,1^, (5.18) а второе неравенство (5.17) приведется к следующему: jl > , t [V^+PTK±(6-V)]2 ,519ч ki ^ ± къ ТЩТ) • (5ЛУ' Рассмотрим случай верхнего знака, что соответствует заданию £2кз третьим равенством (5.9). Неравенство (5.18) удовлетворяется всегда при любых положительных 1*2 и &з- В неравенстве (5.19) наложим еще одно ограничение на параметры а, р, у, 6: положим у = а -Н +б — р. Тогда это неравенство примет вид и все необходимые условия (5.12) выполняются. Выбором оставшегося нефиксированного параметра а это неравенство можно всегда удовлетворить. Аналогично для случая нижнего знака, соответствующего заданию QK3 четвертым равенством (5.9), неравенство (5.19) удовлетворяется тождественно. Неравенство (5.18), полагая у=*=а + 6 — р, приведем к такому виду: Очевидно, что это неравенство также всегда может быть удовлетворено выбором параметров а ^ р ^ у. Отсюда следует, что неравенства (5.17) выбором параметров а, р, б и у могут быть выполнены при любых коэффициентах ku что соответствует знакоопределенности производной (5.11) и, следовательно, асимптотической устойчивости управления по направляющим косинусам. В проведенном доказательстве нигде не фиксировалась величина коэффициентов ki (/ = 1, 2, 3) и не использовалось свойство их постоянности. В соответствии с принципом «кажущейся линеаризации» любая
204 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 нелинейная функция управления, удовлетворяющая условиям (5.8) при х Ф 0, может быть представлена как Fl(x) = kl(x)x (/=1,2,3). Отсюда следует, что любая нелинейная функция направляющих косинусов типа (5.8) также обеспечивает устойчивую ориентацию. Аналогично можно рассмотреть случай управления, когда для коррекции используются направляющие косинусы двух других осей (i2 и h или 1\ и h). III. Для устойчивого управления положением твердого тела достаточно трех независимых сигналов коррекции, задаваемых в функции направляющих косинусов или величин Яо^-. Установим, какое минимальное число независимых сигналов нужно для устойчивой ориентации, т. е., другими словами, нет ли своего рода избыточности в трех независимых сигналах управления. Для решения этого вопроса исследуем, к какому положению приходит система координат Е при использовании одного или двух сигналов коррекции. Рассмотрим для примера управление по компонентам кватерниона (5.6) и положим, что используется только один сигнал коррекции k\ > 0, a k2 = къ = 0 (т. е. случай управления по одному каналу). В этом случае производная от функции Ляпунова (5.5) равна — k\XW\ и обращается в нуль везде, где Х\ = 0, не считая положения Яо = 0. Очевидно, что эти положения будут положениями равновесия, в которых управление (угловая скорость коррекции) исчезает. Этому случаю соответствует такое положение системы £, когда вектор конечного поворота, переводящий базис J в базис £, лежит в плоскости е2вз\ любому из этих положений соответствует целая траектория уравнений движения (5.3). Аналогично при использовании двух сигналов коррекции, например, таких, что k\ > 0, k2 > 0 и k3 = 0 (управление по двум каналам), имеем равную нулю производную (5.5) для \х = \2 = 0, что имеет место, когда вектор конечного поворота направлен по оси е3. Любое из таких положений также является положением равновесия. Отсюда следует, что для ориентации тела
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 205 относительно инерциальной системы координат необходимо использование не менее трех независимых сигналов коррекции, т. е. трех независимых сигналов датчиков углового положения. § 5.3. КИНЕМАТИЧЕСКАЯ ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ КООРДИНАТ • Помимо рассмотренного случая инерциальной ориентации, наиболее часто встречается ориентация во вращающейся системе координат. Примером такого рода является ориентация космического аппарата в так называемой орбитальной системе координат, направления осей которой связаны с плоскостью орбиты и направлением на центр планеты. Орбитальная система координат совершает упорядоченное вращение с угловой скоростью соо, равной орбитальной угловой скорости. Вектор ©о имеет определенное направление в осях орбитальной системы: он постоянен по направлению и расположен по бинормали к орбите. При движении такого рода орбитальная система координат совершает вращение в одной плоскости относительно инерциального пространства (прецессией плоскости орбиты пренебрегаем). Другим примером ориентации во вращающейся системе координат может служить ориентация космического корабля на другой корабль. Если рассматривать относительное движение двух кораблей, то радиус-вектор, их соединяющий, совершает (в общем случае) вращение в одной подвижной плоскости. Соответственно этому можно ввести связанную с плоскостью вращения систему координат, одна ось которой расположена по радиусу-вектору, а другая перпендикулярна к плоскости вращения. В этом случае угловая скорость вращения опорного базиса относительно инерциального пространства имеет фиксированное положение в осях опорного базиса. I. Итак, при рассмотрении задачи ориентации во вращающейся системе координат будем предполагать, что связанная система координат Е совмещается с опорной системой / путем сообщения базису Е угловой скорости коррекции. При этом система координат / вращается относительно инерциального пространства с
206 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 6 угловой скоростью ©о, причем вектор угловой скорости определенным образом расположен в базисе J и не меняет своего направления. Не уменьшая общности, будем считать, что вектор ©о = соо*з направлен по оси *з- Рассмотрим, какую абсолютную угловую скорость должна иметь система координат Е. Очевидно, во-первых, что скорость вращения базиса Е должна содержать угловую скорость коррекции QK, задаваемую в функции рассогласования базисов Е и / с помощью проекций QKj в связанных осях. Во-вторых, целесообразно потребовать, чтобы ориентированное положение было положением равновесия; для этого нужно, чтобы при совпадении систем координат Е и J, когда угловая скорость коррекции обращается в нуль, базис Е совершал такое же вращение, что и опорный базис. Поэтому необходимо, чтобы базис Е имел дополнительную скорость вращения ©*, направленную по той же оси (е3), что и опорный базис (*з), и имеющую ту же величину, т. е. должно быть ©* = (о*е3 = щег. Отсюда следует, что абсолютная угловая скорость базиса Е равна Q = QK + ю* = QKle, + Йк2*2 + (qk3 + ©о) е3. (5.20) Пусть положение связанного базиса Е относительно опорного задается кватернионом A(t). Введем дополнительно инерциальный базис Z и будем описывать относительно него движение базисов Е и J с помощью кватернионов N и М соответственно. Если переход от базиса Z к базису / дается кватернионом М, а от базиса / к базису Е — кватернионом Л, то переход от базиса Z к базису Е определяется их произведением: ' N = MoA. (5.21) Кинематические уравнения, определяющие движение базисов J и Е относительно инерциального базиса, в соответствии с (3.11), (3.12) и с учетом (5.20) будут иметь следующий вид: 2М =* ©oz° М = М о ю0/, 2N = QzoN = NoQ£, где cooz» ©о/—гиперкомплексные отображения вектора % на базисы Z и /, a Q^ и Од — отображения вектора й (5.20) на базисы Z и Е. (5.22)
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 20*7 В соответствии с (5.21) A = SfoN, откуда можно получить кинематическое уравнение, определяющее движение базиса Е относительно базиса /: 2A = 2M[oN-2MoMoMoN = = Й о N о Q£ — MoMoo0/oMoN = AoQ£ — <Do/oA. (5.23) Отметим, что это наиболее удобная форма уравнения, так как вектор Q задается своими компонентами в базисе Е, т. е. на самом деле задан вектор Q£. Точно так же и вектор ©о задан в базисе /, т. е. известна именно величина ©о/. Если перепроектировать, например, вектор ©0 на базис Е9 то получим <*>0£ =Ао ©of ° А, и уравнение (5.23) принимает обычный вид (3.11) для угловой скорости Й£ — ©о£, которая является относительной скоростью движения базисов Е и J. В соответствии с (5.20) и определением вектора ©0 имеем следующие величины отображений: «£=(QKl, Qk2, QK3 + ®o). ©o/=(0, 0, ©о). С учетом этого кинематическое уравнение (5.23) движения в компонентах кватерниона Л запишется в виде таких скалярных соотношений: 2Aq ^= — Л|УК1 — А2™к2 — ^з^кЗ» 2К\ ^ Ло^к1 "Г ^2^кЗ — ЛзйК2 "Т" 2Л2©0» 2А«2 = АомК2 "Г- АзйК1 — ^1"кЗ — 2Л1©о> ZA3 ^= ^0«'к3 "Т" *Ч««к2 "™~ ™2*'к1» (5.24) Полученные уравнения ориентации во вращающейся системе координат отличаются от аналогичных уравнений инерциальной ориентации (5.3) наличием двух членов с угловой скоростью ©о- Как видно, уравнения (5.24) распадаются на две группы: уравнения для компонент A,q и Х$, аналогичные тем же уравнениям (5.3),
208 ИСПОЛЬЗОВАНИЕ^ КВАТЕРНИОНОВ [ГЛ. 5 и уравнения для Х\ и Аг, связанные из-за наличия скорости вращения опорного базиса соо. Положение равновесия %i = 0, QKi = 0 (f=l, 2, 3), очевидно, является решением уравнения, что получилось, когда со* положили равной соо; можно проверить, что в противном случае в первом и четвертом уравнениях (5.24) появились бы члены с ©о — со*. Интересно отметить, что уравнение (5.23) представляет для постоянных величин соо = со* и QK = 0 разрешимый [см. (3.88)] случай прецессии: Ао (0 = Ао, A3 (t) = Аз, Х\ (t) = A? cos coo/ + А° sin (Hot, А2 (t) = A° cos ©о/ + *^i sin coo/. Это решение указывает, что при отсутствии коррекции движение системы координат Е относительно системы J таково, что вектор конечного поворота (дающий переход от системы J к системе Е) вращается по конусу, ось которого расположена вдоль оси е3, если наблюдать движение в связанных осях, или вдоль оси *3 при наблюдении из опорного базиса. II. Исследуем необходимые и достаточные условия устойчивости процесса приведения системы координат Е к системе /. Рассмотрим случай, когда управление осуществляется по компонентам кватерниона. Введем, как и в предыдущем параграфе, функцию Ляпунова в виде (5.4). Ее производная, составленная в соответствии с уравнениями (5.24), имеет точно такой же вид, как и для случая инерциальной ориентации (5.5). Отсюда сразу же следует, что линейное управление (5.6) и произвольное нелинейное управление вида (5.7), удовлетворяющее условиям (5.8), осуществляют асимптотическую сходимость процесса коррекции. В некоторых случаях, в отличие от инерциальной ориентации, вращение опорной системы координат делает возможным приведение системы координат Е к системе J при управлении только по двум сигналам. Такая возможность выполнения ориентации при неполной информации от датчиков углового положения вызвана изменением положения равновесия при наличии
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 209 вращения. На этот факт указывалось в ряде работ [42, 46] без исследования возможных типов коррекции и без доказательства устойчивости процесса приведения в целом. Рассмотрим случай коррекции по двум сигналам QKi и QK2 (^i > 0, ^2>0, &з = 0). В этом случае производная от функции Ляпунова отрицательна везде, кроме области Х\ = Х2 = 0. Нужно выяснить, содержит ли множество Х\ в Х2 в 0 целые траектории, удовлетворяющие уравнениям (5.24) при заданной коррекции. Полагая в уравнениях (5.24) величины QK* = 0, получаем io = 0, к3 = 0, к{ = A,2co0, %2 — — Ь\Щ- (5.25) Очевидно, что для случая К\ вг ^ = 0 этим уравнениям удовлетворяет траектория Яо(/) = ^о, А,3(0 = Лз. Отсюда следует, что при коррекции по двум сигналам QKi и QK2 [типа (5.6) или (5.7)] имеются целые траектории, на которых производная от функции Ляпунова обращается в нуль, т. е. условия асимптотической устойчивости не выполняются и, следовательно, выполнение ориентации с использованием таких двух сигналов невозможно. Пусть теперь коррекция выполняется по следующей паре сигналов QKi и QK3 (^i > 0, k3 > 0, k2 = 0). Исследуем, могут ли при такого рода коррекции существовать решения, на которых QKi и йкз обращаются в нуль, когда какие-нибудь другие координаты отличны от нуля. Положив Qm* = 0, получим соотношения (5.25), которые, очевидно, могут удовлетворять условиям Xi=A,3=0 только при Х2 — 0. Таким образом, множество Х\ вз s= я3 = 0 не содержит целых траекторий, кроме ориентированного положения Х\ = К2 = ta = 0. Отсюда следует, что при коррекции по таким двум сигналам возможно выполнение пространственной ориентации. Аналогично при коррекции по сигналам QK2 и Q„3 (k2 > 0, &з > 0, k\ = 0) на множестве \2 — ta = 0 не содержится целых траекторий, кроме точки \\ = %2 = = х3 = 0, т. е. выполнение ориентации с использованием этой пары сигналов также возможно. Таким образом, ориентация во вращающейся системе координат может быть осуществлена по двум сигналам датчиков углового положения, при этом управление
210 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 типа (5.6) или (5.7) обеспечивает устойчивость в целом (как и ранее, это управление нужно доопределить в точке Хо = 0 так, чтобы оно было отлично от нуля). При коррекции только по одному сигналу существуют целые траектории, на которых производная № равна нулю. Так, при коррекции по QKi (£2 = h = 0, k\ > 0) имеем для множества Х\ as 0 (на котором QKi обращается в нуль) следующие решения: Яо(*) = л8, МО-**. Аналогичные решения существуют и при коррекции по сигналу QK2, т. е. при k{ = k3 = 0, k2 > 0. Для случая коррекции по сигналу йкз, т. е. при k{ = k2 = 0, &з > 0, имеем для множества Я3 гэ 0 траектории A,i (t) =5s )Л cos ©о/ + ^2 sin (D0f, Х2 (t) = %l sin co0/ — %f\ sin ©0/, удовлетворяющие уравнениям (5.25). Отсюда следует, что выполнение устойчивой ориентации с использованием одного сигнала датчика углового положения невозможно. III. Рассмотренный выше случай устойчивой коррекции по сигналам QK3 и QKi (т. е. по ЯДз и Я<Д0 интересно проиллюстрировать исследованием процесса приведения для случая линейной коррекции (5.6). Отметим сразу же, что аналогичным образом происходит процесс коррекции и по сигналам QK3 и QK2 (^з, ЯДг). Пусть коэффициенты коррекции k{ равны и ориентация выполняется при таком управлении: L2Ki =* -— кК()К\у йкз === — /2А0Л3. В этом случае уравнения (5.24) примут следующий вид: 2Jlo —*?о^? + Я|)=*Лю0-Яо-Л|), % 2Аз = — kXo (Я0Я/3 — ^1^2), 2Ai = — k\$ (XqK\ -\- А2Я3) 4* 2cooA»2, 2Я2 = — 2g>0^i. Эти уравнения описывают процесс приведения базиса Е К базису J при коррекции по двум сигналам; точное ре- (5.26)
§6.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ fill шение этих уравнений получить не удается. В связи с этим приведем приближенное исследование уравнений (5.26). Движение, описываемое (5.26), можно разбить на три участка, определяемых начальными условиями, а следовательно, и областью изменений величин Я*. 1. Пусть начальные рассогласования и коэффициент коррекции k таковы, что выполняется условие QKi^coo всюду, кроме тех положений, где Я1 и Я3 являются малыми величинами. (Это условие эквивалентно требованию coo <C k.) Рассмотрим следующее движение, близкое к (5.26) и отличающееся от него малыми членами с (о<ь которыми согласно сделанному предположению можно пренебречь: 2Яо = йЯо (1 — Я^ — Я|), 2Яз= — «Яо (Я0Я3 — Я1Я2), 2%\ = — йЯо (Я1Я0 -|- Я2Я3), 2Я2=0. (5.27) Эти уравнения интегрируются; с учетом того, что Яг = Яг (Я? — начальные значения компонент кватерниона), имеем из первого уравнения (5.27) «ю_. WI-MPI ^1|-.-И»ЭТ')+[1_оет.-М4П'' Полученного решения достаточно, чтобы проанализировать характер движения. Поскольку Я? + Яз = 1 — — Яг — Яо, то riW + tiW-Ktf + WFlx [i-(x°y]r*Hffil' X -1
212 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 Из эт*ого равенства следует, что при больших значениях / xf(Q + xS(o i-(*y -»[»-(*ЭТ* «о» ОДР+WF ЮГ ' ( ' т. е. сходимость процесса достаточно быстрая и определяется выбором коэффициента коррекции k и начальных условий А,2< 1. Очевидно, что соотношение (6.28) описывает процесс приведения оси е2 к оси i2. Отметим, что близость Ад к единице означает, что Ло мало и положение тела близко к точке А,о=0; этот случай следует рассматривать особо. Если представить компоненты кватерниона в виде A,o = cos-2", Xi = y{sin-^ (/=1,2,3), где у* — направляющие косинусы вектора конечного поворота, то из соотношения Я? + Яз -^ 0 следует, что Y1 + vl-^О И» следовательно, yj-^U Это означает, что в процессе приведения оси е2 к оси 12 угол поворота d (t) (угол эйлерова плоского вращения) уменьшается от начального значения до» так что где у\ "" начальное значение соответствующего косинуса вектора конечного поворота. При таком положении система координат Е оказывается повернутой от ориентированного положения вокруг оси е2 на угол b(t). На этом заканчивается первый, относительно быстрый этап приведения, заключающийся в совмещении оси е2 с осью i2. 2. При дальнейшем движении оси е2 и г2 останутся близкими, т. е. движение будет представлять собой вращение системы координат Е вокруг оси i2y в результате которого должно произойти совмещение систем Е и J, т. е. величина b(t) должна убывать до нуля. Для приближенного исследования второго этапа движения, ко-
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 213 торым является вращение вокруг оси е2(^), положим в уравнениях (5.27) производные ^! = Я3 = 0, так как величины X\(t) и Аз (О приводятся в результате коррекции к малым величинам, какими они и остаются на протяжении всего последующего движения. Из этого условия следует, что выполнимы приближенные равенства Л3 «* —л—» ^i^o Н" ^з^2 ^ ~~п— • . _ 2(о0Ла 2(»о . (5.29) поскольку \2 и А3 являются малыми величинами, квадратами которых можно пренебречь. Подставляя полученное значение Х\ в четвертое уравнение (5.27), имеем 2со* %2 £~~ Л»2> откуда следует решение Г • о 2cog ЛаЮ — яЗГ-* ', (5.30) описывающее разворот базиса Е вокруг оси fe к ориентированному положению (здесь Ад — начальное значение на втором этапе движения, т. е. конечное значение для первого этапа, равное у^ш-д-]. Интересно отметить, что величина коэффициента коррекции k здесь оказывает обратное влияние на скорость сходимости процесса: скорость уменьшается' по мере роста коэффициента k (сравнительно с первым этапом движения, где скорость приведения оси возрастает с ростом коэффициента k). Предложим следующий метод ускорения коррекции: поскольку из-за наличия скорости соо координаты К{ и %2 оказываются «связанными», а в рассматриваемом случае коррекция выполняется по сигналу К\ (QKi = = k\0Xi), то можно ввести так называемую перекрестную коррекцию в таком виде: Йк2 = — МЛ- (6.31)
214 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 Оставляя в стороне вопрос исследования сходимости процесса коррекции на этапе совмещения оси е2 с осью *2 (такое совмещение выполняется), рассмотрим только вращение вокруг оси е2, т. е. движение по координате Я2. Из второго и третьего уравнений (5.24) при выбранной коррекции для Я1=Я3 = 0имеем с учетом первых порядков малости величин Х\ и Яз соотношение для компоненты Х\ в виде, аналогичном (5.29). С учетом этого четвертое уравнение (5.24) примет следующий вид: 2Я2= - (AAJ + 2со0)Я1 = Уо\ *> ?Я2. Принимая во внимание, что Яо « 1 — Я2, получим следующее решение найденного уравнения: (ft+2<D0) (Dp *«-*/ ;" 'г-мим. т (б-з2) Отсюда видно, что сходимость процесса может быть существенно ускорена введением перекрестной коррекции. 3. После того как компонента Я2(0 станет малой, приближенные решения (5.28), (5.30) и (5.32) теряют силу. Последний, третий этап движения вблизи положения равновесия при малых значениях Я2 и Яз описывают линеаризованные уравнения (5.26), в которых не учитываются члены второго порядка малости относительно Яь Я2, Яз (Яо « 1): 2Я3 = — «Яз, 2Я! = — kXx + гсооЯг, гЯа™ —2<о0Я1. (б.ЗЗ) Эти уравнения могут быть использованы при анализе точности процесса приведения. Уравнения (5.33) показывают, что канал Я3 независим от каналов Я1 и Яг, связанных между собой из-за наличия скорости вращения (Оо. Характеристическое уравнение второго и третьего
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 216 уравнений системы (5.33) будет P2+fp+G>§ = 0 и имеет корни * _!_ «./"** 2 При очень малых величинах ©о (сравнительно с k) длительность процесса сходимости велика. Для ускорения процесса можно ввести перекрестную коррекцию (6.31); в этом случае третье уравнение (5.33) изменится на следующее: 2Я2 = — АЛ»1 —— 2(j0qAi . Характеристическое уравнение примет вид ^ + £р + Цшо+4)=-0 и будет иметь корни k /"1? 1 лТ Pi,2 = — T±V 1б""" ®° \щ + Т] • Отсюда видно, что выбором коэффициента перекрестной коррекции h скорость сходимости может быть увеличена. В заключение рассмотрим поведение системы в особой точке Я<> « 1, в которой, как следует из решения (5.28), сходимость процесса должна отсутствовать. Значению А,2 = 1 соответствует такое положение, когда оси е2 и ^ систем координат Е и I совпадают, а оси ех и е3 совпадают с осями —1\ и — *з, т. е. системы координат Е и I развернуты на 180°. Заметим, что точные уравнения движения (5.26) допускают частное решение Я2=1, Яо = ^i = Я3 = 0, и указанное положение является положением равновесия; в этом положении корректирующие сигналы QKi и QK3 обращаются в нуль. Если доопределить управление в этой точке так, чтобы оно не исчезало, то такое положение согласно уравнениям (5.24) уже не будет положением равновесия. Для исследования вблизи этой точки положим в уравнениях (5.24) Я2 « 1 и будем считать величины Я0, Я1 и Яз малыми. В этом случае получим следующую
216 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 систему уравнений (напомним, что ЙК2 = 0): 2ло = — A,iQKi — л3йкз, 2Х{ = A»oQKi + ^кз + 2о>о, 2л3 = Лойкз — ^ki • Из этих уравнений видно, что, несмотря на малость величин Яо, Яь Я3, скорость движения по координатам Яз и Я1 определяется в основном скоростями коррекции Qki и Qk3 соответственно. В том же случае, когда скорости коррекции заданы в виде (5.6) и обращаются в нуль в точке Яо = Я1 = Я3 = 0, движение в малой окрестности этой точки описывают приближенные уравнения 2Я0 = 0, 2Х{ = — йЯоЯ3 + 2со0, 2Яг = — 2g^i, получаемые из (5.26) с учетом членов до третьего порядка малости относительно величин Я0, Ки ta Можно видеть, что уравнения (5.34) описывают движение консервативной системы, т. е. величины Я* изменяются по гармоническому закону с частотой V — 4 ' где Я? — начальное значение координаты Яо. Однако не во всех случаях величины Яг- в процессе движения остаются малыми. Поскольку уход траектории от точки Яг = 1 в большей степени характеризуется изменением координаты Я2(0» приведем решение системы (5.34) для этой координаты: (5.34) Я2 (0 = Я2 * ' ©о COS V/ о ю06Я0 0 со0 . + ^з iy2 (1 — cos vt) — Я1 — sm v/.
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 21? Это решение показывает, что координата К2 (/) оста- k2 (я0)2 нется вблизи единицы только при —^- > cog; при малых же коэффициентах наличие угловой скорости вращения соо приводит к сравнительно быстрому уходу системы из этой точки. IV. Рассмотрим вопрос устойчивости управления, когда управляющие сигналы коррекции задаются в функции направляющих косинусов. Будем искать функцию Ляпунова в виде (5.10) при управлении, осуществляемом по направляющим косинусам осей i\ и i2 и имеющем вид (5.9). Производная от функции Ляпунова, составленная в соответствии с уравнениями движения (5.24), при данном управлении будет равна + Й2(Р-б)Я?Яз + йз(а+Р)ЯоЯ2з±/г3(б-у)^2 + + M(Y-a-p-e) + *2(a + p + Y-6)± ± k3 (6 - у + а + Р)1 МаМ<з ~ 2©о (б — у) А^2. (5.35) Положим б = у и потребуем знакоопределенности полученной квадратичной формы. Для этого необходимо прежде всего, чтобы выполнялись условия kt>0 (/=1,2,3), p>Y (P>6), Введем обозначение d =х а + Ь = (k2 - k! ± k3) (a + Р) (5.36) и представим производную (5.35) в таком виде: -1W = [kx (a + 6) Xl%\ + ki (p - y) &U + aUUX2Xz] + + [to (a + Y) ЯоЯ| + k2 (p — б) Я?Яз + 6Я0Я1Я2Я3] + + Ы<* + Р)ЯоЯз- Условия знакоопределенности двух квадратичных форм (условно заключены в скобки) в приведенном выражении будут: 4*i(a+Y)(P-Y)>a2, 4kl(a +у)ф-у)>Ь2.
218 ИСПОЛЬЗОВАНИЕ КбАТЁРНЙОНОВ [ГЛ. 6 Эти же условия можно записать и в таком виде: - 2*, /(a + vHP-vX a < 2kx /(a + Y)(P-Y). - 2й2 /(a + vXP-YX * < 2й2 /(a + v)(P-Y). Эти неравенства выполняются тогда и только тогда, когда прямая (5.36) в плоскости параметров ау Ь пересекает прямоугольник со сторонами kx У (а + y)(P — у) и k2 V(a + Y)(P ~ Y)> чт0 имеет место только тогда, когда -2(A, + ^V(o + Y)(P-Y)<rf< <2(ft, + *f)V(a+Y)(P-Y). Полученное выражение можно разбить на два неравенства: (5.37) h {Va + Y + V^4f ~ *i (V"a + Y - fP - v)2 ± ±ft3(a + P)>0, Ai (V^+y + VT^2 - ftfC/iST+Y - V^v)2 + + M<* + P)>0. Чтобы выполнялись неравенства (5.37), положим a + Y = P — Y- Рассмотрим случай верхнего знака. Первое неравенство (5.37) удовлетворяется всегда, второе приводится к такому: *!>*« Tett)---&-. С'38) Для нижнего знака имеем всегда выполненное второе неравенство (5.37) и первое в таком виде: *»>*»t$V-4-- <5-39> Очевидно, что выбором коэффициентов коррекции указанные неравенства могут быть удовлетворены, т. е. производная (5.35) от функции Ляпунова будет отрицательно определена и процесс коррекции устойчив асимптотически.
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 219 Как видно из приведенного доказательства, наличие вращения опорной системы координат / приводит к тому, что появляются дополнительные условия на параметры а, р, у и б, за счет чего возникают условия (5.38) и (5.39). Случаю (5.38) соответствует такая коррекция, когда в управлении используются два направляющих косинуса оси fa; таким образом, этот случай определяет процесс совмещения оси е2 с осью fa. Аналогичное условие (5.39) определяет процесс совмещения осей ех и fa. По третьему каналу в обоих случаях используется сигнал, определяемый третьим направляющим косинусом (5.9). Из приведенного доказательства сразу же следует, что при использовании в управлении двух направляющих косинусов оси fa величина коэффициента коррекции &2 может быть положена равной нулю. При этом сохраняются все условия знакоопределенности функции Ляпунова (везде) и ее производной всюду, кроме положений, соответствующих совпадению осей е2 и fa. Однако, как было показано ранее, эти положения не являются целой траекторией уравнений движения (5.24), откуда следует, что возможно выполнение трехосной ориентации во вращающейся системе координат при коррекции по направляющим косинусам одной оси fa. Аналогично рассмотрение условий (5.39) указывает на то, что возможно приведение системы Е к опорной при коррекции по направляющим косинусам оси fa. Чтобы пояснить характер ограничений на коэффициенты коррекции (5.38) и (5.39), рассмотрим случай, когда корректирующие сигналы являются нелинейной функцией направляющих косинусов. Будем исследовать случай коррекции по двум сигналам (направляющим косинусам) оси fa в связанных осях: QKl = — Qj sign (ЯоЯг! — Л<А3), 1 . QK3 = — Q3 sign (ЛоЛ3 + AaXj), J ' т. е. будем рассматривать случай релейной функции управления. В качестве функции Ляпунова выберем функцию, определяемую направляющим косинусом оси fa с
220 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 осью е2: Ее производная в силу уравнений (5.24) при функциях коррекции (5.40) будет равна — W = Q| I X$k\ — А^Лз | -|- Q3I Л0Я3 -f- Л1Л21 т* 2©o^i^2* Рассмотрим область, где полученное выражение обращается в нуль или отрицательно, т. е. область, где движение не свертывается. Очевидно, что для этого необходимо выполнение таких неравенств: —— EjAiA*2 ^^ I ™0^1 """" ™2™3 I I — e3AiA2 ^ I Л()Лз "Г Л1Л2 I J где «,-^>0. «, = ^>0. (5.41) Возводя неравенства в квадрат, получаем Z\k\k2 ^А»оЛ»1 — 2А0Я1Л2Л3 Ц- Л2Л3, 83ЛД2 ^А»оАз Ц- 2А0Я1А2Я3 -\- A»iA»2. Чтобы существовали области, где производная от функции Ляпунова положительна, необходимо выполнение обоих неравенств. Обратно: если показать, что хотя бы одно неравенство не выполняется во всей области движения, то производная будет отрицательно определенной функцией. Рассмотрим второе неравенство как квадратный трехчлен относительно АДз (ЛоЯз)2 + 2 (Ыз) (Я1Я2) + (1 — е|) (Ы2)2 < 0, (5.42) имеющий корни (ЛоЛз)ь2 = (— КЮ ± вз (^1^2) = — (1 + е3) (Л^г). Ввиду того, что АД2 ^ 0, неравенство (5.42) при условии 8з < 1 выполняется в интервале (Ло^зл ^ ^(Лз ^ (^0^3)2 или же, согласно квадратному уравнению (5.42), (— hfa) (1 — е3) < АоЛ3 < (— Л^а) (1 + е^
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 221 Для оценки величины ЛоАДг^з умножим это неравенство на (—ЯДг) - A»iA,2 (1 — ез) ^ — Agitata ^ ЛДг (1 Н~ ез)- Отсюда следует, что — Ы1Ы3 = vXiAl, (5.43) где 1 — е3 < v ^ 1 + е3. Подставляя полученную оценку во второе неравенство (5.41), имеем (2v - е?) Л?Л| + \\х\ + Я|я| < 0. (5.44) Очевидно, что вследствие соотношения (5.43) сомножитель 2v - г\ > 2 (1 - е3) - г] (5.45) выбором величин ei и е3 может быть всегда сделан положительным; при этом строгое неравенство (5.44) невыполнимо. Равенство (5.44) возможно только в следующих случаях: а) Л, = 0, А,2 = 0; б) ^ = 0, Л3 = 0; в) Л2 = 0, А,0 = 0. Для первого из этих случаев производная от выбранной функции Ляпунова _Г = £23|Л(Дз1 обращается в нуль только при Я3 = 0 либо при Я<> = 0. Точно так же во втором и в третьем случаях производная от функции Ляпунова обращается в нуль на множестве значений Х\ = 0, Я2 == 0, Яз = 0 и на множестве Я0 = 0, Я2 = 0 или Хо = 0, к\ = 0, А,3 = 0. Таким образом, доказано, что производная от функции Ляпунова отрицательна везде, кроме двух положений: 1) Х\ = Х2 = Я3 = 0 — это положение соответствует выполнению требуемой ориентации; 2) Ко = 0 и одна из других компонент также равна нулю — это, как отмечалось ранее, неустойчивое положение равновесия. Заметим, что последнее следует из того, что производная
222 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 т. е. положительно определенная для рассматриваемых компонент случая а). Интересно отметить смысл ограничений на величины ei и ез: необходимо, чтобы выполнялись условия ei <C 1 и 83 < 1 и несколько более сильное условие (5.45). Таким образом, величины скоростей коррекции Qi, Q3 должны быть минимум в два раза больше скорости вращения соо, что, как легко видеть, является необходимым условием приведения оси е2 к оси *V V. Рассмотренные в этом параграфе вопросы ориентации во вращающейся системе координат относились к случаю, когда вращение исходного базиса J выполнялось вокруг одной его оси (в данном случае вокруг оси *3). Существенной особенностью ориентации во вращающейся системе координат является показанная в этом параграфе возможность выполнения ориентации при неполной информации от датчиков углового положения. Последнее вызвано тем, что наличие вращения существенно изменяет возможные положения равновесия. Рассмотрим теперь случай ориентации твердого тела в опорном базисе J, совершающем вращение таким образом, что вектор угловой скорости ©о имеет в базисе / произвольное положение. На практике такой случай может соответствовать, например, ориентации в системе координат, повернутой относительно орбитальной системы на произвольные (программные) углы. В этом случае вращение опорной системы координат происходит с той же орбитальной угловой скоростью ©0, однако эта скорость может иметь произвольное заданное направление в базисе /. Будем считать, что вектор ©о задан тремя проекциями в базисе /, т. е. ®о = <% = ©i'i + ю2*2 + <Мз. (5.46) Система координат твердого тела Е совмещается с опорной путем задания угловой скорости коррекции QK и, кроме того, дополнительной скорости ©*. При этом дополнительная скорость ©* должна быть такой, чтобы при совпадении систем координат Е и / скорость ©* совпала с ©о, т. е. чтобы положение ориентации было положением равновесия. Угловые скорости коррекции 12к
§ $.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 223 и со* задаются в связанной системе координат компонентами , , Г (5.47) Векторная сумма этих скоростей определяет абсолютную угловую скорость движения базиса Е. Уравнениями относительного движения базисов Е и J будут уравнения (5.23) при значении ©о/, определяемом по (5.46), и Й£=Ок£+®£ из соотношений (5.47). Эти уравнения, определяющие изменения компонент кватерниона Л, запишем в скалярном виде: 2Я, = XqQki - *з (&к2 + 2©2) + Яз (QK3 + 2(о3), 2Я2 = A0QK2 - Я, (Qk3 + 2©з) + h (Qki + 2©,), 2Я3 = ЯоЙк3 — %2 (Qki + 2©i) + Я,, (QK2 + 2©2). (5.48) Положения равновесия, возникающие в результате окончания процесса коррекции, будут описываться уравнениями Л0=0, Х\ = Я2со3 — А,зй>2, ^2= Л3СО1 — А^СОз, Лз=== ^i0t>2.— ^2®1» (5.49) получаемыми из (5.48) при QK< = 0. Уравнения (5.49) для постоянных щ (i = 1, 2, 3) имеют следующие решения, которые описывают прецессионное вращение; 1 /Л lO Ю? + К + ®!) COS О/ Л1 до = Ai -3 1- ©* + ^sin©* + -»(l-cos©o]- -Я°з[-»(1-со8©0 + -^зщ©ф j (6.50)
224 Использование кватернионов [гл. б А2 (0 = А,? [-^- (1 - cos ©0 - -^ sin с»/] + о <о| + (ю* + ©з) cos at + л2 -5 + 4lTsin«rf + ^O -cos»0]. MO-tf^O ~C08«rf) + f-Sta«rf] + + XS[J5S-(l-CO8ffl0—5-8taarf] + } (5.50) 0 ©з + (©i + co2)cos ®* + Аз S5 где (o2=(oJ + <»>2 + (03- Очевидно, что положение ориентации к\ = %2 = ta = 0 является положением равновесия системы (5.48). Для исследования возможности выполнения ориентации будем искать функцию Ляпунова в виде (5.4); тогда ее производная, составленная в соответствии с уравнениями (5.48), будет иметь вид (5.5). Отсюда сразу же следует, что управление по компонентам кватерниона линейного типа (5.6) и произвольное нелинейное управление (5.7), удовлетворяющее условиям (5.8), обеспечивают асимптотическую сходимость процесса коррекции. Рассмотрим вопрос о возможности выполнения ориентации при неполной информации от датчиков. Оставим пока в стороне вопрос о возможности реализации такого случая: поскольку датчик углового положения связан с направлением визирования, то не при любом его положении возможно получение сигналов углового рассогласования. Так, при орбитальной ориентации датчик связан с направлением на планету и может работать только в том случае, если его ось визирования находится в определенной области относительно направления на планету. Пока предположим абстрактно, что при любом положении опорного базиса возможно получение сигналов углового рассогласования. Рассмотрим два случая: 1) все компоненты угловой скорости вращения отличны от нуля; 2) две компоненты <о0 не равны
§ 5.3] ЗАДАЧА ОРИЕНТАЦИИ ВО ВРАЩАЮЩЕЙСЯ СИСТЕМЕ 225 нулю (случай одной не равной нулю компоненты о)0 рассматривался ранее). 1) coi=7^0, 0)2=7^0, соз=7^=0. В этом случае выполнение ориентации в принципе возможно только по одному любому сигналу от датчика углового положения. Действительно, пусть существует коррекция только по одному каналу, например QKi. В этом случае производная от функции Ляпунова (5.5) будет отрицательна везде, кроме множества Х\ sa 0 (предполагаем, что уравнение доопределено в точке Хо = 0 так, что оно не обращается в нуль). Решения (5.50) показывают, что множеству Х\ sa 0 может удовлетворить только одно положение равновесия А,? =А,2 = А,з = 0, т. е. ориентированное положение. Эти же решения поясняют и физический смысл такой ориентации: если измерять величину X\(t)t то достаточно трех измерений в различные моменты времени, чтобы по ним определить величины A,?, kl и Лз (хотя эти же значения могут быть определены и по одновременному измерению трех величин Xh X2 и А,3). На практике реализация этого случая невозможна ввиду того, что не существует датчиков углового положения для такого случая ориентации. Так, при орбитальной ориентации рассматриваемому случаю соответствует программное положение опорного базиса / относительно орбитальных осей. При этом физически направлениям опорного базиса ничего не соответствует, т. е. они не направлены на планету, с которой связана орбита, поэтому построение сигналов управления невозможно. 2) (0i = 0, (02 Ф 0, соз Ф 0. Совершенно ясно, что уравнения симметричны и случай равенства нулю других компонент сводится к данному. В этом случае выполнение ориентации возможно при использование только одного сигнала от датчика углового положения по каналу ЙК2 или QK3. Соответственно этому возможна выполнение ориентации по любой паре сигналов и невозможна ориентация при одном сигнале QKi- Для доказательства обратимся к производной от функции Ляпунова (5.5), которая будет отрицательна везде, кроме некоторого множества, определяемого 8 В. Н. Бранец, И. П. Шмыглевский
226 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 используемым сигналом управления. Так, при коррекции по сигналу Qk2 нужно проверить, не содержит ли множество Я2 = 0 целых траекторий. Из соотношений (5.50) при coi = 0 можно видеть, что К2 = 0 возможно тогда и только тогда, когда Я?= А,2=А,з=0; отсюда следует, что при коррекции по сигналу QK2 происходит процесс устойчивой ориентации. Аналогичный случай имеет место при коррекции по сигналу £2кз- Однако при ориентации по сигналу QKi множество Х\ =s 0 в соответствии с решениями (5.50) может, кроме ориентированного положения, содержать еще и такое решение: A2OD3 — A3OD2 = 0. Отсюда следует, что могут быть выбраны А| и Я,з не равные нулю, такие, что Х2^)Ф_0 и kz(t)=£Q, хотя Я! (/)^0. На практике такому случаю может отвечать, например, ориентация в программно повернутой относительно орбитальных осей системе координат J, если поворот выполнен, например, в плоскости местного горизонта. В этом случае угловая скорость орбитального*вращения о)о проектируется на две оси базиса /. С другой стороны, поскольку одна ось базиса остается связанной с направлением на планету, возможно измерение отклонения связанного базиса Е относительно опорного. В соответствии с доказанным, в этом случае возможно выполнение ориентации с использованием одного сигнала от датчика углового положения (т. е. сигнала по каналу тангажа или крена, но не сигнала по каналу курса). Аналитическое исследование процесса приведения в данном случае сложно и возможно только в области малых отклонений от положения ориентации. § 5.4. ДИНАМИЧЕСКАЯ ЗАДАЧА ОРИЕНТАЦИИ Условия кинематической устойчивости являются необходимыми условиями и для динамической устойчивости. Дополнительным условием динамической устойчивости является, в частности, наличие в управлении демпфирующего члена, содержащего угловую скорость, при определенной зависимости управления от «кинематической» функции управления.
§ 5.4] ДИНАМИЧЕСКАЯ ЗАДАЧА ОРИЕНТАЦИИ 227 Рассмотрим пример динамического управления, когда управляющая функция формируется по линейному закону. Пусть движение твердого тела описывается динамическими уравнениями Эйлера Ji©! + (J2 — J3) G>2«>3 = Мь Л2(Ь2 + (J3 — Ji) ©за), = М2, Лз©3 + (Jl — J2) <*\®2 = Мз> ' (5.61) где Ji, J2, J3 — главные центральные моменты инерции тела; Mi, M2, М3 — внешние (приложенные к телу) управляющие моменты. Уравнения (5.51) совместно с кинематическими уравнениями, например, (5.3), для случая инерциальной ориентации полностью описывают движение управляемого тела. Управляющие моменты М* (i= 1, 2, 3) следует задать в функции угловых скоростей щ тела и кинематических параметров, определяющих отклонение от положения ориентации. Рассмотрим случай, когда кинематическое управление задается в виде (5.6). Зададим управление такой линейной функцией: М* = — hitoi — *,A,0A*. (5.52) Для исследования устойчивости такого управления будем искать функцию Ляпунова в виде где W — «кинематическая» функция (5.4), а член V определяется «динамикой» движения тела V = ^(J,co2 + J2(d2 + J3^) (5.53) и равен кинетической энергии его движения. Очевидно, что функция Т положительно определенная и имеет один нуль в ориентированном положении относительно инер- циального базиса: со, = 0, Xt = О, Х0 = 1 (/ = 1,2,3). (5.54)
228 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 Производная от этой функции, составленная в силу уравнений (5.51) и (5.3), будет равна з з Г= 2 J<<d,M< + 2 AoMi- 1=1 f«*l Подставляя управление (5.52), получаем з з f «r — 2 h х©2 — 2 ал<о, (£, — jo. *=i *=i В простейшем случае можно положить %ki = Ji и получить отрицательно определенную функцию f, обращающуюся в нуль только в положении требуемой ориентации. Отсюда следует, что управление типа (5.52) может обеспечить выполнение ориентации. Ориентация твердого тела может быть выполнена при более общих функциях управления. В частности, рассмотрим управление типа М, - - Л («I - 0«) (/-1,2, 3), (6.55) где функции Fi принадлежат к классу (5.8), а аргументом функции управления является разность угловой скорости движения твердого тела и «кинематической» скорости приведения, формируемой по сигналам от датчиков углового положения. Управление (5.55) также осуществляет устойчивую ориентацию твердого тела. Рассмотрим выражения (5.53) для кинетической энергии вращения твердого тела. Производная V, составленная в соответствии с уравнениями (5.51) и при управлении (5.55), будет равна 3 v= — 2 j*g>^ (®i — qk*)- Очевидно, что эта функция отрицательна везде при |(йг|>|йкг| и положительна при |coi|<|QKi|. Отсюда следует, что управление (5.55) при больших угловых скоростях осуществляет уменьшение кинетической энергии тела до величины, соответствующей а при малых скоростях увеличивает ее,
§6.5] ПРИМЕРЫ 229 Таким образом, управление (5.55) стремится при- вести движение к вращению с угловыми скоростями QKi- При достаточно жестком управлении такое движение может практически совпадать с исследованными случаями ориентации. Тем не менее управление (5.55) не всегда осуществляет асимптотическую сходимость процесса к нулю; вид функции определяет характер поведения системы в нуле. Так, нелинейные функции управления могут, вызывать автоколебания системы около ориентированного положения. Изучение движения твердого тела при различных законах управления представляет собой отдельную и весьма обширную область исследований, и мы ограничимся рассмотренным примером. § 5.5. ПРИМЕРЫ Будем предполагать, что управление движением твердого тела формируется с использованием сигнала углового положения таким образом, чтобы обеспечить устойчивую ориентацию в положении равновесия. При этом управление может задаваться, например, в одной из описанных в предыдущих параграфах форм. Важным является тот факт, что для ориентации в некоторой заданной системе координат в качестве сигналов углового положения используются величины компонент кватерниона, задающего переход от заданной системы координат к связанной. В дальнейшем такой кватернион будем называть кватернионом рассогласования. Рассмотрим различные случаи ориентации в разных системах координат, при которых определение кватерниона рассогласования производится различным образом. Важным приложением этого является построение инерциальных систем управления с использованием принципа бескардановых систем. I. Пусть положение опорной инерциальной системы координат определяется путем интегрирования кинематических уравнений. При этом угловая скорость измеряется с помощью датчиков угловой скорости, жестко установленных в связанных осях. Не уменьшая общности, будем считать, что оси чувствительности датчиков угловой скорости расположены по осям связанного
230 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 базиса Е. В этом случае датчики измеряют компоненты вектора угловой скорости <а£, и для интегрирования должно быть использовано кинематическое уравнение (3.11). Пусть интегрирование начинается в момент t0 и в качестве начального кватерниона используется кватернион (1, 0, 0, 0). В этом случае получаемый в результате интегрирования кватернион Л(/) будет описывать движение базиса Е относительно инерциального базиса/ при начальном условии I = E(t0). Очевидно, что если Л(0 использовать в качестве кватерниона рассогласования для формирования сигнала углового управления [аналогично (5.6)], то при таком управлении ориентация будет выполняться таким образом, чтобы совмещать оси тела с соответствующими осями исходного базиса I = E(t0). Блок-схема подобной системы управления представлена на рис. 5.4, где приведена замкнутая Измеритель углобой спорости wf со длон интегрирования 1 2А = А°<0£ Объент управления (твердое тело) А Формирование упрайления Рис. 5.4. схема контура автоматического управления. В дальнейшем при рассмотрении подобных схем мы не будем изображать замкнутый контур управления, предполагая, что он всегда существует (не будем изображать блоков «формирование управления» и «объект управления»). Наша задача заключается в получении кватерниона рассогласования, что является необходимым условием ориентации в заданной системе координат. Рассмотрим теперь задачу ориентации не в базисе I = E(to)t а в другом инерциальном базисе, который обозначим Еп. Пусть переход от базиса / к базису ЕП определяется кватернионом Лп (рис. 5.5). В этом случае для управления нужно использовать кватернион, за-
§5.5] ПРИМЕРЫ 231 дающий положение базиса Е относительно базиса £п, т. е. кватернион Лр. Очевидно, что выполняется следующее соотношение: Л = Лп о Лр, откуда Лр = ЛпоЛ. (5.56) При управлении по кватерниону Лр (5.56) базис Е будет совмещаться с заданным базисом Еп. Возможен другой способ выполнения ориентации в базисе £п. Очевидно, что если в момент начала интегрирования в качестве начального условия использовать кватернион Лп, то получаемый в результате интегрирования кватернион в соответствии с теоремой 3.1 будет кватернионом (5.56), т. е. Ар будет также удовлетворять реализуемому кинематическому уравнению. Отсюда следует, что при таком способе получается ориентация относительно базиса Еп. Пусть, далее, выполняется ориентация относительно базиса I = E(to) и в Рис. 5.5. некоторый момент времени t требуется осуществить переход к ориентации в базисе Еп. Для осуществления такого перехода необходимо вместо кватерниона Л(t) использовать для управления кватернион Лр(/) (5.56). Такая смена кватерниона управления вызовет требуемую переориентацию объекта. Таким образом, система управления, в которой выполняется интегрирование кинематических уравнений, позволяет получить ориентацию относительно любого инерциального базиса, причем переход от одного базиса к другому осуществляется выполнением дополнительной операции умножения (5.56) и использованием результата в качестве кватерниона рассогласования. Блок-схема ориентации такого рода представлена на рис. 5.6. Переход от ориентации в базисе J к ориентации в другом базисе Е можно осуществить и другим способом. Пусть в момент перехода t\ кватернион, получаемый в результате интегрирования кинематических уравнений, равен A(<i). Очевидно, что при интегрировании уравнений, начиная с момента tu для выполнения
$32 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. в ориентации в базисе I=E(t0) необходимо в качестве начального условия взять A(t\). Если же ориентация выполнялась бы относительно базиса £ш то в момент t\ при том же положении базиса E(t\) величина кватерниона была бы равна Ар (tx) = Ап о Л (tx) (см. рис. 6.5). aJ Измеритель спорости ^ блок интегрирования 4» 6л$Н 1 умножения Рнс. 5.6, Отсюда следует, что для перехода в момент t\ от ориентации относительно базиса J к ориентации в базисе Еп можно в этот момент перейти в блоке интегрирования от А(^,) к AnoA(^). При этом можно использовать . блок-схему системы управления, Рис. 6.7. но него базис J и связанный базис Е. Очевидно, что аналогично предыдущему случаю для ориентации в базисе J необходимо кватернион рассогласования формировать в следующем виде: Ар = ЙоА. (5.57) Кватернион A(t) получается в результате интегрирования кинематических уравнений на основании измерения угловой скорости ©£ при соответствующем задании начальных условий. Кватернион М может быть получен (если он не известен заранее для любого момента времени) по величине угловой скорости шо вращения базиса J путем интегрирования кинематических уравнений при нужном выборе начальных условий. При этом может быть использована любая форма кинематического
*б.б] ПРИМЕРЫ 233 уравнения [(3.11) или (3.12)] — выбор можно делать в зависимости от того, в каком базисе а>о выражается наиболее простым образом. Блок-схема такого типа ориентации представлена на рис. 5.8. Измеритель угловой шрости "'» Р°ъ блок интегрирования блок интегрирования Л + М блок умножения - \ лр~ Рис. 5.8. Такого же рода ориентацию можно получить и другим образом. Заметим, что требуемый кватернион Лр удовлетворяет кинематическому уравнению [см. уравнение (5.23)] 2ЛР = Лр о &Б — ю0/ о Лр, (5.58) полученному из (5.57) с учетом того, что 21Й = (00Z oM = Mo (Do/. Измеряемым вектором угловой скорости является вектор &Е (имеющий компонентами проекции со на связанные оси); кроме того, вектор вращения ©о неподвижного базиса J может быть задан в проекциях на оси этого базиса (а не базиса Е). В связи с этим можно предусмотреть блок интегрирования, реализующий уравнение (5.58). В этом случае блок-схемой ориентации во вращающемся базисе может быть схема (см. рис. 5.4) с указанным блоком интегрирования. Следует отметить, что в некоторых случаях более предпочтительной может оказаться схема, представленная на рис. 5.8, так как в этом случае сохраняются непрерывно положения двух систем координат J и Z и имеется возможность выполнения ориентации в любой из них. Помимо ориентации непосредственно в базисе 7, приведенная схема позволяет выполнять ориентацию в
234 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. 5 *~£ Рис. 5.9. базисе £ш имеющем относительно / фиксированное заданное (программное) положение, характеризуемое кватернионом Ап. Пусть взаимное положение базисов Z, /, Еп и Е определяется кватернионами М, Ап, Ар и А в соответствии с рис. 5.9. Очевидно, что для ориентации относительно базиса Еп следует для управления использовать кватернион Ар = АпоМоА. (5.59) Блок-схемой такого рода ориентации может служить схема (см. рис. 5.8), дополненная еще одним блоком умножения, выполняющим умножение кватерниона Ап на кватернион МоА. Поскольку кватернион Ар (5.59) удовлетворяет (при постоянном Ап) уравнению (5.58), то такого же типа ориентация может быть получена и в блок-схеме на рис. 5.4 при использовании блока интегрирования, реализующего уравнения (5.58). Для перехода от ориентации в базисе / к ориентации в базисе Еп в момент времени tu необходимо в интеграторе произвести замену начальных условий: вместо кватерниона Ap(/i), получаемого в результате интегрирования, следует записать величину AnoAp(/j). При этом, как следует из соотношений (5.57) и (5.58), будет получена требуемая величина кватерниона рассогласования (5.59). III. При исследовании способов реализации ориентации во вращающемся базисе было принято, что получаемые в результате интегрирования кинематических уравнений кватернионы А(0 и М(/) или же кватернион Ар (0 имеют соответствующим образом выбранные начальные условия, обеспечивающие требуемую ориентацию базиса J (и Z). Однако на практике это не всегда имеет место и базис J, в котором производится ориентация, не совпадает с требуемым базисом /0 (вследствие ухода и ошибок в начальных условиях). Допустим, что с объектом управления, т. е. с базисом Е, связан датчик углового положения, определяю-
§5.61 ПРИМЕРЫ 235 щий ориентацию базиса Е относительно базиса /0. Не уменьшая общности, будем считать, что датчик измеряет компоненты кватерниона N(/)> определяющего переход от базиса /0 к базису Е (рис. 5.10). Пусть рассогласование базисов /о и / определяется кватернионом Р. Очевидно, что имеется следующая возможность определения Р по имеющимся кватернионам Лр и N: P=NoAp. (5.60) Движение базиса/относительно инерциального базиса Z задается кватернионом М и происходит с угловой скоростью ю0*; движение же базиса h относительно базиса Z происходит со Рис. 5.10. скоростью (Оо и задается кватернионом Мо. При этом задача исследования взаимного движения базисов / и /о полностью совпадает с рассмотренной в § 5.3 задачей ориентации во вращающейся системе координат. Действительно, для кватерниона Р в соответствии с рис. 5.10 имеем Р = М0оМ, откуда получаем уравнение относительного движения 2Р= — 2Й0оМ0оЙ0оМ + 2М0оМ==-.©0/ооР + Ро©^, (5.61) где в соответствии с приведенным выше условием 2М0 = щг о М0 = М0 о ©0/о, 2М = ©oz о М = М о ©5/. (5.62) Для приведения базиса J к базису /о необходимо ввести дополнительную угловую скорость коррекции QK движения базиса /, т. е. полная угловая скорость базиса / должна быть равна о« + < В этом случае уравнение (5.61) перейдет в уравнение корректируемой системы координат 2Р = - ю0/а оР + Ро(©J/ + Qk/), (5.63)
236 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛг6 аналогичное уравнению (5.23). Соответственно этому второе уравнение (5.62), определяющее движение вращающегося базиса J относительно инерциального базиса Z, перейдет в такое уравнение: 2M = Mo(©S/ + QK/). (5.64) Реализацию этого уравнения и следует осуществить для решения задачи коррекции базиса J. Для формирования сигнала коррекции можно использовать имеющийся (вычисляемый) кватернион (5.60); при этом все Измеритель уелодой спорости \Р 1 Формирование 1 коррекции блан /нтегриройония\ ta/Я/ Л^ блок умножения г 1 блок интегрирования Датчик ПОЛОЖ ения N блок умнол кения i М < А> А Рис. 5.11. рассмотренные в § 5.3 способы коррекции обеспечивают устойчивый процесс приведения базиса J к базису /0. Блок-схема такого процесса управления с коррекцией положения базиса J приведена на рис. 5.11. Как видно из рисунка, эта схема имеет два контура управления: контур управления положением твердого тела и контур коррекции, приводящий базис / к требуемому положению. В заключение заметим, что датчик углового положения не обязательно должен иметь линейную характеристику в функции компонент кватерниона N и измерять величину N при любом положении базиса £. В действительности при работе контура управления величина рас-
§5.в) г ПРИМЕРЫ 237 согласования Лр будет мала; при малом отклонении базиса / от базиса /0 и кватернион Р будет близок к единичному. Для малых отклонений формула (5.60) переходит в векторную форму сложения малых векторов угловых рассогласований. Можно показать, что для коррекции допустимо использование достаточно широкого класса функциональных зависимостей выходных сигналов датчиков углового положения. Однако исследование этого вопроса достаточно сложно и носит специальный характер. Приведенные здесь схемы построения системы управления могут использоваться, например, для ориентации космического аппарата в орбитальной системе координат при его полете около планеты. В качестве датчиков углового положения могут служить датчики, определяющие направление на центр планеты или направление вектора скорости полета космического аппарата. IV. В большинстве практиче- Рис- 5.12. ских случаев инерциальной ориентации требуется не произвольное положение инерциаль- ного базиса /, а определенное, связанное, например, со звездной системой координат (экваториальной, эклиптической и т. п.). Обозначим это требуемое положение системы координат /о. Очевидно, что для совмещения базиса J с базисом /0 необходимо начинать интегрирование кинематических уравнений в блоке интегрирования (см. рис. 5.4) в тот момент, когда базис Е совпадает с базисом /о. Однако существует еще одна возможность совмещения базисов / и /о, которая становится необходимой вследствие уходов базиса J при интегрировании кинематических уравнений, а также при невозможности выставки базиса / в положение /о. Пусть в базисе Е установлены звездные датчики, которые позволяют определять положение базиса Е относительно базиса /о. Не конкретизируя типа этих датчиков, будем считать, что измеряются компоненты кватерниона N (рис. 5.12).
238 ИСПОЛЬЗОВАНИЕ КВАТЕРНИОНОВ [ГЛ. б Поскольку значение кватерниона А(<) вычисляется в блоке интегрирования и также является известной величиной, то имеется возможность вычисления кватерниона Р, характеризующего рассогласование базисов J и /о, по соотношению (5.60). Ввиду того, что базисы J и /о являются инерциальными, кватернион Р останется постоянным. Введем угловую скорость коррекции QK> щ <оЕ\ V i—Н Q L M«i Формирование коррекции ЗЛОА /ктегрироаания \,р 1 Датчик ум пом юоюения \, т блок умножения F N 1 Рис. 5.13. которую будем добавлять к скорости ю£ на входе в блок интегрирования, а величину QK зададим в функции кватерниона Р. Движение базиса Е относительно базиса /о происходит с той же угловой скоростью ю£ (абсолютной угловой скоростью движения базиса £), поэтому имеем такое уравнение изменения N: 2N = ©/„ о N = N о ю£. Уравнение, реализуемое в блоке интегрирования с учетом коррекции, будет таким: 2АР = (со/ + QK/) о Ар = Ар о (ю£+ Qk£) = Ар о ©£ + QK/ о Ар. (5.65) Отсюда в соответствии с (5.60) получаем следующее
§5.5] ПРИМЕРЫ 239 уравнение, описывающее движение базиса / относительно базиса /о: 2P = 2NoAp-2NoApoApoAp = = fi)/ooP-Po(fi)/ + QK/) = -PoQK/l (5.66) так как <о/о ° Р = Р о ю^. Уравнение (5.66) показывает, что процесс коррекции положения базиса J является тождественным рассмотренному в § 5.2 случаю ориентации в инерциальной системе координат. Блок-схема ориентации в корректируемой системе J представлена на рис. 5.13. Блок интегрирования в данном случае должен реализовывать уравнения в виде (5.65). Система содержит также контуры ориентации и коррекции опорного базиса. Заметим, что особой задачей является формирование величины угловой скорости коррекции по сигналам звездных датчиков. Сложность этой задачи заключается в том, что звездные датчики имеют ограниченную выходную характеристику, их выходные сигналы характеризуют вектор углового рассогласования в произвольных осях, определяемых расположением звезд визирования; возможно осуществление коррекции при неполной и избыточной информации от датчиков. Этот вопрос также требует специального исследования. Рассмотренные здесь примеры показывают, что выполнение ориентации различного типа осуществимо в схемах, использующих две стандартные операции: интегрирование кинематических уравнений и умножение кватернионов.
ГЛАВА 6 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ ТВЕРДОГО ТЕЛА Задача оптимального пространственного разворота твердого тела получила практический интерес при исследовании проблем управления космическими аппаратами. К настоящему времени имеется ряд работ, посвященных этому вопросу, в которых решены некоторые частные случаи. К их числу относятся оптимизация плоского разворота вокруг одной из главных осей инерции тела и оптимизация управления разворотом быстро вращающегося тела в пространстве [18, 50, 61]. Задача оптимального разворота, на наш взгляд, является одной из самых сложных задач теоретической механики. Формализм теории оптимального управления приводит в общем случае либо к линейным дифференциальным уравнениям с переменными коэффициентами, либо к нелинейным уравнениям, решение которых в общем виде не получено. Тем более далека от завершения задача построения оптимального управления пространственным разворотом в функции фазовых координат и скорости, т. е. задача синтеза оптимального управления. В настоящей главе рассматривается задача оптимизации пространственного разворота твердого тела по быстродействию. В первых четырех параграфах исследуется задача так называемого кинематического разворота, когда управлением являются величины компонент угловой скорости твердого* тела. Эта задача решается до конца; при этом показывается, что управление по кватернионам является близким к оптимальному. Этот факт дает большие преимущества управлению, которое строится по компонентам кватерниона рассогласования. В двух последних параграфах рассматривается задача динамического оптимального разворота в постановке оптимизации разворота по быстродействию и по расходу рабочего тела, затрачиваемого на разворот. Дается решение задачи для частного случая управления тэердым телом со сферической симметрией,
§ ел] кинематический оптимальный разворот 241 § 6.1. КИНЕМАТИЧЕСКИЙ ОПТИМАЛЬНЫЙ РАЗВОРОТ. ПОСТАНОВКА ЗАДАЧИ Под кинематической задачей пространственного разворота твердого тела будем понимать задачу управления движением твердого тела, когда управляющей функцией является величина угловой скорости движения твердого тела. В этом случае уравнениями движения управляемого объекта (т. е. твердого тела) будут кинематические уравнения, в которых компоненты угловой скорости представляют собой функции управления. Очевидно, что такая постановка задачи не учитывает того факта, что в действительности движение твердого тела описывается динамическими уравнениями Эйлера (5.51) и в качестве функции управления выступают величины моментов, действующих на тело (именно такова постановка задачи динамического разворота твердого тела). Тем не менее кинематическая задача пространственного разворота имеет практическое значение. В действительности система управления пространственной ориентацией твердого тела (например, космического аппарата) построена таким образом, что всегда осуществляется управление тремя компонентами (проекциями) угловой скорости тела. Будем рассматривать положение твердого тела, определяемого связанным базисом £. Движение базиса Е относительно опорного базиса J будем задавать кватернионом А; это движение описывается кинематическим уравнением (3.11), которое запишем в кватернион- ной и координатной формах: 2А 2А»о 2Я,, Z&2 2^з = А о <дБу = — A»iOt>i — Я2Ш2 — Л3СО3, = A»oOt>i -f- Л2СО3 — = A,oOt>2 H~ ^3®1 ~~ ™ A»o(i>3 Ц" A»i0t>2 — • A,3<u2, A,,(D3, • А2С0Ь где ©г (i= 1, 2, 3) — компоненты угловой скорости движения базиса Е относительно базиса / в проекциях т оси базиса Е,
242 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 Величины ©f являются в данной задаче функциями управления. Будем предполагать, что множество функций сог(^) ограничено. Обозначим это множество символом Ее и будем считать его замкнутым: МОеН*. (6.2) Будем рассматривать движение на отрезке времени [to, Л» при этом начальное положение тела зададим кватернионом Ао, а конечное его положение — кватернионом Ат, т. е. имеем следующие граничные условия движения: А(/о) = А0, А(Г) = АТ. (6.3) Ищется управление ©*(/). минимизирующее время перехода от начального к конечному положению. Уравнения (6.1) совместно с условиями (6.2) и (6.3) полностью определяют кинематическую задачу пространственного разворота. Рассмотрим кинематическое уравнение (3.12). Очевидно, что уравнение в этой форме имеет более ограниченное применение, так как оно отражает процесс управления движением твердого тела, когда функциями управления являются компоненты проекции угловой скорости на исходный опорный базис. Исследование второй формы кинематического уравнения представляет скорее теоретический интерес. Запишем уравнение движения (3.12) в кватернион- ной и координатной формах: 2А = ©/оА, | 2А{ — AqQi -p A»3"2 — Л»2"3» I 1%2 == ^0^2 ~Г ^»1айЗ — ^3"1> I 4Л,$ === ^ойз ~Г ^2"1 — AjQg» ' где Qi (i= 1, 2, 3)—компоненты угловой скорости движения базиса Е относительно базиса / в проекциях на оси базиса L
§ 6.1] КИНЕМАТИЧЕСКИЙ ОПТИМАЛЬНЫЙ РАЗВОРОТ 243 Будем считать управление ограниченным, т. е. Qi (= El9 (6.5) причем множество В/ будем считать отличным от множества (6.2). Граничными условиями движения для этого случая будут служить условия (6.3). Перейдем к формулировке необходимых условий оптимальности управления по быстродействию, для чего используем формализм принципа максимума Понтря- гина [6, 41]. Введем вспомогательные функции фо, фь фг, фз» соответствующие фазовым переменным Яо, Яь Я2, Яз, полностью определяющим движение. Для уравнений движения (6.1) составим функцию Гамильтона 96 е = (Щ = — у Фо (Я1©! + Кщ + А,3<о3) + + у *i (^o®i + ^«з — А,зю2) + "2 *2 (^о©2 + Яз©! — Я^з) + + у Фз (А<ДОз + Я^г — Яд©!). (6.6) Функции tyi (* = 0, l, 2, 3) должны удовлетворять так называемой сопряженной системе уравнений *—«СГ- М которая в соответствии с (6.6) примет такой вид: 2фо= — ^1», — ф2<о2 — г|)3сй3, 2^1 = Фо*>1 + ^2®j — "Фз^, 2ij)2 = фоСй2 + ^ъ®\ — ^1©з, 2ф3 = Фо<о3 + ^i^ — iMh- Для определения управления имеем четыре скалярных уравнения движения (6.1), четыре уравнения (6.8) и три условия максимума, заключающиеся в том, что при оптимальном управлении функция Же (6.6) достигает максимума на множестве Ее (6.2): ^еа£ } (6.9) (/ = 0, 1, 2, 3; *=1, 2, 3). j (6.8)
$44 оптимальные Пространственные развороты [Гл. е Для восьми дифференциальных уравнений (6.1) и (6.8) имеем восемь граничных условий (6.3). Тем самым решения А,*(/), *М0 и управления со* (0 должны быть однозначно определены. Однако условия (6.9) определяют управление о>ь в функции величин \|>* и %и а уравнения (6.1) и (6.8) суть линейные уравнения, переменными коэффициентами которых являются функции соь. Отсюда видно, что непосредственно эти уравнения неразрешимы (так как нет общего решения линейных дифференциальных уравнений с переменными коэффициентами, а в данном случае нет и общего решения кинематических уравнений). Для второй формы представления задачи оптимального кинематического разворота, т. е. для уравнений (6.4), получаем (для тех же обозначений вспомогательной функции tyf) следующую функцию Гамильтона: т, = <Й) = - -i ф0 (Л А + ^А + A3Q3) + + "2"Ф1 (*<А + ^2 — A2Q3) "t" У ^2 (^0^2 + ^ А — К&\) + + j +8 (Via + *А - А, А). (6.10) Сопряженная система уравнений (6.7) для этого случая примет такой вид: 2*ф, = <ф(А + Фз^г — ^3» I ,лччх \ (6.11) 2^2= *Ф<А + ♦ А — №\> 2ф3 = ifoA + ФА — ФА- ) Управление Q& (k = 1, 2, 3) будет оптимальным, если функция Гамильтона <9#/ достигнет максимума при данном управлении, т. е. Ж, \U (t), Ь (t) Qk (01 = max Ж, [Kt (t), b (t), Qk (t)]. (6.12) Условия максимума (6.12) совместно с уравнениями (6.4) и (6.11) при граничных условиях (6.3) достаточны для определения оптимального управления и соотвег-
§6.21 РЕШЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО РАЗВОРОТА 245 ствующего движения. Однако здесь имеем ту же трудность, что и в предыдущем случае: не удается получить непосредственного решения кинематического уравнения для произвольных функций Qh(t). § 6.2. РЕШЕНИЕ ЗАДАЧИ КИНЕМАТИЧЕСКОГО ОПТИМАЛЬНОГО РАЗВОРОТА Решение задачи кинематического оптимального разворота удается получить благодаря тому, что системы сопряженных уравнений (6.8) и (6.11) для вспомогательных переменных *фг совпадают с уравнениями движения (6.1) и (6.4) соответственно*). Как нетрудно видеть из (6.8), сопряженная система может быть записана в форме кватернионного уравнения (3.11) 2*=ЧГою£, (6.13) где ЧГ= *ф0 + -ф^! -f iM2 + Фз^'з — кватернион, определяемый вспомогательными функциями. В соответствии с теоремой 3.1 можно утверждать, что, поскольку уравнения (6.8) и (6.1) являются кинематическими уравнениями для одной и той же угловой скорости ©£, функции W(t) и \(t) должны отличаться на константу V=C£oA, (6.14) где Се — постоянный кватернион. Нетрудно проверить, что (6.14) действительно имеет место. Рассмотрим для этого кватернион C£=VoA и найдем производную от него 2С/г=2ЧгоЛ-2Ч'оЛо АоЛ = = ЧГо<д£оЛ — ЧгоЛоЛо(о£оЛ = 0, которая действительно обращается в нуль. *) Можно показать, что для любой линейной системы дифференциальных уравнений X = АХ, имеющей кос,осимметрическую матрицу А, справедлив тот же результат и может быть получено решение задачи оптимального управления.
246 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б Рассмотрим теперь функцию Гамильтона Же (6.6) и представим ее в следующем виде, выделив члены при управляющих функциях: 3&Е = ^ e>i (+А — ^o^i + +2^з — +з^г) + + у со2 (t^o — Ф0А,2 + +з^1 — Ф^з) + + 2" <°з (*зАо ~ +<Аз + +i*<2 — *2^i). Введем векторную функцию р£ (/) (т. е. кватернион р£) которую определим следующими ее компонентами: Pie = +А - +Л + +2*з ~ +зЛ2> ] Р2£= *А - *<А + +зА1 ~ +А> [ (6.15) Р3£ = +3*0 - +А + * А - +2^1- ] Векторную функцию рЕ (/) будем называть сопряженным вектором управления. Можно видеть, что функция Гамильтона записывается в таком виде: ЖЕ = Т (®Л* + ®2Р2£ + ®зРз*) = Т Ш* ' Р£> (6-! 6) и поэтому условие максимума функции 5#£ на множестве Ее определяет управление шя в функции сопряженного вектора, причем вид этой зависимости будет определяться конфигурацией множества Ев- Сопряженный вектор управления определяется величинами «фг- и Яг- с помощью соотношений (6.15). Ранее было установлено, что функции ty(t) могут быть выражены через Я* (0, поскольку уравнения (6.8) и (6.1) имеют один и тот же вид и содержат одну и ту же скорость <о£. Отсюда следует, что в принципе имеется возможность выразить р£ в функции только Я<(0. Действительно, простой проверкой можно убедиться, что равенства (6.15) могут быть записаны в виде такого произведения кватернионов: p£ = vect(Ao*F), (6.17) т. е. функция рЕ есть векторная часть произведения кватернионов А и ЧГ. Однако связь кватернионов ЧГ и Л
§ 6.2] РЕШЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО РАЗВОРОТА 247 дается равенством (6.14), откуда следует, что искомое произведение равно XoW=\oCEo\ (6.18) и определяется только кватернионом А. Найдем скалярную часть кватерниона АоТ: sqal (А о ЧГ) = sqal (А о Се ° А) = sqal (А о А о CE)f= sqal Ce (6.19) (так как норма кватерниона А равна единице). Следует сказать также, что в силу однородности сопряженной системы можно выбрать кватернион ЧГ таким, чтобы норма его также была равна единице, откуда будет следовать, что и норма Се также равна единице: ||AoY||=||AoC£oA||=||C£||=||T||||A||=l. Теперь, используя равенства (6.18) и (6.19), можно найти величину векторной части произведения кватернионов Ч? и А: vect (А о ЧГ) = А о ЧГ - sqal(A о ЧГ) = А о СЕ ° A-sqal CE = = Ао(С£ —sqalC£)o A = Ao(vectC£)o А = А© сЕ ©А. Таким образом, согласно (6.17) получаем окончательно следующее основное соотношение, определяющее сопряженный вектор управления: р£ = Аос£оА. (6.20) Этим самым кинематическая задача оптимального пространственного разворота решается полностью. Действительно, условие максимума функции Же (6.9) с использованием выражения (6.16) определяет управление <о£ (t) в функции сопряженного вектора рЕ. Вектор рЕ соотношением (6.20) определяется в функции фазовых координат и некоторого постоянного вектора сЕ. Будучи подставленными в кватернионное уравнение движения (6.1), функции управления &£(t) внесут в уравнение движения те же фазовые координаты ц константу
£48 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. в сЕу выбор которой должен однозначно удовлетворить граничным (конечным) условиям движения. Таким образом, в принципе (не рассматривая вопроса об аналитической разрешимости полученных уравнений) задача решается полностью. Следует отметить, что кватернион А является двузначной функцией положения твердого тела (Л и —Л тождест^нны одному положению); согласно уравнениям (6.^ и (6.13) кватернион W также может быть двузначным. Отсюда следует, что и кватернион р£, так же как и сЕ, тоже нужно положить двузначным, т. е. допустить возможность существования двух значений +с£ и —с£, одновременно удовлетворяющих решению оптимальной задачи. Как мы покажем позднее, это предположение является весьма существенным. Найдем теперь решение задачи оптимального разворота для второй формы уравнений. Сопряженная система уравнений (6.11) для вспомогательных переменных «ф^ для этого случая совпадает с уравнениями движения (6.4) и, следовательно, может быть записана в виде 2Фа>ш,оТ, (6.21) где W — определенный выше кватернион [см. (6.13)]. В соответствии с теоремой 3.1 уравнения (6.21) и (6.4) имеют одну и ту же фундаментальную систему решений и, стало быть, функция 4T(t)4 отличается от Л(<) на постоянный кватернион, причем справедливо такое соотношение: V=AoC/. (6.22) Убедимся, что такое равенство действительно выполняется. Согласно (6.22) имеем следующее выражение для константы: Производная от нее, полученная в соответствии с уравнениями (6.4) и (6.21), действительно равна нулю: 2Су=-2ЛоЛоЛо^ + 2Ао* = |=-Ло©/оЛоЛаЧг-|-Ао(д/оЧг=0.
4 6.2] РЕШЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО РАЗВОРОТА ^49 Рассмотрим функцию Гамильтона 261 (6.10) и представим ее в таком виде: 26i = у Qi (-А,,г|>о + M>i + ^2^з — Mb) + + у Й2 (М>2 — ^2*0 + tl^3 — ^,-фз) + Аналогично (6.15) введем векторную функцию р7 (/) (т. е. кватернион р7), определяемую переменными Яг- и %, таким образом: Ри = А-о+1 - А А + л2*з - *2Лз» ] P%i = 4*2 - М>о + M>i - я1*з» | (6.23) Рз/ = Ч+з - h% + * А - M>i- I Функцию р7 (0 также будем называть сопряженным вектором управления. С его помощью функция Гамильтона может быть представлена в виде скалярного произведения функции управления ю7 и сопряженного вектора р7: Ж, - у (ЙЛ/ + °Л* + °Л|) = Т •# • рг (6-24) Поскольку вектор р7 определяется в функции Y и Л соотношениями (6.23), а кватернион Y выражается через Л равенством (6.22), то имеется возможность выразить р7 в функции только переменной A(t). Действительно, проверкой можно убедиться, что соотношения (6.23) могут быть представлены в виде такого произведения кватернионов: P/=vect(YoA). (6.25) Рассматривая полученное произведение, в соответствии с (6.22) получаем ¥оЛ = ЛоС7оЛ. Найдем скалярную часть кватерниона Т^Л: sqal (YoA)= sqal (Л о С/ о Л) = sqal (Л о Л о С/) ~ sqal О/.
250 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 Отсюда выражение для его векторной части получим в таком виде: vect(VoA) = YoA-sqalC/ = = Л о (С/ — sqal С/) о Л = Л о с/ о Л. Таким образом, имеем окончательно следующее выражение для сопряженного вектора управления: Р/ = Л о с7 о Л. (6.26) Сопряженный вектор управления (6.26) выражен в функции только фазовых координат и трех констант. Условие максимума функции Mi (6.24) определит управление ©7 в функции р7, а стало быть, и фазовых координат и констант. Подставив это управление в исходные уравнения движения (6.4), получим замкнутую систему дифференциальных уравнений, которая, вообще говоря, всегда разрешима; при этом постоянную с7 следует выбрать так, чтобы удовлетворить граничным условиям. Так же, как и в предыдущем случае, функцию р7 следует положить двузначной функцией. Найденные здесь решения кинематической задачи оптимального пространственного разворота определяют только необходимые условия оптимальности. Это означает, что все полученные решения должны быть проанализированы для выбора одного из них, имеющего минимальное значение критерия (времени разворота). § 6.3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДЛЯ СЛУЧАЯ ОГРАНИЧЕННОГО МОДУЛЯ ВЕКТОРА УГЛОВОЙ СКОРОСТИ Рассмотрим случай управления, когда граница множества допустимых управлений представляет собой сферу, т. е. когда имеет место ограничение на модуль угловой скорости. Будем рассматривать первую форму кинематического уравнения. В этом случае множество 2£ (6.2) будет определяться таким условием: со? + со22 + Ц<а>2, (6.27) где coo — величина максимально допустимого модуля угловой скорости. Такое управление, по-видимому, един-
§ 6.3] ОГРАНИЧЕНИЕ НА МОДУЛЬ УГЛОВОЙ СКОРОСТИ 251 ственное, для которого множество S/ (6.5) для второй формы кинематического уравнения является тем же самым, т. е. Q? + Q22+Q3<coo. (6.28) Условие максимума (6.9) с учетом представления функции Гамильтона в виде (6.16) сводится к требованию, чтобы было максимальным скалярное произведение вектора управления <а£ и сопряженного вектора р£, т. е., очевидно, должно выполняться равенство «>£ = Ap£, где h — коэффициент пропорциональности, и, кроме того, значение со£ должно выбираться максимально возможным, т. е. (0£=(00. Если потребовать, чтобы длина сопряженного вектора р£ была единичной (т. е. и длина сЕ также в этом случае должна быть равна единице), то написанные выше два условия максимума запишутся в таком виде: <°£ = *>оР£- (6>29) Сопряженный вектор управления р£ в соответствии с решением данной задачи определяется выражением (6.20), и, стало быть, оптимальное управление (6.29) будет определяться следующим соотношением: о£=(о0Аос£оЛ. (6.30) Следует отметить, что полученное выражение представляет собой оптимальное управление, заданное непосредственно в функции фазовых координат, т. е. имеем решение задачи синтеза оптимального управления. Величина вектора с£, равная, очевидно, начальному значению сопряженного вектора управления должна быть выбрана таким образом, чтобы удовлетворить граничным условиям движения (6.3). Чтобы получить выражения для сЕ через граничные значения кватерниона А(/), подставим решение (6.30)
252 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. в в кватернионное уравнение движения (6.1); имеем следующее: 2А = А о ©£ = А о (<о0А ос£оЛ) = (ОоС£ о А. Полученное уравнение совпадает по форме с кинематическим уравнением (3.12) для постоянного вектора угловой скорости, равного со0с£. Решением такого уравнения является функция [см. решение (3.18)] A(0 = e2<V£ °A0, (6.31) удовлетворяющая начальному условию. Чтобы эта функция удовлетворяла конечному условию, необходимо, чтобы в момент времени Т выполнялось следующее условие: Ат = ^(й^ГоА0. Из этого условия находим, что е2%СЕ =ЛтоА0. (6.32) Поскольку с£ —единичный вектор, то еТ%сет = cos ^ aj} + се sin (у со0г), откуда получаем следующее выражение для вектора сЕ (кроме случая, когда соо^ = 2я, что соответствует тождественному преобразованию): Се = \ (Ато А0— cos-5-<D07j. (6.33) siny©0rV l l Подставляя это значение в решение (6.31), находим Л(0 = = cos-rOoH 5 (At ° К—cos -о-ОоП sin -к ©оП Л0= sin -jr- ©о* ■ А0 (cos -к coq/ — sin-г со^ ctg т ЩП + Лт : , (6,34)
§ 6.3] ОГРАНИЧЕНИЕ НА МОДУЛЬ УГЛОВОЙ CKOPOGTH 268: т. е. получаем решение задачи кинематического оптимального разворота для данного случая ограничений на управление в функции непосредственно граничных условий. Интересно с помощью соотношений (6.32) и (6.33) представить функцию оптимального управления (6.30) для данного случая: ©*(*) = f2—(ЛоЛтоА0оА —cos-jo0r). sinyooor Полученный результат не зависит от того, в какой момент времени брать текущий кватернион, так как в соответствии с (6.31) и (6.32) имеем ЛоЛтоЛ0оЛ=Л0ое ***** o£>2V£ o*2V/f оЛ0=ЛооЛт. Отсюда получаем окончательно такое выражение для оптимального управления: <о£(0 = 22 (л0 о Ат - cos -r щТ). (6,35) sin^0Orv ' Таким образом, оптимальной траекторией в рассматриваемом случае управления является плоский разворот (6.34), осуществляемый с постоянной максимально возможной угловой скоростью (6.35), причем направление этой скорости определяется конечным и начальным положениями тела. Отсюда следует, что плоский эйлеров поворот твердого тела с максимально допустимой угловой скоростью является оптимальным по времени разворотом для случая, когда управлением является функция угловой скорости, ограниченная по модулю. В предыдущем параграфе было сделано замечание о том, что величину сЕ (и рЕ) следует брать двузначной. Поясним смысл этого требования. Согласно (6.30) двум знакам сЕ (независимо от знака кватерниона А) будут соответствовать различные знаки ©£ и, следовательно, разные направления вращения. Оба эти решения удовлетворяют условиям оптимальности и дают разворот соответственно на угол <оо(Г — fo)™* или <ор (J — to) = 2я — ф (О — угол разворота).
254 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ (ГЛ. 6 Из этих двух решений только одно удовлетворяет условию минимума времени разворота (кроме разворота на угол я). Соответственно этому для минимального времени разворота должно выполняться следующее достаточное условие оптимальности: <о0(Г-*о)<я. (6.36) Можно видеть, далее, что определяющий управление кватернион Ат°Ло является как раз кватернионом рассогласования (для данных двух положений тела) в задачах управления по кватернионам, рассмотренных в главе 5. Отсюда следует, что управление в кинематической задаче будет оптимальным, если скорость коррекции формируется таким образом: QK, = йшх J* sign Л0 (/ = 1, 2, 3), (6.37) Vl-Яо где Qmax — максимальное значение модуля угловой скорости коррекции. К такому управлению близко, например, управление (5.6). В заключение рассмотрим решение данной задачи для второй формы кинематического уравнения. Выше указывалось, что ограничение на допустимое управление (6.28) совпадает с ограничением (6.27). Отсюда следует, что условие максимума (6.12) с учетом функции Гамильтона (6.24) запищется в виде двух условий ©7 = Ар7, ^=©0, аналогичных условиям для первой формы кинематического уравнения. Потребуем, чтобы величина (модуль) вектора рг была равна единице; тогда оба эти условия могут быть записаны в виде *>7=<ОоР/> (6.38) аналогичном условию (6.29). Учитывая, что в соответствии с решением оптимальной задачи сопряженный вектор управления^/ определяется выражением (6.26), получаем для оптимального управления (6.38) следующее соотношение: ©7 = со0Л о с7 о Л. (6.39)
§ 6.31 ОГРАНИЧЕНИЕ НА МОДУЛЬ УГЛОВОЙ СКОРОСТИ 255 Очевидно, что вектор с1 определяется как начальное значение сопряженного вектора управления: *i = P/('o)- Для получения оптимальной траектории движения подставим оптимальное управление (6.39) в кватер- нионное уравнение движения (6.4): 2Л = ©7 о Л = ю0Л о сг Это уравнение является кинематическим уравнением [типа (3.11)] для постоянного вектора угловой скорости (о0с7. Его решением является следующая функция: Л(0 = Лооет<°°С/'. (6.40) Решение (6.40) удовлетворяет начальному условию (6.3). Чтобы это решение проходило через конечную точку Лт, необходимо соответствующим образом выбрать вектор с7. Приравнивая правую часть (6.40) в момент времени Т конечному условию (6.3), получаем откуда находим, повторяя аналогично предыдущему случаю все выкладки, что вектор с£ должен определяться таким соотношением (щТ Ф 2я): сj = z 1Л0 о Ат — cos -=■ ©о Т\. (6.41) Siny<D0r L Z J Подставляя это значение в решение (6.40), получаем точно такую же траекторию, определяемую соотношением (6:34), как и в предыдущем случае. Естественно, что результат получился тем же самым, поскольку ограничение (6.27) и, следовательно, оптимальное движение должны быть теми же самыми, хотя они могут иметь различные формальные записи в разных системах координат.
286 оптимальные пространственные разёороты [гл. в Найдем функцию оптимального управления ю7(0- Подставляя в равенство (6.39) значение вектора с7 из (6.41), получаем 01,(0 — р [ЛоА0оЛто A-cosier]. sin j щТ L J J Из решения (6.40) можно показать, что Л о А0 о Ат о Л = = Аоов2<0°Г/ oAoeAooeeV/ oe 2V/oA0=AToA0, Отсюда получаем такое окончательное выражение для оптимального управления: ©/ (0 г fАт ° Ао - cos-J- щТ] . (6.42) Очевидно, что управление (6.42) определяет тот же самый плоский эйлеров разворот, что и в предыдущем случае. Доказательством этому может также служить тот факт, что кватернионы-отображения ©7 (6.42) и ы£ (6.35) определяют один и тот же вектор угловой скорости. Действительно, можно проверить, что выполняется соотношение ®Е = А о ©/ о А, связывающее два отображения одного вектора. Для этого достаточно обратиться к проведенным выше выкладкам, из которых следует, что Л о Ао о Ат о А = At о Ао, А о Ат о Aq ° А = Aq о Ат и, следовательно, согласно (6.42) и (6.35) приведенное выше соотношение справедливо. $ 6.4. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРИ ОГРАНИЧЕНИЯХ НА КОМПОНЕНТЫ ВЕКТОРА УГЛОВОЙ СКОРОСТИ 9 Следующий случай управления имеет место, когда ограничивается каждая компонента — проекция вектора угловой скорости. Практическое значение имеет анализ
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 257 управления в случае, когда заданы ограничения на проекции вектора угловой скорости на связанный базис Е. Множество Ее (6.2) будет определяться такими условиями: К-|<Ц (/=1,2,3), (6.43) где Qi — величины максимально допустимых компонент вектора угловой скорости по связанным осям е*. В пространстве co£f множество ЕЕ будет иметь вид параллелепипеда, стороны которого равны Q*. Условие максимума функции Гамильтона (6.9) или (6.16) при такого рода области допустимых управлений сводится к требованию максимизации величины <о£ • р£> что имеет место, когда каждая компонента вектора ю£ приобретает максимальное значение в направлении вектора р£: ©«"Qisign(р£|) (/=1, 2, 3). (6.44) Обозначим векторы, идущие от начала координат в вершины параллелепипеда Ее- (т. е. по его диагоналям), через ©т (т = 1, 2, ..., 8), не оговаривая пока порядка присвоения индексов. Каждый из этих векторов получается, когда все три компоненты ю£ принимают экстремальные значения (6.43). Обозначим векторы, идущие из начала координат перпендикулярно к каждому ребру Параллелепипеда Ее, через ©^/. Можно видеть, что всего существует двенадцать таких векторов, т. е. / = 1, 2, ..., 12. Векторы ©^ суть значения вектора ю£, когда две его компоненты принимают экстремальное значение, а одна обращается в нуль. Обозначим, наконец, векторы, идущие из начала координат перпендикулярно к каждой грани параллелепипеда В£, через ю^л. Величина каждого из этих векторов равна Qi; всего имеем шесть таких векторов, т. е. /t=l, 2, ..., 6. Каждый из векторов равен вектору ю£> У которого две компоненты обращаются в нуль, а одна принимает экстремальное значение. Рассмотрим теперь условия (6.44) оптимальности управления и обсудим, какие движения эти условия выделяют. При нахождении вектора pE(f) всюду вне 9 В. Н. Браиец, И. П. Шмыглевский
258 оптимальные Пространственные развороты [Гл. в координатных плоскостей, т. е. при р Ei ф О (I = 1, 2, 3) условия (6.44) определяют такого рода движение, которое осуществляется с одним из максимальных векторов угловой скорости ©т. Если же вектор pE(t) попадает на координатную плоскость, т. е. обращается в нуль одна (или две) из его компонент, то данный случай представляет собой особое управление. Анализ особых управлений показал, что необходимо допустить следующую гипотезу (не вытекающую из принципа максимума): Г Если обращается в нуль какая-либо компонента рЕ{, то соответствующая компонента скорости со* может принимать три значения: +Qi, О, —йг. Другими словами, функция sign (p£i) в выражении (6.44) может принимать в нуле значения +1, 0, —1. В п. I § 6.7 показано, что такое допущение является весьма существенным, так как оно позволяет расширить число допустимых траекторий движения до необходимого их числа. Благодаря такому свойству функций (6.44) происходит расширение возможных движений, удовлетворяющих необходимым условиям оптимальности: во-первых, становятся возможными движения с одной из угловых скоростей щг; во-вторых, возможны движения со скоростями ю^п. Первый случай имеет место, когда вектор рЕ попадает на координатную плоскость и одна из компонент рЕ1 обращается в нуль. Согласно принятой гипотезе компонента a>Ei может быть равна +Q*, 0, —Q*, т. е. допускается движение с угловой скоростью ю^. Во втором случае вектор рЕ попадает на координатную ось, т. е. две его компоненты становятся равными нулю, в связи с чем возможно движение со скоростью &Лп (в п. I § 6.7 будет показано, что возможны другие случаи движения со скоростью ю^л). Таким образом, всего имеем m + ft + / = 26 допустимых векторов угловой скорости, и вращение с каждым из них удовлетворяет условию оптимальности. Обозначим всю совокупность этих скоростей со/, (k = 1, 2, ... ,26) и будем называть их экстремальными
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 259 угловыми скоростями. Согласно (6.44) вся траектория движения должна состоять из участков, на каждом из которых происходит вращение с одним из таких векторов угловой скорости. Вращение на каждом участке осуществляется с постоянной угловой скоростью; для такого случая движения известно решение кинематического уравнения (3.79). Это обстоятельство позволяет до конца решить рассматриваемую задачу оптимального кинематического разворота. В результате решения задачи должен быть дан ответ на такие вопросы: из скольких участков движения состоит целая траектория; какова последовательность вращений с экстремальными угловыми скоростями для реализации требуемого пространственного разворота; как сильно отличается оптимальное управление для данного случая от управления (6.37), рассмотренного в предыдущем параграфе. Прежде чем перейти к исследованию движения при управлении (6.44), сделаем несколько общих предположений. 2° Требуемый пространственный разворот, определяв- мый граничными условиями (6,3), задает как минимум одно начальное значение сопряженного вектора управления рЕ*). 3° Вектор рЕ будем считать двузначным; будем полагать, что граничные' условия движения (6.3) задают одновременно два значения вектора р£, при этом движение реализуется одним из двух значений вектора рЕ, сохраняющимся во всем последующем движении**). Качественное исследование движения. Напомним, что соотношения (6.44), (6.20) и (6.1) совместно с граничными условиями (6.3) образуют замкнутую систему уравнений, описывающих оптимальный кинематический разворот. Согласно (6.44) все движение будет состоять из участков вращений со скоростями ©&. Таким образом, угловая скорость оптимального разворота будет кусочно-постоянной функцией. Разрывы функции *) Далее будет показано, что граничные условия могут определять не одно, а несколько различных движений. **) Гипотеза 3е не является столь же наглядной, как гипотеза 2°; ее обоснование приводится в п. I § 6.7. ■ . - - 9*
260 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 угловой скорости будут происходить при пересечении вектором pt координатных плоскостей. Рассмотрим, как выполняется соотношение (6.20) для траекторий такого рода. Обозначим конечное значение кватерниона движения на k-м участке через Ал; тогда это значение будет начальным значением кватерниона на (&+1)"м участке движения, происходящего со скоростью ©ft+i. Решение кинематического уравнения движения на (& + 1)"м участке имеет вид A(^+1) = A*oe2 ft+ift+i, (6.45) где f*<f*+i<f*+i, t'k+\ — текущее время на (k + 1)-м участке движения. Значение Л(^+1) будет равно Лл+1. Для первого участка движения аналогично (6.45) имеем где Ло определяется начальным условием (6.3). Если движение начинается с первого участка и кончается &-м участком, то согласно (6.45) получим следующее значение конечного кватерниона: -• t -•t Лт=Л0О£2 11о...О£2 * bf что соответствует теореме (2.4). Пусть имеем начальное значение сопряженного вектора управления РЕ0 = сЕ. В конце первого участка движения он будет определяться согласно соотношению (6.20) таким выражением: 1 * 1 * pE\ = Xl°CEo/i\ = e o\oCEoX0°e • Примем величину Л0ос£оЛ0 за рЕ0, тогда 1 , 1 4 Р£1 = е °РЕ0°е ' Это конечное значение для первого участка будет начальным значением для второго участка движения, и,
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 261. следовательно, в конце второго участка движения будем иметь рЕ2=в °РЕ\°е ' Продолжая применять эту формулу, получаем следующее значение вектора р£ в конце движения: -—ю t -—• t — • t 1© f = AToc£o AT. Отсюда можно видеть, что соотношение (6.20) остается справедливым и для кусочно-непрерывных функций угловой скорости. Величина i* t — • t е2 l l ° ... о е2 k k представляет собою результирующее движение. Можно видеть, что она однозначно определяется граничными условиями (6 3). Обозначим ее следующим образом: A2 = e2*i io...o^eu = A0oAT. (6.46) Данный результирующий кватернион определяет и соотношение между начальным и конечным значениями сопряженного вектора управления. Р£Т==^2°Р£0°А2- (6.47) Согласно гипотезе 2° величина As должна определить начальное значение вектора рЕ0. Проводя качественное исследование задачи, мы пойдем обратным путем: будем считать, что задан вектор р^ и будем анализировать получающиеся движения и резуль ирующий кватернион. Пусть величины Q* (6.43) равны, т. е, областью допустимых управлений Ее является куб со стороной 2Q*. Без ограничения общности можем положить Qi= 1;при этом куб Ее окажется вписанным в сферу радиуса, равного \/3(ри- 6.1). В соответствии с соотношениями (6.44) и гипотезой 1° относительно функции sign(0) движение будет происходить с угловыми скоростями, равными:
262 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 Рис. 6.1. Рис. 6.2.
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 263 а) полудиагоналям^ куба &т— величина каждой угловой скорости равна 1^3; б) полудиагоналям квадратов (граней куба) юг/ — величина каждой угловой скорости равна У2\ в) половине ребра куба &Лп—величина каждой угловой скорости равна 1. Введем нумерацию скоростей так, как это показано (правда, не для всех <аь) на рис. 6.1. Будем считать, что начальное значение вектора р£0 задано и рассмотрим различные случаи движения, определяемые его положением. Приведем результаты такого анализа. Из рисунка 6.2 видно, что на сфере существуют восемь областей 0$т (т = 1, 2, ..., 8). Если вектор р^ находится в такой области, то движение выполняется со скоростью ©т и в результате движения вектор рЕ не изменяет знака своих компонент. Действительно, при вращении по конусу в любую сторону вектор р£, находясь в области д$тУ не пересекает и не касается координатных плоскостей. Границей этого случая движения будет такое положение вектора р£0, при котором произойдет касание координатной плоскости и, так как областью допустимых управлений является куб, произойдет каса* ние одновременно трех плоскостей. Такую границу буг дем называть сепаратрисой и будем считать ее не принадлежащей области &т- При любом расположении вектора р^ внутри области 9Sm реализуется только один случай движения, когда результирующее вращение имеет один участок движег ния со скоростью От. Соответствующий кватернион буг дем обозначать Ат- Результирующий кватернион в данном случае будет определяться только одной составляющей: AW = *T4 (6.48) Множеству точек положения конца вектора р£0 на сфере и в области S$m соответствует тот же случай движения, что и при совпадении векторов р£0 и <от. Отсюда следует, что область SSm эквивалентна одной точке, определяемой пересечением вектора а>т со сферой. Характерной особенностью гэтой .точки является то, что при
264 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. S- прохождении через нее вектор pE(t) не меняет своего положения в результате определяемого им движения (вектор остается постоянным). Точки такого рода будем называть стационарными. Можно видеть, далее, что на сфере существуют шесть областей зФп (/г = 1, 2, ... ,6), отличных от областей S$m и разделяемых от них сепаратрисой (сепаратрису также будем считать не принадлежащей области st-п). При нахождении в каждой из областей $&п вектор рЕ может достигать и пересекать координатные плоскости; в связи с этим именно в этих областях возможны движения с различными угловыми скоростями. Скорости вращения при этом суть ©т, а последовательность смены скоростей и длительность каждого участка движения с постоянной скоростью определяются положением вектора pEQ. Типы движений, возникающих при расположении вектора р£0 в области зФПу будут исследованы далее. При нахождении вектора р^ на сепаратрисе имеют место особые случаи движения, возникающие тогда, когда вектор рЕ попадает в точки Vi (см. рис. 6.2); при этом обращается в нуль одна компонента этого вектора. В соответствии с гипотезой Г значение функции sign(O) в этих точках может быть равным + 1» 0» —1- В тех случаях, когда значение sign(O) равно ± 1, угловые скорости вращения согласно (6.44) будут равны одной из величин ©т, и вектор рЕ в результате вращения с такой скоростью покинет точку Vi. Однако если значение функции sign(O) будет равно нулю, то оказывается возможным участок движения со скоростью <агг При таком движении вектор рв (проходящий через точку 9?i) совпадает с вектором ©^ и, следовательно, не меняет своего положения в результате движения. Таким образом, мы имеем еще один случай стационарной точки: при прохождении вектора р£0 через точку Vi и при значении функции sign(O) =0 движение состоит из одного участка вращения со скоростью юл. Соответствующий кватернион обозначим через А^: Aw=e7X (6.49)
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 265 Имеется еще один тип стационарной точки, в кото* рой может реализоваться движение, состоящее из одного участка. Эта точка находится в центре области s&n> в точке пересечения сферы с координатной осью. Если вектор р£ проходит через эту точку, то могут обратиться в нуль две его компоненты. В соответствии с гипотезой Г управление (6.44) допускает при этом вращение со скоростью &Лп. Такое вращение не изменяет вектора р£, т. е. также является стационарным. Обозначим кватернион вращения со скоростью &Лл через \Лп: \Лп = е!*<*п\ (6.50) Итак, мы показали, что существуют такие положения вектора р£0 на сфере, которые определяют движение с любой из экстремальных скоростей ©ь. При положении вектора р£0 вне этих точек в областях st>n и на сепаратрисе реализуется движение, имеющее несколько участков вращения с экстремальными скоростями. Проведем классификацию возможных движений в зависимости от числа участков и последовательности угловых скоростей вращения. Отметим сначала рассмотренные случаи стационарных вращений, когда результирующее движение состоит из одного участка. Имеем следующие типы движений (траекторий): I As = Am [при положении вектора р£0 в области 9$т см. (6.48)]; II Л2 = А^л [при положении вектора р^ в точках пересечения координатных осей со сферой; см. (6.50)]; III А2 = А$г/ [при положении вектора р^ в точках 9$ см. (6.49)]. Рассмотрим теперь случай, когда вектор рт располагается в области зФп. Для определенности (без уменьшения общности) будем считать, что вектор р£0 располагается в области s&i в первом квадранте, который образован положительными направлениями осейеье2, е3. Получаемые траектории вектора р^ предстазлецы Щ
266 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ4 fr рис. 6.3. Заметим, что при нахождении вектора р^ в области s4-n всюду, кроме центра этой области, движение происходит только со скоростями ©т. Действительно, даже при попадании вектора р£ на координатную плоскость, когда обращается в нуль одна его компонента, вектор р£ не остается на этой плоскости, а пересекает ее. Рис. 6.3. В качестве примера рассмотрим случай прохождения вектора рЕ через плоскость 6263 (см. рис. 6.3). В квадранте 6\6263 движение происходит со скоростью ©ь в результате чего вектор р£ попадает на плоскость е2е3 и компонента р£1 обращается в нуль. Согласно гипотезе 1° функция sign(O) принимает значения +1 или 0, или — 1, и в этих случаях движение будет происходить со скоростями ©ь Щ\ или ©2 соответственно. Во всех случаях вектор р£ должен пересечь плоскость е2е3. Согласно рис. 6.3 имеем следующие типы движений: IV As = А, о А2; V As = Aj о А2 о А3; VI As = А! о А2 о А3 о А4; VII As = А, о А2 о А3 о А4 о Ai. Возможен случай, когда конец дуги А{ (т. е. вектора р£т) попадает в точку р£0; такой случай мы назо*
§ в.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 267 вем замкнутым циклом. Очевидно, что возможно дальнейшее увеличение числа участков, когда траектория становится длиннее одного замкнутого цикла и образует двойной цикл и т. д. (число участков может возрастать неограниченно). Ввиду того, что любая последовательность вращений должна соответствовать заданному повороту As, в принципе увеличение числа участков возможно только при уменьшении каждого из них, что имеет место при приближении вектора р£0 к центру области s&3. Если вектор р£0 расположен вблизи центра, то движение будет состоять из бесконечно большого числа бесконечно малых вращений, т. е. будем иметь так называемый скользящий режим. Результирующая скорость такого движения будет равна ю^3» Можно видеть, что получаемый случай стационарного вращения (6.50) есть предел бесконечного числа циклических движений, стремящихся к траектории типа II. Отсюда же следует, что вращение (6.50) является обособленным и не может стыковаться с другими вращениями*), в отличие от вращений (6.48) и (6.49). Покажем, что на любой из определенных выше траекторий движения число произвольных параметров не превышает трех, т. е. того числа, которое необходимо для задания произвольного разворота твердого тела. Очевидно, что траектории, состоящие из пг участков, имеют m свободных параметров (углов вращений). Отсюда следует, что траектории, состоящие из одного, двух и трех участков движения, однозначно определяются результирующим кватернионом Аз. Тем не менее условия максимума (т. е. условия непрерывного движения вектора р£) налагают ограничения на величины углов вращений. Можно видеть, что на траектории типа V должны выполняться неравенства 02><>1, *2>*3, *2<Х' (6.51) откуда следует, что оптимальной может быть только траектория, имеющая наиболее продолжительный сред* ний участок движения. Если условия (6.51) выполнены, *) В п. I § 6.7 рассматривается другая гипотеза, при кото* рой движение типа II может переходить в другие.типы движении.
268 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ, в то любому случаю разложения движения Az на три вращения Ат может быть сопоставлена траектория движения вектора р£. Для траектории типа VI имеем длину второго участка, равную длине третьего, а число свободных параметров также равно трем *2 = 'в'з <~з~» *i ^ *2 = *з» Ф4^Ф2~Фз. (6.52) Аналогичный случай имеет место для пяти и более участков движения. Рассмотрим, наконец, типы движений, возникающих при нахождении вектора рЕ0 на сепаратрисе (рис. 6.4). В этом случае возможны движения, состоящие из одного участка, т. е. обсуждавшиеся ранее траектории типа I и III. Можно видеть, что если вектор рЕ проходит через точку V\9 а функция sign(O) не принимает нулевого значения, то может быть реализована траектория типа IV. Однако, в отличие от предыдущего случая, в данной траектории возможны участки движения с углом вращения, превосходящим -^-. По этой причине выше мы не налагали ограничений на углы вращений для траектории типа IV. При дальнейшем движении вектора р£
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 269 при этих же условиях может реализоваться траектория типа V с углом 02=— и последующие типы траекторий. Однако, как будет показано далее, траектории, содержащие более двух участков вращений с углом пово- рота -J-, дают угол результирующего вращения больше я; в связи с этим в первом соотношении (6.52) стоит знак строгого неравенства. Новым типом траектории для случая, когда вектор р^ находится на сепаратрисе (см. рис. 6.4), будет следующая траектория: VIII Л2 = А1оЛл. Данная траектория возникает, когда при попадании вектора р£ в точку 92 \ функция sign(O) принимает значение нуль. Пусть, далее, вектор р^ находится в точке 9*1 и ему соответствует вращение (6.49). Однако если допустить, что по истечении некоторого времени функция sign(O) меняет свое значение с 0 на + 1, то такому случаю будет отвечать траектория IX As = A^i о А1# Следующей траекторией такого типа будет траектория X As = Aj о A^i о А{. Если после нулевого значения функция sign(O) примет значение —1, то такому случаю будет соответствовать траектория А2 = Л?1°Л2, относящаяся к типу IX. Однако, если движение начинается с вращения со скоростью ©ь имеет место еще один тип траектории: XI As= Ai e AffioA2. Рассуждая аналогичным образом, можно получить далее такие типы траектории: XII As = A^i о А2 о А^2', XIII As = Aj о A?i о А2 о А^2; XIV Ах = А! о А?, о А2 © А?2 ° А3. В этих трех случаях угол вращения $2 (кватернио- на Л2) равен -§-. Дальнейшего увеличения участков
270 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛа б движения быть не может, так как это привело бы как ми- 2л нимум к двум вращениям на угол —, что в сумме даст угол Os, превосходящий я. В п. II § 6.7 показы- 2я вается, что траектория типа XII при 02 = ~ эквивалентна траекториям типа VIII и IX, т. е. Л$л о Л2 о Л^2 = Afri °А2 = А2о Л£2, (6.53) причем на траектории типа XII происходит сложение дуг вращений Л^ч и А?2, а именно: <Kri = <Ьп + ^2 = ^2. Из этого свойства траектории типа XII следует, что траектория типа XIII эквивалентна следующим траекториям: As = Aj о A^i о А2 ° А^2 = Ai о A^i ° А2 = Ai о А2 ° А^2. В первом случае, очевидно, имеем траекторию типа XI, а второй случай определяет новый тип траектории, который также обозначим номером XIII: XIII As = Aj о А2 о А^2, ^2 = — (имея в виду, что при щ = -§- эта траектория эквивалентна траектории типа XI). К этому же типу траектории отнесем траекторию такого рода: XIII As = A?i о Ai о А2, -&!= — . Аналогичным образом получаем, что траектория типа XIV сводится к такой: XIV Ах = Aj о A#i о А2 о А3=А! о А2 о А?2 ° А3, <6vi=flv2, поскольку всегда d2 = -y-. Итак, мы определили 14 типов возможных траекторий движения. Можно видеть, что число свободных параметров на каждой траектории типа VIII—XIV не превышает трех, т. е. того числа параметров, которое однозначно (при заданных направлениях вращения) определяется заданным результирующим поворотом As.
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 271 Отсюда следует, что все составляющие вращения для каждого типа траекторий могут быть определены по величине As. С другой стороны, если задано результирующее вращение (6.46), то ему, вообще говоря, может соответствовать несколько (из числа перечисленных) траекторий, удовлетворяющих условиям оптимальности. Этого следует ожидать, исходя, например, из того, что условия оптимальности являются только необходимыми условиями; условия же выбора из всех данных траекторий наиболее короткой будут достаточными условиями оптимальности. Чтобы перейти к анализу этого вопроса, нужно установить, сколько из перечисленных выше 14-ти типов траекторий может существовать для заданного результирующего кватерниона. Пусть кватернион As определяется углом поворота Os и вектором gs (1.11); последний задает точку на сфере (точку пересечения вектора £z со сферой). Трем независимым параметрам соответствуют угол Os и два параметра — координаты вектора Ss (мы будем определять их величинами yi» Y2 и уз — направляющими косинусами вектора £s). Рассмотрим области на сфере, в которых будут находится концы векторов £s для каждого из 14-ти типов возможных траекторий. Траектории типа I, II и III имеют один свободный параметр, а именно, угол вращения, который должен быть равен Os. По этой причине такие траектории имеют на сфере только одну точку (т. е. областью их существования является точка). Траектории типа IV, VIII, IX, XII, состоящие из двух участков, имеют по два свободных параметра и потому определяют на сфере линию, на которой располагаются концы векторов А2. Все остальные траектории имеют на сфере конечные (по площади) области. Эти области, естественно, ограничены линиями, которыми будут некоторые граничные случаи данного движения. Каждый такой граничный случай возникает при переходе от одного типа движения к другому. При этом условие такого перехода и является дополнительным условием, уменьшающим число свободных параметров с трех до двух, чему соответствует линия на сфере.
272 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 Покажем, что такие граничные случаи действительно имеют два свободных параметра, т. е. определяют линию на сфере. Так, например, область траектории типа V ограничивается с одной стороны случаями, когда Oi = fb или дг = ^з (число свободных параметров при этом действительно равно двум); эти случаи определяют границу перехода между траекторией типа V и траекторией типа VI. С другой стороны эта область ограничена случаями fti = 0 и 03 = 0, т. е. траекториями типа IV. Область траектории типа VI ограничена указанными выше границами с траекторией типа V (что имеет место, когда на траектории типа VI выполняется условие Oi = 0 или ,6,4 = 0); с другой стороны этой области границы определяются случаями 02 = Оз = 04 или Oj = 02 = О3 (эти границы отделяют данный тип траектории от траекторий типа VII). Траектория типа VII от последующего типа траекторий отделяется такими границами: d2 = %=i&4=z'^i +*ь 02=01='&3 = *4 и 02=«3 = *4 = ^1. Траектория типа X имеет только две границы: первая определяется условием <h = 0, когда границей траектории типа X является траектория типа IX, а вторая — условием ,&[ = 0, когда границей является траектория типа VIII. Случаю же O^i =0 соответствует траектория типа I, т. е. одна точка, в которую сходятся обе границы — траектории типа VIII и IX (при О-л = 0). Траектория типа XI имеет следующие границы: траекторию типа IV при 0^1 = 0 и траекторию типа VIII или IX при <h = 0 или 02 = 0. В случае, когда угол ft2 2я достигает значения -у, получаем границу между траекторией типа XI и траекторией типа XIII (в последней следует положить Oi = 0). Иного типа граница существует при'&1 = -п-, когда аналогично (6.53) имеем вследствие чего получаем вторую модификацию траектории типа XIII: Дз = А^4 ° А| о А$.
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 273 Траектории типа XIII и XIV существуют только при больших углах ds и области их существования следующие: траектория типа XIII имеет два свободных параметра, т. е. является линией (границей), отделяющей траекторию типа XI от траектории типа XIV. Таким образом, можно построить все области существования для каждого типа траекторий. Этим определяется, какая из траекторий (или какие несколько траекторий) осуществляет заданный разворот As. Если в данной точке существует несколько траекторий, то необходимо из них выбрать наиболее короткую. Тем самым будут даны ответы на все вопросы поставленной задачи: будут определены угловые скорости вращений и их последовательность, число участков вращений с предельно допустимыми скоростями и их время разворота. В заключение сделаем следующее замечание. Условие (6.47) определяет следующие два соотношения, позволяющие найти р£0 и р£т: угол между векторами Х2 и р£0 равен углу между векторами А2 и Pet* a ДВУ" гранный угол между плоскостями, образованными соответственно векторами А<2 и р£0 и векторами Ц. и. р£т равен ds. С другой стороны, мы видели, что на любой оптимальной траектории однозначно определяются длины дуг составляющих вращений; при этом положение векторов р£0 и р£т задается однозначно. Казалось бы, что приведенные выше два условия являются лишними или же число условий для определения положения векторов р£0 и р£т больше, чем требуется. Оказывается, что на оптимальных траекториях эти два типа условий, определяющих положение векторов р£0 и р£т, совместимы. Отсюда, в частности, следует такой любопытный факт: на траектории замкнутого цикла VII имеет место равенство что согласно (6.47) может быть тогда и только тогда, когда вектор А,2 направлен по вектору р£0. Можно видеть, что возможно и дальнейшее увеличение числа участков траектории, ведущее к появлению двойного цикла. В этом случае, если первый «оборот» вектора р^ (т. е. первый цикл) заканчирается в момент
274 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ., 6 tu имеем P£('l)™p£0» и, следовательно, вектор Х2 (t\) также направлен по вектору р^о. А так как для двойного цикла результирующий кватернион может быть представлен как ^z(T) = Xz(ti)oXz(T-tx) и As (Г) и As (t{) имеют направление р^о, то и As (Г — t{) имеет то же направление и его угол вращения [как и As(^i)] равен половине угла ds. Аналогичное разбиение имеем для трех-, четырехкратного цикла и т. д. Пределом таких циклов при увеличении их числа до бесконечности и уменьшении каждого участка движения до нуля будет скользящий режим со всеми четырьмя скоростями (в данном случае ©1э со2, Щу Щ), эквивалентный стационарному случаю вращения со скоростью ю^з- Малые повороты. Случай малых поворотов интересен тем, что позволяет найти аналитическое решение для любого типа траектории. Мы подробно проведем это исследование, чтобы пояснить на примере методику построения областей для каждого типа траекторий. Приведем выражение для кватернионов, являющихся решениями кинематических уравнений со значениями угловых скоростей (6.44) в порядке их расположения, указанного на рис. 6.1. Для скоростей <ат согласно (6.48) имеем (приведем только первые четыре решения) A2 = cos^+~e,^ + e8sin^, (6.54)
§ бг4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 275 Для скоростей ыЛп согласно (6.50) получаем такие решения: АЛ1 = cos -^- + ех sin~o— \Л2 = cos —иг- + е2 sin —sr- A^3 = cos^- + e3sin-% (6.55) (приведены первые три решения). Для скоростей ©^ приведем также решения (6.49) для первых трех значений скорости: Ф *i A^i = cos -5— «'г A^2=cos—5- + g2 ■+ g3 - gi + g: ^2 # sin- tfl sin- ■ЧГ2 A^3 = cos J?3 - g2 + e3 ^3 — F= Sin—o— Г2 (6.56) Будем считать, что углы дь всех составляющих кватернионов малы, так что можно пренебрегать их произведениями. В этом случае, во-первых, угол результирующего поворота ds будет также мал; во-вторых, при умножении кватернионов малых вращений будет происходить сложение их векторных частей (см. § 3.1). Рассмотрим траектории типа IV—VII, существующие, когда вектор рЕ находится в области «я£п. Исследование начнем с траектории типа IV. Согласно (6.54) для малых углов дь получаем для малого угла ds имеем также А2 ~ 1 + у (Yi*i + Y2<?2 + Уз*з) *s. Приравнивая компоненты кватернионов, имеем Yi^z—pf (♦!-♦»). Y2*s = Y3^ = -p=-(0I + *2).
276 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б Отсюда видно, что результирующий кватернион может располагаться только на дуге сферы, образованной ее сечением с плоскостью, для которой Y2 = Y3- Этого и следовало ожидать, так как сумма двух векторов в! и в2 может дать результирующий вектор, находящийся в плоскости, образованной этими векторами. Разрешая полученные равенства, найдем величины углов составляющих вращений в функции кватерниона As: Условия положительности этих углов определяет следующий отрезок дуги: Yi + Y2>0, Y2>Yi> Y2=Y3- (6.57) Именно на этой дуге может располагаться конец вектора кватерниона As для данного типа траекторий. Рассмотрим далее траекторию типа V. Аналогично предыдущему случаю, имеем такое выражение для результирующего кватерниона: откуда Yi<b=-p=-(e,-e2-#3), Узв2=-р=-(а, + 02 + Оз)- Разрешим эти уравнения относительно углов О*: *3=l^.ds(Y3-Y2).
§6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 277 Условия положительности углов вращения Оь, а также условия (6.51) определяют следующую область на сфере, в которой существует рассматриваемое движение, состоящее из трех участков Yi + Y3>0» Y2>Yi, Ya>Y2, J Y2 — Yi > Yi + Y3> Y2 — Yi > Ya — Y* i Очевидно, что каждое из этих неравенств определяет границу, являющуюся пересечением сферы с такими плоскостями: Yi + Y3=0> Y2 = Yi» Y3=Y2, Y2 = 2Yi + Y3, 2y2=Yi + Y3» т. е. все границы суть дуги большого круга (все плоскости проходят через центр сферы). Указанные пять Рис. 6.5. границ представлены на рис. 6.5, где на плоскость развернута полусфера. Неравенства (6.58) выделяют заштрихованную область. Как видно из рисунка, существенными являются только четыре границы [а именно: первое, третье, четвертое и пятое условия (6.58)]. Первые три условия (6.58) тождественны условиям (6.57) и определяют ту границу, при подходе к которой один из трех участков движения обращается в нуль. Отсюда следует, что границей области траектории типа V с одной стороны являются линии типа (6.57), т. е. линии
278 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ, в траекторий типа IV. Следует ожидать, что другие две границы [четвертое и пятое условия (6.58)] будут определять переход к траекториям типа VI. Внутри самой области траекторий типа V везде выполняются строгие неравенства (6.51) и углы Фь Фг и дз положительны. Обратимся к траекториям типа VI. Производя подстановку величин кватернионов (6.54) в выражение для результирующего кватерниона, получаем 123 2f3 l 2VH 2^ + i?l *3+ 2^3 °4' Приравнивая элементы при единицах eit получаем Yl*2 = у= (*! - *2 ~ *3 + *4), Y2*2 = —?==• (*1 + *2 — *3 — *4)» Y3*2 = -p^(*1+*2 + *3 + *4), и второе условие (6.52) дает еще одно равенство *2 = *3» благодаря которому данные уравнения разрешимы относительно углов составляющих вращений: *, = ££<M2Y2 + Yi + Y8). *4 = 2t-^(y. + Y3-2y2). Требование положительности углов fy, fo, Ф3 и d4, a также условия (6.52) определяют такие границы области траекторий типа VI: 2y2>Yi + Y3. 2y2 + Yi + Y3>0. Ys^Yi. 1 (6—. Yi + Y2<0» Yi>Y2- J
% 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 279 Данная область и границы (6.59) представлены на рис. 6.6. Видно, что первая группа условий (6.59) определяет границы [см. (6.58)] с траекториями типа V, тогда как вторая группа задает границу с траекториями того же типа, состоящими из другой последовательности вращений. Последнее утверждение следует из того, что траектории типа VII эквивалентны траекториям типа VI, так как малые повороты переставимы: As=Aj о А2 ° А3 ° А4 о А{ = Ai • А' о А2 ° А3 ° А4, и данная траектория совпадает с траекторией типа VI с учетом того, что первый угол вращения равен*! + О1. Окончательная картина областей траекторий типа IV—VII представлена на рис. 6.7. На рисунке приняты такие обозначения: каждая область и граница отме* чены соответствующей траекторией, однако индекс некоторых кватернионов обозначен жирной цифрой. Это означает, что угол вращения данного кватерниона меньше предельно возможного; например, Л20Л30А4 означает, что #2 < *з и §4 < Оз- Границам областей соответствует дополнительное условие, уменьшающее число свободных параметров до двух, что нашло отражение в обозначениях; так, граница Лз° Аз °Ai соответствует
280 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. в траектории, для которой fy = #3 > *<*; она разделяет области A2°A3°A4°Ai и А2°А3°А4. Рис. 6.7 позволяет проиллюстрировать все положения относительно областей и границ движения, высказанные при качественном исследовании. Рис. 6.7. Представленные на рис. 6.7 области движений соответствуют траекториям, получаемым при движении вектора р£ в области «я£з. когда он «обходит» точку е3 (см. рис. 6.2). Точно такие же траектории и соответственно картины областей траекторий типа IV—VII существуют в любой области s&n. В любом случае достаточно построить разбиение на области движений только в зоне, например, зФ$?\91$?2 (рис. 6.8) или даже в ее половине •я£з^1^2, так как все остальные зоны сферы адекватно расположены относительно трехгранника и векторов скоростей вращения и, следовательно, имеют точно такое же разбиение на области движений, как и зона
$ 6.4) ограничения на компоненты угловой скорости 28t Можно видеть, что области траекторий типа V и VI и границы IV, представленные на рис. 6.7, полностью покрывают именно талую зону. Таким образом, движение типа IV, V и VI имеет области, полностью покрывающие всю сферу. Отсюда следует, что траектории типа IV, V, VI позволяют осуществить произвольный малый разворот. Найдем время выполнения разворота. Величина угловой скорости ©т равна У^З; отсюда следует, что время движения будет равно сумме всех углов составляющих движений, деленной на |^3. Используя полученные зна* чения углов для каждого типа траекторий IV—VII, получаем 'IV = b+J, ,d„ ll *2Y2 = = ft2Y3> v Кз = *2Y3» Tyi= 7уц = = ^1 + ^2 + ^Э + ^4_ V~3 ^2Y3. (6.60) Рис. 6.8. т. е. на всех траекториях время движения при одном и том же угле fhs максимально и равно Фг при положениях А2 в точках зФп и равномерно убывает до значения Фг/у^ в точках <&1 и до значения Фг/У'З в точках &т. Рассмотрим теперь другие возможные траектории. Стационарным траекториям типа I—III соответствуют точки на сфере (6.48) — (6.50). Можно видеть, что время движения по этим траекториям совпадает со временем движения по траекториям типа IV—VII; в этом смысле все эти траектории являются оптимальными и движение возможно по обоим типам траекторий. Траектория типа VIII и эквивалентные ей траектории типа IX и X (в силу коммутативности малых
282 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 вращений) определяют для малых углов fy и#^ такое движение [согласно (6.54) и (6.56)]: ^♦i+Tf*»1'*6*"-^ Yivs = Y2*2 = -гт= v, + —f= Ь-еи Уз*2 — tt=- vi, откуда получаем O,= V^vxY3>0, vjfl=V^"v2(Y2-Y3) = = l/2vS(Yl-Y3)>0. Такие траектории существуют на следующей кривой на сфере: Y2 = Yi>Ya и время движения по таким траекториям будет равно Туш - Та = ГХ = -р= + -Щ = vsYl = v2Y2- Поскольку областью существования таких траекторий является как раз граница симметричных зон (кривая #2^1 на рис. 6.8), можно видеть, что на этой границе возможна траектория типа IV с точно таким же временем движения. Рассмотрим траекторию типа XI. Для малых углов согласно (6.54) и (6.56) имеем Ax-A1oAyioAg.»l+ 'l + *LJ"**,+ 2\ГЪ 2 г 2j/li откуда Yi«i=-pT(v,-vS) + -p=-«jrb Y2vS=^=-(v1+v2) + -j7^v?1, Y3^ = -p=-(*i+v2).
$6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 283 Разрешим данные равенства относительно углов вращений: *i = /30* (Y3 + Yi - Y2) = ^3 *2у3> *2=/3*2(y2-Yi) = 0, Область существования данной траектории определится условиями Y3>0, Y2 = Yi. Y2>Y3. Данная область представлена на рис. 6.9. Как видно, она является границей области для траектории типа V (это — область А6 о Aj о А2, получающаяся при движении вектора р£ в области $£г). Время движения по траектории типа IX равно Txi- L "Т=- — ЗД» Рис. 6.9. Гз V~2 т. е. совпадает со временем движения по траектории типа V [см. (6.60)]. Траекторий типа XII—XIV для малых углов не су- ществует, так как для них v2=-g-. Итак, найдены все области существования оптимальных разворотов для малых углов. Дадим теперь ответ на последний вопрос: насколько найденное оптимальное уравнение отличается от управления по компонентам кватерниона (6.37)? Пусть А2 располагается в области, ограниченной жирными дугами (см. рис. 6.7). Можно'видеть, что этому случаю соответствует прохождение вектора Xj через одну грань куба (6.43). В этом случае для управления (6.37) величина максимальной угловой скорости будет равна «o^Ya^ = 1/Ys, откуда следует, что время разворота на уголвг
284 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ Ц71. в при таком управлении будет равно Т = узФ£, т. е. совпа* дает со временем оптимального разворота (6.60). Таким образом, в первом приближении при малых углах разворота управление (6.37) является оптимальным и для ограничений типа (6.44). Если учесть величины второго порядка малости, то рассмотренные оптимальные развороты все же «короче», чем вращение типа (6.37). Ниже будет показано, что при больших углах эта разница будет заметной. Произвольные углы разворота. Как было показано на примере малых углов вращений, процесс решения задачи сводится к построению на сфере областей существования каждого типа траекторий и определению достаточных условий оптимальности. Случай, когда составляющие вращения представляют собой произвольные углы, является существенно более сложным и его не удается решить аналитически. В любом случае можно составить уравнения, выражающие величины X^i (i = = 0, 1, 2, 3) результирующего кватерниона и функции углов составляющих вращений для каждого типа траектории, однако обращение этих равенств в произвольном случае невыполнимо. Для решения задачи мы использовали метод построения границ областей. Каждая граница области определяется тем, что первое и последнее вращения приобретают свое максимальное или минимальное значение; при этом для любого типа движения число свободных параметров не превышает двух. Решение строилось путем расчета на ЦВМ следующей задачи: один параметр (угол одного вращения) принимает фиксированное значение; второй выбирается таким образом, чтобы обеспечить требуемый угол результирующего поворота Os'» этим определяется одна точка на сфере. Изменяя первый параметр (угол первого вращения) от минимального до максимального значения, получаем линию на сфере — границу области. Расчеты выполнялись для четырех значений угла Фз» равного IP Т' Т" и я* РезУльтаты решения представлены на рис. 6.10—6.15 в зоне на сфере с обозначениями, аналогичными представленным на рис. 6.7. На всех рисунках на плоскость развернута полусфера; пунктиром представлены границы симметричных зон.
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 285 На рис. 6.10 представлены зоны для случая, когда угол <h: = у. Как видно из рисунка, для такого вращения наибольшие области существуют при положении вектора р£0 в зоне s&z и, в частности, для траекторий типа V. На рисунке представлены границы этих областей, с одной стороны состоящие из траекторий типа IV, а с другой стороны отделяющие эту область от траекторий типа VI. Траектории типа VI занимают узкие области вдоль координатных осей; ближе к центру (е3) находятся их границы с траекториями типа VII; представлена также траектория замкнутого цикла. Как видно из рисунка, внутри и на границе цикла существуют одновременно траектории типа VI и траектории, состоящие из большого числа участков (типа VII, замкнутый цикл и т. д.). Однако расчеты показали, что в целом оказывается справедливой такая гипотеза: 4° Оптимальными являются траектории, состоящие из меньшего числа участков.
Рис. 6.11. Рис 6,12.
$ 6.4] ОГРАНИЧЕНИЙ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 287 Вне траекторий типа V некоторую область занимают траектории, получаемые при нахождении вектора р^ на сепаратрисе, т. е. траектории типа X и XI, ограниченные траекториями типа VIII, IX и IV. Можно видеть, Рис. 6.13. что везде осуществляется непрерывный переход от одного типа движения к другому. По мере увеличения угла вращения Os (см. рис.6.11 для Os =у и рис. 6.12 для -e,s = -j-j происходит уменьшение областей, определяемых движением вектора рЕ в зоне s&z, и расширение областей сепаратрисы (заметим, что при малых углах последние области вообще отсутствуют). При этом происходит вначале уменьшение областей траекторий типа VI, а затем они вновь расширяются. Угол ftz = -r- является предельным углом,
288 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ (ГЛ. б для которого область траекторий типа V подходит к точкам <Dm. С другой стороны, при Os^-o- не существует траекторий типа XII—XIV. Рис. 6.14. Особое место занимают траектории для угла &ъ = п. На рис. 6.13 представлены области, получаемые при нахождении вектора р£0 в зоне Ж*. Как видно из рисунка, произошло дальнейшее расширение зон траекторий типа VI и сужение областей траекторий типа V; появились также зоны областей траекторий типа VII. Траектория замкнутого цикла стала максимальной, однако в целом область данного типа траекторий сильно сократилась. С другой стороны, на рис. 6.14 представлены области траекторий, получаемых при движении
§ 6.4] ОГРАНИЧЕНИЯ НА КОМПОНЕНТЫ УГЛОВОЙ СКОРОСТИ 289 вектора р£ по сепаратрисе; как видно из рисунка, эти области покрывают всю сферу. На данном рисунке не представлены области траекторий типа XIII и XIV (одна из границ этих траекторий представлена на Рис. 6.15. рис. 6.15), так как оказалось, что, во-первых, зона их существования целиком покрывается областью траекторий типа XI, а во-вторых, траектории типа XI «короче» траекторий типа XIII и XIV, т. е. гипотеза 4° оказалась справедливой и для этого типа траекторий. На рис. 6.15 представлены области всех типов траекторий. Из этого рисунка видно, что в центре области^ существуют одновременно области траекторий типа V— VII и VIII—XI. Расчеты показали, что траектории типа VIII—XI везде «короче» остальных траекторий. Таким Ю В. Н. Бранец, И. П. Шмыглевский
2Й0 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б образом, можно получить оптимальное движение, реализующее любой заданный разворот. Рассмотрим в заключение вопрос о том, насколько отличается построенное оптимальное управление от управления типа (6.37) по компонентам кватерниона. Можно видеть, что во всех случаях в точках ©т и ©^ оптимальное управление точно совпадает с (6.37); анализ показал, что в остальных точках оптимальное управление «короче». Разность между временами разворота при управлении (6.37) и оптимального разворота достигает максимума (при любом фиксированном угле Оь) в точках s£n. Эта разность в данной точке в функции угла Os возрастает с ростом этого угла, достигая максимума при Os = я. Оптимальный разворот в этом случае определяется траекторией типа IV, у которой оба 2л составляющих вращения имеют угол -^-, т. е. суммарный угол поворота равен 240°. Однако поскольку вращение происходит со скоростью | ©т 1=1^3, то время разворота 7z = -^-« 138°,8<180°. § 6.5. ДИНАМИЧЕСКИЙ ОПТИМАЛЬНЫЙ РАЗВОРОТ. ПОСТАНОВКА ЗАДАЧИ В задаче динамического оптимального разворота предполагается, что функцией управления является величина внешнего момента, приложенного к телу. Уравнениями движения твердого тела являются динамические уравнения, дополненные кинематическими уравнениями. Будем рассматривать вращательное движение твердого тела относительно неподвижной системы координат /, начало которой расположим в центре масс тела. Динамическими уравнениями движения будут уравнения Эйлера (5.51). Будем считать, что управление М{МЬ М2, М3} ограничено и принадлежит к некоторой замкнутой области М: М{М„ М2,М3}еМ. (6.61) Определяемые уравнением (5.51) величины угловой скорости задают кинематику движения твердого тела, опи-
§ 6.5] ДИНАМИЧЕСКИЙ ОПТИМАЛЬНЫЙ РАЗВОРОТ 291 сываемую уравнениями (6.1). Для полного описания движения необходимо задать граничные условия движения по положению тела: А(0) = Л0, А(Г) = Ат, (6.62) где 0 и Т — моменты начала и конца движения.. Граничными условиями по скорости являются следующие: cd(0) = g>o, ю(Г)=ют, (6.63) где ©о и Ют — некоторые желаемые допустимые [в том смысле, что они могут быть достигнуты при ограниченном управлении (6.61)] значения. Практическое значение имеет задача, в которой ю0 = ют = 0, (6.64) т. е. задача разворота тела из одного неподвижного положения в другое. Чтобы полностью замкнуть задачу, необходимо ввести критерий оптимальности. Будем рассматривать две постановки задачи: динамический оптимальный разворот по быстродействию и оптимальный разворот по так называемой величине «расхода». В первом случае минимизируется время Г разворота; во втором случае при фиксированном времени разворота Т минимизируется следующая величина: й_/(Ш. + ^1+Ш.)л. (6.65) О где гь г2, г3— некоторые длины, имеющие смысл плеча действия реактивной тяги, создающей соответствующий момент М<. Величина G равна суммарному импульсу тяги реактивных двигателей и определяет расход топлива, затрачиваемого системой управления на выполнение разворота. В частном случае гг- = 1 величина G определяет суммарный импульс момента; по-видимому, возможна постановка задачи, когда минимизируется эта величина. Динамические уравнения (5.51) совместно с (6.1) при заданных начальных условиях (6.62), (6.63) и при некоторых функциях управления М*(/) имеют единственное решение (траекторию). Очевидно, что не при всех !<)♦
292 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б возможных функциях управления траектория придет в конечную точку, определяемую Ат и ©т [см. (6.62) и (6.63)]. Будем предполагать, что всегда существует подмножество функций управления Мг(/), принадлежащих множеству (6.61), для которых траектория движения системы удовлетворяет граничным условиям (6.62), (6.63). Задача состоит в том, чтобы среди всех возможных допустимых управлений отыскать те, которые имеют минимальное значение выбранного критерия качества управления: времени Т или импульса G. Для нахождения условий оптимальности управления используем формализм принципа максимума Понтрягина [6, 41]. Чтобы в обеих постановках задачи оптимизации иметь одинаковый подход к ее решению, сведем случай оптимизации по импульсу тяги к случаю оптимизации по быстродействию путем добавления к уравнениям движения дополнительного уравнения G = iMii + iAM+iMai, (6.66) fi ?2 ?г получаемого из критерия оптимальности (6.65). Очевидно, что начальное значение G равно нулю; конечное значение не фиксируется и управление должно его минимизировать. Введем дополнительные функции (pi, ф2 и фз, соответствующие переменным соь сог и со3, функции *фг (I = О, 1, 2, 3), соответствующие координатам Ки и функцию g9 соответствующую G. С помощью этих функций построим функцию Гамильтона 2$ = ЖЛ + ЖК + Ж»= (ф4> + (Щ + (Og) = (6.67) где функция Гамильтона разбивается на «динамическую» <?#д, «кинематическую» Жк и «расходную» <5^р. Величиной Жк = у (coi/?! + со2/?2 + со3р3) является рассмотренная в § 6.2 функция Гамильтона для кинемати-
§ 6.51 ДИНАМИЧЕСКИЙ ОПТИМАЛЬНЫЙ РАЗВОРОТ 293 ческой задачи оптимального разворота (6.6); 'она может быть выражена через кинематический сопряженный вектор управления. В случае управления по быстродействию последний член 5#р в соотношении (6.67) отсутствует. Дополнительные переменные определяются уравнениями Ф*—^(*-».2. «).♦«—^(*-0. 1.2. J».i Щ. Запишем эти уравнения отдельно для разных групп переменных. Имеем следующие уравнения, определяющие функции щ: ф! = Ч>2 j^ G>3 + Фз j^ й>2 — у Ри . J3 ~~ «2 | **2 ~~ *М I Ф2= Ф1 j <»>3 + Фз j ©1 — у Ръ . J3 *-— "2 | ** 1 — "3 ^ ФЗ = Ф1 J G>2 + Ф2 j^ ®1 "" "J Pb (6.68) где величинами рь, являются введенные ранее величины (6.15)—проекции сопряженного вектора р£. Поскольку кинематические переменные Я* (* = 0, 1, 2, 3) входят только в кинематическую функцию Гамильтона <Э#к : д$б дЯбк то уравнениями для переменных фг- будут полученные ранее уравнения (6.8) и (6.13) кинематической задачи. Наконец, для случая оптимизации по импульсу тяги двигателей имеем последнее уравнение для переменной g: £-0. (6.69) В случае оптимизации времени разворота это уравнение отсутствует. Необходимые условия оптимальности управления заключаются в том, что управление М& (6 = 1, 2, 3) должно максимизировать функцию Гамильтона Ж на множестве (6.61) допустимых управлений. Поскольку управление входит только в первый («динамический») и
294 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. 6 третий («расходный») члены функции Гамильтона, то это условие запишется таким образом: Ж{м*(0. «МО. МО. G(0. «МО. Чх(0. вг(0>« = тах^{М*, (о,(0, МО. G(0, «МО. +<(0, *(0> = = тах^д(соь Фь Мл) + max Жр (Мь g9 G). (6.70) В случае постановки задачи по минимуму расхода, когда фиксируется время разворота Г, эти условия необходимо дополнить следующим соотношением, которое должно выполняться в конечный момент времени Т (см. [6], § 8, теорема 6): g(T)=-l. (6.71) Написанных соотношений достаточно для решения (в принципе) поставленной задачи. Действительно, условие максимума (6.70) определяет управление в функции (Oh и вспомогательных переменных фь и g. Выразив формально функции управления М& с помощью условий максимума через фь и gt получим замкнутую систему <Й дифференциальных уравнений первого порядка (6.51), (6.68), (6.1), (6.8) (не считая уравнений для G и #).Эти дифференциальные уравнения в свою очередь определяют фуНКЦИИ COfc, Яг, фЬ, фг, g (t = 0, 1, 2, 3; k = 1, 2, 3) необходимым числом граничных условий (6.62), (6.63) и (6.71). Следует таким образом выбрать константы, задающие функции щ и фг, чтобы траектория {со&, Яг}, выходя из начальной точки (6.62), (6.63), прошла через заданную конечную точку. В случае оптимизации управления по быстродействию управление Мл (k = 1, 2, 3) определяется условием максимума только динамической составляющей функции Гамильтона: тах^ = тах^д(Мь со*, ф*). (6.72) MfteM Этим самым управление задается в функции величин дол и Фь, и ВИД эт°й зависимости определяется конфигурацией множества управлений М.
§ 6.6J РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 296 В случае оптимизации управления по импульсу тяги имеем в соответствии с (6.69) и (6.71) «■СО— —1- Исходя из этого, выбор оптимального управления будет находиться из условия максимума функции max Ж-таМаММ* <о*. ,к)-Ш-Ш.-Ш (6-73) М^ЕМ Г1 Г2 Г3 и будет определяться более сложными соотношениями, зависящими от времени разворота Т (ниже это будет показано). Системы уравнений (5.51) и (6.68) представляют собой системы нелинейных уравнений; поэтому, даже когда получается непосредственное представление управления Мл в функции фь и соа, решения уравнения получить не удается. К тому же, если исходить из условия (6.73), то его разрешение возможно только при известных (найденных) функциях ф* и соь. Следует также учесть, что в уравнения для ф& входят величины ри, определяемые в функции решения кинематического уравнения, кото* рое также в общем виде непредставимо через элемен-- тарные функции. Отсюда ясно видны все принципиальные трудности решения задачи динамического оптимального разворота. § 6.6. ЧАСТНЫЙ СЛУЧАЙ РЕШЕНИЯ ЗАДАЧИ ДИНАМИЧЕСКОГО ОПТИМАЛЬНОГО РАЗВОРОТА ДЛЯ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ ПРИ ОГРАНИЧЕНИИ НА МОДУЛЬ УПРАВЛЯЮЩЕГО МОМЕНТА По-видимому, этот случай является единственно раз-, решимым аналитически, поскольку при сферической сим-; метрии тела имеем Ji = J2 = J3 = J и нелинейные урав* нения (6.68) (нужно учесть, что условием максимума m определяются как функции щ) переходят в линейные дифференциальные уравнения. С другой стороны, решение даже для такого частного случая симметрии твердого тела интересно тем, что позволяет до конца проследить все особенности поставленной задачи и хорошо иллюстрирует роль полученного решения кинематической задачи.
296 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. О Для рассматриваемого случая функция Гамильтона (6.67) примет такой вид: ^=Ф1^ + Ф2^ + Фз^ + ^к--|М1|-|М2|-.|Мз| (6J4) (МЫ ПРИНЯЛИ, ЧТО Г\ = Г2 = Г3 = 1). Динамические уравнения Эйлера (5.51) и уравнения для вспомогательных функций щ (6.68) сводятся к следующим: <b* = JT-> Ф* = -|р* (* = 1,2,3). (6.75) Сюда же следует добавить кинематические уравнения (6.1) для величин Х{ и соотношения (6.15), определяющие величины ph в функции Х{ и г|)г- (i = 0,1,2,3). Запишем эти уравнения в кватернионной форме, используя соотношение (6.20): А = уАою£, р£=Лор£0оЛ, (6.76) где р^— начальное значение сопряженного вектора, а р£ — кватернион (6.15). Исследуем сначала случай оптимизации управления по быстродействию и рассмотрим условие максимума (6.72) для этого случая. Введем следующие векторы (и кватернионы): М = М1*1 + М2*2 + М3*3, 1 Ф^Ф^+Фг^ + Фз^з- I Отметим, что если гиперкомплексный базис совмещен с базисом Е9 то М есть вектор управляющего момента в связанных осях. С учетом (6.77) условие максимума (6.72) запишется в таком виде: max Ж = max [ф • М]. МеМ В частном случае, когда область допустимых управлений есть сфера (момент ограничен по модулю), имеем из условия максимума такое конечное выражение для функции управления: М = цф. (6.78)
$6.6J РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 297 Здесь ii — коэффициент нормировки, равный Мтах/|ф|, где Мщах — максимальное значение модуля момента. Это соотношение выражает управление в функции только вспомогательных переменных ф&: момент М должен быть максимален по величине и направлен по вектору ф. Вектор ф в свою очередь определяется вторым уравнением (6.75) в функции вектора р£; вектор р£ выражается соотношением (6.76) в функции ю£. Представим соотношения (6.75) в векторной форме, используя обозначения (6.77) и рассматривая управление, определяемое условием (6.78): »£=^=*WJL_, ф ^р£. (6.79) Полученные уравнения совместно с уравнениями (6.76) дают замкнутую систему дифференциальных уравнений, которая должна единственным образом удовлетворять граничным условиям (6.62) и (6.63). Следует отметить, что запись уравнений (6.76) в векторной форме является формальным представлением равенств (6.75), поэтому производные ю£ и ф являются здесь локальными производными (взятыми без учета движения базиса Е). Обсудим выбор произвольных констант полученной системы уравнений и их связь с граничными условиями задачи. Поскольку векторные равенства (6.79) есть формальная запись скалярных соотношений, то дифференциальные соотношения (6.79) можно формально проинтегрировать: ®£—®0Т j I |ф| а* t t 4 = %-T}pEdt'> (6.80) где ©о и ф0—начальные значения величин ю£ и ф. Из полученной записи следует, что при выборе начального значения угловой скорости, равной соответствующему граничному условию, удовлетворяется первое условие (6.63). Можно себе представить, что второе
298 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б условие (6.63) может быть удовлетворено соответствующим выбором начального вектора фо. Первое (начальное) условие (6.62) также выбирается автоматически заданием в решении кинематического уравнения соответствующего начального кватерниона Ао. Конечное значение кватерниона Лт должно удовлетворяться соответствующим выбором начального вектора рт (6.76). Итак, полученная замкнутая система уравнений должна иметь решение, определяемое девятью константами (по три константы для каждого вектора ю£, ф и рЕу что полностью согласуется с граничными условиями задачи. Перейдем к анализу 'полученной системы. Вектор рЕ получается как результат решения кинематических уравнений. Дифференцируя второе соотношение (6.76), получаем следующее дифференциальное уравнение, описывающее движение этого вектора: 2Р£=Р£0С)£-С)£0Р£- (6-81) Можно видеть, что уравнения (6.79) и (6.81) как раз и образуют замкнутую систему трех векторных дифференциальных уравнений первого порядка (т. е. систему девяти скалярных уравнений). Однако эти уравнения являются нелинейными; они содержат три переменные <о£, ф и рЕ и даже сведение этих уравнений к одной переменной представляет серьезные трудности. С учетом того, что векторные равенства (6.79) являются формальной записью скалярных соотношений, продифференцируем второе уравнение этой системы: В полученное равенство подставим значение производной (6.81), заменив функцию рЕ. через ф. В результате будем иметь такую систему уравнений, соответствующую системе (6.79), (6.81) и содержащую только две переменные: Ф _ Мтах Ф | Е т J 1*1 § (6.82) 2<р = фою^ — <V<P = 2<pX<V i
i 6.6] РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 299 Исследовать общее решение полученной системы не удается — укажем поэтому одно частное решение. Пусть вектор ю£ параллелен вектору <р, т. е. параллелен вектору р£; это означает, что производная от вектора <р имеет то же направление, что и вектор <р. Исходя из равенства (6.81), получаем, что должно иметь место равенство Ре=Рео> а вектор ю£ должен иметь постоянное направление. Из второго уравнения (6.80) получаем Ч>(0--тРЛ + «. (6.83) где а — постоянный вектор, причем, так как вектор со£ должен иметь также направление вектора со£, т. е. и вектора р£0, то вектор а должен быть коллинеарен с вектором р£0.Итак, функция <р(0 является линейной для рассматриваемого случая и может менять знак только один раз. В соответствии с этим согласно (6.78) управляющий момент является постоянным по направлению, максимальным по величине и может менять знак один раз на всей траектории движения. Единичный вектор функции <p(f) совпадает с вектором р£0; используя первое решение (6.80), получаем для функции угловой скорости г* -г* 4- М™* п [ ±t ДЛЯ 0</<Т, 1 •е-*о + -Т-Р»[ ±(2Ti_0 для Т|</<Г Г (6-84) где Т — временной интервал движения, a ti — момент изменения знака функции <р(0- Из полученного равенства видно, что о>о—начальное значение угловой скорости— не может быть произвольным, а должно иметь направление вектора р^; точно так же и конечное значение ©т определяется этим направлением. Отсюда следует такой вывод: рассматриваемое частное решение системы (6.82) справедливо только для некоторых граничных условий (6.63), а именно таких, когда векторы начальной и конечной скоростей имеют направление
300 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б вектора р£0. Соответственно число этих условий (6.63) уменьшается с шести до двух (т. е. задаются только величины wo и сот). Тем не менее следует отметить, что такой частный случай имеет практическое значение, и граничные условия. (6.64) являются именно таким случаем. Вследствие этого число граничных условий (6.62) и (6.63) уменьшается с девяти до пяти: три условия (6.62) на угол и направление вращения и два условия (6.63) на величины начальной и конечной скоростей. Число констант полученного решения также равно пяти: три константы определяют рЕ0 и а (т. е. направление вектора вращения и момент изменения знака скорости) и по одной константе — величины соо и сот. Характер изменения ю£(0 представлен на рис. 6.16. Нарастание скорости происходит с максимальным ускорением, время разворота Т здесь не фиксировано — оно должно определяться величиной угла разворота. Решение кинематических уравнений для случая постоянного по направлению вектора скорости известно. Для ю£(/) в виде (6.84) имеем ,-A«oeT^lV*-T-Tj Рнс. 6.16. (6.85) \(t)=AQoe2rE°W~ J 2-l при 0<*<ть A»-A...T'-[v!Vh'-|4)] при Т!</<7\ Полный угол вращения за время Т найдется как * = со0Г ± 2fL(2т{Т - т? - Ц-); (6.86) он должен определяться кватернионом А0оЛт (6.46) с помощью, например, такого соотношения: 2ft = arccos [sqal (Л0 о Лт)].
§ 6.6] РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 301 Направление же вращения, т. е. вектор р£0, определяется векторной частью (6.85): p£0=vect(A0oAT)/sin4. (6.87) Очевидно, что рассматриваемый частный случай описывает плоский разворот тела из начального положения в конечное. Представляет интерес сравнить полученное решение (6.84), (6.87) с решением (6.35) кинематической задачи. Из сравнения видно, что именно этот частный случай управления дает плоский разворот, определяемый кватернионом Ло°Лт. Величины Г и ti определяются из решений (6.84) и (6.86): ©т-о10=т-^(Г-2т1), Ъ-щТ=±^[£--(Т-т1у]. (6.88) Условия (6.88) приводят к квадратному алгебраическому уравнению относительно ti или Г, причем из двух корней этого уравнения только один имеет смысл. Тем не менее двум знакам решений (6.86) и (6.88) отвечают разные значения Т и п. Для верхнего знака имеем У iVlmax mmax mmax V inmax inmax inmax (6.89) Нижнему знаку соотношений (6.88) отвечают такие значения: т L м„, (со0 + (от)-2 j/^K + co?)-^-*, У inmax iVlmax <°п ~ 1 / —5 (®1 + ®1) *• 0 I/ М2 ^ т °' М max f mmax i¥1max (6.90) Эти два решения отражают два пути, ведущие из точки coo в точку сот (см. рис. 6.16). При нулевых начальной и конечной угловых скоростях возможно только
302 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ (ГЛ. 6 решение (6,89). Очевидно, что этому случаю соответствует такое движение, когда половину времени движения момент действует в одну сторону в направлении требуемого разворота, половину времени — в обратную. Согласно (6.88) угол, на который осуществляется разворот при таком управлении, равен ТГ— J 4 • а максимальная угловая скорость Мщах Т (Ое- Решение (6.90) имеет смысл только тогда, когда имеются отличные от нуля начальная и конечная угловые скорости, причем ясно, что для того, чтобы решение (6.90) существовало, должно выполняться неравенство ,*2 _L ^2 v. Mmax A ©g + со; > —j— А. При этом характер управления может быть совершенно иным: управляющий момент в начале движения может иметь направление, обратное требуемому развороту (см. рис. 6.16). В любом случае имеется неоднозначность решения, вызываемая, во-первых, возможностью разворота на угол О или 2я—А, а во-вторых, тем, что существуют граничные условия, для которых имеют смысл и решения (6.89), и решения (6.90). Очевидно, что всегда следует из всех допустимых решений выбирать то, которое имеет наименьшее время движения Г. Ответ на этот вопрос не является тривиальным, если только не имеем нулевых граничных условий по скоростям (6.64). В последнем же случае решение является четко однозначным: решения (6.90) не существует, а из углов А и 2я—А следует выбрать тот, который меньше я. Исследование же общего случая весьма интересно и может быть проведено на основании полученных соотношений; такое рассмотрение представлено здесь не будет, так как оно увело бы нас от основной идеи изложения в сторону частных подробностей.
§ 6.6] РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 303 Обратимся теперь ко второму критерию оптимальности— минимизации импульса управляющего момента при фиксированном времени разворота Т. Условие максимума функции Гамильтона Ж (6.73) для данного случая определяет более сложную зависимость управляющего момента от функции ф(Г), чем это имело место для случая (6.72). Можно видеть, что, если з ^ = yM.<p-2lM<|>0, т. е. з M-4P>JSlMl|, (6.91) условие максимума <Э# определяется теми же соотношениями, что и в случае (6.72). Однако когда неравенство (6.91) нарушается, максимальное (неотрицательное) значение 96 достигается при нулевом управлении М,е=0 (/=1, 2, 3). Таким образом, движение должно состоять из участков, когда действует максимальный момент, и участков свободного движения. Можно видеть, что на участках ненулевого управляющего момента оптимальное управление будет определяться точно такими же соотношениями, как и в случае задачи оптимизации времени разворота: управляющий момент определяется соотношением (6.78), движение твердого тела и изменение функции ф — соотношениями (6.79), а кинематика движения описывается равенствами (6.76). Отсюда следует, что полученные решения для задачи оптимизации по быстродействию полностью применимы к отдельным участкам движения для рассматриваемой задачи. Остальные участки движения должны иметь нулевой управляющий момент, т. е. являться участками свободного движения твердого тела. Траектории свободного движения сферически симметричного твердого тела будут такими: ©£(0 = ®£Ы» ) i _ (6.92) Д(*) = Л(тр)ое2МТ<>)(' То)? J
304 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. в где го соответствует моменту начала свободного движения. Полученных выше соотношений (6.84), (6.85) и равенств (6.92) достаточно для анализа движения. Следует отметить, что число определяющих движение'параметров увеличилось на единицу (задано фиксированное время разворота); этому отвечает дополнительное условие (6.91), задающее моменты перехода от одного участка движения к другому. На участках ненулевого управляющего момента будем рассматривать, как и в предыдущем случае, частный случай движения, когда вектор <р направлен по вектору <р. В этом случае векторы ©£ (/) и pE{t) сохраняют постоянное направление. Очевидно, что при переходе к другому участку движения, т. е. участку нулевого момента, дальнейшее движение описывается соотношениями (6.92), из которых следует, что вектор угловой скорости ©£ сохраняет свое положение. Соответственно этому при переходе к участку свободного движения не меняется ориентация кватерниона вращения Л(/), а следовательно, остается неизменным и вектор рЕ (t) = pE0. Отсюда следует, что функция ф(/) описывается одним и тем же уравнением на всех участках движения и не имеет разрывов, т. е. для всего участка движения справедливо решение (6.83). Поскольку функция ср(/) линейно изменяется со временем, проходя через нуль, неравенство (6.91) может нарушиться только один раз: при попадании величины М-ф внутрь куба со сторонами МЛ 2 I М* I). При этом в зависимости от начальных условий могут быть такие случаи движения: а) движение с максимальным моментом, участок свободного движения, движение с максимальным моментом обратного знака; б) движение с максимальным моментом, участок свободного движения; в) участок свободного движения, участок с максимальным моментом. Изменение угловой скорости ю£ определяется на каждом участке движения соотношениями (6.84) и первым равенством (6.92). Характер изменения угловой скорости в зависимости от случая движения представлен
$ 6.6] РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 305 на рис. 6.17. Из рисунка видно, что случаи б) и в) могут существовать только при соо Ф сот, причем имеется единственная траектория для каждого такого случая. Случай а) может быть реализован двумя способами, чему соответствуют различные знаки начального момента управления. Кроме того, случай а) может выродиться в движение без свободного участка, рассмотренное выше, когда время движения из равенств (6.89) или (6.90), движение, когда выполняется соотношение ^ek Т удовлетворяет одному или только в свободное S< J в Г44^ а ъ^ б сог ■ »* Рис. 6.17. Ъ = &0Т=(йТТ. (6.93) В рассматриваемой постановке задачи минимизируется импульс момен- ^ I та, а следовательно, и ^' время участков движения с максимальным управляющим моментом. Из рис. 6.17 следует, что во всех случаях траектории б) ив), если только они возможны, являются более экономичными, чем траектории а). В соответствии с этим при заданных со0, сот, Т и А0°ЛТ [напомним, что направление вектора угловой скорости в рассматриваемом частном случае совпадает с направлением vect (Л0 о Ат)] анализ движения производится в такой последовательности: проверка случаев б) и в) и затем выбор одного из движений а) (которых два, как и в предыдущем случае). Для траектории б) должны выполняться следующие соотношения: ,N „ . Mmax Ют — (00 = ± г— Tlf (^т{Т—х1) + ф0х1 ± J < где Ti — длительность первого участка движения с максимальным моментоод. Значение \\ находится цэ зтц#
306 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б соотношений в виде T, = /W-»>J, (6.94) При угле вращения О ^ сотТ [в случае равенства может иметь место условие (6.93) и возможно движение по такой траектории] и со0 ф сот вращение выполняется на угол b-\-2kn (k= 1, 2, ...), если только нет более экономичных траекторий другого типа. Для траектории в) выполняются аналогичные соотношения: шт-(о0=±^р-(7'-Тз), где тз — длительность первого участка свободного движения. Значение Тз находится из этих соотношений в таком виде: w_yT2=3E. (в.96) В тех случаях, когда щТ ^ д [равенство возможно при выполнении условия (6.93)], движение по такой траектории должно происходить на угол О + 2kn (k = = 1, 2, ...), если нет более экономичных траекторий другого типа. Точно так же, если Тз получается отрицательным, движение должно выполняться на угол 2я — д или по траектории другого типа. Для траектории а) имеем соотношения такого рода: шг-аю-±-йр-(т1.-т1), ±ан>Т+^Тт1-^*1-%1(»0-»г)- где Ti > 0, тз > 0 — длительности первого и третьего участков движения с постоянным максимальным моментом,
§ 6.61 РАЗВОРОТ ТЕЛА СО СФЕРИЧЕСКОЙ СИММЕТРИЕЙ 307 Эти соотношения определяют значения xi и тг: _Т_ ((oT-(o0)J __ Tl — 2 - 2Мтах * 2Мтах Мтах 4Мтах , . _ _.. Т (ою-«г) J !(6.96) Т2 — 2 - 2Мтах К 4 2Мтах Мтах ^4М2тах Здесь верхний знак соответствует случаю движения, когда первый участок имеет положительный момент (а третий — отрицательный); нижнему знаку отвечает обратная последовательность моментов. Отметим, что вторая траектория а) не всегда имеет место. Так, например, при со0 = сот=0 существует только первая траектория (6.96), так как для второй имеем отрицательные значения ti и Тг. При соо = сот > 0 и О > сооГ существует также только первая траектория (т2<0), при д = сооГ реализуется траектория только свободного движения (6.93), при Ъ<.(доТ существуют и первая, и вторая траектории. При дальнейшем возрастании ©о значения ti и Тг приближаются к у Г и при 7*2 АД I <0o='O'-f-7 у51 становятся равными -у Т. При соо> >d + -j ~2-решения (6.96) формально теряют смысл (появляется отрицательная величина под корнем). Это указывает на то, что при таких граничных угловых скоростях разворот за время Т на угол Ъ невозможен; при этом осуществим разворот на угол d + 2kn (k = = 1,2, ...). В любом случае существует несколько траекторий типа а), осуществляющих требуемый разворот. Такая неоднозначность определяется, во-первых, возможностью разворота на углы О, 2я—Ф и д + 2£я (k = = 1,2, ...)» дающие тот же самый пространственный разворот, а во-вторых, двумя возможными траекториями (6.96). Всегда для нахождения оптимального
308 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. б разворота следует рассмотреть все возможные траектории и выбрать из них наиболее экономичную. Такого рода неоднозначности не существует только для нулевых граничных условий по скоростям (6.64). В этом случае, как указывалось выше, реализуется только одна траектория (6.96), имеет место равенство ti = t2 и оптимальный разворот осуществляется на угол &<.п. Именно такой случай имеет практическое значение, поэтому рассмотрим его подробнее. При таком движении сначала происходит разгон с максимальным управляющим моментом, имеющим направление кватерниона рассогласования Л0°ЛТ, до значения угловой скорости —ЧГ('-/>"1Чс)- <6ЭТ> определяемой по заданному времени разворота. После этого следует участок свободного движения длительностью V Г»М„ах и затем участок торможения максимальным моментом обратного направления. На практике обычно задают не время разворота Г, а угловую скорость разворота (6.97). Если при этом управляющий момент задать в виде релейной функции м* = Mf (&Ei - Qhi) (i = 1, 2, 3), (6.98) где ЯКг — угловая скорость коррекции (6.37), то можно видеть, что управление (6.98) как раз и реализует рассмотренное здесь оптимальное управление для случая сферически симметричного тела. Этим объясняется высказанное в главе 5 положение о том, что управление по компонентам кватерниона близко к оптимальному. § 6.7. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ I. Обсудим кратко гипотезы, принятые в § 6.4. Наиболее простой из них является гипотеза 2°. Проведенное в этом параграфе исследование показало, что для каждого заданного А2 может существовать один или не-
§6.7] ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 30$ сколько типов траекторий, реализующих это движение. Согласно этому, As определяет одно или несколько значений р£0. В действительности в любой конечной области оптимальной является одна траектория (с учетом достаточных условий оптимальности), поэтому в действительности As единственным образом опре- 9toJ деляет вектор р£0. Однако нам не удалось найти алгоритма, который ставит в соответствие ква- Per Рис. 6.18. терниону А2 вектор р£0. Гипотеза 3° более сложная; ее альтернативой является допущение о •«♦ том, что вектор pE{t) может менять свой знак (т. е. осуществлять переход от одного двузначного значения к другому) в процессе движения. Если допустить такую возможность, то можно показать, что такой переход от одного знака к другому может происходить только при попадании вектора рЕ на координатную плоскость. В этом случае оказывается возможным движение в скользящем режиме, когда вектор рЕ движется вдоль координатной плоскости (рис. 6.18); угловая скорость такого движения будет равна ©^rt. Длина такого участка зависит от места попадания вектора рЕ на координатную плоскость и не превышает -^-, так как такой скользящий режим продолжается до попадания вектора р в точку Vi. Движение со скоростью & Лп в этом случае может стыковаться с другими движениями; число возможных траекторий увеличивается за счет появления новых типов траекторий, включающих в качестве одного из участков движение (6.50). Такими движениями являются следующие 13 траекторий [здесь
3ia ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ [ГЛ. в используем обозначения для составляющих кватернионов (6.48)-(6.50)]: A^ioAi, A^ioA2, AioA^i, AioA^ioAi, А^А^оАг, A4 о Ai о A^i, A4 0 Ai 0 A^i о Ai, A4 ° Ai о A^i о А2, A3 о А4 о Aj о A^i, A3 о А4 о Ai 0 A^i о Af, A3 о А4 о Aj 0 A^i 0 A2*, A^i о Ai 0 A5, A^i о А2 о Ae. Все эти типы траекторий позволяют однозначно определить составляющие вращения через результирующий кватернион А2 и условия движения вектора р£. Так, например, на траектории A4°Ai о A^i о А{, число участков которой превышает три, углы $л\ и Oi связаны таким условием: (смысл этого условия понятен из рис. 6.18). Кроме этого, существует еще целый ряд траекторий, в которых среди составляющих вращений присутствует как вращение А^п, так и вращение А?/. Для такого типа траекторий составляющие вращения определимы не во всех случаях. Укажем траектории, для которых As однозначно определяет все составляющие вращения: A^i о Atfi, Ai о A^i о A^i, А4 о А| о A^i о А?ь Аз о А4 о Ai © A^i о А^ 1. Во всех указанных здесь случаях движения было проведено численное исследование. Были построены области существования решений для каждого типа траекторий; эти области накладываются на области, существующие при движении вектора р£ в области s4>n и по сепаратрисе и рассмотренные в § 6.4. Результаты расчета показали, что все эти траектории «длиннее», чем рассмотренные в § 6.4. Иногда оказывалось, что траектории такого рода имеют время движения больше, чем при управлении (6.37). Таким образом, справедливость гипотезы 3° подтверждается проведенным исследованием. Гипотеза 1° является, по-видимому, самой сложной и неочевидной. Если допустить, что функция sign(0) в вьь
§6.71 ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 311 ражении (6.44) не имеет нуля среди своих значений, то исключаются движения со скоростями ©^. При этом исчезают траектории типа VIII—XIV и появляется ряд областей, не покрываемых оставшимися траекториями. Таким образом, чтобы иметь оптимальное управление в любой точке (точке положений концов вектора As), необходимо допустить среди значений функции sign(O) нулевое значение. Аналогичным образом отсутствие значений + 1 или —1 для этой же функции sign(O) ведет к сокращению возможных движений, в результате чего появляются области, в которых нет «оптимального» решения. Тем не менее физически трудно понять, каким образом происходит смена значений функции sign(O) при движении вектора р£. Гипотеза 3° позволяет рассматривать только одну полусферу, в которой располагаются концы векторов As. Обратному вращению соответствует кватернион Ах, имеющий противоположное направление. Можно видеть, что обратному вращению Ах должно соответствовать движение, реализуемое вторым значением вектора р£, т. е. вращение будет происходить с обратными (по знаку) угловыми скоростями. Однако это самое движение, если его рассматривать на второй полусфере, будет выглядеть точно так же, как это оговорено гипотезой 3°. П. Покажем, что траектория типа XII при среднем угле вращения, равном -|-, становится эквивалентной траекториям типа VIII и IX. Рассмотрим сначала для этого кватернион траектории типа IX Ах = А<п о А2, р йодставим сюда значения составляющих согласно (6.54) и (6.56). Выполняя умножение, получаем для компонент результирующего кватерниона: Ахо = cos Ц±- cos ^ -1/| sin^|i sin ^,
312 ОПТИМАЛЬНЫЕ ПРОСТРАНСТВЕННЫЕ РАЗВОРОТЫ (ГЛ. 6 f2 2 2 l УЗ 2 2 1 . Gffi . % 7=r Sin -=- Sin , ^6 2 2 1 ф«. #2 1 ^. Ф2 Ахз = -=■ sin — cos — + -7=- cos — sin— + K2 2 2 /3 2 2 + -7=-sin—-sin-^. Кб 2 2 Умножим теперь полученный кватернион справа на кватернион А^2 [согласно (6.56)]. После необходимых преобразований он приводится к такому виду: ^o=cos-y-cos yi 2 y2 -|/ Tsin-j-sin yi 2 y2 + + -7=- sin-S- sin — sin -), /3 2 2 \3 2) Xxi = - -7=■ sin— cos *' y2 /3 2 2 +-(^-т)[тт-»^(^»^--»^)]' 1 ^2 . ®V\ + % ^x2=-7=-cos — sin , 1^2 2 2 + -r=-sin—cos — S- r=rsin-^-sin yi ^ y2 + '1/12 2 Кб 2 2 4!|"(т-1)*т(^»^+4)' -f -=■ sin— sin— sin f ). ^3 2 2 \3 2/
§6.7] ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 313 Если здесь положить flvi = 0, то получим результирую* щий кватернион для траектории типа VIII: As = А2 о А^2, te=C0S^c08^_/Isi„^sl„^. 2 шо 2 ' 3 2 1 fl\> 0^2 1 ^9 ^V2 -т=- sin—1- cos =• cos — sin—£- f3 2 2 |/T 2 2 * . ^2 . ^ff2 + -7rrSin Sin-£-f \Tb 2 2 I . #2 ^2 Л22 = T7=r sin—- cos -^-, У 3 2 2 1 ft, ^5f2 1 . ^2 ^Sf2 . ^23 = -7=* COS — 81П-^- + -7=- Sill COS -^- + J^2 2 21^3 2 2 1 . ^2 . ^*f2 + -т=- Sin Sin -*- • /6 2 2 Можно видеть, что если в выражении для As = = А#{ о Л2 о Л^2 положить Ф2 = -£•, то оно точно совпадет с выражением для As = A?i о А2, в кедром угол d^i следует заменить на угол -flyi + Ф?2. Можно убедиться, что и траектория As = A2<>A^2 переходит в траекторию Az = Affi о Аг° А?2 при этом же значении угла д2. 2л Итак, доказано, что при ft2= -у выполняется равенство Atfi (*л) ° ^2 (^г) ° А^2 О&гг) = A^i {Ъ$\ + AY2) ° А2 (Фг) = = А2 (da) ° A^2 (fyri + &&).
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ Н — гйперкомплексное пространство; /, Е, Е\ ЕУ — ортонормированные базисы в трехмерном пространстве; *i> *2э *з — гиперкомплексные единицы; орты базиса /; еЬ ei* *t ~~ °РТЫ базисов; А, М. R, S, Р, N — кватернионы; ^i* Pr ri* st* Р*» vi ~~ компоненты «кватерниона; sqal, vect — обозначения скалярной и векторной частей кватерниона; К I1» г, з9 Р, V —векторы; векторные части кватерниона; А, М — сопряженные кватернионы; А-1, М""1 — обратные кватернионы; || А ||, || М Н — нормы кватернионов; | А | = У || А || = А — модуль (тензор) кватерниона; Ф» 6 — Угол и единичный вектор кватерниона; ДА, AN — кватернионы бесконечно малого преобразования; А£, RE — кватернионы-отображения на базис; Аф Ат — начальное и конечное значения кватернионов; А2 — результирующий кватернион; ^2» 52~"УГ0Л и единичный вектор результирующего кватерниона; ft в = 2£ tg -^ — вектор конечного поворота; в = Ф£ — вектор истинного поворота; в* — вектор кажущегося поворота; C/t СЕ — постоянные кватернионы; Yi» Y2» Ya — направляющие косинусы векторов £, £2; at bt с, d, r, m — векторы; а с= | а | — модуль вектора; © — вектор угловой скорости; Г£, аЕ% ?£— векторы отображения на базис Е\ riEt ®iE — компоненты векторов отображений г£, ©£; ©f, Q( — компоненты —проекции © на связанный и неподвижный базисы Е и /; ю^, ©7—отображения © на базисы Е и /; е — единичный вектор; 0т' °V/» ©^п —экстремальные векторы угловой скорости; Ат, А^|, АЛп — кватернионы вращений с экстремальными скоростями!
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ 315 N (/) — кватернион-частное реи^елие кинематического уравнения, в том числе с единичным начальным условием; А, В, С, D, G, С — ортогональные матрицы; дт _ транспонированная матрица; А""1 — обратная матрица; R, Т, I, E — матрицы-столбцы; 1 = || Ьц || — единичная матрица (в том числе двумерная); 1 + е — матрица бесконечно малого преобразования; Ф — угол вращения матрицы А; %k — собственные значения матрицы А; U, R — двумерные унитарные матрицы; и> v — элементы двумерного комплексного пространства; U* — матрица, комплексно сопряженная с матрицей U; U+, U*T — матрица, эрмитово сопряженная с матрицей U; AU — матрица бесконечно малого преобразования; Рь Р » Рз— спиновые матрицы Паули; Q, Q£, Q7 — трехмерные матрицы угловой скорости; V, V£, V7 — двумерные унитарные матрицы угловой скорости; я, о, т — верзоры (единичные векторы); *К Ф» *Ф — Углы Эйлера; #, &, Ф, Юу £\ &и . . . — точки на сфере; \ т — шаг интегрирования и время внутри шага; ф = © dt — угол суммарного поворота; о g — шаг по углу суммарного поворота; £ср Я щ= — коэффициент; W, Т9 V — функции Ляпунова; QKi — скорости коррекции; 96 — функция Гамильтона; \|ь — вспомогательные функции, соответствующие Xfi <Pj — вспомогательные функции, соответствующие ©^; Jb ^2» ^з— главные центральные моменты инерции тела; М — внешний управляющий момент; £/ — оси чувствительности датчиков углового положения; М, S£, Ef — допустимые области управления в динамической и кинематической задачах; stn> &m — области на сфере; о, ♦, X — знаки соответственно кватернионного, скалярного в векторного умножений; е — квант измерения угловой скорости; i — мнимая единица.
ЛИТЕРАТУРА 1. Барбашин Е. А., Табуева В. А., Динамические системы с цилиндрическим фазовым пространством. М., Изд-во «Наука», 1969. 2. Б е ж к о А. П., Б р а н е ц В. Н., 3 а х а р о в Ю. М., Шмыглев- с к и й И. П., Применение кватернионов в теории конечного поворота твердого тела. «Изв. АН СССР. Механика твердого тела», 1971, № 1. 3. Березин И. С, Жидков Н. Б., Методы вычислений, I и II. М., Физматгиз, 1959. 4. Боголюбов Н. Н., Митропольский Ю. А., Асимптотические методы в теории нелинейных колебаний. М., Физматгиз, 1958. 5. Б о д а н с к и й Е. Д., Фурман В. Д., О погрешностях численного интегрирования кинематических уравнений Пуассона. «Космические исследования», 1970, VIII, вып. 6. 6. Болтянский В. Г., Математические методы оптимального управления. М., Изд-во «Наука», 1966. 7. Б р а н е ц В. Н., Ш м ы г л е в с к и й И. П., Кинематические задачи ориентации во вращающейся системе координат. «Изв. АН СССР. Механика твердого тела», 1972, № 6. 8. Б р а н е ц В. Н., Ш м ы г л е в с к и й И. П., Применение кватернионов в управлении угловым положением твердого тела. «Изв. АН СССР. Механика твердого тела», 1972, № 4. 9. Бухгольц Н. Н., Основной курс теоретической механики, ч. II. М., Гостехиздат, 1945. 10. Воронов А. А. и др., Цифровые аналоги для систем автоматического управления. М., Изд-во АН СССР, 1960. 11. Вычислительная техника. Справочник под ред. Г. Д. Хаски и Г. А. Корна, I и II, перев. с англ. М.—Л., Изд-во «Энергия», 1964. 12. Г а н к е л ь Г., Теория комплексных числовых, систем, преимущественно обыкновенных мнимых чисел и кватернионов Гамильтона вместе с их геометрическим толкованием, перев. с нем. Казань, изд. Казанского университета, 1912. 13. Г арбузов А. Р., Погрешности преобразования координат на плоскости поворотом осей цифровым дифференциальным анализатором. В сборнике «Автоматика и телеинформационные системы». М., Изд-во «Наука», 1965. 14. Г е л ь ф а н д И. М., М и н л о с Р. А., Ш а п и р о 3. Я., Представления группы вращений и группы Лоренца. М., Физматгиз, 1958. 15. Г и л м о р Дж. П., Ф е л д м а н Дж., Гироскоп с обратной связью по моменту для бескарданной системы, перев. с англ. В сборнике переводов «Вопросы ракетной техники», 1970, № 9. 16. Голдстейн Г., Классическая механика, перев. с англ. М., Гостехиздат, 1957.
ЛИТЕРАТУРА 317 17. Гробов В. А., К о ц ю б а А. В., О применении параметров Кей- ли — Клейна при исследовании квазипрецессионного движения свободного твердого тела. «Прикладная механика», 1971, VII, вып. 7. 18. Гурман В. И., Лавровский Э. К., Сергеев С. И., Оптимальное управление ориентацией осесимметричного вращающегося космического аппарата. «Космические исследования», 1970, VIII, вып. 8. 19. Д и м е н т б е р г Ф. М., Винтовое исчисление и его приложения в механике. М., Изд-во «Наука», 1965. 20. Диментберг Ф. М., Севостьянова Е. Г., К теории конечных перемещений твердого тела. «Изв. АН СССР. Механика твердого тела», 1969, № 2. 21. 3 ом м ер фе л ь д А., Механика, перев. с нем. М., ИЛ, 1947. 22. Инерциальные системы без гиростабилизированной платформы (обзор), перев. с англ. В сборнике переводов «Вопросы ракетной техники», 1967, № 1. 23. И ш л и н с к и и А. Ю., Механика гироскопических систем. М., Изд-во АН СССР, 1963. 24. Каляев А. В., Теория цифровых интегрирующих машин и структур. М., Изд-во «Советское радио», 1970. 25. Каляев А. В., Численные методы интегрирования по Стилтьесу в цифровых интегрирующих машинах. «Кибернетика», 1966, № 2. 26. Клейн Ф., Элементарная математика с точки зрения высшей, I и II, перев. с нем. М.—Л., ГТТИ, 1933—1934. 27. К о ш л я к о в В. Н., О применении параметров Родрига — Гамильтона и Кейли — Клейна в прикладной теории гироскопов. «Прикладная математика и механика», 1965, 29, вып. 4. 28. Л а г а л л и М., Векторное исчисление, перев. с нем. М., ОНТИ, 1936. 29. Леви-Чивита Т., Амальди У., Курс теоретической механики, II, ч. 2, перев. с итал. М., ИЛ, 1951. 30. Л е т о в А. М., Устойчивость нелинейных регулируемых систем. М., Физматгиз, 1962. 31. Лурье А. И., Аналитическая механика. М., Физматгиз, 1961. 32. М а й о р о в С. Д., Новиков Г. И., Малогабаритные вычислительные машины. М., Изд-во «Машиностроение», 1967. 33. М а й о р о в Ф. В., Электронные цифровые интегрирующие машины. М., «Машгиз», 1962. 34. Малкйн И. Г., Некоторые задачи теории нелинейных колебаний. М., Гостехиздат, 1956. 35. М э т ь ю с Ф. Б., Тейлор Г. Р., Испытания бесплатформенной инерциальной навигационной системы, перев. с англ. В сборнике переводов «Вопросы ракетной техники», 1970, № 8. 36. Н е с л у х о в с к и й К. С., Цифровые дифференциальные анализаторы. М., Физматгиз, 1963. 37. Н и к о л а е в И. А., О сохранении устойчивости по Ляпунову при моделировании линейных систем дифференциальных уравнений на ЦИМ. «Изв. вузов. Приборостроение», 1968, № 8. 38. О т т е н, Инерциальные навигационные системы без гиростабилизированной платформы, перев. с англ. В сборнике переводов «Вопросы ракетной техники», 1967, № 12.
die ЛИТЕРАТУРА 39. П а р с Л. А., Аналитическая динамика, перев. с англ. М., Изд-во «Наука», 1971. 40 П о н т р я г и н Л. С, Обыкновенные дифференциальные уравнения. М., Физматгиз, 1961. 41. Понтрягин Л. С, Болтянский В. Г., Гамкрелид- з е Р. В., Мищенко Е. Ф., Математическая теория оптимальных процессов. М., Физматгиз, 1961. 42. Р а у ш е н б а х Б. В., Об измерении углов ориентации инер- циальными датчиками. «Космические исследования», 1971, IX, вып. 5. 43. С а в а ж П. Г., Новое решение второго приближения для вычислителя ориентации бескарданной инерциальной системы, перев. с англ. В сборнике переводов «Механика», 1968, № 1. 44. Синг Дж. Л., Классическая динамика, перев. с англ. М., Физматгиз, 1963. 45. Токарь Е. Н., Возможные принципы ориентации космического аппарата относительно вращающейся системы координат. «Космические исследования», 1966, IV, вып. 3. 46. Цифровые дифференциальные анализаторы. Сборник переводов. М., ИЛ, 1959. 47. Ш и л е й к о А. В., Цифровые модели. М., Изд-во «Энергия», 1964. . 48. В о г t z J. E., A New Mathematical Formulatin for Strap-down Inertial Navigation. «IEEE Trans. Aerosp. and Electr. Systems», 1971, No. 1. 49. Brand L., Vector and Tensor Analysis. New York, J. Wiley, London, Chapman and Hall, 1948. 50. Chi Ids D. W., Tap ley B> D., Fowler W. Т., Suboptimal Attitude Control of a Spin-stabilized Axisymmetric Spacecraft. «IEEE Trans. Automat. Contr.», 1969, 14, No. 6. 51. Crubin C, Derivition of the Quaternion Scheme Via the Euler Axis and Angle. «Internat. J. Control», 1968 8, No. 3. 52. Dickinson, Comparison of Digital Differential Analyzer and General Purpose Equipment in Guidance Systems. «Communications and Electronics», 1961, 1, No. 52. 53. Garra d W. L., A Method for Suboptimal Stabilization of Spacecraft Angular Velocity. «Internat. J. Control», 1968 8, No. 3. 54. Hamilton W. R., Elements of Quaternions. Chelsea Publishing Company, New York, 1969. 55. Hamilton W. R., Lectures on Quaternions. Dublin, Hodges and Smith, 1853. 66. I ekes B. P., A New Method of Performing Digital Control System Attitude Computation Using Quaternions. «AIAA Journal», 1970, 8, No. 1. 57. M a s о n W. L., W e d e k i n d D. E., Prediction and Measurement of Strap-down Inertial Measurement Unit Performance on Lunar Mission. AIAA paper, No. 1028, 1970. 58. Mc. К е г n R., G i 1 m о г e J., A Redunant Strap-down Inertial System Mechanization. SIRU AIAA paper, No. 1027, 1970. 59. Mitchell E. L., Rogers A. E., Quaternion Parameters in the Simulation of a Spinning Rigid-Body. «Simulation», New York, 1968.
ЛИТЕРАТУРА 319 60. Mortensen R., A Globally Stable Linear Attitude Regulator. «Internat. J. Control», 1968, 8, No. 3. * 61. Porcelli G., Large-angle Attitude Control of a Spinning Space Body. «IEEE Trans. Automat. Contr.», 1969, 14, No. 6. 62. Q u a s i n s G. R., Strap-down Inertial Systems. «Space/Aeronautics», 1963, 40, No. 3. 63. Robinson A. C, On the Use of Quaternions in Simulation of Rigid-body Motion. WADD Techn. report, No. 58—17, 1957. 64. Smyth R. K., Guidance and Control 1968. AIAA paper, No. 72, 1969. 65. Weber H. J., Inertial Guidance System Uses Digital Integrator. «Space/Aeronautics», 1958, 30, No. 5. 66. W h i 11 а к е г Е. Т., Analytische Dynamic der Punkte and Starren Korper. Berlin, Springer, 1924. 67. Wilcox J. C, A New Algorithm for Strapped-down Inertial Navigation. «IEEE Trans. Aerosp. and Electr. Systems», 1967, 3, No. 5.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аналог матрнцанта 148 Базис неподвижный 43 — связанный 43 Бикватернионы 11 Вектор истинного поворота 150 — конечного поворота 65, 118, 150 — управления сопряженный 246, 249 Верзор 39 — кватерниона 20 Вращение на эйлеровы углы 77 Задача ориентации динамическая 192 кинематическая 192 Кватернион 11, 39 — нормированный 16 кватернион-отображение 99 кватернион преобразования собственный 67 — рассогласования 229 —, сопряженный данному 15 Коррекция 192 — перекрестная 213 Косинусы направляющие 105 Матрица спиновая Паули 88 — унитарная 85 ~, эрмитово сопряженная 85 Метод малого параметра 151 — Пикара 148 — средней скорости 151 — Эйлера модифицированный 150 обычный 150 Модуль кватерниона 29 Норма кватерниона 15 Операция вращения 29 Ориентация во вращающейся системе координат 193 — инерциальная 193 Отображение вектора гиперкомплекс ное 69 — кватерниона 66 Параметры Кейли — Клейна 84, 112 — Родрига — Гамильтона 67 Поворот конечный 26, 65 Преобразование вращения 29 — подобное 52 Прецессия коническая 139 Процесс коррекции 192 Разворот динамический 240 — кинематический 240 Режим скользящий 267 Сепаратриса 263 Символ Леви-Чивита 95 Система координат орбитальная 205 Тензор 39 — вектора 39 — кватерниона 20 Теореиа Гамильтона — Донкина 32 — Эйлера 42, 50 Точка стационарная 264 Угловая скорость экстремальная 280 Углы Крылова 77, ПО — Эйлера 77, ПО Управление особое 258 Уравнение Шеннона 152 Уравнения Пуассона 185 Уход нормы кватерниона 153 Формула Муавра 21, 132 — Родрига 66 Функция Гамильтона 243 Центр вращения 42 Цикл замкнутый 267