Текст
                    В. Ф. Журавлев
Основы
теоретической
механики
Издание второе, переработанное
Москва
Физматлит, 2001


ББК 22.21 Ж91 УДК 531 Рецензенты: Кафедра теоретической механики Московского энергетического института (зав. кафедрой профессор Ю. Г. Мартыненко) Академик Л. Ю. Ишлинский Доктор физико-математических наук, профессор А. П. Маркеев ЖУРАВЛЕВ В.Ф. Основы теоретической механики. Изд. 2-е, перераб.—М.: Издательство Физико-математической литературы, 2001.—320 с.—ISBN 5-94052-041-3. Книгу отличает более глубокий, чем обычно принято в учебной литературе, ана- анализ оснований классической и релятивистской механики, выполненный с единым для этих парадигм подходом. Курс включает изложение элементов теории групп Ли, доста- достаточное для понимания особенностей применения теоретико-групповых идей в совре- современной механике и физике. Традиционные разделы теоретической механики подвергну- подвергнуты серьезной методической переработке с целью, с одной стороны, максимально упрос- упростить введение основных понятий, доказательства теорем и основных методов, с другой стороны, заменить устаревшие представления более эффективными современными. По- Последнее относится, например, к аппарату теории конечных поворотов. Для научных работников, преподавателей, аспирантов, студентов. Ил. 79. © В. Ф. Журавлев, 2001 © Издательство Физико-математической ISBN 5-94052-041-3 литературы, 2001
Оглавление Введение 7 §1. Проблема аксиоматизации классической механики .. 7 §2. Инвариантность и ковариантность уравнений механики 10 Часть I КИНЕМАТИКА Глава 1. Кинематика точки 14 § 3. Основные определения 14 §4. Кинематика точки в естественной системе осей .... 15 §5. Кинематика точки в криволинейных координатах .. 17 Глава 2. Кинематика твердого тела 22 §6. Способы задания ориентации твердого тела 23 1. Углы конечного вращения. 2. Ортогональные матрицы 3. Кватернионы. 4. Спиновые матрицы Паули. 5. Дробно- линейные преобразования § 7. Сложение поворотов 41 1. Группа SOC) 2. Кватернионное сложение поворотов § 8. Топология многообразия поворотов твердого тела .... 49 § 9. Угловая скорость твердого тела 51 1. Определение угловой скорости. 2. Сложение угловых ско- скоростей. 3. Формула Эйлера. 4. Кинематические уравнения Эйлера. 5. Уравнения Пуассона. 6. Теорема о телесном угле Глава 3. Кинематика относительного движения 60 Часть II. ДИНАМИКА Глава 4. Общие теоремы динамики 65 § 10. Определения 65 §11. Теорема об изменении количества движения 67 § 12. Теорема об изменении момента количества движения 68 § 13. Теорема об изменении энергии 70 § 14. Первые интегралы 71 § 15. Теорема Кёнига 71 § 16. Теорема о вириале 72 § 17. Общее уравнение динамики системы связанных материальных точек 74
4 ОГЛАВЛЕНИЕ Глава 5. Специальные задачи динамики 75 § 18. Задача двух тел 75 § 19. Динамика твердого тела с одной неподвижной ТОЧКОЙ 79 1. Геометрия масс. 2. Динамические уравнения Эйлера. 3. Решение в случае Эйлера (М=0) 4. Геометрическая интер- интерпретация Мак-Куллага. 5. Геометрическая интерпретация Пуансо. 6. Уравнения динамически симметричного тела в наблюдаемых переменных. 7. Волчок Лагранжа § 20. Реактивное движение 93 §21. Теория удара 95 1. Понятие об ударе. 2. Общие теоремы теории удара. 3. Удар материальной точки о препятствие. 4. Удар шаров. 5. Удар твердых тел § 22. Теория рассеяния частиц юз Часть III ЛАГРАНЖЕВА МЕХАНИКА Глава 6. Уравнения Лагранжа для голономных систем 106 § 23. Основные определения 106 § 24. Вывод уравнений Лагранжа ill § 25. Свойства уравнений Лагранжа 115 1. Ковариантность. 2. Калибровочная инвариантность. 3. Структура кинетической энергии. 4. Невырожденность. 5. Принцип наименьшего действия по Гамильтону. 6. Дви- Движение по геодезическим § 26. Понятие первого интеграла 120 § 27. Первые интегралы лагранжевых систем 121 Глава 7. Уравнения Рауса 125 § 28. Преобразования Лежандра 125 § 29. Уравнения Рауса 126 Глава 8. Уравнения систем с дополнительными СВЯЗЯМИ 129 § 30. Классификация связей 129 1. Голономные связи. 2. Кинематические связи. 3. Неудер- живающие (односторонние) связи. 4. Стационарные связи. 5. Виртуальные перемещения в случае дополнительных связей. 6. Гипотеза идеальности связей § 31. Уравнения Лагранжа с множителями 133 § 32. Уравнения Аппеля 135 § 33. Уравнения Лагранжа для систем с неудерживающи- ми связями 139 1. Удар в механических системах. 2. Негладкая регуляри- регуляризация. 3. Система с канонической формой кинетической энергии. 4. Приведение к канонической форме. 5. Общие уравнения систем с неудерживающими связями
ОГЛАВЛЕНИЕ 5 Часть IV КОЛЕБАНИЯ И УСТОЙЧИВОСТЬ Глава 9. Равновесие и движение вблизи положения равновесия 153 §34. Определение устойчивости положения равновесия 153 § 35. Корректность понятия устойчивости 155 §36. Общие теоремы об устойчивости линейных систем 157 §37. Устойчивость линейных систем с постоянной матрицей 159 § 38. Устойчивость положений равновесия нелинейных систем 165 1. Теоремы Ляпунова об устойчивости и неустойчивости. 2. Теорема Лагранжа об устойчивости положения равно- равновесия консервативной механической системы Глава 10. Малые колебания в окрестности положения равновесия 171 §39. Колебательная система с одной степенью свободы 171 1. Амплитудно-частотная характеристика. 2. Функция Грина §40. Колебательные системы произвольного числа степеней свободы 174 1. Классификация линейных сил. 2. Свободные колебания консервативных систем. 3. Вынужденные колебания. 4. Осо- Особые направления в пространстве конфигураций линейных консервативных систем § 41. Спектральные свойства линейных систем 187 1. Поведение собственных частот при изменении жесткос- жесткости или массы. 2. Поведение собственных частот при изме- изменении гироскопической связи §42. Нелинейные системы. Метод нормальной формы Пуанкаре 195 §43. Свойства колебаний нелинейных систем 199 1. Нелинейная диссипация энергии колебаний. 2. Автоко- Автоколебания. 3. Вынужденные колебания Часть V ОДНОПАРАМЕТРИЧЕСКИЕ ГРУППЫ ЛИ Глава 11. Элементы локальной теории 207 § 44. Понятие группы 207 § 45. Группа Ли. Примеры 208 §46. Инфинитезимальный оператор группы. Алгебра Ли 215 §47. Однопараметрические группы. Теорема единственности 218 §48. Уравнение Лиувилля. Инварианты. Собственные функции 218
6 ОГЛАВЛЕНИЕ §49. Линейные уравнения с частными производными ... 219 § 50. Канонические координаты группы 225 § 51. Формула Хаусдорфа. Группы симметрии 227 §52. Принцип суперпозиции решений в нелинейных системах дифференциальных уравнений 237 § 53. Теория продолжения 240 §54. Уравнения, допускающие заданную группу 246 §55. Симметрии уравнений в частных производных ... 250 §56. Примеры интегрирования задач механики на основе вычисления симметрии 253 1. Движение материальной точки под действием следящей силы. 2. Задача Суслова 3. Задача о траектории пресле- преследования § 57. Уравнения Пуанкаре 260 Глава 12. Группы симметрии уравнений классической механики 264 § 58. Первый закон Ньютона. Инерциальные системы .. . 264 § 59. Второй закон Ньютона. Группа Галилея 267 Глава 13. Релятивистская механика 269 § 60. Постулаты релятивистской механики 269 § 61. Группа симметрии уравнений Максвелла 271 §62. Оператор второго продолжения. Дважды продолжен- продолженная группа Лоренца 272 § 63. Инварианты группы 274 § 64. Релятивистские уравнения динамики точки 276 § 65. О неинерциальных системах отсчета 277 Часть VI ГАМИЛЬТОНОВА МЕХАНИКА § 66. Уравнения Гамильтона 279 §67. Связь законов сохранения со свойствами симметрии гамильтоновых систем 281 § 68. Инварианты гамильтоновых систем 284 § 69. Канонические преобразования 292 § 70. Уравнение Гамильтона-Якоби 298 §71. Теорема Лиувилля об интегрируемых системах .. 301 § 72. Переменные "действие-угол" 303 § 73. Метод Пуанкаре-Цейпеля 304 §74. Метод Биркгофа нормализации гамильтонианов ... зоб Приложение Теория скользящих векторов 315
Введение § 1. Проблема аксиоматизации классической механики Классическая механика представляет собой аксиоматическую систему. Понятие аксиоматической системы является общематема- общематематическим и состоит в следующем. Построение теории должно начинаться с введения основных для дальнейшего неопределяемых категорий, которые мы обозначим условно буквами А, В, С... Обычно эти категории имеют назва- названия, например, точка, сила и т.д. Однако на этой стадии роль названий минимальна. Индивидуальные свойства у обозначаемых ими объектов появляются не тогда, когда они вводятся, а тогда, когда они связываются друг с другом какими-то соотношениями, называемыми аксиомами. Дополнив введенную систему категорий и аксиом правилами логического вывода, мы можем как угодно глубоко развивать на этой основе теорию, не прибегая ни к каким ссылкам на какую-либо практику или очевидность. Построенная таким образом теория может показаться плодом чистого разума, никакой связи с природой не имеющей. Однако, если в этой природе, или какой-либо другой науке, или области человеческой деятельности, найдутся объекты, которые, будучи поставленными в соответствие с введенными А, В, С,..., окажутся в тех же отноше- отношениях, что и предписываемые аксиомами, то все выводы построенной теории будут верны и для этих объектов независимо ни от каких других их свойств. Установление соответствия между категориями аксиоматической системы и подобными объектами носит название реализации аксиоматической системы. Однако прежде чем подобную теорию строить, необходимо убе- убедиться в "доброкачественности" фундамента, т.е. выбранной акси- аксиоматической основы. В связи с этим рассматриваются три основные проблемы акси- аксиоматики: 1) проблема непротиворечивости, 2) проблема минималь- минимальности, 3) проблема полноты. Непротиворечивость системы аксиом означает, что на ее основе нельзя вывести посредством правильных рассуждений утверждение и отрицание одного и того же факта. Решить проблему минимальности — значит доказать, что каждое положение системы аксиом не зависит от остальных положений, т.е. не может быть получено из них логическим путем. Наконец, полнота системы аксиом означает возможность дока- доказать истинность (или ложность) любого осмысленного утверждения, содержащего рассматриваемые объекты.
8 ВВЕДЕНИЕ Требование построения физико-математических дисциплин на аксиоматической основе было выдвинуто Гильбертом в конце про- прошлого века (шестая проблема Гильберта) и рассматривалось им как необходимое условие достижения абсолютной строгости. Впервые основные аксиомы механики в систематическом виде были сформулированы в 1687 году Ньютоном. Их исследование с целью решения трех вышеперечисленных проблем было предпринято уже в нашем веке. Это потребовало изменить форму представления аксиом механики для того, чтобы максимально приспособить ее к применению методов математической логики. В настоящее время имеется несколько форм представления аксиом механики. Есть аксиоматические системы, основанные на рассмотрении дискретных совокупностей материальных точек. Есть системы, в которых уже в аксиоматике отражена идея континуу- континуума. Некоторые системы были созданы под влиянием идей Маха, который утверждал, что в науку нельзя вводить понятие, не до- допускающее конструктивной проверки на практике. Поэтому все понятия такой метааксиоматической системы строятся так, чтобы ими можно было воспользоваться для выполнения конкретных из- измерений. В системах этого типа непременным является требование соответствия между первоначальными понятиями на формальном, аксиоматическом уровне и наблюдаемыми величинами на эмпири- эмпирическом уровне. Наконец, известна аксиоматизация в чисто гильбертовском духе, когда первичные категории просто перечисляются и их содержание определяется лишь вводимыми аксиомами. Заметим, что изложение любой формальной аксиоматизации классической механики в курсе механики неуместно, поскольку со- составляет фактически главу математической логики, а не собственно механики. Точно так же аксиоматизация арифметики не является предме- предметом самой арифметики. По этому поводу уместно процитировать А. Пуанкаре *, который, анализируя проблему аксиоматизации арифметики в главе "Математика и логика", пишет: ". . . Бурали-Форти определяет число 1 следующим образом: I = сГ{Ко ^ {u)h)e{ueUn)}. Это определение в высшей степени подходит для того, чтобы дать представление о числе 1 тем лицам, которые никогда о нем ничего не слышали!". Так и в механике, имеет смысл предполагать наличие у чи- читателей достаточной физической интуиции, чтобы не перегружать изложение основ избыточным формализмом. Аксиомы классической механики. 1. Первая группа аксиом це- целиком заимствована из геометрии и определяет понятие евклидова * Пуанкаре Л. О науке. — М.:Наука,1983.
§ 1. ПРОБЛЕМА АКСИОМАТИЗАЦИИ КЛАССИЧЕСКОЙ МЕХАНИКИ 9 пространства Е3 и геометрических объектов в нем (точки, прямые, плоскости). 2. Объекты в Е3 полагаются зависящими от скалярного параме- параметра t, называемого временем. Сказанное означает, что в механике рассматривается отображение R1 —> Е3, называемое движением. 3. Материальная точка — геометрическая точка, которой поста- поставлен в соответствие скаляр, называемый массой: (г, т), г — вектор в евклидовом пространстве, отнесенном к какой-либо декартовой системе координат. Масса полагается постоянной, независящей ни от положения точки в пространстве, ни от времени. 4. Каждой паре материальных точек (ri,mi) и (гг.шг) может быть поставлена в соответствие пара векторов Fi и F2, удовлетво- удовлетворяющих условию Fi = —F2 ||(ri — Г2). При этом говорят, что сила F приложена к материальной точ- точке или что она действует на материальную точку. Материальные точки, которым поставлены в соответствие удовлетворяющие при- приведенному условию силы, называются взаимодействующими. Если рассматривается совокупность взаимодействующих материальных точек, то к одной материальной точке может быть приложено не- несколько сил. Их векторная сумма называется равнодействующей. (Эта аксиома одновременно с категорией "сила" вводит и третий закон Ньютона.) 5. В евклидовом пространстве можно найти такую декартову систему координат и такой способ параметризации — t, что mr = F (по традиции, идущей от Ньютона, производная по времени обозна- обозначается точкой над буквой: г = dr/dt). Такие системы координат в Е3 и такой параметр t} для которых справедливо написанное уравнение (второй закон Ньютона), называются инерциалъными системами отсчета. Такова аксиоматика классической механики. Обратим внимание на двойственный характер всех основных категорий механики: с одной стороны, понятия "сила", "масса", "ускорение" — суть абстрактные категории аксиоматической си- системы, для которых второй и третий законы Ньютона служат их определением, с другой стороны, эти понятия апеллируют к реаль- реальным объектам, с которыми имеет дело человеческая практика и на которых осуществляется реализация аксиоматической системы механики. "Сила" при этом представляет собой меру физического взаимодействия тел, измеряемую любыми физическими средствами; "материальная точка" — тело достаточно малых размеров. Реали- Реализацией понятия "евклидово пространство" является пространство неподвижных звезд, лучи света — реализации категории "прямая линия". Декартовы координатные трехгранники, с помощью кото- которых можно задавать положение любых тел в пространстве, могут
10 ВВЕДЕНИЕ связываться с неподвижными звездами при помощи оптических при- приборов. Реализация категории "время" осуществляется посредством сравнения наблюдаемых процессов с каким-либо одним, обычно содержащим повторяющиеся фазы, например, обращение Земли вокруг Солнца. Употребляющиеся в механике термины "однородность" и "изо- "изотропность" пространства и "однородность времени" лежат вне ак- аксиоматической схемы, поскольку они там не нужны. Эти понятия относятся к сфере реализации и определяют свойства реального физического пространства и конкретных способов измерения вре- времени. Пространство называется однородным и изотропным, если физические законы не зависят ни от места в пространстве, где протекают соответствующие явления, ни от направлений в нем. Однородность времени означает возможность выбора таких часов, по которым любая движущаяся материальная точка, на которую не действуют никакие силы, проходит одинаковые отрезки пути за одинаковые интервалы времени. Обратим внимание на то, что вне аксиоматической системы классической механики лежат и та- такие житейские словосочетания как "время течет", "время течет в точке". Время является аргументом функции и ничем больше. Иногда формулировке второго закона Ньютона предпосылают формулировку первого закона: "в евклидовом пространстве всегда можно найти такую декартову систему координат и такой способ параметризации t, что любая свободная материальная точка (F = 0) движется прямолинейно и равномерно или неподвижна". Такой способ введения аксиом механики содержит противоречие (см. §58). Завершая обсуждение проблемы аксиоматизации классической механики, заметим, что программу аксиоматизации физико-матема- физико-математических наук, сформулированную Гильбертом, как известно, в полной мере осуществить не удалось. Геделем было показано, что любая достаточно мощная акси- аксиоматическая система (классическая механика к таким системам относится) не может быть полной, т.е. она допускает истинное недоказуемое высказывание. Отсюда следовала и невозможность установить непротиворечивость системы средствами самой систе- системы. Появилось, однако, понятие относительной непротиворечи- непротиворечивости. Например, классическая механика непротиворечива, если непротиворечива арифметика. Для целей обоснования механики подобный аргумент представляется достаточно убедительным. § 2. Инвариантность и ковариантность уравнений механики Основные законы механики сформулированы Ньютоном в тру- труде "Математические начала натуральной философии". Понятие инерциальной системы отсчета в этой работе отсутствует. Вместо него Ньютон говорит об "абсолютном пространстве" и об "абсо- "абсолютном времени". Например, он пишет: "Абсолютное пространство
§ 2. ИНВАРИАНТНОСТЬ И КОВАРИАНТНОСТЬ УРАВНЕНИЙ 11 по самой своей сущности безотносительно к чему бы то ни было внешнему остается всегда одинаковым и неподвижным". Такое определение ясностью не отличается, однако в конкретных ситуа- ситуациях Ньютон в качестве "абсолютного пространства" рассматривает пространство неподвижных звезд. На то, что законы механики не изменяются при переходе от той системы отсчета, где они вер- верны, к другой, движущейся относительно исходной равномерно и прямолинейно, впервые указал Галилей. Поэтому преобразования, осуществляющие переход от одной инерциальной системы отсчета к другой, носят название преобразований Галилея. Математиче- Математически эти преобразования могут быть выражены следующим образом {*,*, У, *}->{t', x'.i/.z'}: t' =t+r, х' = а + vxt + пцх + а\2у + у' = 6 + vyt + а2\х + а22У + z1 = c + vzt Здесь постоянные г, а, 6, с характеризуют смещение начала отсчета времени и координат, постоянные vX) vy, v2 определяют равномер- равномерное, прямолинейное движение начала новой системы координат относительно старой, постоянные числа а^ определяют матрицу поворота (см. §6) осей новой системы координат относительно старой. Поскольку независимых коэффициентов в произвольной матрице поворота только три, то множество всех преобразований Галилея содержит 10 произвольных параметров и представляет собой 10-параметрическую группу Галилея (см. §58). На современном языке все сказанное выражается следующими словами: законы классической механики инвариантны по отноше- отношению к группе Галилея. Это утверждение носит название принципа относительности Галилея. Термин "инвариантность" в механике и в физике существует наряду с термином "ковариантность". Оба эти термина отражают различные свойства уравнений движения и их не следует путать. Попытаемся пояснить точный смысл обоих терминов. Рассмотрим в общем случае произвольную систему дифференциальных уравнений: t, Q, Я, •••> Я J =0, i = l,..., п. Независимая переменная t — время, зависимая переменная я — вектор, содержащий п компонент. Старшая производная, входящая в систему, Я = dkq/dtk. Пусть над зависимыми и независимыми переменными соверша- совершается преобразование [i) q) —> (*', q')\
12 ВВЕДЕНИЕ Выписанная система дифференциальных уравнений называется инвариантной по отношению к этому преобразованию переменных, если после подстановки замены в уравнения для новых переменных можно полунить уравнения с теми ж,е самыми функциями F,-: , dq' dkq'\ . 9J = o г 1*¦ Пример. Рассмотрим дифференциальное уравнение dq q-t -г- = (q - скалярная переменная) . at q -ft Осуществим преобразование переменных [ty q) —> (t*, 7'): Прямая подстановка этой замены в уравнение дает: После разрешения этого соотношения относительно производной получаем dq' _q' -t' ~аЧ ~~ q' + tr Таким образом, в новых переменных дифференциальное уравнение имеет тот же вид, что и в старых переменных. Преобразования, относительно которых дифференциальные уравнения инвариантны, называются симметриями этих уравне- уравнений (см. §51). Симметрии обладают тем очевидным свойством, что они переводят решения системы в решения той же системы. Пусть, например, мы нашли некоторое решение q = f(t) уравнения dq _ q-t ~dX ~" q + t' Подставим это решение в замену: q'-? = f(t' + q'). Разрешим это уравнение относительно q'\ q'=g(t').
§ 2. ИНВАРИАНТНОСТЬ И КОВАРИАНТНОСТЬ УРАВНЕНИЙ 13 Тогда можно утверждать, что q = g(t) есть еще одно решение рассматриваемого уравнения. В принципе относительности Галилея речь идет об инвариант- инвариантности законов классической механики, а не об инвариантности тех конкретных дифференциальных уравнений, которые могут быть получены в силу этих законов в разных конкретных задачах. Ин- Инвариантность закона означает неизменность правила составления дифференциальных уравнений, но не самих уравнений. В част- частности, инвариантность второго закона Ньютона по отношению к переходу от одной инерциальной системы отсчета к другой означает, что в новой системе мы должны по-прежнему приравнять ускорение точки, умноженное на ее массу, той же самой силе, действующей на точку. При этом в новых переменных эта сила может иметь иное аналитическое выражение. Инвариантность правила составления дифференциальных урав- уравнений по отношению к переходу к новым переменным и называется ковариантностью самих дифференциальных уравнений: ковариантность _ инвариантность закона, дифференциальных уравнений ~~ в силу которого они составлены. В дальнейшем мы встретимся с ковариантностью дифференци- дифференциальных уравнений, составленных в форме уравнений Лагранжа, по отношению к любым заменам обобщенных координат и с ко- ковариантностью уравнений, составленных в форме Гамильтона по отношению к каноническим преобразованиям. И в этих случаях речь идет об инвариантности правила составления дифференци- дифференциальных уравнений, а не об инвариантности самих составленных уравнений *. * В прекрасном учебнике В.И.Арнольда "Математические методы классиче- классической механики" дается ошибочное толкование принципа относительности Гали- Галилея, возникшее из-за смешения понятий "инвариантность" и "ковариантность".
Часть I Кинематика Глава 1. Кинематика точки Задачей кинематики точки является определение таких понятий как положение точки, скорость и ускорение точки, а также установле- установление связи между этими характеристиками при различных способах описания движения точки. § 3. Основные определения Положение материальной точки считается известным, если за- задан радиус-вектор г этой точки в некоторой заранее фиксированной декартовой системе координат. Движение материальной точки за- задается явной функцией времени гB), что соответствует заданию трех скалярных функций времени x(t), y(t), z(t) при рассмотрении радиуса-вектора в некотором базисе i, j, k: Кривая, описываемая движущейся точкой, называется траектори- траекторией. Скоростью точки называется вектор dr dx. dy. dz Функции времени dx dy dz являются проекциями вектора скорости на оси х, у, z. Модуль скорости Ускорением точки называется вектор _ d\ __ d?x. d2y. d2z Проекции ускорения на оси х, у, z есть Wy dt2 ' Wz dt2 '
§ 4. КИНЕМАТИКА ТОЧКИ В ЕСТЕСТВЕННОЙ СИСТЕМЕ ОСЕЙ 15 Модуль ускорения w=\vr(t)\ = Если скорость точки как функция времени задана и требуется найти ее положение, то для этого необходимо решить три диффе- дифференциальных уравнения вида ?=•¦«>. г=*<«>• г-'"- называемых кинематическими уравнениями движения точки, в отличие от уравнений Ньютона, называемых динамическими урав- уравнениями. Решение этих уравнений определяет закон движения точки x(t) = хо+ [ vs{t)dtt y[t) =yo+ / vy(t)dtt z(t) = zo+ [ v,(t)dt, Jo Jo 7o одновременно представляющий собой уравнения траектории, задан- заданные в параметрической форме. § 4. Кинематика точки в естественной системе осей Пусть закон движения точки задан: * = *(*), y = y{t), z = z(t). Выберем на траектории произвольную точку, от которой будем отсчитывать пройденный рассматриваемой точкой по траектории путь s(t). Рассматривая s в качестве нового параметра траектории, получим следующее выражение для скорости точки: d .. drds ds Из дифференциальной геометрии известно, что модуль вектора _ dr T~Ts равен единице, а сам вектор определяет направление касательной к траектории в рассматриваемой точке. Следовательно, модуль скорости определяется производной от пути: i i ds „ = |v|=-.
16 ГЛ.1. КИНЕМАТИКА ТОЧКИ Вычислим ускорение точки: d\ d . ч dv w = dr ds dv dr Вектор dr/ds называется вектором кривизны. Он связан с единич- единичным вектором нормали к кривой п следующим образом: dr ds 1 ~ р где величина р называется радиусом кривизны траектории в рас- рассматриваемой точке. Таким образом, вектор ускорения w оказывается разложенным на два взаимно перпендикулярных единичных вектора тип сле- следующим образом (рис. 1): dv v2 w = -77Т+ —п. dt p Дополнив векторы тип тре- третьим ортогональным им единич- единичным вектором b таким образом, чтобы построенный базис из трех векторов оказался правым, мы и получим то, что называется есте- естественным, или сопровождающим трехгранником траектории. Проекция ускорения w на ось т называется тангенциальным, или касательным ускорением: Рис. 1 w - — Проекция ускорения на нормаль называется нормальным ускоре- ускорением: - vl Р Проекции на вектор b (вектор бинормали) ускорение w не имеет. Пример. Точка движется по винтовой линии x = /icost, y = /isin2, z = It. Путь, пройденный точкой, s = Перепишем уравнения траектории, выраженные через новую неза-
§ 5. КИНЕМАТИКА ТОЧКИ В КРИВОЛИНЕЙНЫХ КООРДИНАТАХ 17 висимую переменную: z = Is Вычисляем базисные векторы сопровождающего трехгранника: dx dy dz 1 ds ' ds' ds / : sin dr = - < cos b = r x n = : Sin :COS /h2 + /2 "" Vh2+ I2 ' V/l2 + /2 " V/l2'+ /2 ' Проекции скорости на оси сопровождающего трехгранника: vT = y/h2 + /2, vn = 0, Проекции ускорения на эти же оси: = 0. wT = -37- = °1 tun = — = Л, 1У6 = 0. § 5. Кинематика точки в криволинейных координатах Положение материальной точки г = {х, у, z} можно задавать не только при помощи декартовых координат х, у, z, но и любых других переменных gi, ^ 9з, через которые декартовы координаты могут быть однозначно выражены: х = z(gi, 92, 9з), У = у(?ь 92, ?з)> г = гGь ^2, Яз). Для того чтобы соответствие между тройкой новых переменных и тройкой декартовых координат было взаимнооднозначным, тре- требуется невырожденность соответствующего отображения, а чтобы 3 Зак. 233
18 ГЛ.1. КИНЕМАТИКА ТОЧКИ вычислять в дальнейшем скорости и ускорение, надо потребовать его дифференцируемость нужное число раз. Если точка движется, т.е. г(?), то новые координаты являются функциями времени: Наша задача состоит в том, чтобы выразить скорость точки v(t) и ускорение w(t) через производные по времени от новых координат и при этом представить эти векторы в проекциях на локальный базис, связанный с новыми координатами. Рассматривая в формуле замены переменных г = r(q\) <?2, <?з) по очереди каждую из переменных qk в качестве параметра при фиксированных оставшихся, получим три семейства кривых, назы- называемых координатными линиями. Сами координаты qk называются криволинейными кординатами. Рассмотрим касательные к координатным линиям в текущем положении наблюдаемой материальной точки (рис. 2). Векторы, определяющие направления этих ка- касательных, выражаются следующим образом: dv _ dx . dy . , dz ._ дт дх . ду . dz _ о— = д—1 + т—J + о—к = Я2е2) Oq Oq Oq vq дг dz рис. 2 ^3 ^3 ^3 U43 Коэффициенты Hk (k = 1, 2, 3) представляют собой норму векторов dr/dqk, а векторы е^ являются единичными векторами направлений, задаваемых векторами \(дх\\(ду\2 (dz Эти коэффициенты называются коэффициентами Ляме. Криволинейные координаты называются ортогональными, если следующие скалярные произведения равны нулю: (ei • е2) = (е2 • е3) = (ei • е3) = 0. Эти условия эквивалентны следующим: дх дх ду ду dz dz + + ~ есЛИ т'
§ 5. КИНЕМАТИКА ТОЧКИ В КРИВОЛИНЕЙНЫХ КООРДИНАТАХ 19 Дифференциал дуги произвольной кривой ds2 = dx2 + dy2 + dz2 может быть выражен через дифференциалы криволинейных коор- координат после подстановки сюда выражений , дх ' дх дх dx = -^—d4\ + -?—d92 + ^—Щз, oq\ Oq2 Oq$ *=&*+&*>¦&*• dz . dz , dz , ^ = д—rfgi + -K—dq2 + o~^з- ^9i ^92 uq3 Результат подстановки приводит к квадратичной форме ds2 = gi называемой метрикой пространства, выраженной в координатах qk (по индексам / и т подразумевается суммирование /, т = 1, 2, 3). Если система криволинейных координат ортогональна, то ме- метрика диагональна и имеет вид ds2 = Я? dg? + Я22 dg| + Нз dq\. Найдем скорость движущейся точки dr дг . Зг . дг . v = — = д—9i + л~92 + ^г~<7з = Я + Яв + Я а< agi адг #9з Скорость оказалась разложенной по единичным векторам v = vxei +v2e2 -f с компонентами Модуль скорости v = Если криволинейные координаты ортогональны, то это выражение принимает вид v = ^H\q\ + НЩ
20 ГЛ.1. КИНЕМАТИКА ТОЧКИ Ускорение движущейся точки также может быть выражено через производные по времени от криволинейных координат и предста- представлено в виде разложения по единичным векторам е^: W = W\e\ -f Для того чтобы найти компоненты wk) нужно исходить из равенства _d^x. d2y. d2z d2r W l+ J+k в котором производные от декартовых координат следует выразить через производные от криволинейных координат: d2x д2х . . дх . + d2y д2у . . ду .. = qq + q d2z d2z . . dz .. л* = ~д^тт + d7,qi (по / и т суммирование). После этого надо выразить векторы исходного базиса i,j,k через векторы базиса ei, ег, ез из системы линейных уравнений: Получающиеся таким образом компоненты ускорения wk имеют достаточно громоздкий вид и далее нигде не используются. Более удобными оказываются ортогональные проекции вектора ускорения на единичные векторы е*: wek=wek {к =1,2,3). Скалярные произведения здесь понимаются в обычном, евклидовом смысле. Если базис efc ортогонален, то wek = wk- Вычислим указанные проекции w€k в общем случае. Используя выражения для е*, получим d\ дт d ( дт \ d дт dt dqk dt \ dqkj dt dqk
§ 5. КИНЕМАТИКА ТОЧКИ В КРИВОЛИНЕЙНЫХ КООРДИНАТАХ 21 Поскольку dq\ dq2 dq$ то д\ _ дг dqk dqk Кроме того, легко видеть, что dt \dqk поэтому d ( dv \ dv Введем обозначение Т = mv2/2. В дальнейшем (Часть II) для этой величины будет введено название кинетической энергии материальной точки. Используя это обозначение для проекции вектора ускорения w на направление, задаваемое вектором е*, получим 1 { d дТ дТ> ек тНк \dtdqk dqk Одним из приложений полученного результата является запись второго закона Ньютона mw = F в общековариантной форме. Дей- Действительно, проецируя это векторное равенство на три оси е^, получим где Т= mv2/2. Термин "общековариантны" означает, что эти уравнения не ме- меняют своей формы при переходе к любым другим допустимым системам криволинейных координат. Допустимыми считаются та- такие координаты, в которых могут быть выполнены все потребные операции дифференцирования и которые не нарушают взаимно однозначного соответствия между точками некоторых открытых областей в пространствах {х, у, z} и {qi, q2) ?з}- Пример. Сферические координаты: х = г cos<pcos0, у = г sin<pcos0, z = rsin#.
22 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Роль переменных gi, g2> <7з играют <р, 0, г, изменяющиеся в пределах О < (р < 27Г, ~7г/2 < 0 < 7г/2, 0 < г < оо. Коэффициенты Ляме: fdx\ (ду\2 (dz\2 2 Локальный базис: ез = {cos ip cos 0) sin (p cos ^, sin ^}. Нетрудно видеть, что базис ортогонален. Разложение скорости в локальном базисе: Ы = гф cos в, V2 = rff, V3 = г. Модуль скорости: v = yjr2(p2cos2e + г2в2 + г2. Функция Т: ei = 2гф cos ^ -f ry? cos 9 - 2гфв sin в, = f -г we2 = 2r^ -f гв + гф2 cos ^ sin 0, Глава 2. Кинематика твердого тела Совокупность материальных точек, состоящая из более чем одной материальной точки, называется твердым телом (иногда абсолютно твердым телом), если расстояние между любыми двумя точками этой совокупности неизменно. Вращением трердого тела называется
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 23 такое его движение, при котором по крайней мере одна точка тела все время неподвижна в выбранной системе отсчета. Произвольное движение твердого тела в пространстве скла- складывается из движения какой-нибудь одной точки этого тела и вращения тела вокруг этой точки. Кинематике точки была посвя- посвящена предыдущая глава. Настоящая глава посвящена кинематике вращательных движений твердого тела. § 6. Способы задания ориентации твердого тела 1. Углы конечного вращения. С любым твердым телом мо- может быть жестко связан координатный трехгранник (триедр), в котором все точки тела неподвижны. Начало этого координатного трехгранника удобно поместить в неподвижную точку. Ориента- Ориентация твердого тела определяется как ориентация одного триедра, (жестко связанного с телом), относительно другого, принимаемого за неподвижный. Исторически первый способ задания ориентации — углы Эйлера (рис. 3). Углы т/>,0 и (р, задающие ориентацию подвижного триедра относительно неподвижного xyz} представляют собой углы Рис. 3 Рис. 4 плоских поворотов, на которые надо было бы мысленно повернуть неподвижный триедр до совмещения его с подвижным. При этом первый поворот осуществляется в плоскости ху на угол ф} второй в плоскости yz на угол 0, третий — снова в плоскости ху на угол (р. Заметим, что плоскость yz после первого мысленного поворота изменила свою ориентацию по отношению к неподвижному пространству. То же можно заметить и про плоскость ху в связи со вторым поворотом. Угол ф носит название угла прецессии, угол в — угол нута- нутации, угол (р — угол собственного вращения. Важно иметь ввиду
24 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА следующее обстоятельство. Три числа ф, в и <р, определяющие ориентацию твердого тела, не являются наблюдаемыми, как это имело место в случае декартовых координат материальной точки. Указанные повороты, наполняющие конкретным содержанием углы ф, 0, <р, представляют собой воображаемую конструкцию, которая может быть и иной. Например, одной из распространенных в настоящее время последовательностей поворотов является изобра- изображенная на рис. 4 (углы Крылова-Булгакова). Здесь углы а, /3 и 7 позволяют мысленно совместить неподвижную систему с по- подвижной, совершая первый поворот вокруг первой оси на угол а, второй поворот вокруг второй оси на угол /3 и третий поворот во- вокруг третьей оси на угол 7- Символически эту последовательность можно изобразить так: 1-2-3. Можно представить себе и другие последовательности поворотов; например, последовательность 3-1-2 означает, что первый поворот выполнен вокруг третьей оси, второй — вокруг первой и последний поворот вокруг второй оси. Последовательность, образующая углы Эйлера, записывается так: 3-1-3. Совокупность возможных последовательностей называ- называется системой углов конечного вращения. Все последовательности поворотов могут быть разбиты на четыре класса: I 1-2-3, 3-1-2, 2-3-1; II 1-3-2, 2-1-3, 3-2-1; III 1-2-1, 2-3-2, 3-1-3; IV 1-3-1, 3-2-3, 2-1-2. В I и II классах повороты осуществляются вокруг всех трех осей, в III и IV классах одна из осей пропущена. Для удобства опи- описания свойств выделенных классов в III и IV классах изменим обзначения последовательностей поворотов; на первом месте будет стоять номер оси, вокруг которой поворот осуществляется дважды, а на третьем месте — номер оси, вокруг которой вращения нет. Например, в случае углов Эйлера 3-1-3 обозначение этой последо- последовательности принимает вид 3-1-2. Так что последние два класса переписываются в виде III 1-2-3, 2-3-1, 3-1-2; IV 1-3-2, 3-2-1, 2-1-3. В этих обозначениях в один класс попадают все последовательности поворотов, которые получаются одна из другой четной подстанов- подстановкой (напомним, подстановка называется четной, если она состоит из четного числа инверсий двух соседних элементов). Переход от класса I к классу II, а также от класса III к классу IV осуществляется нечетной подстановкой. Все последовательности поворотов, принадлежащие одному клас- классу, являются эквивалентными между собой в том смысле, что при одних и тех же числовых значениях углов а, /?, 7 положение тела, задаваемое одной последовательностью, отличается от положения
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 25 тела, задаваемого другой последовательностью, поворотом тела вокруг биссектрисы координатного угла на угол ±120°. Таким образом, из двенадцати возможных последовательностей поворотов вокруг координатйых осей существенно различными явля- являются лишь четыре. Последовательности из I и II класса называются углами копейного вращения первого рода. Последовательности из III и IV — углами конечного вращения второго рода. Нижеследующая теорема доказывает, что для определения по- положения твердого тела трех углов достаточно. Теорема. Любое положение твердого тела может быть полу- получено тремя последовательными плоскими поворотами из любого начального положения любым из указанных выше способов. Доказательство проводится одинаково для любого из четырех классов. Для определенности остановимся на I классе (углы Крылова-Булгакова). Обратимся к рис. 5. Пусть триедр f^C произвольно ориентирован относительно триедра xyz. В общем случае плоскость yz пересекается с плоскостью ?г) по прямой /. Если плоскости совпадают, то это означает частный случай, когда триедр xyz удается совместить с триедром ?т}? двумя или даже одним плоским поворотом. Если случай общий, то прямая / существует и поворотом триедра xyz вокруг оси х ось у можно совместить с прямой /. Поскольку на прямой / не определено направление, то мини- минимальный угол этого поворота лежит в пределах 0 < а < тт. В новом положении триедра xyz его ось у перпендикулярна оси ? (поскольку прямая / перпендикулярна, оси Q. Значит, вторым поворотом триедра xyz вокруг оси / (или у) можно совместить ось z с осью С- Поскольку необходимо обеспечить и совпадение направлений этих осей, то минимальный угол этого поворота лежит в пределах 0 < /3 < 2я\ После второго поворота плоскости ху и ?т) Рис. 5 Рис. 6 2 Зак 233
26 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА оказываются совпавшими, и для полного совмещения трехгранников достаточно повернуть триедр xyz вокруг оси z на угол 0 < 7 < 27г. Теорема доказана. На рис. 6 изображен параллелепипед, у которого противополож- противоположные грани отождествлены и каждой точке которого соответствует единственное положение твердого тела. При этом в силу доказанной теоремы оказываются исчерпанными все положения тела. Между тем взаимно однозначного соответствия между положениями тела и точками изображенного параллелепипеда нет. Если угол /3 равен 7г/2 или 37г/2, то ось z после второго поворота занимает положение оси х и третий поворот складывается с первым поворотом, образуя единый плоский поворот а+7- Иными словами, множеству точек а + 7 = const, /? = 7г/2 соответствует одно положение твердого тела. Если /3 = 37г/2, то этим свойством обладает множество а — 7 = const. Этот факт является общим для углов конечного вращения первого рода. Для углов второго рода плоскостями, в которых нарушается единственность представления положений твердого тела тремя углами, являются плоскости /3 = 0 и /? = тг. Это неудобство углов конечного вращения заставляет искать другие способы задания положений твердого тела, не имеющих указанных вырождений. 2. Ортогональные матрицы. Поворот твердого тела математи- математически может быть задан как линейное отображение трехмерного евклидова пространства в себя, при котором расстояния между произвольными точками неизменны. Такие отображения называ- называются ортогональными. Пусть вектор R задан в триедре xyz (нам удобно здесь его представлять как матрицу-столбец): ту Преобразованием поворота этот вектор отображается в вектор R': /х'\ R'= I уЧ. Само преобразование в триедре xyz задается матрицей А: R' = имеющей вид 021 <*22 023 Я32 <*33
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 27 Из определения поворота следует равенство скалярных квадратов векторов R и R': R R = R' R', откуда вытекает R R = AR AR = R AT AR. И, следовательно, АтА = Е — произведение транспонированной ма- матрицы на саму эту матрицу равно единичной матрице. Это условие означает, что столбцы матрицы А представляют собой ортонор- мированную систему (сумма квадратов элементов столбца равна единице, а скалярное произведение различных столбцов друг на друга равно нулю). Такие матрицы называются ортогональными. Пример. Рассмотрим преобразование поворота на угол (р вокруг оси х. Поскольку первая координата вектора R при этом не изменяется, будем считать, что он целиком лежит в плоскости yz (рис. 7). Для установления связи координат преобразованного вектора у', z1 с координатами исходного вектора у, z повернем треугольник z' У У Рис. 7 У' Рис. 8 OyR на угол (р так, чтобы R совместилось с R' (рис. 8). Из полученного рисунка непосредственно видно, что у7 = у cos <p—z simp, z1 = ysin^ + zcos^?. Если вектор R не лежит в плоскости поворота, то к этим двум соотношениям следует добавить х' = х и матрица поворота вокруг оси х принимает вид А •=¦ Аналогично можно установить, что матрицы поворотов вокруг осей у и z соответственно имеют вид cosy? 0 siny?\ /cosy? —simp 0> О 1 0 ) , I sin^p cosy? О -siny? О cosy?/ \ 0 0 1 2* 1 0 0 0 cosy? sin у? 0 -sin у? cosy?
28 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Здесь учтено, что в плоскости zx положительным является поворот от оси z к оси х. Отметим важнейшие свойства ортогональных матриц. Свойство 1. Из равенства det (ЛТ А) = 1 вытекает det A = ±1. Свойство 2. Из алгебры известно, что если det Л ф О, то существует и единственна матрица, обозначаемая А и удовлетво- удовлетворяющая свойству А А = АА~1 = Е. Это означает, что в случае ортогональных матриц АТ — А и ААТ = Е% т.е. не только столбцы представляют ортонормированную систему, но и строки тоже. Свойство 3. Произведение двух ортогональных матриц есть орто- ортогональная матрица. Действительно, пусть А и В — ортогональные матрицы, и рассмотрим С = АВ. Тогда СТ = (АВ)Т = ВтАт. Что влечет СтС = Вт Ат АВ = Е. Свойство 4. Поскольку операция произведения матриц является ассоциативной, то из предыдущих двух свойств вытекает, что мно- множество всех ортогональных матриц образует группу. (Напомним, в алгебре группой называется любое множество элементов, в котором есть единица и для каждого элемента существует обратный в силу единственной ассоциативной операции. См. гл. 11.) Эта группа имеет стандартное обозначение 0C). Множество ортогональных матриц с положительным детерминантом образует подгруппу. Ее обозначают 50C). Читается это обозначение так: специальная, ортогональная группа преобразований трехмерного пространства в себя. Свойство 5. Между всеми ортогональными матрицами (det A = = 1) и всеми поворотами твердого тела существует взаимноодно- взаимнооднозначное соответствие. Действительно, рассмотрим образ первого единичного вектора триедра xyz: (n 2 i a21 a22 a23 т.е. образом первого орта является первый столбец матрицы А. Аналогично для остальных. Но это значит, что если задана ортогональная матрица, то однозначно определяется положение нового триедра. И обратно, если задано положение нового триедра, то, выбирая его орты в качестве столбцов матрицы Л, получаем однозначное определение этой матрицы. При этом номер столбца соответствует номеру орта, что влечет за собой det A = 1. Итак, группа 50C) является основной математической моделью множества всех поворотов твердого тела. Она представляет собой конфигурационное многообразие твердого тела с одной неподвижной точкой.
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 29 Свойство 6. Элементы ортогональной матрицы равны их алге- алгебраическим дополнениям. Действительно, используя правило вычи- вычисления обратной матрицы, имеем Л~1 = {A{j}T/det А. Рассмотрим лишь матрицы с det А = 1 и, учитывая, что АТ = А'1, находим *ij = Aij . Свойство 7. Определим действие ортогонального преобразования на комплексный вектор: где Р и Q — вещественные векторы. Если определить норму комплексного вектора как |Р + tQ| = у/(Р + iQ)-(P + »Q) = \/PTP + QTQ, то свойство ортогональных преобразований сохранять норму вектора распространяется и на комплексные векторы. (Звездочкой обозна- обозначен эрмитово сопряженный вектор, получающийся из исходного транспонированием и заменой г на —г.) Свойство 8. Собственные векторы и собственные числа ортого- ортогональных преобразований. Собственные векторы удовлетворяют условию АК = AR, где А — числовой коэффициент. Поскольку ортогональное преобразование не изменяет длину вектора, то |А| = 1. Собственные числа находятся из уравнения det(A-XE) = 0, которое, используя свойство 6, можно получить в виде А3 - A2tr A -f Atr А — 1 = 0. Здесь след матрицы tr А = аи + Я22 + азз- Это уравнение имеет очевидный корень Ai = 1. Для двух других получаем tvA- Поскольку модуль равен единице, то тригонометрическая форма этого выражения в общем виде такова: \2 з = cos <p ± г sin (p. Следовательно, Для нахождения трех собственных векторов Кк (к = 1,2,3), со- соответствующих трем собственным числам А^, следует решить три однородные системы AKk = A^Rfc. Первое собственное число — вещественное, вещественным будет и первый собственный вектор
30 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА для нахождения которого имеем (оц - 1)х + о>\2У + ^13^ = О, О>2\% ~Ь (а22 ~"~ 1)У "Ь 023^ = 0) аз1Х -h азгУ + (азз ~ 1)^ = О, Добавленное последнее уравнение вызвано желанием получить соб- собственные векторы единичной нормы. Эта система имеет два реше- решения, отличающиеся знаком: , Я32 — <*23 п\з ~ О31 O21 ~ п\2 х±У = ЬZ ± 2 sin <p 2 sin (p 2sin(p Выбор знака определим условием: поворот вокруг координатной оси на положительный угол должен осуществляться против часо- часовой стрелки, если смотреть на него со стороны положительного направления оси. Для матрицы поворота вокруг оси х, вычисленной в последнем примере, имеем аз2 = sin^>, О2з = — sin^>, а\з = а^\ = 021 = ^12 = 0. Следовательно, z = ±l,y = O,z=O. Таким образом, в полученном решении следует оставить знак плюс. Собственные векторы для комплексно сопряженных собственных чисел Аг.з = cos (p±isimp являются тоже комплексно сопряженными: R2|3 = Р Т iQ Покажем, что три вещественных вектора R, P, Q представляют собой правую, ортогональную систему векторов. Вначале вычислим произведение (j4Ri) R2. С одной стороны, С другой стороны, )T R2 = Rj" ATR2 = A3R^ • R2 Использован тот факт, что R2 есть собственный вектор матрицы Ат с собственным значением А = 1/А2 = А3. Сравнивая оба результата, видим, что если Аз ф 1, то Ri R2 = = 0, откуда следует, что RT • Р = 0 и RTQ = 0. Поступая как в предыдущем случае, получим, с одной стороны,
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 31 с другой стороны, {AR2)T R2 = A3R2T-R2. Сравнивая результаты, видим, что если А2 ф А3, то Rj • R2 = 0 или Р2 - Q2 + 2zPTQ = 0, откуда Р2 = Q2 и PTQ = 0. Случай Ai = А2 = А3 = 1 означает тождественное преобразование А — Е, для него все векторы собственные, так что всегда найдутся взаимно ортогональные. Осталось показать, что система Р, Q, R является правой. Для этого найдем собственные векторы для комплексных собственных значений для частного случая поворота вокруг оси я, рассмотрен- рассмотренного в последнем примере. Система для нахождения R2 имеет вид или ~ isin(p)x = 0, у — sirup • z = 0, sin (p - у — г sin <р • z = 0. Из нее следует: х = 0, у = 1, z ?= -г. Так что собственный вектор R2 = Р — iQ имеет вид R2=( 1 |, P = | 1 | , Q = Система R= I 0 I , P= I 1 I , Q = является правой. Поскольку общий случай отличается от рас- рассмотренного преобразованием с положительным детерминантом, то доказанное верно и в общем случае. Свойство 9. Любое ортогональное преобразование пространства эквивалентно повороту пространства вокруг собственного вектора R на угол <р. Действительно, перепишем уравнение АКк = A^R^ для каждого собственного вектора в вещественной форме: = R, АР = Р cos <p -h Q sin <p, AQ = ~Р sin (p -f Q cos <p.
32 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Если оси исходного триедра i,j,k выбрать направленными по век- векторам R, P, Q, то R= 0 , P= 1 , Q= О и из полученных соотношений следует (AR}AP}AQ) = А = 1 0 0 0 coscp sin^> 0 — sin^> cos^? т.е. в базисе R,P,Q ортогональная матрица имеет вид матрицы плоского поворота вокруг вектора R на угол (р. Следствие (Теорема Эйлера). Любое перемещение твердого тела с одной неподвижной точкой может быть заменено плоским поворотом вокруг некоторой оси на некоторый угол. В свойстве 9 вычислено направление этой оси и соответствующий угол. 3. Кватернионы. Рассмотрим четырехмерное векторное про- пространство над полем вещественных чисел. Любой элемент этого пространства Л в каком-либо базисе г0, г'ь г'г, г'з имеет вид Л = Лого + Aiii + A2i2 + А3г3. Вещественные числа Ао, Ai, А2, Аз называются координатами векто- вектора Л в заданном базисе. Векторное пространство превращается в алгебру, если в нем определено произведение двух векторов, ставящее им в соответствие третий вектор. Закон умножения должен быть ассоциативным: для любых трех векторов. Он должен быть дистрибутивным: для любых четырех векторов. Наконец, этот закон обязан удовле- удовлетворять условию {\А)о(/лМ) = XfiAoM, где A,/i — произвольные вещественные числа, А,М — произволь- произвольные векторы. Заметим, что это определение алгебры годится для векторного пространства любой размерности. При этом размерно- размерностью алгебры называется размерность ее как векторного простран- пространства. Также заметим, что коммутативность операции умножения не предполагается.
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 33 В силу этих требований для того чтобы знать произведение лю- любых двух векторов, достаточно знать таблицу умножения векторов базиса. Четырехмерные векторы называются ^кватернионами, если умножение их, удовлетворяющее сформулированным требованиям, задается следующей таблицей умножения ортов: i'o о ik =ik ° io = ifc, k = О, 1, 2, 3, ik oik = —«oi к = 1, 2, 3, l'l О 12 =«3i 1*2 О i3 = l'l, 13 О l'l = 1*2, 1*2 ° l'l = — 1*3) 1*3 ° 1*2 = —l'l) l'l ° h = —1*2 • Введенная абстрактная алгебра кватернионов допускает раз- различные интерпретации. Для того чтобы понять, чем абстрактное определение отличается от интерпретации, обратимся к примеру алгебры комплексных чисел. Эта алгебра построена на базе дву- двумерного векторного пространства Л = Лого + Aiz'i со следующей таблицей перемножения ортов: г0 о г0 = г'о) i'o ° i'i = i'i ° i'o = гь i'i ° i'i = —i'o- Укажем три различные интерпретации комплексных чисел. Геометрическая интерпретация. Каждый вектор Л понимается как направленный отрезок прямой в геометрической плоскости. Матричная интерпретация. Если под г'о понимать матрицу 1 0\ . /О -Л ), а под zi — матрицу ( ^ ) , то векторное пространство матриц вида 0 )-{Xl Ло с обычным правилом произведения матриц подчиняется введенным выше правилам умножения в абстрактной форме. Числовая интерпретация. Если под г'о понимать вещественное число 1, а под z'i — мнимое число \/—1, то векторное пространство чисел вида также подчиняется введенным правилам умножения. Вернемся теперь к кватернионам. Важнейшей их интерпретацией является геометро-числовая интерпретация. В этой интерпретации орт г'о отождествляется с вещественной единицей, а орты м, г2, г'з являются ортами некоторого базиса трехмерного евклидова про- пространства. Таким образом, любой кватернион может быть записан так: Л = Ао + Aiii + A2i2 4- Л31з = Ао + Л, Ао € Я1, A G Еъ.
34 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Если при этом определить правила произведения трехмерных ортов как i/c о ik = -1, ik о i/ = ik x i/ (A / /), то произведение любых кватернионов будет подчиняться введенным выше правилам в абстрактной форме (здесь i* х i/ — обычное век- векторное произведение в трехмерном пространстве). В дальнейшем в этой интерпретации мы будем часто использовать традиционные обо- обозначения ортов: i 1 = i, i2 = j, i3 = k. Эта интерпретация позволяет выписать формулу произведения двух произвольных кватернионов: Л = Ао + А, М = /io + м> КоМ — Ао/хо -А-/х + Ао/х + ^оА + Ах/х. Матричная интерпретация кватернионов (спиновые матрицы Паули) будет изложена далее. Для того чтобы векторное пространство превратить в алгебру, таблица умножения ортов может выбираться произвольно. Та кон- конкретная таблица, которая предложена выше, обладает уникальным свойством: она и только она позволяет во введенной алгебре ква- кватернионов построить деление, т.е. определить операцию, обратную введенной операции умножения. Заметим, что в конечномерном пространстве алгебру с делением можно ввести только в трех случаях: алгебра вещественных чисел, алгебра комплексных чисел и алгебра кватернионов. При этом первые две коммутативны (Теорема Фробениуса). Введем понятие сопряженного кватерниона: Л = Ао + А, Л = Ао — А и нормы кватерниона ||Л|| = Л о Л = Л о Л = А02 + Xi2 + А22 + А32. Основные свойства операции умножения. Свойство 1. Введенное произведение некоммутативно: поскольку ik о'ц ф 'ц о U (к Свойство 2. Сопряженный кватернион от произведения двух и более кватернионов равен произведению сопряженных кватернионов в обратном порядке: Л о «М = М. о Л. Действительно: (Ао + А) о (/i0 + /х) =Ao/io - А /х - А0/х - /ioA - А х д, (а*о + м) ° (Ао + A) =Ao/io - А • /х - А0/х - /ioA + /х х А.
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 35 Свойство 3. Норма произведения равна произведению норм: ||Л о М\\ = (Л о М) о (Л о М) = Л о М о М о Л = Свойство 4. Операция произведения кватернионов инвариантна по отношению к ортогональным преобразованиям векторной части кватернионов. Сказанное означает следующее. Пусть умножаются два кватерниона Л = Ао+А и .М = /хо + М и в результате получается кватернион N = По + n. Если перед тем как умножать, в векторной части осуществить ортогональное преобразование: А' = Л А, /х' = А/х и после этого перемножить преобразованные таким образом кватер- кватернионы Л' = Ао + А', М! = /io + M;> TO получится кватернион, равный ЛЛ = п0 + An. То есть операции перемножения кватернионов и ор- ортогонального преобразования векторной части можно переставлять местами. Это свойство следует из того, что в формуле для произведе- произведения кватернионов скалярное произведение А/х не изменяется при ортогональных преобразованиях, а векторное произведение А х /х, как известно, обладает свойством инвариантности. Свойство 5. Для любого ненулевого (||Л|| ф 0) кватерниона существует обратный. Легко видеть, что этим свойством обладает кватернион ~ЦЛ|Г Кватернионы, рассматриваемые в числовой интерпретации, носят также название гиперкомплексных чисел. Для гиперкомплексных чисел основная теорема алгебры неверна. Пример. Решить, уравнение х2 + х + 1 = 0. а) В вещественных числах решений нет. б) В комплексных числах решений два: 1 ^.лД 2 2 в) Найдем все решения в гиперкомплексных числах х = хо + х: х2 = (х0 + х) о (х0 + х) = xl - х2 + 2хох. Подставляя это соотношение в уравнение, получаем х2 - х2 + 2хох + х0 + х + 1 = 0. Кватернион равен нулю тогда и только тогда, когда равны нулю отдельно его скалярная и векторная части: xl - х2 + хо + 1 = 0, Bх0 + 1)х = 0.
36 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Если х = 0, то уравнение для х0 неразрешимо, если х ф О, то хо = —1/2 и из первого уравнения находим 2 3 Таким образом, решением предложенного уравнения является любой кватернион вида 1 х = -- где ||х|| = уД/2. Решений бесконечно много. Основная теорема алгебры о том, что решений в комплексных числах столько же, каков порядок уравнения, здесь не имеет места. Использование кватернионов для задания положения твердого тела с одной неподвижной точкой основано на свойствах вводимого ниже присоединенного отображения: П -+ П1: П' = Adll = Л о П о Л. Это отображение алгебры кватернионов в себя (R, — произволь- произвольный кватернион) определяется фиксированным кватернионом Л, имеющим единичную норму ||Л(| = 1. Присоединенное отображение обладает следующими свойствами. Свойство 1. Отображение Щ = AdH не меняет скалярной части кватерниона: Остается показать, что Л ого Л не имеет скалярной части. Действительно, ЛогоЛ = ЛогоЛ= -Л or о Л. Сопряженный кватернион равен исходному со знаком минус, если у него нет скалярной части. Свойство 2. В силу свойства 1 присоединенное преобразова- преобразование действует так, что векторная часть кватерниона подвергается линейному преобразованию: г' = Лг. При этом А является ортогональной матрицей.
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 37 Действительно, рассмотрим норму Следовательно, г02 + г[2 + г'22 + г'32 = г2 + т\ + т\ + г|. Поскольку г'0 = г0) то ||г'|| = ||г||. Таким образом, ортогональные преобразования можно задавать наряду с ортогональными матрицами также и единичными кватер- кватернионами: ||Л|| = 1. Запишем такой кватернион в форме Л = Ао + Ае, где А — модуль вектора Л, а е — единичный вектор его напра- направления. Из условия ||Л|| = 1 следует Ад + А2 = 1. Два скаляра, удовлетворяющие уравнению единичной окружности, всегда мо- могут быть представлены в виде: Ао = cos(^>/2), A = sin(^>/2). Тогда Л = cos(^/2)-f-esin(^>/2) с условием |е| = 1 представляет собой общий вид кватерниона единичной нормы. Теорема. Поворот, определяе- определяемый кватернионом Л в Е3, есть поворот вокруг вектора е на угол ^ (рис. 9). Доказательство состоит в не- непосредственном вычислении матри- матрицы поворота А по заданному ква- кватерниону cos(<p/2) + esin(<p/2). В соответствии со свойством 5 (см. п. 2) столбцы матрицы А предста- представляют собой образы ортов исходно- исходного базиса. Вычислим эти образы. При этом исходный базис выберем так: ii = e, i2,i3 -1- е. (Свободу в выборе базиса в Е3 нам гарантирует свойство 4 операции умножения кватернионов.) Тогда i[ = (cos | + ii sin |) ° ii ° (cos | - ii sin |) = ib cos —h ii sin — ) о i2 о I cos ii sin — 1 = i2 cos (p + 13 sin ю. 2 2/ V 2 2/ cos — -f ii sin — J о i3 о (cos — - ii sin — J = ~i2 sin (p + 13 cos (p. Следовательно, /10 0 A = I 0 cos (p - sin (p ) , у 0 sin (p cos (p что и требовалось доказать. р
38 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Таким образом, в записи единичного кватерниона cos(<p/2) + 4-esin(<p/2), определяющего присоединенное отображение, е есть единичный вектор оси эйлерова поворота Е3, а <р — угол это- этого поворота. В покомпонентной записи в соответствии с ранее полученным этот кватернион имеет вид ( ф ф ф ф Л = (cos -, ж sin-, у sin-, z sin — Коэффициенты этого кватерниона A0 = cos-, A1 = xsin^l A2 = ysin|, 3 | носят название параметров Родрига-Гамильтона конечного пово- поворота. 4. Спиновые матрицы Паули. Спиновые матрицы Паули по- позволяют дать матричную интерпретацию алгебры кватернионов, в которой правила, определяющие перемножение ортов, предста- представляются наиболее естественным образом. Дадим для этих ортов следующую матричную интерпретацию: (I 0\ . /О «Л . (О -Л . (х О Здесь t = л/^Т. Можно проверить, что если под произведением по- понимать обычное матричное умножение, то введенная ранее таблица умножения ортрв оказывается выполненной. Кроме того, выполнен- выполненными оказываются и все остальные аксиомы алгебры кватернионов. Следовательно, любой кватернион может быть переписан так: Конкретные интерпретации обладают рядом свойств, лежащих вне исходных аксиом, которыми можно с успехом пользоваться. В данном случае матрицы можно сложить и записать кватернион так: после чего перемножение подобных кватернионов осуществлять как обычное умножение матриц. Сопряженный кватернион имеет вид -г- / Ао — ^Аз Л2 — iA1 "" V -^2 - t'Ai Ао + г'А3
§ 6. СПОСОБЫ ЗАДАНИЯ ОРИЕНТАЦИИ ТВЕРДОГО ТЕЛА 39 Видно, что сопряженный в ранее определенном смысле кватер- кватернион, рассматриваемый в матричной форме, представляет собой эрмитово-сопряженную матрицу (комплексно-сопряженную и транс- транспонированную): При этом норма кватерниона равна детерминанту соответствующей ему матрицы Так что кватернионы единичной нормы, служащие для определения положения твердого тела, описываются комплексными матрицами 2x2, удовлетворяющими двум условиям ЛЛ* = Е, det Л = 1. Элементы таких матриц, являющиеся комплексными комбинациями компонент кватерниона, называются параметрами Кейли-Клейна: а = Ло + iA3, b = Л2 -f i\\. В этих обозначениях матричная интерпретация кватерниона при- приобретает вид 'a —t Некоторые представления о других свойствах параметров Кейли- Клейна дают 5. Дробно-линейные преобразования. Рассмотрим поворот твер- твердого тела как преобразование единичной сферы в себя (рис. 10). Рис. 10 Поворот осуществляется вокруг оси, задаваемой единичным векто- вектором е, на угол <р, т.е. описывается следующим кватернионом: Л = = cos((p/2) + esin((p/2). При стереографическом проектировании сферы на плоскость ху повороту сферы будет соответствовать некоторое преобразо- преобразование плоскости. Выясним, какое именно. Покажем, что любая
40 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА окружность на сфере при стереографическом проектировании пе- переходит в окружность (при этом прямые считаются окружностями, которые проходят через бесконечно удаленную точку). Для этого рассмотрим в плоскости ху произвольную окружность и проведем через нее коническую поверхность с вершиной в полюсе С. Этот конус пересекает сферу по кривой, являющейся прообразом рас- рассматриваемой окружности при стереографическом проектировании. Если окружность в плоскости ху проходит через бесконечно уда- удаленную точку, т.е. является прямой, то конус превращается в плоскость и сечение сферы плоскостью есть всегда окружность. В общем случае рассмотрим сечение сферы плоскостью, прохо- проходящей через ось конуса и перпендикулярной плоскости ху. Это сечение изображено на рис. 11. Точки L и М, лежащие в этом сечении, принадлежат и конусу, и сфере. Проведем через эти точки плоскость П перпендикулярно плоскости сечения. Поскольку угол Рис. 11 ABC равен половине угла, стягиваемого дугой CL, а угол САЛЬ опирается на эту дугу, то эти углы равны. Следовательно, плос- плоскость П ориентирована по отношению к конусу так же, как и плоскость ху (поворотом вокруг оси конуса на угол тг плоскость П переводится в положение, параллельное плоскости ху). Сле- Следовательно, сечение конуса плоскостью П — тоже окружность. Плоскость П сечет сферу по окружности, поскольку точки L и Л4 у этих окружностей общие, то они совпадают. При повороте сферы, задаваемом кватернионом Л, любая окруж- окружность на ней переходит в другую окружность. По доказанному, образы этих окружностей на плоскости также являются окруж- окружностями. Но это означает, что преобразованию поворота сфе- сферы соответствует такое преобразование плоскости, которое любую окружность переводит в окружность. Из теории функций комплекс- комплексного переменного известно, что такими преобразованиями являются
§ 7. СЛОЖЕНИЕ ПОВОРОТОВ 41 ного переменного известно, что такими преобразованиями являются дробно-линейные преобразования z = х + гу —> w = u + u>: m + nz Представляет интерес найти связь между компонентами кватер- кватерниона Л и параметрами дробно-линейного преобразования р, g, m, п. Для того чтобы это сделать, достаточно знать, как преобразуются три произвольные точки плоскости. В качестве таких точек удобно взять две неподвижные точки, получающиеся стереографическим проектированием точек пересечения прямой е со сферой и одну из точек 2 = 0 или z = со, соответствующих проектированию нижнего или верхнего полюса. Опуская эти, не представляющие никакого интереса выкладки, получаем az — Ь w = . bz + a То есть параметры Кейли-Клейна и определяют то дробно-линейное преобразование, которое является стереографическим образом ко- конечного поворота. § 7. Сложение поворотов В предыдущем параграфе изложены три основных способа за- задания положения твердого тела с одной неподвижной точкой: углы конечного вращения (с обязательным указанием последовательности воображаемых поворотов), ортогональные матрицы, отображающие базис неподвижной системы координат в базис, жестко связанный с телом, и кватернионы, выполняющие ту же роль, что и матрицы, но с меньшим числом параметров. Задание поворота параметрами Кейли-Клейна или дробно- линейными функциями по сути своей эквивалентно заданию его кватернионом, имеется лишь некоторое отличие в правилах опери- оперирования с этими параметрами. Важнейшей задачей кинематики твердого тела является задача сложения двух или нескольких поворотов, т.е. задача вычисления по параметрам составляющих поворотов параметров результирующе- результирующего поворота. Пусть, например, положение некоторого трехгранника х'у'z' определено углами Эйлера ф\) 9\) <р\ относительно неподвиж- неподвижного трехгранника xyz, а положение твердого тела, с которым жестко скреплена система ?т?С определяется углами ф2) 02) <р2 от- относительно трехгранника x'y'z'. Требуется найти углы т/>з, #з> ^3) определяющие положение тела относительно исходной системы xyz. Эта задача в углах конечного вращения вообще и в углах Эйле- Эйлера в частности имеет очень громоздкое решение. Между тем в
42 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА матрицах или в кватернионах операция сложения поворотов есть основная операция соответствующей группы (группы 50C), или группы единичных кватернионов). 1. Группа S0C). Если после преобразования поворота R —> R/ с матрицей А R' = AR осуществляется новое преобразование R/ —> R" с матрицей В R" = то результирующее преобразование R -> R", очевидно, получается так: R" = BR' = BAR. Матрица С — В А, равная произведению матриц составляющих по- поворотов в обратном порядке, и есть матрица, задающая суммарный поворот. До сих пор мы смотрели на ортогональное преобразование как на оператор, отображающий пространство в себя. Система ко- координат, в которой записывалась матрица этого преобразования, была неизменной. Это так называемая активная точка зрения на преобразование. Можно, однако, образы единичных векторов i, j, k, т.е. i',j',k', рассматривать как базис новой системы х'у'V, а ортогональное преобразование — как преобразование координат. Сами векторы при этом считаются неизменными (пассивная точка зрения). Чтобы подчеркнуть, что рассматриваемый вектор R неиз- неизменен (меняются только его координаты по отношению к новому базису) мы будем пользоваться обозначением R^. Выясним, как подсчитываются координаты вектора R в новом базисе. Образы ортов исходного базиса имеют вид i' = Ai, j' = Aj, k' = Ak. Подставляя их обратное преобразование i = ATi', j = ATj', k=ATk' в разложение R = xi + yj + Л, находим R = xAT\' + УАТУ + zATk' = AT{xi' + yj' + zk'). В новом базисе матричная форма записи самих ортов такова:
§ 7. СЛОЖЕНИЕ ПОВОРОТОВ 43 В новом базисе матричная форма записи самих ортов такова: поэтому последнее соотношение можно переписать как V (') = atr. Пусть теперь осуществляется переход к новому базису i', j', k' —>• -> i", j",k" посредством ортогонального преобразования В\ i" = = jBi',j" = В}', k" = Вк'. Тогда, в соответствии с изложенным: R(") = ?TR(') = BTATR = CTR, т.е. матрица полного преобразо- преобразования координат есть С = АВ. Это и есть формула сложения поворотов с позиций преобразования координат. Подчеркнем принципиальные различия двух точек зрения при сложении поворотов. Активная точка зрения. Матрицы последовательных поворотов перемножаются в обратном порядке. Все матрицы вычисляются в общем для всех базисе i, j, k. Пассивная тонка зрения. Матрицы последовательных поворотов перемножаются в прямом порядке. Каждая матрица рассматрива- рассматривается в поворачиваемом ею базисе (А в i, j, k, В в i', j', k' и т.д.) Пример. Тело повернули вокруг оси х на угол 7г/2, затем вокруг оси у на угол 7г/2 (рис. 12). Найти матрицу результирующего поворота. Рис. 12 По смыслу постановки задачи здесь речь идет об активной точке зрения на преобразование. Матрица первого поворота /10 0 А = I 0 cos (р — sin (p \ 0 sin ip cos ip
44 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Матрица второго поворота (cos (р 0 sin <j О 1 О - sin <p 0 cos <p t Матрица результирующего поворота " 0 0 1\ /1 0 0 \ /010 С = ВА= | 0 1000-1=0 0-1 -1 0 0/ \0 1 0 / \-1 0 0 Например, вектор диагонали параллелепипеда переходит в новое положение 0 1 0 ' = CR= I 0 0-1 -10 0 Этот же пример может быть решен и при помощи пассивной точки зрения на преобразование (рис. 13). Матрица первого поворота та же, что и в предыдущем случае. У Рис. 13 Матрица второго поворота В должна быть записана в новых осях: / cos (р — sin ip 0 \ В — I sin <p cos (р 0 , <р = — jr. \ 0 0 1/ 1 Матрица результирующего поворота 10 0 С- АВ= | 0 0 -1 0 1 0 0 1 0\ /010 -10 0=0 0-1 0 0 1/ \-1 0 0
§ 7. СЛОЖЕНИЕ ПОВОРОТОВ 45 В рассмотренном примере оба способа вычисления матрицы С оказываются эквивалентными по сложности. В разных задачах могут оказаться предпочтительными разные подходы. Пример. Выразить матрицу конечного поворота через углы Эйлера. Напомним (см. § 6) последовательность поворотов в данном случае: при этом угол ф есть угол поворота вокруг оси z, угол в — угол поворота трехгранника х'у' z' вокруг оси х', угол <р — угол поворота трехгранника х"у"z" вокруг оси z" (см. рис. 3). При решении этой задачи также можно воспользоваться как активным, так и пассивным представлением ортогонального пре- преобразования. Однако в этом примере пассивное представление на- намного удобнее, поскольку матрицы составляющих поворотов здесь выглядят намного проще в промежуточных осях, чем в общей, исходной системе xyz. Матрица первого поворота / cos ф — sin ф 0' Ф = I sin ф cos ф О V 0 0 1 Матрица второго поворота /10 0 0=0 cos в - sin в \ 0 sin в cos в Матрица последнего поворота / cos ip — sin (p 0> Ф = I sin (p cos ip 0 \ 0 0 1, Матрица результирующего поворота (Лц An Ai3\ A2i A22 A23 A31 A32 A33)
46 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА где Лц = cos (p cos ф — sin ip cos в sin ф) А12 = - sin (p cos ф - cos (p cos 0 sin ф, Л i3 = sin в sin V>, Л21 = cos ^> sin ф + sin ^> cos 0 cos ^, A22 = - sin </? sin ф + costp cos 0 cos ^, Л23 = -sinflcos ^> Л31 = sin <^ sin 0, Л 32 = cos (psinO, Л33 = cos 9. 2. Кватернионное сложение поворотов. Как и в случае матриц, сложению поворотов отвечает произведение кватернионов, при этом активная и пассивная точки зрения на преобразования имеют су- существенные отличия. Активная тонка зрения. Пусть первый поворот задан кватер- кватернионом Л: __ П' = ЛоКоЛ, после чего выполнен второй поворот (кватернион Л4) R" = MoR'oM. Следовательно, результирующий поворот задается кватернионом N = М о Л. Как и в случае матриц, сложению поворотов в случае их актив- активного представления отвечает произведение кватернионов составля- составляющих поворотов в обратном порядке. При этом все кватернионы заданы в исходном базисе i* (k = 1, 2, 3). Пассивная тонка зрения. Выясним вначале, как изменяется запись вектора при переходе к новому базису i^ = Л о i^ о Л. Пусть в старом базисе имеем разложение вектора R= xii + yi2 + *i3. При переходе к новому базису получаем R(') = хЛ о i[ о Л 4- уЛ о i'2 о Л -h zA о i'3 о Л = = Л о (xii + yi'2 + zi'3) о Л = x'ii + i/i'2 + г%.
§ 7. СЛОЖЕНИЕ ПОВОРОТОВ 47 Поскольку направляющие косинусы оси конечного поворота оди- одинаковы как в исходных осях, так и в повернутых, то Л = = Ао + Aiii + A2i2 + Аз1з = Ао + A^ -h Аг^'г + Аз^з и в последнем равенстве можно считать все кватернионы заданными в осях i^. Пусть кватернион М. задает очередное преобразование базиса: iJJ = М о \'к оМ, тогда по аналогии с предыдущим имеем: R(") = М о (x'i'{ 4- y'i'2' + *'%) оМ=МоАо (xi'{ 4- yi'2' 4- zi'3') 0A0M. Кватернион результирующего поворота получился таким: т.е. он равен произведению кватернионов составляющих поворо- поворотов в прямом порядке. При этом в соответствии с изложенным компоненты кватернионов заданы в поворачиваемых ими базисах. Несмотря на то, что перемножаемые кватернионы заданы в разных базисах, их перемножение осуществляется при формальной записи их в одном базисе — последнем. Результат оказывается записанным в исходном базисе Ц, поскольку Jsf = п0 4- Hii" 4- 712I2 4- 71з1з = 71о + Tiiii + 7^2 + 71313- Пример. Рассмотрим пример из предыдущего пункта (см. рис. 12). Требуется найти угол и эйлеро- эйлерову ось результирующего поворота. Первый поворот задается кватер- кватернионом 7Г . . 7Г Л = cos т + 11 sin т, 4 4 второй поворот — кватернионом 7Г . . 7Г М = cos — + 12S111 т. 4 4 Кватернион результирующего по- поворота есть М = МоА = Л/5 . ч/2\ Л/5 . Vu\ т.е. эквивалентный эйлеров поворот осуществляется вокруг вектора е = (ii + i2 - 13)/уД на угол 120° (рис. 14). Выполним это же вычисление, используя пассивную точку зре- зрения. Кватернион первого поворота тот же. л 7Г . . 7Г Л = cos —Mi sin T. 4 4
48 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Кватернион второго поворота, заданный в повернутых осях, имеет уже иной вид: кл 7Г . . 7Г М = cos 13 sin —. 4 4 Кватернион результирующего поворота = ^(l+i'i' + i'2'-i'3') = 5A + il+i2"i3)- Сложение поворотов можно выполнять и в параметрах Кейли- Клейна. Сумме поворотов соответствует произведение соответству- соответствующих матриц или композиция соответствующих дробно-линейных преобразований. Все правила выполнения произведений аналогичны вышеизложенным. Пример. Найти связь углов конечного вращения первого рода (см. рис. 4) с параметрами эквивалентного эйлерова поворота. Ква- Кватернионы последовательных поворотов в данном случае наиболее просто выглядят в пассивном представлении. В соответствии с вы- вышеизложенным при вычислении произведения их в прямом порядке их формально следует записывать в исходном базисе: & ос CC 7 7 А = cos - + ii sin -, В = cos - + i2 sin -, C = cos - + i3 sin -. Результирующий поворот определяется кватернионом Л: Л = А о В о С. Запишем результат вычислений в покоординатной форме: х <р а C 7 . а . Р - 7 Ло = cos - = cos - cos - cos - - sin - sin - sin -, . <p .a /3 7 a . C . 7 Ai = x sin - = sin - cos - cos - + cos - sin ~ sin -, . . (p a . /3 7 .a /3.7 A2 = у sin - = cos - sin - cos - - sin - cos - sin -, . <p ol C . 7 . a . /3 7 A3 = z sin — = cos - cos - sin - + sin - sin - cos -.
§ 8. ТОПОЛОГИЯ МНОГООБРАЗИЯ ПОВОРОТОВ ТВЕРДОГО ТЕЛА 49 Из первого соотношения находится угол эйлерова поворота <р, после чего из трех оставшихся находятся проекции единичного вектора оси эйлерова поворота х, у, z. § 8. Топология многообразия поворотов твердого тела Рассмотрим множество положений твердого тела с одной непо- неподвижной точкой, или, что одно и то же, множество всех ортого- ортогональных матриц с равным единице детерминантом. Введем здесь следующие обозначения для элементов ортогональной матрицы: Напомним, что столбцы матрицы А представляют собой координаты образов единичных векторов при преобразовании с матрицей А. Если известны первые два вектора J = то третий определяется однозначно условием ортогональности и условием detA = 1. Поэтому все множество ортогональных матриц может быть представлено пересечением трех гиперповерхностей в шестимерном пространстве: *3= 1 Х1Х4 Это и есть геометрическое представление конфигурационного мно- многообразия твердого тела с неподвижной точкой. Важнейшая топологическая характеристика многообразия за- заключается в понятии односвязности многообразия. Многообразие называется односвязным, если всякий замкнутый контур на нем может быть непрерывно стянут в точку. Это условие очевидно выполняется для сферы в трехмерном пространстве и не выполня- выполняется для тора. Замкнутый контур на группе 50C) соответствует непрерывному вращению твердого тела, которое заканчивается в начальном положении тела. Теорема. Группа S0C) неодносвязна. Все замкнутые кривые на ней разбиваются на два класса: первому классу принадлежат кривые, стягиваемые непрерывной деформацией в точку, второму 5 Зак. 233
50 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА классу принадлежат кривые, стягиваемые к кривой, соответствую- соответствующей повороту тела на угол 2л" вокруг фиксированной оси. Для доказательства теоремы удобно сделать следующее пред- представление для конфигурационного многообразия твердого тела. Вся- Всякий поворот по теореме Эйлера может быть задан осью конечного поворота е и углом правовинтового вращения вокруг нее <р. Обра- Образуем в трехмерном пространстве вектор <ре, где 0 < (р < тг. Между множеством положений тела и точками введенного шара взаимно- взаимнооднозначного соответствия нет, поскольку поворот вокруг е на угол тг дает то же самое положение тела, что и поворот вокруг оси —е на угол тг. Однако если мы отождествим диаметрально противо- противоположные точки поверхности этого шара, то получим множество, находящееся с поворотами во взаимно однозначном соответствии. Все замкнутые траектории в шаре могут быть разделены на два типа: внутренние траектории (рис. 15а) и траектории с выходом на поверхность и последующим продолжением из диаметрально противоположной, тождественной точки (рис. 156). Рис. 15 Траектории первого типа непрерывно стягиваемы в начало ко- координат. Траектории второго типа из-за наличия в них разрыва (само вращение при этом непрерывно) в начало координат стянуты быть не могут. Они могут быть непрерывно стянуты к диаметру шара, соответствующему повороту тела на угол 2тг вокруг этого диаметра. На рис. 155 изображена траектория с одним выходом на поверхность. Общий случай делится на два подслучая: чет- четное число выходов на поверхность и нечетное. Нетрудно понять, что при четном числе выходов на поверхность кривая непрерывно стягивается в начало координат, а при нечетном — к диаметру. Рассмотрим в качестве примера два выхода на поверхность (рис. 16а). Первый выход состоялся в точке 1 и из точки V продолжился до второго выхода в точке 2) после чего он продол- продолжился из точки 21 и завершился в исходной точке. Очевидно, точку 2 можно непрерывно стянуть в точку V (при этом точка 2'
§ 9. УГЛОВАЯ СКОРОСТЬ ТВЕРДОГО ТЕЛА 51 Рис. 16 непрерывно переходит в точку 1) (рис. 16). После чего замкнутая петля в V', 2 непрерывно стягивается в точку 1\ 2, а оставшаяся петля стягивается в ноль. Теорема доказана. Представление поворотов при помощи кватернионов единичной нормы представляет собой многообразие, являющееся трехмерной сферой в четырехмерном пространстве: ' А§ + AJ + А^ + А§ = 1. Это многообразие является односвязным, но оно не находится во вза- взаимнооднозначном соответствии с группой 50C): два кватерниона Л и —Л задают одно и то же положение твердого тела. Груп- Группа единичных кватернионов называется в математике односвязной накрывающей группы вращений. Не входя в детали этого нового понятия, укажем, что накрывающая группа строится по заданной так: каждый ее элемент есть элемент исходной группы с указанием траектории, ведущей к этому элементу из некоторого, заранее фик- фиксированного (обычно единица группы). Построение накрывающего многообразия называется разверткой исходной группы. Например, разверткой окружности (группа 50B)) является прямая Я1. § 9. Угловая скорость твердого тела 1. Определение угловой скорости. Пусть тело совершает непре- непрерывное вращение вокруг неподвижной точки. Определим понятие мгновенной угловой скорости в мгновение времени t так. Положе- Положение тела в этот момент времени примем за начальное. Положение тела в близкий момент t -\- At по теореме Эйлера может быть по- получено из начального положения поворотом вокруг некоторой оси e(t + At) на некоторый угол A(p(t + At). To есть это положение может быть описано введенным в § 8 вектором конечного поворота A(p(t + At)e(t + At). Мгновенной угловой скоростью твердого тела называется предел A(p(t и>= hm At-+O если такой предел существует. At cft + At),
52 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Угловую скорость тела удобно связать с производной от по- положения тела, задаваемого одним из приведенных в §6 способов. Лучше всего соответствует введенному определению задание теку- текущего положения тела кватернионом coe^ + e(Oein. В момент времени t -f At тело находится в положении л ч <p(t + At) , А ч . (pit + At) A{t + At) = cos ?i-Z 1 + e(f + At) sin -^-~ '-. Кватернион малого поворота, переводящий тело из первого поло- положения во второе: л а А(р . А(р „ А<р АЛ = cos—- -f esmy 2^ 1 +е-у"- Закон сложения поворотов (активная точка зрения): Л(* + At) = ДЛоЛ@= A + е^) оЛ@- Отсюда получаем Л= hm — -^ — = -wo A< 2 То есть угловая скорость выражается через производную от ква- кватерниона так: и; = 2ЛоЛ. И вектор и;, и кватернион Л определены здесь в неподвижных осях. В случае пассивной точки зрения на поворот закон сложения поворотов дает Л(* + At) =ЛоАЛ = Ло М +e^ Отсюда получаем и = 2ЛоЛ. Здесь и вектор ы, и кватернион Л определены в осях, связанных жестко с телом. Как ранее уже отмечалось, кватернион Л имеет одинаковый вид в обоих случаях.
§ 9. УГЛОВАЯ СКОРОСТЬ ТВЕРДОГО ТЕЛА 53 2. Сложение угловых скоростей. Постановка вопроса следую- следующая. Относительно неподвижной системы координат xyz совершает произвольное вращение тело, представляемое жестко связанной с ним системой x'y'z'. Кватернион, определяющий положение три- едра x'y'z' относительно триедра xyz, — A{t)) а угловая скорость триедра x'y'z' равна и\ = 2Л о Л (в осях xyz). Относительно этого тела вращается некоторое другое тело, представляемое триедром х"у"z". Кватернион, определяющий положение триедра x"y"z" от- относительно триедра x'y'z'', есть Л4(г), а угловая скорость вращения триедра x"y"z" относительно триедра x'y'z' есть и>2 = 2Л4 о Л4 (в осях x'y'z'). Ставится вопрос, чему равна угловая скорость триедра x"y"z" относительно исходного триедра xyz. В соответствии с правилом сложения поворотов (пассивная точка зрения) имеем М = АоМ, а искомая угловая скорость есть Первое слагаемое есть и\ в проекциях на xyz, второе слагаемое есть из2 в проекциях на x'y'z', перепроектируемое на оси xyz. Таким образом, для угловых скоростей и>\ и и>2, заданных в одних и тех же осях, имеем и = u>i + <^2- 3. Формула Эйлера. Формула Эйлера определяет закон распре- распределения линейных скоростей точек твердого тела, совершающего вращение. Пусть некоторая точка тела г'B) является образом какой-то неподвижной точки г в пространстве xyz: r'{t) = A[t)oroA(t). Скорость этой точки есть г'(*) = Л(*) ого A(t) + Л@ ого Л(*). Чтобы выразить эту скорость через положение самой точки, под- подставим в эту формулу равенство г = Л о г' о Л: г' = Л о Л о г'+ г' о Л о Л = - (w о гЧ г' о ы) = w х г'. Формула распределения скоростей
54 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА и называется формулой Эйлера. В силу инвариантной формы ее записи она верна не только в системе xyz, как это следует по выводу, но и в любой другой системе. Формулу Эйлера можно представить в матричной форме г' = Пг', где Q называется матрицей угловой скорости, определяющей опе- оператор векторного произведения. Эта матрица является кососимме- трической и обычно ее рассматривают в двух вариантах: в проекциях на неподвижные оси xyz в проекциях на связанные с телом оси где р, g, г — традиционные (следуя Эйлеру) обозначения для этих проекций. 4. Кинематические уравнения Эйлера. Эти уравнения определя- определяют связь между проекциями угловой скорости тела на оси, с ним жестко связанные, и производными от углов Эйлера. Связь легко установить, представив произвольное вращение как составленное из трех плоских вращений, воспользовавшись установленным выше законом сложения скоростей (рис. 17) xyz Л xyz -> xyz -^ ???. Скорости составляющих вращений имеют вид Ф = ( 0 1 в осях х'у'Y, О = I 0 в осях x"y"z" О \ Ф = [ О I в осях
§ 9. УГЛОВАЯ СКОРОСТЬ ТВЕРДОГО ТЕЛА 55 Эти скорости надо сложить, предварительно спроектировав их на оси ?т)?: 1 0 О \ /О ы = | — sin <р cos <р и | | 0 cos в sin в I I 0 О -sin0 cos6/ \ф cos (p sin ^ 0 ¦+¦ | -~ sin <p cos <p О О 0 1 p = ф sin ip sin в + 0 cos ^?, g = ^> cos <^? sin 0 — 0 sin <p, г = ^ cos в + v?. Если нам задана угловая скорость тела p(t), q(t), r(t) и необходимо найти его положение в углах Эйлера, то следует решить систему дифференциальных уравнений р sin ^? -h g cos <p sin^ ^> = г — (psin ^ 4- q cos ^>)ctg0. Перед нами система нелиней- нелинейных уравнений с переменными коэффициентами, имеющая осо- особенность в точке в = 0. Более удобными уравнения- х ми для решения задачи нахо- нахождения положения тела по его скорости являются С. *" Рис. 17 5. Уравнения Пуассона. Пусть вращение тела описывается в основных переменных, определяющих положение тела с одной неподвижной точкой, т.е. в элементах группы 50C): A(t). Тогда положение любой точки тела в пространстве xyz есть г' = A(t)r, а ее скорость V = A{t)r = A{t)AT{t)r>. Воспользовавшись формулой Эйлера в матричной форме, получим т' = A(t)AJ{t)r',
56 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА откуда следует А = пА. Это и есть уравнения Пуассона в проекциях на оси xyz. Для записи его в проекциях на оси ?г)( достаточно заметить, что "у И в проекциях на собственные оси получаем А = АП. Эти уравнения обладают существенными преимуществами по сравнению с кинематическими уравнениями Эйлера — они линейны и не имеют особенностей. Их недостатком является более высокая размерность по сравнению с последними. Линейные кинематические уравнения минимальной размерности можно получить в кватернионах. Как следует из п. 1 настоящего параграфа, эти уравнения имеют вид 2Л = и о Л в осях xyz, 2Л = Л о ы в осях Основным свойством уравнений Пуассона является то, что в отличие от общего случая линейных систем, когда для построения общего решения необходимо знать столько линейно независимых частных решений, каков порядок системы, здесь для построения общего решения достаточно знать единственное частное. Покажем это. Пусть известно какое-то частное решение Ar(t). Будем искать общее решение в виде ) С — некоторая постоянная ортогональная матрица. Общее решение будет найдено, если можно найти С так, чтобы удовлетворить любым наперед заданным начальным условиям А@) — Aq: Л@) = СЛГ(О) = Ло => С = ЛоЛгт@). Следовательно, общее решение имеет вид A = AQAj{0)Ar(t).
§ 9. УГЛОВАЯ СКОРОСТЬ ТВЕРДОГО ТЕЛА 57 Таким образом, оказывается, что все решения конгруэнтны друг другу, поскольку получаются одно из другого преобразованием поворота. 6. Теорема о телесном угле*. Как следует из изложенного выше, кинематические уравнения твердого тела, записанные в лю- любой форме, имеют существенно более сложную структуру, чем кинематические уравнения материальной точки i = M*)> 2/ = г;у(*)> z = vz(t). Если проекция скорости точки на какую-либо ось равна нулю (например, vx{t) = 0), то и изменение соответстующей координаты (в данном случае х) отсутствует. Не так дело обстоит с твердым телом. Если угловая скорость тела в проекции на какую-либо ось равна нулю, то тело вокруг этой оси неподвижным не остается. Прежде чем сформулировать этот факт точно, заметим, что он связан с тем, что в отличие от материальной точки, кон- конфигурационное многообразие которой есть трехмерное евклидово пространство, многообразие положений тела с одной неподвижной точкой евклидовым не является. Теорема. Если некоторая ось 1, жестко связанная с телом, опи- описала в процессе движения тела замкнутую коническую поверхность и при этом проекция угловой ско- скорости тела на эту ось была равна нулю: 1 • и = 0, то после возвра- возвращения оси 1 в исходное положение тело оказывается повернутым во- вокруг нее на угол, равный телесно- телесному углу описанного конуса. Доказательство удобно про- провести, воспользовавшись для за- задания подвижного триедра ?т?С " географическими" координатами (рис. 18). Положение подвижно- подвижного триедра f^C относительно непо- неподвижного xyz задается тремя угла- углами: ф — долгота, <р — широта и X — азимут. Чтобы не загромо- загромождать рисунок, центр подвижного трехгранника смещен из центра неподвижного. Ось 1, о которой идет речь в теореме, совпадает с осью С и описывает на поверхности единичной сферы замкнутую кривую Г. N ? Рис. 18 * Впервые доказана А.Ю.Ишлинским в 1952 г. 4 Зак. 233
58 ГЛ.2. КИНЕМАТИКА ТВЕРДОГО ТЕЛА Выразим явно через введенные углы ф, <р) х условие ш 1 = = 0. Воспользуемся правилом сложения скоростей. Скорость ф перпендикулярна плоскости меридиана и, следовательно, проекции на ось С не имеет. Проекция скорости ф на эту ось равна ф sirup. Скорость х проектируется в натуральную величину. Следовательно, и-1 = г = х + ф sin <р = 0. Отсюда имеем X = — (р si Jr р Jr Воспользовавшись теоремой Грина, получим X = / / cos <pd(p йф — II dS = s s — площадь участка поверхности сферы внутри кривой Г. По определению это и есть телесный угол конуса с образующей Г. Теорема доказана. Теорему нетрудно проиллюстрировать. На рис. 19а изображено тело в начальном положении. Жестко связанная с телом ось ? будет описывать замкнутую коническую поверхность. Полное движение, в котором ось С возвращается в исходное положение, состоит из трех простых поворотов (рис. 196 - г). На каждом этапе выполнено ы±?. Кривая Г, которую описала ось С на единичной сфере, представляет собой восьмушку сферы. По доказанной теореме поворот вокруг оси С должен быть равен тг/2, что хорошо видно на рисунке. Доказанная теорема допускает небольшое обобщение. Если в условиях теоремы проекция абсо- абсолютной угловой скорости и на ось 1 является известной функцией времени: и>1=ы/B), то уравнение для нахождения угла поворота тела имеет вид Отсюда где Т — время обхода контура Г. И, окончательно X = S+ [ Ui{t)dt. Jo Результат, аналогичный доказанному, имеет место и в том слу- случае, если ось, в проекции на которую угловая скорость тела задана, является неподвижной не в теле, а в неподвижном пространстве. = — фъ\п^ф+ I u)[{t)dt) /г Уо
§ 9. УГЛОВАЯ СКОРОСТЬ ТВЕРДОГО ТЕЛА 59 Рис. 19 Теорема. Если тело движется так, что некоторая неподвижная в пространстве ось (например, z) описала в теле замкнутую кони- коническую поверхность и проекция угловой скорости тела на эту ось задана: ujz =.uj2(t)) то угол поворота тела вокруг этой оси равен u,(t)dt-S, где S — телесный угол конуса, описанного неподвижной осью в теле, а Т — время обхода конуса. Доказательство легко получается, если принять неподвижным вращающееся тело и считать вращающимся вокруг него ранее не- неподвижное пространство. Тогда угловая скорость пространства 4*
60 ГЛ.З. КИНЕМАТИКА ОТНОСИТЕЛЬНОГО ДВИЖЕНИЯ относительно тела равна угловой скорости тела относительно про- пространства, взятой с обратным знаком: —и;. Для определения положения пространства относительно тела справедлива доказан- доказанная выше теорема: = S- J tJt{t)dtt а поскольку угол поворота пространства относительно тела равен углу поворота тела относительно пространства, взятому с обратным знаком, то это и завершает доказательство. Глава 3. Кинематика относительного движения Рассмотренные выше раздельно кинематика точки и кинематика твердого тела сочетаются в настоящей главе, в которой мы задаемся вопросом: как подсчитать скорости и ускорения материальной точки относительно некоторой неподвиж- неподвижной системы отсчета xyz) если мы знаем, как движется точка в неко- некоторой подвижной системе отсчета ?77^, причем движение ?т/С относи- относительно xyz тоже известно (рис. 20). Мы будем полагать известными в проекциях на подвижные оси (си- (система отсчета наблюдателя) следу- следующие величины: vo(*) — скорость точки О; wo(<) — ускорение точки О; ш[г) — угловая скорость системы относительно системы xyz\ Рис. 20 г = — положение точки в подвижной системе; = Г = = г = — скорость точки в подвижной системе; — ускорение точки в подвижной системе. Требуется найти в проекциях на подвижные оси полную скорость точки относительно системы xyz и полное ускорение этой точки относительно той же системы. Пусть А есть ортогональная матрица
ГЛ.З. КИНЕМАТИКА ОТНОСИТЕЛЬНОГО ДВИЖЕНИЯ 61 преобразования от системы x'y'z1 к системе ?т;С (система x'y'z' имеет общее начало с системой ^т/С, а оси параллельны осям xyz). Тогда связь между изображенными на рис. 20 векторами будет такой: R = го + Лг, R = У г = Вычисляем полную производную: dR dr0 • - = -+Ar + Ar. Перепроектируем это равенство на подвижные оси: Введя обозначение для полной скорости в проекции на подвижные оси f а также имея в виду, что AT--r- = vo и ATAr = w х г, at получим искомое выражение для скоростей: V = vo+u>xr-f vOTH. Скорость vo + w x г = vnep называется переносной скоростью. Она определяет скорость той точки системы ^т/С, с которой в данный момент совпадает рассматриваемая точка. Для вычисления ускорения вернемся в последнем соотношении к проекциям на неподвижные оси: dR dr0 Af ч _. = _ + Л(ыхг + уотн). Дифференцируя это соотношение, находим d2R d2r0 dt2 dt2 -f A(u x г + vOTH) + A(u xr + wxH vOTH).
62 ГЛ.З. КИНЕМАТИКА ОТНОСИТЕЛЬНОГО ДВИЖЕНИЯ Перепроектируя на подвижные оси, получаем Лт -тт- = Лт dt2 dt2 хг-f vOTH) или W = Wo w0 Мы получили, что полное ускорение может быть представлено в виде суммы трех частей. Первая часть называется переносным ускорением Wnep = W0 + W X (w X г) + W X Г. Оно получается из полного ускорения в предположении, что рас- рассматриваемая точка в системе ?77^ неподвижна: vOTH = 0, wOTH = 0. Вторую часть представляет собой относительное ускорение. Оно совпадает с полным тогда, когда система ?т)( относительно системы xyz движется равномерно и поступательно, т.е. wo = 0, и = 0. Третью часть представляет собой ускорение, называемое кори- олисовым: wKOp = 2ы х vOTH. Пример. Определить абсолютное ускорение точки, движение которой наблюдается относительно Земли в связанной с нею местной системе координат, оси которой на- направлены на восток, север и в зе- зенит (рис. 21). Полагая ускорения, связанные с движением центра Земли по ор- орбите вокруг Солнца, малыми, бу- будем считать, что этот центр не- неподвижен в инерциальной системе координат xyz, относительно ко- торой Земля вращается с угло- угловой скоростью суточного вращения и. Роль подвижного трехгранника ?т7? здесь играет репер, ориенти- ориентированный по сторонам света SAfZ. Наблюдается и считается извест- известным движение точки в этом трех- трехграннике: N Рис. 21 = 4@ - Vcw/ voth = ^Vr>TH — Требуется определить абсолютное ускорение этой точки в проекциях на эти же оси. Исходим из формулы W = W пер Т "Т W] кор«
ГЛ.З. КИНЕМАТИКА ОТНОСИТЕЛЬНОГО ДВИЖЕНИЯ 63 Подсчитаем переносное ускорение. Ускорение точки О в проекциях на хцг есть wo = I —c V Или, в проекциях на оси о os^ —CJ2roCOS2<^ / wq = I uj2ro cos (psin (p I . Здесь (р — широта места. Поскольку предполагается, что Земля вращается равномерно, то ы = 0. Скорость вращения Земли в проекциях на SMZ 0 и = I uj cos (p I . k uj sin (p ) \ Подсчитаем и х (ы х г): w х (w х г) = и2 (С cos (р - г) sin у?) sin ^ ~cj2 (С cos (р — г) sin <p) cos <^? t Складывая это ускорение с ускорением wo, получаем переносное ускорение: Wnep = I ^2[(С + r0)cos^~ rysin v?]sin v? -ы2[(C + r0) cos <p - т] sin (p] cos ^> y Подсчитаем кориолисово ускорение: (C,u cos у? - tjlj sin <^?> ш? sirup —CJ^ COS ^? Складывая переносное, кориолисово и относительное ускорения, получим полное ускорение в проекциях на оси SMZ: we = -cj2? + ti;^ = ^2[(C + ro) cos^? — 77 sin <p] sin ^ 4- 2cj? sin^? -h т), ti;2 = -w2[(C -f ro) cos<^ - г) simp] cos (p - 2tj?cos<p -f C-
64 ГЛ.З. КИНЕМАТИКА ОТНОСИТЕЛЬНОГО ДВИЖЕНИЯ Воспользуемся этими выражениями, чтобы ответить на вопрос, куда падает из состояния покоя материальная точка, поднятая на высоту h над Землей. Для этого надо решить уравнения we = 0, wtf = 0, wz = -д при начальных условиях ? = 77 = 0, ^ = Л,^ = т) = ^ = О. Относительно искомых переменных эти уравнения линейны и могут быть решены точно. Однако полагая, что и — малая угловая скорость и пренебрегая в решении квадратом этой скорости, можно сильно упростить выкладки. Решаем систему - 77sin <^>) = О, с указанными выше начальными условиями методом последователь- последовательных приближений. В нулевом приближении и — 0 и из системы получаем ? = 0, г? = О,С = h — gt2/2. Подставляя это решение в члены, содержащие множителем ы, и еще раз интегрируя, получаем решение первого приближения: 1 з 9*2 ? = —<jjgt cos <p, 77 = О, С = h . 4 3 * v» / » s 2 В момент падения на Землю С = 0, откуда t = yj2h/g. Откло- Отклонение точки к востоку в момент падения равно ^3/2 При значениях параметров, равных и = 0,00007 с, ^ = 1000 см/с2, = 1/2, /г = 10 м, отклонение к востоку составит ?-3,3- 10 см.
Часть II Динамика Глава 4. Обпще теоремы динамики § 10. Определения Рассматривается совокупность (дискретная или континуальная) материальных точек, образующая механическую систему S. На каждую точку системы действует сила с массовой плотностью F (рис. 22) . Сила, действующая на элемент массы dm, равна Fdm. В дальнейшем будем иметь в виду следующие основные определения. Силы, которые действуют на рассматриваемую точку системы 5 со стороны других точек этой же системы, называются внутренни- внутренними. Силы, действующие со сторо- стороны материальных точек, лежащих вне рассматриваемой системы, на- называются внешними. Количеством движения изоли- изолированной материальной точки мас- массы т, движущейся со скоростью v, называется вектор рис 22 р = mv. Количеством движения системы N изолированных материальных точек называется сумма количеств движения всех составляющих систему точек: N 1=1 Количеством движения непрерывной системы материальных точек называется интеграл v dm. /5 ¦/; Моментом количества движения, или кинетическим момен- моментом, изолированной материальной точки относительно точки О, радиус-вектор которой есть го, называется вектор К = т(г - го) х v.
66 ГЛ.4. ОБЩИЕ ТЕОРЕМЫ ДИНАМИКИ Моментом количества движения системы N изолированных мате- материальных точек называется сумма N К = У ^ ТП{ (Т{ — Го) X V,'. 1 = 1 В непрерывном случае этот вектор имеет вид К = / (г - r0) x v dm. Js Кинетической энергией материальной точки называется скаляр- скалярная неотрицательная величина Т= -mv • v. Кинетической энергией системы N изолированных материальных точек называется сумма Т — - V^ m-V' В непрерывном случае эта скалярная величина имеет вид v • v dm. -Ц' Центром масс системы N изолированных материальных точек называется точка, радиус-вектор которой вычисляется по формуле N N Или, в непрерывном случае: гс = —г / г dm (М = / dm). М Js Js Импульсом силы за время <2~*i называется интеграл 1= / Fdt
§ 11. ТЕОРЕМА ОБ ИЗМЕНЕНИИ КОЛИЧЕСТВА ДВИЖЕНИЯ 67 в случае, если F — дискретная сила. Если F — массовая плотность силы, то этот интеграл называется массовой плотностью импульса силы. Работой силы на перемещении 7 называется интеграл F dr. у Вириалом материальной точки называется выражение где г — радиус-вектор точки, F — приложенная к ней сила. Вириал системы материальных точек: 1 N i 1 = 1 Таковы основные определения. Добавим, что количество движе- движения и кинетическая энергия называются соответственно векторной и скалярной мерой движения системы. § 11. Теорема об изменении количества движения Представим массовую плотность сил F в виде суммы плотности внутренних сил F1 и плотности внешних сил Fe и запишем уравнение Ньютона Проинтегрируем это уравнение по всей системе 5, учитывая, что в силу третьего закона Ньютона интеграл от плотности внутренних сил равен нулю: [^4<1т= [{F[ + Fe) dm = [ Jsdt Js Js [ Fe dm. s Если масса системы от времени не зависит (система постоянного состава), то из этого соотношения выводим Этот результат формулируется так: производнная от количества движения системы равна сумме всех внешних сил, действующих на систему.
68 ГЛ.4. ОБЩИЕ ТЕОРЕМЫ ДИНАМИКИ В частности, если внешние силы равны нулю, то количество движения системы измениться не может: р—const. Для системы постоянного состава количество движения системы может быть выражено через скорость движения ее центра масс: Поэтому, если на систему внешние силы не действуют, то центр масс ее движется равномерно и прямолинейно: —г- = COnst. at Иными словами, никакими внутренними силами привести центр масс механической системы в ускоренное движение невозможно. Проинтегрируем по времени уравнение dp/dt = JsFe dm: ¦га- Др= / / Fedm j eft = 1. Это соотношение называется законом изменения количества дви- движения в интегральной форме и звучит так: изменение количества движения системы S за время t2—t\ равно импульсу внешних сил за это оке время. Замечание. В современной литературе термины "количество движения" и "импульс" часто выступают как синонимы. § 12. Теорема об изменении момента количества движения Умножим уравнение Ньютона d2r/dt2 — Fl + Fe векторно на г — Го и проинтегрируем результат по всей системе S: / (г - го) х -^ dm = / (г - го) х Fe dm (как и в предыдущем параграфе мы использовали здесь третий закон Ньютона, что привело к исчезновению внутренних сил). Левую часть полученного равенства можно представить так: dr j f d i \ dr dJ() Первый член суммы представляет собой производную от момен- момента количества движения относительно точки О, а второй член преобразуется следующим образом: dr f dr0 dr dr0 (^xd ]*drn xp
§ 12. ТЕОРЕМА ОБ ИЗМЕНЕНИИ МОМЕНТА 69 И, окончательно, мы получаем: — (fro - — xp — закон изменения момента количества движения: скорость из- изменения момента количества движения относительно некоторой точки некоторой О равна момен- моменту всех внешних сил, вычисленно- вычисленному относительно той же точки, минус скорость точки О, вектор- но умноженная на количество дви- движения системы. Теорема об изменении момента количества движения известна и в другой форме. Введем понятие относительно- относительного момента количества движения. Свяжем с подвижной точкой О систему координат ?77 С, поступа- поступательно движущуюся относительно системы xyz (рис. 23). В опреде- лении количества движения скоро- скорости точек будем рассматривать не относительно системы xyz) как в предыдущем случае, а относительно подвижной системы ?77 С : Рис. 23 Котн — d4dm. В этом случае, проделывая выкладки, аналогичные предыдущим, получаем * d2 (ro + р) d2r0 dKo ¦/. р х Fe dm, и уравнение для относительного момента количества движения принимает вид dKc dt = / У5 р х Fe dm - Мрс х w0 — скорость изменения относительного кинетического момента вокруг точки О равна моменту внешних сил относительно той же точки минус момент силы инерции переносного движения Mwo, вычисленный относительно центра масс системы. В последнем результате дополнительный момент сил инерции равен нулю, если система ?77С движется равномерно — w0 = О, или, если точка О совпадает с центром масс — рс = 0.
70 ГЛ.4. ОБЩИЕ ТЕОРЕМЫ ДИНАМИКИ § 13. Теорема об изменении энергии Вычислим производную по времени от кинетической энергии системы: dT d Г1 Г , 1 [ d* , = т к / v vdm\ = / v —- dm. dt[2Js J Js dt dt Учитывая закон Ньютона d\/dt = F, получим dT ¦/; *-ysv-pdm- Элементарная работа всех сил, приложенных к точке на пере- перемещении точки dr, равна Fdr. Отношение этой работы к интервалу времени dt, за которое она была совершена, называется мощностью силы F. Полученный результат может быть сформулирован так: производная по времени от кинетической энергии системы равна мощности всех сил, приложенных к ней. В дифференциальной форме теорема об изменении энергии мо- может быть записана так: dT = I dr-Fdm — приращение кинетической энергии равно элементарной работе всех сил, приложенных к системе. Сила, приложенная к точке, называется потенциальной, если существует такая функция координат этой точки и. времени — U{t, х, у, г), что проекции F на оси могут быть вычислены как р _ dU г? - dU р - dU "х — ~~Z—) "у — "о—) "* — "о ох ду oz или, в краткой форме: Если потенциал U от времени не зависит, то выражение dr • F представляет собой полный дифференциал функции U: dr-F = dU. Потенциальной энергией всей системы называется величина П = - I U dm.
§ 14. ПЕРВЫЕ ИНТЕГРАЛЫ 71 Для случая потенциальных и не зависящих от времени сил теорема об измении кинетической энергии в дифференциальной форме принимает вид dT = -cffl, откуда следует Т + П = const. Сумма Т + П называется полной механической энергией системы. Таким образом, установлено: полная механическая энергия си- системы не изменяется во времени, если все действующие силы потенциальны, а их потенциал от времени не зависит. Этот закон называется законом сохранения энергии. § 14. Первые интегралы Понятие первого интеграла более подробно будет обсуждаться в §26. Здесь же мы дадим лишь предварительные сведения. Функция, зависящая от координат и скоростей точек меха- механической системы и не являющаяся тождественной константой, называется ее первым интегралом, если она не изменяется во время любого движения системы. Доказанные выше теоремы позволяют установить условия суще- существования трех основных типов первых интегралов. Если внешние силы отсутствуют, то не меняется во времени количество движе- движения системы, называемое в этом случае интегралом количества движения. Если момент внешних сил равен нулю, то не меня- меняется кинетический момент системы, называемый в этом случае интегралом момента количества движения. Наконец, если все действующие силы потенциальны и не зависят от времени, то полная механическая энергия является интегралом энергии рас- рассматриваемой системы. § 15. Теорема Кёнига Введем понятие относительной кинетической энергии системы 5. Это энергия, вычисленная в движении системы относительно подвижной системы координат ?7?С (см- Рис- 23): dP dp drn Рассмотрим частный случай, когда начало координат подвижной системы помещено в ее центр масс, и вычислим полную кинетиче- кинетическую энергию системы: dr dr . 1 ffdr0 dp\ (dr0 dp = I*E.*o f dm+dro f dp I fd^ dp 2 dt dt J dt J dt 2 J dt dt
72 ГЛ.4. ОБЩИЕ ТЕОРЕМЫ ДИНАМИКИ Первый член в полученной сумме представляет собой кинетическую энергию материальной точки, помещенной в начало координат по- подвижной системы и имеющей массу, равную массе системы. Второй член равен нулю, поскольку предположено, что центр масс ле- лежит в точке О и, следовательно, fpdm = 0. Третий член равен относительной кинетической энергии системы. Таким образом, установлена теорема Кёнига: кинетическая энергия системы есть энергия движения центра масс (в опреде- определенном выше смысле) плюс энергия движения относительно центра масс. § 16. Теорема о вириале Рассмотрим систему TV материальных точек, кинетическая энер- энергия которой есть Заметим, что кинетическую энергию можно представить в следую- следующей форме: где рг — количество движения г-й точки. Запишем очевидное тождество: аг{ 1 a ^-y 1 ^-ч dpi Таким образом, учитывая закон Ньютона dpi/dt = F,-, для кинети- кинетической энергии получаем 1 d N I N Г1> 2? 1=1 1=1 Вычислим среднее значение по времени от обеих частей равенства, введя для среднего значения обозначение (Т) = lim - / Tdt. r_+oo r JQ Будем предполагать, что движение материальной системы осуще- осуществляется в ограниченной области пространства и с ограниченными
§ 16. ТЕОРЕМА О ВИРИАЛЕ 73 скоростями. Из этого следует, что сумма YliLi Р» г» ограничена, а следовательно, d N \ 1 Г d N I N Yl li / Yl л li d \ 1 Г d ~Ts Yl P« * rW = lim ~ / -Jl dt ^ I r-foo r Jo dt г» л == lim ~ У^ Pi = 0. 1=1 / 1/и 1=1 1=1 Значит, для среднего значения кинетической энергии получаем Среднее значение кинетической энергии системы равно среднему значению ее вириала. Если действующие силы F; потенциальны, т.е. где П — потенциальная энергия, то написанное соотношение при- приобретает вид , / N огт \ Если потенциальная энергия есть функция n-й степени от всех радиусов-векторов г^, то Поскольку полная энергия Е = Т + П, то <П> = ? п -\- Z п -+- 1 (в силу закона сохранения энергии Е — const и (Е) = ?"). Если п = 2 (потенциальная энергия сил, линейно зависящих от г») то (Т) = (П) — среднее по времени от кинетической энергии равно среднему по времени от потенциальной. Если п = — 1 (потенциальная энергия частиц, взаимодействую- взаимодействующих по закону всемирного тяготения), то 2(Т) = — (П).
74 ГЛ.4. ОБЩИЕ ТЕОРЕМЫ ДИНАМИКИ § 17. Общее уравнение динамики системы связанных материальных точек Рассмотрим систему N материальных точек. Будем предпола- предполагать, что между точками системы существуют связи, математически выражающиеся в наличии соотношений типа /,-(*, гь ...,rN) = 0, i = 1, ..., п< ZN, или типа /,-(*, гь ..., rN, гь ..., rN) = О, г = 1, ..., п < ЗАГ. Связи первого типа называются голономными, второго типа — кинематическими (см. также §30). Связи тождественно выполняются для любого момента времени и для любых движений системы. Действие связей на материальные точки эквивалентно появлению дополнительных сил, называемых реакциями связей, так, что уравнения Ньютона системы связанных материальных точек могут быть записаны в виде mkrk =Ffc + Rfc, k = 1, ..., N. Здесь F/c — так называемые активные силы, R* — реакции связей. Введем определение. Виртуальным перемещением системы на- называется такое перемещение Srk) которое удовлетворяет линеари- линеаризованным в момент времени t связям (см. также § 23): —- . Srk = 0 в случае голономных связей, V^ -тг-Л • Srk = 0 в случае кинематических связей. t[dr« Понятие виртуального перемещения обычно противопостовля- ется понятиям действительного перемещения и возможного пе- перемещения. Действительным перемещением называется перемеще- перемещение Srk, удовлетворяющее и уравнениям движения, и уравнениям связей. Возможным перемещением Srk называется перемещение, удовлетворяющее уравнениям связей: /,-[*, i-1 + Лгь ..., rN +6rN] = 0 (i= I, ..., п) или fi[tt ri +5г\, ..., rN + 6tn, ri H-rfri, ..., tn + 6*n] = 0.
§ 18. ЗАДАЧА ДВУХ ТЕЛ 75 Связи называются идеальными, если их работа на любых вир- виртуальных перемещениях равна нулю: N = 0. k=i Если выразить из написанных выше уравнений Ньютона реакции связей и подставить их в это соотношение, получим уравнение N к=\ называемое общим уравнением динамики. Это уравнение выражает принцип Даламбера-Лагранжа: сумма работ активных сил и сил инерции на любых виртуальных перемещениях равна нулю. Пример. Найти ускорение груза т\ (рис. 24). В блоках отсутствует трение, нить невесома и нерастяжима. Решение. Система двух материальных точек т\ и га2 подчинена связи 2x-hу = const. Вид общего уравнения механики в этом случае (mix ~ m\g)8x + (т2У - m2g)Sy = 0. Виртуальные перемещения Sx и Sy и ускорения х и у связаны уравнением связи: Sy = -2cJx, у = -2х. Подставляя эти соотношения в общее уравне- уравнение, имеем [mi(х ~ g) - 2т2(-2? - д)]5х = 0. Поскольку Sx — произвольно, то у////////////////// откуда находим х = ~ 2m2) 4ш2 Глава 5. Специальные задачи дщнамики § 18. Задача двух тел Исторически задача двух тел возникла в небесной механике в связи с изучением движения планет вокруг Солнца под действием сил, подчиняющихся закону всемирного тяготения.
76 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Если считать, что сила взаимодействия между планетой и Солнцем много больше сил взаимодействия планет друг с другом, то задача изучения движения лю- любой планеты сводится к задаче движения в инерциальном про- пространстве двух тел (рис. 25). Мас- Масса Солнца обозначена буквой М, масса планеты — буквой т. Если считать размеры тел мно- много меньше растояния между ними, то оба тела можно рассматривать как материальные точки, притяги- притягивающиеся друг к другу с силой, модуль которой равен Рис. 25 7 (R-rJ Коэффициент 7 называется уни- универсальной гравитационной посто- постоянной, R и г — радиусы-векторы Солнца и планеты соответственно. По теореме об изменении количества движения системы имеем MR + гаг = const, поскольку внешних сил нет. То есть центр масс системы Солн- Солнце плюс планета в произвольной инерциальной системе отсчета движется равномерно и прямолинейно. Выберем такую инерциальную систему, в которой этот центр покоится, и поместим начало координат в этот центр: MR + mr = = 0. Тем самым, достаточно найти движение планеты, движение Солнца определится из соотношения R = -mr/M. Подставим это соотношение в выражение для силы тяготения и запишем уравнение движения планеты: тт = ~ тпМ {1 + т/МJ кГ Обозначив величину jM3/(M + тJ буквой к, получим г = -А: \г\ 3' Тем самым задача двух тел при помощи теоремы об изменении количества движения сводится к задаче движения одной матери- материальной точки в поле притягивающего центра. Умножив полученное уравнение слева векторно на г, находим: г х г = 0. Это соотношение можно переписать так: d/dt(r х г) = 0, откуда следует г х г = С,
§ 18. ЗАДАЧА ДВУХ ТЕЛ 77 что выражает собой закон сохранения кинетического момента. Из него следует, что движение происходит в неизменной плоскости, ортогональной вектору С. Исходную инерциальную систему отсчета можно выбрать так, чтобы это была плоскость {я, у}. В этом случае уравнения движения точки принимают вид кх .. ку % = /, п O4Q > У = 7= v v~ ¦ ^ / v v*~: • У ) Решение этой системы нелинейных уравнений удобно проводить в полярной системе координат х = rcos<p, у = rsin<^. Воспользуемся уравнениями Лагранжа, выведенными в §5: d дТ дТ „ „ ,% , ЛЧ в которых gi = г, q2 = <p, (Fi, F2) — проекции силы (FXi Fy) на направление к центру и на перпендикуляр к нему. Подсчитаем коэффициенты Ламе: Кинетическая энергия точки т=1„2 = (я2г2 + ; Проекции силы г2 Уравнения Лагранжа дают Из последнего уравнения следует г2ф = С — модуль вектора неизменного момента количества движения гхг= С. Поскольку
78 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ r2d(p/2 = dS — элемент площади, заметенной радиусом г при бесконечно малом смещении вдоль траектории, то константа С = = 2dS/dt выражает собой закон постоянства секторной скорости. Этот закон позволяет исключить переменную (р из уравнений Это уравнение сводится к линейному при помощи подстановки Вине. Вместо переменной г будем рассматривать переменную и = 1/r, a вместо независимой переменной t в качестве независимой выберем переменную (р. Последнее возможно, поскольку из соотношения ф = С/г2 следует, что (р изменяется монотонно. Выполним необходимые выкладки: *L - — • - ^^L - _г А dt~ dip*" r2d<p~~ d<p dt2 " dip \dt) dt " r2 d^2' После этого написанное выше дифференциальное уравнение при- приобретает вид Его общее решение или, в исходной переменной: г=т~; г> Ф = (р + <ро> 1 + е cos ц) где (~*2 С^2 А Полученное решение представляет собой уравнение эллипса, записанное в полярных координатах, если е < 1. Этот случай и имеет место для планет. В общем случае при е — \ траектория представляет собой параболу, если е > 1 — гиперболу. Найденное решение позволяет подтвердить справедливость трех законов Кеплера. Первый закон Кеплера: планеты движутся по эллипсам, в одном из фокусов которого находится Солнце.
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 79 Более точно, в фокусе находится центр масс системы Солнце + планета, однако масса Солнца намного больше массы любой планеты, и этот закон практически точен. Второй закон Кеплера: площади, заметаемые радиусом-векто- радиусом-вектором, идущим от Солнца к планете, пропорциональны промежуткам времени, в которые они были заметены. Этот закон является следствием отмеченного выше постоян- постоянства секторной скорости и, так же как и первый закон, должен формулироваться для центра масс. Третий закон Кеплера: квадраты периодов обращения планет вокруг Солнца относятся как кубы их больших полуосей. Этот закон получим, если воспользуемся известной из геометрии связью между параметром эллипса р и его полуосями а и b : Константу интеграла площадей С можно выразить через пло- площадь эллипса и через период обращения так: С = 2каЪ/Т. Поскольку _ С2 _ 4тг2а262 Р~~ Jfc kT2 ' то указанная выше связь между р, а и 6 дает Поскольку константа к слабо зависит от массы планеты т, то и этот закон тем точнее, чем меньше соотношение т/М'. § 19. Динамика твердого тела с одной неподвижной точкой 1. Геометрия масс. В основе геометрии масс абсолютно твердого тела лежит понятие момента инерции тела вокруг некоторой оси. Пусть твердое, тело вращается вокруг неподвижной оси, на- направление которой задается единичным вектором е (рис. 26), с угловой скоростью ы. Поскольку модуль скорости элемента массы dm равен ы/э, где р — расстояние от оси е до элемента массы dm, то кинетическая энергия тела как механической системы Т = - / v • v dm
80 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ приобретает вид Здесь через Je обозначен коэффициент, называемый моментом инерции твердого тела вокруг оси е: ч- р2 dm. В случае, когда ось вращения не фиксирована и в теле только одна неподвижная точка О, кинетическую энергию его можно под- подсчитать, воспользовавшись форму- формулой Эйлера (§9): Т - - (и х г) • (ы х г) dm. Векторное произведение и х г можно представить, как линейное преобразование вектора и с матри- матрицей преобразования г; Рис. 26 о Здесь f, 77, С — компоненты вектора г в подвижных, жестко связанных с телом осях, р, q, r — компоненты вектора и в тех же осях. Поскольку скалярное произведение под знаком интеграла можно представить соответствующим произведением матриц (ы х г) • (ы х г) = uTrTrui то выражение для кинетической энергии приобретает вид = - I и г ru am = -и = -u-Ju. Здесь буквой J обозначен тензор инерции: ¦= /r
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 81 Произведение стоящих под интегралом матриц имеет вид о -С v \ ( о С • V о # -€ч С2 + е2 -О? -ее -сч v2+e2, Видно, что по диагонали тензора инерции получились моменты инерции вокруг осей С, *?> ? Элементы вне главной диагонали на- называются центробежными моментами инерции: /Т I /Г ГГ ST I ~"~ I — 1С I — / Г Кинетическую энергию можно вычислить и так: Т = - / v • (ы х г) dm = - /W'(rxv) dm = -w • К. Сравнивая этот результат с полученным выше, находим выра- выражение для кинетического момента: При помощи тензора инерции можно вычислить момент инерции вокруг произвольной оси е. Подставляя в выражение Т = и ¦ Ju/2 вектор угловой скорости в виде и = ые, получим Т — и2е • Je/2. Сравнивая это выражение с ранее полученным Т = (\/2)u2Je) находим Je = e Je. Установим некоторые свойства моментов инерции твердого тела. Параллельный перенос осей. Пусть осуществлен параллельный перенос осей: ? = ?' + а, т\ = ц1 + Ъ, ? = CJ + с. Изменение осевых моментов инерции проследим на примере момента инерции вокруг оси ?: 3^ - I {(?+ гJ) dm =¦ 1((.'2 +ril2)dm+2c I ? dm+2b I т)' dm+(a2+b2)M. Если в результате переноса начало координат попало в центр масс тела, то j?' dm = frf dm = f?* dm -Ои мы приходим к теореме Гюйгенса-Штейнера: момент инерции вокруг оси, проходящей через 7 Зак 233
82 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ центр масс, имеет минимальное значение в сравнении с моментом инерции вокруг прочих осей, параллельных данной, и отличается от них произведением массы тела на квадрат расстояния до соответствующей оси. Изменение центробежных моментов рассмотрим на примере мо- момента относительно осей ? и г\ : J(V = I Zr)dm= ft)' dm+a / 7/ dm + b ?' dm + abM. Видно, что если параллельный перенос осуществляется из цен- центра масс вдоль одной из координатных осей (из трех величин а, Ь, с не равна нулю только одна), то центробежные моменты инерции не меняются. Поворот осей. Пусть от осей ?7?? перешли к осям ?'т/ С,' при помощи матрицы поворота 5, так что векторы и и К в новых осях приобрели вид u>' = Su>% K' Связь между К' и о/ принимает вид К' = SJSTu'. Следовательно, тензор инерции в повернутых осях может быть подсчитан по формуле J' = Этот закон преобразования и определяет смысл названия "тензор". Из алгебры известно, что любая симметрическая положитель- положительно определенная матрица преобразованием поворота может быть приведена к диагональному виду: ' А О О J' = [ О В О О О С t Оси, в которых тензор инерции тела имеет диагональный вид, называются главными осями инерции тела. Если эти оси допол- дополнительно проходят через центр масс, то они называются главными центральными осями инерции. В главных осях кинетическая энергия лриобретает простейший вид l Эллипсоид инерции. Это геометрическая поверхность, жестко связанная с телом, которая строится так. В произвольном напра- направлении, задаваемом вектором е, отложим отрезок длиной 1/лД7ё
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 83 Геометрическое место таких точек и есть эллипсоид инерции. Дей- Действительно, подставляя в выражение Je = е • Je вектор е в виде е = Yy/~J~e) получаем г- Jr= 1. В главных осях это уравнение имеет простейший вид 2. Динамические уравнения Эйлера. Динамические уравнения Эйлера для твердого тела с одной неподвижной точкой выводятся из теоремы об изменении момента количества движения (§12): j = M, К = {КХ,КУ,К,}, М = {Мх,Му,Мг}. В этом выражении К и М рассматриваются в проекциях на не- неподвижные оси xyz. В дальнейшем оказывается более удобным рассматривать это уравнение в проекциях на оси, жестко связан- связанные с телом — ?т}?. Для того чтобы написать соответствующие уравнения, восполь- воспользуемся правилом вычисления полной производной от вектора, за- заданного своими проекциями в подвижной системе координат (см. гл. 3). Если обозначить угловую скорость тела, или, что то же самое, трехгранника ?77^ через ы, то рассматриваемое уравнение принимает вид: К = {К(, К„, А'с}, w = {р, q, г}, М = {М<, М„, Мс}. Удобство этого уравнения заключается в том, что в нем вектор К выражается через вектор ы установленным выше отношением К = Ju, в котором тензор J уже не зависит от времени. Выбирая в качестве осей ?т?С главные оси инерции тела, в покоординатной форме написанное уравнение получим в виде Эти уравнения и называются динамическими уравнениями Эйлера. В общем случае момент внешних сил М зависит от положения твердого тела относительно триедра xyz, от скорости ы и от 7*
84 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ времени. Поэтому для замыкания системы к ним необходимо присоединить кинематические уравнения, связывающие положение тела с его угловой скоростью. Эти уравнения могут быть взяты в любой из установленных в §9 форм: кинематические уравнения Эйлера в углах Эйлера, кинематические уравнения Пуассона в ортогональных матрицах, или в кватернионах. 3. Решение в случае Эйлера (М = 0). Особый интерес пред- представляет собой движение тела по инерции, т.е. когда внешние моменты равны нулю. Этот случай и называется случаем Эйле- Эйлера. Выбрав в качестве кинематических уравнений, дополняющих динамические, уравнения Эйлера, запишем полную систему диф- дифференциальных уравнений, описывающих движение твердого тела с одной неподвижной точкой по инерции: Cjt+{B- А)рд = 0, • _ p sin (p + q cos (f * ~ sin9 ' 9 = p cos (p — qsirnp, ф = r - (psimp + gcos<p)ctg#. Уравнения расщепились, динамические уравнения могут быть решены независимо от кинематических. Найденное для динамиче- динамических уравнений решение затем нужно подставить в кинематические уравнения, что позволяет решить и их. Для решения динамических уравнений заметим, что в случае М — 0 система допускает интеграл кинетического момента и интеграл энергии. Век?Ь^ кинетического момента постоянен в осях xyz: К = const. В осях ?т7? постоянным будет лишь его модуль: Добавив к нему интеграл энергии Ар2 + Bq2 + Сг2 = 2Т,
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 85 получаем систему алгебраических уравнений, позволяющих выра- выразить из нее любые две компоненты скорости через третью. Положим для определенности А > В > С {А > С). (Случай А = В = С очень прост. В нем и — const, и все движение состо- состоит во вращении тела с постоян- постоянной скоростью вокруг неподвижной оси.) Выразим из первых двух ин- интегралов компоненты риг, учи- учитывая, что определитель системы относительно переменных р2 и г2 равен АС(А-С) и, следовательно, отличен от нуля: р= ±y/a-bq2) r = ±^/c-dqt. рис. 27 Здесь параметры а, 6, с, d выра- выражаются через исходные параметры задачи. Подставляя эти соот- соотношения в уравнение Bdq/dt + (А - С)рг = 0, находим = 0. Нахождение из этого уравнения q(t) сводится к обращению эллиптического интеграла: А-С, В ( dq о v/(a-&<?2)(c-<V) Такое обращение делается при помощи так называемых элли- эллиптических функций, что и завершает задачу нахождения р(<), q(t) и r{t). Для того чтобы решить кинематические уравнения, их удобно записать, выбрав трехгранник xyz специальным образом: пользу- пользуясь неизменностью вектора К, направим ось г по этому вектору (рис. 27). Тогда проекции вектора К на оси ?т}( примут вид К$ = К sin 0 sin (p) Krj = К sin в cos <p, С другой стороны, К$ = Ар, Kv = Bq, K^ = Лг, что позволяет последовательно найти й Ar(t) Bq{t) cos0 = —^-, cosy? = *. '. К Y К sin в
86 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Для нахождения ф воспользуемся первым из кинематических уравнений Эйлера: lp(t) si q{t) cos <p(t) sinfl(t) eft. 4. Геометрическая интерпретация Мак-Куллага. Использованные выше интеграл модуля кинетического момента и интеграл кине- кинетической энергии, выраженные через компоненты скорости р, д, г, могут быть выражены через компоненты кинетического момента: fc'2 I fc'2 i fc'2 — fc'2 1\? + An + Лс - А , Л + В + С Эти уравнения позволяют получить достаточно ясное предста- представление о движении тела в случае Эйлера. В осях Л^, КГ)) К^ первое уравнение представляет собой сферу радиуса К, второе уравнение — эллипсоид, называемый эллипсоидом Мак-Куллага, с полуосями л/271 Л, у/2ТВ и л/2ТС. В процессе движения тела вектор кинетического момента должен принадлежать пересечению этих поверхностей. Само пересечение возможно, если радиус сферы лежит между большой и малой полуосями эллипсоида: 2ТА > К2 > 2ТС. Поскольку вектор К неподвижен в пространстве xyz, а эл- эллипсоид Мак-Куллага неподвижен в теле, то движение тела в пространстве xyz представляет собой обкатывание эллипсоидом не- неподвижного конца К по линиям пересечения эллипсоида со сферой. Проследим характер траекторий вектора К на рассматриваемом эллипсоиде. Начнем с критического случая К2 = 2ТВ. В этом случае траектория является плоской. Действительно, умножив интеграл энергии на В и вычтя его из интеграла кинетического момента, получим В в_ с откуда следует
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 87 Эти две плоскости проходят через ось г\ (ось среднего момента инерции тела) и пересекают эллипсоид Мак-Куллага по двум эл- эллипсам, которые разделяют остальные траектории на два класса: 1) эпициклоидальное движение, 2) перициклоидальное движение. В первом случае траектории являются замкнутыми вокруг оси ? кривыми, во втором — они замкнуты вокруг оси С (рис. 28). Это следует из того, что предель- предельным для первого случая является движение с К2 = 2ТС, для которо- которого К$ = А',, = О, К{ ф 0. Во втором ?"" случае предельным является дви- движение с К2 = 2ТА, для которого А> ф 0, К„ = Яс = 0. Для завершения рассматривае- рассматриваемой интерпретации осталось заме- заметить, что проекция скорости тела на ось К постоянна: и К = = 2Т, и для определения положения тела вокруг этой оси можно воспользоваться теоремой о телесном угле. 5. Геометрическая интерпретация Пуансо. В отличие от преды- предыдущей интерпретации здесь используется эллипсоид инерции: / = ?2А + г]2В + С2С - 1 = г • Jv - 1 = 0. Рис. 28 Покажем, что при движении твердого тела в случае Эйлера жестко связанный с телом его эллипсоид инерции катится без про- проскальзывания по неподвижной плоскости, перпендикулярной векто- вектору кинетического момента (рис. 29). Действительно, рассмотрим точ- точку на поверхности эллипсоида инер- инерции, через которую проходит вектор угловой скорости и: г г = —ы. Подставляя этот вектор в уравнение эллипсоида, получим Отсюда следует \/2Г = const. К Рис. 29
88 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Вычислим нормаль к эллипсоиду в этой точке: dr -Д=1С Мы получили, что эта нормаль в процессе движения неиз- неизменна. Для того чтобы касательная плоскость к эллипсоиду в рассматриваемой точке была неизменной, осталось, таким образом, показать, что расстояние от нее до неподвижной точки постоянно. Это расстояние равно г 1С К г Klj 1 == КуДТ 2Т = const. Поскольку через рассматриваемую точку проходит вектор угло- угловой скорости, то это значит, что скорость этой точки тела равна нулю, т.е. тело, представляемое своим эллипсоидом инерции каса- касается неподвижной плоскости без проскальзывания. Такое качение называется движением Пуансо. Точка Р описывает в эллипсоиде инерции кривую, называемую полодией, соответствующая кривая на неподвижной плоскости называется герполодией. 6. Уравнение динамически симметричного тела в наблюдаемых переменных. Динамические уравнения Эйлера для симметрично- симметричного твердого тела (когда, например, А — В) несколько упрощаются. у Однако наличие у тела динами- динамической симметрии может быть ис- использовано более существенно. Ни- Ниже мы получим уравнения, в ко- которых динамические и кинемати- кинематические уравнения неразрывно сли- слиты и которые после своего реше- решения не требуют геометрической ин- интерпретации движения, поскольку записаны в переменных, непосред- непосредственно доступных наблюдению. Введем следующие обозначения (рис. 30): е — единичный вектор оси динамической симметрии тела, С — момент инерции тела вокруг рис зо этой оси (полярный момент инер- инерции), А — момент инерции тела вокруг любой оси, перпендикулярной оси динамической симметрии (экваториальный момент инерции). Тензор инерции тела в главных
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 89 осях имеет вид (А О О J = О А О \0 О С, Тензор инерции обладает следующими свойствами: JR = CR, если R || e, JR = AR, если Rle, т.е. направленные таким образом векторы являются собственны- собственными векторами тензора инерции, а моменты инерции А и С — соответствующими собственными числами. Все векторные величи- величины, фигурирующие в задаче, удобно раскладывать по собственным векторам тензора инерции. Угловая скорость тела Л = {р, g, r} = re + u (u_Le). Момент внешних сил М = {М^, Мтц Мс} = Mce + m (mle). Момент количества движения К = Jft = J(re + w) = rCe + Au = He+ Aw, где через Н = rC обозначен так называемый собственный кинети- кинетический момент тела. Теорема об изменении момента количества движения дает at Исключим из этого уравнения производную от проекции угловой скорости на плоскость, перпендикулярную оси динамической сим- симметрии ш. Для этого по теореме Эйлера о распределении скоростей в твердом теле запишем ё = ft х е = (re + ы) х е = ы х е. Умножая это равенство слева векторно на е, получаем ехё = ех [ыхе] = ы. После чего теорема об изменении К приобретает вид Не 4- Не + Ае х ё = М. 6 Зак. 233
90 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Или, в проекциях на собственные векторы: f Я = Мс, [ Ае х ё 4- Не = т. Если, как это часто бывает, правые части полученной системы зависят только от t) e, ё, Я, то эта система оказывается замкнутой и достаточной для полного описания движения тела, поскольку для динамически симметричного тела его положение вокруг дина- динамической оси симметрии интереса не представляет. Рассмотрим в качестве примера свободное движение тела. В этом случае М^ = О и m = 0. Из первого уравнения находим Я = const, а второе уравнение принимает вид Ае х ё+Яё = 0, из которого следует первый интеграл Ае х ё + Яе = К = const. Умножив это равенство скалярно на е, находим Я = К • е = К cos в — const. Таким образом, тело движется так, что угол 9 между осью е и постоянным вектором К остается постоянным, т.е. ось е описывает коническую поверхность. Для того чтобы выяснить скорость движения по этой конической поверхности, умножим найденный первый интеграл векторно на е справа: [Ае х ё] х е = К х е, откуда следует К е=тхе, А Это означает, что вектор е движется по конической поверхности с постоянной угловой скоростью, равной К/А. Движение тела, в котором тело вращается с постоянной ско- скоростью вокруг некоторой оси, которая, в свою очередь, движется с постоянной скоростью по поверхности прямого кругового конуса, называется регулярной прецессией. Таким образом, свободное движение динамически симметричного твердого тела полностью описано.
§ 19. ДИНАМИКА ТВЕРДОГО ТЕЛА 91 Выясним теперь, может ли тело совершать регулярную прецес- прецессию под действием внешнего момента т. Подставляем условие регулярной прецессии ё = и х е в уравнение Ае х ё + Не = ш, для чего предварительно вычислим e = i/xe = i/x[i/xe] = ui/cos в - ей2. После подстановки в уравнение находим Ле х м cos в + Ни х е = т. Таким образом, вызывающий регулярную прецессию момент напра- направлен по вектору и х е и имеет модуль т = (Я - и A cos 9)i/ sin 9. 7. Волчок Лагранжа. Момент сил, вызывающий регулярную прецессию и вычисленный в п. 6, возникает естественным образом в случае, когда тело находится в поле тяжести, а центр тяжести его смещен вдоль оси симметрии на расстояние / от точки подвеса. Тогда уравнение движения волчка приобретает вид Ле х ё -h He = Mgle x е. Здесь через М обозначена масса тела, д — ускорение земного тяготения, е — единичный вектор направления силы тяжести. Величина d = Mgl называется неуравновешенностью. Будем искать частное решение этого уравнения в форме регу- регулярной прецессии с осью прецессии, направленной по оси тяжести: ё = ve х е, где v — искомая угловая скорость прецессии. Подставляя это выражение в уравнение волчка, получим (Н -vAcosO)v + d= 0. Если ось динамической симметрии перпендикулярна направлению поля тяжести, то cos0 = 0 и написанное уравнение для нахождения скорости прецессии v имеет единственное решение i/=-d/# — скорость прецессии направлена противоположно полю тяжести. Если cos0 ф 0, то рассматриваемое уравнение имеет решение вида _ Н±у/Н2 + AAd cos в V~ 2 A cos 0
92 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Отсюда видно, что если cos0 > 0, то имеются два решения. Если cos# < 0, то два решения имеются, если Я2 > -4Ad cos в. В частности, если cos в = — 1, то условие Я2 > 4Ad известно как условие Майевского устойчивости вертикального положения волчка. Если Я2 < 4Ad cos 6, то движений типа регулярной прецессии нет. Во всех случаях существования двух решений одно из них # + \Atf+4Adcos0 v = -> оо (Я -> оо) имеет порядок роста Я при увеличении Я, другое Я- ^Я2 + 4Ad cos в п ,„ v - — > О (Я -> оо) 2 A cos в v ; имеет порядок убывания 1/Я. Первое решение носит название быстрой прецессии, второе ре- решение — медленная прецессия. Динамически симметричное твердое тело, имеющее одну непо- неподвижную точку и достаточно большой собственный кинетический момент Я, называется гироскопом. Предположение, что Я —> сю позволяет воспользоваться при- приближенной теорией гироскопа, получаемой, если в уравнениях Н =. М{} Ае х ё + Яё = m пренебречь членом Ае х ё в сравнении с членом Яё : bT = AfCl Яё = т. Эти уравнения называются уравнениями прецессионной теории гиро- гироскопа: скорость конца вектора собственного кинетического момента равна моменту внешних сил. В частности, если, как в предыдущем примере, к волчку в точке / на его оси приложена сила F, то его прецессионные уравнения примут вид Я = 0, Яе = /ех F. Из них следуют три основных свойства гироскопа: 1) гироскоп стремится сохранить направление своей оси не- неизменным в инерциальном пространстве, поскольку, несмотря на наличие F, скорость ё -> 0 при Я -> оо;
§ 20. РЕАКТИВНОЕ ДВИЖЕНИЕ 93 2) eJ_F — приложенная сила вызывает движение не по напра- направлению силы, а перпендикулярно ему; 3) гироскоп обладает свойством "безинерционности", т.е. при приложении силы F или при снятии ее скорость ё мгновенно принимает значение (//Я)е х F или обращается в ноль (гироскоп мгновенно останавливается). § 20. Реактивное движение Системы, рассмотренные в гл. 4, состояли из неизменного числа точек, каждая из которых обладала неизменной массой. Такие системы называются системами постоянного состава. Нередко, однако, приходится иметь дело с ситуацией, когда в процессе движения масса системы меняется. Если рассматривать системы, в которых за малые промежутки времени и масса изменяется мало, т.е. системы с непрерывным изменением массы, тогда система переменного состава может быть представлена как система постоянного числа точек, обладающих переменной массой. В этом случае в число внешних сил, дей- действующих на каждую точку, следует включить так называемые реактивные силы, обусловленные изменением массы, к вычислению которых мы и переходим. Материальная точка (материальное тело, размерами которого можно по смыслу задачи пренебречь) может иметь переменную массу тогда, когда к ней непрерывно присоединяются или его непрерывно покидают частицы исчезающе малой массы. Рассмотрим два состояния материальной точки массы т: в момент времени t и в близкий момент времени t + At. За время At к этой точке присоединилась частица массы Ami, имевшая перед присоединением скорость щ, и точку покинула частица массы Ат2 со скоростью иг- Подсчитаем количество движения системы точка и две частицы в моменты времени t и t + At. В момент времени t: р = mv В момент времени t + At: р + Ар = (т + Ami - Am2)(v + Av) + A7712U2. Изменение количества движения равно импульсу всех внешних сил, действующих на точку и частицы: Fe dt. Разделив это соотношение на At и устремив At к нулю, находим: dv dm\ . ч
94 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Или 4 где реактивная сила имеет вид R(u Выражения ui - v и иг - v представляют собой относительные скорости соответственно присоединяющейся и отделяющейся частиц. Полученное уравнение, обобщающее уравнение Ньютона на слу- случай переменной массы, называется уравнением Мещерского. Ис- Использование реактивных сил для движения описано в "Пневматике" Герона (I век н.э.). Первое вычисление реактивной силы выполнено Д.Вернулли в его "Гидродинамике" в 1738 году. Пример (обменные силы). Рассмотрим две достаточно длин- длинные платформы, движущиеся параллельно друг другу (рис. 31). Платформы имеют одинаковую , % массу М и равные начальные ско- I*1 х рости. Когда одна из платформ .$ догоняет другую, платформы на- I*" у чинают обмениваться грузом; при- чем количество массы, покидаю- Рис. 31 щей платформу в единицу вре- времени, равно количеству массы, добавляющейся к платформе за это же время. Будем полагать для простоты это количество постоянным. Скорость отделяющейся массы вдоль оси платформы равна скорости платформы (груз кидают перпендикулярно оси движения). Требуется определить движение платформ на интервале времени, в течение которого описанный обмен происходит в предположении, что никакие внешние силы на платформы не действуют. Решение. Напишем уравнение Мещерского для каждой плат- платформы: .... dm dm = ~df(Ul ~x>~ ~dt^U2 " Х'} My=—{vl-y)-—{v2-y). По условиям задачи dm/dt = const, M — const, скорость частиц, прибавляющихся к первой платформе ui, равна скорости второй платформы: и\ —у и, наоборот, v\ = x, скорость частиц, покидаю- покидающих первую платформу, равна скорости этой платформы: —1*2 = х и, аналогично, v2 = у. Поэтому написанная система принимает вид
§ 21. ТЕОРИЯ УДАРА 95 Реактивные силы, появившиеся в правых частях уравнений, но- носят название обменных сил, они приводят к выравниванию скоро- скоростей платформ. Действительно, общее решение написанной системы уравнений имеет вид х = Л + Ct + De'2^, ± = (С - y = B + Ct- De-2"', y = C + Произвольные постоянные А, В, С, D определяются начальными условиями. Видно, что если время действия обменных сил доста- достаточно велико, то скорости х и у стремятся к общему значению: § 21. Теория удара 1. Понятие об ударе. Ударом называется процесс мгновенного изменения скорости материальной точки под действием мгновенных сил. Понятия мгновенного изменения скорости и понятие мгновен- мгновенной силы являются весьма удобными в расчетах идеализациями той ситуации, когда конечное изменение скорости происходит за малые промежутки времени при кратковременном действии больших по величине сил. Понятия "большая сила" и "малый лромежуток времени" име- имеют смысл, когда эта сила сравнивается с какими-либо другими силами, действующими на точку, а время — с характерными вре- временами, такими как, например, период собственных колебаний, время затухания переходного процесса и т.п. Кроме мгновенных сил на точку могут не действовать никакие другие. Тогда идеализация при помощи удара имеет субъектив- субъективный характер: время действия мало по сравнеию со временем наблюдения, а сила считается большой потому, что за малое время приводит к конечным изменениям скорости. Рассмотрим действие мгновенных сил на материальную точку. Движение свободной материальной точки под действием силы F подчиняется дифференциальному уравнению Изменение количества движения материальной точки за время от to до t равно Г* тт — тг0 = I Fdt. Jt0
96 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Векторная величина, равная Jto J = / Fdt, называется импульсом силы за промежуток времени от to до t (§ю). Мгновенной силой, действующей на материальную точку в мо- момент времени t0) назовем такую идеализацию большой силы F, действующей на малом промежутке времени t — t0) при которой следующий предел имеет конечное значение: lim / Fdt = J. Этот предел и называется ударным импульсом. Изменение количества движения материальной точки при этом равно Д(тг) = J. То есть скорость рассматриваемой точки в момент времени 2о. в который действует ударный импульс, изменяется скачком. Заметим, что мгновенная сила за время своего действия не производит перемещения материальной точки. Действительно, если еще раз проинтегрировать исходные дифференциальные уравнения, то получим rt ,t тт - тпго = mro(t - t0) + / dt I F dt Jt0 Jt0 и при переходе к пределу t -> *о имеем тг - тг0 =0, поскольку Jt0 Jto 2. Общие теоремы теории удара. Общие теоремы динамики системы материальных точек могут быть переформулированы для случая, когда среди действующих на систему сил присутствуют мгновенные силы, следующим образом. Теорема об изменении количества движения при ударе. Ана- Аналитическое выражение теоремы в общем случае
§ 21. ТЕОРИЯ УДАРА 97 в котором в левой части стоит производная от количества движения системы материальных точек, а в правой части — сумма всех внешних сил, действующих на эту систему, после интегрирования от /о до t принимает вид р-ро = / y^F^dt. При t -+ to импульсы обычных сил стремятся к нулю, импульсы мгновенных сил, в соответствии с принятой выше идеализацией этих сил, стремятся к ударным импульсам: Изменение количества движения системы материальных точек в момент удара равно сумме всех внешних ударных импульсов, действующих на систему в этот момент. Теорема об изменении момента количества движения при ударе. Проинтегрируем от to до t аналитическое выражение для этой теоремы, записанное в общем случае в виде dK d (^ Л ST^ т> -IT = 37 > .т»*» х ГП = > г„ х F,, - Мгс х wOl где wo — ускорение той точки (полюс), относительно которой вычисляются момент количества движения и момент внешних сил, гс — координата центра масс в системе, начало которой совпадает с подвижным полюсом, ги — координаты точек в этой системе. В результате интегрирования имеем rt rt К - Ко = / Vr.xF.A- / Мгс х wo Л. Jto и Ло При t —> to в правой части остаются лишь моменты от внешних мгновенных сил: К - Ко = Y^ ги х Ju. Изменение момента количества движения системы матери- материальных точек относительно произвольно движущегося полюса в момент удара равно моменту внешних ударных импульсов. Подчеркнем, что эта теорема имеет одинаковый вид независимо от того, подвижен или неподвижен полюс, совпадает ли он с центром масс или нет.
98 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Общее уравнение динамики системы материальных точек при ударе. Общее уравнение динамики системы некоторого числа свя- связанных материальных точек ихи - Fxu)Sxu + {тиуи - Fyu)Syu + (muzu - F2u)Szu] = О для описания процесса удара может быть видоизменено следующим образом. Пусть среди сил Р^ присутствуют мгновенные силы. Обозначим эти силы через Gu и выделим их из сил F^ : где Фи — прочие, "обычные" силы. Общее уравнение динамики будет справедливым и в случае, если гипотезу Лагранжа об идеальных связях распространить и на случай удара. Осуществляя интегрирование за время удара, запишем / {тиги - Fu) dt = muAru - <&udt- Gu dt. Jt0 Jto Jto Поскольку /ф^Л-чО, Gudt Лп Jtn Ho Jto то общее уравнение динамики можно переписать в виде • Sru = О, называемом общим уравнением теории удара. Теорема Карно. В теореме Карно рассматривается система свя- связанных материальных точек, на которую не действуют внешние ударные импульсы Ju = О, но которая в некоторый момент времени подвержена внезапному наложению дополнительных связей, сохра- сохраняющихся в дальнейшем. Такие связи называются неупругими. Общее уравнение теории удара в этом случае имеет вид гиАти • 5ти = 0. Положим, что связи не зависят от времени. Тогда можно выбрать &yw = kru и из написанного уравнения получим
§ 21. ТЕОРИЯ УДАРА 99 Поскольку (г, - тио)ти = - r,0J + (l/2)rj - (l/2)rjol то где v, = ти - rUo, То = J2u{rnu/2)rlQ) Tx = ЕЛ™^)**. Потеря кинетической энергии при наложении неупругих связей равна кинетической энергии потерянных скоростей. 3. Удар материальной точки о препятствие. Препятствие, о которое происходит соударение материальной точки, полагается не- неподвижным в некоторой инерциальной системе координат. Удар называется прямым, если скорость материальной точки перед со- соударением направлена по нормали к поверхности препятствия в точке соударения. Удар называется абсолютно упругим, если ско- скорость материальной точки при ударе меняется на противоположную: г>+ = —у" (v" — скорость до удара, i>+ — после). Удар называ- называется абсолютно неупругим, если после удара материальная точка осталась на поверхности, т.е. v+ = 0. Промежуточный случай выражается гипотезой Ньютона: где коэффициент к, называемый коэффициентом восстановления, лежит в пределах 0 < к < 1. Косой удар (рис. 32). Если скорость материальной точки перед ударом не направлена по нормали к поверхности, то следует рас- рассмотреть изменение обеих ее про- проекций (движение предполагается плоским). Для проекции на нор- нормаль используется, как и в случае прямого удара, гипотеза Ньютона: Для того чтобы связать доудар- ные и послеударные значения со- составляющей скорости вдоль пре- У///////////////////////////////////Л Рис. 32 пятствия, требуется новая гипотеза. Употребительными являют- сядве гипотезы. Первая использует закон Кулона, связывающий нормальное и касательное усилие при сухом трении (гипотеза Ра- Рауса), что приводит к соотношению — приращение скорости в касательном направлении пропорцио- пропорционально приращению скорости в нормальном направлении, / —
100 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ коэффициент сухого трения. Подставляя в это соотношение связь между нормальными составляющими, получим что и выражает в окончательной форме гипотезу Рауса. Другая, более простая гипотеза основывается на предположении, что изменение касательной составляющей скорости пропорционально доударному значению этой составляющей: Стесненный удар. Стесненным ударом называется удар несво- несвободной материальной точки о неподвижное препятствие, т.е. точки, стесненной некоторыми связями с другими точками. В случае нестесненного косого удара движение материальной точки характеризуется равенством угла падения углу отражения, когда удар абсолютно упругий, и большим значением угла отраже- отражения для неупругого удара (угол измеряется от нормали). В случае стесненного удара равенства этих углов может не быть даже для абсолютно упругого удара. Рассмотрим пример на рис. 33. Две одинаковые массы, связан- связанные абсолютно жестким, невесомым стержнем, совершают плоское движение. Одна из масс сталкивается с неподвижной преградой, характеризуе- характеризуемой неудерживающей связью у > 0. Пе- Перед ударом скорости х, у, ф произволь- I q-___^ ны. Требуется найти приращения этих скоростей Air, Ay, Ay?, возникающие в результате удара в предположении, что ________^________ удар идеальный (кинетическая энергия У////////////////////////////////л v \ системы в момент удара не изменяется). рис зз В этом примере материальная точ- точка в момент удара находится под дейст- действием двух мгновенных сил: одна сила направлена по нормали к поверхности, о которую происходит соударение, вторая сила направлена по стержню, связывающему две точки, и определяет реакцию связи в момент удара. Это и объясняет более сложную картину движения, чем в случае свободной материальной точки. Общий метод решения подобных задач дан в §32. Столкновение двух материальных точек. Рассмотрим про- простейшую ситуацию, когда сталкиваются две движущиеся по одной прямой материальные точки. Пусть их массы т\ и Ш2, а скорости v\ и i>2 соответственно. Скорости измеряются в той системе отсчета, в которой центр масс неподвижен.
§ 21. ТЕОРИЯ УДАРА 101 Из закона сохранения количества движения имеем + 7712^2 = 0. Это соотношение справедливо как для доударных скоростей, так и для послеударных, поскольку никаких внешних мгновенных сил не предполагается. Из этого следует ТП2 Гипотеза Ньютона для двух сталкивающихся материальных точек состоит в равенствах: V+ = - Этими равенствами связаны не только скорости точек относительно их общего центра масс, но и до уд арная и послеударная относи- относительные скорости и = V2 - v\ : Если одно из тел много больше другого (mi >> 7712), то задача о столкновении двух точек переходит в задачу о столкновении точки с неподвижным препятствием. 4. Удар шаров. Задача об ударе шаров в предположении, что ударный импульс направлен по общей нормали к поверхности шаров в точке касания, сводится к задаче об ударе двух материальных точек. Действительно, проведя ось х че- через центры шаров в момент удара (рис. 34), заключаем, что измене- изменение количества движения любого из шаров в проекции на ось у рав- равна нулю (поскольку сила взаимо- взаимодействия между шарами не имеет проекции на эту ось). Следова- Следовательно, проекции скоростей шаров на ось у в момент удара изменений не претерпевают. Что касается проекций этих скоростей на ось х,то они подчиняются законам, установленным для удара двух точек. 5. Удар твердых тел. Теорема об изменении момента количе- количества движения относительно неподвижной точки, записанная для твердого тела в проекциях на жестко связанные с ним оси, имеет вид (уравнения Эйлера) -т- +wxK = rxF. at Рис. 34
102 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ где и; — угловая скорость твердого тела, г — радиус-вектор точки приложения мгновенной силы F. Интегрируя это уравнение на интервале от t0 До t, на котором действует мгновенная сила, имеем К-Ко L и х КЛ = /: Fdt (предполагается, что точка приложения мгновенной силы не изме- изменяется за время от 2о До t). Переходя к пределу, получим lim t—fto x КЛ = 0, lim / Fdt = /:¦ и для изменения момента количества движения тела при ударе получается К-Ко = г х J. Гироскопические свойства тела при ударе никак не проявляются: изменение момента количества движения твердого тела, имею- имеющего неподвижную точку, под действием ударного импульса имеет одинаковый вид как в проекциях на неподвижные оси, так и на связанные с телом оси. Действие удара на твердое те- тело, имеющее неподвижную ось вра- вращения. Рассмотрим твердое тело в системе координат хуг, ось z ко- которой направлена по оси вращения тела (рис. 35). Центр масс тела находится в точке G(?, rj) С). В точке Р(а} 6, с) к телу приложен ударный импульс J = {JX} Jy> J2}. Поставим задачу: найти точку приложения импульса, т.е. вели- величины а, 6, с, такие, чтобы ось вра- вращения не испытывала ударных нагрузок. Такая точка существует, и она называется центром удара. В результате удара первоначально покоившееся тело приобре- приобретает вокруг оси z угловую скорость и. По теореме об изменении количества движения имеем Рис. 35 По теореме об изменении момента количества движения -Jxzlj = -cjy> -JyzU = cjx J22u = Jya - Jxb.
§ 22. ТЕОРИЯ РАССЕЯНИЯ ЧАСТИЦ 103 В этих соотношениях через М обозначена масса тела, а через Jxz, Jy2) Jzz обозначены моменты инерции тела относительно со- соответствующих осей. Из условия Jz = 0 следует, что ударный импульс должен быть перпендикулярен оси вращения. Неподвижную систему xyz можно выбрать так, чтобы ударный импульс лежал в плоскости ху\ кроме того, поворотом этой системы вокруг оси z можно добиться ортогональности этого импульса оси х. Таким образом, без ограничения общности можно считать, что Jx — 0. Тогда приведенные выше соотношения примут вид Отсюда следует: т) = О — центр масс должен лежать в плоскости, перпендикулярной ударному импульсу и проходящей через ось вращения; Jxz = Jyz = О — ось вращения должна быть главной осью инерции тела в точке О] а = Jzz/Wt), b — произвольно. § 22. Теория рассеяния частиц, Ставится следующая задача. Пучок легких электрически за- заряженных частиц, летящих из бесконечности, имеет первоначально цилиндрическую форму. Пролетая вблизи ядра тяжелого элемента, каждая частица испытывает воздействие со стороны ядра посред- посредством кулоновой силы. Вследствие этого при удалении частиц в бесконечность пучок приобретает коническую форму (рис. 36). Это явление называется рассеянием частиц. Будем предполагать взаимодействие частиц друг с другом несу- несущественным и сведем задачу к задаче двух тел (§18) с тем только отличием, что вместо силы притяжения будем иметь в виду силу отталкивания. Рис. 36
104 ГЛ.5. СПЕЦИАЛЬНЫЕ ЗАДАЧИ ДИНАМИКИ Обозначив массу легкой частицы ш, а массу ядра М, в системе координат, связанной с центром масс ядра и частицы, получим тт = к- r3 "г3' где е\ и в2 — электрические заряды ядра и частицы, имеющие одинаковый знак, А: — множитель пропорциональности, зависящий Рис. 37 от выбранной системы единиц, г — радиус-вектор легкой частицы. Как и в § 18 введем в плоскости движения полярную систему координат х = rcos(p) у = г simp (рис. 37). Тогда в переменных г и ip уравнения движения примут вид /•• 1\ а d / 2 ч т[г — пр ) = —г-, —(тг ip) = 0. V у } г2' dV У} Являющийся постоянным в силу второго уравнения момент количества движения частицы тг ф может быть выражен че- через скорость частицы на бесконечности V^ и через прицельное расстояние р: К = тг2ф = mVoop. Выполняя, как и в § 18, подстановку Бине, найдем d2u та 1 и = - г с очевидным начальным условием и@) = 0. Начальное условие для du/d<p найдем, используя равенство . dr . _ dr К _ ^K^d^u m dip _ _ d(p d(p mr2 Поскольку при ip = 0 г = —К») имеем du mVoo d9 Ф=о = ~К~
§ 22. ТЕОРИЯ РАССЕЯНИЯ ЧАСТИЦ 105 После этого решение написанного дифференциального уравнения второго порядка с указанными начальными условиями получается в виде та 1 . и = —И cos ip - 1) + - sin у?. К1 р Или, учитывая выражения для /i = mVoop '¦ 1Ч 1 . P p Нас интересует то значение угла (р) при котором г снова уходит в бесконечность: ( 1) + -siny> = О, откуда находим связь прицельного расстояния р с углом, опреде- определяющим отклонение траектории: а 1 — cos <р а <р а ае , • ч ^==tg=Ct6 (« = *^ Пусть теперь gW — число частиц, рассеиваемых внутри угла от ае до ае -f rfae. Число частиц, проходящих в единицу времени через единицу площади в исходной трубке, обозначим буквой п. Отношение dN Асг= п носит название дифференциального, эффективного поперечного се- сечения рассеяния. В луч, заключенный между углами ае и ае + с/ае, попадают частицы, которые в начале движения прошли через кольцо с внутренним диаметром р и внешним p + dp. Таких частиц в единицу времени проходит dN — п • 2wp dp = 7гп dp2. Следовательно, da = ndp2. Подставляя сюда найденное выше значение р) находим выражение для абсолютной величины da : sin3(ae/2) Это выражение называется формулой Резерфорда. От угла с/ае удобно перейти к телесному углу d6: dO = 27Г sin ае с/ае. Формула Резерфорда тогда приобретает вид sin4(ae/2)'
Часть III Лагранжева механика Глава 6. Уравнения Лагранжа для голономных систем § 23. Основные определения Механической системой будем называть конечную или беско- бесконечную совокупность материальных точек в трехмерном евклидовом пространстве. Будем говорить, что положение механической системы известно, если известно положение любой ее точки в некоторой декартовой системе координат. Сказанное означает, что нам известна вектор-функция: R=R(i/) = ставящая в соответствие точке системы, имеющей номер i/, ее декартовы координаты х, у, z. Два разных положения механической системы Ri(j/) и R2(^) близки друг другу, если точки Ri и R2 близки в смысле метрики трехмерного евклидова пространства Е3 для любого i>. Механическая система называется системой с конечным числом степеней свободы, если можно ввести такое конечномерное линейное (векторное) пространство Rm и такое множество точек М в нем, что между всеми возможными положениями механической системы и всеми точками множества М С Rm имеется взаимно-однозначное соответствие. Множество М называется конфигурационным многообразием ме- механической системы, если указанное соответствие дифференцируемо в обе стороны (под дифференцируемостью понимается /:-кратная непрерывная дифференцируемость, при этом конкретное значение к несущественно). Пример 1. На рис. 38 изображен двухзвенный маятник, состоя- состоящий из двух материальных точек 1 и 2, соединенных невесомыми, нерастяжимыми стержнями. Конфигурационное многообразие этой системы является тором (рис. 39). Откладывая углы а и /3 от произвольно выбранных за
§ 23. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 107 нулевые меридиана и параллели, убеждаемся в наличии взаимно- взаимнооднозначного соответствия между точками тора и положениями Рис. 38 Рис. 39 двухзвенного маятника. Сам тор в R3 может быть задан, например, таким уравнением: (х\ х\ - 5J = 16. Пример 2. Тонкий абсолютно жесткий стержень длиной /, один конец которого занимает произвольное положение на оси у (рис. 40), Рис. 40 Рис. 41 угол наклона стержня к оси х также произволен. Конфигурацион- Конфигурационным многообразием этой системы является бесконечный цилиндр
108 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ (рис. 41), уравнение которого может быть задано в виде Х\ хч хз х4 хъ Хб XI Х8 Х9 х3 — произвольно. Пример 3. Абсолютно твердое тело (рис. 42). В качестве номера точки, принадлежащей телу, можно взять ее декартовы координаты в некотором, жестко связанном с телом декартовом трехграннике [и — в этом случае вектор). В § б было показано, что конфигурационным многообразием твердого тела, одна точка которого неподвижна, является группа 50C). Если А — матрица, определяющая ориентацию трехгранника относительно трехгранника xyz: А = то это многообразие задается в пространстве Л6 уравнениями Х\Х^ + ^2*^5 "Ь ^3*^6 = 0) Если точка О не закреплена и рис. 42 ее координаты х0, уо, ^о произ- произвольны, то конфигурационное мно- многообразие такого тела представляет собой R3 произведение группы 50C) на трехмерное пространство. Числом степеней свободы механической системы называется размерность ее конфигурационного многообразия. Напомним, что размерностью многообразия называется разность между размерно- размерностью пространства, в которое оно погружено, и числом уравнений, задающих многообразие аналитически. В примерах 1 и 2 число степени свободы равно двум, в примере 3 — шести. (Условие detA = 1 не ограничивает размерности многообразия, поскольку в общем случае ортогональных матриц det^A = ±1 и это условие представляет собой лишь выбор одной из полостей в общем случае несвязного многообразия.) Параметризацией механической системы с конечным числом степени свободы называется введение конечного числа параметров <7Ь . .., qn) задание которых однозначно определяет положение си- системы: Сами параметры q\} ..., qn называются лагранжевыми параметрами.
§ 23. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 109 Очевидно, в качестве таких параметров можно взять координа- координаты того #т, в которое погружено конфигурационное многообразие рассматриваемой системы: д, = Х{ (г = 1, ..., т), тогда запись R = R(j/, t, q)t q 6 M С Rm определяет глобальную параметриза- параметризацию. Однако если взаимно-однозначного соответствия между поло- положениями системы и точками ее конфигурационного многообразия требовать не всюду, а лишь в некоторой окрестности выбранного положения, то, используя уравнения многообразия, можно умень- уменьшить число параметров д, до минимального, равного числу степеней свободы. Такая параметризация называется локальной. Функция R = R(i/, t, <ji, ..., <7п), задающая локальную пара- параметризацию, должна обеспечивать взаимно-однозначное и взаимно непрерывно дифференцируемое соответствие между точками ука- указанных окрестностей. В частности, не должно существоать такого направления {е,}, производная вдоль которого равна нулю тожде- тождественно по всем точкам системы, т.е. по и. Следовательно, должно быть выполнено В противном случае будет существовать такая вариация локальных координат, которая не приводит к вариации положения, что вступает в противоречие с требованием непрерывной дифференцируемости обратного отображения. Геометрически независимые параметры <?,, задающие локальную параметризацию, называются локальными координатами конфигу- конфигурационного многообразия или обобщенными координатами рассма- рассматриваемой механической системы. В примере 1 локальная параметризация может быть такой: cosgi -f h cos<j2 i -f /i , RB, q) = где qi = a, g2 = /?• В примере 2 локальная параметризация может быть записана так: I/ cos <ji + 92 ',*) = где ?! = a, q2 = a. В примере З локальная параметризация имеет следующий вид: *. я) = Ч\ Я2 Яз С , V — V с v G телу,
ПО ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ где А — ортогональная матрица, выраженная, например, через углы Эйлера (§ 6). При этом дз — Ф> Я* = ^> Яъ — <Р- Если параметризация R = R(i/, t) g) от времени явно не зависит, то такая параметризация называется стационарной. В противном случае параметризация нестационарная. Во всех предыдущих примерах параметризация была стационар- стационарной. Пример 4. Пример нестационарной параметризации доставля- доставляет система, изображенная на рис. 43. Она представляет собой математический маятник, который может занимать произвольное положение в плоскости П (угол а — произволен). Сама же плос- плоскость П принудительно вращается вокруг Оси z с постоянной угловой скоростью и. Конфигурационным многообразием этой системы явля- является окружность. Угол а можно взять в качестве ее локальной ко- координаты gi = а. Положение ма- маятника однозначно задается следу- следующим образом: /sing cos ut I sing sin ut л h — I cos g Рис. 43 Y (зависимости от номера нет, так как точка одна). Если механическая система движется, то ло- локальные кординаты конфигурационного многообразия g являются функциями времени: Яг =4i{t) (» = 1,...,п). Если в движении системы локальные координаты не стеснены никакими дополнительными условиями типа fk{t,qt g) = *= связывающими производные от обобщенных координат, то такие координаты называются кинематически независимыми, а сами ме- механические системы — голономными. Виртуальным перемещением механической системы, локальная параметризация которой — R(j/, t, g), называется полный диффе- дифференциал этой функции при фиксированном времени: dR ^
§ 24. ВЬЮОД УРАВНЕНИЙ ЛАГРАНЖА 111 § 24. Вывод уравнений Лагранжа Рассмотрим в механической системе малую окрестность некото- некоторой точки R. Расположенный в этой окрестности малый элемент механической системы имеет массу dm и находится под действи- действием сил с массовой плотностью F, так что сила, действующая на рассматриваемый элемент, есть F dm. В соответствии со вторым законом Ньютона Rdm — F dm по- получаем R-F = 0. Рассмотрим виртуальное перемещение системы SH и вычислим работу силы Y dm на этом перемещении: SK • F dm. Полная работа всех сил, действующих на точки системы на виртуальном перемещении JR, есть 5А= ISRFdm. •I Интегрирование ведется по всей массе системы. Подставляя сюда выражение для виртуального перемещения, находим 6А = ]СS J Oqi где — коэффициенты линейной формы вариации положения Sq меха- механической системы в конфигурационном многообразии. Действующие на элемент dm силы с массовой плотностью F могут быть разбиты на два класса — реакции связей, плотность которых обозначим F', и все остальные с плотностью Fd. Реакции связей представляют собой силы взаимодействия между точками системы или с внешними по отношению к рассматриваемой системе точками, которые неизвестны заранее как функции времени, положения и скорости точек и должны быть определены из условий, наложенных на взаимное положение этих точек. Все прочие силы задаются в виде функций: Fd = Fd(t) R, R). Если в примере со стержнем (рис. 40) предположить, что он на- находится в однородном поле тяжести с силой тяжести, направленной вдоль оси х, то где д — ускорение силы тяжести.
112 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ Реакции связей в этом примере представляют собой силы двух видов: внутреннее напряжение в стержне, вычисляемые из условия, что он абсолютно недеформируем, и сила реакции в точке стержня v = О, вычисляемая из условия, что эта точка не покидает ось у. Эта сила является сосредоточенной, и ее массовая плотность представляется с помощью дельта-функции Дирака. Гипотеза идеальных связей. Связи называются идеальными, если виртуальная работа реакций связей тождественно по Sq равна нулю. Для того чтобы связи были идеальными, необходимо и достаточно равенство нулю коэффициентов линейной формы вир- виртуальной работы, вычисленных для F = F': Достаточность этого условия очевидна; необходимость следует из условия независимости вариаций Sqi и имеет место только для голономных систем. Определение. Коэффициенты линейной формы виртуальной ра- работы заданных сил F называются обобщенными силами рассма- рассматриваемой механической системы: fdR „dj Qi= / д— • Fd dm. J VQi Из уравнения Ньютона R - F = 0 следует qij^(R-F)dm = 0. Или, предполагая выполненной гипотезу идеальных связей и учи- учитывая обозначение для обобщенных сил: Если система голономна, то все Sqi независимы и из этого соотно- соотношения следует Вычислим стоящий в левой части равенства интеграл, для чего установим предварительно некоторые соотношения • „ dR s-^dR.
§ 24. ВЫВОД УРАВНЕНИЙ ЛАГРАНЖА 113 Отсюда находим: 5V _ дК dcji ~ dqi ' Наряду с этим соотношением покажем переставимость операций полного дифференцирования по времени с операцией частного диф- дифференцирования по координате: dt dqi dtdqi ^—' dqjdqi J С другой стороны, dV d2R sr^ d2R . И если частные производные переставимы, то d_dR_ 5V d< 3g,- dqi Интересующий нас интеграл представим в виде dt Или, используя выведенные выше соотношения, находим: Кинетической энергией (§ 10) механической системы называется следующий интеграл: Т = ]- fy - V dm. Учитывая это обозначение, окончательно уравнения можно переписать в виде d dT dT . ,. 1 9 Зак. 233
114 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ Это и есть уравнения Лагранжа для голономных механических систем. Обобщенные силы Q, называются потенциальными, если суще- существует такая скалярная функция времени и обобщенных координат (tt <?i, .., <7п)> что силы Qi могут быть представлены в виде Обобщенные силы Q, называются обобщенно потенциальными, если существует такая функция времени, координат и скоростей U{t, gi, . . ., qn) <7i, . .., ^n), что обобщенные силы могут быть пред- представлены в виде п _dU ddU В обоих случаях можно ввести функцию называемую функцией Лагранжа, или лагранжианом, или кинети- кинетическим потенциалом системы, с использованием которой уравнения Лагранжа можно представить в виде d ее дс . .. , . Пример 1. Силы, линейно зависящие от координат j с симметрической матрицей {а»;}, т.е. a{j = aJt, имеют потенциал Пример 2. Силы, линейно зависящие от скоростей
§ 25. СВОЙСТВА УРАВНЕНИЙ ЛАГРАНЖА 115 с кососимметрической матрицей {7ij}, т.е. 7»j = —7ji имеют обоб- обобщенный потенциал „ 1 Такие силы называются гироскопическими. § 25. Свойства уравнений Лагранжа 1. Ковариантность. Если обобщенные координаты д, подвергнуть невырожденным дважды непрерывно дифференцируемым преобра- преобразованиям qi —>> q{\ 4i = <7i(*> 9), то в новых переменных уравнения Лагранжа сохранят свою форму. Сказанное означает коммутативность следующей диаграммы: г.. d { f,Q d * dt дТ df dq dT ~dq~ df dq = Q—> уравнения движения В q I уравнения движения В q Справедливость утверждения очевидна, поскольку переменные qi также являются локальными координатами конфигурационного многообразия системы. Напомним (§2), что ковариантность урав- уравнений движения означает инвариантность правила их составления (уравнения Лагранжа), а не инвариантность самих, полученных в результате применения этого правила уравнений. 2. Калибровочная инвариантность. Если к кинетической энергии системы добавить полную производную по времени от произвольной гладкой функции времени и обобщенных координат, то уравнения Лагранжа не изменяется: Это утверждение проверяется прямой подстановкой так измененной кинетической энергии в уравнения Лагранжа.
116 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ 3. Структура кинетической энергии. Выясним, как зависит кинетическая энергия механической системы от обобщенных скоро- скоростей <jt-: . fdR dR 1 fdR dR Введем обозначения: 9R Ж, , fdR dR , „I /7<9R\2 , Кинетическая энергия записывается в виде Т = 2 и представляет собой сумму трех форм от обобщенных скоростей: квадратичной Тг = A/^) YlaijQiQj* линейной Т\ = ^^»^» и формы нулевой степени То(^, q). Коэффициенты этих форм являются функ- функциями времени и обобщенных координат: a,j(i, q), 6,(^, g), To(t, q). Механические системы, у которых кинетическая энергия за- зависит от обобщенных скоростей указанным образом, называются натуральными. 4. Невырожденность. В силу указанной структуры кинетической энергии уравнения Лагранжа всегда оказываются линейными по обобщенным ускорениям: ijtii + M** 9» Я) = 0» i= 1, ..., п. Матрица коэффициентов при ускорениях Л = {а^}} являющаяся матрицей квадратичной части кинетической энергии, невырождена: detA ^0. Для доказательства этого факта предположим противное, т.е. пусть detA = 0. Тогда следующая алгебраическая система относи- относительно неизвестных чисел t$ имеет нетривиальное решение Qijej =0, г = 1,...,п.
§ 25. СВОЙСТВА УРАВНЕНИЙ ЛАГРАНЖА 117 Пусть имеем такое решение: ?е? = 1. Оно определяет напра- направление в пространстве обобщенных скоростей {^}, вдоль которого кинетическая энергия системы принимает вид Здесь v — модуль вектора {<?,} = v{e,-}, a Вспоминая выражения для заключаем, что оно может быть тождественно по v равным нулю, тогда и только тогда, когда что противоречит введенному ранее определению локальной пара- параметризации. 5. Принцип наименьшего действия по Гамильтону. Действием по Гамильтону называется следующий функционал: S= [9C(t,g,q)dt9 ставящий в соответствие произвольной дифференциуемой кривой {qi{t)} число 5. Рассмотрим семейство кривых, проходящих в моменты времени t\ и ^2 через две заданные точки qa и qb. Параметр семейства а выбран так, что при а = 0 кривая этого семейства является действительной траекторией, соответствующей решению краевой задачи На рис. 44 эта кривая изображена жирной линией. Решение этой краевой задачи является единственным, если точки qa и qb выбраны достаточно близко друг к другу. Эти точки
118 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ если для них решение поставленной краевой задачи единственным не является. Будем предполагать, что на действительной траектории нет ки- кинетических фокусов, сопряженных точке qa (включая точку qb). Тем самым все остальные кривые семей- семейства q{t) а) при а ф О решениями поста- поставленной краевой задачи не являются. При подстановке этого семейства в функционал, выражающий действие по Гамильтону, мы получаем скалярную функцию скалярного аргумента S(ot). Если семейство является дифференци- дифференцируемым по а, дифференцируемой по а будет и функция S(a). Кривая семейства, для которой dS/da = О, называется экстремалью действия по Гамильтону. Теорема. Действительная траектория (а = 0) и только она является экстремалью действия по Гамильтону. Доказательство. Рис. 44 da ~ Jtl \dqda+ dqda) Второе слагаемое под знаком интеграла можно проинтегрировать по частям: L dqdaai- dqda . L dt\dq) да ' Поскольку все кривые семейства проходят через точки qa и qb, то = 0 dq_ да dq_ да и производная dS/da принимает вид d5 _ [**(9?_<1_дС\ dq_ da ~ Jtl \dq dtdq) да ' Если а = 0, то dC/dq - d(dC/dq)/dt = 0 и dS/da = 0. Если dS/da — 0, то, в силу произвольности dq/da, имеет место д? _d_dC. _ dq dtdq~ ' Теорема доказана.
§ 25. СВОЙСТВА УРАВНЕНИЙ ЛАГРАНЖА 119 В вариационном исчислении доказывается, что на самом деле экстремаль действия по Гамильтону обращает его в минимум. Это означает, что для любых кривых, достаточно близких к действительной траектории и с достаточно близкими скоростями (||д(*, а) - q{t, 0)|| < е, \\q(tt а) - q(tt 0)|| < е), действие по Га- Гамильтону строго больше действия вдоль действительной траекто- траектории. Такой экстремум называется слабым, в отличие от сильного экстремума, когда ограничений на скорости нет. 6. Движение по геодезическим. Если в системе обобщенные силы отсутствуют, то функция Лагранжа совпадает с кинетической энергией: C(t, q, q) = T(tt q, q). Рассмотрим стационарную систему T{t, Ч,Я) = \ Экстремаль действия по Гамильтону будет экстремалью функ- функционала, в котором вместо функции Лагранжа стоит произвольная дифференцируемая и монотонная функция от функции Лагранжа. В частности, на действительных траекториях минимальным будет интеграл S= Jtl представляющий собой длину кривой от точки qa до точки q b: в метрике, определяемой кинетической энергией, т.е. геодезическая, проходящая через рассматриваемые точки. Таким образом, движе- движение по инерции стационарной лагранже- вой системы представляет собой движе- движение по геодезическим ее конфигурацион- конфигурационного многообразия. Пример. Рассмотрим движение по инерции материальной точки на поверх- поверхности единичной сферы (рис. 45). В сферических координатах (q\, «72) кине- кинетическая энергия имеет вид Ll ~ TTilOi COS G2 ~t~ (/2) • , Рис 45 Точки qa и q° будут сопряженными ки- нетическими фокусами, если они диаметрально противоположны. Если этого нет, то единственная дуга большого круга, проходящая
120 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ через них, обращает в минимум интеграл представляющий собой при т — \ длину этой дуги. § 26. Понятие первого интеграла Рассмотрим автономную динамическую систему общего вида: Правые части определены в некоторой области D С Яп. Скалярная функция G(xi, .. ., хп), не являющаяся тождественно константой, определенная в той же области D, что и рассматриваемая система, называется глобальным первым интегралом или просто первым интегралом этой системы, если она остается постоянной вдоль любого решения этой системы: G[xi@,...,*n@] = const- Если функция G{x) дифференцируемая, то необходимым и до- достаточным условием первого интеграла является следующее тожде- тождество: Если скалярная функция G{x) удовлетворяет условию первого интеграла, но определена в подобласти области Д то она называ- называется локальным первым интегралом. Если правые части системы х = F(x) дифференцируемы, то в окрестности любой неособой точки х°, т.е. такой, что F(x°) ф О, система имеет п — 1 функционально независимых локальных первых интегралов. Глобальный первый интеграл, даже один, существует лишь в исключительных случаях и представляет собой интерес в механи- механике. Он позволяет полностью расслоить фазовое пространство на интегральные многообразия меньшей размерности. Пример. Механическая система х — у, у = -х, описывающая движение линейного одномерного осциллятора, имеет глобальный первый интеграл G(x,y)=x2+y2. И система, и функция x2-f-y2 определены во всей фазовой плоскости Я2. Система х = х, у = у имеет локальный первый интеграл G(x, у) = у/х, определенный всюду за исключением прямой х = 0. Глобальных первых интегралов у этой системы нет.
§ 27. ПЕРВЫЕ ИНТЕГРАЛЫ ЛАГРАНЖЕВЫХ СИСТЕМ 121 Определение первого интеграла в случае неавтономной системы Х{ = Fi(tt хь .... хп), г - 1, .... п, сводится к приведенному выше определению формальным сведением к автономной системе добавлением еще одного уравнения i = 1. Пер- Первым интегралом неавтономной системы будет скалярная функция G{t, хь . .., хп), удовлетворяющая всем указанным выше условиям. В частности, в случае дифференцируемости этой функции должно выполняться тождество В случае системы уравнений второго порядка, какими и явля- являются уравнения Лагранжа, первым интегралом будет называться скалярная функция GB, q, q), определенная там же, где определе- определена кинетическая энергия и обобщенные силы, и постоянная вдоль любых траекторий системы. Механическая система называется интегрируемой, если она имеет глобальный первый интеграл. Пример. Система i + i + i = 0 неинтегрируема, поскольку глобального первого интеграла у нее не существует. Заметим, что решение ее тем не менее выписывается без труда. § 27. Первые интегралы лагранжевых систем Рассмотрим уравнения Лагранжа с потенциальными силами. Умножая их на сц и суммируя по г, получаем следующее скалярное соотношение: . ddC . дС\ dt dqi dqi) которое можно переписать в форме дс\ ..дс . ее ) Поскольку то последнее соотношение переписывается в виде I Зак 233 дс\ dC дС п
122 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ Если функция Лагранжа от времени не зависит , т.е. dC/dt = О, то из записанного равенства следует первый интеграл Этот интеграл носит название обобщенного интеграла энергии, или интеграла Пенлеве-Якоби. Выясним структуру этого интеграла, учитывая, что _ 1 2 f Подставляя это выражение в полученное выражение для интеграла Пенлеве-Якоби, находим: — N ciijqiqj — То — U — Т2 — То — U ~ const. Или, используя обозначения для потенциальной энергии П = —U: Т2 -То + П = const. Заметим, что полная энергия Е = Т2 -f Ti + То + П в общем случае не сохраняется. Механическая система называется консервативной, если выпол- выполнены следующие условия: 1) параметризация стационарна, т.е. dK/dt = 0; 2) силы потенциальны: Q, — dU/dq%\ 3) потенциал U от времени явно не зависит: dU/dt = 0. Если система консервативна, то Т\ = То = 0 и обобщенный интеграл энергии совпадает с полной энергией Т2 + П = const и выражает тем самым закон сохранения полной энергии в консер- консервативных механических системах. Еще один распространенный в механике тип первых интегралов составляют так называемые циклические интегралы. Они имеют место тогда, когда функция Лагранжа C(t, q\, ..., qni j\, ..., qn) не зависит от некоторых координат: qi+i, . .., qn- В этом случае уравнения Лагранжа приобретают вид at Oqi oqi d дС n . , ,
§ 27. ПЕРВЫЕ ИНТЕГРАЛЫ ЛАГРАНЖЕВЫХ СИСТЕМ 123 Из последних п — I уравнений следует п — I первых интегралов дС/dqi = const (г = I + 1, ..., п). Сами переменные, которые не входят явно в функцию Лагранжа, называются циклическими. Знание первых интегралов позволяет понизить порядок системы, т.е. продвинуться в деле нахождения решения системы в явном виде. Пример. Эллиптический маятник (рис. 46). Лагранжиан этой системы имеет вид С — -г-[(х + 1ф cos <рJ + 12ф2 sin2 ф\ + тпд1 cos (р. Система консервативна, поэтому имеет интеграл энергии Е = тг{х2 + 2/xy?cos (p + 12ф2) — тпд1 cos (p =¦ const. Кроме того, координата х является циклической, поскольку яв- явно в выражение для С не входит. Поэтому в системе есть еще и циклический интеграл ( дС ,. . . ч | х j —- = mix + l(p cos (p) = const. ' \ ox I Рассматривая два последних соотноше- i— ния в качестве уравнений для нахождения L_ хB) и <p(t), можно исключить из них х и V///////////}/hfr}///////A свести задачу к одному уравнению относи- относительно <р} из которого <p(t) находится по- посредством вычисления интеграла, т.е., как принято говорить, задача сводится к ква- квадратуре. Следует иметь ввиду, что уменьшение порядка при помощи первых интегралов приводит, как правило, к системе уравне- р .g ний, неэквивалентной исходной. Например, задачу о прямолинейном падении материальной точки в однородном поле тяжести можно решать, исходя из уравнения Ньютона у =. —д при начальных условиях у@) = Л, у@) = О, что приводит к единственному решению: у = h — gt2/2. Если же воспользоваться в этой задаче интегралом энергии у2/2-{-ду = const и рассматривать его как дифференциальное уравнение, из которого можно найти y(t) при тех же начальных условиях, то решений получается бесконечно много: О < t <tOi - to) . t > in.
124 ГЛ.6. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ ГОЛОНОМНЫХ СИСТЕМ где t0 — произвольно. При <0 = 0 получается правильное решение. Построение точного решения, или понижение порядка систе- системы — не единственная цель поиска первого интеграла. Гло- Глобальные первые интегралы выражают обычно некоторые законы сохранения, представляющие самостоятельный интерес, как содер- содержательный физический факт. Установление таких законов бывает интересным даже тогда, когда общее решение задачи известно. В этой ситуации представляет интерес следующий прием. Пусть ii = /i(*i, • • •, *n), i = 1, . .., п, — изучаемая система. Пусть общее решение ее есть <Pi(t} xi, ..., xn), где xi, ..., xn — начальные условия, т.е. — = fi[<pi{tt ХЬ ..., Xn)t...t<pn{tt XU ..., Хп)]. Тогда, если существует и не сводится к константе выражение 1 Г F(xu .... хп) = Jim - / G[<Pi{t, хь ..., хп), ..., T-+OQ1 Jo ... (рп(т} хь ..., xn)]dr} то оно является первым интегралом исходной системы. При этом G(y?i, •-., <Рп) — произвольная функция. Пример. У системы х = у, у = —х имеется общее решение (pi = х cost + у sin/, <р2 — —xsin t + у cost (x и у в нем — начальные условия). Выбор функции G(<^i,<^2) Для вычисления первого интеграла не ограничивается ничем, кроме возможности вычисления соответ- соответствующего предела. Возьмем, к примеру, G(y?i, <?>г) = |^i|, тогда I Гт 2 F(x)y)= lim — / |xcosr + у sin r\dr = — y/x2 + у2, T-fc» T Jo Я" т.е. получен интеграл энергии. Доказательство сформулированного общего приема вычисления первого интеграла осуществляется прямой подстановкой решения Х{ = (pi(t} С\, . .., Сп) в функцию F(x). При этом приходится рассма- рассматривать выражения (рк[т} tpi(tt Си .... Сп), ••-, ^n(<, C\t . .., Сп)], которые, в силу группового свойства решений автономной системы
§ 28. ПРЕОБРАЗОВАНИЯ ЛЕЖАНДРА 125 дифференциальных уравнений (см. §46), сводятся к выражениям ( + t.Ci, .... Сп). Поэтому Ы) ( )] = lim i / G[<pi{t + rt Си ...,Cn), ....^n^ + r.Ci, .... Cn)]dr = T-fOO T JQ = F(Cu...tCn)t поскольку вычисление предела при Т —> оо не зависит от начальной точки интегрирования. Глава 7. Уравнения Рауса § 28. Преобразования Лежандра Переход от уравнений Лагранжа d(dT/dq)/dt - дТ/dq = Q к уравнениям Рауса осуществляется при помощи специальной заме- замены фазовых переменных, для введения которой рассмотрим неко- некоторый особый класс преобразований, называемых преобразованиями Лежандра, или потенциальными преобразованиями. Пусть от некоторых переменных xi, ..., хп осуществляется пе- переход к другим переменным у\, ..., уп по формулам Уп = /п(хь ..., хп). Это преобразование переменных называется преобразованием Ле- Лежандра, если его правая часть имеет потенциал, т.е. если найдется такая скалярная функция V(x\} ..., хп), что fk = «—, к = 1, .... п. С7х Потенциал V называется невырожденным, если Этот потенциал называется сильно невырожденным, если уравнения ук = Д(х1, ..., хп) можно гладко и взаимно однозначно разрешить относительно переменных х^: хк =<Рк[Уи -чУп), к = 1, ..., п.
126 ГЛ.7. УРАВНЕНИЯ РАУСА Теорема. Если преобразование ук = /к{х\, • • •, хп) потенциально, а потенциал V(xi,...,xn) сильно невырожден, то обратное пре- преобразование Xk = <fk{y\) - - -) Уп) {к = 1, ..., п) также потенциально и его потенциал W(yi, ..., уп) также сильно невырожден и связан с потенциалом V формулой Доказательство. Продифференцируем написанную формулу по Поскольку dV/dxi = у,, то из этого следует dW т.е. преобразование Хк = ^fc(yi. • • •. Уп) — потенциально. Потенциалы К и W называются сопряженными. § 29. Уравнения Рауса Воспользуемся преобразованием Лежандра для построения урав- уравнений Рауса. Преобразованию подвергаются фазовые переменные т.е. на самом деле преобразовываются не все фазовые переменные, а лишь s = п-1 обобщенных скоростей. В качестве потенциальной функции для соответствующего преобразования возьмем выражение для кинетической энергии: Рк = «г-, * = /+ 1, .... П. Все остальные переменные остаются параметрами. Потенциал обратного преобразования называется функцией Ра- Рауса и, в соответствии с теоремой предыдущего параграфа, он имеет вид , .... Рп) = Y
§ 29. УРАВНЕНИЯ РАУСА. 127 В правой части этого выражения всюду вместо сц надо подставить их выражения через р,, получаемые после обращения преобразований Рк = дТ/ддк. Уравнения в новых переменных вместо исходных уравнений Лагранжа получаются с использованием функции Рауса. Действи- Действительно, для i = l,...,/ имеем дП ^dqk дП Поэтому для первых / уравнений получаем ddn дп Q < 1 т.е. они сохранили форму уравнений Лагранжа с заменой знака перед обобщенными силами. Для оставшихся переменных i = = 1+1, ..., п: дП d4i an дТ _ ^ dqk_ дТ dqk _ . Подстановка этих соотношений в уравнения Лагранжа дает В итоге полная система уравнений Рауса получается в виде : — —Qi i=l,...,/, dt dqi dqi dt dpi ' dt dqi Уравнения Рауса оказываются удобными при исследовании си- систем с циклическими координатами. Уточним здесь введенное в
128 ГЛ.7. УРАВНЕНИЯ РАУСА §27 понятие циклической координаты. Координата qi называется циклической, если 1) от нее не зависит функция Рауса: dTZ/dqi = 0; 2) от нее не зависят обобщенные силы: dQ/dqi = 0; 3) обобщенная сила, соответствующая этой координате, равна нулю: Qi - 0. Пусть в системе последние п — / координат циклические, тогда в уравнениях Рауса dpi/dt = 0 (i = / + 1, .. ., п) и лагранжева часть уравнений полностью отделяется, поскольку в функции Рауса и в обобщенных силах переменные р, оказываются постоянными, а от циклических переменных, по определению, зависимости нет. Сами циклические переменные qi находятся после того, как проинтегри- проинтегрирована система dd1l дП Jt-dq-i~Wr-Q* <l = 1"-/> простой квадратурой Таким образом, для систем с циклическими координатами ука- указанное преобразование Лежандра позволяет понизить порядок си- системы на 2(п — /) единиц. Координаты называются псевдоциклическими, если из трех усло- условий циклических координат не выполнено второе, т.е. силы могут зависеть от этих координат. Свойство dpi/dt = 0 (г = / + 1, . .., п) выполнено и в этом случае, однако, отделившейся оказывается следующая система: ddii дп diwrwr-®" {г=1 Oi В случае псевдоциклических координат использование преобра- преобразования Лежандра с соответствующим числом / приводит к пони- понижению порядка системы на п - I единиц. Процедура исключения циклических координат посредством перехода к уравнениям Рауса носит название процедуры игнорирования циклических координат по Раусу. Уравнения Рауса используются также для систем с неудерживающими связями (§33).
§ 30. КЛАССИФИКАЦИЯ СВЯЗЕЙ 129 Преобразование Лежандра, осуществленное над всеми обобщен- обобщенными скоростями qi, приводит к частному случаю уравнений Рауса, называемому уравнениями Гамильтона (§66). Глава 8, Уравнения систем с дополнительными связями § 30. Классификация связей Помимо тех связей, которое определили конфигурационное мно- многообразие голономной механической системы (§23), на систему могут быть наложены дополнительные связи, которые можно ана- аналитически задавать соотношениями на обобщенные координаты и обобщенные скорости. В зависимости от вида этих соотношений различают следующие типы связей. 1. Голономные связи. Они выражаются уравнениями, в которые скорости не входят: Эти связи изменяют конфигурационное многообразие системы и при введении независимых обобщенных координат они могли быть учтены с самого начала. Число степеней свободы при этом равно п-т. Однако есть возможность учесть эти дополнительные связи и после того, как параметризация системы была выполнена без их учета, посредством введения дополнительных членов в уравнения Лагранжа. Об этом речь идет в следующем параграфе. 2. Кинематические связи. Эти связи выражаются уравнениями вида п $3Я) = О (*= 1, .... т). Напрашивается более общий вид этих связей, в котором зави- зависимость от скоростей является нелинейной: /*(*i Яи • • -I 0п, Яи • • •, Яп) = 0 (к = 1, . . ., т). Однако рассмотрение подобных связей не имеет большого смы- смысла. Все известные конкретные примеры кинематических связей выражаются именно линейными по скоростям соотношениями. По- Попытки построить искусственно примеры нелинейных кинематических связей успеха не имели. В 1915 году французский механик Делас- сю изучал вопросы принципиальной реализуемости таких связей и пришел к отрицательным результатам.
130 ГЛ.8. УРАВНЕНИЯ СИСТЕМ С ДОПОЛНИТЕЛЬНЫМИ СВЯЗЯМИ Линейные кинематические связи можно записать в следующей эквивалентной форме: ki{t, q)dqi + lk{t, q)dt = 0 (* = 1, . . ., m). Введем следующие обозначения для стоящих слева дифференци- дифференциальных форм: t, q)dt. Если существует матрица s x m (s < m) с зависящими от t и q элементами, такая, что s соотношений представляет собой s полных дифференциалов то исходные т кинематических связей можно свести к т — s кинематическим связям и s голономным связям: fi(tt q) = const (i = 1, ..., s). Кинематические связи при этом называются интегрируемыми. Если s = m и матрица Я невырождена, то эти связи называются вполне интегрируемыми. В последнем случае кинематические связи могут быть целиком заменены конечными связями. Если кинематическими связи не являются вполне интегрируемыми, то они называются неголоном- ными. Условия, позволяющие установить полную интегрируемость уравнений кинематических связей, составляют содержание теоремы Фробениуса, которую можно найти в теории систем дифференци- дифференциальных уравнений Пфаффа. При составлении уравнений движения механических систем с кинематическими связями вопрос об инте- интегрируемости этих связей никакого значения не имеет, поэтому мы на этой теореме останавливаться не будем.
§ 30. КЛАССИФИКАЦИЯ СВЯЗЕЙ 131 Отметим только качественные отличия в движении систем с интегрируемыми и с неинтегрируемыми (неголономными) связями. Кинематические связи в обоих случаях не изменяют конфигураци- конфигурационного многообразия системы, и система может находиться в любой точке многообразия. Однако если в случае неголономных связей систему можно из любой точки многообразия перевести подходящи- подходящими силами в любую другую, то для случая вполне интегрируемых связей система из точки qa может быть переведена в точку q@ только, если /*(*, 9°) = /*(*.«')• Последним соображением можно пользоваться для проверки неинтегрируемости кинетических связей, не прибегая к теореме Фробениуса. Пример. Рассмотрим движение конька по льду. Будем себе представлять конек тонким стержнем, одна из точек которого, на- например центр масс, может иметь скорость, направленную только вдоль конька. Положение конька можно описать тремя коорди- координатами: х и у — координаты центра масс на плоскости и р — угол наклона конька к оси х. В процессе движения введенные переменные подчинены условию xsin^> — ycos^> = 0. Эта кинема- кинематическая связь неинтегрируема, в чем легко убедиться, заметив, что из любой точки {zi,yi,<pi} конфигурационного многообразия конек может быть переведен в любую другую {хг, уг> ^2}, напри- например, таким способом. Не меняя вначале xi и у\) изменяем угол ц> так, чтобы конек был направлен в точку Х2, У2- После этого, не меняя <р, по прямой перемещаем конек в точку х2, уг- Наконец, в этой точке поворачиваем конек на нужный угол. Следовательно, из условия xsin (р — ycos<p = О не может вытекать никакого соот- соотношения /(х, у, (р) — const. Конек с указанной связью является неголономной системой. 3. Неудерживаюшие (односторонние) связи. Эти связи аналити- аналитически выражаются ограничениями на обобщенные координаты вида неравенств. fk{t,q) > 0 (* = 1,...,т). Иногда неголономные связи определяются как связи, не явля- являющиеся голономными. Если стоять на этой позиции, то неудержи- вающие связи следует отнести к неголономным. Мы будем придерживаться более узкого понимания неголоном- неголономных связей, данного выше. 4. Стационарные связи. Если все перечисленные выше связи не зависят от времени: fk(q) = О — в случае голономных связей, Y2cij{Q)Qj = 0 — в случае кинематических связей, fk{q) > 0 — в случае неудерживающих связей, то такие связи называются стационарными.
132 ГЛ.8. УРАВНЕНИЯ СИСТЕМ С ДОПОЛНИТЕЛЬНЫМИ СВЯЗЯМИ В случае кинематических связей условие стационарности вклю- включает в себя кроме того требование отсутствия неоднородного члена: ьк = о. 5. Виртуальные перемещения в случае дополнительных связей. Ограничения на координаты и скорости приводят, очевидно, и к ограничениям на виртуальные перемещения, определенные в §23. Если связи голономные: fk{q) = 0, то виртуальные перемещения стеснены условием Если связи кинематические: ]C?=i с*,-(*, q)dqi -f h dt = 0, то виртуальные перемещения ограничены так: (в соответствии с определением виртуальных перемещений dt — 0). Если связи неудерживающие: /к(я) > 0> то 6. Гипотеза идеальности связей. В случае голономных и кине- кинематических связей введенная (см. §24) гипотеза идеальности связей сохраняет свою форму: работа реакций связей на любых виртуаль- виртуальных перемещениях должна быть равна нулю. При этом реакциями связей мы будем называть те дополни- дополнительные обобщенные силы Mi в уравнениях Лагранжа которые нужно приложить к системе, чтобы движение ее удо- удовлетворяло дополнительным связям. Тогда условие идеальности голономных и кинематических связей можно записать так: При неудерживающих связях ДB, q) > 0 — случай движения по связи, т.е. когда выполняется строгое равенство, и случай, когда возникает переход от неравенства к равенству и обратно, должны
§ 31. УРАВНЕНИЯ ЛАГРАНЖА С МНОЖИТЕЛЯМИ 133 рассматриваться отдельно. Реакция связи, возникающая в первом случае на всех виртуальных перемещениях, удовлетворяющих усло- условию Yl(dfk/dqi)8qi = О, не должна совершать работы. Во втором случае движение сопровождается ударом, и связь будет считаться идеальной, если в момент удара кинетическая энергия системы не претерпевает разрыва: где Т_ — значение энергии непосредственно перед выходом на связь, Т+ — после. § 31. Уравнения Лагранжа с множителями Выведем уравнения, содержащие дополнительные голономные или кинематические связи. Как уже было сказано, введя понятие дополнительных реакций связей Л/;, уравнения можно записать в виде ddT д_Т__ at oqi oqi Однако пользы от этих уравнений нет, поскольку в них возникли дополнительные п неизвестных функций времени Л/i, а уравнений связей у нас m < п. В системе 2п неизвестных ип + m уравнений, из которых найти эти неизвестные нельзя. Для исключения лишних переменных умножим эти уравнения скалярно на виртуальные перемещения: Реакции связей здесь исчезли, поскольку мы предполагаем их иде- идеальными. В этом соотношении виртуальные перемещения стеснены условиями ?^?. = 0 (i=l m) — в случае голономных связей, или кг&Ж = 0 (* = 1, ..., т) — в случае кинематических. Введем m новых неизвестных функций времени 1Лк (*=!,..., т).
134 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Очевидно, имеют место равенства fc——Sqi = О или к \ ^ к i Вычитая их из полученного выше скалярного соотношения, находим: EU 01 01 \~* _ _ Qt _ \ к ИЛИ а/Л п Выберем неизвестные функции /i^ так, чтобы первые слагаемые в этих суммах были тождественно равны нулю: d дТ дТ „ или I пт В оставшихся суммах присутствует только п - m компонент виртуальных перемещений Sq{. Но их уже можно считать не- независимыми и произвольными, а это влечет за собой равенство нулю оставшихся множителей при Sqi, и полученные только что уравнения справедливы при любых г. Итак, уравнения Лагранжа с множителями в случае дополни- дополнительных голономных связей имеют вид i= 1, .... n), Для кинематических связей: ( d_dT__ ^_0. dt д6{ до; = 0
§ 32. УРАВНЕНИЯ АППЕЛЯ 135 Эти уравнения в количестве п + т позволяют найти такое же количество неизвестных функций д,- и /i^. § 32. Уравнения Аппеля В полученных в предыдущем параграфе уравнениях Лагранжа с дополнительными кинематическими связями множители /х мо- могут быть исключены. Покажем это, переписав эти уравнения в матричной форме: Здесь буквой G обозначены все те члены в уравнении Лагранжа, которые не зависят от ускорений. Выразим из уравнений движения ускорения: Продифференцируем уравнения связей по времени: Cq + Cq + l = 0. Подставим сюда найденные выше ускорения: CA~lG + СА~1СТ11 + Cq + / = 0. Если кинематические связи независимы, то матрица СА~1СТ невырождена и последнее соотношение может быть разрешено от- относительно множителей /х: /1 = (CA-1CT)-l{-CA-lG -Cq- /). Подставляя это выражение в уравнения движения, окончательно получим: Aq = G- CT(CA~lCT)-l{CA-lG + Cq + /) Множители Лагранжа исключены, написанные уравнения имеют тот же порядок, что и исходные уравнения без дополнительных свя- связей, сами связи оказываются первыми интегралами этих уравнений. Начальные условия следует подчинить исходным связям. Между тем наложение связей приводит к понижению числа степеней свободы и было бы интересно построить такие уравнения, в которых это обстоятельство находило бы отражение. Определенным
136 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ преимуществом в этом плане обладают выводимые ниже уравнения Аппеля. Для составления уравнений Аппеля вернемся к уравнению ба- баланса виртуальных работ, полученному в § 24 в виде [ J -j- • Rdm = Sq{ [ — • Fd dm = Для сокращения записей здесь опущен знак суммы по повторяю- повторяющимся индексам суммирование подразумевается. На этот раз коэффициенты виртуальной работы инерционных сил, т.е. выражения 5R « —-•Rdm, 1 преобразуем иначе. гт • dR. dR Продифференцируем выражение для скорости R, = ——q{ -f -77-• uqi ot Получим: где через V обозначены все члены, не зависящие от обобщенных ускорений q. Тогда 9R 9R что позволяет вычислить f dR - J г <9R » , l г <9R2 , as / —- Rdm= / —- Rdm= - / —— dm = —- J dqi J dqi 2 J dqi dqi где функция 5 = г / R2 dm называется функцией Аппеля (иногда "энергией" ускорений). Если все 8qx независимы, то из баланса виртуальных работ следуют уравнения, эквивалентные уравнениям Лагранжа = l п. Пусть теперь на рассматриваемую систему наложены тп кине- кинематических связей. С3гСЦ + 13 = 0, 5 = 1, .. ., ГП.
§ 32. УРАВНЕНИЯ АППЕЛЯ 137 В этом случае в уравнении виртуальных работ вариации Sqi больше не являются независимыми, кроме того, обобщенные силы должны вычисляться с учетом появившихся новых реакций связей N: Из уравнений связей можно выразить последние т обобщенных скоростей через первые п — т: qi = оцкЯк + /?/. Условимся в дальнейшем обзначать индексом к, меняющимся от 1 до п - т, оставшиеся независимыми скорости, а индексом /, меняющимся от п — т +1 до п, обобщенные скорости, выражаемые через независимые обобщенные скорости по написанной формуле. Разобьем уравнение виртуальных работ на две части: f f^ • {Fd + N) dm + Sqt ff J 0qk J Oqi В первой части суммируются члены с независимыми вариациями Sqk) во второй части — с зависимыми вариациями Sqi. Зависимые и независимые вариации, очевидно, связаны так: Sqi = aikSqk) что позволяет уравнение работ записать в виде dS dS\ f ffdR dR\ dqk dqij J \dqk dqi J В функции Аппеля можно исключить зависимые ускорения <jit если продифференцировать связь между скоростями: qi = ам^+ц, где л обозначает члены, не зависящие от ускорений. Обозначим через S* функцию Аппеля, появившуюся после та- такого исключения: S*(qk) = S[qk) qi{<jk)]. Тогда dS* dS dS -дтг- = ^тг- Ч- Оцк — Oqk Oqk Oqi Назовем реакции кинематических связей идеальными, если J \dqk dqij Тогда в силу независимости Sqk из уравнения виртуальных работ получим —- = Qk) t=l n-m, oqk
138 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ где Qi = [(— J \дЯк —- dqi cFddm. Добавляя к найденным уравнениям уравнения связей, получаем систему п уравнений относительно п обобщенных координат. Поскольку в этой системе п — т уравнений второго порядка и т уравнений первого, то порядок полученной системы равен 2(п — т) + гп — 2п — т. Пример. Материальная точка массы т, радиус-вектор кото- которой R = {х, у, z} с действующей на нее силой F = {FX) Fy) Fz}, подчинены идеальной кинематической связи х -\- yz = 0. Требуется составить уравнения Аппеля. Выразим зависимые переменные через независимые: r Sx .. х -f yz 6z = , z = . У У Подсчитаем обобщенные силы из условия QJx + Qy6y = Fx6x + Fy6y + F28z = (fx - —J 5x + Fy5y} откуда = Fx-^, Qy = Fy. Подсчитаем энергию ускорений m : m ~2 x + yz Уравнения Аппеля позволяют найти: У2 ту = Fy i + yz = 0.
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 139 § 33. Уравнения Лагранжа для систем с неудерживающими связями 1. Удар в механических системах. Рассмотрим произвольную механическую систему и запишем ее уравнения движения в форме, указанной в п. 4 § 25: Aq + F{ttqt q) = О, где А — матрица квадратичной формы кинетической энергии. Пусть на систему наложена идеальная односторонняя связь /(*, Я) > 0. • Пока система находится вне связи, так что выполняется строгое неравенство /(/, q) > 0, ее движение описывается приведенными уравнениями. В те моменты времени, когда /(*, q) = 0, система подвержена действию дополнительных мгновенных сил N', пред- представляющих собой реакции связей. В эти моменты уравнения движения могут быть записаны в виде Запись такого вида содержит условность, связанную с понятием "мгновенная сила", что было предметом обсуждения в §21. Виртуальные перемещения вдоль связи обязаны удовлетворять условию dq (мы используем матричную форму записи условия, приведенного в п. 5 §30). Матрица-строка df/dq - (df/dqi, .... df/dqn) определяет нор- нормаль к поверхности /B, q) = 0, компоненты единичного вектора нормали е имеют вид df е» = и условие на виртуальные перемещения может быть переписано так: e'Sq = 0. Для удобства дальнейших выкладок мы применяем матричные обозначения, в которых все векторы понимаются как матрицы- столбцы, а штрихи обозначают их транспонирование.
140 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Из условия идеальности рассматриваемой связи, т. е. из M'Sq = О, следует М=\М\е, т.е. реакция связи направлена по нормали к связи. Подставляя это выражение для реакции в уравнения движения и интегрируя уравнение за время удара At, получим F(ttqt q)dt = e f \M\dt. Обозначая ударный импульс / = J^t \J\f\dt и полагая At малым, так что в написанном уравнении можно пренебречь интегралом /д, F{*> 9> Я)М, находим AAq = /e. Отсюда для приращения обобщенных скоростей в момент удара выводим: Aq = IA~le. Для определения величины ударного импульса воспользуемся условием непрерывности кинетической энергии (Т_ = Т+). Если кинетическую энергию до удара записать в форме то после удара она приобретает вид \ ?)'Л(? + Д?) + b'(q + Aq) + То. Приравнивая эти выражения друг другу и сокращая одинаковые члены, получим Aq'Aq + -Aq'Aq -f 6'A^ = 0. Подставляя в это равенство полученное выше выражение для прира- приращения скоростей Ад, получаем уравнение для нахождения величины ударного импульса /:
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 141 Исключая нулевое решение, находим e'A~le ' что позволяет получить окончательную формулу для приращения обобщенных скоростей в момент удара: Эта формула и представляет собой общее решение задачи определе- определения послеударного состояния произвольной механической системы по известному доударному в случае идеального удара (идеальных связей). Здесь q — доударные скорости, q + Aq — послеударные, е — единичный вектор нормали к связи в точке удара, А — матрица квадратичной формы кинетической энергии, b — коэф- коэффициенты линейной формы кинетической энергии, возникающие в случае нестационарной параметризации. Если параметризация стационарная, то 6 = 0 и формула для приращения скоростей принимает более простой вид: Остановимся на некоторых свойствах идеального удара в ла- гранжевых механических системах, вытекающих из полученных формул. Свойство 1. Для того чтобы падающая скорость q и отраженная скорость q -f Aq и вектор нормали е в точке удара лежали в одном линейном многообразии размерности два при любых qy необходимо и достаточно, чтобы вектор нормали был собственным вектором матрицы кинетической энергии в этой точке. Доказательство. Двумерное многообразие, натянутое на векто- векторы q и q + Д<7, имеет вид Л= Xq + pA~let где Л и /i — произвольные числовые коэффициенты. Если вектор нормали е принадлежит этому многообразию, то найдутся такие Ло и /io, что ЦоА~1е = е. При произвольном q отсюда следует, что Ло = 0 и ц0А~1е = е, т.е. /i0 — собственное число матрицы Л, соответствующее собственному вектору е.
142 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Таким образом, эффект стесненного идеального удара, проявля- проявляющийся в нарушении закона "угол падения равен углу отражения", определяется структурой матрицы квадратичной формы кинетиче- кинетической энергии в точке удара. Свойство 2. Для стационарных систем F = 0) проекция на нормаль в точке удара е падающей скорости q равна прекции на эту нормаль отраженной скорости q + Aq по модулю и противополжна по знаку: e'q= -e'{q + Aq). Доказательство получается прямой подстановкой в это равен- равенство формулы для приращений скоростей Aq при 6 = 0. Свойство 3 (Теорема Аппеля). Обобщенные импульсы, соот- соответствующие обобщенным координатам, на которые не наложена неудерживающая связь, в момент выхода системы на связь, непре- непрерывны. Доказательство. Обобщенные импульсы имеют вид дТ А. L p=_ = Aq+b. Поскольку в момент удара координаты непрерывны, то Ар = AAq = /e. Пусть связь наложена на координату ^i, т.е. Ч\ > 0, тогда единичный вектор нормали е имеет следующие компоненты: Следовательно, и В заключение этого пункта приведем решение задачи о стеснен- стесненном ударе, сформулированной в §21 для системы, изображенной на рис. 33. Кинетическая энергия изображенной на рисунке системы может быть записана следующим образом: [I2 1 х2 4- у2 4- 1{у cosp-x sin (р)ф + —ф2 ,
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 143 так, что матрица кинетической энергии получается такой: 2т 0 -m/sin<,p А — О 2т ml cos tp — ml sin <p ml cos (p ml2 Вычисление обратной матрицы дает 1 2m/2 I2B-cos2 (p) -I2 simp cos <p 2/sin у? —I2 sin ip cos (p I2 B —sin2 (p) — 21 cos (p 21 simp -21 cos <p 4 Поскольку уравнение связи имеет вид у > О, то вектор нормали получается таким: е = 0 1 0 / V X У z вектор обобщенных координат I . Поскольку система стационарная, то 6 = 0 и вычисление приращения скоростей производится по формуле Ах Ау = -2 е'Ае В этой формуле e'q =@,1,0) = у, & 1 ~2m" cos <p ml Отсюда следует: 2 — sin 7—2— sin <p cos ip, 2 - sin2 (i Ay cos ip /B-sin2( -B - sin2 ip) - -2y,
144 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Приращение горизонтальной составляющей скорости равно нулю для горизонтального и вертикального положений стержня в момент удара. Если / —> оо, то стержень движется поступательно (Аф = 0), однако имеется разрыв как вертикальной составляющей скорости, так и горизонтальной. 2. Негладкая регуляризация. Как следует из изложенного выше, в момент выхода системы на идеальную неудерживающую связь обобщенные скорости в общем случае терпят разрыв первого рода как функции времени. В системе возникает удар, движение ее может быть описано дифференциальными уравнениями только в промежутке между двумя ударами. В моменты ударов требуется пересчет начальных условий. Между тем существует возможность посредством подходящей замены обобщенных координат исключить удары в системе, после чего дифференциальные уравнения движения оказываются пригод- пригодными на бесконечном интервале времени. Такая замена переменных называется регуляризацией исходной системы. Аналитический смысл излагаемой регуляризации заключается в том, что негладким преобразованием обобщенных координат мы можем в системе с неудерживающи- ми связями эти связи исключить. Рассмотрим идею такой замены вначале на простом примере. Пусть изучается плоское движение мате- материальной точки под действием сил произвольной природы (рис. 47). Обозначим декартовы координаты плоскости как <7ь <72. а силы, зависящие от времени, координат и скоростей материальной точки, Qi, Qi> Пусть точке запрещено пребывание в левой полуплоскости, ось координат q\ — 0 представляет собой идеально отражающую стенку. Формализация описания рассматриваемой механической си- системы в терминах теоретической механики исчерпывается заданием выражения для кинетической энергии, обобщенных сил и уравнения связи: 1) кинетическая энергия Т = rn{q\ + <7i)/2; 2) обобщенные силы <3i(*, <7> <j)> <22(<> <7> я)\ 3) идеальная неудерживающая связь <7i > 0. Выполним негладкую замену переменных [я\) Я2) —> (я. у): Я\ = \х\> Я2 = У- В силу этой замены скорости преобразуются следующим образом: qi = xsignx, Я2 = У Рис. 47
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 145 (способ доопределения производной от модуля в нуле большого значения в дальнейшем не имеет). Кинетическая энергия в новых переменных приобретает вид Т = (х2 -f У2)/2, она оказалась инвариантной по отношению к выполненной замене переменных. Подсчитаем обобщенные силы, которые будем обозначать X и У. В соответствии с определением обобщенных сил (§ 24) имеем у dqin jdq2n v dqin idq2n откуда X = QlSignxt Y = Q2. Осталось выяснить, как преобразуется выражение неудержи- вающей связи. Поскольку q\ = \х\ > 0 выполняется при любых х G (—оо,оо), то на новые переменные никаких ограничений не наложено. Связь исключена. Имеем систему, для которой спра- справедливы уравнения Лагранжа ±?_? х ±^E__LY dt дх дх ~ ' dt ду ду ~ ' Подставляя сюда найденные выражения для кинетической энергии и обобщенных сил, получим mx = Qi(t} |x|, у, xsignz, y)signx, ту = Q2{t) |x|, у, zsignx, у). Полученные уравнения описывают движение материальной точ- точки на бесконечном интервале времени, включая любые фазы дви- движения. После того как решение этой системы х(*), y(t) найдено, подстановкой его в выполненную ранее замену находим решение в исходных переменных qi(t) = |z(*)l) <7г@ — 2/@- Пример. Пусть движение пружинного маятника ограничено так, что его перемещение из положения равновесия возможно только в положительном направлении (рис. 48). Допустим также, что при выходе на ограничитель возникающий удар является идеаль- идеально упругим. Тогда уравнения движения такого маятника можно записать в следующей форме: 9 + 9 = 0, q > 0, 9+ = -9-. 9 = 0. 11 Зак 233
146 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Эти уравнения состоят из двух существенно отличающихся частей. Первая часть представляет собой дифференциальное уравнение, справедливое лишь тогда, когда движение удовлетво- удовлетворяет строгому неравенству. Вторая часть, заменяю- щая дифференциальное уравнение в моменты, когда неравенство превращается в равенство, связывает значения скорости в моменты времени, непосред- непосредственно предшествующие удару, со скоростями сразу после удара. Рис. 48 Такая форма уравнений движения предопреде- предопределяет и способ их решения, состоящий в отыскании кусков траекторий между ударами с последующим их сшиванием в моменты удара. Между тем при помощи указанной выше негладкой замены пере- переменных можно получить дифференциальные уравнения движения, справедливые в любой момент времени и не дополненные никакими условиями на скорости. В рассматриваемом примере исходное описание системы таково: кинетическая энергия T=q2/2, обобщенная сила Q = —q) неудерживающая связь q > 0. Производим замену переменной: q —> х\ q = |x|. Кинетическая энергия инвариантна к этой замене: Т = х2/2. Обобщенная сила X пересчитывается в новую обобщенную силу так: X = Qsignx = —gsignx = —|r| sign x = —x. В этом примере и выражение для обобщенной силы оказалось инвариантным к выполненной замене. Исходная неудерживающая связь ни к каким ограничениям на новую переменную не приводит. Уравнение движения в переменной х имеет вид х + х = 0. Его общее решение, справедливое на бесконечном интервале време- времени, таково: х = С\ cost -f C2S111*. Подстановка этого решения в выполненную замену дает общее решение исходной задачи: q — \С\ cos* -f C2sin*|.
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 147 3. Система с канонической формой кинетической энергии. Рас- Рассмотрим механическую систему с неудерживающими связями общего вида. Кинетическая энергия, обобщенные силы и неудерживающая связь заданы функциями T = T(t)q)q)) Q = Q(ttqtq)t /(*, q) > 0. В механических системах с удерживающими связями большое значение имеет число наложенных связей, прямо связанное с чи- числом степеней свободы. В системах с неудерживающими связями дело обстоит по-другому. На рис. 49 изображен случай двух неудер- живающих связей f\(t} q) > 0 и /2(<, q) > 0 Понятно, что случай сводится к одной связи, имеющей угловые точки при пересечении поверхностей, определяемых каждой связью в отдельности. Таким образом, связь /(*, q) без ограничения общности может считаться скалярной, а различ- J ные предположения о гладкости могут лг делаться в зависимости от потребностей конкретных задач. лУ Если функция /(*, q) — гладкая, то / существует гладкая замена переменных q -* г, такая, что неравенство, выража- выражающее связь, может быть приведено к ви- виду г\ > 0. Иными словами, функцию, ^кс* 4^ выражающую неудерживащую связь, можно выбрать в качестве новой обобщенной координаты. Выбор других новых обобщенных координат ограничен только требованием невырожденности осуществляемой замены переменных. Можно считать, что исходная система уже имеет такой вид, т.е. /(*, q) = q\ > 0. Для удобства в дальнейшем введем для компоненты q\ специальное обозначение q\ = 5. Введем также обозначение для оставшихся компонент (^2. •••. Яп)' = У- (Штрих, как и ранее, обозначает транспонирование, все векторы изображются как матрицы-столбцы.) С учетом этих обозначений рассматриваемая система приобре- приобретает вид T{t, s, у, s, у), S(t, s, у, s, у), Y{t, s, у, s, у), s > 0, где 5 и У — обобщенные силы, соответствующие координатам s и у. Кинетическая энергия, как это следует из §25, в общем случае имеет вид Т = Тч -f T\ -f То. Однако члены, получающиеся в уравне- уравнении Лагранжа от дифференцирования T\(tt q} q) и ТоB, q), можно присоединить к обобщенным силам 5, У. Поэтому в дальнейшем под кинетической энергией будем понимать только ее квадратичную часть: 11*
148 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ Здесь А = A(t) 5, у) — матрица квадратичной формы кинетической энергии. Матрицу А представим разбитой на блоки следующим образом: А- = аП) h в-1 V = {al3,...,ain), B-l={aij} {i,j = 2,...,n) Имея ввиду эти обозначения, перепишем выражение для кинетиче- кинетической энергии: T=^{as2+ 2sh'y + y'B~ly). Определение. Кинетическая энергия системы имеет по отноше- отношению к неудерживающей связи s > О каноническую форму, если h = 0. Иными словами, кинетическая энергия в канонической форме является инвариантной по отношению к негладкой замене s —> х : s = |х|, устраняющей неудерживающую связь. Рассмотренный в предыдущем пункте пример негладкой регу- регуляризации простой системы с неудерживающей связью полностью применим для любых систем в канонической форме. Обобщен- Обобщенная сила X, соответствующая новой обобщенной координате х, находится из баланса мощностей: откуда Хх = Ss = Si sign х, X — 5 sign x. И следовательно, уравнения движения, справедливые для любых моментов времени, имеют вид X) dtdy ду~~ Неудерживающая связь исключена. Если кинетическая энергия не имеет канонической формы, т.е. h ^ 0, то ее можно привести к этой форме. 4. Приведение к канонической форме. Для приведения к канонической форме разыскиваем подходящую замену перемен- переменных, на которые неудерживающая связь не наложена: у —> v) у = (p(t) 5, v). Подставляя выражения для обобщенных скоростей
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 149 у = d<p/dt -f (d(f/ds)s -f (d<p/dv)v в выражение для кинетической энергии, находим: Для того чтобы кинетическая энергия была канонической, не- необходимо обратить в ноль члены, содержащие первую степень s. Для этого достаточно выполнения тождества d(f/ds = —Bh. Получена система дифференциальных уравнений для нахожде- нахождения функций (р. Общее решение этой системы зависит от произ- произвольных постоянных С: <р= (р^, 5, С). Подставляя вместо С новые обобщенные координаты v, мы получаем искомую замену у = (р(г, 5, v). Пример. Пусть кинетическая энергия имеет вид Т=-{Р + 2sy2Vl + 2sy2 + y\ + y\). В соответствии с вышеизложенным, замена, устраняющая линей- линейные по s члены, должна удовлетворять системе дифференциальных уравнений д д ( в этом примере а = 1, Л = (у2| 1),В l = L , Общее решение этой системы таково: Следовательно, преобразование, приводящее к канонической форме кинетическую энергию, имеет вид s2 У\ = — - V2S -VI, У2 = "« + V2-
150 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ В новых переменных кинетическая энергия оказывается такой: Т = - [-{s - v2Js2 + Ъ\ + 28щщ + vl] . 5. Общие уравнения систем с неудерживаюшими связями. Приве- Приведенный выше прием сведения кинетической энергии к канонической форме дает принципиальное решение задачи составления регуляр- регулярных уравнений движения систем с неудерживающими связями в самом общем случае. Однако он требует знания общего решения системы обыкновенных дифференциальных уравнений для разыска- разыскания замены переменных, что при решении конкретных задач может быть препятствием для построения искомых уравнений системы с неудерживающими связями в явном виде. В этом пункте излагается прием, позволяющий выписать ре- регулярные уравнения систем с неудерживающими связями в явном виде для любых таких систем. В основе этого приема лежит изложенное в п. 1 настоящего параграфа свойство 3 (теорема Ап- пеля), согласно которому обобщенные импульсы, соответствующие переменным, на которые не наложена неудерживающая связь, в момент удара не терпят разрыва. Следовательно, если выбрать эти импульсы в качестве фазовых переменных, то дифференциальные уравнения могут содержать не более чем разрывы первого рода. Переход от части обобщенных скоростей к обобщенным импуль- импульсам соответствует переходу от уравнений Лагранжа к уравнениям Рауса (§29). Будем исходить из выражения системы с неудержива- ющей связью в виде, представленном в п. 2 настоящего параграфа. Кинетическая энергия 5, у — обобщенные силы, s > О — уравнение связи. Введем в рассмотрение функцию Рауса, заменив обобщенные скорости у на соответствующие обобщенные импульсы. Дифференцируя выражение для кинетической энергии, найдем Из этого соотношения следует у= Запишем функцию Рауса (в отличие от записи этой функции в § 29 берем ее с обратным знаком) TV = T(t, s} у, 5, у)-р'у.
§ 33. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ 151 Подставляя сюда полученное выше выражение для у, находим IV = ^ (а - h'Bh) s2 - ^р'Вр + hp'Bh. Выполним теперь негладкую замену s —> х: 5 = |х|. С учетом этой замены функция Рауса перепишется так; TZ*(t} |х|, у, xsignx, р) = n(t, х, у, i, р) = = ^ (а - /i'B/i) х2 - ^р'Бр + ip'B/i sign x = = 7l0 -f xp'jB/isignx, где через 7?0 обозначена непрерывная часть: Запишем уравнения движения: d дП дП . _ дП . _дП Jt~dx~~!h~ ' У~"~"др"' Р~~ду* ' Подставляя сюда приведенное представление функции Рауса, полу- получим более подробное выражение: й ят?„ ят?„ ( d д д\ = Х - ЗТ^Т-^Г хрБ/isignx, dt дх дх \dtdx дх у = -— хБ/isignx, р гг —— + х — (р J5/i)signx + У. ар ар ау В этом выражении содержится член d д д в котором операции дифференцирования применяются к разрыв- разрывной функции signx. При дифференцировании разрывных функ- функций обычно возникают сингулярности типа так называемых 6- функций, введенных первоначально в физику П.Дираком, тео- теория которых (теория обобщенных функций) впоследствии была построена Л.Шварцем. Покажем, что в нашем случае требуе- требуемое дифференцирование ни к каким подобным сингулярностям не приводит и выписанная система уравнений является регулярной дифференциальной системой, определенной в любой точке беско- бесконечного интервала времени. Для этой цели выполним подробное
152 ГЛ.8. УРАВНЕНИЯ ЛАГРАНЖА ДЛЯ СИСТЕМ СО СВЯЗЯМИ дифференцирование разрывного члена: It di " !h) fP'B/lsignx = ^(p'5/isigni) - ip'—(В/гsignx) = -rip'Bh) ~xp' — (Bh)\ signx + p'Bh (--signx- x—signx ) . at ox J \cn ox J Последний член в этом выражении, который мог быть ответ- ответствен за появление сингулярности, на самом деле равен нулю, если только правило дифференцирования сложной функции остается справедливым и для обощенной функции: -signr = iAsignx. В теории обобщенных функций показывается, что это действи- действительно так, если только x(t) — непрерывная функция времени. Таким образом, нам осталось убедиться в непрерывности х в момент удара. Теорема. Если кинетическая энергия системы с неудерживаю- щей связью, записанная в первоначальных переменных, Т = -q'Aq + b'q + То не содержит линейной формы скоростей, т.е. 6 = 0, то хB) является непрерывной функцией времени. Доказательство. Пусть в своем движении рассматриваемая система проходит положение 5 = 0, сопровождамое ударом. Пусть s — скорость до удара, a s -f As — после. В соответствии с заменой s = |x| разрыв скорости As приводит в общем случае к разрыву скорости Дх. До удара s = xsignx, после удара s + As = = (х-f-Ax) signx. Поскольку до удара signx = — 1, а после удара signx = 1, то получаем s = —х, s -f- As = х + Дх. Из этих двух равенств находим Ах = 2s -f As. Воспользуемся полученным в п. 1 настоящего параграфа выражением для приращения скорости по той переменной, на которую наложена связь: As = -2(s + A-4) (напомним, что s = ^i). Следовательно, для приращения скорости Ах получаем Ах = 2А~1Ь. И если 6 = 0, то и Ах = 0. Теорема доказана. В частности, теорема верна для стационарных систем, для которых не только Т\, но и То равно нулю.
Часть IV Колебания и устойчивость Глава 9. Равновесие и движение вблизи положения равновесия § 34. Определение устойчивости положения равновесия Как было показано в §25, уравнения Лагранжа разрешимы относительно старших производных: Я = F{t, 9> Я), Я = {яи ..-, Яп)- При обозначении q = р система сводится к нормальной форме Коши: Г Я = Р, \p=*U9,p), которую мы будем записывать в виде х = X(tt х), х = (хь ..., хп). Число компонент вектора х, т.е. число п, здесь вдвое больше числа компонент вектора д, однако четномерность вектора х для механических систем в дальнейшем никакого значения не имеет, и мы на этом не будем акцентировать внимания. Правые .части будут предполагаться достаточно гладкими в области их определения функциями своих переменных, с тем что- чтобы решение любой начальной задачи Коши существовало и было единственным. Решение системы x{i) называется бесконечно ТфОДОЛЖае\ШМ вправо, если оно существует для любого t E [*о5 °о). Решение, не являющееся бесконечно продолжаемым вправо, за конечное время выходит на границу области существования. Пример. Уравнение х = 1 — л/1 — x2t2 имеет область определе- определения, задаваемую условием x2t2 < 1. Решения начальной задачи Коши для этого уравнения изображены на рис. 50. Видно, что существуют как продолжаемые, так и непродолжаемые бесконечно вправо решения. Система допускает положение равновесия х = 0, если система X{ty х) = 0 имеет не зависящее от t решение х = а = const. Без ограничения общности можно полагать а = 0. Определение 1. Положение равновесия системы х = X(t} х) называется устойчивым по Ляпунову, если \/е > 0 3S > 0 такое, что любое малое возмущение начальных данных ||х(^о)|| < & вле- ЮЗак 233
154 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ чет и малое возмущение положения равновесия: ||z(*)|| < e для любого *о < t < оо (рис. 51). Заметим, что из условия малости возмущенного движения при любом t следует, что в достаточно малой окрестности устойчивого Рис. 50 Рис. 51 положения равновесия любые решения бесконечно продолжаемы вправо. Определение устойчивости по Ляпунову представляет собой ни что иное, как определение непрерывности решения начальной задачи Коши по начальным условиям, причем эта непрерывность является равномерной по t. Положение равновесия будет неустойчивым по Ляпунову, если, либо в любой сколь угодно малой окрестности его найдется хотя бы одно непродолжаемое бесконечно вправо решение, либо, каким бы малым ни назначить 6, всегда найдется такое решение, удовле- удовлетворяющее условию ||яBо)|| < ^> и такой момент времени t*, когда это решение выйдет за пределы ^-окрестности нуля: ||яB*)|| > fJ., где /i — некоторое положительное число. Положение равновесия в примере на рис. 50 неустойчиво, поскольку в любой окрестности его есть непродолжаемое решение. Определение 2. Положение равновесия рассматриваемой системы называется асимптотически устойчивым по Ляпунову, если, во- первых, оно просто устойчиво по Ляпунову, во-вторых, существует такая окрестность нуля, что все решения, стартующие из нее при t -» оо, стремятся к положению равновесия: ||х(*)|| -> 0. В приведенных определениях под нормой вектора фазового со- состояния x(t) понимается евклидова норма: х = Заметим, что к исследованию устойчивости положения равнове- равновесия всегда может быть сведено исследование устойчивости любого частного решения.
§ 35. КОРРЕКТНОСТЬ ПОНЯТИЯ УСТОЙЧИВОСТИ 155 Действительно, пусть х = ф(г) — некоторое частное решение системы х =. F{t) x). Выполним в этой системе замену переменных х -> у: х = у+ фA). Систему в новых переменных получаем в виде с положением равновесия у = 0. Решение х = ф{1) называется устойчивым по Ляпунову, если устойчивым по Ляпунову будет это положение равновесия. Анало- Аналогичное определение имеет место и для асимптотической устойчи- устойчивости. § 35. Корректность понятия устойчивости В определении устойчивости присутствует начальный момент времени *0- Возникает вопрос — зависит ли от выбора начального момента свойство устойчивости? Теорема. Если положение равновесия системы х = X{t, x) устойчиво для начального момента времени t = *о, то оно является устойчивым и для любого последующего момента времени t = t\) принимаемого за начальный. Доказательство. Пусть задано произвольное е > 0 и нужно построить такое 6\ > 0, чтобы из условия ||x(^i)|| < 6\ следовало ПХ(ОН < е для любого t\ < t < оо. Поскольку для начального момента времени t = *o устойчи- устойчивость имеет место, то существу- существует такое J, что из ||х(<о)|| < ^ следует ||х(<)|| < е для любого to < t < оо. Обозначим через Ds ^-окрестность нуля, через G ее образ при отображении, осуще- осуществляемом вдоль траекторий, стар- стартующих из Ds в момент времени t = to и рассматриваемых в момент времени t = t\ (рис. 52): G = xp{tu D6). Здесь х = ^{t, xo) — решение си- системы с хBо) = хо- Это отображение является взаимно-однозначным и взаимно- непрерывным. Если бы это было не так, то либо задача Рис. 52 x(to)=a, либо задача 10*
156 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ не имела бы единственного решения, непрерывного по начальным данным. Из того, что отображение Д; —> G является взаимно непре- непрерывным, следует, что все внутренние точки D$ отображаются во внутренние точки G. Поскольку положение равновесия есть вну- внутренняя точка Д5, то оно остается внутренней точкой и в G. Значит, расстояние от нее до границы области G положительно. Это расстояние и представляет собой искомое 5\. Теорема доказана. Из доказанной теоремы следует, что от выбора начального момента в определении устойчивости времени может только зависеть S. Если окажется, что S можно находить не зависящим от 2о> то такая устойчивость называется равномерной. Не столь хорошо дело обстоит с выбором переменных, в которых описывается система. Устойчивая в одних переменных она может оказаться неустойчивой в других и наоборот. Пример. Рассмотрим устойчивость решения следующей началь- начальной задачи Коши: х = 1/2, х@) = хо- Это решение имеет вид t х = хо + ~. При возмущении начальных условий имеем возмущенное реше- решение х = х0 +6xq + t/2. Разность между возмущенным решением и исследуемым на устойчивость \х — х\ = 8хо сколь угодно мала при сколь угодно малых 6х0 для любого момента времени. Рассмотрим эту же систему, перейдя к новой переменной х —> у у — х2. Приходим к задаче Коши: у = у/у, у@) = х%. Решению xq + t/2 в исходной переменной соответствует решение в новой: При возмущении начальных данных имеем у = Uo+JXo + -J . Соответствующая разность Is/ — 3/1 > 2<Jx0 f *o + \ не ограничена, каким бы малым ни выбрать начальное возмущение. Решение, устойчивое в переменной х, оказалось неустойчивым в переменной у
§ 36. ОБЩИЕ ТЕОРЕМЫ ОБ УСТОЙЧИВОСТИ 157 Для того чтобы исследование устойчивости было корректным, мы должны, во-первых, твердо знать, по отношению к каким переменным нас интересует устойчивость. И, во-вторых, если процедура исследования требует перехода к новым переменным, мы должны гарантировать эквивалентность свойств устойчивости в старых и в новых переменных. Замены переменных, не изменяющие свойств устойчивости ис- исследуемых решений, называются допустимыми. Достаточные условия допустимой замены дает следующая Теорема. Пусть х = О — устойчивое решение системы х = f(t) x). Если замена х -> у: х = F(t, у) такая, что FB, 0) = 0 удовлетворяет условиям: 1) dF/dy невырождена в некоторой окрестности нуля; 2) если F{t) у) и F~l(t, x) непрерывны в нуле равномерно по 2,то решение у = 0 системы у = (dF/dy)~lf[t, F(t, у)] устойчиво (и наоборот). Доказательство теоремы предоставим читателю в качестве упражнения. § 36. Общие теоремы об устойчивости линейных систем Рассмотрим линейную систему Выше было дано определение устойчивости положения равно- равновесия и было отмечено, что к изучению устойчивости равновесия может быть сведено изучение устойчивости любого частного ре- решения. Если все частные решения дифференциальной системы устойчивы, то говорят, что сама эта система является устойчивой. Теорема 1. Линейная система устойчива (с любым свободным членом) тогда и только тогда, когда устойчиво тривиальное решение соответствующей однородной системы. Доказательство. Пусть х = ф(г) — исследуемое на устойчивость решение неоднородной системы. Сведем задачу к исследованию устойчивости положения равновесия: х -> у, х = ip(t) + у. Подстановка в систему дает ^ + ! = А@М) + у] Поскольку ^ = а(г)ФA)
158 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ то для у получаем систему которая не зависит от того, какое именно частное решение рассма- рассматривается. Теорема доказана. Теорема 2. Линейная однородная система устойчива тогда и только тогда, когда каждое ее решение ограничено. Доказательство. Допустим, что система устойчива, но у нее есть неограниченное решение х = 4>(t). Очевидно, -0@) ф 0 и мы можем построить решение обладающее свойством х@) = S. При любом S это решение неогра- ничено, что вступает в противоречие с определением устойчивости при S -> 0. В обратную сторону. Пусть любое решение ограничено. Но тогда и ограничена фундаментальная матрица решений: *(*) = xln(t) столбцы которой составлены из линейно-независимых частных ре- решений. Если эти решения выбраны так, что Х{0) = Е, где Е — единичная матрица, то общее решение линейной однородной системы можно записать как Тогда = X(t)x@). < Af||x@)||. И при ||х@)|| -> 0 функция ||х(<)|| -> 0 равномерно по t € [0,оо), что и означает устойчивость.
§ 37. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ 159 § 37. Устойчивость линейных систем с постоянной матрицей Теорема 1. Линейная система с постоянной матрицей х = Ах асимптотически устойчива тогда и только тогда, когда вещественные части корней характеристического уравнения системы det {А - ХЕ) = О отрицательны: ReA* < 0 (* = 1, ...,п) Доказательство. Из теории линейных систем дифференциаль- дифференциальных уравнений известно, что произвольная компонента вектора решения х линейной системы состоит из суммы функций следую- следующего вида: (exp a^t) cosh^t, если корни А^ = а^ -f ibk не являются кратными. Если же среди корней есть кратные, то в решении появляются слагаемые вида (Со + C\t + ... + Cptp)(ex'p atf) cos 6^1 Если пк < 0, то все такие слагаемые стремятся к нулю. Решения линейной системы оказываются ограниченными и, в силу теоремы 2 из §36, сама система является устойчивой, а в силу экспоненциального затухания решений — и асимптотически устойчивой. Теорема доказана. Таким образом, чтобы установить асимптотическую устойчи- устойчивость линейной системы, достаточно убедиться, что все корни ее характеристического уравнения (иногда его называют вековым) det (А - ХЕ) = а0 + ^А + ... + апХп = О обладают отрицательными вещественными частями. Теорема 2 (Критерий Рауса-Гурвица). Для того чтобы полином /(А) = а0 + агХ + . . . + апХп (а0 > 0) имел все корни с отрицательными вещественными частями, необ- необходимо и достаточно, чтобы все главные диагональные миноры матрицы а\ ао 0 ... 0 аЗ Я2 а1 а0 • • 0 М = 0 ап были положительны. Поясним, что на главной диагонали этой матрицы стоят ко- коэффициенты рассматриваемого полинома, от а\ до аП| а каждая строка получается достраиванием диагонального элемента вправо
160 ГЛ.9 РАВНОВЕСИЕ И ДВИЖЕНИЕ и влево до последовательности всех коэффициентов в порядке их убывания. Доказательство. Полином /(Л), корни которого обладают от- отрицательными вещественными частями, называется устойчивым. Лемма 1. Если полином устойчив, то все коэффициенты его положительны. Действительно, пусть полином имеет корни Xj = -aj±i0jt j = 1, .... p, с кратностью сг;. А также корни А* = — 7fc с кратностями Sk, /: = 1, ..., q. Поскольку полином устойчив, то а;-,7/с > 0. Представим полином в виде разложения на сомножители: Произведение сомножителей с положительными коэффициентами есть полином с положительными коэффициентами. Лемма доказа- доказана. Полином F(X) = A + аА)/(А) Ч-/(-А), в котором а > 0, назы- называется присоединенным к полиному /(А). Лемма 2. Если полином /(А) устойчив, то и присоединенный полином тоже устойчив. Рассмотрим вспомогательный полином А), /* € [0, 1]. Очевидно, что Фо(А) — устойчивый полином. Корни полинома () являются непрерывными функциями параметра \х. Если = F(\) не является устойчивым, то это значит, что существует \х* такое, что ) Подставим этот корень в полином Отсюда |l + Так как /(А) — устойчивый полином, то \НШ = \ПЦЗ)\ = \П-гр)\фО. И из полученного выше равенства следует |l + ia/?| = /i* или 1 +а2/?2 =//2.
§ 37. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ 161 Так как Ф^@) = A + /i)/@) = A+ fi)a0 ф О, то и /3 ф 0. Значит, 1 + а2/?2 = /i*2 > 1, что невозможно, поскольку /i < 1. Лемма доказана. Лемма 3. Для всякого устойчивого полинома степени п + 1 существует устойчивый полином степени п, для которого данный полином является присоединенным. Пусть F(A) — заданный устойчивый полином степени п + 1. Найдем устойчивый полином /(А) степени п, такой, чтобы Отсюда, учитывая, что находим с*2А2/(А) - -A - aA)F(A) + F(-A). Прежде всего нужно показать, что /(А) является полиномом, т.е. это равенство можно сократить на А2. Для этого запишем F(A) в виде 1 и подставим в полученное равенство: 2А2 а2А2/(А) = (аЛ0 - 2АХ)\ Отсюда видно, что /(А) будет полиномом степени п, если выбрать a = 2Ai/A). Осталось показать, что такой полином будет устойчивым. Рассмотрим функцию ФМ(А) = -A - aA)F(A) -f /iF(-A), /i G [0, 1]. Полином Фо(А) = -A - aA)F(A) имеет один корень А = I/a по- положительный и все остальные с отрицательными вещественными частями. Выясним, при каких /i сохраняется подобная расстановка корней. Пусть при некотором fi = fi* Xk = i/3, тогда 1 + a2/?2 = /i*2, что невозможно для 0 < /i < 1. При /i = 1 полином <?i(A) имеет двукратный нулевой корень.
162 ГЛ.9 РАВНОВЕСИЕ И ДВИЖЕНИЕ Рассмотрим поведение корней при /i —У 1. Возможны два вари- варианта поведения. В первом варианте в нулевой корень сливаются один корень из левой полуплоскости и единственный корень из правой (рис. 53). Во втором варианте корень в правой полуплос- с т Рис. 53 Рис. 54 кости остается в ней же, а к нулю стремятся два корня из левой полуплоскости (рис. 54). Если имеет место первый случай, то после сокращения на Л2 оставшиеся корни будут лежать в левой полуплоскости и полином /(А) оказывается устойчивым. Покажем, что именно этот вариант и имеет место. Обозначим два корня, стремящиеся к нулю при fj. —> 1, через Лр и Л^. Рассмотрим подробнее поведение этих корней при 1 — /1 = ? -> 0 : /о Л2 \ Ф^ = -Аое + АгвХ + f j± - еА2) Л2 + ... = 0. Ищем указанные корни в виде Подставляя в написанное выше уравнение, находим: откуда получаем
§ 37. УСТОЙЧИВОСТЬ ЛИНЕЙНЫХ СИСТЕМ 163 Но при /i ф 1 у полинома Ф^, единственный корень с положительной вещественной частью, следовательно, это и есть корень Ар. Лемма доказана. Доказательство самой теоремы будем проводить методом пол- полной математической индукции. Покажем вначале необходимость условий теоремы. Пусть полином /(А) — устойчив. Тогда для п — \ /(А) = аоЧ-сцА и главный диагональный минор фигурирующей в теореме матрицы сводится к а\) которое должно быть больше нуля из условия отрицательности А. Для п = 1 условие теоремы, как необходимое, справедливо. Пусть теперь оно справедливо для некоторого п. Покажем, что оно справедливо и для п + 1. Полином степени п -f 1 можно рассматривать как присоединенный к полиному степени п: Для удобства примем a = 2С. Выразим полином F(X) через коэф- коэффициенты полинома /(А): = 0. Вычислим главный диагональный минор порядка fc-fl матрицы М: 2а0 2Са0 2а0 О О 2Са2 2а2 -\- 2Со.\ 2Colq 2olq 2СаА 2а4 + 2Са3 2Са2 2а2 - 2Ca2k 2ci2k + 2Ca2k-i 2Ca2k-2 Ас+1 = Вынесем из первого столбца за знак определителя 2С и вычтем после этого из второго столбца удвоенный первый. Из полученного второго столбца вынесем 2С и повторим процедуру для третьего и четвертого, затем пятого и шестого и т.д. В результате получим a0 а2 0 0 а0 2к 0>2к-1 0>2к-3 где Ак — главный минор порядка к матрицы М для полинома /(А). Но по предположению индукции А* > 0 для к = 1, ..., п. Значит, и Dk+\ > 0.
164 ГЛ.9 РАВНОВЕСИЕ И ДВИЖЕНИЕ Докажем теперь достаточность. Пусть п = 1, /(А) = аоЧ-сцА, из условия А\ > 0, т.е. а\ > О, следует, что полином /(А) устойчивый. Пусть теперь теорема верна вплоть до некоторого п включительно: из А* > 0 при к = 1,...,п следует, что /(А) — устойчивый полином. Рассмотрим полином F(X) порядка п+1. Дано, что для него все Dk + \ > 0, к = 1, ..., п. Для этого полинома существует полином /(A): F(A) = A + аА)/(А) + /(-А) и в силу Dfc+1 = а* + 1а0Д* следует, что Д*>0,& = 1,...,п. Но это значит, что полином fW — устойчивый. Тогда по лемме 2 F(X) — тоже устойчивый полином. Теорема доказана. Существуют теоремы, в которых необходимые и достаточные условия устойчивости полинома /(А) формулируются не в анали- аналитической форме, как в предыдущей теореме, а в геометрической. Остановимся на одной из таких теорем, которая называется геоме- геометрическим критерием устойчивости Михайлова. Определение. Кривая, описываемая в комплексной плоскости комплексным числом f(iu) при изменении и от 0 до оо, называется годографом Михайлова функции /(А). Теорема (Критерий Михайлова). Для того чтобы вещественные части корней полинома /(А) = 0 были строго отрицательны: ReA^ < < 0, необходимо и достаточно, чтобы при изменении w от 0 до оо arg/(zcj) изменился на тгп/2. Доказательство. Представим полином f(iu>) в виде разложения на множители: f(iu) = an(iu - Ai) ... (iu - An). Изменение аргумента произведения комплексных чисел равно сумме изменений аргументов сомножителей: Aarg/(ia;) = Изменение аргумента сомножителя iu т- А^ зависит от знака ве- вещественной части корня А/с = а^ + ihk (рис. 55). Если а* < 0, то изменение аргумента ги — Xk при cj, изменяющемся от —оо до со, очевидно равно —тг. Если а^ > 0, то изменение аргумента в том же диапазоне изменения и равно +тг. Если а^ = 0, то изменение аргумента не определено. Значения предела этого изменения при пк —>¦ 0 справа и слева не равны друг другу. Следовательно, тг(/-г), ак^0 Vfcl -с»<ы<оо [не определено, если d* : ак = 0. Поскольку f(—iu) = /(tw), то кривая оказывается симметричной
§ 38. УСТОЙЧИВОСТЬ ПОЛОЖЕНИЙ РАВНОВЕСИЯ 165 относительно вещественной оси для и- ? (-оо,оо), поэтому для и е [о.оо) gf{ о < w < оо ^(/ - г)/2, акф0 не определено, если = и. Здесь / — число корней с отрицательной вещественной частью, г число корней с положительной вещественной частью. Таким образом, если полином устойчив, то все аи < 0 и из полученной формулы следует A arg f(iu>) = тгп/2 . Обратно, если 4arg(iaj-A*> wg (io)-Xk) ак>0 ак<0 Рис. 55 Д arg f(iuj) = 7гп/2, то это значит, что изменение аргумента опре- определено, т.е. ак ф 0, и из той же формулы следует, что г = 0, т.е. все пк < 0 — полином устойчив. Теорема доказана. § 38. Устойчивость положений равновесия нелинейных систем В большинстве случаев исследование устойчивости положения равновесия нелинейных систем может быть сведено к исследова- исследованию устойчивости линейных систем, выполненному в предыдущем параграфе. Случаи, когда это можно сделать, описываются в нижеследующих теоремах Ляпунова. 1. Теоремы Ляпунова об устойчивости и неустойчивости. Тео- Теорема Ляпунова об устойчивости по первому приближению. Пусть для системы ± = *(*), положение равновесия которой х = 0, правая часть является не- непрерывно дифференцируемой в нуле, а вторые производные ее
166 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ существуют в некоторой окрестности положения равновесия и огра- ограничены в ней. Пусть, кроме того, линейная часть этой системы х = Ах является асимптотически устойчивой. Тогда положение равновесия исходной системы также является асимптотически устойчивым. Доказательство. Вначале докажем лемму Гронуолла. Лемма. Пусть для положительных u(t)yf(t) и С имеет место неравенство u(t) < С+ [ f(t)u(t)dt. Jo Тогда u(t) < Сехр Доказательство леммы. Из исходного неравенства последова- последовательно получаем ^<i, 4 C + fif(t)u{t)dt ~ C + f'f(t)u(t)dt Интегрируя последнее, находим: ln|c+ / /@ti@*] -\nC < f f(t)dtt С + [f(*Ht) Л < Сехр У /(<) л] . откуда В силу исходного неравенства это влечет за собой доказываемое неравенство. Приступим к доказательству теоремы. В условиях теоремы правая часть системы допускает представление x = Ax + f(x), ||/(х)|| < а||х||2. Поскольку линейная часть системы асимптотичеки устойчива, то все корни характеристического уравнения det|A-AE| = 0
§ 38. УСТОЙЧИВОСТЬ ПОЛОЖЕНИЙ РАВНОВЕСИЯ 167 удовлетворяют условию Re А^ < 0. Обозначим min|ReA^| = 2/i и выполним замену переменных х —> у: Рассматриваемая система приобретает вид у = Ву + ehtf (ye-ht) , B = A + hE. Очевидно, что линейная часть этой системы по-прежнему устойчива. Запишем эту систему в эквивалентной форме Jo и оценим y(t) по норме Поскольку линейная часть системы устойчива, то ее фундамен- фундаментальная матрица решений ограничена: ||ехрE<)|| < М, и написанное неравенство можно переписать в виде ПУ(ОП < М\\уо\\ + Ma f exp(-hT)\\y(T)\\2 dr < Jo < M\\yo\\ + Ma[ exp(-fcr)||y(r)||dr. J Последний переход верен до тех пор, пока ||у(г)|| < 1. Используя лемму Гронуолла, получаем ||у@|| < Мехр [ j Если ||уо|| < 1/&, то неравенство ||у(т)||2 < ||у(т")|| справедливо при любом f и из неравенства ||уB)|| < ^||уо|| следует устойчивость положения равновесия в переменной у. Переходя к переменной х, имеем = \\y(t)\\e-ht->0, t^oo, что и означает асимптотическую устойчивость положения равнове- равновесия в переменной х. Теорема доказана.
168 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ Теорема Ляпунова о неустойчивости. Положение равновесия рассмотренной в предыдущей теореме системы f(x), ||/(х)|| < а||х |2 неустойчиво, если хотя бы один корень характеристического урав- уравнения det [Ах — ХЕ) имеет положительную правую часть. Доказательство теоремы проводится как и в предыдущем слу- случае методом оценок с использованием леммы Гронуолла, в которой неравенство следует заменить на противоположное. Из приведенных теорем следует, что вне поля зрения остались такие нелинейные системы, в которых у линейной части существу- существуют корни характеристического уравнения с нулевой вещественной частью. Такие случаи исследования устойчивости называются осо- особыми. В особых случаях из свойств устойчивости линейной части системы никак не следует устойчивость положения равновесия всей системы. Некоторые возможности в исследовании устойчивости в этих случаях дает теорема Лагранжа. 2. Теорема Лагранжа об устойчивости положения равновесия консервативной механической системы. Уравнения Лагранжа кон- консервативной механической системы имеют вид d_ar _ ат __5п dtdtji dq{~ dii I1' •••¦*)¦ где кинетическая энергия Т содержит только квадратичную форму (§25): Т = Т2 = а П представляет собой потенциальную энергию. В положении равновесия дг = 0 (Уг). В этой точке вся левая часть обращается в ноль и, следовательно, То есть в положении равновесия консервативной механической системы потенциальная энергия принимает стационарное значение (максимум, минимум или точка перегиба). Теорема. Если в положении равновесия консервативной механи- механической системы с конечным числом степеней свободы потенциаль- потенциальная энергия имеет строгий минимум, то это положение равновесия устойчиво. Доказательство. Консервативная механическая система обла- обладает первым интегралом (§27) вида Е = Т -f- П = const.
§ 38. УСТОЙЧИВОСТЬ ПОЛОЖЕНИЙ РАВНОВЕСИЯ 169 Обозначения можно выбрать так, чтобы в положении равновесия qi = 0 (г = 1, ..., п) и П@) = 0. Тогда в некоторой окрестности положения равновесия Е = Т + П > 0. Обозначим буквой х фазовый вектор: х = {?1> • • • i 9п, 9ь • • -1 9п} с нормой ||х||= ^i + ••¦ +0п +9?+•••+#• Выберем число ? и найдем минимум полной энергии Е на сфере ||х|| = е. Обозначим этот минимум буквой Е*. Такой минимум существует, покольку непрерывная функция Е(х) на ограниченном замкнутом множестве достигает своего наибольшего и наименьшего значений. Поскольку экстремум П в положении равновесия строгий, то этот минимум строго больше нуля: Е* > 0. Так как Е —> 0 при х —У 0, то существует такое 6, что Е < Е*, если только ||х|| < <J. Но тогда любое решение х(?) с начальными условиями ||х@)|| < 8 будет удовлетворять условию ||z(*)ll < ?> так как в противном случае Е > Е*, что невозможно, поскольку Е = const. Теорема доказана. Пусть к только что рассмотренной системе приложены допол- дополнительно непотенциальные силы Будем говорить, что силы Q являются диссипативными силами с полной диссипацией, если 4iQi < 0 {qi ф 0). Теорема. Изолированное положение равновесия консервативной механической системы с конечным числом степеней свободы, в ко- котором потенциальная энергия имеет строгий минимум, становится асимптотически устойчивым при добавлении к системе диссипатив- ных сил с полной диссипацией. Доказательство. Поскольку положение равновесия изолирова- изолировано, то можно так выбрать число ?, чтобы в области ||х|| < е других положений равновесия кроме х = 0 не было. Поскольку выполнены условия предыдущей теоремы, то это положение равновесия является устойчивым, и для выбранного е можно найти 6 такое, при котором из ||х@)|| < 6 следует, что е для любого t.
170 ГЛ.9. РАВНОВЕСИЕ И ДВИЖЕНИЕ Как следует из §27, производная по времени от полной энергии имеет вид dE ¦JCUM) и, в силу условий теоремы, является монотонно убывающей функ- функцией времени. Покажем, что вдоль любой траектории, удовлетво- удовлетворяющей в начальный момент времени условию ||х@)|| < 6} полная энергия стремится к нулю при t —> оо. Отсюда и будет следовать, что И01ИО (<->оо). Пусть это не так. Пусть су- существует траектория x(t) такая, что Hindoo E[x(t)] = Ео > 0 (рис. 56). Рассмотрим бесконечную последо- последовательность моментов времени tk —> оо (к —> оо). Бесконечная и огра- ограниченная последовательность x(tk) по теореме Больцано-Вейерштрасса содержит сходящуюся подпоследова- подпоследовательность х» = x(tkt) —> х* при г —* оо. Причем в силу непрерывности Е(х) х* не совпадает с положением равновесия и lim,_*oo Е(х{) = Ео. Рассмотрим траекторию, начинающуюся в момент времени t = О в точке х* : х(х*, t). Поскольку х* не есть положение равновесия, то энергия вдоль этой траектории монотонно убывает, и в некоторый момент времени Т мы имеем неравенство Е[х(х\Т)] < Ео=Е[х*]. Рассмотрим далее другую траекторию, начинающуюся в момент времени t = 0 в точке х,- : х(х,-, t). По теореме о непрерывной зависимости решений начальной задачи Коши от начальных условий имеет место Jim х(х,-, Т) - х(х*, Т). Рис. 25 Напомним известную теорему о пределах: если А < В и если А{ —> А, то, начиная с некоторого г, А, < В, В силу этой теоремы, если Е[х{х\Т)} < Ео и если ?[х(х,-, Т)] -» ?[i(i*J)], то, начиная с некоторого г, i?[x(xj, Т)] < Ео. Однако траектория х(х,-, t), в силу теоремы единственности решений начальной задачи Коши, представляет собой часть траектории х(*), для которой в любой момент времени J5[x(<)] > Ео. Полученное противоречие и доказывает теорему.
§ 39. КОЛЕБАТЕЛЬНАЯ СИСТЕМА 171 Пример. Исследовать устойчивость вертикального положения равновесия маятника с линейной восстанавливающей пружиной (рис. 57). Выбором масштабов измерения перемен- переменных уравнения движения такого маятника можно привести к виду i + b = sinx. Линеаризация этого уравнения дает ?+(Jfe-l)x = O. Характеристическое уравнение Л2 + (к - 1) = 0 име- имеет один вещественный положительный корень, если к < 1, и по теореме Ляпунова о неустойчивости заключаем, что в этом случае положение х = О у/, V77/, Рис. 57 неустойчиво. Если к > 1, то оба корня лежат на мнимой оси, и сделать вывод об устойчивости нельзя. Применим теорему Лагранжа. Потенциальная энергия рассма- рассматриваемого маятника имеет вид кх2 + cos х - 1 = к- 1 X*4 IT Если к > 1, то потенциальная энергия имеет строгий минимум и по теореме Лагранжа следует, что положение х = 0 в этом случае устойчиво. Глава 10. Малые колебания в окрестности положения равновесия § 39. Колебательная система с одной степенью свободы 1. Амплитудно-частотная характеристика. Уравнения колебаний линейного одномерного осциллятора (рис. 58) могут быть получены как уравнения Ньютона, связываю- связывающие ускорение материальной точки массы т с действующими силами: — кх — сила упругости пружины, —hx — сила вязкого сопротивления и р cos А* — сила периодического воз- возбуждения. Это уравнение имеет вид I ИС. 5о тх + hx + кх = pcosut. Если р = О, то маятник осуществляет свободное движение, которое можно искать в виде т р cos wt х = хое xt
172 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ После подстановки этого решения в уравнение для нахождения А получаем уравнение тА2 + /iA + к = О, корни которого h2 к Am2 m позволяют записать общее решение для случая р = 0 в виде х = Aexp(Ai^) + Bexp(\2t), где А и В — произвольные постоянные интегрирования. Если h2 — Атк > 0, то выписанное решение является веществен- вещественным и оно при h > 0 определяет решение, стремящееся к нулю при t -> оо. Если h2—Amk < 0, то полученное решение в вещественной форме имеет вид Оно определяет затухающий колебательный процесс, если h > 0 и незатухающие колебания, если h — 0: х = Л cos \/— 2 -Ь Б sin \/— 2. V m V т Величина Q = у/к/т называется частотой собственных колебаний осциллятора. Если h2 — Атк = 0, то общее решение уравнения при р = 0 имеет следующий вид: х = (A ))] Если р ф 0, осциллятор находится под действием внешней периодической силы, и общее решение уравнения колебаний в этом случае складывается из общего решения однородного уравнения (т.е. при р = 0), что нами уже найдено, и какого-либо частного решения неоднородного уравнения. Необходимое решение будем строить следующим образом. В силу принципа суперпозиции интересующее нас частное решение будет представлять собой вещественную часть соответствующего частного решения следующего уравнения: тх + hi -f kx = p(cosu;2 + isinut) = pexp(iurt). Разыскивая решение этого уравнения в виде х =
§ 39. КОЛЕБАТЕЛЬНАЯ СИСТЕМА 173 находим х0 = а = (к - ти2) + ihu к — тиJ о = = p(a-ib)) (к-ти2J -f h2tu2 ' Отсюда следует, что Rex = Rep(a-zb)(coscj*-fzsmu;*) = p(acos где p A- r— _,_ ====;, a = arctg (к - ты2J + h2u2 ' = Acos(<jjt — a)} к — mu2 Полученное выражение для амплитуды вынгрюденных колебаний А и для фазы а, рассматриваемые как функции частоты внешней силы и, называются соответственно амплитудно-частотной и фаз о-частотной характеристиками линейного осциллятора. Они изображены на рис. 59 в виде семейства кривых, где параметром Рис. 59 семейства является коэффициент демпфирования h. Амплитуда вынужденных колебаний принимает максимальное значение вблизи точки ш = \fkjm, т.е. когда частота внешней силы близка к частоте собственных колебаний. Это явление называется резонансом. 2. Функция Грина. Пусть внешняя сила, приложенная к осцил- осциллятору, зависит от времени произвольно: тх -f- hi -f kx = f(t). Частное решение этого уравнения разыскиваем в виде = fc{t-T)f{r)dT. Jo
174 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Подлежащая определению функция G{9) носит название функ- функции Грина для рассматриваемого осциллятора. Говорят, что частное решение уравнения осциллятора в этом случае представляет собой свертку функции, выражающей зависи- зависимость внешней силы от времени, с функцией Грина осциллятора. Подставляя это решение в уравнение, найдем t [mG{t -т) + hG{t - т) + kG{t - г)] dr+ о +mG@)f(t) + [mG@) + hG@)]f(t) = f(t). Для того чтобы это соотношение выполнялось тождественно, до- достаточно положить mG + /iG + *G = 0, G@) = 0, G@) = 1/m. Таким образом, функция Грина является решением начальной задачи Коши для однородного уравнения и в случае 4km > h2 имеет вид * I G{6) = — exp[-A0/Bm)] sin Ш f Q = J — - -^ ) . muj \ V m 4mz I В результате частное решение при произвольном неоднородном члене имеет вид 1 fl х = —- / exp[-A(t - r)/{2m)][sinU(t - r)]f(r) dr. muj Jo § 40. Колебательные системы произвольного числа степеней свободы 1. Классификация линейных сил. Рассмотрим механическую систему со стационарными связями ddT вт ^ ( 1) где Qi{q, q) — обобщенные силы. Пусть <7iEE0 — положение равновесия этой системы. Как и в случае исследования устойчивости положения равновесия, движе- движение в его окрестности можно изучать, осуществив линеаризацию системы, полагая qi и сц малыми: Т= 2
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ 175 Тогда уравнения движения могут быть записаны в следующей матричной форме: Aq + Bq + Cq = O) где А = {a,j(O)} — симметрическая, положительно определенная матрица кинетической энергии, В = {bij} — матрица скоростных сил произвольного вида, С = {с,у} — также произвольного вида матрица позиционных сил. Произвольная матрица скоростных сил В может быть един- единственным образом разложена в сумму симметрической и кососим- метрической матриц: Силы Dq называются диссипативными, если квадратичная фор- форма qTDq > 0, и они называются силами с полной диссипацией, если qr Dq > 0 для любого q ф 0. Функция 71 = qTDq/2 называется диссипативной функцией Релея. Диссипативные силы связаны с ней так: Dq = dlZ/dq. Силы Tq называются гироскопическими и они обладают следу- следующими основными свойствами. Свойство 1. Мощность гироскопических сил в любом движении равна нулю: W = qT^Q — 0. Действительно, WT = {qTTq)T = ~qTTq = -W, но W — скаляр и он равен себе обратному только, если W = 0. Свойство 2. Гироскопические силы имеют обобщенный потен- потенциал: Г. d dV dV Действительно, нетрудно проверить, что роль потенциала играет следующая билинейная форма: V(q, q) = \qTTq. Свойство 3 (без доказательства). Подходящим ортогональным преобразованием обобщенных координат матрица Г может быть приведена к следующей канонической форме: МТТМ =
176 ГЛ. 10. МАЛЫЕ КОЛЕБАНИЯ По главной диагонали этой блочной матрицы стоят двумерные блоки или нули. Вне главной диагонали — нули. Свойство 4. det Г > О, если п — четное, и det Г = 0, если п — нечетное (следует из предыдущего свойства). Последние два свойства относятся и к вводимой ниже кососимметрической матрице лл Произвольная матрица позиционных сил С также единственным способом разлагается в сумму симметрической и кососимметриче- кососимметрической частей: С = А' + ЛЛ КТ = А', Мт = -ЛЛ Силы Kq называются потенциальными или консервативными. Они обладают следующими основными свойствами. Свойство 5. Консервативные силы обладают потенциалом: .. dU Kq= -г-, dq где U = qTKq/2. Это свойство ранее нами было положено в основу определения потенциальных сил. Свойство 6. Работа консервативных сил по любому замкнутому контуру в конфигурационном пространстве равна нулю: (li - 0. Nq Это свойство немедленно следует из предыдущего. Силы Afq в литературе по механике имеют несколько названий: циркулярные, или псевдогироскопические, или соб- собственно неконсервативные, или силы ра- радиальной коррекции. Последнее название встречается в более специальной лите- литературе. Основные свойства этих сил таковы. Свойство 7. Циркулярные силы ор- ортогональны вектору обобщенных коорди- координат: qTMq = 0. В частности, в плоском случае это озна- Рис. 60 чает, что силовые линии векторного поля циркулярных сил — окружности (рис. 60). Этим и объясняется их название (от франц. cercle — круг)..
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ 177 Свойство 8. Работа циркуляционных сил по замкнутому конту- контуру в плоском случае пропорциональна площади, охваченной этим контуром: В общем случае эта работа равна сумме площадей проекций за- замкнутого контура на двумерные подпространства, соответствующие каноническому представлению матрицы N. Существует и более подробная классификация линейных сил, основанная на дальнейшем разложении (тоже единственным спосо- способом) симметрических матриц D и К в сумму скалярной и деви- аторной частей. Скалярная матрица это диагональная матрица с одним и тем же числом на главной диагонали. Матрица-девиатор — это матрица, имеющая равный нулю след. Скоростные силы, определяемые скалярной матрицей, назы- называются скоростными силами сферического типа, а определяемые девиатором — скоростными силами гиперболического типа. Анало- Аналогично и для позиционных сил — позиционные силы сферического и гиперболического типа. 2. Свободные колебания консервативных систем. В консерва- консервативных системах действуют только потенциальные силы, поэтому уравнения движения имеют вид Aq + Kq = 0. Для того чтобы движения системы были колебательными, матрицу К тоже следует считать положительно определенной: q1Kq > 0. Разыскиваем движение этой системы в виде q = hcos(\t + a), где h — неизвестный постоянный вектор, Л и а — неизвестные постоянные скаляры (частота и начальная фаза). Для нахождения h получается линейная алгебраическая система {К -fiA)h = O (/i = A2). Система линейных однородных уравнений имеет нетривиальное решение h ф 0, если и только если det{K -fiA) = O. Это характеристическое уравнение порядка п относительно неиз- неизвестной /i называется уравнением частот. Теорема. Уравнение частот имеет только вещественные и поло- положительные корни. 13 Зак. 233
178 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Доказательство. Пусть /i — комплексный корень уравнения частот, и ему соответствует комплексное решение А соответствующей линейной системы. Умножим эту систему слева на эрмитово- сопряженный вектор А*, т.е. транспонированный и с комплексно- сопряженными элементами: A* = (Аь ...., An). В результате получаем Отсюда находим /х: Поскольку система вещественная, то имеется и комплексно- сопряженный корень Д с комплексно-сопряженным решением А. Проделывая выкладку аналогично только что выполненной, полу- получаем _ _ И, в силу симметричности матриц А и А", получаем /i = Д, т.е. ц — вещественное. Следовательно, и А — вещественный вектор, и, поскольку формы 52^tjAtAj и 5Za»i'l»'lj положительно определены, V > 0. Таким образом, уравнение частот имеет п положительных кор- корней /ii,...,/in, и им соответствуют п вещественных векторов А1,...,А". Теорема. Если среди корней уравнения частот нет кратных, то собственные векторы hk являются Л-ортогональными, т.е. (А5,АА') = 0, если 5^/. Доказательство. Векторы А5 и hl удовлетворяют следующим соотношениям: Khl = уц Ah1 и Khs = ysAhs. Умножая первое скалярно на А5, а второе на А', получаем (A', Khl) = /1,(А', Ah1), (A*, Kh>) = Мд(А', Ahs). Вычитая одно из другого, имеем
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ 179 откуда, если щ ф /i5, (hl, Ahs) = 0. Если / = s, то (hl,Ahl) = пц > 0. Нормируем вектор hl: hl -> М^/гщ. Тогда доказан- доказанное свойство А-ортогональности можно записать как свойство А- ортонормированности: (hl,Ahs) = (J5j, где Ssi = 1 при s = / и (J,j = 0, если s ф L Следствие. Векторы h1, ..., hn линейно независимы. Действи- Действительно, если v\hl + ... + i/nhn = 0 и ик ф 0, то (Ahk, vihl -f ... + -\-unhn) = 0, что влечет за собой (A/ifc,/ifc) = 0, а это невозможно. Следовательно, общее решение системы Aq -f Kq = 0 есть Cn/in Векторы /ifc носят название амплитудных векторов. Колебания с чистым тоном, из которых составляется общее решение q = Ckhkcos{\t+ak)) называются главными колебаниями системы. Направления глав- главных колебаний, определяемые амплитудными векторами hk (k = = 1, ..., п), называются главными направлениями в конфигураци- конфигурационном пространстве линейной колебательной системы. Эти главные направления можно выбрать в качестве новых координатных осей, рассматривая амплитудные векторы в качестве нового базиса. То- Тогда координаты, определяющие положение колебательной системы в новом базисе, называются нормальными координатами. Для перехода к нормальным координатам в системе Aq + Kq = 0 следует выполнить замену переменных q —> у по формуле где Я = Л} ... Л? fti . к, Выполняя умножая слева это преобразование в рассматриваемой системе и , на Я , получим НТАНу + НТКНу = 0. В силу того, что (hk, Ah1) = 6ki, матрица НтАН равна единичной, а в силу того, что , Ati)=v,8M, 13*
180 ГЛ. 10. МАЛЫЕ КОЛЕБАНИЯ имеем НТСН = О Таким образом, в нормальных координатах рассматриваемая система приобретает вид Ух + РхУх = О, Уп + ЦпУп = 0. Все сказанное выше получено в предположении отсутствия крат- кратных корней в уравнении частот. Все остается справедливым и в случае кратных частот (следует из известной в алгебре теоремы о приведении пары форм к главным осям). При решении уравнений (К — fiA)h = 0 в случае кратного корня /i размерность пространства решений равна кратности корня. Выбор независимых решений из этого пространства осуществляется с использованием процедуры ортогонал изации. 3. Вынужденные колебания. Пусть консервативная колебатель- колебательная система подвержена действию внешней силы, зависящей от времени f(t): Aq + Kq = f{t). Будем полагать, что гармоническая внешняя сила приложена по А:-й обобщенной координате, т.е. f(t) имеет вид ло = - р cos ut = Переходя к нормальным координатам q —> у, получим НтАНу + НтКНу = HTekpcosu>t
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ или, в покоординатной форме: 2/1 -К А^ух = h\p cosut, 181 Уп = h^pcoswt. Частное решение этой системы с периодом внешней силы (вы- (вынужденные колебания) имеет вид Ут = p cos ut m - ^ • • •» n) или же, возвращаясь к старым координатам, найдем: = РЛзк cosut- ( КК КК \ * - Р [ 72 2 + • • • + 72 2 \л1 —и лп -и j Коэффициенты Ask, показывающие, как возбуждение по А-й координате влияет на движение по s-й координате, называются гармоническими коэффициентами влияния. Они, очевидно, явля- являются симметрическими: А8к = Акз, что выражает так называемый принцип взаимности. Если s = А:, то в выражении для A3k числители всех слагаемых положительны, и график зависимости Л,,(и>), сочетающий в себе понятия амплитудно-частотной и фазо-частотной характеристик од- одномерной системы, имеет вид, изображенный на рис. 61. График показывает, что всегда имеется ровно п резонансов и ровно п — 1 то- точек на оси частот, при которых амплитуда колебаний возбуждаемой обобщенной координаты равна нулю. Такое явление называется со Рис. 61 Рис. 62 явлением динамического поглощения колебаний или антирезонан- антирезонансом. Если же А: ф 5, то в силу Л-ортогональности амплитудных
182 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ векторов, числители слагаемых, входящих в выражение Ask, уже не могут иметь одинаковый знак. Число антирезонансов меньше, чем п - 1 (их может не быть совсем), и график A,k{u>) имеет, например, такой вид, как это изображено на рис. 62. Рассмотрим теперь вынужденные колебания в тех случаях, когда в системе присутствуют диссипативные силы: Aq -f Dq + Kq = tkpcosut. Поступаем так же, как в случае одномерной системы, т.е. заменяем написанное уравнение следующим: Aq + Dq + Kq = ekpeiwt. Частное периодическое решение исходного уравнения получается как вещественная часть соответствующего решения только что написанного уравнения: i Для вектора амплитуд / получается система алгебраических уравнений (-Аи2 + iuD + K)l = екр. Решая ее по правилу Крамера, получаем для s-Й компоненты вектора /: /, = Д,*/Д = [u(v) - iv(u)]pt где Д — определитель системы, а Ask — алгебраическое дополнение элемента этого определителя, стоящего в пересечении к-й строки и s-ro столбца. Искомое вещественное решение исходной системы имеет вид qs = [u((jj) cosut + v((jj) sinut]p. Функция Wsk{v) = py/u2((jj) + V2((jj) определяет амплитудно-частотную характеристику колебаний по s-й координате при возбуждении по fc-й. 4. Особые направления в пространстве конфигураций линейных консервативных систем. Найденные выше главные направления свободных колебаний hk являются особыми в том смысле, что только в этих направлениях форма колебаний прямолинейна, а сами колебания являются гармоническими (одночастотными). При сколь угодно малом отклонении начальных условий от начальных условий, определяющих главные колебания, отмеченные свойства пропадают. Рассмотрение вынужденных колебаний обнаруживает существо- существование в конфигурационном пространстве еще двух семейств особых
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ 183 направлений: если внешняя периодическая сила действует вдоль какого-либо из этих направлений, то периодическое решение систе- системы обладает свойствами, которых не имеют периодические решения при любых других внешних силах. Особые направления, сопряженные главным, получаются из глав- главных преобразованием hk с матрицей К, т.е. Khk. Свойства этих направлений устанавливает следующая теорема. Теорема. Если в системе Aq -f Kq = pcosut сила pcosut (здесь р — вектор) направлена вдоль сопряженно- сопряженного направления, то вынужденные колебания, имеющие частоту w, осуществляются вдоль соответствующего главного направления, причем при изменении ы от нуля до бесконечности система ведет себя как одномерная, т.е. амплитудно-частотная характеристика имеет единственный разрыв второго рода в точке и •= Х^. Доказательство. По условию теоремы р = Khk. Периодическое решение ищем направленным по вектору hk: q — ahk cosu;tf, где а — скалярная величина, определяющая амплитуду решения. Подставляя эти выражения для р и q в систему, находим а{К -uj2A)hk = Khk. Поскольку амплитудные векторы hk удовлетворяют условию \\Ahk = Khk, то из написанного соотношения получаем: откуда Теорема доказана. Особый характер направления, сопряженного главному, проявля- проявляется в том, что при сколь угодно малом отклонении направления вынуждающей силы от этого направления на амплитудно-частотной характеристике появляются в общем случае п точек разрыва. Рассмотрим главные направления вынужденных колебаний. Определение. Пусть q = h cos ut — частное решение системы Aq + Kq = р cos ut. Главным направлением вынужденных коле- колебаний будем называть такое направление р, которое совпадает с направлением отклика системы на периодическое возбуждение: h = up,
184 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ где v — скаляр, определяющий амплитуду колебаний. Посколь- Поскольку вектор h связан с вектором р в общем случае формулой [К - uj2A)h = p, то главные направления вынужденных колеба- колебаний должны удовлетворять системе (К -и2 A- /i?)/i = 0, т.е. вектор, определяющий главное направление, является собствен- собственным вектором матрицы К — и2А, а величина, обратная амплитуде колебаний /i = i/, представляет собой собственное значение (Е — единичная матрица). Это собственное значение является корнем уравнения det{K -и2 А- цЕ) = 0. Поскольку матрица К—и2А симметрическая, то написанное урав- уравнение содержит ровно п вещественных решений. Так как А и К — положительно определенные матрицы, то существует ит\п такое, что К - и2А — также положительно определенная матрица для всех и из интервала 0 < и < ит\п. Наряду с этим существует ^тах такое, что К — и2А — отрицательно определенная матрица для всех и из интервала u>max < и < оо. Первый случай называется дорезонансным, для него все /х отрицательные. Поскольку при переходе от отрицательных значений к положительным \х проходит через ноль, то и>т\п и ^тах совпадают с наименьшим и наибольшим значениями корней уравнения det(A'-w2i4) = 0. Каждому решению уравнения det(/i— и2А — цЕ) = 0 относитель- относительно /х соответствует собственный вектор /i, являющейся решением соответствующей однородной системы. Уравнение для нахождения \х определяет неявную функцию /x(cj2), имеющую п ветвей. Свойства этой функции устанавливает следующая теорема. Теорема. Каждая из ветвей функции /x(cj2) является монотонно убывающей, имеющей ровно один ноль на интервале и2 Е [0, оо). Доказательство. Систему для нахождения h умножим скалярно на вектор h : (Л, Kh) - cj2(/i, Ah) - /i(/i, A) = 0. В этом уравнении векторы Л, представляющие собой решение системы (-Аи/2 + К - fiE)h = 0, сами являются функциями и2, поэтому, дифференцируя его по и2) имеем ( dk т'Л ,L А^ О 2 ( dk АЛ dH /L L4 О ( dk Л П
§ 40. КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ 185 Поскольку в этом уравнении члены, содержащие dh/du2, в силу системы в сумме обращаются в ноль, то оставшиеся члены дают dfi _ (Л, Ah) &J2 "" ~ (Л, А) ' В силу положительной определенности А отсюда следует, что dfi/du2 < 0. В полученной формуле для производной dfi/duj2 каждый соб- собственный вектор h определяет производную от соответствующего именно ему собственного значения /i. Если же при каком-то и2 воз- возникает случай кратных корней уравнения det (К — и2А — }лЕ) = 0, то в силу симметричности матрицы К — и2А собственные числа оста- остаются дифференцируемыми функциями и2, и формула для d^/du2 остается верной, однако она требует специального выбора соб- собственных векторов из собственного подпространства, отвечающего кратному корню. Монотонное убывание функции ц(и>2) доказано. Заметим далее, что /i@) > 0, поскольку /х@) — собственные числа матрицы А'. С другой стороны, Пт^з.^ fx(u>2)/u>2 < 0, посколь- поскольку этот предел совпадает с собственными числами матрицы —А. Монотонно убывающая непрерывная функция, имеющая на концах интервала значения разных знаков, имеет один ноль внутри этого интервала. Теорема доказана. На рис. 63 изображена произвольная ветвь функции /i(^2). Вели- Величина |j/(u;2)| = l/^u;2)! представляет собой амплитудно-частотную характеристику главных выну- вынужденных колебаний механиче- ^' ской системы. Из изложенного следует, что любая система Aii + Kq = рcosut имеет ровно п амплитудно- частотных характеристик глав- главных колебаний, каждая из ко- которых имеет единственный раз- разрыв второго рода. Это означает, что если систему с п степенями свободы возбудить вдоль глав- главного в определенном выше смы- смысле направления, то при изме- изменении и от 0 до оо в системе наблюдается один резонанс. Как и в случае возбуждения вдоль сопряженного направления, система ведет себя как одномерная. Пример. Построить амплитудно-частотные характеристики глав- главных вынужденных колебаний в колебательной системе с двумя рис 12 Зак 233
186 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ степенями свободы: 2 0 0 1 9i 92 2 -1 -1 2 91 92 Pi п COS С<Л. Решение. Система для определения главных направлений вы- вынужденных колебаний имеет вид ||2-2cj2-/i -1 Приравнивая ее определитель нулю = 0. находим ветви функции /i(cj2): 1 Mi, 2= ~D-3w2± Соответствующие этим собственным значениям собственные векторы имеют вид Если сила р единичной нормы направлена по какому-либо из этих векторов, то и отклик системы будет направлен по этому же вектору: 92 \Р2 cosut. Скаляр v — l//i и есть амплитуда колебаний в этом случае. То есть амплитудно-частотные характеристики двух главных направлений имеют вид  = Точки разрыва этих характеристик (резонасы) 2 3 4- v3 2 3 — v3 совпадают с собственными частотами соответствующей однородной системы.
§ 41. СПЕКТРАЛЬНЫЕ СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ 187 Полученные в настоящем пункте результаты представим следу- следующей таблицей: — pCOSUJt Главные направления колебаний h, Сопряженные направления h Главные направления возбуждения р Определяющие соотношения (к - х2а)н = 0 h Kh p (К - ь>2А - цЕ)р = 0 Периодическое решение q = hcosXt хЧ р q = — COSivt Свойства ортого- ортогональности А - ортогональность: А~ - ортогональность: (л*, л-Ч')-0, Е - ортогональность: § 41. Спектральные свойства линейных систем Будем рассматривать линейные системы следующего вида: где матрицы А и К — симметрические и положительно определен- определенные, Г — кососимметрическая матрица гироскопических сил. Системы этого вида представляют собой самый общий вид линейных колебательных систем, т.е. таких систем, общее решение которых может быть составлено из гармонических колебаний. Это означает, что независимые частные решения можно искать в виде q = hexXt с вещественными Л. Покажем это. Подставляя это решение в рассматриваемую систему, находим: Умножая полученное равенство на комплексно-сопряженный вектор Л, получим следующее скалярное равенство: -\2h • Ah + tA/i • ГЛ + h - Kh = 0. 12*
188 ГЛ. 10 МАЛЫЕ КОЛЕБАНИЯ Заметим, что, в силу свойств симметрии матриц Л и А' и косой симметрии матрицы Г, имеем h Ah = /i1 • Ah1 + h2 • Ah2 = a {h = /i1 + iTi2), h-Kh = hl .Khl + h2-Kh2 = kt A • ГА = 2ihl • Г/i2 = 2igt где a,/:,^ — вещественные числа, причем a > 0, к > 0. Из найденного квадратного уравнения выводим откуда и следует вещественность Л. Корни Л находятся из характеристического уравнения det(-A2A + iAr + /С) = О, имеющего 2п корней. Если Л = Ло — корень этого уравнения, то Л = — Ао — тоже корень. Это следует из того, что K) =det{-\2A + i\T + K)T = det (-A2A- г Таким образом, у характеристического уравнения с гироскопи- гироскопическими силами всегда есть п положительных корней, которые и являются собственными частотами системы. 1. Поведение собственных частот при изменении жесткости или массы. Систему п линейных уравнений с комплексными коэф- коэффициентами (—А2Л 4- *'АГ + K)h = 0 можно заменить системой 2п уравнений с вещественными коэффициентами посредством введения 2п-мерного вектора г, первые п компонент которого есть веществен- вещественная часть вектора /г, а оставшиеся п компонент есть мнимая часть вектора Л: Соответствующая вещественная система имеет вид (ТА2 + GX- V)r = О, Т = \А 0 О А Гг. "= к о о к Наряду с механической системой Aq + Tq + Kq = 0 можно рас- рассматривать механическую систему вдвое большей размерности, в
§ 41. СПЕКТРАЛЬНЫЕ СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ 189 которой уже нет гироскопических сил и матрица потенциальной энергии которой отрицательно определена: d d(s} Ts) д{ё, Gs) д(8, Vs) __ dt ds ds ds " Разыскивая ее решение в виде s = reA?, мы и приходим к написанной выше системе для нахождения г. Некоторые свойства решений этой системы устанавливает сле- следующая лемма. Лемма 1. Пусть Ао — корень уравнения det(-A2A-f +1ХГ+К) = = 0, а г+ — решение системы (TA2-fGA — V)r = 0, соответствующее этому корню. Тогда существует такое решение г_ у этой системы для А= — Ао, что имеют место следующие равенства: 1) г+ • Тг+ = г_ • Тг_ , г+ • Vr+ - г_ • Vr-; 2) r+ Gr+ + r_ Gr_ = 0. Доказательство. Покажем, что всем условиям удовлетворяет вектор r_ = Er+l E=KQ _} (Е — единичная п х п матрица). Проверка того, что г_ в этой форме действительно является решением, основывается на очевидных равенствах ЁТЁ = Т, EVE = = V, EGE — — G, в силу которых имеют место и свойства 1) и 2). Характеристическая функция. Скалярно умножая на г систему (ТА2 + GA - V)r = 0, получим г • ТгА2 + г • GrA - г • Vr = 0. (*) В дальнейшем удобно иметь дело не с А, которая может быть как положительной, так и отрицательной, а с А2, которую обозна- обозначим буквой /i = А2. Для этой переменной из написанного выше уравнения следует (г • TrJfx2 - [2(г • Тг){г • Vr) + (г • GrJ]/i + (г • VrJ = 0. Будем рассматривать это уравнение как неявную функцию /i(r). Лемма 2. Решения системы (ТА2 + GA - V)r = 0 и только они являются критическими точками (max, min или точка перегиба) функции /л(г). Доказательство. Продифференцируем промежуточное соотно- соотношение (*) по г: A2Tr + \Gr -Vr+ \{r • Tr)A + ^r • Grl ^ = 0.
190 ГЛ. 10 МАЛЫЕ КОЛЕБАНИЯ Покажем, что г • TV A -f (l/2)r • Gr ф О для г ф 0. Пусть это не так, тогда _ 1 го 2 2 r0 • Тг0 для некоторого г0 ф 0. Подставляя это равенство в (*), получим что невозможно в силу положительной определенности Т и V. Следовательно, dX/dr обращается в ноль только для таких г, которые являются решениями системы \2Tr-\-\Gr—Vr = 0. С другой стороны, поскольку А(г) ф 0, если г ф 0, то и dfx/dr = 2XdX/dr обращается в ноль там же, где и dX/dr. Лемма 3. Функция fi(r) (каждая из ее ветвей) — монотонно возрастающая функция потенциальной энергии, т.е. если имеются две механические системы с одинаковыми TkGhcVhV такими, что г • Vr < г • Vr для любого г ф 0, то fi{r) < f*{rf). Доказательство. Выпишем характеристическую функцию в явной форме, введя для простоты обозначения г Тг = г, г -Vr = v) г - Gr =: д: _ 2rv + д2± у/д2 4- 4туд Дифференцируя, получим dfi/dv > 0 для г ф 0, так как ту > 0. Характеристическая поверхность. Будем считать, что в R2n определена метрика при помощи квадратичной формы (г, Тг): Рассмотрим в этом пространстве гиперповерхность П, определяемую уравнением ||r||4/i(r) = 1- (г • GrJ - (г, VrJ{r • ТгJ + 2(г • Tr){r . W) = 1. Это уравнение определяет замкнутую поверхность восьмого по- порядка. Луч, выпущенный из начала координат в любом направле- направлении, пересекает ее в двух точках, соответствующих разным знакам в выражении для /i. Вектор го, удовлетворяющий системе (ТА2 + GX - V)r = 0 и имеющий длину |Ао | 1у^2, где Ао — соответствующее этому вектору значение А, принадлежит П. Длину такого вектора будем называть главной полуосью поверхности. Будем различать в дальнейшем две ветви П: ветвь, соответствующую верхнему знаку в (**), обозначим П+, ветвь, соответствующую нижнему знаку, — П_. Аналогичные обозначения введем и для ветвей /i(r): /i+(r) и /i-(r).
§ 41. СПЕКТРАЛЬНЫЕ СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ 191 Лемма 4. Поверхности П+ и П_ имеют одну и ту же систему главных полуосей. Доказательство. Рассмотрим (**) и, опираясь на лемму 1, получим А+(г+) = А_(г_), А+(г_) = А_(г+). Отсюда следует, что линейно-независимая система система решений г может быть раз- разбита на две подсистемы ri, -.., гп и г?, ..., С такие, что /i+(r-) = А?, и /i-(r") = А?, откуда и вытекает утвер- утверждаемый факт. Будем считать, что для введенной в лемме 4 системы векторов соответствующие характеристические числа расположены в порядке возрастания их модулей: Введем обозначения для главных полуосей: Очевидно: а\ > п2 > • •. > ап. Поскольку каждая из ветвей П+ и П. обладает одной и той же системой полуосей, в дальнейшем достаточно рассмотреть одну из них. Рассмотрим для определенности П+. Покажем, что главные полуоси П+ обладают экстремальными свойствами. Пусть Ц2(п-т+1) — подпространство, определяемое векторами г'т) г'п, ..., г'п)г„ как базисными. Норма этих векторов меньше, или равна ат. Лемма 5. ат = max ||r|| для г Е П+ П Д2(п-т+1) Доказательство. Пусть на систему d д{ё, Те) | д{ё, Gs) d(s, Vs) = Q dt ds ds ds наложена дополнительная связь: s ? д2(п-т+1) Система с этой связью эквивалентна механической системе с 2(п — т + 1) чи- числом степеней свободы, для которой квадратичные формы (i, Ts), E, Gs)} E, Vs) равны ограничению соответствующих форм без связи на /^2(n~m+1)> Следовательно, и ограничение характеристической функции./i(r) на Д2(п~т+1) будет равно характеристической функ- функции системы со связью. У такой функции ровно 2(п — т + 1) критических точек. С другой стороны, векторы, составившие ли- линейную оболочку /^2(n~m+1)) очевидно, останутся критическими для ограничения характеристической функции на д2(г»-т+1)) а так как
192 ГЛ.10 МАЛЫЕ КОЛЕБАНИЯ их 2(п - m + 1), то они и только они удовлетворяют необходимым УСЛОВИЯМ ЭКСТремума фуНКЦИИ /х(г) ДЛЯ Г Е д2(п-т + 1) ПрИ ЭТОМ А^ — абсолютный минимум функции fx(r) на /J2(n-m+1)) откуда, в силу |M|2/i(r) = 1) следует, что ат — абсолютный максимум нормы радиуса-вектора поверхности П+ на Д2(п-т+!) Рассмотрим сечение поверхности П+ некоторым подпростран- подпространством R2m. Введем обозначение bm = min ||r|| для г ? R2m П П+. Лемма 6. Для любого R2m имеет место Ьт < ат и max bm = am. Доказательство. Пусть Д2(г»-т+1) — подпространство, фигу- фигурирующее в лемме 5. Поскольку суммарная размерность Я и д2(п-т+1) больше 2п, то эти пространства пересекаются. Пусть г G Я2т П Я2^-"-1) П П+ тогда ||г|| < ат в силу леммы 5. С другой стороны, ||г|| > Ьт, так как г G Я2т, откуда Ьт < ат. При этом очевидно, что max6m = ami R2rn так как верхняя грань достигается на подпространстве, являющемся линейной оболочкой г[} г'/, ..., г'т) г^. Теорема о поведении собственных частот при изменении жест- жесткости. Пусть даны две механические системы Aq + Tq + Kq = ti и Aq+Yq + K'q^ti. Систему будем называть более жесткой, если (<7, K'q) > (^, Kq) при любом q ф 0. Теорема. Собственные частоты менее жесткой системы не пре- превосходят собственных частот более жесткой. Доказательство. Из неравенства (q} K'q) > (q, Kq) следует неравенство (r,V'r) > (г, Vr), откуда, в силу леммы 3, А+(г) < A^(r) для всех г ф 0. Это означает, в силу равенства ||H|V(r) = 1> что характеристическая поверхность П'+ лежит целиком внутри П+. Рассмотрим сечение поверхностей П+ и П'+ подпространством R2m. Очевидно, bm > b'm) следовательно, max6m > max6'm, но max6m = am, а max6'm = а'т) откуда ат > а'т. Используя равенство ат = lAynl"/2, получаем |Ат| < |А^|, т — произвольно. Следствие 1. При Г = 0 доказанная теорема известна как теорема Релея.
§ 41. СПЕКТРАЛЬНЫЕ СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ 193 Следствие 2. Будем называть систему обладающей большей массой, если для любого q ф 0 ее кинетическая энергия больше: (<7> A'q) > {Я) Aq)- Имеет место следующая теорема: собствен- собственные частоты более массивной системы не превосходят собственных частот менее массивной: |Ат| > |А^|. Для доказательства достаточно показать аналогично лемме 3 монотонное убывание характеристической функции fi(r) при любом фиксированном г с увеличением энергии. Следствие 3. Требование положительной определенности ма- матрицы А' может быть заменено требованием неотрицательности: (г, Кг) > 0 при любом г. В самом деле, утверждение теоремы верно, когда некоторые из собственных чисел матрицы К сколь угодно малы. В силу непрерывной зависимости корней характери- характеристического уравнения от его коэффициентов утверждение теоремы верно и в пределе, т.е. для случая, когда некоторое количество собственных чисел матрицы К нулевые. Замечание. Доказанная теорема носит глобальный характер. Локальный результат, когда поведение частот изучается при малой вариации матрицы А", уже мог следовать из лемм 2 и 3. 2. Поведение собственных частот при изменении гироскопиче- гироскопической связи. Уравнения рассматриваемой колебательной системы перепишем в следующей форме: где выделен скалярный параметр д) определяющий норму матрицы гироскопических сил. Представляет интерес изучение поведения собственных частот при д —> оо. Введем следующие определения. Прецессионной частью рассматриваемой системы называется сле- следующая система (прецессионная система): gTq + Kq = 0. Нутационной частью рассматриваемой системы называется си- система Характеристическое уравнение как для прецессионной си- системы det (гХдТ + А") = 0, так и для нутационной системы det( — X2А + гХдГ) = 0 сохраняет свойства корней характеристиче- характеристического уравнения полной системы: все корни вещественные и входят парами отличающихся друг от друга знаком корней. У нутационной системы всегда есть не менее чем п нулевых корней. Количество ненулевых корней у нутационной и у прецес- прецессионной системы одинаково, и, если det Г ф 0, то их у каждой системы ровно п.
194 ГЛ.10 МАЛЫЕ КОЛЕБАНИЯ Заметим, что det Г ф О может быть только для систем, имеющих четную размерность: п = 2т. Действительно, detr = detrT = (-l)ndetr и, если п нечетно, то detF = O. Теорема. Если в линейной колебательной системе Aq + gTq+ +Kq = 0 матрица К положительно определена и det Г ф О, то собственные частоты делятся на две группы: 1) А* ~ 0, д -> со, 2) А, - 1/д, ^ -> со. Частоты первой группы при этом стремятся к ненулевым частотам нутационной системы, а частоты второй группы — к частотам прецессионной системы. Доказательство. Выполним замену времени (t —> г): t=l-r 9 и обозначим е = д~2. Характеристическое уравнение системы запишется при этом в виде det(-A2A + г'ЛГ-f еК) = 0. Рассматриваем это уравнение как неявную функцию Х(е). При е = 0 уравнение переходит в характеристическое уравнение нута- нутационной системы, у которого, в соответствии со сделанными выше замечаниями, т ненулевых корней: А", ..., AJ^. По теореме о неявных функциях, в случае, если среди А" нет кратных, корни полного уравнения можно искать в виде \к = А? + ак? + .... Точками обозначены члены с более высокими степенями е. Так как частное решение исходной системы имеет вид q = exp(iXkr) = exp[t^(AJJ + ак? + . . .)*], то первая группа собственных частот имеет вид • \k=g\»+*L + ... (*=1, .... m). 9 Если среди корней AJJ имеется кратный корень кратности р, то разложение следует искать не по степеням ?, а по степеням tfe.
§ 42. НЕЛИНЕЙНЫЕ СИСТЕМЫ 195 Результат оказывается тем же, хотя скорость стремления корней полной системы к корням нутационной будет меньше. Для рассмотрения второй группы частот выполняется иная замена времени: t = дт) после чего характеристическое уравнение принимает вид det {-е\2А + гЛГ + К) = 0. Рассуждения, аналогичные предыдущим, приводят к следующему виду собственных частот: Апр Ан Рис. 64 9 9° Теорема доказана. Если в условии теоремы det Г = 0 (для нечетномерных систем так будет всегда), то помимо указанных двух групп частот будет еще и третья, частоты которой имеют конечные, отличные от ну- нуля пределы при д —у оо. Суммируя все случаи, прихо- приходим к заключению. Если К поло- положительно определена, то при д —> —> оо частоты произвольной линей- линейной колебательной системы ведут себя следующим образом. Часть частот, называемых прецессионны- прецессионными, стремится к нулю: Л/с ~ 1/д, часть частот, называемых нута- нутационными, стремится к бесконеч- бесконечности: Л/с ~ д, часть частот, называемых маятниковыми, стре- стремится к конечным, не равным нулю пределам: Л/с ~ 1. Число прецессионных частот всегда равно числу нутационным частот, а число маятниковых частот равно разности между размерностью системы п и рангом матрицы гироскопических сил Г. Типичное поведение частот линейной колебательной системы при изменении интенсивности гироскопической связи изображено на рис. 64. § 42. Нелинейные системы. Метод нормальной формы Пуанкаре Метод нормальной формы Пуанкаре, применяемый для анализа нелинейных систем, не ограничен рамками колебательных механиче- механических систем. Применение его к собственно колебательным системам будет дано в следующем параграфе. Здесь же мы изложим его в общей постановке.
196 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Рассмотрим систему дифференциальных уравнений с аналити- аналитическими в окрестности нуля правыми частями: 2/1 =/i(yi, •-., Уп), Уп =/п(У1, •••, Уп)- Здесь у/с — комплексные переменные A < к < п). Будем полагать, что правые части в нуле обращаются в нуль, т.е. /fc@, .... 0) = 0 (Ы,...,п). Записанная в виде рядов по степеням переменных эта система имеет вид У\ = ]Iл (*) Уп =aniyi+ ... ^&? Суммирование ведется по всем положительным, целочисленным т/с, удовлетворяющим условию Y^k=\ тк > 2. Число а = Y^mk называется порядком нелинейного члена у™1, ..., у™п. Поставим задачу: найти такую аналитическую замену перемен- переменных (у\, .. ., уп) —> (zi, ..., zn), чтобы обратить в ноль максимально возможное число коэффициентов aij линейной части системы, а так- также и коэффициентов /^П1|...|Шп нелинейной части вплоть до любого заданного порядка а включительно. Вид системы, в котором до заданного порядка нелинейных членов никакое дальнейшее упрощение в классе аналитических замен уже невозможно, называется нормальной формой Пуанкаре до соответствующего порядка. Приведение к нормальной форме можно осуществить последо- последовательно, начиная с линейной части. После упрощения линейной части приступают к упрощению членов второго порядка, затем упрощают члены третьего порядка и так далее вплоть до задан- заданного. Задача упрощения линейной части хорошо известна: линейным преобразованием она приводится к жордановой форме, в кото- которой матрица линейной части имеет отличными от нуля лишь две диагонали — главную, на которой стоят элементы, называемые собственными числами, и ближайшую к ней, на которой стоят либо нули, либо единицы. Будем считать, что наша система уже упрощена по линейным членам (для механических колебательных систем это приведение
§ 42. НЕЛИНЕЙНЫЕ СИСТЕМЫ 197 к нормальным координатам, или к главным осям). Кроме того, примем вначале, что жорданова форма чисто диагональная: 1-гппУ?1 -УпП (*=1, ...,П). Суть применяемой процедуры нормализации полностью и во всех деталях выясняется при рассмотрении одно го-единстве иного нелинейного члена в одном уравнении из п уравнений системы Уз =А5у5, зфк, Здесь уже mi, ..., тп фиксированы. Так получается потому, что преобразование, изменяющее этот член, можно выбрать так, чтобы оно не меняло никаких членов низ- низшего порядка, а также и никаких других членов этого же порядка. Нужное преобразование имеет вид (yi, ... ,yn) -> [z\y ... , zn): ys=zs {вфк), т.е. нелинейный член в преобразовании берется точно такого же вида, как и подлежащий уничтожению. Прежде чем внести это преобразование в преобразовываемую систему, запасемся обратным преобразованием, которое с точно- точностью до членов более высокого порядка отличается от прямого преобразования лишь знаком перед нелинейным членом: zk = Ук - hky^ ... у™" + ... Если нас интересует выполнение лишь одного шага, т.е. устране- устранение рассматриваемого члена и появляющиеся при этом члены более высоких порядков нас уже не беспокоят, то в обратном преобра- преобразовании достатоточно ограничиться выписанными членами. Если же мы предполагаем продолжить процедуру дальше, то обращение преобразования следует выполнять с большей точностью. Дифференцируя обратное преобразование, получаем Подставляя сюда вместо ук правую часть системы, а вместо ук его выражение через zk) находим: zk = \kzk + [/* - (-Afc 4- ml\l + .. . + mn\n)hk)z?1 . .. z?n 4- . ..
198 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Для того чтобы устранить рассматриваемый нелинейный член, следует выбрать hk из условия fk hk = f -Л/с -hmiAi + ... + тп\п ' Это возможно, если А/с ф rn\\\ + ... + тп\п. Нелинейный член в к-м уравнении, у которого показатели т\, ... , тп таковы, что А/с = miAi ¦+¦ . • • + тппХП) называется резонансным. Резонансные члены не могут быть уни- уничтожены никакими полиномиальными заменами, они вообще не изменяются при таких заменах. Устранение нелинейных членов одного порядка в общем случае осуществляется для каждого члена независимо от других: Ук = zk ¦ Суммирование распространено на все т\, . . ., тп рассматриваемого порядка т\ + ... + га„ = а. Поскольку все нелинейные члены одного порядка малости пребразуются независимо один от другого, то найденная выше формула для hk справедлива и в общем случае: ... +mnAn* Таким образом, нормальная форма — это форма, в которой в разложении правых частей по степеням переменных присутствуют лишь резонансные члены. Рассмотрим теперь случай недиагональной жордановой формы. Пусть для простоты имеется только одна жорданова клетка, соот- соответствующая двукратному корню У2 -> Уз =КУз {п > s > 2). Рассматривается присутствие одного нелинейного члена в первом уравнении. Как и ранее, из последующего будет ясно, что делать в общем случае. Вид замены для устранения имеющегося нелинейного члена такой же, как и в простом случае:
§ 43. СВОЙСТВА КОЛЕБАНИЙ НЕЛИНЕЙНЫХ СИСТЕМ 199 Поступая аналогично случаю простых корней, находим: ii = \izl + г2 + [fl - {-Xi + miAi + ... + mn\n)hl]z?1 ... z™*- -hlmxz^l-lz^lz^ ... z™» + ... По-прежнему в нерезонансном случае, т.е. когда -Ai + miXi + . .. + тп\п ф О, можно устранить член г™1, . . . , z™n, однако появляется новый член того же порядка \ -1 Очевидно, что этот член тоже нерезонансный и его можно устра- устранить очередным преобразованием. При последовательном выпол- выполнении этих процедур степень первого сомножителя будет убывать, а второго — расти. Повторив процесс нужное число раз (равное степени первого сомножителя), получаем член вида 2 3 . . . Zn который уже устраняется без появления новых членов того же порядка. Рассмотрение случая произвольного набора жордановых клеток уже не встречает принципиальных затруднений. При применении этой процедуры на практике все указанные элементарные преобра- преобразования выполняются одновременно. Нами доказана (с указанием конструктивной процедуры приведения) Теорема Пуанкаре-Дюлака. В классе полиномиальных замен конечного порядка любая система вида (*) приводима к виду, в котором все члены до соответствующего порядка включительно резонансны. § 43. Свойства колебаний нелинейных систем 1. Нелинейная диссипация энергии колебаний. Рассмотрим ко- колебания одномерного осциллятора, на который действует диссипа- тивная сила, нелинейно зависящая от скорости: о ?+ -ех3 + х- 0 (е > 0). о Запишем это уравнение в виде системы в нормальной форме Коши: i 3
200 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Для приведения линейной части к диагональному виду введем обозначения: z = х + гу, z = х — гу. В этих переменных имеем i = -12: + \e(z3 - 3z2z + З222 - f3). о Уравнение для z является сопряженным к написанному, поэтому выписывать его не обязательно, хотя его присутствие будет иметься в виду. Теперь наш осциллятор записан в виде, к которому может быть применен метод нормальной формы Пуанкаре. Поскольку Ai = — —г, Аг = г, то в правой части написанного уравнения присутствует только один резонансный член z2z (для него Ai = 2Ai + A2). Поэтому нормальная форма Пуанкаре второго порядка имеет вид i = — iz — ez2z. Переменная, удовлетворяющая этому уравнению, отличается от переменной, удовлетворяющей исходному уравнению, как это сле- следует из доказательства теоремы Пуанкаре-Дюлака, квадратичными членами. Поэтому, с точностью до этих членов, приближенное ре- решение точного уравнения можно получить, решая его нормальную форму*. Нерезонансные члены оказывают меньшее влияние на решение, чем резонансные. Нормальная форма легко решается. Умножим написанное урав- уравнение на г, а сопряженное ему на z и сложим: Отсюда С ZZ — 2eCt' где С — значение zz} в начальный момент времени С = Подставляя это решение в i = —iz — ez(zz) и интегрируя, получаем * Более строгое утверждение о соответствии точных и приближенных ре- решений дается теоремой Боголюбова, в силу которой приближенное решение стре- стремится к точному при е -> 0 для любого t из интервала [0, l/e] (теорема сформу- сформулирована для метода осреднения, представляющего собой разновидность метода нормальной формы).
§ 43. СВОЙСТВА КОЛЕБАНИЙ НЕЛИНЕЙНЫХ СИСТЕМ Или, возвращаясь к переменным я, у, имеем zocostf — уо sint х =¦ 201 Полученное решение показывает, что характер затухания ко- колебаний при t —> оо уже не имеет экспоненциального вида, как это было в линейном случае. Нелинейные диссипативные силы приводят к затуханию степенного вида, т.е. к более "вялому", чем линейные. 2. Автоколебания, Автоколебаниями называются изолирован- изолированные, асимптотически устойчивые периодические решения автоном- автономных систем дифференциальных уравнений. Отличие автоколеба- автоколебаний от вынужденных колебаний за- заключается в следующем. В систе- ==i мах с диссипативными силами поддер- поддержание периодических колебаний осу- осуществляется посредством приложения периодических внешних сил. Это про- проявляется в том, что дифференциаль- дифференциальные уравнения, описывающие такие системы, являются неавтономными, периодически зависящими от времени. В автоколебательных системах внешних периодических сил нет. Поддержание периодических колеба- рис б5 ний в них осуществляется за счет стационарных внешних, или внутренних источников энергии, бла- благодаря особому механизму взаимодействия их с самой системой. Типичным примером автоколебательной системы являются механи- механические часы. В них стационарный источник энергии — внутренний. Древнейшим примером автоколебательной системы является танталов сосуд (рис. 65). Вода медленно поступает в сосуд из источника с постоянным расходом. При достижении уровня /i2 она быстро истекает через боковой патрубок до уровня h\. Процесс периодически повторяется. Простейшим математическим примером автоколебательной си- системы является уравнение Ван-дер-Поля i- = 0, приближенно описывающее колебательный процесс в ламповом ге- генераторе.
202 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Как и в предыдущем примере, от системы i = У» у = -х - 2бA - 4х2)у, посредством замены переменных z = х -f iy) z = х — iy, приходим к системе i = -iz - е[1 - (z + zJ](z - г), I = iz - е[1 - (z + zJ](z - z), в которой Ai = —i, A2 = г и резонансный член в первом уравнении имеет вид z2z. Следовательно, нормальная форма первого приближения есть z = —iz — e(z — z2z)f z = iz — e(z — z2z). Решение этих уравнений осуществляется как и в предыдущем случае, т.е. умножая первое уравнение на z, а второе на z и складывая, получим: 1(«) = -2е[« - (z-zJ}. Общее решение этого уравнения имеет вид zz = zo*o + A — zozo)e2ct' Подставляя это решение в исходную систему и интегрируя получающиеся линейные уравнения, находим: z — — ¦ , у ZqZq + \1 — ^O^oJ6 Или, возвращаясь к исходным переменным: х0 cos t + yo sin < x = Это решение показывает, что у уравнения Ван-дер-Поля имеется единственное периодическое решение с начальными условиями: х§+ +Уо = 1 и с амплитудой, равной единице. Все остальные решения стремятся к нему асимптотически при t —>> 00, если е < 0.
§ 43. СВОЙСТВА КОЛЕБАНИЙ НЕЛИНЕЙНЫХ СИСТЕМ 203 Найденное периодическое решение в этом случае и представляет собой автоколебательный процесс. 3. Вынужденные колебания. Вынужденные колебания нелиней- нелинейного осциллятора мы рассмотрим на примере уравнения Дуффинга х + ах -Ь Ьх + сх3 = d sin ut, в котором нелинейная восстанавливающая сила представлена ку- кубическим двучленом. Целью следующего ниже анализа является выяснение вопроса о том, какие изменения претерпевает амплитудно-частотная ха- характеристика линейной системы, изображенная на рис. 59, при появлении в уравнении нелинейного члена сх3. Для удобства дальнейших выкладок слегка изменим обозначения входящих в уравнение параметров: а = 2Л, 6=1 — 2Д, с = 8е/3, d = 2/i. Вели- Величина Д называеся расстройкой частот. Если единицу измерения времени выбрать так, чтобы ы = 1, то при Д = 0 в линейной системе наблюдается резонанс. Зависимость амплитуды установив- установившихся колебаний, имеющих период внешней силы, от растройки Д и будет представлять собой форму записи амплитудно-частотной характеристики. Решать написанное нелинейное дифференциальное уравнение мы будем методом нормальной формы Пуанкаре, для чего перепишем исходное уравнение в виде системы i =У, о у = - жA - 2Д)-2Лу- -ex3 + 2ficost. о Выше нормальная форма Пуанкаре излагалась и применялась для автономных систем дифференциальных уравнений. Рассматри- Рассматриваемая теперь система неавтономна. Однако и ее можно записать в автономной форме, если ввести вспомогательный осциллятор и + и = 0. Его решение при начальных условиях tx(O) = 1, й@) = О имеет вид и = cost, совпадающий с видом приложенной к исходно- исходному нелинейному осциллятору силы. Поэтому написанная система эквивалентна следующей: х =у, у = -хA - 2Д) - 2Лу - -ex3 + 2/iu, о и =v, t> = —ti, n@) = 1, v@)=0. Эта система автономна и к ней применяется метод Пуанкаре. По-прежнему удобно использование комплексных переменных z = = х + гу, w = и + iv, в которых написанная система принимает вид г = - гA - A)z Н- г'Дг - h(z - z) - -гф + гK + t/x(iy + tD), о
204 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ Уравнения для сопряженных переменных z и w являются со- сопряженными к написанным. Характеристические числа "невозму- "невозмущенной" части системы (т.е. системы при A = h = e = fi = Q) имеют вид А] = А2 = —г, A3 = A4 = г. Первые два относятся к выписанной системе, вторые два — к сопряженной. В соответствии с этим нормальная форма первого приближения такова: z = — гA — Д)г — hz — iez2z + i/iio, w = — iw, w@) = 1. Если решение этой системы искать в виде z = zoexp(-i/), w = woexp(—it), то для переменных zo(t) и wo(t) получаются уравнения - hz0 - i% г/i, w0 = 0. Решение будет периодическим, если z0 = const и w0 = const. Это приводит к уравнению для нахождения zo: г'Дго — hzo — iez^zo H- г/i = О, откуда, обозначая квадрат амплитуды Л2 = zoz"o = Zq + Уо, нах°Дим: i Д — Л - ieA2 ' г'Д -f ft — Перемножая эти равенства друг на друга, имеем Получено уравнение, определяющее в неявной форме ампли- амплитудно-частотную характеристику А(А). Она может быть разрешена явно относительно Д:
§ 43. СВОЙСТВА КОЛЕБАНИЙ НЕЛИНЕЙНЫХ СИСТЕМ 205 Семейство амплитудно-частотных характеристик (параметром се- семейства рассматривается амплитуда внешней силы /*), построенное по этой формуле, изображено на рис. 66. Основное отличие полученной характеристики для вынужденных колебаний нелинейного осциллятора от линейного случая, изобра- изображенного на рис. 59, состоит в наклоне резонансного пика вправо (для е > 0). В результате этого на оси частот появляется зона Рис. 66 Рис. 67 (от А\ до Дг), внутри которой у осциллятора возможно существова- существование трех значений амплитуды установившихся колебаний (рис. 67). Сами значения А\ и Дг обладают тем свойством, что при сколь угодно малом отклонении Д от них состояние системы может изменяться на конечную величину. Такое явление называется "би- "бифуркацией", а значения Дх и Дг — бифуркационными значениями параметра Д. Изучим устойчивость найденных режимов установившихся ко- колебаний. Для этого введем малое отклонение Szo от стационарного значения zq и на основе системы (*) запишем систему уравнений в вариациях 6z0 =(г'Д - h - 2ieA2Nzo - i 6z0 =(-iA - ft + 2ieA2Mz0 Характеристический определитель этой системы ,"Д - h _ 2ieA2 - Л -гД - Л + 2ieA2 - Л = Л2 + 2ftA + ft2 + {ЪеА2 - А){еА2 - Д) = О
206 ГЛ.10. МАЛЫЕ КОЛЕБАНИЯ позволяет выписать условия асимптотической устойчивости: ft > О, Л2 + (ЗеА2 - А){еЛ2 - Д) > 0. Наиболее существенным условием является второе. Оно не за- зависит от /1 и в переменных (Д, Л2) представляет собой гиперболу, изображенную на рис. 66 и отделяющую область устойчивости от области неустойчивости (последняя заштрихована). Асимптотами гиперболы являются две прямые Д = ЗеЛ2 и Д = еЛ2. Если продифференцировать по Л2 функцию (¦*) и приравнять производ- производную нулю, то можно убедиться, что геометрическое место точек, в которых семейство амплитудно-частотных характеристик имеет вертикальные касательные, совпадает с найденной гиперболой. Таким образом, из трех возможных значений амплитуды уста- установившихся колебаний устойчивым колебаниям соответствуют наи- наибольшее и наименьшее значения, а неустойчивым — среднее.
Часть V Однопараметрические группы Ли Глава 11. Элементы локальной теории § 44. Понятие группы Пусть G обозначает множество элементов произвольной приро- природы (множество чисел, или функций, или каких-нибудь объектов геометрической природы и т.п.). Множество G называется группой, если: 1) На множестве G определена операция, которая любым двум элементам из G: A Е G и В ? G, взятым в определенном поряд- порядке, ставит в соответствие единственный элемент С Е G. Будем называть условно эту операцию умножением и записывать ее так: А о В = С. Операция, вообще говоря, некоммутативна, т.е. А о В ф В о А, что и определяет понятие порядка выбора элементов в произведении. 2) Существует элемент Е, такой, что для любого А Е G имеет место АоЕ = ЕоА = А. Этот элемент называется единицей группы. 3) Для любого А Е G существует элемент Л", такой, что А о А =Г1оЛ = ?. Этот элемент называется обратным элементу А. 4) Имеет место ассоциативность операции: А о (В о С) = {А о В) о С для любых Л, В, С из G. Примеры групп. 1. Множество всех рациональных чисел без нуля. Операция — арифметическое умножение. 2. Множество всех векторов на плоскости. Операция — сложе- сложение. 3. Любое конечное число элементов с операцией, задаваемой таблицей Кейли (в примере 5 элементов): о А В С D Е А В С D Е А В С D Е А В С D Е А В С D Е А В С D Е А В С D Е
208 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ 4. Множество всех точек, лежащих на окружности. Операция — точке Л, положение которой на окружности определено углом </>д, и точке В с углом крв ставится в соответствие точка С, положение которой определяется суммой углов <РС = Ч>А + <РВ • 5. Множество матриц п х п с неравным нулю определителем. Операция — матричное умножение. Примеры не групп, когда определенная на множестве операция не удовлетворяет каким-то из свойств 2-4. 1. Множество целых чисел. Операция — умножение. 2. Множество векторов в трехмерном пространстве. Операция — векторное произведение. § 45. Группа Ли. Примеры Нетрудно заметить, что в примерах 1, 2, 4, 5 на множестве элементов, составляющих группу, можно совершенно независимо от аксиом группы ввести понятие близости между любыми двумя элементами, в силу которого групповые операции оказываются непрерывными функциями, что позволяет на такие группы (они называются топологическими) смотреть одновременно с двух точек зрения: с точки зрения алгебры и с точки зрения анализа. Такое объединение оказывается весьма плодотворным. Это и используется самым существенным образом в теории групп Ли. В настоящее время под термином групп Ли понимают более широкий объект, чем тот, который ввел сам Ли и который и будет рассматриваться далее нами. Под множеством G, на котором вводится операция, удовлетво- удовлетворяющая аксиомам группы, будет пониматься множество преобра- преобразований n-мерного вещественного арифметического пространства в себя: ' ) (<? € Яп). Переход от одного преобразования к другому осуществляется изменением параметра а. Если параметр скалярный, то множе- множество преобразований называется однопараметрическим. Параметр может быть векторным: а Е Rk. Размерность этого вектора и определяет размерность множества преобразований. При этом все ai,...,a^ должны быть существенными, т.е. несводимыми при помощи преобразований к меньшему числу. Операция, вводимая на множестве преобразований q' = Q(q, a), есть композиция двух преобразований. Пусть, например, после преобразования q —> q' с некоторым фиксированным а выполняется преобразование q' —> q" с некоторым фиксированным 6: q"=Q(q',b).
§ 45. ГРУППА ЛИ. ПРИМЕРЫ 209 Если композиция преобразований, определяющая преобразование " есть преобразование из того же самого множества (отвечающее какому-то другому значению параметра с), т.е. то это и означает, что на рассматриваемом множестве преобразо- преобразований определена операция (композиция двух преобразований из множества не выходит за пределы этого множества). Для того чтобы не интересоваться областью определения функ- функций q' = Q(q, a) как по переменной q} так и по параметру а, пред- предполагают, что преобразования определены на некотором открытом множестве из Rn и в достаточно малой окрестности некоторой точки а. Тем самым функция q1 = Q[q) о) определяет локальное семей- семейство локальных преобразований. Определение. Множество преобразований q' = Q(q, a) называется локальной группой преобразований Ли (в дальнейшем коротко: группой Ли), если: 1) Композиция любых двух преобразований определяет операцию на этом множестве, т.е. есть преобразование из этого же множества. 2) Рассматриваемому множеству принадлежит тождественное преобразование (единица группы). Значение параметра а, определя- определяющее тождественное преобразование, будем обозначать буквой е. 3) Для любого преобразования из множества существует обрат- обратное, принадлежащее этому же множеству, такое, что их композиция дает тождественное преобразование. 4) Функция q' = Q(q, a) является аналитической по переменным q и а в некотором открытом множестве изменения q и в некоторой окрестности единичного элемента е для переменной а. Заметим, что требование ассоциативности операции, необходи- необходимое при общем определении группы, здесь излишне, поскольку композиция преобразований этому свойству, очевидно, удовлетво- удовлетворяет. Важнейшие примеры групп Ли. 1. Группа трансляций: q' = q + a. Здесь размерность параметра а такая же, как и переменной q. 2. Группа растяжений: q[ = a^,- (i = 1, . .., п). Если а{ = а — скаляр, не зависящий от г, то группа называется группой подобия. 3. Группа вращений: q[ = ^2j aij9j> гДе А = {aij} — ортогональ- ортогональная матрица АТ = А. Принято обозначение для этой группы — SOfa), что означает специальная, ортогональная, действующая в йп. 15 Зак. 233
210 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ 4. Группа линейных преобразований: q[ = ^2-o.ijqj при det А ф ф 0. Обозначение GC(n) — общая, линейная. Если дополнительно потребовать det А = 1, то получаем группу SC(n) — специальная, линейная. 5. Группа движений: q' = a+Aq, где Aq есть краткое обозначение Y2j QijQj и матрица А — ортогональная. 6. Аффинная группа: q' = а + Aq, где det А ф 0. 7. Проективная группа: , = ? «цц + б,' det/4, 6Л В стоящей под знаком детерминанта блочной матрице матрица А = {a,j} окаймлена столбцом из элементов 6,-, строкой из элементов dj и последним диагональным элементом 6. 8. Группа отображений, сохраняющих площадь (п = 2). 9. Группа Лоренца (запишем ее в двумерном случае с традици- традиционным обозначением переменных): , х — vt X — / . =. Групповая операция. Композиция преобразований q' = Q(g, a) g" = Q(9', b) определяет преобразование q" = Q(<7, с), в котором параметр с связан функционально с параметрами а и Ь: Эта функция, аналитическая в окрестности единицы (а = е и 6 = е), и представляет собой выражение групповой операции. В примере группы Лоренца групповая операция имеет вид vi + 1 + Vil>2 Связь прямого и обратного преобразований в терминах групповой операции такова: 7(а, а) =7(а~1, а) = е.
§ 46. ИНФИНИТЕЗИМАЛЬНЫЙ ОПЕРАТОР ГРУППЫ 211 § 46. Инфинитезимальный оператор группы. Алгебра Ли Предположим вначале, что а — скалярный параметр. Заменой переменной а —> \х\ а = е + /i добиваемся того, что тождественному преобразованию всегда соответствует \х = 0. Пусть в уравнении группы q' = Q(q, /i) мы имеем именно такой параметр. Разложим это выражение в ряд по степеням /i в окрестности нуля: я' = я + Ыя) + ••• Выписанная линейная по /i часть группы называется ядром группы. Пусть в пространстве переменных q задана некоторая скалярная функция F(q). Преобразования q —)• q' переводят функцию F(q) —»• F(q') = F[q + flT,(q) +...] = F(q) ^ Линейная по /i часть приращения функции F(q') имеет вид AF(q') = dq где U представляет собой линейный дифференциальный оператор первого порядка: 9 . ч д который называется инфинитезимальным оператором группы. Если группа многопараметрическая, то у нее столько операторов, сколько независимых параметров. Приведем выражения для инфинитезимальных операторов в перечисленных выше примерах групп Ли. 1. Группа трансляций: 2. Группа растяжений: (U - ^9»5/9g, — группа подобия). 3. Группа вращений. Рассмотрим малую окрестность единичной матрицы в множестве ортогональных матриц: А = Е + цАГ, где /! — малый скалярный параметр. 15*
212 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Из условия ортогональности [Е + fi/sff\E пренебрегая малыми второго порядка, находим N = -Мт. Сле- Следовательно, инфинитезимальные операторы группы вращения (в количестве п(п - 1)/2) имеют вид 4. Группа линейных преобразований: Uik =qi о— («',* = 1, -.., л). 5. Операторы группы движений представляют собой операторы трансляций и операторы группы вращений. 6. Операторы аффинной группы представляют собой операторы трансляций и операторы группы линейных преобразований. 7. Операторы проективной группы состоят из операторов аф- аффинной группы U'-dq: и операторов q~ д 8. Группа отображений, сохраняющих площадь (п = 2). Рассмо- Рассмотрим отображение, близкое к тождественному: Я\ = 9г), 92 = 92 Н- Условие сохранения площади имеет вид т.е. dq\ dq2 dq'2 dq'2 dq\ dq2 dqidq; •SI dqidq2 dq\ oq\ drj2 = 1,
§ 46. ИНФИНИТЕЗИМАЛЬНЫЙ ОПЕРАТОР ГРУППЫ 213 откуда с точностью до /i2, получаем: дщ 9. Группа Лоренца: дх Пусть m-параметрическая группа имеет т операторов: U\t ... ....Urn. Если все т параметров существенны, т.е. не могут быть заменами сведены к меньшему числу, то операторы линейно независимы (первая основная теорема Ли). Это означает, что не существует таких, не всех равных нулю чисел Ai, ..., Am, что Aif/i-f ... +Am[/m=0. В противном случае операторы называются линейно зависимы- зависимыми. Числа Ai, ..., Am при этом преполагаются независимыми от q. Линейная независимость этих операторов позволяет взять их в качестве базиса линейного пространства операторов, связанного с рассматриваемой группой. Любой элемент этого пространства есть оператор вида: U = \xUi+ ...+Am[/m, где Аь ..., Am — координаты оператора U в этом пространстве. В этом пространстве можно ввести операцию произведения опе- операторов. Пусть U и V — два оператора из рассматриваемого пространства. Введем произведение операторов, называемое комму- коммутатором, так: [[/, V) = UV - VU. Это означает, что действие оператора [[/, V] на некоторую функцию F(q) заключается в том, что нужно вначале подействовать на нее оператором V, после чего на полученную функцию подействовать оператором U и из результата вычесть то, что получается при действии на F(q) этих же операторов в обратном порядке: [U, V]F(g) = U{VF) - V{UF). Такое определение требует проверки нескольких фактов. Во- первых, будет ли оператор [[/, F) оператором первого порядка? Прямое вычисление показывает, что возникающие вторые производ- производные при вычислении U(VF) сокращается после вычитания V(UF). Если оператор U имеет вид
214 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ а оператор V имеет вид то оператор [U, V) получается таким: [U, V) = ? о,- &• где коэффициенты &i(q) = U?i(q) - Vrn{q). Во-вторых, будет ли оператор [С/, V) принадлежать рассматри- рассматриваемому пространству операторов, т.е. может ли он быть выражен линейной комбинацией исходных базисных операторов [/,•? Если заданы т произвольных линейно независимых операторов, то про- произведение любых двух из них вовсе не обязано выражаться ли- линейной комбинацией этих m операторов. Оказывается, что если эти m операторов являются операторами m-параметрической груп- группы, то произведение любых двух операторов из соответствующего этой группе пространства ему же и принадлежит (вторая основная теорема Ли): [UtV) = kxUi+ ... +ктит. В силу того, что введенное произведение очевидно обладает свойством дистрибутивности по сложению, т.е. [[/, V + W] = [Ut V] + [U, W}} то для нахождения констант к\} ... ,кт в случае произвольных U и V достаточно знать эти константы для базисных операторов: Константы C'j называются структурными константами группы и определяют группу полностью. В-третьих, важно знать, является ли введенное произведение корректным в следующем смысле. Говоря о преобразовании про- пространства или какой-то его области, мы выражаем это преобразова- преобразование с помощью координат q. Если пространство отнести к другим координатам, например г, то те же преобразования, выраженные в виде функции от координат, будут иметь иной вид. Иной вид будут иметь и операторы (правило преобразования оператора при замене переменных будет приведено в § 49). Зависит ли операция произведения операторов
§ 47. ОДНОПАРАМЕТРИЧЕСКИЕ ГРУППЫ 215 где а, = U?i - Угц, от того, в каких переменных она вычисляется? Другими словами, имеет ли значение, если вначале заменить в операторах переменные, а потом взять их произведение, или посту- поступить наоборот? Несложная выкладка показывает, что все равно. Введенное произведение не зависит от выбора системы переменных. Получившийся объект: линейное пространство операторов с введенной в этом пространстве операцией умножения называется алгеброй Ли. Алгебра Ли порождается группой Ли. Верно и обратное: если даны какие-то п линейно независимых операторов, таких, что ком- коммутатор любой пары есть их линейная комбинация, то они поро- порождают некоторую n-параметрическую группу Ли (вторая обратная теорема Ли). Заметим, что коммутатор по каждому из аргументов линеен, т.е., например: где а и 6 — скаляры. Кроме того, он кососимметричен: [(У, V] = -\V) U] и удовлетво- удовлетворяет тождеству Якоби {{U, V),W} + [[V, W],U] + [[W, U],V) = 0. Абстрактное определение алгебры Ли не связано ни с группами, ни с операторами и определяется посредством введения в линейном пространстве операции умножения билинейной, кососимметрической и удовлетворяющей тождеству Якоби. Пример: трехмерное вектор- векторное пространство с операцией векторного произведения есть алгебра Ли. Пример. Группа 5?B). Операторы dqi dq2 oqi Oq2 образуют базис трехмерной алгебры Ли со следующим правилом перемножения операторов базиса: ,[[/ь и2] = -?/з, [Uu Us) = 2UU [U2> U3) = -2U2. § 47. Однопараметрические группы. Теорема единственности В дальнейшем речь будет идти в основном об однопараметриче- ских группах. В предыдущем параграфе уже упоминалась вторая теорема Ли: всякая n-параметрическая группа порождает п-мерную
216 ГЛ. П. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ алгебру, и обратно: всякая n-мерная алгебра Ли операторов поро- порождает группу той же размерности. Теорема в случае п = 1 имеет нелокальный характер. Теорема. По заданному инфинитезимальному оператору U = — iLtiVid/dQ* группа q' = Q(q)fi) восстанавливается (с точностью до замены параметра ц) единственным образом. Иными словами, знание производной по /i функции в нуле определяет всю функцию полностью. (В случае функций, не имеющих отношения к группам, для построения функции, например, в форме ряда, необходимо знать все производные в нуле.) Доказательство. Рассмотрим малую вариацию параметра груп- группы /2 + i/i, приводящую и к малой вариации образа точки q: q' + 6q' = Подставим в правую часть этой формулы выражение для q: и воспользуемся групповым свойством Разложим групповую операцию 7(/i~1> A* + <$/i) в ряд по степеням 6ц: 7(/i,/i + */i) = 7(/*./*) + Г(/х)*/х + ... , где ^~1, /х) = 0 и 07(/*ii /*2)/0/*2 ПРИ РЧ = А*" и /i2 = /i. Таким образом, получаем Раскладывая функцию Q в ряд по i/i, находим q' + Sq' = q' + v( Переходя к пределу &ц -» 0, имеем Так как /i в этом соотношении произвольно и оно (это соот- соотношение) должно обращаться в тождество при подстановке в него q' = Q(q, fi), то это означает, что группа q' = Q(q, /i) может быть получена из этого соотношения, рассматриваемого как дифферен- дифференциальное уравнение с начальным условием q'\fi=0 = q. При этом единственность группы следует из теоремы о суще- существовании и единственности решения начальной задачи Коши, что
§ 47. ОДНОПАРАМЕТРИЧЕСКИЕ ГРУППЫ 217 в данном случае имеет место в силу аналитичности правых частей. Если заменить параметр /i —> г: то найденное дифференциальное уравнение приобретает вид Правая часть его определяется лишь оператором группы. Ре- Решая его, мы восстанавливаем группу полностью с точностью до указанной замены параметра. Теорема доказана. Замечание 1. Доказанная теорема означает, что между всеми одночленными группами в Rn и всеми автономными обыкновенны- обыкновенными дифференциальными уравнениями с аналитическими правыми частями существует взаимооднозначное соответствие (с точностью до несущественной замены параметра). Замечание 2. Параметр т = ^Y{yL)dyL носит название кано- канонического. Построение группы при помощи решения автономного дифференциального уравнения определяет эту группу автоматиче- автоматически через канонический параметр. Каноничность параметра состоит в том, что групповая операция для него имеет простейший вид гз = т\ + гг, а обратный элемент Пример. Найти групповую операцию и канонический параметр в группе подобия: Пусть q" = A + i/)q'. Тогда q" = A + /i + и + \xv)q и групповая операция 7(а*> у) = А* + v + № - Вычислим обратный элемент: Вычислим производную: Находим функцию F(/i): F(/i) = —, /i —> /i" и i/ —> /i, 14 Зак. 233
218 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ откуда F(/i) = 1/A Н- /i). Канонический параметр Выражение группы подобия через канонический параметр имеет вид Пример. Рассмотрим проективную группу на плоскости. Один из ее операторов имеет вид г, 2 д д Построим однопараметрическую подгруппу, порождаемую этим оператором. Дифференциальные уравнения, определяющие эту подгруппу, имеют вид Решение этой начальной задачи Коши и дает искомую подгруппу: Выбирая любой оператор из алгебры Ли операторов группы, можно построить таким образом все ее однопараметрические подгруппы. § 48. Уравнение Лиувилля. Инварианты. Собственные функции Пусть группа задана через канонический параметр г: и ей по доказанному выше эквивалентна система Вернемся к вопросу о преобразовании с помощью этой группы некоторой функции F(q). Если q —> qf} то F(q) -> F(q') = F[q + V(q)r +...] = F(q, r).
§ 48. УРАВНЕНИЕ ЛИУВИЛЛЯ. ИНВАРИАНТЫ 219 Определим производную этой функции по г: dF dF dq' dF . ,. rr ^ T = ni- = w^ = UF- Найдем связь преобразованной функции F(q, r) с исходной функ- функцией F(q) и оператором группы U. Ряд Тейлора для F(q, т)\ Последовательно имеем: т=0 и так далее. В результате искомую связь находим в виде ряда: F(q') = F(q, т) = F(q) + rUF(q) + ^U2F(q) + ... Этот ряд называется рядом Ли. Он может быть записан еще в такой форме: Ряд Ли и служит для определения операторной экспоненты. Дифференцируя ряд Ли по г, находим dF ~дт~'~ Уравнение носит название уравнения Лиувилля. Или, в более подробной записи: 8F ^ 8F Дополнив это уравнение начальным условием F(q, 0) = F(q), полу- получаем начальную задачу Коши для линейного уравнения в частных 14*
220 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ производных относительно искомой функции F(q> г), эквивалентную системе нелинейных дифференциальных уравнений: Эквивалентность понимается в следующем смысле. Если известно общее решение системы обыкновенных дифференциальных уравне- уравнений q' = Q(q, r), где q — начальные условия, то решение уравнения Лиувилля есть где функция F(q) определяет начальные условия для уравнения Лиувилля. Обратно, если известно решение начальной задачи Коши для этого уравнения: F[q> r), то, выбрав в качестве начальной функции F(q) = g, получим общее решение <7' = Q(<7,r) системы Указанная эквивалентность позволяет заменить изучение нели- нелинейной системы обыкновенных дифференциальных уравнений часто более удобным изучением линейного уравнения первого порядка в частных производных. Ряд Ли для частного вида функции F(q) = q позволяет записать выражения для группы в виде ряда Тейлора по г: г2 q' = q + rUq + — U2q + ... Пример. Восстановить группу вращений 50B) по ее оператору U - q2d/dqi - q\d/dq2. Последовательно находим: ~9i, U3q\ = -Uq\ = -q2, . • U2q2 = -Uqi = -q2) U3q2 = -Uq2 = qu . . . Следовательно, r2 r3 • • = 9i cos r + q2 sin r, r r 92 =92 - T9i - 7?2 + -jjj-91 + • • • = -9i sm r + 92 cos r. r2 r3
§ 48. УРАВНЕНИЕ ЛИУВИЛЛЯ. ИНВАРИАНТЫ 221 Определение. Функция G(q) называется инвариантом группы, если она не изменяется группой: G(q') = G(q). Ряд Ли показывает, что для того чтобы аналитическая функ- функция своих переменных была инвариантом группы, необходимо и достаточно, чтобы она была корнем оператора группы: UG(q) = 0 для любого q. Свойство инварианта. Пусть G(q) — инвариант, a F(q) — произвольная функция. Тогда U[G(q)F(q)] = F(q)UG(q) + G(q)UF(q) = G(q)UF(q), т.е. инвариант группы играет роль константы для ее оператора. Определение. Функция P(q) называется собственной функцией оператора [/, если UP(q) = X(q)P(q), где X(q) — инвариант, называемый в данном случае собственым значением, отвечающим собственной функции P(q). Если P(q) — собственная функция оператора [/, то она пре- преобразуется соответствующей этому оператору группой так: P(q, r) = G(q, T)P(q), где G{q) t) — инвариант группы при любом фиксированном г: 2! w ' "* Очевидно следующее свойство собственных функций оператора. Если P\{q) — собственная функция с собственным значением \\{q) а fyiq) — собственная функция с собственным значением А2(^), то т.е. Р\Р2 — тоже собственная функция с собственным значением Ai + A2. Инвариантное семейство поверхностей. Если функция G(q) есть инвариант группы, то приравнивая ее произвольной постоян- постоянной: G(q) = C} получаем семейство гиперповерхностей, каждая из которых преобразуется сама в себя. Иными словами любая такая гиперповерхность является инвариантной.
222 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Представляет интерес несколько другая ситуация. Пусть задано некоторое семейство гиперповерхностей: u(q) = С. Причем u(q) инвариантом группы не является. Таким образом, преобразование группы изменяет каждую конкретную гиперповерхность семейства. Нас будет интересовать случаи, когда при таком изменении они переходят в другие гиперповерхности того же семейства. Такое семейство называется инвариантным. Пример. Семейство прямых, исходящих из начала координат в плоскости (<7ь<72): q\/q2 = С, является инвариантным семейством группы вращении. Найдем условие, которому должна удовлетворять функция u(q), чтобы она определяла инвариантное семейство. Пусть u(q) = С и a(q) = А: — два представления одного и того же семейства. Каждая гиперповерхность одного представления конгруентна неко- некоторой поверхности другого. Это значит, что для каждого значения С первого представления найдется такое значение к второго, что оба представления определяют одну и ту же гиперповерхность. То есть к есть функция С: к = /(С). Но тогда и a(q) = f[u(q)]. Таким образом, условие инвариантности семейства состоит в следующем: wfa, г) = f[u{q)t т]. Раскладывая это условие в ряд по г, находим Г2 *(*, г) = u{q) + rfi[{u>{q)] + ^-/гМ?)] + • • • Сравнивая этот ряд с рядом Ли, получаем условие инвариантности семейства в виде Uu(q) = fx[u(q)]. Это условие можно представить в более удобной для приложений форме, если избавиться от произвола в выборе функции Д. Будем искать из него не w(g), а некоторую функцию от этой функции: ft[w(<7)]. Поскольку ft[u>(<7)] определяет то же семейство, то Un[w(q)) = h[U(q)), откуда следует ^Uij(q) = h[u(q)]. аи Пользуясь произволом в выборе ?2(и>), положим — = h (w .
§ 49. ЛИНЕЙНЫЕ УРАВНЕНИЯ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ 223 Это приводит к условию Uu(q) = lt которое и будем считать основным для нахождения инвариантного семейства. § 49. Линейные уравнения с частными производными Как видно из предыдущего, задача нахождения инвариантов и инвариантных семейств приводит к необходимости рашать линейные уравнения с частными производными В случае поиска инварианта уравнение однородное, т.е. Qn+i = 0. Если ищется инвариантное семейство, то уравнение неоднородное. Рассмотрим вначале однородное уравнение. Поставим ему в соответствие систему обыкновенных дифференциальных уравнений dq\ _ g^2 __ __ dq^ 07 ~~ Q^ " Qn ' Теорема. Функция w(g) тогда и только тогда является решением уравнения когда она есть первый интеграл написанной системы. Доказательство следует из отмеченной в предыдущем пара- параграфе эквивалентности уравнения Лиувилля соответствующей ему системе обыкновенных уравнений. Решение неоднородного уравнения сводится к решению однород- однородного уравнения, если искать это решение в неявной форме: Тогда ди дФ /дФ и после подстановки в ^S^Qidu/dqi = Qn+i получаем дФ дФ _+...+Qrl+1_
224 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Общее решение этого уравнения есть произвольная функция первых интегралов системы dq\ du т.е. Ф = F[c*i(g, и), ..., ап(9, ш)]. Приравнивая ее нулю и разрешая относительно и, и получаем решение исходного неоднородного уравнения. Пример. Найти инвариантные семейства группы вращения: Условие инвариантного семейства ди ди) dqx dq2 Этому уравнению соответствует следующее однородное уравнение: ЭФ дФ_ дФ_ dq\ dq2 duj Эквивалентная система обыкновенных уравнений dq\ dq2 duj 92 —91 1 имеет следующие первые интегралы. Из уравнения dq\ dq% 92 -9i находим Из уравнения получаем Ях Qi Qi а2 = и - arcsin — = и - arcsin . = и - arctg —.
§ 50. КАНОНИЧЕСКИЕ КООРДИНАТЫ ГРУППЫ 225 Общее решение однородного уравнения есть Ф = F(au а2) = F (\Д? + 02. и - arctg^ ) . \v 42 J Приравнивая его нулю и разрешая относительно и>, имеем где Р — произвольная функция. Если Р = 0, то arctg(gi/g2) = С определяет пучок прямых, проходящих через начало координат. Если Р = y/q\ + q\, то arctg(gi/q'2) H- \/q\ Ч- q\ = С определяет семейство спиралей Ар- Архимеда. § 50. Канонические координаты группы Вид оператора однопараметрической группы U = J2irji(q)d/dqi) действующей в пространстве переменных д, зависит от выбора координат q. Выясним, как изменится этот вид, если от координат q перейти к координатам г по формулам r=R{q). Пусть в новых координатах оператор имеет вид Ему соответствуют дифференциальные уравнения группы Запишем для каждой из компонент функции R{q') уравнение Лиувилля откуда следует Таким образом, формула замены переменных в операторе имеет следующий вид:
226 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ в которой после применения оператора в старых переменных к уравнениям замены R(q) переменные q следует выразить через г, используя обратную замену q = R~l(r). Пример. Выразить оператор гг 2 9 д U = qt^ h в полярных координатах (gi, q2) -> (г, у?): Последовательно находим r =qi \Jq\ + q\ = г2 cos <p, Вид оператора в полярных координат таков: Гг 2 9 U = г cos <р-%-. ОГ Канонические координаты группы. Естественно поставить во- вопрос о нахождении таких координат, в которых группа имела бы простейший вид. Для этого потребуем в U = 52,-(f'Ri)d/9ri чтобы выполнялось: С/Яг = 1, Функции Ri(q) (г = 2, ..., п) представляют собой п —1 функцио- функционально независимых инвариантов рассматриваемой группы, которые всегда существуют. Это следует из известной теоремы из теории обыкновенных дифференциальных уравнений о том, что система уравнений n-го порядка в окрестности любой неособой точки име- имеет ровно п - 1 локальных первых интегралов. Функция R\(q) определяет инвариантное семейство гиперповерхностей. Рассматривая функцию, определяющую инвариантное семейство совместно сп-1 инвариантом группы в качестве новых переменных, мы приходим к простейшему виду оператора данной группы: представляющий собой оператор группы трансляций.
§ 51. ФОРМУЛА ХАУСДОРФА. ГРУППА СИММЕТРИИ 227 Сам результат о подобии любой одночленной группы группе параллельных переносов вдоль одной из осей эквивалентен теореме о выпрямлении векторного поля. Координаты, в которых заданная группа является группой трансляций, называются каноническими. Заметим, что функция, определяющая инвариантное семейство и удовлетворяющая уравнению U R\ = 1, является логарифмом любой собственной функции. Действительно, пусть P(q) — собственная функция, a X(q) — собственное значение: UP(q) = X(q)P(q). Опре- Определим fti как R\ = \nP(q). Тогда Поскольку X(q) — инвариант, то в новых переменных это просто константа, которую можно считать равной единице. Вопрос о знаке P(q) не имеет значения, поскольку, если P(q) — собственная функция, то P2{q) тоже собственная, т.е. всегда существуют положительные собственные функции. Таким образом, роль канонических координат группы играет логарифм собственной функции ее оператора и п — 1 независимых инвариантов. § 51. Формула Хаусдорфа. Группы симметрии В § 47 было выяснено, как преобразуется функция, заданная в некоторой области пространства, однопараметрической группой пре- преобразований. Результат был представлен в двух формах: уравнение Лиувилля и ряд Ли. В обеих формах приведенные соотношения связывали выражение рассматриваемой функции в старых коор- координатах, ее выражение в новых координатах и оператор группы преобразований старых координат в новые. В настоящем параграфе рассматривается аналогичная задача, однако объектом преобразования является уже не функция, а система дифференциальных уравнений s ¦*<•>¦ Пусть задана группа преобразований q -> q': Требуется выяснить, как преобразуется в результате этой замены написанная система дифференциальных уравнений. В терминах
228 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ операторов групп задача формулируется так. Оператор группы, порождаемой дифференциальной системой, имеет вид Оператор группы преобразований: В новых переменных дифференциальная система принимает вид с оператором Необходимо установить связь между А, А и U. Решение этой задачи дается формулой Хаусдорфа, к выводу которой мы приступаем. Запишем преобразования, задаваемые группой, и им обратные в экспоненциальной форме (см. §47): Напомним, что в этих выражениях в случае прямого преобразования U = X^f7i(<7M/d<7i, а в случае обратного в этом операторе формально вместо старых переменных надо писать новые: Используя формулы замены переменных в операторе, устано- установленные в предыдущем параграфе, перейдем в операторе А обратно от новых переменных к старым: Компоненты оператора А в этой формуле являются функциями новых переменных. Заменяя их на старые, получаем компоненты исходного оператора А:
§ 51. ФОРМУЛА ХАУСДОРФА. ГРУППА СИММЕТРИИ Эти выражения не зависят от т, поэтому — (А ~ти ') - dr ' 229 откуда ft А ^e~TUq[ - AUe'rUq[ ^ = 0. Первый и второй члены этого соотношения получены дифференци- дифференцированием по явно входящему т. Третий член представляет собой дифференцирование по г функции, зависящей от q\ которая, в свою очередь, зависит от т: q' = e™q. В результате получаем: дА дт = AU-UA = [A, U]. К этому уравнению следует добавить начальное условие A(q',r) = A(q'), r=0 чтобы получить искомую связь между А, А и U. Уравнение дА/дт = [Л, С/], определяющее преобразованный опе- оператор А) является аналогом уравнения Л иу вил ля, определяющего преобразованную функцию. Оно раскрывает смысл второго назва- названия для коммутатора — производный оператор: коммутатор есть в буквальном смысле слова производная оператора А по параметру группы, определяемой оператором U. Приведенная начальная задача Коши для операторного урав- уравнения решается при помощи разложения A(q', г) в ряд Тейлора по т: ft А т=0 2! дт2 г=0 Последовательно находим: =[А, С/]т=о = [A, U], д_А_ дт д2А т=0 г=0 =?ап = [[A, U], С/]т=0 = [[A, U], V) г=0 и так далее.
230 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ В результате приходим к формуле Хаусдорфа: Из этой формулы следует, что если [Л, U] = 0, то А = Л, т.е. группа с оператором U не изменяет оператора А (или соответствующих ему дифференциальных уравнений). Группа q' — Q(q, т) в этом случае называется группой симме- симметрии дифференциальной системы dq/dt — K(q). Или, говоря иначе: дифференциальная система допускает группу. Если уравнения пре- преобразованиями группы симметрии не изменяются, то это означает, что любые решения этих уравнений группой симметрии переводятся в решения этих же уравнений. Этот факт может служить другим определением группы симметрии. При этом для эквивалентно- эквивалентного дифференциальной системе dq/dt = K{q) уравнения Лиувилля dF/dt = AF имеет место следующее. Если F(q, t) — решение этого уравнения, то UF(q, t) — тоже решение. То есть решения уравнения Лиувилля переводятся в его же решения оператором группы симметрии. Полезность установления симметрии дифференциальной систе- системы демонстрирует следующая теорема. Теорема. Пусть задана система Если известна группа симметрии этой системы с оператором то заданная система может быть понижена в порядке. Доказательство. Укажем алгоритм понижения порядка. Груп- Группа, порождаемая оператором С/, предполагается известной в такой степени, что известны ее канонические координаты r=R(q), в которых оператор U имеет простейший вид: U = д/дг\. Но тогда условие [A, U] = 0 переходит в условие [Л. &J = [^, ^-] = о
§ 51. ФОРМУЛА ХАУСДОРФА. ГРУППА СИММЕТРИИ 231 Последний коммутатор сводится к дифференцированию компонент оператора А по г\. Равенство нулю означает при этом, что в канонических координатах группы U оператор А (а следовательно, и дифференциальная система, соответствующая ему) от переменной г\ не зависит. Пример. Понизить порядок уравнения Вначале приведем это уравнение к виду системы уравнений первого порядка: I-1- г"- ? = -*№-"<•>»¦ Одна из групп симметрии этой системы очевидна. Она связана с изменением масштаба измерения переменной у. Это группа растяжений: х1 = я, у' = ку - A + р)У) z1 = kz = A + n)z. Следовательно, операторы А и U имеют вид rr д д ду dz Можно проверить, что [Л, U] = 0. Разыскиваем канонические координаты группы G: Р = Р{х> У, *)> Я = Я{х, У, ^), г = ф, у, г), исходя из условий Up=l, Uq = 0, C/r = 0, для чего, в соответствии с процедурой, изложенной в §49, разыс- разыскиваем первые интегралы системы dx dy dz dp = = =
232 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Отсюда: р = In у, q = г/у, г = х. Находим выражение для оператора А в новых переменных: = 1[м{ф + Щх)] + ^ + удр {у у2 J dq дг Или, выражая х, у, z через р, д, г: Иными словами, в новых переменных исходная дифференциальная система имеет вид Р = Я> q = N{r) + M{r)q +q2, r = 1, т.е. задача сведена к интегрированию уравнения Риккати. Заметим, что приведенный способ понижения порядка требует знания канонических координат группы симметрии. Однако есть случаи, когда для этого достаточно лишь знания оператора группы. Например, это возможно, когда размерность системы равна двум. Рассмотрим этот случай. Пусть имеем систему с оператором и пусть известен оператор ее группы симметрии: про который будем дополнительно предполагать, что он явля- является линейно несвязанным с оператором А. (Условие линейной несвязанности является более жестким, чем условие линейной не- независимости, и определяется так: операторы U\t ..., Uk называются линейно несвязанными, если не существует таких X\(q)) ..., ) не всех тождественно равных нулю, что В отличие от определения линейной независимости здесь коэффи- коэффициенты А могут зависеть от переменных q.)
§ 51. ФОРМУЛА ХАУСДОРФА. ГРУППА СИММЕТРИИ 233 Пусть и(я, у) — первый интеграл рассматриваемой системы. Это значит, что Аи{х, у) = 0. Поскольку группа симметрии переводит решения в решения, то семейство интегральных кривых u>(z, у) = С должно быть инвари- инвариантным семейством группы: Uu(xt у) = 1. Эти два соотношения образуют систему ^,у)-+г/(х,у)- Разрешая эту систему, находим дш _ Y{x, у) дх X(x,y)r1(x,y)-Y(x,y)((x,y)' дш_ Х(х, у) ду ~X{x,y)T,(xty)-Y(x,y)t{x,yy Отсюда первый интеграл исходной системы находится квадратурой Х(х, у) dy — Y(я, у) dx и(хг у) = у X(x)y)rj(x)y)-Y(x)y)ax)y)' Аналогичный результат имеет место и в случае произвольной размерности. В книге Н.Г.Чеботарева* он сформулирован так. Теорема. Если система dq/dt = K(q) допускает (п - 1)- параметрическую разрешимую группу, операторы которой U\t ... ..., Un-\ вместе с оператором А составляют линейно несвязанную систему, то рассматриваемая дифференциальная система интегри- интегрируется в квадратурах. Термин "разрешимая группа" как раз и происходит от возможно- возможности использования таких групп для интегрирования в квадратурах систем обыкновенных дифференциальных уравнений. Не приво- приводя точного определения понятия "разрешимая группа", приведем * Чеботарев Н.Г. Теория групп Ли. — М.: ГИТТЛ, 1940.
234 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ критерий, позволяющий установить наличие этого свойства: п- параметрическая группа разрешима тогда и только тогда, когда ее структурные константы (см. §45) связаны условием C^C^Ct = C^C^C^ (i,j,k = l,..., n) (по itjtk — суммирование (Картан)). Расширение понятия группы симметрии. Вернемся к системе dt ш с оператором А. Пусть дана группа с оператором U таким, что имеет место Используя формулу Хаусдорфа, выясним, как в этом случае из- изменяется рассматриваемая дифференциальная система. Последова- Последовательно находим [[Л, [/], U] = [ЛИ, U] = XXAU - U{XiA) = = XXAU - XxUA - {UXi)A = Ai[i4, U] - {UXX)A = (A? - {UX\))A = X2A где А2 = А?- Аналогично и для других членов ряда. Следовательно, формула Хаусдорфа дает А = X{q)A. Таким образом, система q = K(q) группой q' = Q{q,r) в этом случае приводится к виду Хотя уравнения и изменились, но фазовые траектории остались теми же, поскольку общий для всей правой части множитель X(q') сокращается при делении всех уравнений системы на одно из них. Группа, удовлетворяющая условию [Л,С/] = АЛ, также называ- называется группой симметрии. Она переводит фазовые траектории в фазовые траектории. Теорема. Если дифференциальная система допускает группу симметрии в расширенном смысле, то эта система может быть понижена в порядке.
§ 51. ФОРМУЛА ХАУСДОРФА. ГРУППА СИММЕТРИИ 235 Доказательство. Выполним переход к каноническим координа- координатам группы U: q -> г. Тогда U = д/дг\ и условие расширенной симметрии приобретает вид Л, -— = АЛ или - -— == А^- dr\ д В терминах компонент оператора А это запишется: Разделив все эти уравнения на первое, получаем: г- = -=- (г = 2 п). К IU дКх Или, интегрируя, находим Константа С,- зависит от всех остальных переменных, кроме г\: C,(r2,...,rn). Но полученное означает, что в канонических координатах группы U рассматриваемая система приобретает вид г{ =Ci{r2) ..., rn)Ki (i = 2, ..., n). Разделив все уравнения на первое, приходим к системе меньшего порядка. Пример. Уравнение Блазиуса: dt Требуется понизить порядок. Приведем предварительно это уравнение к нормальной форме Коши автономной системы: dx dy dz z2 xz
236 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ с оператором Л~~ дх+*ду \у + 2у) дг' Ищем группу симметрии при помощи изменения масштаба: х = кх\ у = ту', z = sz1', ^l-I ^-JL' dz' s z'2 k x'z' 4t ~~ k' dt ~ mZ ' dt my' 'm'2yr' Отсюда видно, что правая часть этих уравнений приобретает оди- одинаковый для всех скалярный множитель, если s = к и \/к = s/m. Следовательно, однопараметрическая группа симметрии (в рас- расширенном смысле) имеет вид х = кх', у = к2у') z = kz' или х1 = A + /i)x, i/ = A + 2/i + . . . )У, z1 = A + /i)z. Оператор этой группы ах ау az Коммутатор операторов А и [/ в этом примере равен [Л, U] = Л. Для понижения порядка системы достаточно перейти от пере- переменных, в которых она записана, к переменным, являющимся кано- каноническими координатами ее группы симметрии (х, у, z) -> (р, д, г): x/ + 2y/ + z/ = 1, ах ах az 9о п 9о да x7± + 2y7± + z7± = 0) дх ду dz дг п дг дг x^~-h2y— + z— = 0. ах ay dz Эта система представляет собой полную запись условий, кото- которым должны удовлетворять канонические координаты, однако при практических вычислениях выписывать два нижних уравнения не
§ 52. ПРИНЦИП СУПЕРПОЗИЦИИ РЕШЕНИЙ 237 требуется, поскольку все необходимые интегралы получаются уже из первого уравнения: х* х Обратная замена: е2? Г Осталось найти вид оператора А в новых переменных: Следовательно, исходные уравнения в новых переменных приобре- приобретают вид В этом примере видно, в чем состоит отличие случая, когда [Л, U] = О, от случая, когда [Л, ?/] = АЛ. В первом случае при переходе к каноническим координатам система теряет зависимость от одной из переменных, во втором — зависимость от одной из переменных присутствует лишь в виде общего скалярного множи- множителя при всей правой части (в этом примере е~р), что не мешает понижению порядка: dq dp dr — dp § 52. Принцип суперпозиции решений в нелинейных системах дифференциальных уравнений Рассмотрим две системы обыкновенных дифференциальных уравнений: (dq -?¦ = f\(qi, •••, qn), —jj- = fn{qi, ¦••, ?n) И <
238 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Или, в краткой записи: Этим системам соответствуют группы q' = u{q, f), q' = v(q, r), представляющие собой решения этих систем с начальными услови- условиями ?'@) =,. Операторы этих групп: Рассмотрим композицию пробразований из разных групп, т.е. пусть q'=u(qtt)t q" = v(q',r) = v[u(q)t))T]. Выполним эти же пребразования (при тех же фиксированных t и г), но в обратном порядке: q'=v(q,T), q" = u(q',t) = u[v(q,r),t}. Зададимся вопросом, когда композиция не зависит от порядка выполнения преобразований? Если такое случается, то говорят, что указанные две группы коммутируют: v[u(qtt)tr] = u[v{qtT)tt]. Утверждение 1. Группы коммутируют тогда и только тогда, когда коммутируют их операторы. Доказательство. Воспользуемся экспоненциальным представле- представлением групп (§48): u[v(q, T),'t}=eAtv(q, r) = eAteBrq, v{u(q,t),T}=eBTu(q,t) = eBTeAtq. Следовательно, группы коммутируют, если емеВт =еВтем.
§ 52. ПРИНЦИП СУПЕРПОЗИЦИИ РЕШЕНИЙ 239 Для этого необходимо и достаточно, чтобы АВ = ВА (или [Л, 5] = 0). Утверждение 2. Если группы коммутируют, то их композиция есть также группа при условии отождествления параметров t = г, т.е. u[v(q} t)} t] — группа. Справедливость этого утверждения следует из того, что при условии коммутирования имеем u[v(q, t), t] = eMeBtg = eBteAtq = e<*+B>V Стоящая в правой части экспонента представляет собой группу с оператором А + В. Теорема. (Принцип суперпозиции в нелинейных системах). Если система дифференциальных уравнений такова, что операторы систем q = f(q) и q = F(q) коммутиру- коммутируют: [А, В] = 0, то решение этой системы является суперпозицией решений систем q = f(q) и q = F(q): q = u[v(q0) t), t] = v[u(qo, t), t], где q0 — начальное условие. Доказательство вытекает из доказанных утверждений. Пример. Пусть имеем систему х = кх + Лу, у = ку — Хх. Разобьем ее на две системы так: A) B) ЛЯЮ1 д i = X = ЦИХ ( д УТу. for, у = Ау, у = :истем \ 1 , В- -Ах. лГ — -- V 5х а са^ коммутируют: [А, В] = 0. Решение системы A): х = жоехр(М), у = yoexp(W).
240 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Решение системы B): х — xq cos Xt + г/о sin Xt, у = — xo sin A/ -j- yo cos Л/. Решение полной системы есть суперпозиция этих решений в любом порядке (вместо начальных данных одной системы ставятся решения другой): х — ekt(xo cos Xt + yo sin Xt), у = ekt(—XQ sinXt + yo cos A<). § 53. Теория продолжения На задачу преобразования дифференциальных уравнений можно посмотреть несколько иначе, чем это было сделано в §50. Пусть, к примеру, требуется выяснить, как изменяется группой система дифференциальных уравнений, записанная в следующей форме: где t — независимая переменная (время), a q и F — п-мерные векторы. Пусть в пространстве (t, q) действует группа Я* =q + l{i, Я)т+ ... Введем обозначение q = p и будем рассматривать систему F{i> Я> Р) = 0 как уравнения многообразия в пространстве пере- переменных (t, q, p). Поскольку эти переменные по смыслу связаны, то и преобразование, которое индуцирует рассматриваемая группа в таком пространстве, будет целиком определяться коэффициентами t(tt q) и ri(tt q): i'=i + t{t,q)r+ ..., я' =я+ *){*, я)т+ •••. Р' =P + ({i> Я> Р)т+ .-., где ?(<, q, p) должна определяться однозначно этими коэффициен- коэффициентами. По определению, , dq' dq' dt1 q + rjr + . . . . • где г] и ? есть полные производные по t:
§ 53. ТЕОРИЯ ПРОДОЛЖЕНИЯ 241 Следовательно, ?B, q, р) = rj — p?. Продолженная таким образом группа в пространстве переменных (t, p, q) называется группой первого продолжения, а ее оператор — оператором первого продол- продолжения: Аналогично можно рассмотреть преобразование систем уравне- уравнений, содержащих производные любых порядков. Инварианты продолженной группы называются дифференциаль- дифференциальными инвариантами группы. Пример. Найти дифференциальные инварианты до второго порядка включительно группы вращений U = Ч~О1~1~д~ (? -скаляр). Поскольку ? = д, а г] = -t, то и оператор первого продолжения имеет вид A) 8 д „ .2. д Для нахождения оператора второго продолжения имеем откуда &{i, 9,9, q) = (- q? = -%qq - q'i = -%qq- Следовательно, оператор второго продолжения таков: B) д д .2ч д д Нахождение дифференциальных инвариантов сводится к нахо- нахождению первых интегралов следующей системы: dt dq dq dq ~^q " T "" 1-f q2 ~" 3^' 17 Зак. 233
242 ГЛ. 11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Из первого уравнения С\ = y/t2 + q2. Из уравнения dq dq получаем qq/t' dq dq 1 + g2 = 3^ находим Наконец, из уравнения Этот инвариант имеет смысл кривизны кривой. Интегральные инварианты. Рассмотрим следующие три типа интегралов: Интеграл J\ представляет собой функционал на траекториях q(t). В интеграле Ji имеется в виду суммирование по к. Пусть имеем группу отображений: я'=ч Вычислим указанные интегралы в новых переменных, но с теми же подынтегральными функциями: 3[ = [ Ф{?, q\ q', ...) df, Л = I Фк(д') dq'k, Ji=J..J<b(q>)dq[...dq'n. V В общем случае эти интегралы становятся функциями г: ЛИ, J2'(r), Jl{r).
§ 53. ТЕОРИЯ ПРОДОЛЖЕНИЯ 243 Определение. Указанные интегралы называются интегральными инвариантами рассматриваемой группы, если J[{t) = Ju Ji{r) = J2t Л(т) = J3. Для этого необходимо и достаточно, чтобы «Uo, «S. о, й»а cfr rfr ar Найдем, каким условиям должны удовлетворять функции ФB, <7, <j, ..), Фдв(д), Ф(<7)> чтобы соответствующие интегралы бы- были интегральными инвариантами заданной группы. Начнем с первого интеграла и рассмотрим малое приращение параметра группы т + 5т: J[[t + 8т) = / Ф[/'(г + <$r), g'(r н- 8т), ...] Л'(т В полученном интеграле выполним замену переменных по формулам Поскольку, в силу теоремы единственности группы (§46), то написанный интеграл приобретает вид • с/Ф 1 (*', q\ q't . . .) + — 5r + . . . j dit' + W, q')8r+ Учитывая, что dQ/dr = JJ Ф, получаем С'2 i i i С2 17*
244 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Отсюда следует: 6т dr Jt> Для того чтобы на любых траекториях qf(tf) было dj[/dr = О, необходимо и достаточно и]ф(г', q», q',...) + №, «')*(*'.«', <?',••) = о. Поскольку это выражение явно от т не зависит, то t'', q1 имеют смысл немых переменных, и штрихи можно опустить: (п) ф iф - о Последнее соотношение и выражает собой критерий интеграль- интегрального инварианта J\. При вычислении производных по параметру группы от J^ и J$ поступаем совершенно аналогично. Поскольку в подынтегральных функциях время не присутствует, то и в группе преобразований можно положить ?(<, q) = 0. В результате находим djj _ dr " (по I, i, к — суммирование), Отсюда и следует критерий инвариантности J^. dq, V1 дЯ1 +9idqj ~ dqk V dq, + ^ 8q. и критерий инвариантности J^\ С/Ф-f Ф^у?7 = 0.
§ 53. ТЕОРИЯ ПРОДОЛЖЕНИЯ 245 Пример. Найти интегральные инварианты вида J\ группы вращений. Продолженный оператор группы имеет вид Условие инвариантности J\: Соответствующая система обыкновенных уравнений: dt dq dq dq с/Ф -q t l + q2 Sqq ?Ф Уравнения, не содержащие Ф, позволяют вычислить дифференци- дифференциальные инварианты до n-го порядка включительно: Ci = y/tz + q'} O2 = — г, Сз = t + qq г t + qq q Из уравнения dq/(l + q2) = dФ/(qФ) находим Ф = Cy/l -f q2 или c= ф Общее решение уравнения, выражающего условие инвариант- инвариантности J{} есть функция Ф, которая находится из условия G(Ci, C2, ..., С) =0, где G — произвольная функция найденных первых интегралов. Или, разрешая это соотношение относительно Ф, получаем где Q — произвольная функция дифференциальных инвариантов. Таким образом, общее выражение для интегрального инварианта 3\ группы вращений есть В частности, при Q = 1 этот функционал выражает длину кривой.
246 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ § 54. Уравнения, допускающие заданную группу Теория продолжения оператора позволяет иначе сформулировать условие инвариантности дифференциальных уравнений относитель- относительно однопараметрической группы преобразований. Пусть, к примеру, имеем дифференциальное уравнение, заданное в плоскости я, у и записанное в неявной форме: Из результатов предыдущего параграфа ясно что, для того чтобы это уравнение было инвариантным относительно группы с оператором необходимо и достаточно, чтобы A) U F{x}y)p) = 0) F(x,y, p) = 0, т.е. уравнение F(x, у, р) = 0 должно определять инвариантную поверхность один раз продолженной группы. Покажем эквива- эквивалентность этого критерия критерию [A, U] = ХА для системы в нормальной форме Коши: которую перепишем в неявной форме: X(x,y)p-Y(x,y)=0. Применим к этому уравнению оператор первого продолжения: (дХ dY\ (дХ dY\ ,. .v n где С(«, У, P) = lx + {ly ~ Zx)P - ZyP2, и оно должно быть выполнено на Хр — У = 0. Выражая отсюда р и подставляя его в полученное уравнение, находим
§ 54. УРАВНЕНИЯ, ДОПУСКАЮЩИЕ ЗАДАННУЮ ГРУППУ 247 Напомним, что U = ?д/дх + ф/ду, А = Хд/дх + У<9/<9у. Поэтому последнее соотношение принимает вид - XUY + XЛт? - УА? = О, откуда С/Х - Aj _ UY -Arj X У Но это и означает, что координаты коммутатора [Л, U] пропорцио- пропорциональны координатам оператора Л: [Л, U) = АЛ. Для уравнений более высокого порядка доказанная эквива- эквивалентность места не имеет. Рассмотрим уравнение n-го поряка в разрешенной относительно старшей производной форме: d^y=f(x dy_ dxn \ ' ' dx' Условие инвариантности этого уравнения относительно некото- некоторой группы может быть сформулировано в двух различных формах. Во-первых, при помощи введенного понятия продолженного опера- оператора \dxn Если на полученное соотношение смотреть как на на условие для нахождения группы симметрии, то оно представляет собой уравнение в частных производных относительно двух неизвестных функций ?(я, у) и т/(х, у). Это уравнение распадается, как прави- правило, на переопределенную систему, поскольку искомые функции не зависят от производных и необходимо приравнять нулю коэффи- коэффициенты при всех степенях и произведениях всех dky/dxk. Решений такой системы может не существовать, что означает, что симметрии рассматриваемого типа у изучаемого дифференциального уравне- уравнения нет. Во-вторых, это дифференциальное уравнение может быть переписано в нормальной форме Коши: dx\ __ dx2 __ dxn _ dxn+i __ После чего для отыскания симметрии можно воспользоваться кри- критерием [Л, U] = АЛ. В этом случае у разыскиваемого оператора уже n-hl компонента, которые не связаны условиями продолжения, в силу чего такая задача всегда разрешима.
248 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Большой интерес представляет решение обратной задачи: задана группа с оператором требуется найти общий вид дифференциальных уравнений, инвари- инвариантных относительно этой группы. Решение этой задачи начнем с дифференциальных уравнений первого порядка. Поскольку каждое дифференциальное уравнение инвариантное относительно группы, должно быть инвариантной поверхностью один раз продолженной группы в пространстве я> У> Р — dy/dx, то запись общего вида такой поверхности и бу- будет решением задачи. Если и(х, у, р) и v(x, у, р) — два независи- независимых инварианта продолженной группы, то общий вид инвариантной поверхности есть где М — произвольная функция. В качестве и можно взять инвариант оператора U = ?д/дх+ +г}д/ду и, следовательно, он не зависит от р, а в качестве v — диф- дифференциальный инвариант. Тогда общий вид дифференциальных уравнений первого порядка, инвариантных относительно группы с оператором [/, может быть записан так: N — произвольная функция. Пример. Общий вид уравнений, инвариантных относительно группы вращений, таков: dy_ dx Замечание. Нахождение дифференциального инварианта первого порядка для оператора U = ?д/дх+г]д/ду приводит к необходимости решать следующую систему: dx __ dy _ dp
§ 54. УРАВНЕНИЯ, ДОПУСКАЮЩИЕ ЗАДАННУЮ ГРУППУ 249 Если предположить, что простой инвариант известен: то для нахождения дифференциального инварианта приходится решать уравнение Риккати dp I 2i \ 9 dx f (z, y)XyX у - о , Однако именно это уравнение решается в квадратурах, поскольку можно указать его частное решение: Для уравнений второго порядка аналогичные рассуждения приводят к следующему выражению для общего вида таких уравнений, инвариантных относительно заданной группы с оператором U = ?д/дх + т]д/ду: w где и) v, w — инварианты нулевого, первого и второго порядков, М — произвольная функция. Причем дифференциальный инва- инвариант каждого следующего порядка может быть получен диффе- дифференцированием инварианта предыдущего порядка по инварианту нулевого порядка. Пример. Общий вид уравнений второго порядка, инвариатных относительно группы вращений, таков: Построение уравнений третьего и высшего порядков, инвариантных относительно заданной группы, осуществляется аналогично. 16 Зак. 233
250 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ § 55. Симметрии уравнений в частных производных Пусть уравнение в частных производных с двумя независимыми переменными записано в виде dz dz d2z И пусть в пространстве я, у, z действует группа с оператором F) F) Я U = ?{х,у, z)— -fr/(x, у, г)— +({х)У) г)—. d2z d2z ~S) dtf~ ' Введя обозначения представляем написанное дифференциальное уравнение как уравне- уравнение поверхности в пространстве соответствующего числа измерений: F{*> У, *i Pi 9» г» 5» 0 =0. Заданная группа индуцирует в этом пространстве группу (продол- (продолженная группа), определяемую продолженным оператором. Способ построения продолженного оператора состоит в следующем. Выпишем ядро продолженной группы: х' = х + ?(х, у, z)t+ ... У1 = У + ^х, у, z)t+ ... z' = z + C(*. У. *)т+ ... р' ¦=р-\-тг(х) у, z,p, q)r+ ... 9; = 9 + p(x, У, г, р, q)r+ ... Требуется вычислить коэффициенты тт, р и т.д. Переменные х> У> z, р, ^ не являются независимыми и связаны условием полного дифференциала: dz = pdx + q dy. Точно так же определены переменные р' и q1: dz1 = p'dx' + q'dy'.
§ 55. СИММЕТРИИ УРАВНЕНИЙ В ЧАСТНЫХ ПРОИЗВОДНЫХ 251 Подставляем в последнее соотношение ядро группы: dz Ч- г(Сг dx + Су dy + B dz) + ... = г+ .. )[dx + т(?х dx + ?у dy + ?л dz) + ...]+ pr+ . . .)[dy + r(rjx dx + rjy dy + rjz dz) + ...]. Заменяя dz на pdx + qdy и приравнивая коэффициенты при dx и dy, находим р = Су - р?у - gqy - g(-Ca + viz + qrjz). Эти соотношения достаточны для построения оператора первого продолжения. Для построения оператора второго продолжения следует снова воспользоваться условием полного дифференциала ,dz d2z . d2z . Bz . <92z . d2z . d d+d d d+d или dp = r cfx + s cfy, cfg = s dx + I dy. Продолжение ядра группы на переменные г, s, / определяется ко- коэффициентами а, /?, 7- = s Поступая как и при нахождении тг и р, получим а =*"х +ртг2 +Г7гр + snq -r(^x 4-рб) - e(»7* +pr7z), ^ =7Гу + 97Гг + S7Vp + l7Tq - Г(?у + 96) - «(^y + Иа), 7 =Py + 9Рг + spp + lpq - s(^y + q?z) - /(?7y + ^a). Оператор второго продолжения имеет вид B) д д д д д д „д д ох оу oz op oq or os ol Условие инвариантности поверхности F(xt у, г, р, q, r, s, /) = О, или, что то же самое, условие инвариантности соответствующего уравнения в частных производных второго порядка получается следующим: B) [/F = 0, F = 0. 16*
252 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Как и ранее, на эти соотношения можно смотреть двояко: за- задан оператор U — найти инвариантную поверхность, или задана поверхность — найти сохраняющую ее группу. В обыкновенных дифференциальных уравнениях обе задачи эквивалентны по слож- сложности, поскольку обыкновенное дифференциальное уравнение и группа, преобразующая его, — объекты одной и той же природы. В случае уравнений в частных производных это уже не так. Диф- Дифференциальные уравнения, определяющие группу, — обыкновенные, а преобразуемое уравнение — в частных производных. Первый объект проще. Поэтому и алгоритмы поиска групп симметрии уравнений в частных производных оказываются эффек- эффективными. Если уравнение F(x, у, z, zX) zy, zXX) ...) = 0 линейное, то, как и в случае обыкновенных дифференциальных уравнений, условия ин- инвариантности уравнения можно сформулировать без использования продолжения операторов, в терминах коммутаторов. Запишем это уравнение в виде Az = 0, где А — линейный дифференциальный оператор: В силу линейности уравнения преобразовывать переменную z не имеет смысла. Тот факт, что линейное однородное уравнение допус- допускает группу растяжений по г, очевиден и интереса не представляет. Поэтому будем рассматривать группу, действующую в пространстве переменных я, у с оператором U = ?(я, у)д/дх + г}(х, у)д/ду. Коммутатор двух операторов А и U есть оператор второго порядка: [Л, U] = AU - U А. Определение. Оператор U называется оператором симметрии для уравнения Az = 0, если [A, U) = А(х, у)А. Теорема. Оператор симметрии отображает решение уравнения Az = 0 в решение этого же уравнения. Доказательство. Пусть г = <р(я,у) — решение, тогда A{U<p) = U{A<p) + XAip = О, т.е. U(p — тоже решение. Пример. Уравнение Гельмгольца: d2z d2z 2 n / д2 д2 Л дх2 ду2 \ дх2 ду2 )
§ 56. ПРИМЕРЫ ИНТЕГРИРОВАНИЯ ЗАДАЧ МЕХАНИКИ 253 Требуется найти алгебру симметрии этого уравнения. Исходим из условия [A, U] = АЛ, в котором помимо* неизвестного оператора U нахождению подлежит скалярный коэффициент А(х,у). Вычисление коммутатора дает AU -UA = Вычитая из него оператор АЛ и обращая в нуль коэффициенты -юлученного разностного оператора, находим 2?х = А, 2г)у = А, 2{г)х + ?у) = 0, 6* + ?уу = О, Vxx + TJyy = О, LJ2X = 0. Отсюда вытекает решение: А = 0, ? = а + by, ц = с — Ьх, где а, 6, с — произвольные постоянные. Следовательно, общий вид искомого оператора U такой: ?, = (« + 6у)А+(*-*«)?. Он представляет собой произвольный элемент трехмерной алгебры операторов U = aUi+ Ы/2 + cU3 с базисом операторов тт д тт д д п д 9х <9х 9т/ ду Операторы U\ и Gз — операторы трансляций вдоль осей х и у, оператор С/г — оператор группы вращений. § 56. Примеры интегрирования задач механики на основе вычисления симметрии 1. Движение материальной точки под действием следящей силы. Рассмотрим плоское движение материальной точки массы m под действием силы F, которая постоянна по модулю и приложена в любой момент времени перпендикулярно радиусу-вектору этой точки (рис. 68). Так как масштаб можно выбрать произвольно при' измерении переменных, будем считать m = 1, F = Зл/2. Уравнения рассматриваемой материальной точки в полярной системе координат имеют вид г-гф2 = 0, -г{г2ф) = at
254 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Перепишем эту систему в виде трех уравнений первого порядка, введя обозначения для скорости изменения г (г = v) и для момента количества движения а = г2ф: r = v, г/=гсг2г~3, & = Зл/2г. Поскольку фазовые переменные в правых частях этой системы входят только в виде степеней и произведений, группу симметрии этой системы естественно искать в виде группы растяжений (г, v, а) -> (г', t/, </): r = ar\ v = /?t/, а = ч<т', после подстановки которой в уравнения получаем а Правые части в результате преобразования будут иметь общий для всех уравнений множитель, если а (За3 7 Выбирая Р произвольным, из этих соотношений найдем а = /?2, 7 = /?3. Следовательно, группа симметрии системы имеет вид г' = Р~2г = г+ 2гг+ ..., t/ = /Г1!; = v + vr + ..., cr' = /?"o- = cr + i<TT + ..., где r — параметр группы (/? = 1 — г). Оператор этой группы имеет вид Он удовлетворяет условию [A, U] = Л.
§ 56. ПРИМЕРЫ ИНТЕГРИРОВАНИЯ ЗАДАЧ МЕХАНИКИ 255 Это условие является достаточным условием того, что группа с оператором U является группой симметрии в следующем смысле: Рис. 68 Рис. 69 любые интегральные кривые этой системы группой отображаются в интегральные кривые этой же системы, или же любое стационарное решение соответствующего системе уравнения Лиувилля дФ/dt = = АФ, т.е. решение Ф = Ф(г, t>, cr)> переводится оператором U в стационарное решение этого же уравнения: G = f/Ф. Если в исходной системе независимой переменной считать не время, а полярный угол <р, то система примет вид dip vr2 a dv dip a r da a<p Оператор этой системы a or r ov ifJL a da коммутирует с оператором U: [i9, U] = 0. Следовательно, построенная группа, является группой симме- симметрии для этих уравнений в более сильном смысле: каждое ее решение переводится группой в решение уравнения, и каждое ре- решение уравнения Лиувилля дФ/д(р = АФ переводится оператором U в решение этого же уравнения. То есть, если Ф(у?, г, v, a) — решения, то ?/Ф — тоже решение. При наличии группы симметрии в том или в другом смысле система, рассматриваемая в любой ее форме записи, может быть понижена в размерности. Для понижения размерности в системе следует выполнить заме- замену переменных (г, vt a) —у (я, у, г), где я, у, z представляют собой канонические координаты группы симметрии, т.е. функции, удо- удовлетворяющие условиям Ux = 1, Uу = 0, Uz = 0. То есть функции
256 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ y(r, vf а) и z(r, v, а) являются инвариантами группы, a x(r, t>, a) представляет собой логарифм собственной функции (§49). Для нахождения этих функций достаточно решить уравнение о дФ дФ о дФ л 2r— + v— +3G— = 1 or ov ост или, что эквивалентно, систему обыкновенных дифференциальных уравнений dr dv da dФ 2r ~ ~v ~~ Ja " "T* Отсюда находим: 1 . 1 v л/2 а Х=21ПГ' y=27F' 2 = ~2— Поскольку любая функция инвариантов есть снова инвариант, то коэффициенты 1/2 и \/2/2 в выражениях для у и z выбраны только из соображений удобства для дальнейшего. Найденным уравнениям замены соответствуют уравнения обрат- обратной замены: r = e2r, v = 2yex, a = yfize3*. Исходная система, после выполнения в ней этих замен, в новых переменных принимает вид или c/x _ \/2y dy __л/2 ( y2\ cfz __ Зл/2 /1 5у?~~2~г' 5^ " T \Z " 7J ' 5^ "" 2 \z~ Система имеет две особые точки у = г = 1 и у = z = — 1. Первой точке соответствует устойчивый фокус, второй — неустойчивый. Фазовый портрет системы изображен на рис. 69. Устойчивому фокусу соответствует точная интегральная кривая в исходных пе- переменных, получаемая из уравнений обратной замены при у = z = 1 в виде v = 2л/г, а = \/2гЗ. Для нахождения соответствующего решения исходим из уравнения г = 2у/г, откуда г = (y/r~o + tJ. Что позволяет выписать однопара- метрическое семейство точных решений системы г = v} v = a2r~3} а = 3\/2т- в виде
§ 56. ПРИМЕРЫ ИНТЕГРИРОВАНИЯ ЗАДАЧ МЕХАНИКИ 257 Изменение полярного угла, соответствующее этому семейству, может быть найдено при помощи формулы а = г2ф в виде В результате зависимость тех же переменных от угла кр может быть найдена в виде г = гоехр(\/2<?>), v = 2y/F^exp(V2ip/2)) a = yj2r%expCy/2(p/2). Таким образом, движение точки под действием следящей силы в полярных координатах представляет собой логарифмическую спи- спираль г = гоехр(у/2(р) или кривую, стремящуюся к ней при t -> оо. 2. Задача Суслова. Рассмотрим задачу о скатывании матери- материальной точки по наклонной шероховатой плоскости (рис. 70). Уравнения движения при подходящем выборе масштаба измере- измерения переменных могут быть записаны в следующей форме: х = 1 - *- Общее решение этих уравнений для случая к ф 1 приведено в кни- книге Г.К.Суслова *. Случай к = 1 — критический: сила трения равна при этом скатывающей силе, или угол наклона плоскости к горизонту ра- равен углу трения. Рассмотрим задачу именно для этого случая при сле- следующих начальных условиях: х@) = = у@) = х@) = 0, у@) = 1. Введя обо- обозначения х = и, у =¦ v, \/х2 + у2 = w) получим систему и = 1 — u/w) v = —v/w, н@)=0, v@) = 1. Рис. 70 Группой симметрии этой системы, очевидно, является группа подо- подобия с оператором U = ид/ди + vd/du и каноническими кординатами а = —, в = \nv. v Суслов Г.К. Теоретическая механика. — М.: Гостехиздат, 1946.
258 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Используя их в качестве замены переменных в рассматриваемой системе, приводим ее к виду Отсюда получаем - с очевидным решением a = —sh /?, имеющим в исходных переменных вид Подставляя это выражение в уравнение v = —v/w) приходим к уравнению Решая это уравнение, находим lnt/+y = -2i + i. Если разделить уравнение v = — 2v(l + v2)~l на у = v, то получится уравнение l откуда следует __v _ i? 2 У~~2 ~ "б~+3' Система 1 i>2 1, __ ^ _ ^ У~3 2 6 определяет в параметрической форме решение y(t)} изображенное на рис. 71. Разделив далее х = гх на г> = —2v(l -ft;2) с учетом, что 2и — 1 — v2, получим (fx = _I(l_t,4)^> хA)=0.
§ 56. ПРИМЕРЫ ИНТЕГРИРОВАНИЯ ЗАДАЧ МЕХАНИКИ 259 2/3 3/8 Рис. 72 Рис. 71 Отсюда следует параметрическая форма решения x(t): изображенная графически на рис. 72. 3. Задача о траектории преследования. Пусть в плоскости (рис. 73) движутся две точки. Преследуемая точка движется с постоянной скоростью и на постоян- постоянном расстоянии / от горизонтальной оси. Преследующая точка движется с постоянной по модулю скоростью v > и, направленной вдоль прямой, соединяющей обе точки. В началь- начальный момент времени прямая, соеди- соединяющая две точки, препендикулярна горизонтальной оси, а расстояние ме- между ними равно /. Требуется найти время до встречи. Будем рассматривать положение х' х\Т) Рис. 73 преследуемой точки {я, у} в системе координат, начало которой совпадает с преследующей точкой. Закон сложения скоростей дает vx + х = и} vy + у = О, где vx Отсюда и следуют уравнения движения преследуемой точки в системе, в которой неподвижна преследующая: vx . vy х = и — fx*~+ у2
260 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Эти уравнения полностью идентичны уравнениям для скоростей в задаче Суслова. Все процедуры, примененные в предыдущем пункте, могут быть применены и в этой задаче. Переход к каноническим координатам группы подобия (я, у) —> —> (а, C): а = я/у, /3 = \пу позволяет получить ^ = N/l + a2, /3@) = In/, a@) = 0. ар v Обозначив u/v = к, запишем решение этого уравнения: После чего из уравнения для /3: >=-.- выводим '-ln/)ef/? = -t/t + C или При t = О Р = In/, что позволяет найти С: C~2\l + ik+ I-*/' При t = Т (момент встречи) /? = —с», поэтому откуда § 57. Уравнения Пуанкаре Пусть имеется механическая система; Т — ее кинетическая энергия, U — потенциальная. Пусть gi,...,gn — локальные (обобщенные) координаты этой системы, q\, ..., qn — обобщенные скорости.
§ 57. УРАВНЕНИЯ ПУАНКАРЕ 261 Пусть, наконец, в области определения системы действует ло- локальная группа Ли, обладающая свойством транзитивности (гово- (говорят, что группа транзитивна, если для любых двух точек простран- пространства положений существует преобразование из группы, переводящее одну точку в другую). Группа транзитивна тогда и только тогда, когда алгебра ее операторов содержит п линейно несвязанных: и -г— Векторы образуют в пространстве q базис, по которому можно разложить обобщенную скорость: Выберем в качестве фазовых переменных системы переменные Подставляя в выражение для кинетической энергии T(q} q) это представление для обобщенной скорости, получим функцию T(q, 77) (для простоты новую функцию обозначим той же буквой). Воспользуемся принципом наименьшего действия по Гамильтону: 5S = 8 f{T-U)dt = 0. Вычислим вариацию кинетической и потенциальной энергии: Вариацию 6qi спроектируем на базис: f1 ?": Sq = Su^1 + ... + 8ыпС, 6qi = Surfl + ..
262 ГЛ.11. ЭЛЕМЕНТЫ ЛОКАЛЬНОЙ ТЕОРИИ Вариацию Srj также надо выразить через <$ы, для чего продиф- продифференцируем последнее соотношение: (f±c\ Я?1 dqi Oqn \oqi dqn ) Заменяя в этом равенстве g на г], находим С другой стороны, вычисляя вариацию от ^ = JZfc ^'^> находим gci gc 5q = (Jr/^1 H- . . . + <fyn?n H- гц j^-Sqi + . . . + ^ i \ -fyn I + . . . n / n ) Мы получили два представления для Sq, приравнивая их друг другу, выводим Fm-Su,Kl+ ... +(%.-**. К"^ Меняя обозначения индексов г <—У s, получаем к к ~ik i Или, иначе i, 5
§ 57. УРАВНЕНИЯ ПУАНКАРЕ 263 Заметим, что есть вектор компонент коммутатора [US) [/,]. Поскольку операторы группы образуют алгебру, то где Clti — структурные константы группы. Следовательно, E77! - 8ш,)е + .. • + {6г,п - 6ип)?п + +5>л* cfo1 + ...+ 52тбы.с??п = о. Отсюда находим Вариация действия примет вид dt. В первом члене применим интегрирование по частям: -—5ик dt = -—Suk - / ---—8ик dt. orjk дщ t0 J dtdrjk В силу независимости 5ик отсюда получаем уравнение Пуанкаре d дТ у^5Т . _Q где — обобщенная сила.
264 ГЛ. 12. ГРУППЫ СИММЕТРИИ УРАВНЕНИЙ Частным случаем уравнений Пуанкаре, очевидно, являются уравнения Лагранжа. В динамике твердого тела роль переменных щ могут играть компоненты вектора угловой скорости тела в проекции на связанные с ним оси. В этом случае уравнения Пуанкаре переходят в уравнения Эйлера. Глава 12. Группы симметрии уравнений классической механики § 58. Первый закон Ньютона. Инерциальные системы Обычно формулировке второго закона Ньютона предваряют фор- формулировку первого закона: "В евклидовом пространстве всегда можно найти такое тело отсчета и такую связанную с ним декартову систему координат, а также такой способ измере- измерения времени t, что любая материальная точка, на которую не действуют силы, описывает прямую или неподвижна" Этот закон служит для определения понятия инерциальной системы отсчета, после чего для любой такой системы формулируют второй закон Ньютона. Такой способ введения аксиом механики содержит противоречие. Действительно, пусть в соответствии с первым законом инер- циальная система отсчета найдена: {t, x, у, г}. Любая свободная материальная точка движется в ней прямолинейно и равномерно. Перейдем к системе отсчета {t\} x\t у\) z\} по формулам ti^t+ux, xi = х, yi = у, *i = г. Поскольку линейным преобразованием все прямые переводятся в прямые, то и в этой системе рассматриваемая точка движется равномнерно и прямолинейно. В соответствии с первым законом Ньютона и ее следует признать инерциальной. Но это войдет в противоречие со вторым законом, который в этой системе, как легко проверить, не имеет места. Приведенная система координат не является искусственной и имеет ясный физический смысл. Представим себе поезд, идущий на восток. Пассажир следит в окно за километровыми столба- столбами и видит установленные на них часы, показывающие местное время. Километры на столбах и время на их часах и образуют указанную в примере систему координат (разумеется, в областях, размеры которых малы по сравнению с радиусом Земли, чтобы ее формой можно было не интересоваться). Заметим, что кажущаяся искусственность в способе введения времени в этом примере на самом деле представляет собой вопрос конкретного технического устройства часов. Можно, например, представить себе часы, вну- внутри которых вмонтирована инерциальная навигационная система,
§ 58. ПЕРВЫЙ ЗАКОН НЬЮТОНА. ИНЕРЦИАЛЬНЫЕ СИСТЕМЫ 265 непрерывно ведущая счисление координат местонахождения часов и вносящая в их показания необходимую поправку. Если бы у людей никаких других часов не было, то они могли бы и не подозревать, что существует какой-то иной способ измерения времени. При этом в примере с поездом пассажир, имея на руке такие часы, был бы избавлен от необходимости переводить стрелки при попадании в другой часовой пояс. Для устранения противоречия следовало бы оговорить синхро- синхронизацию часов во всех точках пространства. Однако описание про- процедуры синхронизации вносит серьезные осложнения в формальную аксиоматическую конструкцию классической механики. Гораздо проще оставить свободу в выборе способа измерения времени в любой точке пространства, а первый закон Ньютона считать лишь необходимым условием инерциальности выбранной системы отсчета. При таком подходе необходимым и достаточным условием инер- инерциальности системы отсчета становится выполнимость в ней второго закона Ньютона, но в таком случае первый закон теряет самосто- самостоятельное значение, превращаясь в следствие второго. Иначе обстоит дело в релятивистской механике, обсуждаемой в следующей главе. Прерогатива в формировании критерия инерци- инерциальности системы отсчета в релятивистской механике переходит от уравнений Ньютона к уравнениям электродинамики Максвелла. В этом случае первый закон Ньютона превращается в самостоятель- самостоятельное и независимое необходимое условие инерциальности. Поэтому представляет большой интерес выяснение вопроса о том, как же связаны друг с другом те системы отсчета, которые удовлетворяют этому необходимому условию инерциальности. Рассмотрим этот вопрос детально на примере одного простран- пространственного измерения. Обобщение на трехмерный случай не имеет ни принципиальных особенностей, ни трудностей. Прямая в плоскости (t} х) будет переходить в прямую в резуль- результате преобразования (t} х) —> (t*, я'), если ее уравнение dPx п будет относительно этого преобразования инвариантным. Если искомую группу симметрии записать в виде t'=t+Z{ttx)T+ ..., х' =х + 77(*, х)т + ..., то это уравнение должно быть инвариантным относительно дважды продолженной группы с оператором: {U = i(t, *)^ + ф, х)^ + С(*. х, v)-^ + 6(t, х, v, w) A,
266 ГЛ.12. ГРУППЫ СИММЕТРИИ УРАВНЕНИЙ где v = х (скорость), w = х (ускорение). Рассматриваемое диф- дифференциальное уравнение в пространстве (t} х, v} w) определяет гиперповерхность w = О, условие ее инвариантности есть B) U w— О на w = О, что в данном случае дает S(tt х, v, 0) =0. В соответствии с теорией продолжения (§ 52) имеем * =0 + vCx н- ^(Cv -St) Следовательно, условие инвариантности есть О + <* = Г7хс Н- г;(г/хе - ?tt) - v2^xt + vrjtx + г;2(т7хх - ^tx) - v3?xx = 0. Поскольку функции ? и 77 не зависят от и, то это соотношение распадается на следующие: tyt = 0, 2rjxt - {rt = 0, 2?xt - r;xx = 0, <?** = 0. Дифференцируя второе из этих соотношений по х, а третье по t) получаем 2т7ххе -ixtt = 0, 26tt - Ixxt = 0. Два линейных алгебраических уравнения относительно неиз- неизвестных ?xtt и 7/xxt с неравным нулю определителем имеют лишь тривиальное решение Ixxt = 0, ixtt = 0, откуда следует ? =а + Ы Н- сх + Лх + е/2, г) =f + gt + hx + Их + mx2 с постоянными а, 6, с, cf, е, /, #, /i, /, т. Подставляя эти решения в уравнения 2r)xt—?tt = 0 и 2&х-77хх = 0, находим 2d - 2т = 0 и 2/ - 2е = 0. Таким образом, окончательно оператор искомой группы, пере- переводящий прямые в прямые, имеет вид bU2 + cU3 + dU* + eU5 + fU6 + gU7 + hUs,
§ 59. ВТОРОЙ ЗАКОН НЬЮТОНА. ГРУППА ГАЛИЛЕЯ 267 в котором а, Ь, с, d, е, /, д, h — произвольные постоянные, а опера- операторы «¦4 *='?• v'=4- »<+'7l представляют собой операторы проективной группы (§45). Таким образом, все системы отсчета, в которых имеет ме- место первый закон Ньютона (необходимое условие инерциальности), связаны друг с другом проективной группой. Этот же результат имеет место и в трехмерном случае. § 59. Второй закон Ньютона. Группа Галилея Рассмотрим теперь вопрос о группах симметрии уравнений Нью- Ньютона, т.е. о тех группах преобразований, которые переводят инерци- альные системы отсчета снова в инерциальные. При этом, как уже отмечалось во введении, следует различать понятия инвариантно- инвариантности и ковариантности уравнений по отношению к тем или иным преобразованиям переменных и времени. Если мы хотим рассмо- рассмотреть вопрос об инвариантности уравнений в какой-то конкретной задаче механики, то следует иметь ввиду конкретную зависимость сил от времени, координат и скоростей, и инвариантность изучать с учетом этой зависимости. Если же нас интересует инвариантность правила составления уравнений, а не самих уравнений (ковариант- (ковариантность уравнений), то зависимостью силы от указанных переменных интересоваться не нужно, рассматривая сами силы в качестве до- дополнительных преобразуемых переменных. При решении вопроса о связи инерциальных систем отсчета друг с другом нас интересует именно вторая постановка. Опять-таки рассмотрим ее на примере одного пространственного измерения тх = F. Искомая группа симметрии в пространстве переменных (*, я, F) рассматривается в виде F' =F Дважды продолженный оператор этой группы имеет вид B) л д д 8 с д д ot ox ov ow oF
268 ГЛ.12. ГРУППЫ СИММЕТРИИ УРАВНЕНИЙ Условие инвариантности гиперповерхности и = mw — F = О есть t/w=0, w = 0, что влечет Как и ранее, Я = Ct + <* + ™(Cv - 6) С = т + НЧх ~&) -V2^x. Поэтому условие инвариантности переписывается в виде О + <х + ^(Cv - 6) - ^?* - 7(П = 0. Поскольку С и ? от F не зависят, то -у может быть только линейной функцией F: 7 = fci +k2F/m и написанное условие распадается на два: О + t/C. - *! = 0, Cv - 6 - ^х - *2 = 0. Подставляя сюда вместо С его выражение через ? и г;, имеем fyt Н- v(Tyxt ~ 6t) - v2Zxt Н- г;туех н- v2G/rx - ftx) - v3^xr - *i = 0, rix-tt- 2v& - 6 ~ <* - *2 = 0. Опять-таки, учитывая независимость ? и 77 от v, получим ?7tt - *i = 0, 277xt - {tt = 0, 2?xt - 77XX = 0, 6* = 0, »?.-26-*2 = 0, G = 0. Как и ранее, из второго и третьего уравнений можно вывести ? =а + 6/ + еж + Л ж + е*2, r)=f + gt + hx + etx + cfx2. Но тогда из первого уравнения следует &i = 0, из последнего уравнения следует с = of = 0. Наконец, из предпоследнего — к2 = h + et - 26-4е*. Поскольку &2 не зависит от t, то е = 0 и, окончательно, иско- искомый оператор группы симметрии уравнения Ньютона в одномерном случае принимает вид С/ = at/i + bU2 + fU3 + pf/4 + ЛС/5,
§ 60. ПОСТУЛАТЫ РЕЛЯТИВИСТСКОЙ МЕХАНИКИ 269 где а, 6, /, д, h — произвольные константы, а базисные операторы таковы: тт ,д тт д F Э ox ox m or Оператор U\ определяет преобразование t' = t + г, означающее изменение начала отсчета времени. Оператор (Уз соответствует сдвигу начала отсчета координаты х: х' = х + г. Оператор [/4 определяет движение нового начала отсчета с постоянной скоростью относительно первоначального начала отсчета: х' = х + г< (г — скорость подвижной системы координат). Оператор G2 определяет одновременное изменение масштаба измерения времени и силы, а оператор [/5 — одновременное изменение масштаба измерения координаты и силы. Изменение масштаба переменных интереса не представляет. Трехпараметрическая группа с операторами \]\, (Уз и (У4 называется группой Галилея. Вычисление группы симметрии уравнений Ньютона в простран- пространственном случае никаких принципиальных отличий от описанной процедуры не имеет. Опуская преобразование масштабов измерения времени, координаты и силы, перечислим все остальные подгруппы группы симметрии уравнений классической механики. 1) Трансляция по времени: t' = t + г, rf = г, F' = F. 2) Трансляция по пространственным переменным: t1 = t, r' = 3) Поступательное движение координатного трехгранника с по- постоянной скоростью: tf = t, r' = г + vt, F' = F. 4) Переход к новому базису: tf = tf, г' = Лг, F' = AF (det Л ф 0). Если в последнем случае ограничиться только ортогональными базисами, то и матрица А будет также ортогональной, а само преобразование будет означать переход к повернутой системе коор- координат. Группой Галилея принято называть подгруппу симметрии урав- уравнений Ньютона, не содержащую подгрупп изменения масштабов и не содержащей переходов к неортогональным системам координат. Такая группа является, очевидно, десятипараметрической. Полная группа содержит двадцать независимых параметров. Глава 13. Релятивистская механика § 60. Постулаты релятивистской механики Как и в случае классической механики, основным аксио- аксиомам релятивистской механики должно предшествовать введение
270 ГЛ.13. РЕЛЯТИВИСТСКАЯ МЕХАНИКА категорий пространства, времени, материальной точки и силы. При этом понятия пространства и времени, в отличие от клас- классического случая, могут вводиться (хотя и не обязательно) в форме единого пространства-времени с индефинитной метрикой dl2 = dt2 - dx2 - dy2 -dz2. Основными для дальнейшего аксиомами будут: A. Аксиома инерциальной координатной системы (системы от- отсчета): существует система координат (и она называется инерци- инерциальной), в которой: 1) любая материальная точка, на которую не действуют никакие силы, описывает прямую; 2) уравнения Максвелла в пустоте имеют вид с) R 1 /)Р div? = 0, divJ3 = O, rot?+ —= 0, rot В - — — = 0, ot сг at где Е и В — электрическая и магнитная составляющие электро- электромагнитного поля, с — скорость света. B. Аксиома динамики: в любых инерциальных системах за- закон движения материальной точки выражается дифференциальным уравнением второго порядка, имеющим пределом уравнения Нью- Ньютона при с —У оо: lim Ф(г} г, г, г, m, F, с) = mr — F, с -* оо где т и F — параметры предельного уравнения, т.е. масса и сила. В классической механике уравнения динамики (уравнения Нью- Ньютона) постулировались и служили критерием инерциальности си- системы отсчета. В релятивистской механике роль критерия инерциальности си- системы отсчета выполняют постулируемые уравнения электродина- электродинамики, а уравнения динамики точки надлежит вывести. С этой целью необходимо выяснить, как связаны друг с другом инерциальные системы координат. Поскольку в любой инерциаль- инерциальной системе координат уравнения Максвелла обязаны иметь один и тот же вид, то преобразования, связывающие такие системы, должны быть симметриями этих уравнений. Из уравнений Максвелла последовательно получаем: rotJ5 = Ё => rot rot ? = -Ё => E-V2E = О (без ограничения общности с= 1). Рассмотрим далее ради простоты одномерный случай (там, где неодномерность будет существенной, это будет указано) д2Е д2Е _ dt2 дх2 ""
§ 61. ГРУППА СИММЕТРИИ УРАВНЕНИЙ МАКСВЕЛЛА 271 § 61. Группа симметрии уравнений Максвелла Для нахождения группы симметрии этого уравнения используем условие [Л, U] = X(t} x)A (§54), в котором операторы А и U имеют вид Определяющие уравнения для нахождения коэффициентов ис- искомого оператора получаются в силу этого условия такими: 2& = Л, 2г)х = A, r]t = (Xi fa - fxx = 0, г)и - т)хх = 0. Из ?t = т]х и rjt = ?х следует ?tt = Ixt, ?** = Itx- Следовательно, независимы только три соотношения: представляющие собой систему трех уравнений относителоно трех неизвестных функций. Множество решений этой системы бесконеч- бесконечно, так что алгебра симметрии волнового уравнения бесконечно- бесконечномерна. Однако нас интересуют только такие симметрии, которые переводят прямые в прямые, т.е. их следует искать в проективной группе, построенной в предыдущем параграфе: ? = a -f bt + ex -f dtx + et2, rj = / + gt + hx + etx + dx2. Подставляя эти выражения в рассматриваемые соотношения, нахо- находим 2F + dx + 2et) = А, 2(А + et + 2dx2) = Л, 0 + ex = c+ eft. Из последнего соотношения следует д = с, е = cf = 0. После чего из первых двух находим Ь = Л. Следовательно, искомый оператор получен в виде где [/i = d/dt — оператор трансляции по времени, [/2 = <9/9я— оператор трансляции по координате, (У3 = td/dt + xd/dx — оператор группы подобия, [/4 = xd/dt + td/dx — оператор группы Лоренца. Таким образом, единственной группой, отличной от трансляций и однородных растяжений, которая исчерпывает все инерциальные системы отсчета, является группа Лоренца.
272 ГЛ. 13. РЕЛЯТИВИСТСКАЯ МЕХАНИКА § 62. Оператор второго продолжения. Дважды продолженная группа Лоренца В дальнейшем нам понадобится дважды продолженный оператор группы Лоренца, который вычисляем так, как это делалось в § 52: BU^ + 'f + (ii)|r3«|r. dt дх дх дх В соответствии с теоремой единственности группы (§46) по этому оператору восстанавливаем саму группу, решая дифференциальные уравнения ?-¦ ?='¦ ?—*"¦ %--«*¦ B) где правые части составлены из компонент оператора Цл- Из первых двух уравнений находим t' = t ch т + х sh г, я' = tf sh r + х ch r. Из третьего находим Последним соотношением удобно воспользоваться, чтобы придать каноническому параметру т механический смысл. Пусть относи- относительно неподвижной системы отсчета (*, х) система (*', х') движется по пространственной координате со скоростью v. Тогда для начала координат системы (<', х') его скорость х' равна нулю, а х = vy что дает т = In / Подставляя это выражение для т в sh г и ch г, находим уравнения группы Лоренца, выраженные через параметр v: Оставшиеся два дифференциальных уравнения позволяют найти ., x-v .., [у/1 - v2\ .. I — XV \ 1-IU /
§ 62. ОПЕРАТОР ВТОРОГО ПРОДОЛЖЕНИЯ 273 Это и есть полные выражения для дважды продолженной группы Лоренца. Первые два соотношения представляют собой собствен- собственно группу Лоренца, третье — закон преобразования скоростей, четвертое — закон преобразования ускорений. Замечание 1. В исходном операторе Лоренца С/4 время и координата входят совершенно симметричным образом. В получен- полученных выше выражениях для группы эта симметрия утеряна. Это означает, что где-то в ходе построения теории возникла ситуация неединственности и был осуществлен переход к одной из симме- симметричных ветвей теории. Это произошло при продолжении оператора и расшифровке смысла канонического параметра группы. Переход к движущейся по оси х системе координат означает, что каждому значению t ставится в соответствие новое начало отсчета х (рис. 74). / t' X, X Л / I / I х' Рис. 74 Рис. 75 Ничто не мешает рассуждать иначе. Каждому значению х поставим в соответствие новое начало отсчета t (рис. 75). Физически это означает, что в каждой точке оси х стоят свои часы, они все идут в одном темпе, но по-разному заведены. Пример такого рода и был приведен в §58. Нетрудно построить преобра- преобразования, заменяющие в этом случае преобразования Лоренца. Такие преобразования можно назвать сопряженными преобразо- преобразованиями Лоренца. Если обозначить "скорость" перемещения систе- системы [t\ х') по оси времени через о>, то после выкладок, совершенно аналогичных приведенным, получим t — их V = Здесь для ясности сохранен произвольный масштаб измерения ско- скорости света с. Эти преобразования удовлетворяют обоим условиям, накладываемым на преобразования, переводящие инерциальные си- системы координат снова в инерциальные. То есть свободные ма- материальные точки в координатах (*', х') движутся по прямым, и уравнения Максвелла в них имеют прежний вид. 19 Зак. 233
274 ГЛ.13. РЕЛЯТИВИСТСКАЯ МЕХАНИКА Инвариантными относительно найденных преобразований явля- являются и уравнения релятивистской динамики, которые представляют основную цель наших построений. Замечание 2. В общем, пространственном случае оператор второго продолжения трехпараметрической группы Лоренца имеет вид дт 'дт 'дт' где B) Ux B) Uy B) Uz , г = X У Z 1 0 0 0 1 0 0 0 1 B) и = Три оператора группы в пространственном случае соответствуют трем компонентам скорости v. § 63. Инварианты группы Перейдем к вычислению инвариантов группы Лоренца. Роль инвариантов исключительно высока. Они представляют собой ве- величины, зависящие от времени, координат, скоростей и ускорений, численное значение которых не зависит от того, в какой системе координат их вычислять. Следовательно, именно они и харак- характеризуют физику явлений, а не выбор системы отсчета. Если требуется построить какую-нибудь теорию, инвариантную относи- относительно преобразований Лоренца, она должна быть выражена через инварианты этих преобразований. Цель настоящего параграфа — уравнения релятивистской ме- механики — как раз и представляет собой иллюстрацию сказанного. Дифференциальные инварианты до второго порядка включи- включительно находятся из уравнения B) dG dG (л .2x5G 0...<9G . U G = 0 или z— + t—-+ 1-х2)— -Зхх-— =0. 4 dt дх дх дх Отсюда следуют три инварианта: Инвариант G\ носит название интервала. Для нахождения интегральных инвариантов исходим из урав- уравнения (см. §53) B) U J+iJ = 0,
§ 63. ИНВАРИАНТЫ ГРУППЫ откуда следует т.е. интегральный инвариант группы Лоренца имеет вид G2,G3)dtt где М — произвольная функция инвариантов. В частности, инвариант 275 носит название собственного времени частицы, движущейся со скоростью х. Смысл введения такого названия для этого инварианта требует пояснения. Пусть, в частном случае, материальная точка движется с по- постоянной скоростью: х = v. Тогда с этой точкой можно совместить начало подвижной системы (*', х'). Связь новых переменных со старыми: I1 = (t — vx)/y/l — v2, x' = (x — vt)/y/l — v2 позволяет выяс- выяснить, как течет время на часах, помещенных в подвижную точку. Для нее х' — О, откуда х = vt и V = y/l — v2t, что совпадает со значением интегрального инварианта в случае постоянной скорости. Приведенное рассуждение оправдывает приписывание инвариан- инварианту /0>/1 — v2 dt смысла собственного времени, но ничего не дока- доказывает. Например, рассмотрим такой интегральный инвариант: с2>/A-*2/с2K dt. Он обладает тем свойством, что при х = 0 тоже совпадает с найденным выражением для собственного времени при постоянной скорости, а при с —»• оо стремится к ньютоновскому "абсолютному" времени. Система координат, совмещенная с неравномерно движущейся точкой, является неинерциальной и прежде чем говорить о времени в какой-либо точке такой системы (в частности, в начале коорди- координат), необходимо указать закон перехода от инерциальной системы к неинерциальной. При построении таких законов приходится вво- вводить новые постулаты. Поэтому и отождествление fQ у/1 - х2 dt с собственным временем частицы, движущейся со скоростью х, сле- следует считать новым постулатом, независимым от уже введенных. 19*
276 ГЛ. 13. РЕЛЯТИВИСТСКАЯ МЕХАНИКА § 64. Релятивистские уравнения динамики точки После того как найдены инварианты, можно приступить к нахождению обобщения для уравнений Ньютона. Согласно аксиоме В (§60) эти уравнения должны иметь одинаковый вид в любой инерциальной системе координат. Общий вид уравнений второго порядка, инвариантных относительно заданной группы (§54), есть G3 = <*>(Gi,G2, Ftm). В силу однородности пространства ( допустимость группы транс- трансляций) зависимости от G\ и Gi быть не может, так как G\ и Gi не являются инвариантами трансляций, поэтому уравнение динамики приобретает вид G3 = ${F, тп). Используя найденное выше выраже- выражение для G, получим (возвращаясь к измерению с в произвольном масштабе): 7, m). V I (x/c) J Из условия m находим Ф(F) m) = F/m. Для получения трехмерного обобщения перепишем найденное уравнение в виде Вычислим функцию Лагранжа из условия дС гпх откуда находим Трехмерное обобщение, учитывающее инвариантность лагранжиана относительно поворотов, есть С = -my/l - х2 - у2 -i2.
§ 65. О НЕИНЕРЦИАЛЬНЫХ СИСТЕМАХ ОТСЧЕТА 277 Заметим, что действие по Гамильтону 5 = -т fy/l -х2 -у2 - i2dt = -m j у/\ - и2 dt есть интегральный инвариант группы Лоренца, поэтому простран- пространственные уравнения релятивистской механики имеют вид d { тх \ _d f my \ dt VvT^W ~ " dt \vr^2) " dt mi _ Поскольку при записи уравнений Лагранжа в новых переменных (*, ж, у, z) -> (*', ж', t/, г') происходит также и перепроектирование их на новые оси, то закон преобразования левых частей написанных уравнений навязывает тот же закон и для преобразования правых частей. В трехмерном случае при переходе от одной инерциальной системы к другой стоящие в правых частях силы изменяются. Для одномерного случая это не так; сила F одна и та же во всех системах координат и представляет собой обычную ньютонову силу. В одномерном случае уравнение механики инвариантно по отношению к лоренцевой группе, в трехмерном оно ковариантно. § 65. О неинерциальных системах отсчета К построению законов перехода от инерциальной системы ко- координат к неинерциальной можно подойти следующим образом. Пусть относительно неподвижной системы отсчета, которую будем обозначать (to, жо), рассматриваемая точка xo(to) (рис. 76) движется с кусочно-постоянной скоростью. Введем в начале ка- каждого нового участка движения с постоянной скоростью свою непо- неподвижную систему координат: дви- движение на участке со скоростью V{ рассматривается в неподвижной си- системе координат (/,-, ж,). Обозна- Обозначим оси подвижной системы ко- координат, связанной с рассматрива- рассматриваемой точкой на том же участке движения, через (ту, ?,-). Очевидно имеем: Т{ = > & = а Рис. 76 Обозначим момент времени *0) в который осуществляется пере- переход к участку движения со скоростью v,-, через tlQ (/§ = 0). Тогда Х{ — жо — Yl%k=:oVk^o^1 —*o) и соотношение для ?, принимает вид
278 ГЛ.13. РЕЛЯТИВИСТСКАЯ МЕХАНИКА В числителе стоит интегральная сумма; увеличивая число разбие- разбиений и переходя к пределу |t?+1 -*q| < h -» 0, получим Аналогичные рассуждения при дополнительном предположении, что в процессе перехода от одного участка движения с постоянной скоростью к другому время во всех точках пространства меняется непрерывно, приводят к соотношению Полученные соотношения и определяют закон перехода от инерци- альнай системы отсчета к неинерциальной: (t} х) -> (t*, х*). Если v = vo = const, эти преобразования переходят в преобра- преобразования Лоренца. Время, текущее в начале координат подвижной системы (т.е. при х* = 0), совпадает с введенным выше понятием собственного времени Jo (t)dt.
Часть VI Гамильтонова механика § 66. Уравнения Гамильтона В §29 были введены уравнения Рауса. Рассмотрим частный случай этих уравнений, когда непотенциальные силы отсутствуют, а преобразованию Лежандра подвергаются все обобщенные скорости. Функция Рауса в этом случае называется функцией Гамильтона и обозначается обычно буквой И\ где pi = _ (г = 1,...,п) — обобщенные импульсы, а функция q = /(<, g, p) представляет собой результат обращения их относительно q. Уравнения движения, записанные в фазовых переменных, имеют вид и называются уравнениями Гамильтона. Свойства функции Гамильтона. 1) Из свойств функции Рауса (§ 29) непосредственно следует dt "" dt* dq ~ dq' 2) Вычислим полную производную функции Гамильтона вдоль действительных траекторий: а"Н дП y^ (дН . дП . \ дП +* + P Если функция Гамильтона явно от времени не зависит [dH/dt = 0), то dH/dt = 0 влечет 7i = const. To есть независящая от времени функция Гамильтона является первым интегралом системы. 3) Выясним структуру и физический смысл этого первого инте- интеграла. Для этого вначале установим структуру функции Гамиль- Гамильтона. Общая структура функции Лагранжа такова (§25):
280 ГАМИЛЬТОНОВА МЕХАНИКА Коэффициенты a,ij и 6, зависят от времени и от обобщенных коор- координат. Следовательно, обобщенные импульсы могут быть найдены в виде Pi = Щ: = /"ijVj 6 Эти линейные уравнения относительно q могут быть разрешены, поскольку det{a,j} ф 0 (§25): где hij — коэффициенты матрицы, обратной к матрице {a,j}. Подставляя это выражение для q в формулу, определяющую функцию Гамильтона получаем !С - bk){pi - bi)- _ 1 у^ l y^l l l sr^h b г и 2 ~i 2 4"^ ~~^ *• j *• j *» j Если система консервативна, то6 = ОиТо = Ои функция Гамиль- Гамильтона совпадает с полной энергией, выраженной через переменные 1 «i И полученный первый интеграл (свойство 2) совпадает с интегралом полной энергии. Если система неконсервативна, но dH/dt = 0, то система на- называется обобщенно консервативной, а первый интеграл совпадает с интегралом Пенлеве-Якоби (§27). 4) Уравнения Гамильтона в расширенном конфигурационном пространстве (/,<?)• Рассматривая время в качестве дополнительной обобщенной ко- координаты, можно привести неавтономные уравнения Гамильтона к автономной форме. Для этого необходимо выяснить, что будет играть роль импульса, сопряженного координате t) и как следует трансформировать функцию Гамильтона с тем, чтобы она зависела от нового состава переменных.
§ 67. СВЯЗЬ ЗАКОНОВ СОХРАНЕНИЯ 281 Пусть исходная функция Гамильтона есть W(tt qt р), а транс- трансформированная 7i*(t, Г, g, р), в которой. Т представляет собой им- импульс, сопряженный t. Уравнения Гамильтона запишем раздельно по переменным (t, Т) и (д, р): i- дт' ~дГ' Для того чтобы эта система описывала исходную неавтономную систему с заданным гамильтонианом H(t, q, p), достаточно положить Поскольку dt dt ~ dt} то второе уравнение системы можно проинтегрировать, и мы полу- получаем, что вдоль траекторий рассматриваемой системы обобщенный импульс, сопряженный времени, отличается от -И на константу: Т= -Щ1% q,p)+ const. § 67. Связь законов сохранения со свойствами симметрии гамильтоновых систем Теорема Нётпер. Если существует группа Ли t'=t+Z{t,q)T+ ..., g'=? + 77(*, q)r+ ..., для которой действие по Гамильтону /: C(t,q,q)dt есть интегральный инвариант (§53), то у механической системы, описываемой лагранжианом ?, есть первый интеграл , q} p) = const, где pi — обобщенные импульсы, а И — гамильтониан. 18 Зак. 233
282 ГАМИЛЬТОНОВА МЕХАНИКА Доказательство. Полученное в § 53 условие инвариантности функционала имеет в рассматриваемом случае вид Или, в развернутой форме: <9? у, дС_ ^ • д? % i Используем уравнения Лагранжа дС d ВС с помощью которых условие инвариантности можно переписать в виде ВС ^ d дС v-^ . дС sr^:. дС df n Поскольку dC/dt = -дП/dt = -dU/dt и 3?/%- =р,-, то [ \ ( \ df ) + С = откуда d(-ZU + Ei lidC/dqi)/dt = 0. Рассмотрим конкретные примеры. Группа трансляций по времени: t' = t + т, q' = q. Если действие по Гамильтону инвариантно относительно этой группы, то в силу доказанной теоремы, поскольку rj = 0, f = 1, имеем Щя> р) = const. То есть закон сохранения энергии есть следствие инвариантности действия по отношению к трансляции по времени. Группа трансляций по координатам: t1 = <, q'k = qk + тщ q\ = ч< (»•**)• В этом случае ^ = 0, щ = 1 и из теоремы следует р* = const (закон сохранения импульса). Пример. Механическая система, содержащая п материальных точек: i^j(x? + ^ + i?) + V(xIyI г).
§ 67. СВЯЗЬ ЗАКОНОВ СОХРАНЕНИЯ 283 Если эта система допускает трансляцию по пространственной координате вида х[ = хг + г, ..., х'п = хп + г, то 77i = ... = т}п = 1, ? = 0 и из теоремы Нётер следует ,x, = const (закон сохранения количества движения). Если эта система допускает поворот вокруг какой-либо про- пространственной оси, например такой: *'* =**, Ук -Ук cos т + zk sin r, zk=-yk sin т + z* cos r с оператором srf д д \ то, поскольку в этом случае ? = 0, ту* = 0, 77*+„ = гА, т)к+2п = = —У/с (А = 1, ..., п), из доказанной теоремы следует »(?»2» ~ у***)= c°nst (закон сохранения момента количества движения). Замечание. Если действие по Гамильтону инвариантно по от- отношению к некоторой группе, содержащей преобразование времени, то первый интеграл, доставляемый обсуждаемой теоремой, малопо- малополезен, поскольку он оказывается зависящим от времени и, следо- следовательно, не позволяет понизить порядок автономной системы (§27). Пример. Действие по Гамильтону для системы с лагранжиа- лагранжианом С = тлг/2 (материальная точка с одной степенью свободы, движущаяся по инерции) инвариантно относительно группы t' = t + 2tr} x1 = х + хт. (i) Действительно, в этом случае JJ = 2td/dt + xd/dx — xd/dt и условие инвариантности действия есть 01 ОХ ОХ которое для С = гпх2/2, очевидно, выполнено. 18*
284 ГАМИЛЬТОНОВА МЕХАНИКА Поэтому, учитывая, что ? = 2*, rj = я, Ч = р2/Bт), получаем выражение для первого интеграла h xp = const. т § 68. Инварианты гамильтоновых систем На гамильтонову систему дифференциальных уравнений . дП . &Н можно смотреть, как на уравнения, определяющие в фазовом про- пространстве (<7, р) однопараметрическую (t — параметр) группу Ли, оператор которой, очевидно, имеет вид Любой инвариант такой группы G(q} p), т.е. функция, для которой UG = 0, является первым интегралом исходной системы. Выражение называется скобкой Пуассона двух функций И и G. Свойства скобки Пуассона. 1) Линейность по каждому аргу- аргументу: {И, Aid + A2G2} = \i{n, Gi} + \2{H, G2}, Ai, Аг — вещественные числа. 2) Кососимметричность: {Н, G) = -{G, П). 3) Справедливость правила Лейбница при дифференцировании по любой переменной, например, &™-«И ¦{*¦?}¦
§ 68. ИНВАРИАНТЫ ГАМИЛЬТОНОВЫХ СИСТЕМ 285 Эти свойства очевидны. Рассмотрим теперь три нужное чи- число раз дифференцируемые функции Щя^р), G{q}p)} F(qt p). Они порождают три гамильтоновые группы Ли с операторами U - — —-— — dp dq dq др} dp dq dqdp} dp dq dq dp 4) Скобка Пуассона двух функций % и G представляет собой функцию Гамильтона той дифференциальной системы, которая определяется коммутатором операторов систем с гамильтонианами W и G. Иными словами: G}3 d{H,G}d Докажем это свойство. Правило вычисления коммутатора, при- приведенное в §46, в рассматриваемом случае имеет вид ... / dG д%\ д ( 8G дП\ д = (г ~di) " Г1 WU д~я ~ ~ (r' WJ" lGl Wi) Щ- Учитывая свойства 2 и 3, и получаем утверждаемое. 5) Тождество Пуассона: {{?{, G}, F) + {{F, П)% G) + {{G, F}, П} = 0. Доказательство. Учитывая свойство 4, перепишем тождество Пуассона в виде [Un, UG)F+[UF) Un]G+[UG, UfYH = 0. В соответствии с определением скобки Пуассона правая часть рассматриваемого тождества представляет собой линейную форму вторых производных функций Я, G, F. Поэтому тождество будет доказано, если мы установим, что оно вторых производных не содержит вовсе. Поскольку тождество симметрично относительно входящих в не- него функций, то достаточно показать отсутствие вторых производных в одной из них. Возьмем к примеру F. Первый член последнего
286 ГАМИЛЬТОНОВА МЕХАНИКА соотношения вторых производных не содержит, поскольку комму- коммутатор [U-h, Ug] есть оператор первого порядка. Оставшиеся два члена перепишем, используя определение коммутатора: [Uf, Un]G + [UG, UF)n = (UFUn - UnUF)G + (UGUF - UFUG)H. В последнем соотношении вторые производные функции F содержат лишь "половинки" коммутаторов: В этом же соотношении для членов, содержащих только вторые производные F, очевидно, имеем -UnUFG=-UGUFH) что и приводит к сокращению с такими же членами во втором слагаемом. 6) Если G и F — первые интегралы гамильтоновой системы с гамильтонианом гН) то их скобка Пуассона {G, F} тоже является первым интегралом при условии, что она не обращается тожде- тождественно в ноль. Доказательство следует из тождества Пуассона, в котором по условию {Ht G} = 0 и {F, 4} = 0, следовательно, и {{G, F}, П} = О, а это означает, что {G, F} — первый интеграл. Пусть гамильтонова система дифференциальных уравнений порождает группу преобразований фазового пространства в себя {я> Р) -* (<7'>Р')> действующую вдоль траекторий этой системы. Ядро группы: , дП дП Pi =Pi ~ T-* dqi Оператор группы: Pi d9i dqi dpi Ниже речь идет об интегральных инвариантах этой группы. Теорема Лиувилля (о сохранении фазового объема). Интеграл = / ... dqn dpx ... dpn V есть инвариант любой гамильтоновой группы. Иными словами,
§ 68. ИНВАРИАНТЫ ГАМИЛЬТОНОВЫХ СИСТЕМ 287 если при отображении (q, р) —> (qf, р') область интегрирования изменилась: V —> V') то интеграл по этой области постоянен: / dqi ... dqn dpi . . . dpn = I dqx . . . dqn dpi ... dpn. Доказательство. Воспользуемся критерием инвариантности по- подобного рода интегралов, установленным в §53: С/Ф + <?div77 = 0. В нашем случае Ф = 1, а div iv г] = > -г—т = 0. Пример. Гамильтонова система <j' = р', р' = q' с гамильтони- 9 9 аном % = (р' - д' )/2 порождает группу отображений фазового пространства в себя: q-' = qcht +psht} p' = qsht + pcht (t — параметр группы). Здесь g, р — начальные условия, a q1 }р' — решение системы. Рассмотрим интеграл ffdqdp. ff При отображении (q,p) —> {я',р') граница круга / = q2 + р2 = 1 преобразуется в границу: р, t) = ./(«. Р) - Рис. 77
288 ГАМИЛЬТОНОВА МЕХАНИКА Теорема Лиувилля утверждает (рис. 77): jj dqdp= I I dqdp. J'(9,P,t)<l Теорема (Интегральный инвариант Пуанкаре). Криволинейный интеграл /г является инвариантом произвольной гамильтоновой группы тогда и только тогда, когда с — скалярная константа. Доказательство. Для сокращения выкладок рассмотрим слу- случай, когда q и р — скаляры. 1) Необходимость: если группа q' = q + 771(9, p)t + ..., р1 = = р + 772(9, p)t + • • • гамильтонова, то Q = ср} а Р = 0. Условие инвариантности интеграла подобного типа получено в §53. Оно состоит в требовании равенства нулю производной от этого интеграла вдоль траекторий группы: ?r = i<f ?(<?> Р) at at J Эта производная была вычислена в виде (в обозначениях этого параграфа) Для равенства этой производной нулю необходимо и достаточно p V dp dpjq Если рассматриваемая группа гамильтонова, то и написанное условие принимает вид
§ 68. ИНВАРИАНТЫ ГАМИЛЬТОНОВЫХ СИСТЕМ 289 Отсюда вытекает {П, Qp} = {П, Ря] или {K,QP-Pq} = 0. Поскольку И — произвольно, то отсюда следует QP-Pq = с. Частное решение этого уравнения есть Q = cp, P = 0. Общее решение есть сумма какого-либо частного и общего решения однородного уравнения « дМ п дМ ^+ P M{q,p) — произвольная дифференцируемая функция. Необходи- Необходимость доказана. 2) Достаточность: если интеграл •?¦ J2= <f>pdq является интегральным инвариантом группы я' = я + т{я> р)*+ •••! р' = р то эта группа — гамильтонова. Полученное выше условие, для того чтобы dfc/dt = 0, в данном случае приобретает вид Поскольку Up = 772, то из него следует дт_ дт_ _ 0 dp dq а это значит, что 771 = дЛ/др, щ — —dW/dqt где W(q, p) — произ- произвольная дифференцируемая функция. Теорема полностью доказана. Случай, когда гамильтониан явно зависит от времени, может быть, как это показано в § 66, сведен к автономному, введением импульса, сопряженного времени. Однако получаемая таким обра- образом автономная система обладает более простой структурой, чем в
290 ГАМИЛЬТОНОВА МЕХАНИКА случае автономных систем общего вида. Поэтому и к доказанной выше теореме, которая в неавтономном случае формулируется для интегралов в виде ? Tdt+pdq, могут быть добавлены некоторые дополнительные детали. Действительно, контур Г, рассматриваемый в пространстве (*, Т, q} p) , может выбираться из более узкого класса. Вместо того чтобы его рассматривать в параметрической форме i=i(a), T = T(a), с произвольными функциями параметра а, сузим класс кри- кривых Г, воспользовавшись тем, что вдоль траекторий системы Т = ~'H{t) <?, р), и выберем параметризацию Т зависимым от пара- параметризации t, q, p способом: T{a) = -n[t(a),q(a),p(a)}. Тогда интегральный инвариант Пуанкаре можно рассматривать в пространстве меньшего числа переменных: t, q, p и он приобретает вид 4- В этом частном случае интегральный инвариант Пуанкаре на- называется инвариантом Пуанкаре-Картана. Замечание. Из доказанного ранее следует, что интеграл $[—% dt + pdq] является интегральным инвариантом группы, опре- определяемой уравнениями: dr dr др} dr dq Однако этот интеграл инвариан- инвариантен и относительно более широкой группы dt . ч dq 1л ,8П г, dp дП Рис. 78 где тг(<, q, p) — произвольная ска- скалярная функция. У этой группы те же самые траектории. Меняется лишь рас- расписание движения вдоль каждой траектории. Иными словами, интеграл Пуанкаре-Картана имеет одно и то же значение вдоль
§ 68. ИНВАРИАНТЫ ГАМИЛЬТОНОВЫХ СИСТЕМ 291 любой кривой Г, охватывающей одну и ту же трубку траекторий, а не только вдоль кривых, в которые сносится начальный контур самими траекториями (рис. 78). Этот факт следует из теоремы. Теорема. Для того чтобы интеграл $—И dt + р dq] был инте- интегральным инвариантом группы dt/dr = 7Г, dq/dr = кМ, dp/dr = -кМ с произвольной функцией тгB, q, p), необходимо и достаточно: КЛ Ш КГ Ш Доказательство. Выпишем ядро группы tf =t + тгг + ..., q' —q + пМт + . . . , p1 -p + пЯт H- . . . и ее оператор Под действием группы интеграл преобразуется так: [-Щ?, ?'- Р') Л' + P'dq'} = /[-¦«(<, ?, Р) Л + РЛ]+ Необходимое и достаточное условие инвариантности есть /'- Updq-П dn +pd(nM)) = 0. Воспользуемся интегрированием по частям: 6 И dn = — Ф 7Г(Ш, <ppd(nAi) = — ФпМ dp. Тогда dt + (tf + nq)dq + (-M +'Hp)dp\ n = 0. В силу произвольности тг dq др я р Эта переопределенная система удовлетворяется единственным ре- решением М=-ПЯ) М=ПР.
292 ГАМИЛЬТОНОВА МЕХАНИКА § 69. Канонические преобразования Начнем с рассмотрения примера. Пример. Гамильтониан одномерного линейного осциллятора имеет вид % — (р2 -f <72)/2, а соответствующие ему уравнения дви- движения таковы: q = р, р = ~q. В этих уравнениях движения выполним замену переменных (<7> Р) —>¦ (^i г): 9 = rcostp, p = rsiiKp. Внося эту замену в уравнения, получаем уравнения движения осциллятора в новых переменных: ф =¦ — 1, г = 0. Можно поинтересоваться, во что переходит функция Гамильтона при этой замене переменных: И{(р}г) = U(rcos(p, rsiiKp) = -г2. Мы видим, что в новых переменных утрачена связь преобра- преобразованной функции Гамильтона с преобразованными уравнениями, поскольку дг ~rt L Уравнения Лагранжа (§ 26) были ковариантны по отношению к любым допустимым (дифференцируемым) заменам обобщенных координат. Уравнения Гамильтона свойством ковариантности по отношению к любым допустимым преобразованиям фазовых переменных не обладают. Класс замен фазовых переменных, для которых ковариантность уравнений Гамильтона имеет место, и представляет собой канони- канонические преобразования. Определение. Преобразование (q, р) —> (д, р) называется кано- каноническим, если оно сохраняет связь преобразованных уравнений с преобразованным гамильтонианом, каким бы этот гамильтониан ни был. Иными словами, преобразование (q, р) —> (д, р) называ- называется каноническим, если для любого гамильтониана коммутативна следующая диаграмма: q — Tip, p 7iq Замечание. В литературе встречается определение валентных канонических преобразований. Так называются преобразования, переводящие любую гамильтонову систему снова в гамильтонову,
§ 69. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 293 нако гамильтониан преобразованной системы получается из га- гамильтониана исходной умножением на константу: ?{(?, р) = c4[q(q, p), p(q} р)]. Эта константа с называется валентностью пре- преобразования. Такое расширение класса канонических преобразо- преобразований большой содержательностью не обладает, поскольку легко показать, что любое валентное каноническое пребразование есть композиция канонического преобразования и преобразования растя- растяжения: q = k\q, p = &2р. Условия каноничности замены. Введем обозначения для фазо- фазового вектора: х = (q, р), первые h координат которого совпадают с обобщенными координатами д,-, а оставшиеся п координат — с обоб- обобщенными импульсами р,. В этих обозначениях систему уравнений Гамильтона можно записать в следующей форме: или, в краткой записи х = JdH/dx, где J — симплектическая матрица 2п х 2п: О Е J " -Я О а Е — единичная п х п матрица. Матрица J обладает свойством J2 = —?*2пх2п (аналог мнимой единицы). Рассмотрим теперь замену переменных х —> х: х = х(х) и установим, каким условиям должна удовлетворять функция х(х), чтобы эта замена была канонической. Очевидно, имеем з J i,* J С другой стороны дН _^дП dxi дхк *-J dxi дхк Окончательно получаем дх{ dxi д'\ X{ = Или, в краткой записи: Для того чтобы замена х(х) была канонической, необходимо и
294 ГАМИЛЬТОНОВА МЕХАНИКА достаточно Поскольку найденное условие каноничности замены содержит ограничения на производные от уравнений замены, то оно носит название локального критерия каноничности. Локальный критерий каноничности выделяет в множестве всех дифференцируемых замен многообразие второго порядка канонических замен. Пример. Выделить из семейства линейных преобразований вида u, v — вещественные числа, многообразие канонических замен. Решение. Здесь Используем найденный критерий: Перемножив матрицы слева, находим: О -и2 - v2 и2 + v2 О I ° Ч -1 О откуда Многообразие канонических замен в плоскости (it, v) всех рас- рассматриваемых замен представляет собой окружность единичного радиуса. Если заметить, что матрицу обсуждаемого линейного преобра- преобразования можно представить в виде E = в котором видно, что семейство таких преобразований изоморфно алгебре комплексных чисел, то многообразие канонических пре- преобразований в нем изоморфно группе вращений. Теорема. Отображение, осуществляемое фазовым потоком га- мильтоновой системы, является каноническим.
§ 69. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 295 Доказательство. Пусть семейство замен х —> х: х = х(х, г) порождается гамильтоновой системой Введем следующие обозначения: A — dx/dx, J — AJAT. Общий элемент последней матрицы есть функция хит: Jij(x) т). Любая такая функция представима рядом Ли (§47): ЛЛХ* т) = ЛЛХ* °) + г{и^)т=0 + ... Если f/J|r=0 = 0, то и все Ukj\T=o = 0. Вычислим UJ\t~q. Последовательно имеем dU х = г + J —г / J dx2 = J+[J rd2n dx2 dx2 Коэффициент при т равен нулю. Таким образом, J = J, т.е. фазовый поток гамильтоновой системы удовлетворяет условию ка- каноничности. Производящие функции. Так называются функции, позволяющие конструктивно строить канонические преобразования посредством применения к этим функциям некоторых простых операций. Для введения производящих функций воспользуемся установлен- установленным ранее взаимнооднозначным соответствием между уравнениями Гамильтона и интегральным инвариантом Пуанкаре-Картана: dt dq_ dr dp I dr QOJ r —% dt + p dq] — инвариант. dp
296 ГАМИЛЬТОНОВА МЕХАНИКА Рассмотрим преобразование (q, p) -> (q, р). В новых переменных уравнения приобретают вид Если интегральный инвариант в новых переменных сохранит свою форму то, по доказанному ранее, М - дИ/др, Я = -dti/dq и, следова- следовательно, преобразование (q, p) -> (f, p) будет каноническим. Для того чтобы в результате преобразования инвариант Пуанка- ре-Картана сохранил свою форму, необходимо и достаточно, чтобы измененная часть подынтегрального выражения представляла бы собой полный дифференциал: <t[-Hdt + pdq] = {[--Hdt + pdq + dF(tt qtp)]. Произвольную функцию F(t, q)p)) используя рассматриваемое пре- преобразование (qtp) —> {q,p)) можно записать так: Подставляя это представление под знак полного дифференциала, находим С , // ~ ,_ 3S , dS , 55 , \ <f> (—7^ dt + р dq) = Ф —?f dt -\- pdq + -^- dt + -5— ag H- -5— ap , Уг Уг\ ^ cty Ф / откуда следует dS dS Таким образом, конструктивный алгоритм построения канони- канонического преобразования состоит в следующем. Взять произволь- произвольную дифференцируемую функцию смешанных переменных вида S(t, 9> Р)- Составить соотношения (¦). Разрешить их либо отно- относительно новых переменых либо относительно старых. Результат такого разрешения и будет представлять собой каноническое пре- преобразование. Пример. S = qp2. Соотношения (*) дают dS .2 . 55
§ 69. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 297 Разрешая их относительно новых переменных, получаем канониче- каноническую замену: q = 2q^/p, р = yjp. Выбор состава смешанных переменных в производящей функции не является единственно возможным. Возможен следующий выбор: , р), *, Я> р), Для трех новых функций S2> «?з и 54 выкладки, аналогичные выполненным, приводят к соотношениям: —-, ар 554 Пример. Построить производящие функции для семейства ка- канонических преобразований = и v — V U Решение. Для нахождения производящей функции Si необхо- необходимо разрешить эту систему относительно р и q: Р = p + vq и и Таким образом, для нахождения S\ имеем уравнения dS\ р + vq dS\ q + vp dq и ' dp и откуда 5i = Для нахождения производящей функции решить эту систему относительно р и q: , р) необходимо раз- разЯ = Я- VP p-vq и и и производящая функция получается такой:
298 ГАМИЛЬТОНОВА МЕХАНИКА Для нахождения производящей функции 5з(<7>?) рассматривае- рассматриваемую систему разрешаем относительно р и р: что дает 1 ъ Наконец, для функции S^(p) p): S4 = Мы видим, что в этом примере производящие функции S\ и 5 не существуют для симплектического преобразования: а функции 5з и 54 не существуют для тождественного (рис. 79): = Е Рис. 79 § 70. Уравнение Гамильтона-Якоби Рассмотрим гамильтонову систему
§ 70. УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ 299 Поставим для нее задачу найти каноническую замену переменных (<7> Р) -* (?> р), приводящую ее уравнения к наипростейшей форме. Воспользуемся для этого производящей функцией первого типа Q(i _. 55 . 8S Эта функция выбрана для определенности. С равным успехом можно было бы воспользоваться другими. Выше была установлена связь между старым и новым гамильто- гамильтонианами в силу канонической замены переменных: Ц ='Н + dS/dt. Уравнения движения принимают наиболее простую форму, если % = 0. Это условие приводит к уравнению для нахождения производящей функции S: 8S п Оно и называется уравнением Гамильтона-Якоби. Функция S(t} q\} ..., qn) c*i, . .., ап), удовлетворяющая уравне- уравнению Гамильтона-Якоби и зависящая от п произвольных постоян- постоянных c*i, ...,an, называется полным интегралом этого уравнения, если ни одна из постоянных не входит аддитивно и Если в найденном полном интеграле отождествить произволь- произвольные постоянные а* с новыми импульсами р*, то использование этого полного интеграла в качестве производящей функции кано- канонической замены приводит исходные дифференциальные уравнения Гамильтона к виду с очевидным решением q = const, p = const. Разрешив соотношения q — dS/др, р = dS/dq относительно пе- переменных q и р, получим общее решение исходных уравнений Гамильтона: q = ?(*, q, p)t р = р{*> я, р)- Установленная связь между уравнениями Гамильтона и урав- уравнением Гамильтона-Якоби может быть использована для решения обратной задачи — найти полный интеграл уравнения в частных производных первого порядка, опираясь на решения соответствую- соответствующих обыкновенных дифференциальных уравнений.
300 ГАМИЛЬТОНОВА МЕХАНИКА Делается это так. Пусть общее решение системы Гамильтона Я = ftp, Р = -ftg, ft(<, 9, р) известно: q,P — произвольные постоянные. Разрешим эти соотношения относительно р и а: <* = /(«,?,/?), Р = <7(<, ?,/?)• Тогда полный интеграл уравнения в частных производных dS/dt+ +7^B, g, dS/dq) = 0 можно найти, положив Ц = /(«.*. Я. f = *(«.*./>)¦ В силу установленной выше связи между системой Гамиль- Гамильтона и уравнением Гамильтона-Якоби эти уравнения разрешимы относительно 5, и их решение может быть записано в виде S= [ [Cf{t,eq,e0)+qg(t,eq,ei3)}de. Jo Рассмотрим отдельно случай автономного гамильтониана, для которого уравнение Гамильтона-Якоби имеет вид В этом случае полный интеграл можно разыскивать так, чтобы одна из констант в него входила следующим специальным образом: S = -ait + W% где функция w уже от времени не зависит. Подставляя решение в этой форме в уравнение Гамильтона- Якоби, получаем для нахождения функции W следующее уравнение: *(•¦?)¦ = oil. Полный интеграл этого уравнения зависит от уже введенной произвольной константы а\ и от п - 1 оставшихся: W{q% au ..., ап). Представляет интерес выяснить, к какому виду могут быть приведены уравнения Гамильтона, если в качестве производящей функции соответствующей канонической замены брать не функцию S(tt 9, Р)> а функцию W(q, p): dW
§ 71. ТЕОРЕМА ЛИУВИЛЛЯ ОБ ИНТЕГРИРУЕМЫХ СИСТЕМАХ 301 Поскольку замена автономная, то новый гамильтониан получа- получается при подстановке этой замены в старый. Однако при такой подстановке имеем И = %[<7(g, р), dW/dq] = pi, и уравнения Га- Гамильтона приобретают вид рк - 0, fc = 1, ..., п. Решение этой системы: q\ = t + const, qk = const (fc ф 1), pk = const (fc = l,...,n) следует подставить в уравнения канонической за- замены, выраженные относительно старых переменных q = q{q,p), Р = P{q> P)i чтобы получить общее решение исходой системы Га- Гамильтона. Функция W(q, p) носит название характеристической функции системы. § 71. Теорема Лиувилля об интегрируемых системах Задача интегрирования системы Гамильтона по трудности экви- эквивалентна задаче интегрирования уравнения Гамильтона-Якоби. По- Поэтому хотя установленная в предыдущем параграфе связь между этими объектами и являются полезной, но она не продвигает ни на шаг в деле построения решений. Общих методов построения точных решений системы Гамильтона (или уравнения Гамильтона-Якоби) не существует. Ниже мы изложим некоторые приближенные методы интегриро- интегрирования таких уравнений. Они основаны на так называемом локаль- локальном подходе, когда рассматриваемая система является в некотором смысле близкой к некоторой, точно интегрируемой. К точно инте- интегрируемым системам относятся линейные системы, а также системы, описываемые в излагаемой ниже теореме Лиувилля. Содержательность теоремы Лиувилля заключается в том, что она показывает, как, зная п первых интегралов системы Гамильтона 2п-го порядка, можно свести всю задачу к квадратурам (обращение функций и взятие интегралов). Известно, что для системы 2п обыкновенных дифференциальных уравнений первого порядка для этой цели необходимо знание 2п — 1 первых интегралов. Теорема Лиувилля. Пусть система Гамильтона q — ИР) р = = —%q, %(<7, р) имеет п первых интегралов в инволюции: %к{Яу Р) (к — 1, . . ., п) (два первых интеграла находятся в инволюции, если их скобка Пуассона равна нулю). Тогда, если det {dWk/dpi} ф 0, , то эта система интегрируется в квадратурах. Доказательство. В силу последнего условия система Wk(qt p) = = а/с (а/с — постоянные) может быть разрешена относительно обобщенных импульсов: рк = fk{q> л) несложно показать *, что из Маркеев А.П. Теоретическая механика. — М.: Наука, 1990.
302 ГАМИЛЬТОНОВА МЕХАНИКА условия инволюции {Ик, Hi] =0 следует df!L=dfL dqt dqk • Но тогда разрешима следующая система: dS г, х относительно скалярной функции S(q) a): S(q,a)= f ^qkfk(eq,a)de, Jo k которая и берется в качестве производящей функции канонического преобразования (q, р) —> (q, p) dS . dS ,_ Поскольку функция Гамильтона %{q) р) сама является первым ин- интегралом, то она либо совпадает с одним из Ик{Я) Р)> либо является их функцией: Л = FG/i, ...,Мп)- Построенная каноническая за- замена переводит исходный гамильтониан в новый так: И -> ti = рк) либо так: % —> И = F(p\) ..., рп). Система с подобным гамильто- гамильтонианом в обоих случаях легко интегрируется. Теорема доказана. Если в условиях теоремы n-мерное многообразие в 2п-мерном пространстве {q} p}, задаваемое уравнениями Tikiq, P) = ак> являет- является компактным, то можно показать, что это многообразие является тором *. Это означает, что, помимо задания этого многообра- многообразия указанными уравнениями в неявной форме, его можно за- записать и в параметрической форме: q = q(a\} . .., an, 0i ..., 0n), p = p(c*i, • • ¦, c*n, 9\ ..., 9n) в виде зависимости от п параметров #i ¦••jflnj от которых эта зависимость 2тг-периодическая по ка- каждому 9k- Все фазовое пространство расслоено такими торами, постоянные ак определяют n-параметрическое семейство п-мерных торов. Вектор а является номером тора в этом семействе. Поскольку каждая траектория, начавшись на каком-либо из этих торов, с него уже в дальнейшем сойти не может, то гово- говорят, что решение интегрируемой по Лиувиллю системы в случае компактного многообразия уровня функций %ь представляет собой Арнольд В.И. Математические методы классической механики. — М.: Нау- Наука, 1974.
§ 72. ПЕРЕМЕННЫЕ "ДЕЙСТВИЕ-УГОЛ" 303 обмотку тора. Сам тор является инвариантным: он не изменяется фазовым потоком системы. § 72. Переменные "действие-угол" Канонические переменные "действие-угол" вводятся в случае компактного многообразия уровня первых интегралов Hk и явля- являются удобными при формировании в дальнейшем процедур при- приближенного интегрирования систем, близких к интегрируемым по Лиувиллю. Строятся переменные "действие-угол" так. Воспользуем- Воспользуемся найденной в предыдущем параграфе функцией S(q, a) = — ^ЛкЯк/к^Я, ос) dO, которую мы использовали в качестве про- производящей функции канонической замены (q, р) -* (q} р) после отождествления а = р. Однако вместо этого отождествления свяжем константы инте- интегралов с новыми импульсами иначе. Именно, положим Иными словами, к-я компонента нового импульса есть среднее значение pdq вдоль замкнутой траектории на торе, получаемой при изменении параметра Ok и при фиксированных остальных. Полученную функцию р = р(а) надо обратить и подставить в S(q, а). После чего новая координата строится обычным образом: Такая переменная р и называется действием, a q — углом. В литературе для них приняты специальные обозначения: / и <р, так что /fc(Q) = i- Г "?л(а,el,...,en)-?-qi(a,еи...,ея)<юк, 2тг Jo ^ авк Пусть для определенности гамильтониан системы совпадает с первым из находящихся в инволюции интегралов %(<7, р) = %i(<7, p)- Тогда после перехода к переменным "действие-угол" получаем новый гамильтониан в виде > Шs п[я>
304 ГАМИЛЬТОНОВА МЕХАНИКА И уравнения исходной системы в этих переменных получаются такими: d Их решение <р = и(/)<+ <?>0, / = const, и (I) = da\/dl позволяет запи- записать, воспользовавшись уравнениями замены, решение в исходных переменных: Я = q[v{I)t + ?>о, /], Р = РМ/)* Н- <?>о, /]¦ Основное свойство переменных "действие-угол" заключается в том, что каноническая замена q(<pt /), p((pt I) является 2тг- периодической по всем <рк, так что выписанное решение пред- представляет собой условно периодический колебательный процесс с п частотами u>k(I). Доказательство этому факту можно найти в цитированной выше книге В.И.Арнольда. § 73. Метод Пуанкаре-Цейпеля Будем предполагать, что гамильтонова система близка к точно интегрируемой по Лиувиллю, так что ее гамильтониан может быть приведен к виду Здесь е — малый параметр. Такая система называется возмущен- возмущенной. Функция %q[I) есть функция Гамильтона вырожденной (или невозмущенной системы), которая предполагается интегрируемой по Лиувиллю. Канонические переменные /, <р являются переменными "действие-угол" в невозмущенной системе. Возмущением называ- называются слагаемые, исчезающие вместе сей которые предполагаются 2тг-периодическими по всем угловым переменным (р. Ставится задача найти каноническую замену переменных (</?, /) -> (ф, J), такую, чтобы в новых переменных уже весь гамильтониан не зависел от <р ?{{<р, /, ?) -> K(J, e) К = K0(J) + eKiJ + e2K2J + • • • Будем разыскивать производящую функцию такой замены S((pt /, e) так, что сама замена определяется соотношениями т 8S , 3S Представим исходную производящую функцию в виде ряда 5 = у J + eSi(у, 3) + e2S2{<f, J) + ...,
§ 73. МЕТОД ПУАНКАРЕ-ЦЕЙПЕЛЯ 305 где <р • J — скалярное произведение: <р • J = ip\J\ + ... + <pnJn- Поскольку при е = О гамильтониан уже имеет необходимый вид, то S((p} J', 0) должна порождать тождественную замену: Производящая функция, приводящая гамильтониан к указанно- указанному виду, носит название характеристической функции (§70) и она удовлетворяет уравнению п(<р, ^-%е\ = const =/ОД. Или же, подставляя вместо %) S и К их разложение по степеням ?, запишем: № + .Р + + 9So Раскладывая в ряды и разделяя порядки, получаем: dS0 dS0 \ = /^i(i7b i dSx E3^i 55i ^y / dS0 dS0\ k Ojk Oipk \ O(fi 0<pn J Учитывая, что dS0/d<pk = Л, a дЩ/dJk = Wfc(*7i, • • •, *7n), полу- получаем следующую цепочку дифференциальных уравнений в частных 20 Зак. 233
306 ГАМИЛЬТОНОВА МЕХАНИКА производных первого порядка, позволяющих найти все компоненты производящей функции: Выбирая K\{J) в виде среднего значения по всем ц>к гамильтониана Hi[<pi> ..., <Рп, Ji, • • •, Jn)t т.е. Ki{Jit ..., Jn) = CHi(<pit ..., <pn, Ju ..., Jn)>, для нахождения Si получаем где ti\ — дополнение к среднему в функции И\. Это уравнение легко решается (см. §49). Подставляя решение во второе уравнение, для K.2{J) получим что позволяет найти 5г из уравнения + • • • + W где F2 — дополнение к среднему от функции F2. Это уравнение точно такого же вида, как и предыдущее. И так далее. Описанная процедура носит название нерезонансной, поскольку требует предположения, что частоты с«;/с(*7) не связаны соЪтноше- ниями типа + ... + \пи>п = О с некоторыми целыми, не всеми равными нулю А^. § 74. Метод Биркгофа нормализации гамильтонианов Рассмотрим гамильтонову систему, описываемую аналитическим гамильтонианом где Но — квадратичная часть функции Гамильтона, определяющая линейную часть системы, а ?/¦ — конечный или бесконечный полином, не содержащий членов ниже третьей степени.
§ 74. МЕТОД БИРКГОФА НОРМАЛИЗАЦИИ ГАМИЛЬТОНИАНОВ 307 Будем также преполагать, что Но определяет линейную коле- колебательную систему с п собственными частотами Ai, ..., Ап. Тогда в нормальных координатах (см. §40) Но запишется в виде Функцию Но можно привести к более удобной для дальнейшего форме, выполнив каноническое преобразование (q, р) —> (q, p): Рк = A Тогда функция Гамильтона Но в новых переменных запишется так: /с = 1 Будем считать, что с самого начала имеем дело в этими перемен- переменными, так что в дальнейшем тильду над буквой опускаем. Существует еще одно удобное представление для функции Но- Для этого рассмотрим комплексные комбинации обобщенных коор- координат и импульсов Эти соотношения можно рассматривать как каноническую замену (<7> Р) -* (х> У) с валентностью 2г. В этих переменных гамильтониан Но принимает вид (сохраним для функции, зависящей от новых переменных, старые обозначения): ТЫ*. У) = i /с = 1 Таковы две наипростейшие формы рассматриваемой линейной си- системы. Возникает вопрос, к какой наипростейшей форме можно приве- привести нелинейную часть системы, представленную функцией Н+(х, у). При этом преобразования переменных, решающие эту задачу, долж- должны удовлетворять трем условиям: они должны быть каноническими, они не должны менять квадратичную часть гамильтониана, т.е. Но, и, наконец, они должны быть в классе полиномиальных функций. Последнее означает, что искомые замены переменных не должны иметь никаких особенностей в нуле. 20*
308 ГАМИЛЬТОНОВА МЕХАНИКА Такая, неупрощаемая никакими полиномиальными заменами, форма гамильтониана называется нормальной формой Биркгофа. Ниже будет дано более конкретное определение для этой формы. Будем искать каноническую замену, приводящую гамильтониан к нормальной форме Биркгофа, поставив целью уничтожить как можно больше членов в разложении возмущенной части гамильто- гамильтониана: Х>, «..., *i' •¦•xj.-yj' ...y>n*. Сумма в этом выражении распространяется на все / и s, такие, что h + ... + ln + «1 + ... + sn > 2. Выясним, какие же из членов этой суммы могут быть уничто- уничтожены, а какие нет. Рассмотрим некоторый член этого ряда Этот член может быть уничтожен посредством канонической замены (я, у) —> (и, v) с производящей функцией 5(х, v) при наличии в ней точно такого же члена s = Y,xkVk + hx'i ¦¦¦xnv'il ¦¦¦<"¦ к При подстановке соответствующей замены для которой запишем и обратные выражения v=y-h^-{x'v')+ ... = u-h^-{x'y' OX ' UX в функцию Гамильтона И =7io +H+, получаем Возникший дополнительный член ihJ2^k{^kd/duk - Vkd/dvk)(ulvs) имеет ту же самую структуру, что и подлежащий уничтожению во всех случаях, за исключением того, когда выражение и1 Vs = и[х ... ul^v[l ... <л
§ 74. МЕТОД БИРКГОФА НОРМАЛИЗАЦИИ ГАМИЛЬТОНИАНОВ 309 является первым интегралом системы линейных дифференциальных уравнений, порождаемой гамильтонианом Но. В последнем случае оператор линейной системы обращает подобные выражения в ноль: U(ulvs) = 0. Таким образом, выясняется, что полиномиальными заменами можно уничтожить в линейной части гамильтониана %+ все члены, кроме первых интегралов линейной части системы. Линейная часть системы имеет простой вид, и структуру ее первых интегралов установить нетрудно. У системы с гамильтонианом ИъУ которая имеет вид uk = i\kuk) vk =-i\kvk (к = 1, ..., n), имеется 2n — 1 независимых первых интегралов Gi(u, v), ..., G2n-i(u) v). Из них п первых интегралов всегда имеют полиномиальный вид: Gk = икук (к = 1, ..., п). Среди других первых интегралов в полиномиальной форме нет, если система нерезонансная, т.е. если ни при каких целых к\, ..., кп. Если же резонансы есть, то число независимых полиномиальных первых интегралов превышает п на число резонансных соотноше- соотношений XZ^»Ai = 0- Например, если имеется резонанс Ai = ЗАг, то полиномиальным интегралом, дополнительным к уже указанным, будет и такой: G + l = ^1^2 В этом примере нормальная форма Биркгофа может зависеть только от таких аргументов: т.е. И -Щщы, ..., unvn, uxvl). Определение. Гамильтониан имеет нормальную форму Биркго- Биркгофа, когда он зависит только от полиномиальных первых интегралов (от инвариантов) невозмущенной части.
310 ГАМИЛЬТОНОВА МЕХАНИКА Более короткое определение таково: гамильтониан W = о имеет нормальную форму Биркгофа, если {Tio, H+} = 0. Через {Woifi*} обозначена скобка Пуассона, равенство нулю которой и есть условие первого интеграла. Описанный метод приведения к нормальной форме, основанный на использовании производящих функций, называется методом Биркгофа. Он удобен для выяснения структуры нормальной формы. Для проведения вычислений в конкретных задачах удобен другой метод, основанный на привлечении однопараметрических групп Ли. Необходимые канонические преобразования будем строить не с помощью производящей функции, а с помощью функции Гамильтона некоторой вспомогательной системы, фазовый поток которой и задает однопараметрическую группу преобразований, используемых для нормализации исходного гамильтониана. Пусть искомый гамильтониан этой вспомогательной системы есть Q(x, у). Это означает, что уравнения dx _ <9Q dy_ dQ dr ду ' dr дх с начальными условиями х@) = и, у@) = v определяют искомые преобразования по формулам X = Х(Г, U, V), У = у(г, 14, V), представляющим собой решение этой начальной задачи Коши. Эти преобразования и обратные к ним могут быть записаны с помощью следующих рядов Ли (см.§48 и 68): y=t/ + r{t/, Q} + ^- r2 u=x-r{x, Q} + — Здесь в случае прямых преобразований обозначения аргументов х и у в функции Q заменены обозначениями и и v. Сама функция Q во всех случаях одна и та же. Преобразованный гамильтониан связан с исходным также ря- рядом Ли: Щи, v) = Щи, v) + т{Н, Q) + ^{{П, Q),Q}+...
§ 74. МЕТОД ВИРКГОФА НОРМАЛИЗАЦИИ ГАМИЛЬТОНИАНОВ 311 Эта формула является основной для формируемого ниже алгоритма приведения гамильтониана к нормальной форме Биркгофа. Формализуем признак, определяющий порядок нелинейных чле- членов, посредством введения масштаба х -> ?я, у -> ?*/, где е — скалярный параметр, рассматриваемый в окрестности нуля. Тогда гамильтониан Н(х, у) = Ио(х) у) +?{+(х) у) с учетом валентности этой замены, равной 1/е2, запишется так: П[х, у)е)=По{х) У) + —П*{ех} еу) = П0{х, у) +%«(«, у, б). Назовем асимптотикой к-го порядка для гамильтониана И любую функцию Tiki отличающуюся от точного гамильтониана членами более высокого порядка малости, чем ек\ Заметим, что асимптотики заданного фиксированного порядка образуют кольцо: сумма двух асимптотик есть асимптотика того же порядка для суммы соответствующих им функций и произведение двух асимптотик есть асимптотика этого же порядка для произ- произведения. Для элементов кольца асимптотик имеет место также и такое очевидное свойство: (е1Пк)к=е1Пк-1 (I < к). Иными словами, асимптотика к-го порядка от произведения е1 на Tik равна произведению е1 на асимптотику (к — /)-го порядка. Гамильтониан вспомогательной производящей системы также будем искать в форме асимптотик: Ряд Ли, представляющий новый гамильтониан, может быть записан для асимптотик в следующем виде после отождествления е = г: u, v) = П2(и, v) + т{Пи Qi] + ^ Hk(ut v) = Пк(и, v) + т{-Нк-и Qk-i) + • • • /с раз
312 ГАМИЛЬТОНОВА МЕХАНИКА При получении этих соотношений использованы приведенные выше свойства кольца асимптотик. В вьражении для ^(г/, v) представим скобку Пуассона {%к> Qk} в асимптотически эквивалентной форме: {Пк) Qk} = {По, Qk) + {Пк-П0) Qk} = {П0) Qk} + {Пк-По, Qk-i}- Эта эквивалентность имеет место, поскольку Tik — 'Но =О(т). С учетом этого представления перепишем выражения для асим- асимптотик гамильтониана И так: 'Но = Tio, 0) Qk-i} + т{Пк-1 - П0} Qk-2}+ к Введем следующие обозначения: Ск=т{Пк-1-П0) Qk-2}+ к { тт{ • • • {**-¦¦ о*-}, о*-.-},...}+ш (к > 2), Тогда формулу для искомой асимптотики к-го порядка преобразо- преобразованного гамильтониана можно записать следующим образом: Пк = r{n0)Qk-i} + Ck {к > 1). Это уравнение называется гомологическим. Будем использовать его для последовательного увеличения порядка найденной асимптотики искомого гамильтониана И. Асимптотика нулевого порядка совпа- совпадает с порождающим гамильтонианом Hq = Tio. В дальнейшем в каждом искомом порядке Пк функция Ск оказывается известной функцией и и v, поскольку она зависит лишь от уже найденных на предыдущих шагах асимптотик. Неизвестными и подлежащи- подлежащими определению из гомологического уравнения являются функции Пк[и} ь) и <2/c-i(u, v). Для решения гомологического уравнения относительно этих функций заметим, что скобка Пуассона {Но, Qk-i} представляет собой полную производную по t от функции Qk-iiu, v), взятую вдоль траекторий вырожденной системы, т.е. вдоль семейства отображений и -> иехр(г"А<), v -> vexp(-iXt) (см. §48): UQk.i = {no,Qk-i}=^:1-
§ 74. МЕТОД ВИРКГОФА НОРМАЛИЗАЦИИ ГАМИЛЬТОНИАНОВ 313 Кроме того, по определению Иь состоит только из инвариантов этой же линейной системы. Проинтегрировав правую и левую части гомологического уравнения вдоль траекторий вырожденной системы, находим [ ilkdt = T f {nOiQk-i}dt+ f Jo Jo Jo Ckdt. Или, учитывая все сказанное, получаем / Jo ) vexp(-iXt)] dt = o = Гкк + r{Qk-i(ut v) - Qfc-iluexpfi'At), t/exp(-iA*)]}. Таким образом, проинтегрировав по времени известную функ- функцию ?/c(u, v) вдоль траекторий вырожденной системы, получаем искомую асимптотику нормальной формы гамильтониана Ик в ви- виде коэффициента при t, а искомую асимптотику производящего гамильтониана Qk-i в виде не зависящего от времени коэффици- коэффициента при т. Свойства нормальной формы Биркгофа. 1) Асимптотика каждо- каждого конкретного порядка нормальной формы содержит минимальное число нелинейных членов соответствующего порядка, уже неумень- неуменьшаемое никакими полиномиальными преобразованиями. Поэтому и любой анализ свойств системы по ее нормальной форме является наиболее простым. 2) Поскольку в нормальной форме возмущение W+ и невоз- невозмущенная часть системы Tio коммутируют, то для всей системы верен принцип суперпозиции (см. §51), в силу которого для по- построения решения системы с гамильтонианом 7io + Tim достаточно знать решения с гамильтонианом 7io и 7im в отдельности. Решение системы с гамильтонианом 7io известно. Остается найти решение с гамильтанианом ?{¦, что доставляет дополнительные упрощения. 3) Уравнение Гамильтона в нормальной форме всегда допус- допускает понижение порядка, поскольку решения вырожденной систе- системы являются группой симметрии для возмущенной части системы (см. §51). Пример. Уравнение Дуффинга: q + q + q3 = 0. Соответствующий этому уравнению гамильтониан Ъ, = [р2+ +<72 + <74/2]/2 заменой х = q — ip} у = q + ip приводится к виду 4 В гамильтониане нет членов третьей степени, поэтому параметр ?, отделяющий друг от друга члены разных порядков, можно взять как х = \fex\ в результате чего гамильтониан запишется в виде (штрихи опускаем) % = г[ху 4- е(х + уL/32].
314 ГАМИЛЬТОНОВА МЕХАНИКА Первое приближение нормальной формы. Траектории вырожден- вырожденной системы с гамильтонианом 7i = ixy имеют вид х = iiexp(i<), у = i>exp(—it). Интегрируя вдоль них гамильтониан, находим: [ Hidt= f ndt = if [и* + Uueil + уе~{г)Л dt = Jo Jo Jo L ^ J 4 f -u4c4" + 2ti3vc2" + 6iu2v2* - 2uv3e~2it - -vAe'Ait 32 \4 4 Асимптотика первого порядка нормальной формы есть коэффи- коэффициент при t: Первое приближение для производящего гамильтониана есть не зависящий от времени коэффициент при г: Второе приближение нормальной формы. Вычислим функцию Hi'- ?2 = t{Ki - По, Qo] + у Здесь ) Qo} = \{Пх ~ Wi) = -^(*4 + 4x3y + 4xy3 + y4), Вычислив скобки Пуассона и подставив х = uelt, у = ve lt и проинтегрировав ?2 no t, выделяем необходимый коэффициент при t: Поскольку мы этим приближением и ограничиваемся, то функцию Q, необходимую для построения третьего приближения, приводить не будем.
Приложение Теория скользящих векторов 1. Определения и свойства. Вектор в механике определяется ве- величиной, направлением, ориентацией и точкой приложения. Такой вектор называется закрепленным, или приложенным. В трехмерном евклидовом пространстве, отнесенном к некоторой декартовой системе координат, закрепленный вектор может быть определен заданием трех чисел, определяющих радиус-вектор точки приложения — (х, у, z) = г, и трех чисел, представляющих собой проекции закрепленного вектора на оси координат — (Fr, Fy, Fz) = = F. Будем записывать закрепленный вектор так: (г; F). Вектор, точка приложения которого интереса не представляет, называется свободным Для его задания достаточно трех чисел — F. Закрепленный вектор определяет в пространстве единственную прямую, проходящую в направлении этого вектора через точку его приложения. Такая прямая называется линией действия закре- закрепленного вектора, или основанием вектора. Вектор, точка приложения которого на заданной линии дей- действия интереса не представляет, называется скользящим. Скользя- Скользящий вектор представляет собой семейство закрепленных векторов, имеющих общую линию действия. Каждой точке в пространстве (обозначим такую точку буквой О, а ее радиус-вектор г о) и каждому закрепленному вектору (г; F) поставим в соответствие закрепленный вектор Mo(F) с точкой приложения О по следующему правилу: Мо(Р) = (г-го) хР. Такой вектор называется моментом вектора (г; F) относительно точки О. Поскольку при изменении точки приложения закрепленного век- вектора вдоль линии его действия величина и направление момента не меняется, то приведенное определение позволяет говорить и о моменте скользящего вектора относительно точки О. Такой момент тоже при необходимости может считаться скользящим вектором. Рассмотрим теперь систему закрепленных векторов {(г, : F,)}, i = 1, ..., п. Для этой системы введем две основные характеристи- характеристики. Главным вектором системы закрепленных векторов называется свободный вектор, равный сумме свободных частей этих векторов: Главным моментом относительно точки О системы закрепленных векторов называется свободный вектор, равный сумме свободных
316 ПРИЛОЖЕНИЕ частей моментов этих векторов относительно той же точки, назы- называемой полюсом: Если осуществить переход к новому полюсу, то главный вектор от этого никак не зависит, а главный момент изменится так: г°') х F» = го = re + Р- Умножим это равенство скалярно на главный вектор F: F = Мо F + р х F F. Поскольку последнее слагаемое равно нулю, заключаем: проекция главного момента на главный вектор не зависит от выбора полю- полюса. Эта проекция называется скалярным инвариантом вычисления главного момента системы векторов. Выясним, к какой наипростейшей форме может быть приведен главный момент за счет подходящего подбора полюса. Для этого представим главный момент, вычисленный относительно произволь- произвольно выбранной точки О, в виде суммы где М'О||Р, a Mg±P. Переместим теперь полюс в точку О', стараясь выбором р добиться, чтобы || Если это можно сделать, то, в силу наличия скалярного инварианта, = М'о, и для нахождения р получаем уравнение М? + р х F = 0. Искать решение этого уравнения будем в виде ? xF)+*F, где а и к — неизвестные скаляры. При подстановке р в этой форме в исходное уравнение имеем MS + а(М? х F) х F 4- *F x F = 0.
ПРИЛОЖЕНИЕ 317 Последнее слагаемое равно нулю, а раскрытие двойного векторного произведения дает откуда 1 a = F F Таким образом, общее решение поставленной задачи имеет вид М'Л х F , ^ где А: — произвольно. Получилась прямая линия, параллельная F, представляющая собой геометрическое место полюсов, относительно которых глав- главный момент совпадает по направлению с главным вектором и имеет минимальный модуль, равный скалярному инварианту. Такая ли- линия называется центральной осью системы закрепленных векторов. Она существует для любой системы, для которой главный вектор не равен нулю: F • F ф 0. Если главный вектор F равен нулю, то главный момент не зависит от выбора полюса. 2. Эквивалентные системы векторов. Будем рассматривать пре- преобразования системы закрепленных векторов, при которых меня- меняются точки приложения векторов, некоторые векторы удаляются из системы и некоторые в систему вводятся. Из всех возможных подобных преобразований выделим два, которые называются элементарными. Первое элементарное преобразование состоит в присоединении к системе двух закрепленных векторов (ri;Fi) и (r2;F2), таких, что (Эти два вектора равны по величине, имеют общую линию действия и противоположно ориентированы.) Второе элементарное преобразование состоит в замене двух векторов (r;Fi) и (r;F2), имеющих общую точку закрепления, вектором (r;Fi+F2), называемым их равнодействующей. Введем отношение эквивалентности: две системы векторов на- называются эквивалентными, если одна получается из другой эле- элементарными преобразованиями. Рассмотрим теперь четыре простейшие системы закрепленных векторов. 1) Система, в которой все векторы равны нулю (векторный нуль). 2) Система, состоящая из одного, не равного нулю вектора.
318 ПРИЛОЖЕНИЕ 3) Система, состоящая из двух векторов (iv,Fi) и (гг'.Гг), таких, что Fi = -F2, и Г1-Г2 неколлинеарно Fi (равные по модулю силы имеют одинаковое направление, но противоположно ориентированы; линии действия не совпадают). Такая система называется парой. 4) Система, состоящая из одного, не равного нулю, вектора и одной пары, расположенной в ортогональной к нему плоскости. Такая система называется винтом. Теорема 1. Система закрепленных векторов {(r,;F,)} эквива- эквивалентна векторному нулю тогда и только тогда, когда главный вектор и главный момент равны нулю. Доказательство. В формулировке теоремы уточнять, отно- относительно какого полюса главный момент равен нулю, не надо, поскольку из формулы Me = Mo +pxF следует, что при F = О главный момент не зависит от выбора полюса. Проведем плоскость так, чтобы она не проходила ни через одну из точек г, (г = 1,..., п). В выбранной плоскости фиксируем произвольно три точки га, гд, и г с так, чтобы никакие три вектора г,-гд, г,-г# и г, — г с не были компланарны. Каждый из векторов (г,; F,) разложим по этим трем направлениям: (r,;F,) = (г,-; F,a) + (гг, F,B) + (г,-; F ,•<?). Эта операция является, очевидно, элементарной. Каждый вектор (rt;Ft^) переместим вдоль линии действия в точку г а (вторая эле- элементарная операция), после чего все их сложим: Fa = 5Z?=i^»^- Так же поступим и с векторами (r,;F,^) и (r,;F,c)- Мы получили, что произвольную систему закрепленных векторов элементарны- элементарными преобразованиями можно привести к трем векторам (fa;Fa), (rB;FB), (rc;Fc). Покажем, что из условия равенства нулю главного вектора и главного момента следует, что эти три вектора компланарны от противного. Пусть, например, Faz Ф 0. Тогда момент этой силы вокруг прямой, проходящей через г в и г с не равен нулю. Векторы Fa, Fb, Fc компланарны. Тогда, например, вектор ?с можно разложить по двум направлениям г л - г с и г в — г с- Вектор (tc;Fca) вдоль линии действия перемещаем в точку га, а вектор (гс\^св) — в точку гд и складываем их соответ- соответственно с векторами (rA;F^) и (rB;FB). Таким образом, система закрепленных векторов с нулевыми главным вектором и главным моментом оказалась эквивалентной двум векторам, приложенным в точках га и гв, а эти два вектора обязаны быть равны и прямопротивополжны, т.е. сводимы к векторному нулю. Теорема доказана. Теорема 2. Две системы закрепленных векторов {(r,;F,)} и {(iV, Gk)}, (i = 1, ... , п, k = 1, ..., т) эквивалентны тогда и только тогда, когда их главные векторы и главные моменты равны.
ПРИЛОЖЕНИЕ 319 Доказательство. В одну сторону утверждение очевидно: если две системы эквивалентны, то их главные векторы и главные моменты равны, поскольку при элементарных преобразованиях эти характеристики не меняются. Пусть теперь у двух систем равны главные векторы и главные моменты. Покажем, что системы эквивалентны. Рассмотрим новую систему {(r^;-G^)} (все векторы заменены на обратные). Тогда у системы {(г,; F,), (rv,-Gk)} главный вектор и главный момент равны нулю. Но по предыдущей теореме такая система эквивалентна нулю. А это значит, что {(r*;Gfc)}~ {(rfc; G*)}+ {(,-,•; Fi), (rfc;-Gfc)} ~ {(r,-;F.-)}. Теорема доказана. Теорема 3. Любая система закрепленных векторов эквивалентна одной из четырех простейших. Доказательство. Произвольная система закрепленных векторов удовлетворяет одному из четырех условий: 1) F = 0, Mo =0; 2) F ф 0, Mo = 0; 3) F = 0, Mo ф 0; 4) F ф 0, Mo Ф 0. Именно такими и являются эти характеристики для введенных ранее четырех простейших систем: векторный нуль, вектор, пара, винт. Опираясь на теорему 2, и получаем утверждаемое. Теорема доказана. Поскольку введенное выше отношение эквивалентности любой закрепленный вектор переводит в скользящий, то доказанные три теоремы составляют основу теории скользящих векторов. В механике теория скользящих векторов используется в двух ситуациях. 1) Система закрепленных векторов представляет собой систему сил, приложенных к абсолютно твердому телу. Поскольку аб- абсолютно твердое тело не деформируется, то приложение к нему двух равных по модулю, но противоположно ориентированных сил, действующих вдоль одной прямой, не меняет его состояния равно- равновесия. Это означает, что равновесие твердого тела не изменяется при эквивалентных преобразованиях приложенной к нему системы сил. Следовательно, для равновесия твердого тела необходимо и достаточно, чтобы были равны нулю главный вектор и главный момент приложенных к нему сил. 2) Система векторов — угловые скорости составляющих движе- движений сложного движения твердого тела. Момент угловой скорости относительно точки определяет линейную скорость этой точки. В общем случае, следовательно, произвольное движение твердого тела есть мгновенный винт: вращение вокруг некоторой оси плюс поступательное движение вдоль этой оси. 4
Учебное издание Журавлев Виктор Филиппович ОСНОВЫ ТЕОРЕТИЧЕСКОЙ МЕХАНИКИ Издание второе, переработанное Редактор Л. А. Панюшкина Компьютерный набор и верстка Е. С. Нехаевой Компьютерная графика М. В. Ивановского ИД №01389 от 30.03.2000. Гигиеническое заключение № 77.99.02.953.Д.003724.07.01 от 05.07.2001 Подписано в печать 10.09.2001. Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 20,0. Уч.-изд. л. 22. Тираж 2000 экз. Зак. 233 Издательство Физико-математической литературы 117071 Москва, Ленинский пр-т, 15 Тел. @95) 955-03-30, 952-49-25 http:Wfizmatlit.narod.ru Отпечатано с оригинал-макета в ГУП «Облиздат» 248640 Калуга, пл. Старый торг, 5 Тел. @842) 57-40-70